逐浪AIGC丨生成式AI涌向终端 高通欲做“铺路人”

21Tech白杨 2023-10-26 19:37

Oryon CPU,让高通有了更多新故事。

21世纪经济报道记者白杨 美国夏威夷报道

北京时间10月25日,一年一度的高通骁龙峰会如期而至。以往,最新的旗舰手机芯片会是该峰会的主角,但今年,骁龙峰会呈现出令人瞩目的新变化。

议程设置上,在介绍手机芯片——第三代骁龙8之前,高通把更多时间留给了“生成式AI”和“最新的PC芯片——骁龙X Elite” ,不仅如此,高通公司总裁兼CEO安蒙更是表示骁龙X Elite和第三代骁龙8均是专为生成式AI而打造,这让本届骁龙峰会俨然成为了一场“高通AI峰会”。

实际上,高通对AI的关注由来已久。2017年,高通便推出了AI引擎,据高通官方数据,过去6年,骁龙计算平台的AI性能已经提高了100倍;而在5G时代刚开始时,高通也一直谈论5G时代将由5G和AI共同构成。

不过在今年之前,高通虽然重视AI,但始终没有将它放到如今的高度。这种转变,源自ChatGPT的出现,过去一年,生成式AI的快速发展,让高通像其他科技公司一样,也看到了新时代大门的开启。

“我们已经进入了生成式AI的新时代,它带来的变革,将会是前所未有的变化。它会改变我们使用终端的想法和创新,改变我们创新的方式,改变我们搜索以及与终端互动的方式”。安蒙在骁龙峰会上说道。

其进一步表示,人们现在有能力让AI在终端无所不在,并且一刻不停运行,这将带来独一无二的体验。比如给某人发信息,有了提供的情景,手机就可以据此选择相应的应用程序,并做出不同的决定;再或者是打电话的时候,电话内容可以被总结出来,帮助人们了解接下来要做什么。

为了实现这一切,加速引擎的设计必须能够在终端上高效运行这些模型,而高效的AI模型和未来的终端侧AI则需要不同的计算方法。对高通而言,打造这样的异构计算平台是其强项,在AI时代,这也成为了高通的巨大机会。

PC芯片王者易主

10月中旬,高通宣布为下一代PC计算平台制定了全新命名体系——骁龙X。这也吹响了高通进军PC市场的新号角。

此前,高通在PC芯片已有布局,包括骁龙7C、骁龙8C、骁龙8CX等,都是高通专为PC打造的芯片。但是从市场反馈来看,这些芯片并没有帮助高通在PC行业站稳脚跟。而这次选择推出新命名体系,是因为高通在PC芯片方面取得了实质性的突破。

2021年初,高通以14亿美元的价格收购了成立刚刚两年的创业公司Nuvia。Nuvia拥有ARM官方的技术许可协议(TLA)和架构许可协议(ALA),团队实力也十分强劲。比如Nuvia创始人Gerard Williams III曾担任苹果首席CPU架构师,也曾在ARM工作十余年。当时,作为交易的一部分,Gerard Williams III以及其他Nuvia员工也都加入了高通。

此次骁龙峰会上发布的骁龙X Elite,所采用的Oryon CPU就是来自Nuvia团队。“这是一款高通从零开始设计的产品,它从设计之初就秉承着一个目标:在极低的功耗下实现强劲性能,我们一直在为此努力。”安蒙在骁龙峰会上表示,“今天,我可以很高兴地告诉大家,这是一个历史性时刻。我们成功了,并且远超预期。”

据其介绍,高通每年都在研发旗舰芯片,在研发的过程中,需要做很多模拟工作。“当一件产品完成时,我们希望这个产品和模拟的效果是一样的。但骁龙X Elite是与众不同的,它超出了我们在模拟测试中的所有预期,这对于芯片产品来说是非常难得的。”

根据峰会现场披露的测试数据,Oryon CPU的单线程性能已经超越了基于ARM的苹果M2 Max,而在实现相同水平性能时,Oryon CPU可以减少30%的能耗。若对比X86 CPU,Oryon CPU的单线程性能也超过了专门为高性能游戏终端而设计的i9-13980HX。实现相同的性能,Oryon CPU的能耗则降低高达70%。

一夜之间,PC芯片的王者实现了更替。安蒙说,“这款CPU已经成为了绝对的市场领导者。这不仅是骁龙、高通的高光时刻,更是整个Windows 生态系统的高光时刻。”目前,大多数基于ARM的笔记本电脑仍来自苹果,而Oryon CPU的出现,或会改变这一市场格局。

当然,PC芯片的构成不只是CPU。在介绍骁龙X Elite集成的高通Adreno GPU时,高通将重点放在了性能和能效的平衡上。

据高通技术公司高级副总裁兼手机、计算和XR业务总经理阿力克斯·卡图赞介绍,与最热门的x86集成GPU——i7-13800H相比,在面向PC的热门3D图形基准测试中,骁龙X Elite的性能可达其两倍多。而在达到竞品峰值性能的同等水平时,骁龙X Elite所需的功耗要低74%。

除了CPU和GPU,终端侧AI也在成为衡量PC性能的重要维度。骁龙X Elite异构的高通AI引擎,通过NPU、CPU和GPU能够整体实现75TOPS的算力。

阿力克斯·卡图赞表示,TOPS也不是量化终端侧AI性能的唯一方式,还要考虑AI模型的准确性和响应时间,以及用每秒生成token(tokens/s)来衡量的大语言模型处理速度。

根据现场演示,在终端侧运行70亿参数的Llama 2模型时,骁龙X Elite的处理速度可以达到30 tokens/s。如果对比人类阅读,普通人每分钟可阅读200-300个单词,相当于每秒处理5-7个tokens,这说明骁龙X Elite支持的终端侧AI的书写速度已经比人类阅读要快得多,这将使用户在与AI进行交互时,几乎能够即时得到答案。

同时,骁龙X Elite还支持处理更大、更复杂的模型。比如完全在终端侧运行超过130亿参数的生成式模型,而无需云端资源。在几个月前,这件事还只能在数据中心里实现,而现在,基于骁龙X Elite,厂商可以将相同水平的功能集成进用户的PC。

从各项性能指标来看,骁龙X Elite将在PC行业掀起一场变革。目前,骁龙X Elite已经获得了很多PC厂商的支持,在峰会上,联想、微软、惠普等企业高管均表示将在2024年推出搭载骁龙X Elite的PC产品。

高通为AI铺路

相比在PC芯片领域带来颠覆性突破,高通的最新手机芯片——第三代骁龙8则显得有些“沉闷”。实际上,这也是由市场地位所决定。在PC芯片领域,高通扮演的是挑战者,要和原有的巨头争抢蛋糕,所以向来温和的安蒙在演讲中也展现了“狼性”的一面,他指着大屏幕上高通Oryon CPU和竞品的对比图说,“随便拍照,欢迎传出去”。

而在手机芯片领域,高通已经成为行业的佼佼者,他每年最大的挑战,就是如何实现对自己上一代产品的迭代。但“打败自己”往往最难,这一点不仅是高通,苹果也深有感触。

但AI的加持,让第三代骁龙8有更多故事可讲,高通官方也将该芯片称为“首个专为生成式AI而精心打造的移动平台”。

阿力克斯·卡图赞称,借助终端侧AI模型,智能手机也将变得更加个性化。它将成为真正的数字助手,通过将对话式终端侧助手和能够理解文本、图像和语音输入的多模态生成式模型相结合,智能手机能够提供更有意义的回答,并帮助用户完成任务。

所以,第三代骁龙8除了常规的一些升级,比如CPU性能提高30%、GPU性能提升25%等之外,更值得关注的是其在AI性能方面的更新。

据阿力克斯·卡图赞介绍,第三代骁龙8重新设计的Hexagon NPU性能实现了翻倍,并且通过增强架构,Hexagon NPU的能效也提升了40%。正因如此,第三代骁龙8也成为高通首个能够支持大语言模型、大视觉模型以及生成式AI应用的手机芯片。

具体而言,第三代骁龙8能够支持在终端侧运行100亿参数的模型,而面向70亿参数大语言模型,第三代骁龙8每秒可处理的token数量为20个。

一个能更直观展现高通AI能力进步的例子是,今年一季度,高通曾对外演示在手机上运行拥有10亿参数的Stable Diffusion模型,当时从给出文字到生成一张图片需要等待15秒。而现在,基于第三代骁龙8,这个速度将被缩短至0.6秒。

通过在终端侧运行这些大模型,用户无需再完全依赖云端。这将使智能手机中的AI辅助响应更快,同时也更加隐私和安全。在骁龙峰会期间,小米集团总裁卢伟冰和荣耀CEO赵明也都作为嘉宾进行了主题分享,据卢伟冰介绍,小米14将全球首发第三代骁龙8,同时,小米自研的60亿参数大模型已经在第三代骁龙8平台上流畅运行。而赵明也透露称,即将发布的荣耀Magic 6将支持70亿参数的大模型。

需要指出的是,高通目前也正经历业绩增长的挑战。根据其2023财年第三财季(2023年Q2)财报,在非美国通用会计准则下,高通的营收为84.42亿美元,同比下降23%,净利润为21.05亿美元,同比下降37%。

其中,占高通营收超70%的智能手机业务,收入同比下滑了25%,核心原因是智能手机市场的持续收缩。据高通CFO当时预计,2023年全球手机市场的销量将继续下滑“高个位数”,为此,高通也在今年采取了包括裁员在内的降本举措。

不过在接受21世纪经济报道记者采访时,卢伟冰对于明年的市场情况抱有乐观态度。他预计2024年全球市场将有5%的增长,其中中国市场的出货量,能达到2.8亿,而今年中国市场的出货量约在2.68亿台。

对于高通而言,在面对不确定的市场环境时,快速变革的AI技术或成为其极为明确的布局方向。安蒙表示,这次骁龙峰会将是最具影响力的一次峰会,因为它关乎高通的改变——从原来的一家通讯企业,变为现在的AI驱动的计算处理企业。

如今,人们正站在AI改变一切的门槛上。无论是终端设备、PC市场还是智能手机,AI已经不再是辅助角色,而是核心驱动力。这不仅改变了人们使用技术的方式,还将重新定义人们的日常生活和商业格局。

在这个过程中,高通需要持续迭代手机芯片,同时也要寻求新增长。据安蒙透露,2024年,高通将把Oryon CPU用于手机芯片,同时,Oryon CPU未来也将进入汽车、XR等终端。所以,智能手机依然重要,但高通不想再过度依赖这块业务,除了现在的物联网和汽车业务外,接下来,PC则将是高通重点押注的市场。

所以,高通正在调整姿态,并成为更多领域的市场挑战者,而为终端侧AI铺路,或成为高通当下最有竞争力的抓手。如安蒙所说,“我们正在进入改变用户体验的生成式AI时代,也将创造一个移动行业和计算行业的全新周期”。

(作者:白杨 编辑:骆一帆)

白杨

IT版记者

关注科技互联网领域报道。微信:by_xiansheng(加好友请备注姓名、公司及职务)