深度丨从大模型价格战说开去:大厂投石问路,产业行至何方?

合规科技冯恋阁,王俊,实习生孔雅萱 2024-06-04 10:18

国内大模型市场飞快地跨入“厘时代”,又跃入“免费纪元”。

21世纪经济报道记者冯恋阁  实习生孔雅萱 广州报道

如果要为5月的AI界找关键词,“价格战”一定是其中之一。5月以来,国内包括字节、腾讯、阿里在内的多家厂商密集宣布模型降价。先是字节打出“远低于行业定价99.3%”的招牌,阿里喊出“1元最多=200万tokens”的口号,再到百度官宣主力大模型免费。国内大模型市场飞快地跨入“厘时代”,又跃入“免费纪元”。

(图说:“价格战”时间线。21世纪经济报道记者不完全梳理自公开资料)

事实上,早在大厂“杠上”之前,大模型价格战的序幕就已悄然拉开。

5月6日,幻方量化旗下的DeepSeek正式开源第二代MoE模型:DeepSeek-V2,其定价仅为GPT4-Turbo的1%;5月9日,阿里云发布通义千问2.5,称个人用户可从APP、官网和小程序免费使用相关服务;5月13日,OpenAI发布GPT-4o,表示面向ChatGPT的所有付费和免费用户发布,API价格还比GPT-4Turbo降价50%。

(图说:各大厂商接入相关服务价格。21世纪经济报道记者不完全梳理自公开资料) 

无论体量、不分业务模式,在AI竞速上,降价似乎成为了重要的方向。大模型走向价格战或成不可逆转的趋势,这是何种原因?又将造成何种影响?

扩张的野望

一面是算力危机、数据之困;一面是路线之争、生态待建……高投入、低产出的AI产业,为什么要在还没找准变现路径前就打价格战?

多位受访专家指出,技术加速演进带来的算力成本降低和市场竞争趋向内卷引发的生存焦虑,共同推动了价格战的发生。

模型训练成本是横亘在研究与应用间不可忽视的门槛。清华大学电子工程系系主任汪玉曾用公开数据做了一次针对算力成本的估算。不包括模型训练的投入,假设GPT-4 Turbo每天要为10亿活跃用户提供服务,每年的算力成本就可能超过两千亿。

普遍的技术进步给大模型降价带来了可能。 

在天使投资人、资深人工智能专家郭涛看来,在技术层面,大模型降价能降价,主要受益于模型训练的效率提升、硬件资源的优化使用、算法的改进等。

一般来说,模型的算力成本主要包括预训练成本和推理成本。零一万物CEO李开复在接受媒体采访时指出,未来整个行业的推理成本可能会达到每年降低10倍的程度。据媒体报道,幻方量化的DeepSeek-V2采用稀疏MoE架构进行了共享专家等改进,节约了42.5%的训练成本。

“此外,厂商或许还寄望于价格战带来的规模经济效应,随着用户量的增加,训练和推理成本也进一步摊薄,形成良性循环。 ”郭涛指出。 

降价也有助于扩大市场份额,推动AI技术的普及和应用,为厂商创造更多的商业机会。如果说技术是降价浪潮的充分条件,那快速“落地”,抢占市场的紧迫需求则是必要条件。 

“在国内,各大模型的能力对齐得比较快。”IDC中国研究总监卢言霞坦言,在国内大模型能力差距并不大的当下,通过价格战分高下是很自然的策略。 

猎豹移动董事长兼CEO、猎户星空董事长傅盛也公开评论:“谁也甩不开谁,谁也拿不出杀手锏,降低推理成本、降低售价成了现在每一家的高优先级任务。” 

据麦肯锡报告分析,到2030年,大模型有望在全球推动约49万亿人民币的经济增量。但在当下,庞大而活跃的市场似乎只是厂商的愿景,并没有完全成为现实,愿意出钱的人还是少数。

据媒体报道,2023年11月,IDC对全球889家企业开展了一次AI应用调研。结果显示,三分之一的企业已经开始在生成式AI领域大规模投入,12.7%的企业尚未开始规划生成式AI的应用;25.5%的企业虽然正在开发潜在应用场景列表,但未有技术投资;32%的企业已经开始模型的初步测试和概念验证(POC),但还没有固定的支出计划。 

对于大模型厂商来说,价格战真的能快速抢占市场吗?

一个比较明显的事实是,加入降价车轮战的厂商大多同时还提供云计算服务。目前厂商降低的则大部分是调用大模型应用程序编程接口(API)的费用。换言之,付费环节并没有消失,而是由API向云计算转移。 

金沙江创业投资基金主管合伙人朱啸虎在近日参加AI创生时代大会时表达了这样一个观点——大模型产业终将走向价格战。在他看来,独立创业的大模型公司“毫无生存空间”,因为大厂为了卖云服务,可能会直接将大模型免费。

本质上这是拥有云的大厂为了销售云服务而实施的一种类似‘跑马圈地’的举措。厂商的模型免费,可能会选择在之后云计算服务环节收费,实际上是激发了新的商业模式。”企业智能体解决方案提供商孚知流(FuzFlo)创始人兼CEO白双指出。

从大厂的进一步行动中也不难发现这种趋势。比如,阿里云就在官宣降价的第二天表示,包括GPU云服务器、百炼平台、大模型训练与推理服务等AI产品及解决方案在内的阿里云AI算力及AI系列产品首次参与618满减活动。此外,阿里云还在618活动中设置5亿元加速上云算力补贴。

价格战,难有赢家

人工智能厂商的生存焦虑早在价格战之前就萦绕在从业者心头。喊出口号后,厂商要面对的下一个问题同样直接,用户真的会为此买单吗? 

多位受访专家告诉21世纪经济报道记者,在当下,价格绝非用户考虑的唯一因素。 

“对降价浪潮的狂热可能并不是市场真实的声音。”白双指出,API价格具体降到多少没法让用户拍板做出决策,“决定因素还是AI的整体性能。换言之,接入AI会带来多大程度的降本增效空间。”

大模型和产业端结合,目前有两种主要的落地模式。其一是企业采用“公有云+API调用”的模式,成本相对较低;另一种则是私有化部署模式,成本较高,但数据安全方面将会获得更多保障。

白双告诉21记者,孚知流提供基于大模型的SaaS服务,也为客户进行私有化部署。

SaaS套餐主要就是通过调用API接口的方式提供服务。“我们向用户提供SaaS解决方案时,会按照规模收取席位费用,并附赠一定数量的流量包(tokens),如果用户超额使用,就需要额外支付流量费用。”价格战意味着单位token数花费降低,甚至能变为0。“价格敏感的客户能够以更低的门槛来使用我们的产品。”

但需要完成大模型私有化部署的大客户实际上没有受到什么影响。“目前降价的大模型大都是闭源的,而可私有化部署的模型通常是开源的。”她解释道。

“这些客户可能目前处于观望状态,期望有更垂直、小参数单位开源模型,在保障安全的情况下,不用消耗太多算力。”白双告诉21记者。

卢言霞则指出,用户使用生成式AI的主要挑战,不是成本,而是效果。 不过,虽然业界和学术界目前都有评估大模型能力的标准,但这些标准主要聚焦模型效果,系统评估性能的标准目前还没有出现。

“现在大家只宣传价格降低,似乎很少提起模型的并发情况,也不大考虑响应速度。”在硅基智能科技有限公司CEO司马华鹏看来,价格低、高并发、良好的应答质量是AI领域的“不可能三角”。“如果三项指标都能表现优异,从经济学角度来看是不可持续的。”他直言。

第三方测评机构Artificial Analysis的测试结果显示,低价区间的大模型已经非常拥挤,但质量仍良莠不齐。

司马华鹏向记者指出,目前参与降价的不是能力最强的大模型,厂商的“砍一刀”也没有覆盖所有产品。 

在性能差别不大,甚至略微落后于竞品的情况下,盲目的价格混战对品牌声誉带来了一定风险。

司马华鹏认为,如果模型间性能拉不开差距,每一家提供的服务都不够惊艳,最后迎来的就是整个AI市场付费意愿的降低。“价格战打久了,用户心里揣测便宜没好货,是很正常的事。” 

在他看来,字节、阿里、百度等大厂提供的核心服务是传递信息。而当前生成式人工智能应用实际上是传播知识的工具。相比价格,AI服务的用户会更关心知识的质量。“以OpenAI为例,其旗下的产品已经开始部分付费,但未对用户热情产生太大影响,究其根本就在于OpenAI应用的产品力是不断提升的,这是个良性循环。” 

大模型成“引流套餐”

降价、拉新、盈利、存活,这套生存逻辑比生成式AI浪潮来得还要早。互联网时代的跑出来的公司、模式、产品背后,都少不了价格搏杀。后“价格战”时代,大厂缠斗的涟漪已经随着时间逐渐扩散到产业链的各个环节,但前路似乎还在迷雾之中。 

郭涛认为,对于上游的芯片制造商和云计算提供商,价格战可能会带来更高的需求,但同时也可能导致利润空间缩小;对于下游的用户,价格战将降低他们使用AI技术的门槛,有助于AI技术的普及和应用。 

在司马华鹏看来,如何利用大模型发掘应用、场景,是用户和开发者更应该关注的问题。他在接受采访时多次提到,大模型本质上是工具,最终还是应当找到合适的应用场景才能发挥价值。 

大模型厂商处在爆炸核心,竞争格局激烈带来的生存风险加剧是显而易见的。有AI企业从业人员向21记者坦言,这轮价格战颇有互联网企业早期拓展市场的意味。 

对于中小企业来说,更大的竞争压力成为一种必然。“生存空间变小、甚至被淘汰出市场都是有可能的。”因此,郭涛认为,如何在竞争中保持创新和差异化将是这些企业面临的挑战。 

在白双看来,tokens价格降低甚至免费的当下,基于模型本身卖应用可能逐渐变成一种主要的变现思路。用模型的低价做“引流套餐”,销售云计算或终端应用服务获利的模式可能会越来越广泛地出现。

除了大厂借价格战拉用户“上云”,toC赛道也有厂商做了类似尝试。“当红炸子鸡”Kimi就在近期小范围灰度测试了打赏功能。有用户在使用时被提示可通过支付购买5.2元至399元不等的礼物以获取总量不同的高峰优先使用时长。 “大模型可能会变成某种意义上的基础设施,厂商通过构建在模型之上的应用盈利。” 

此外,新用户涌入也为繁荣AI生态带来了可能。宣布降价消息的当天,火山引擎还官宣了与中国电动汽车百人会的合作。字节将与吉利汽车、长城汽车、捷途汽车、赛力斯、智己汽车等 20 余家厂商,宣布成立汽车大模型生态联盟。

此外,火山引擎还与OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。据悉,目前,OPPO小布助手、荣耀智慧办公智能助手、小米“小爱同学”,以及华硕笔记本电脑的豆叮AI助手等应用,均已接入火山引擎的大模型服务。 

“发展短时间内将会加速。但是,终局目前完全不好说。”卢言霞也坦言,当下toB的路径比较明确,就是卖大模型应用与解决方案。但由于接下来大模型的产品形态并没有确定,所以这种明确也只是暂时的。基于相同的困境,toC端的未来也难以判断。“可能行业会‘卷’向能力趋同,失去竞争壁垒;又或者价格战大浪淘沙,真的能带来新的转机。”

(作者:冯恋阁,王俊,实习生孔雅萱 编辑:王俊)

冯恋阁

记者

关注人工智能、知识产权、数据合规等互联网科技领域新动向。微信:isfenglg

王俊向TA提问

记者

做数字经济时代的观察者。微信:wangdajun0117