Kimi B端负责人黄震昕:行业肯定有泡沫,但基本面很扎实
企业ROI可算清,生产力已质变。
21世纪经济报道记者 雷晨
“今年以来所有模型厂商都在涨价,核心原因是算力成本在全球范围内上涨,不管海外还是国内的卡,都跟不上token需求的增长。”月之暗面Kimi B端负责人黄震昕在近期一场媒体沟通会上坦言。
下游企业AI应用需求爆发式增长,上游算力供给却因芯片产能限制持续紧张。他认为,供需两端的双重挤压下,API价格水涨船高已是必然。
不过,黄震昕表示,如果只盯着输入输出价格的变化来评判模型性价比,对客户而言并不公允。他提到了一项指标——Cache率(缓存命中率,指模型在处理重复或相似输入时复用已缓存计算结果的比例,命中率越高,实际使用成本越低)。
据其介绍,以Kimi为例,原厂Cache命中率达到90%以上,在第三方平台OpenRouter的公开排名中位列第一。“Cache命中率九十多和七八十相比,成本可能差好几倍。”他说。
黄震昕进一步以某互联网大厂为例佐证AI生产力变革的真实性。该企业给每个员工每月800美元的Coding Quota,“老板算得过来账,才愿意投入资源和资金。”
在他看来,这一轮AI变革与移动互联网的本质区别在于,后者提升了信息交换速度,但生产力、生产结构并未发生根本性改变;而这一次,当企业主能够算清ROI并持续追加投入时,意味着生产力提升“已经踏踏实实有了质变”。
他同时回应了外界对行业泡沫的担忧。“现在肯定有泡沫,”他承认,但随即补充道,“Anthropic已经实现了季度盈利,收益是实实在在的。”泡沫存在,但基本面并不空洞,当生产力真实发生质变时,算得过账的企业会持续投入,这正是行业健康度的信号。
对于模型的未来发展路径,黄震昕表示Kimi不会因底层架构创新难度大而绕路。“我们选择直接向最难的问题发起挑战,只有实现底层架构突破,才能做更大的模型,让Scaling Law持续往前走。”他透露,Kimi首次大规模验证和应用的Muon优化器后续已被GLM、DeepSeek V4等模型采用,成为新的标准。
至于企业AI落地的“最后一公里”,他判断目前的FDE(前沿部署工程师)模式仍在摸索期。“难点不在模型厂商,而在于如何快速找到最先能实现效率提升的业务环节,行业还没有标准范式。”但他相信,随着模型基础能力持续变强,应用层的技术范式也会随之简化,“去年大家还在整天讨论Prompt怎么写,今天随着模型变聪明,已经很少有人提了。”
(作者:雷晨 编辑:李新江,张明艳 视频编辑:杨浩凯)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。
