AI Token的中国式出海

21世纪经济报道 赵云帆
2026-03-04 07:00

今年2月26日、27日,英伟达(NVDA)股价于仅两个交易日中跌去10%,其跌幅“恰好”是过去一年之最。

仿佛,去年春节 DeepSeek 横空出世给英伟达带来的“至暗时刻”,时隔一年重现。

准时光临的,依然是中国AI大模型这只“年兽”。而比起去年DeepSeek单兵出击,今年的中国AI模型掀起的,更像是一场巨型的会战。

根据全球最大的大模型API聚合平台OpenRouter数据,截至2月28日,该平台内前十模型总Token消耗量已突破28.7万亿,其中国产模型贡献超过14.69万亿,为历史上首次单月Token调用占比过半且超越美国产模型。

其中,国产模型MiniMax M2.5,月之暗面的Kimi K2.5、DeepSeekV3.2,分别以5.44万亿、4.27万亿和3.09万亿Token,居调用排行榜的第一、第二和第四席位。智谱旗下GLM 5则以1.89万亿位居第八。

当然,更多诸如阿里Qwen系列模型也得到大量调用,但仅因不同版本模型分流,未能居于前十榜单。

以上数据似乎很容易让我们得出一个结论——中国AI模型,不仅彻底实现了出海,且在智能体调用和编程这两个最重要的领域,完成了对美国的超越。

考虑英伟达芯片早已停止进口,那么一个关于英伟达的“恐怖故事”,将会呼应着中国模型出海,成为全球AI角逐下半场改天换日的序言。

图片来源:视觉中国

超越的背后

2月26日,英伟达全方位超越市场预期的财报,最终只换回了华尔街投行的集体“用脚投票”。

在“担忧AI企业无序资本开支”的市场语境之中,英伟达头上的乌云,更来自大洋彼岸的中国。

“根据现行规定,公司无法为中国数据中心市场提供具有竞争力的产品。”英伟达财报中披露。

英伟达在2026财年财报会议中也确认,‌未收到中国客户的实质订单,H200未产生任何来自中国的收入‌‌。

也就是说,除“可能通过其他途径”获得芯片之外,从去年4月开始,中国AI模型企业就一直在全球尖端算力芯片的断供状态下存活,且活得越来越好。

事实上,早在OpenRouter数据发布之前,硅谷从业者们感官上的变化,已经佐证了以上数据的真实性。

知名硅谷投资人,Facebook早期创始成员阿加瓦尔(Aditya Agarwal)去年11月便在社交媒体上发出过这样一个感叹:

“即便是在硅谷,大部分人都认为应用/智能体都是用诸如Claude或者ChatGPT完成的——然而事实上在表象之外,50%以上的大语言模型调用是通过廉价的开源模型完成。”阿加瓦尔在博客中表示。

“这能有效证明中国模型,诸如Kimi、DeepSeek等,实际在支持大部分的AI应用,美国同行甚至无法替代。”阿加瓦尔表示。

同样的问题,AI和加密货币领域坐拥百万粉丝的知名博主马里奥·奈费(Mario Nawfal)则说的更为露骨:

“硅谷是否在暗中运行于中国AI之上?硅谷的AI企业们表面光鲜亮丽,直到你查看其引擎盖下的真相。忘掉炒作吧。硅谷正悄然将其最热门的初创公司构建在中国AI之上。Cursor?可能正运行于来自北京的DeepSeek。Cognition AI?显然在使用智谱。Airbnb?跳过了OpenAI,选择了阿里的Qwen。甚至连Sam Altman的前CTO,如今也在推出基于中国模型的工具。”

马里奥·奈费所指的是米拉·穆拉蒂(Mira Murati),后者离开OpenAI后创立了AI初创公司Thinking Machines Lab,并于去年10月发布了用于优化AI大模型的工具Tinker。

Tinker初期只针对两款开源模型,其中就有阿里巴巴的Qwen。而这证明了Qwen现在已然是硅谷最主流调用工具模型之一。

便宜才是一切

“因为它们更便宜、更快、开源,而且老实说……对于想要交付可用产品的开发者来说,就是更好。”马里奥·奈费表示。

这是一个和中国制造业类似的故事——中国几乎制造了全球所有的原材料、零部件、模具。包括美国在内,任何国家都很难完全独立于中国供应链,完成哪怕是一根烧烤刷子。当然,你也可以硬着头皮选择不使用中国的供应链,但那会让产品失去价格竞争力,并且面临市场快速迭代的风险。

今年2月,月之暗面宣布完成新一轮融资。而根据澎湃新闻报道,旗下大模型Kimi2.5在今年年初一经发布,20天内的调用量已经超过了去年全年。

大获成功的背后有天时佐佑。通用智能体OpenClaw大火之后,月之暗面顺势推出KimiClaw允许客户一键部署。随之而来的是智能体调用Kimi 2.5水涨船高。

然而真正让Kimi突然跻身全球顶级AI大模型的,仍然是“便宜”:基准跑分名列前茅,调用价格是Claude的八分之一,而且开源。

无独有偶,月之暗面的中国友商们也都非常默契:2月末问世的阿里Qwen 3.5将百万Token价格定到了0.8元人民币,仅为Gemini的1/18。至于尚未发布便赚足眼球的DeepSeek V4,业内普遍认为,由于会优先适配国产芯片,DeepSeek V4的调用价格或许会惊掉人们的下巴。

AI的中国式出海

“Token”在AI领域被称为“词元”。但在区块链和加密货币领域,“Token”又有代币的意思。

今天,“代币”这个词,对于描述如今成本敏感的AI行业,又显得恰如其分。

一个简单的事实是,在模型性能领域,按照所谓的“Scaling Law(规模化法则)”,调用效果的好坏与调用资源的用量几乎成正比。但是,当中国AI模型可以用美国AI模型10%,甚至5%的价格调用时,由模型性能带来调用量差距便几乎可以被忽略不计,调用哪家的AI大模型,变成了一个简单的“成本题”。

毫无疑问,中美电价差异是成本题的终极解:中国工业用电的价格约较美国低30%~40%,中西部绿电的价格比美国电价低50%到70%。

加上中国工业用电基数大,中国AI模型可以更好地利用谷电进行训练和调用。相比之下,美国AI企业腾挪的空间就显得小得多。

再比如,对于代码(coding)、智能体(Agent)等均以代码能力为主的基准场景中,中国AI模型的性能差距并不明显。任务本身的特点,也使得其不要求低延迟、快响应的就近算力配备。

这一切,都让“中国Token出海”逻辑无比顺畅,也让美国AI公司感受到了前所未有的危机。

今年2月23日,美国AI公司Anthropic发布所谓的官方声明,“指控”三家中国AI公司:DeepSeek、月之暗面和MiniMax——对其Claude模型实施了“工业级蒸馏攻击”,创建2.4万个虚假账户,旨在提取Claude的核心能力来训练自家模型。

“巧合”的是,Anthropic“指控”的三家公司,恰好便是OpenRouter平台调用模型前三的中国企业。

不过,即便中国企业真的在“蒸馏”模型,即便Anthropic真的有办法防止所谓的虚拟账户进行“工业级蒸馏攻击”,一些行业人士仍然认为,当前的中国企业可以通过开源,甚至“互相蒸馏”,保持大模型性能差距不被甩开。

而当中国国产芯片开始大规模对英伟达芯片进行补位,中国AI大模型产业“自主可控”,整体出海的最后一块拼图,也将正式备齐。

(作者:赵云帆 编辑:郑世凤,张明艳)