AI Token的中国式出海

21世纪经济报道赵云帆

2026-03-04 07:00

今年2月26日、27日，英伟达（NVDA）股价于仅两个交易日中跌去10%，其跌幅“恰好”是过去一年之最。

仿佛，去年春节 DeepSeek 横空出世给英伟达带来的“至暗时刻”，时隔一年重现。

准时光临的，依然是中国AI大模型这只“年兽”。而比起去年DeepSeek单兵出击，今年的中国AI模型掀起的，更像是一场巨型的会战。

根据全球最大的大模型API聚合平台OpenRouter数据，截至2月28日，该平台内前十模型总Token消耗量已突破28.7万亿，其中国产模型贡献超过14.69万亿，为历史上首次单月Token调用占比过半且超越美国产模型。

其中，国产模型MiniMax M2.5，月之暗面的Kimi K2.5、DeepSeekV3.2，分别以5.44万亿、4.27万亿和3.09万亿Token，居调用排行榜的第一、第二和第四席位。智谱旗下GLM 5则以1.89万亿位居第八。

当然，更多诸如阿里Qwen系列模型也得到大量调用，但仅因不同版本模型分流，未能居于前十榜单。

以上数据似乎很容易让我们得出一个结论——中国AI模型，不仅彻底实现了出海，且在智能体调用和编程这两个最重要的领域，完成了对美国的超越。

考虑英伟达芯片早已停止进口，那么一个关于英伟达的“恐怖故事”，将会呼应着中国模型出海，成为全球AI角逐下半场改天换日的序言。

图片来源：视觉中国

超越的背后

2月26日，英伟达全方位超越市场预期的财报，最终只换回了华尔街投行的集体“用脚投票”。

在“担忧AI企业无序资本开支”的市场语境之中，英伟达头上的乌云，更来自大洋彼岸的中国。

“根据现行规定，公司无法为中国数据中心市场提供具有竞争力的产品。”英伟达财报中披露。

英伟达在2026财年财报会议中也确认，‌未收到中国客户的实质订单，H200未产生任何来自中国的收入‌‌。

也就是说，除“可能通过其他途径”获得芯片之外，从去年4月开始，中国AI模型企业就一直在全球尖端算力芯片的断供状态下存活，且活得越来越好。

事实上，早在OpenRouter数据发布之前，硅谷从业者们感官上的变化，已经佐证了以上数据的真实性。

知名硅谷投资人，Facebook早期创始成员阿加瓦尔（Aditya Agarwal）去年11月便在社交媒体上发出过这样一个感叹：

“即便是在硅谷，大部分人都认为应用/智能体都是用诸如Claude或者ChatGPT完成的——然而事实上在表象之外，50%以上的大语言模型调用是通过廉价的开源模型完成。”阿加瓦尔在博客中表示。

“这能有效证明中国模型，诸如Kimi、DeepSeek等，实际在支持大部分的AI应用，美国同行甚至无法替代。”阿加瓦尔表示。

同样的问题，AI和加密货币领域坐拥百万粉丝的知名博主马里奥·奈费（Mario Nawfal）则说的更为露骨：

“硅谷是否在暗中运行于中国AI之上？硅谷的AI企业们表面光鲜亮丽，直到你查看其引擎盖下的真相。忘掉炒作吧。硅谷正悄然将其最热门的初创公司构建在中国AI之上。Cursor？可能正运行于来自北京的DeepSeek。Cognition AI？显然在使用智谱。Airbnb？跳过了OpenAI，选择了阿里的Qwen。甚至连Sam Altman的前CTO，如今也在推出基于中国模型的工具。”

马里奥·奈费所指的是米拉·穆拉蒂（Mira Murati），后者离开OpenAI后创立了AI初创公司Thinking Machines Lab，并于去年10月发布了用于优化AI大模型的工具Tinker。

Tinker初期只针对两款开源模型，其中就有阿里巴巴的Qwen。而这证明了Qwen现在已然是硅谷最主流调用工具模型之一。

便宜才是一切

“因为它们更便宜、更快、开源，而且老实说……对于想要交付可用产品的开发者来说，就是更好。”马里奥·奈费表示。

这是一个和中国制造业类似的故事——中国几乎制造了全球所有的原材料、零部件、模具。包括美国在内，任何国家都很难完全独立于中国供应链，完成哪怕是一根烧烤刷子。当然，你也可以硬着头皮选择不使用中国的供应链，但那会让产品失去价格竞争力，并且面临市场快速迭代的风险。

今年2月，月之暗面宣布完成新一轮融资。而根据澎湃新闻报道，旗下大模型Kimi2.5在今年年初一经发布，20天内的调用量已经超过了去年全年。

大获成功的背后有天时佐佑。通用智能体OpenClaw大火之后，月之暗面顺势推出KimiClaw允许客户一键部署。随之而来的是智能体调用Kimi 2.5水涨船高。

然而真正让Kimi突然跻身全球顶级AI大模型的，仍然是“便宜”：基准跑分名列前茅，调用价格是Claude的八分之一，而且开源。

无独有偶，月之暗面的中国友商们也都非常默契：2月末问世的阿里Qwen 3.5将百万Token价格定到了0.8元人民币，仅为Gemini的1/18。至于尚未发布便赚足眼球的DeepSeek V4，业内普遍认为，由于会优先适配国产芯片，DeepSeek V4的调用价格或许会惊掉人们的下巴。

AI的中国式出海

“Token”在AI领域被称为“词元”。但在区块链和加密货币领域，“Token”又有代币的意思。

今天，“代币”这个词，对于描述如今成本敏感的AI行业，又显得恰如其分。

一个简单的事实是，在模型性能领域，按照所谓的“Scaling Law（规模化法则）”，调用效果的好坏与调用资源的用量几乎成正比。但是，当中国AI模型可以用美国AI模型10%，甚至5%的价格调用时，由模型性能带来调用量差距便几乎可以被忽略不计，调用哪家的AI大模型，变成了一个简单的“成本题”。

毫无疑问，中美电价差异是成本题的终极解：中国工业用电的价格约较美国低30%~40%，中西部绿电的价格比美国电价低50%到70%。

加上中国工业用电基数大，中国AI模型可以更好地利用谷电进行训练和调用。相比之下，美国AI企业腾挪的空间就显得小得多。

再比如，对于代码（coding）、智能体（Agent）等均以代码能力为主的基准场景中，中国AI模型的性能差距并不明显。任务本身的特点，也使得其不要求低延迟、快响应的就近算力配备。

这一切，都让“中国Token出海”逻辑无比顺畅，也让美国AI公司感受到了前所未有的危机。

今年2月23日，美国AI公司Anthropic发布所谓的官方声明，“指控”三家中国AI公司：DeepSeek、月之暗面和MiniMax——对其Claude模型实施了“工业级蒸馏攻击”，创建2.4万个虚假账户，旨在提取Claude的核心能力来训练自家模型。

“巧合”的是，Anthropic“指控”的三家公司，恰好便是OpenRouter平台调用模型前三的中国企业。

不过，即便中国企业真的在“蒸馏”模型，即便Anthropic真的有办法防止所谓的虚拟账户进行“工业级蒸馏攻击”，一些行业人士仍然认为，当前的中国企业可以通过开源，甚至“互相蒸馏”，保持大模型性能差距不被甩开。

而当中国国产芯片开始大规模对英伟达芯片进行补位，中国AI大模型产业“自主可控”，整体出海的最后一块拼图，也将正式备齐。

（作者：赵云帆编辑：郑世凤,张明艳）

南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权，任何人不得以任何方式使用。详情或获取授权信息请点击此处。

加载全文