工业AI,进入“共建时代”
工业AI最难的不是模型
21世纪经济报道记者 孔海丽
京东工业相关负责人在接受21世纪经济报道记者采访时提到一个细节,大模型爆发之初,公司内部曾明确讨论一个问题,如果通用大模型进化足够快,行业还有没有必要自己训练模型?
工业领域不缺大模型,但是很缺准确靠谱的大模型。
过去两年,从通用大模型到行业模型,从制造业到能源、电力、汽车,几乎每个行业都出现过自己的“大模型故事”。
结论是什么?
“解决工业场景的复杂性问题,垂直模型是必由之路,没得选。”
原因很复杂。工业场景对准确率、稳定性和专业知识的要求,远高于互联网场景。一个聊天机器人回答错误,用户最多关掉页面重新提问;但如果工业系统推荐错误型号、错误参数,或者导致错误采购决策,代价可能是真实的生产损失,甚至威胁安全。
这导致工业AI的发展始终面临一个核心问题:模型越来越强,但产业数据始终分散,难以在真实场景中落地。
日前京东工业发布了“百川计划”,宣布联合上游企业共同建设行业大模型生态。表面看,这是一次围绕AI的产业合作;实际上,它试图解决的是工业数字化二十年来一直没有完全解决的问题,也就是,如何让分散在产业链各个环节的数据真正流动起来。
这也是工业AI从技术竞争走向产业竞争的一个信号。
过去大家比拼的是模型能力,现在开始比拼组织产业资源的能力。
工业AI最难的,不是模型
如果站在互联网行业的视角,很容易把工业大模型理解为“给工业企业装上AI”。
但真正进入工业领域后会发现,问题远没有那么简单。
京东工业所处的MRO(维护、维修和运营)工业供应链市场有一个典型特点,SKU数量极其庞大,商品标准化程度低,大量商品带有行业特征和企业特征。
一个轴承、一个断路器、一颗螺丝,看起来只是简单商品,但背后往往对应不同规格、型号、标准和应用场景,在每个企业和供应商系统中的名字也千差万别。
据京东工业方面披露,其服务的工业供应链体系中拥有接近1亿SKU,而长尾物料占据了绝大部分。
这些数据长期存在几个问题。
首先是分类体系不统一。同一种商品,在不同企业可能有完全不同的命名方式。
其次是参数标准不统一。同样的产品描述,往往存在大量非结构化信息。
知识沉淀也很分散,很多经验掌握在采购员、工程师和销售人员手里,“老师傅经验”几乎等同于“独门秘籍”。
所以,过去很长时间,工业供应链都依赖经验驱动。
谁更懂产品,谁更熟悉客户需求,谁就拥有更高效率。
而AI要具备或者辅助这些能力,首先要理解这些行业知识。
问题恰恰在这里。
通用大模型的知识主要来自互联网公开数据,而工业知识大部分并不在互联网。据德力西相关负责人透露,通用大模型并不缺通识能力,缺的是对产品型号、行业术语、应用工况等细节的理解。
大量数据沉淀在企业ERP、产品手册、技术文档、历史订单和工程实践中。
如果没有这些数据,再强大的通用模型进入工业场景也容易出现“幻觉”。
从这个角度看,工业AI真正的门槛并不是训练模型,而是获取高质量数据。
一场关于数据的产业协作实验
百川计划最值得关注的地方,并不是发布了什么模型,而是它试图建立一种新的产业协作方式。
按照京东工业的规划,未来将联合上游品牌和制造企业,从数据、模型和应用三个维度共同建设行业生态。
这种模式背后有一个现实判断。
单个企业的数据终究有限。即便一家企业拥有丰富的产品资料和业务数据,也很难覆盖整个行业。如果行业模型长期依赖单一企业的数据,最终仍然会遇到数据边界。
“一家公司的力量是有限的,我们需要源源不断的动力保持整个行业模型的领先。只有数据的流通性才能带来真正的价值。”前述京东工业负责人表示。
京东工业AI的发展开始出现一个新的趋势,从企业级模型走向产业级模型。
与德力西电气的合作案例是一份样本。双方将超过2000份产品手册、8万条物料数据进行清洗和结构化处理,最终形成4万条标准化商品数据。
在模型训练过程中,这些数据被进一步转化为行业知识。
最终形成的低压电气行业模型仅有8B参数,却在多个专业任务上超过部分通用模型。
也就是说,在工业场景中,高质量行业数据的重要性,正在超过参数规模本身。
过去两年,行业讨论更多集中在模型参数和算力。但工业领域正在证明,决定应用效果的往往不是模型有多大,而是数据是否专业、知识是否准确、场景是否闭环。
这也是工业AI与互联网AI最大的差异。
互联网更关注通用能力,工业更关注确定性。
百川计划真正想解决什么
如果仅仅把百川计划理解为一次AI合作,可能低估了它的意义。
从产业角度看,它实际上瞄准的是工业供应链最基础的一层能力:商品标准化。
这是一个并不性感,却决定行业效率的问题。
过去十多年,中国工业互联网、数字化采购和供应链平台不断发展,但行业始终存在一个难题,不同企业之间的数据难以互通。采购方有自己的编码体系,供应商有自己的产品体系,平台有自己的分类体系,大量信息需要依赖人工经验匹配。
这种信息损耗最终体现在采购成本、沟通成本和库存成本上。
京东工业从成立之初持续建设“墨卡托标准商品库”,本质上就是在解决这个问题。
而AI的出现,则让标准化工作拥有了新的工具。过去需要人工完成的数据清洗、分类和标注,如今可以借助模型实现自动化处理。
更重要的是,模型反过来还能推动行业标准进一步统一。
如果说工业互联网时代解决的是连接问题,那么工业AI时代开始解决理解问题。系统不仅能够连接数据,还能够理解数据。
这也是京东工业不断强调“行业语言体系统一”的原因。对于工业供应链而言,统一语言体系的重要性甚至不亚于统一系统。
工业AI竞争开始进入下半场
从全球范围看,制造业和供应链领域一直被认为是AI落地最复杂的场景之一,原因并非技术不足,而是产业链太长、参与主体太多、数据基础不足,但模型能力可以复制,产业协同能力很难复制。
因此,工业AI的竞争逻辑正在发生变化。第一阶段竞争的是模型能力;第二阶段竞争的是行业知识;第三阶段竞争的则是生态组织能力。
谁能够汇聚更多产业数据,谁能够建立更大的行业协作网络,谁就更有机会构建行业级智能基础设施。
从这个角度观察,百川计划更像是一场基础设施建设。它未必会在短时间内带来爆发式增长,但可能影响未来几年工业AI的发展路径。
这条路并不轻松。数据共享始终伴随着安全、隐私和商业利益分配等问题。对于制造企业而言,产品数据、客户数据和运营数据本身就是核心资产。
如何在开放与保护之间找到平衡,将决定产业生态能否持续运转。这也是所有产业大模型最终都必须回答的问题。
不过,工业AI发展到今天,行业越来越意识到,仅靠一家企业、一个模型、一次技术突破,很难完成工业智能化升级。真正的突破点,来自产业链共同参与的数据协作。
(作者:孔海丽 编辑:李新江,张明艳)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。
