银河通用创始人王鹤:人形机器人正迈向生产力时代

21Tech白杨 2025-03-27 14:47

合成数据的应用,将缓解具身大模型训练数据缺乏的挑战。

21世纪经济报道记者白杨 北京报道

3月27日,2025中关村论坛年会正式开幕。银河通用创始人兼CTO王鹤在会上表示,人形机器人寄托了人类对美好生活以及尖端科技的向往。

他表示,从20世纪70年代以来,人形机器人就初具雏形。这一阶段具有代表性的是本田ASIMO机器人、波士顿动力Atlas机器人,它们都展现了一定的行走能力和简单的运动能力。

但这些机器人背后的技术相对传统,因此也不可避免地存在一些局限性,比如新的运动技能开发周期长、对地形的适应性差以及在新的环境中部署可靠性欠佳。

而今年以来,人们看到了许多机器人秀。比如蛇年春晚上,宇树科技展示了机器人的群体舞蹈;国地共建具身智能机器人创新中心开发的“天工”机器人已经可以在一系列复杂的地形中奔跑,并在备战马拉松比赛。

在王鹤看来,人形机器人已经步入运动时代。“机器人对地形有了很强的自适应性,可靠性也变得非常高。这背后是无需视觉输入、基于关节状态输入的强化学习技术引领了这场革命”。

但他也强调,虽然现在没用视觉输入就培育出了运动健将,但运动健将绝不是人形机器人的终点。

去年,特斯拉的人形机器人Optimus在电车工厂里展示了电池分拣能力。王鹤表示,这样的能力显然要依赖连续的视觉输入,而银河通用发布的Galbot机器人也是依靠该技术实现各种泛化的操作能力。

王鹤认为,这种以视觉引领肢体控制,进而实现自主泛化操作的能力,将让人形机器人真正成为人类的帮手。所以接下来,人形机器人的发展将进入到最激动人心的生产力时代。

在人形机器人的生产力时代,一项核心技术就是基于视觉输入的端到端具身大模型实现任务的通用和能力泛化。但王鹤指出,目前具身大模型的发展遇到了一些困难,其中挑战最大的是数据的缺乏。

为破解这一难题,银河通用尝试的方法是通过大规模生产和使用合成数据来训练人形机器人。

据其介绍,银河通用研发的全仿真合成数据生产管线,在短短一周内就能生成全球规模最大的十亿级机器人操作数据集,且包含视频、语言、动作等三个模态。

基于此,银河通用在年初也发布了全球首个完全基于合成数据训练的端到端具身大模型GraspVLA。

王鹤表示,通过大量的合成数据,大模型不再需要任何真实世界的数据,就能获得很高的可靠性,这样的数据成本非常低廉。如果还想进一步训练它按照人类意图去工作,也只需要采集少量的人工数据就能完成训练。

同时,银河通用的GraspVLA大模型也拥有较强的举一反三能力,并具备柔性物体的操作能力。

据王鹤介绍,目前,银河通用的机器人已经在药店、新能源汽车工厂等场景中落地。

(作者:白杨 编辑:巫燕玲)

白杨
向TA提问

IT版记者

关注科技互联网领域报道。