专访广东省具身智能机器人创新中心负责人丁宁:机器人的核心是“人脑”而非“人形”

深圳观察陈思琦 2024-04-24 18:38

南方财经全媒体记者 陈思琦 深圳报道

将双腿折叠到身体后方,没有手部支撑,仅靠膝盖的弯曲就从“躺平”状态一跃而起,随即头部旋转180度“直视”镜头——近日,波士顿动力纯电版人形机器人Atlas以“骨骼清奇”惊艳全球。

纯电版Atlas一只手有3根指头,浑身关节灵活得有些“惊悚”。波士顿动力借此传达了一个理念:人形机器人并非要完全像人,足够灵活的设计反而让其更能胜任各种危险工作。

“我们要关注的是如何复现人的能力,而非人的形态。”广东省具身智能机器人创新中心负责人、深圳市人工智能与机器人研究院(AIRS)常务副院长丁宁认为,人形机器以“人”为对标对象,但关注的重点不应只是“人形”,而是要让机器人能够像人一样不断突破,并创造工具、使用更多工具,基于“智能性”来提高机器人的工作能力及效率。

4月16日,广东省具身智能机器人创新中心(以下简称“创新中心”)在深圳南山正式启动,由香港中文大学(深圳)及其下设单位深圳市人工智能与机器人研究院(AIRS)牵头,依托深圳国创具身智能机器人有限公司组建,首批股东单位包括了逐际动力、乐聚机器人、奥比中光、云天励飞等。

除了广东,北京、上海、浙江等地也相继设立了省级“人形机器人创新中心”,向原则上每个行业只设一个的“国家级制造业创新中心”评选发起冲刺。这其中,广东在命名上独树一帜,侧重“具身智能”而非“人形机器人”。

丁宁接受南方财经全媒体记者专访时表示,“具身智能”(Embodied AI)是AI技术与机器人硬件的结合。以工业场景为例,具身智能机器人将具备“思考”能力,对产线上的各种问题迅速做出反应、调整策略,保证产线具有相当的柔性和容错能力。

丁宁表示,机器人距离大规模进工厂、进家庭还有很长的路要走。而广东的制造业基础雄厚,加之深圳的软件实力雄厚,为具身智能机器人的研发和产业化提供了坚实基础。

由此,创新中心将不拘于机器人的形态,而从专业特种、工业制造、家用服务三类需求入手,犹如“打怪升级”,循序渐进提高机器人的“智能”水平。

(丁宁。受访者供图)

应被复现的是“人脑”而非“人形”

南方财经:北京、上海在建的省级创新中心都叫“人形机器人创新中心”,而广东省的叫“具身智能机器人创新中心”,命名上为什么会有区别?

丁宁:具身智能,就是AI和机器人的结合。人形机器人在国内非常火热,而“具身智能”概念的普及度还不高,其实国外早就开始布局了。

去年5月,英伟达创始人黄仁勋在ITF World 2023半导体大会上就说,人工智能的下一个浪潮将是具身智能。Open AI去年3月也曾提到,要以机器人为载体来接入AI数据。

目前在国内,AI和机器人属于两个学科。前者属于计算学科,偏软件;后者属于机械、控制、电子类学科,偏硬件。

到了产业化阶段,搞AI的人做语言大模型、多模态模型,但聚焦在商业、金融、多媒体等领域,对制造业缺乏关注,导致我国制造业的软件能力一直停留在中低端水平。比如工业机器人,虽然效率和精准度很高,但尚不具备适应变化的能力,一旦产线上出现一个小错误,机器人会“闭着眼睛”继续干,酿成大错。

我们认为,机器人不是一种“产品”,而是一种软硬件集成的“方法论”。从学术到产业化,AI和机器人都是高度关联的,“智能”水平才是机器人最终能否很好地完成作业的关键。因此,我们在命名上选择“具身智能”,希望把产业链构建得更完整,包括硬件和软件。

硬件方面,深圳的制造业基础雄厚,北京、上海等地的人形机器人核心零部件也会到深圳或者广东来买。软件方面,深圳有华为、鹏城实验室等实力强劲的企业和科研机构,已经具备软件基础。创新中心要做的,是聚合这两方面的能力。

南方财经:AI与机器人结合,形态上是否有要求?强调机器人的“人形”有无必要?

丁宁:人形机器人的好处在于提供一个“对标对象”,也就是人本身。但是,我们要关注的是如何复现人的能力,而非人的形态。

人类的体力之有限,是很显然的。但人类会创造工具、使用工具,从徒手摘果子,到使用利器去种植、狩猎,从而大幅提升自己的能力和效率。可以说,人类最大优势是大脑,而非“人形”。

机器人就是物理世界的一种移动载体。水平面上的移动是轮式机器人最优;空间移动要借助空气动力,无人机是最合适的。要结合应用场景,而不是一味追求“人形”。

“类人形”是更科学的说法,就是让机器人学习“人形”的某种能力和特点,但不用完全模仿人的形态和行为。比如,一只手不一定要有5根手指头,有些场景可能只需要3根,有些则需要8根。

(纯电版Atlas。图源:波士顿动力官网)

具身大模型需与世界真实交互

南方财经:ChatGPT、Sora等生成式AI的“底座”是数据,具身智能对数据是否提出了更高的要求? 

丁宁:具身智能要求机器人理解物理世界的运作规则以及各个物理量之间的耦合关系,仅通过文本和视频是理解不到的。

就像照片拍得再高清,也拍不出重力场、电磁波;让小孩看再多苹果的图片,都不如让他自己拿着苹果啃一口。物理世界的维度非常丰富,数据的获取只能通过机器人的“身体”与物理世界交互。

我国在具身智能方面起步较晚,从芯片到算力,到人才,到生态体系都相对落后。我们最大的优势是拥有完备的工业体系和成本更低的制造能力,以及效率更高的举国体制。用好这些优势,我们就能更完整、更低成本、更高效地获取数据,构建具身智能的基础大模型。

比起发达国家将中低端制造业都转移出去,全工业体系让我国拥有更完整的数据维度,覆盖物理世界。比如生产一个塑料脸盆,在将柔性材料挤压成型的过程中,我们就积累了对材料属性的深入理解,积累了独有的生产数据。

其次,我国完备的制造业体系能使数据的获取成本更低。机器人是数据的接口和载体,除了机器人的“身体”,还需有生产装备和各种模具。如果制造成本能够控制,获取数据的成本也会相应降低。

而且,我国拥有自上而下的举国体制。去年,国家数据局正式获批成立,就是希望在数据的组织、分配形式上设定一个机制。

南方财经:目前仍存在生产各环节数据分散、流通不畅等问题。你有何建议?

丁宁:业内常说数据是资产、是“矿产”。数据是建模的原材料,一旦分散就不能称之为资产,数据不汇集起来就形成不了大模型。

一些手上有数据的企业之所以用不好,是因为数据都集中在某一类场景上,而他们不可能穷举生产过程的所有场景。所以,他们的大模型总是在99%的状态上,剩下1%的边缘场景解决不了。

每家企业的数据和模型都是片面的,只有把数据聚起来、互为补充,对场景的覆盖才会更完整。我一直建议推行“数据入股”,从国家层面建立起数据的交易和分配机制。比如国家用了你的数据,把大模型训练起来了,你可以通过贡献数据的独特性来分享收益。数据独特性高、价值高,股权比例就大。

从特种、工业到家用的“打怪升级”

南方财经:创新中心瞄准了专业特种、工业制造、家用服务三类需求,为什么是这三类?

丁宁:三类场景是循序渐进的。专业特种考验的是干对、干准确;工业制造考验的是干得快、有效率;家用服务则要求极致的安全,复杂程度越来越高。

专业特种,比如电网、水务、采矿等,核心是执行“效果”。这些场景的规范化程度很高,只要按规程去做,基本不会出错,对“智能”水平的要求也没那么高。

工业制造,关键是执行“效率”。但不同于传统的工业机器人,具身智能不止于以速度、精度来提高生产效率,而要求有适应变化的能力,保证产线具有相当的柔性和容错能力。假如突然来料有问题,或哪一款机器设备老化,导致生产的中间环节出现问题,机器人要能够迅速反应和适应,及时调整策略,而不是“闭着眼睛”继续干。

家用服务,关键是极致的“安全”。今天有水倒在地上,明天煤气没关,后天又是各种情况交织在一起……家用环境存在许多变数,智能理解任务的维度变得非常复杂。

未来,机器人一定会走入工厂、走入千家万户。但现阶段就到汽车产线上打螺丝,或在家里做家务,技术水平和安全性远远达不到。

南方财经:创新中心第一批股东单位包括逐际动力、奥比中光、云天励飞、乐聚机器人等8家企业,涵盖整机研制、智能芯片、光学感知等领域,中心与这几家公司的合作模式是怎样的?

丁宁:目前,创新中心各家公司的股权占比很均等。我们希望把各股东单位的软硬件能力聚合起来,形成一个整体的作业系统,为产业提供服务。

我们将组建产业联合体,让企业在各自所属的链条环节起到引领作用,再一起去服务有场景需求的龙头客户,比如南方电网,为客户提供一个整体性的智能系统解决方案。这种项目体量很大,股东单位可以各司其职,而非相互竞争。

(深圳国创具身智能机器人有限公司股东信息。图源:爱企查)

南方财经:深圳与香港一河之隔,创新中心是否会探索与香港的合作机遇?

丁宁:目前,香港制造业占GDP比重约1%,正在力推“再工业化”,目标未来5到10年将制造业比重提高到5%。香港对引入高端制造企业落地建厂、建产线提供了专项资金扶持,机器人产业显然符合他们的支持范畴。

我们与香港的沟通很多,香港高校也鼓励教授创新创业,参与到科技创新载体建设中。未来我们会利用好香港中文大学的深港两地校园,联动两地的国际化资源,尤其是人才优势,探索创新中心到香港布局。

(作者:陈思琦 编辑:孙超逸)

陈思琦向作者提问

记者

常驻深圳,关注科创、区域产业、教育等话题,欢迎交流。微信号:sukichen1723(请备注来意)