如何用好大模型?如何应对持续迭代的模型浪潮?
21世纪经济报道记者骆轶琪 东莞报道
“机器人”概念在智能化浪潮下已经发展多年,但似乎是在大模型技术迭代之下,开始迎来更好的发展机会。
近日举行的第十四届松山湖中国IC创新高峰论坛上,神顶科技(南京)有限公司董事长、CEO袁帝文回顾历史分析道,早在20年前,面对日本开始做人形机器人的形态,资本市场普遍观念是不靠谱。但近期市场开始重视这类形态,很大程度是与大模型的快速发展有关。
“大模型能够把过去20年间所有的信息、论文等数字化后,进行训练。目前的结果是,机器人可以作诗、拍电影,把人雅致的一面学习过去了,但真正具体干活儿,例如倒垃圾能力还不够。所以我们看到大模型公司都在积极与人形机器人公司合作,做数据采集等工作,类似特斯拉推FSD(完全自动驾驶)前期也需要做类似采集,这是自动驾驶的基础。”他认为,如果人形机器人最终的目的是要跟人一样可以煮饭、搬重物,就需要有人的角度和视野,结合物理世界的场景做训练。这其中就需要大模型能力的加持。
这几乎成为一种共识,一名芯片行业从业者对21世纪经济报道记者举例分析道,扫地机器人在发展早期,往往难以辨别“这是一摊水”“这是一层台阶”等问题,令早期其应用备受争议,但大模型的出现,将加速各类型服务机器人的识别和执行效果。当然对从业者来说,将软件算法硬件化,可能正成为其中一个重要能力,而大模型本身的迭代进化,也为当前推进落地带来一定挑战。
智能化累积
根据2022年国家机器人检测与评定中心等单位联合发布的《机器人智能等级划分标准》,以解放人体、自主完成任务为目标,综合考量机器人的感知、认知、决策和执行能力,将机器人的智能程度划分为L1(基础型)、L2(半交互型)、L3(交互型)、L4(自主型)、L5(自适应型)多个等级。
东方证券分析认为,现阶段看,由大模型作为核心“大脑”的Figure 01、Tesla Optimus等通用人形机器人基本已经能实现较为自然的人机交互,无需任何控制装置,仅用自然语言发出指令即可实现指令下达,整体基本达到L3级水平,但距离真正类人的交互还有一段距离。
大模型在其中或许将起到加速作用。珠海一微半导体机器人事业部总经理杨武表示,机器人市场前景广阔,这是来自于人赖以需要各类型服务,尤其是老龄人群需要机器人帮助提供服务。但其技术密集度高,是电路、水路、气路等多个维度的技术融合。
“好消息是,中国在这方面技术不落后甚至是先进的。日本当初做出跳舞机器人时候大众很震惊,但到了今天,无人机等各类型机器人已经可以集成化发展,所以中国在这方面是领先的,那么对后续的产业发展和全球带动作用都将比较明显。”根据他分析,按照以往技术迭代经验,终端类产品一年有10%~20%增速就是稳步发展,但当前,技术进步将令人形机器人迭代呈现指数级别发展。
前述从业者也对21世纪经济报道记者分析道,预计未来,随着智能化和互联等能力提升,智能生活将呈现家庭中控作为中心,多类型终端围绕不同家庭人群和场景运作的生态。例如家中有专门机器人辅助老人生活、陪伴孩子学习等。
“当然这中间还面临几个难题。”该名人士续称,首先是机器人的智能化程度提高,有赖于当前大模型能力辅助,“机器人在有大模型能力后,就更容易理解现实世界中‘看’到的到底是什么,然后做出相应反馈,这将前进一大步。”
另外则是能源和伦理问题仍有待解决。例如具备高算力的机器人,将可能有很高能耗,如何避免“充电需要几小时,但只能用几十分钟”的难题,需要持续解决;此外是机器人毕竟是复杂设备,深入人类生活涉及诸多隐私和个人问题,如何前置管理也是核心命题。
“当然这只是眼前,再过五年,或许就有很大改善了。”该人士如此表示。
东方证券认为,AI大模型的出现为人形通用机器人的发展带来了新的曙光,具身智能也是AI发展的终极目标。人形机器人是软硬件能力高集成的实体,商业化的核心突破点在于“AI大脑”。大模型具备强大的泛化能力,让通用这一目标的实现成为了可能。
此外,政策边界已逐步形成。2024年3月,欧盟通过了全球首个关于人工智能的综合法律框架《人工智能法案》,旨在确保人工智能系统尊重基本权利、安全和道德原则,并解决非常强大和有影响力的人工智能模型的风险,在欧洲及其他地区培育值得信赖的人工智能。
算法渗透
前述论坛上,多数业内人士认为,大模型驱动的机器人将在3年内面世。一部分人则认为可能将在未来3~5年内。
从应用场景看,三年内被认为能快速量产落地的服务机器人类型,包括娱乐机器人(用于游戏互动等)、儿童教育和陪伴机器人、老人看护陪伴机器人等。
(业内关于三年内量产的服务型机器人类型研判,图源:主办方提供)
当然考虑到持续性应用和迭代优化角度,如何让服务型机器人更好使用大模型,是当前必须思考的问题。
瑞芯微电子高级副总裁陈锋指出,随着大模型技术的迭代演进,参数规模在持续上涨。但应用到机器人本身,未必需要很多参数。因为大模型参数就意味着很高的算力要求,如果是针对特定应用场景,采用CNN算法某种程度上或许会比大模型更为高效。
成都启英泰伦科技有限公司创始人、CEO何云鹏也认为,看大模型对机器人行业带来的影响,首先要看如何定义:如果是做一款通用型机器人,那么就需要有极为丰富的世界知识,这是当前市面上机器人还没有做到的;但如果是面向特定场景,就无需极大量模型参数,甚至少则0.1B规模都有可能实现。
他分析道,AI大模型最新带来的突破,更多是模型参数累积后带来的震撼,这证明了生成式AI和Transformer架构的注意力机制能在实际场景中带来价值。
“实际上现在还不能说当前的模型结构就已经发展到头了。”何云鹏续称,未来可能模型发展还有新的可能。所以在相应发展机器人时,就需要将机器人的实际应用,结合大模型的特点,采用相应的AI算法,这才能真正推动机器人更好商用。
对于芯片厂商来说,将核心算法软件化,或许正成为其中一个切入点。
前述从业者对21世纪经济报道记者表示,目前如果要让大模型上车,其规模可达100T~1000T数量级,那么就对功耗、网络、成本提出极高要求。“我们希望把高算力的东西做成链接单元。不需要大量CPU运算,直接通过指令快速实现翻转和执行,类似GPU的运作模式,由此形成硬件的联动机制。据我观察,将核心算法软件化也是业内都在探讨的方向。”
至于其中门槛,他指出,一方面来自芯片设计水平,考虑到高端工艺芯片设计成本很高,那么如何通过更少的迭代来适应算法发展;另一方面需要很强的算法能力,才能满足芯片设计需求。
东方证券认为,软件决定人形机器人“高度”,算法需与硬件匹配。人形机器人本质是AI系统落地物理世界的最佳载体,更核心问题在于算法对运动能力的控制,包括本体平衡、行走的步态、手部抓取等规划与控制。这需要成熟的感知系统基础、强大的算法分解任务和规划动作、大模型不断仿真训练以及超强的算力支撑,同时要求算法与硬件相匹配。这要求机器人企业需自研算法,并持续更新迭代。
(作者:骆轶琪 编辑:骆一帆)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。