21对话|商汤绝影CEO王晓刚:端到端的决战,战场在云端
21世纪经济报道记者 郑植文 上海报道
11月27日,商汤科技旗下的智能汽车平台商汤绝影举办2024“绝影实力AI DAY”,当日商汤绝影全面展示了「驾-舱-云」三位一体的通用人工智能(AGI)产品体系与战略布局,还宣布牵手奇瑞大卓智能、东风汽车展开全方位深度战略合作。
自从特斯拉在北美推送FSD V12版本后,点燃了大多数中国车企和智驾供应商对端到端大模型的热情。在AI DAY上,商汤绝影也展示了基于J6E、J6M、Orin等不同算力平台打造的全场景高阶智驾、端到端智驾等绝影量产智驾产品体系。据悉,基于J6平台的智驾方案预计2025年第二季度将量产交付,而量产端到端智驾方案则预计会在明年年底量产落地。
端到端智驾技术为行业带来了范式革新,逐渐取代模块化的规则,成为智驾技术的进化方向。但随之而来的是对高质量数据的需求呈指数级的增长,而高质量数据的关键在于真实。受限于高阶智驾的量产规模、算力资源,目前大多数车企和智驾公司都面临相同的问题,即高质量驾驶数据的获取难度大、效率低、成本高。
“智驾高端局的竞争不只是车端模型的比拼,端到端的决战,战场在云端。”商汤绝影CEO、商汤科技联合创始人、首席科学家王晓刚表示,随着端到端时代的到来,数据成为最核心的竞争力,“谁离数据最近,谁的数据基础设施最强,谁能把这些数据基础设施铺到主机厂,谁在未来发展和竞争当中就有主动权。”
为此,商汤绝影发布「开悟」世界模型,能够理解真实世界的物理规则、交通规则,生成的视频数据也更加逼真。通过多模态大模型,「开悟」世界模型可以支持多样化的自动驾驶场景及Corner case(极端情况)的可控生成。目前商汤绝影基于1024类场景,能够泛化出更多的平行世界,打造了千万级的生成场景库,预计2025年对行业开放。
世界模型最基础也是最核心的能力是生成高质量视频数据,因此也成为车企占领智驾高地的新风向。今年7月,蔚来在科技日活动上也宣布蔚来世界模型(NWM)正式发布,它能够在100毫秒内推演出216种可能发生的场景,并寻找到最优决策。
但在王晓刚看来,选择全栈自研路线的主机厂可能难以承受基础设施的持续投入,“像大模型,商汤在这方面累计投入超过100个亿,后面还会持续在这方面投入。所以说大家要找到自己的定位,形成比较有效的合作,而不是恶性竞争和取代的关系,这样的话才能够达到共赢共生,长久持续的发展。”
然而All in大模型的商汤科技也面临着巨额亏损,2018年至2023年,商汤科技的净亏损分别为34.28亿元、49.63亿元、121.6亿元、171.4亿元、60.45亿元和64.4亿元,而以智驾为重点业务的商汤绝影仍然是需要长期烧钱的板块,2024年上半年,绝影智能汽车业务收入为1.68亿元,同比增长100.4%,但目前商汤绝影量产上车的情况要稍显落后于其他头部Tier 1。
对于盈利预期和合作规划,王晓刚表示,未来自动驾驶实现盈亏平衡还需要有三年左右的时间,这取决于自动驾驶的量,要有足够多的量,百万级的量去支撑业务的发展。“另外,比较重要的是合作的模式,能够以更高性价比的方式去完成交付,实际上还包括新技术和新产品的开发。”
当日,王晓刚就大模型对智驾技术的变革、行业竞争与生态等问题接受了21世纪经济报道在内的媒体采访,以下是采访实录(经摘编):
数据决定主动权
Q:去年智驾圈子里面传出头部四家“地大华魔”这样的说法,这个格局形成背后的深层次原因是什么?商汤绝影在智驾供应商行业里给自己的定位是什么?
王晓刚:过去自动驾驶交付模式还是标准化的交付模式,“地大华魔”有各自的优势和特点,只能说今天当端到端到来的时候,最大的价值就是在于数据。
以前大家关注的是,谁的算法比较先进或者有没有芯片,能不能进行垂直的整合,这四家可能多多少少都有类似的特点。但是接下来端到端最核心的点,不一定是软硬一体或者进行垂直整合,而是数据,谁离数据最近,谁的数据基础设施最强,谁能把这些数据基础设施铺到主机厂,谁在未来发展和竞争当中就有主动权。今天毕竟还是技术驱动的行业,当技术发生变革的时候,这里面生产力核心要素就会发生变化,这也意味着给市场上竞争的态势带来新的变化。
Q:关于端到端,数据非常重要,但是对于原始数据的积累,因为不可能一开始就有很多优质的数据,现在大家又在进行数据的交易,你如何看待数据交易的趋势?
王晓刚:更准确来说,数据并不是最关键的,而是数据的基础设施和数据管线是最重要的,因为有效的数据是随着算法的变化而变化的,永远不可能去存储最原始的数据,因为无论是通讯,还是存储成本都太高了。那么算法和模型变的时候,提取数据的方式就会发生变化。只要有这样一套有效的数据生产的管线随时随地都可以有新的数据高效地引进来。
Q:国内除了自动驾驶供应商,还有主机厂比如蔚小理、小米这些新势力也在投入智驾,绝影如何能够实现突破?
王晓刚:这里面比较重要的是要有一个可持续发展的逻辑,今天虽然竞争很激烈,实际上智能化、自动驾驶的投入还是巨大的;同时看到一个问题,大家很多是重复性的投入,这就在于基础的设施数据,大家没有进行对齐,今天之所以会出现成本高的问题,在于机制上大家合作的模式。
有些新势力全栈自研,像大模型,商汤在这方面累计投入超过100个亿,后面还会持续在这方面投入,任何一家公司如果在基础设施方面持续投入的话也是难以承受的。这就是为什么说大家要找到自己的定位,形成比较有效的合作,而不是恶性竞争和取代的关系,这样才能够达到共赢共生,长久持续的发展。
Q:现在比较坚定地选择纯视觉方案的,除了Tesla,就是极越跟小鹏,在封闭路段上纯视觉确实是没有问题的,但是在城区明显还是比有激光雷达的差了不少,在你看来,纯视觉和带激光雷达的方案今后会是怎样的发展态势?
王晓刚:关于纯视觉和激光雷达,这是由现阶段所积累的数据体量所决定的,视觉我觉得还是有更高的天花板,但这里面需要有更多的数据,这也是为什么我们要把基础设施建立好,这样才能够有比较长久的发展。
盈亏平衡还需要三年左右
Q:绝影作为新型Tier-1是如何与客户研发部门协同的?双方各自的技术边界是什么?具体到本次绝影和大卓的合作,两者是如何分工的?
王晓刚:传统的是模块化分工,Tier-1负责集成,作为整体黑盒标准化的交付,但是未来在端到端自动驾驶到来的时候,更多是要依赖数据的驱动,数据就在主机厂手里,所以谁能够更接近数据,谁就能够在未来发展过程当中占据主动。
以前模块化的分工,将来就不太存在了,因为端到端一个模型把原来的模块统一在一起,它的协作和分工模式就会发生比较重要的变化。比如我们跟主机厂和自研团队的协同,重要的是我们能够提供基础算力和数据平台化能力,包括工具链,我们要能够去对齐数据生产的标准和算法的架构,如果这些东西对不齐的话,在不同车型上采集的数据是没有办法进行兼容的。
这些东西做好之后,相当于我们给数据石油搭了一个非常坚实的、高质量的数据生产管线,有价值高质量的数据就会从这个“油田”里面源源不断地输出出来,最后为它的产品形成提供很强的动力。
在产品层面,大家采取的模式就是比较灵活的模式,像类似奇瑞这样的主机厂,量产车的数量非常多,每年车型也非常多,整个交付的任务是非常繁重的。这种情况下,如果我们跟主机厂自研团队在数据、工具链、算法架构上对齐以后,当涉及具体交付车型的时候,大家就会比较灵活,有的时候你可以多做一点,有的时候我来多做一点。
今天我们可以看到智能驾驶整体上离盈利还有一定的距离,也就是说,在交付过程当中,如果大家各方面资源和数据工具链没有对齐,往往会造成重复的投入,谁将来能够提升效率,有高性价比的交付,谁就能够走得更远,所以我们跟大卓的合作就是基于这样的认知,也是按这种方式进行推进的。
Q:刚才提到智能驾驶距离盈利还有一段距离,从你的判断,这个距离大概会有多长?绝影在海外市场方面怎么考虑?
王晓刚:未来自动驾驶实现盈亏平衡还需要有三年左右的时间,这里面取决于自动驾驶的量,要有足够多的量,百万级的量去支撑业务的发展。另外,比较重要的是合作的模式,能够以更高性价比的方式去完成交付,实际上还包括新技术和新产品的开发。
另外,海外方面比较重要的是随着中国车企出海,当然我觉得座舱可能会走得更快一些,驾驶里面可能还要涉及不同区域适配的工作,这是一个大趋势,国内能够培养出产品的竞争力,将来能够取得盈利,还是希望全球市场上有更多的空间,而且利润空间可能还会更高一些。
Q:国内的车企,特别是新势力智驾第一梯队,他们出于竞争的需求,很多在采取高阶智驾免费的策略或者以变相的形式向用户赠送几年使用权来推广他们的智驾,你对目前这种商业模式可持续性怎么看?你希望的商业模式是怎样的?在目前情况之下车企和智驾供应商之间利益分配,你有什么思考吗?
王晓刚:整体来说,今天汽车的发展很多事情看着还不够合理,很多事情也是不可持续的。我们当然希望市场能够回到正轨,所以不光是智驾本身的问题,是整个行业的问题。
另外比较重要的是要避免同质化的竞争,还是要做出既有用户价值,还有特色的功能产品。从产品设计、技术发展路线上来说,找到自己独特的路线和价值,这个才能实现可持续的发展。
在智驾里面,除了端到端自动驾驶,还需要做到舱驾融合,有些新的体验,另外,我们还跟车企有深入的合作,共创一些产品体验上的差异化,从而节省这些成本和投入。如果每个车企大家都是采用不同的配置标准,回传数据也都不一致的话,最终实际上是没有办法让它实现可持续发展的。
Q:从财报来看汽车业务是近两年增长比较快的业务,那么从细分的构成上看,目前智舱和智驾营收或者出货量占比上大概是什么样的结构?后续资源如何配比?之前商汤在智驾战略和组织架构方面有些调整,具体是怎么样的情况?
王晓刚:从收入上看两边是差不多的,如果从出货量上来看,肯定座舱是高于智驾的。如果从研发投入上来说,现在更多研发投入是在智驾上,因为这里面本身的技术栈比较深,而且有比较多的资源投入,从长期来说智驾会更多一些。
目前我们的组织架构更加的聚焦,之前项目相对分散一些,今天比较明确的像J6E和J6M的平台,还有端到端自动驾驶,客户也会更加聚焦,所以做了这方面的调整,主要是因为我们的产品和客户需求更加清晰了,更加聚焦在量产方面。
(作者:郑植文 编辑:张明艳)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。