21深度丨“AI钢铁侠”黄仁勋,又进化了英伟达

21世纪经济报道 21财经APP 倪雨晴 深圳报道
2024-03-19 20:38

21世纪经济报道记者倪雨晴 深圳报道  2024年,英伟达一年一度的GTC大会已然成为AI界春晚,现场座无虚席,全球AI爱好者翘首以待黄仁勋的独家SOLO。

北京时间3月19日凌晨,GTC终于拉开大幕。英伟达创始人兼CEO黄仁勋一如既往一身黑色皮衣登场,率先发布了全新架构平台Blackwell和相关的GPU新品,包括B100、B200、GB200超级芯片。

同时,英伟达还升级了自动驾驶芯片平台Thor,使用了Blackwell架构并支持生成式AI;在大热的机器人方面,英伟达发布人形机器人通用基础模型Project GR00T、新型人形机器人计算机Jetson Thor,并对NVIDIA Isaac机器人平台进行升级。

软件层面,英伟达推出了NIM微服务、Omniverse Cloud API。不止于此,英伟达也在深入半导体产业链上游,台积电和新思将在生产中使用英伟达计算光刻平台NVIDIA cuLitho,从而加快先进半导体芯片的制造速度。从硬件到软件,英伟达继续全方位碾压并与同行拉开代际差距。

Forrester副总裁兼首席分析师戴鲲向21世纪今经济报道记者表示:“英伟达的软硬件一体化生态发展相当迅猛,同时英伟达也在继续开放生态边界。”

在GTC大会两小时的演讲中,黄仁勋再一次回顾了AI发展历程和计算进化史,多年前他亲手把第一台AI超级计算机DGX交到OpenAI手中时,命运的齿轮就开始转动。如今,在黄仁勋看来,加速计算已经来到了临界点,通用计算后劲不足,需要新的计算方式。而生成式AI是这个时代的决定性技术,Blackwell GPU是推动这场新工业革命的引擎。

在业绩拉动方面,Counterpoint Research 副研究总监Brady Wang向记者预测道,英伟达2024年数据中心收入将超过720亿美元,同比增长134%。

截至3月19日,英伟达股价为885美元/股,市值约2.2万亿美元。

Blackwell架构和AI超级芯片

先看英伟达最新一代的GPU芯片架构Blackwell,这一命名致敬了数学家David Harold Blackwell。Blackwell接棒两年前推出的Hopper架构,这两年间,Hopper助力了英伟达业务和股价飙升。

而随着多模态大模型的演进,英伟达认为需要更多、更大的GPU。于是在现场,黄仁勋从口袋中掏出了基于Blackwell架构的芯片,黄仁勋说:“Hopper很棒,但我们需要更大的GPU。”

在Blackwell架构家族中,黄仁勋着墨最多的是NVIDIA GB200 Grace Blackwell 超级芯片,由两个B200 Blackwell GPU 和一个Grace CPU连接而成,比Hopper芯片更大。

其中,B200 GPU包含2080亿个晶体管,可以支持高达10万亿个参数的AI模型。而B200则由两颗B100裸片通过片间互联技术整合而来,Blackwell整体采用台积电4纳米家族下的4NP定制工艺。

新系列的芯片预计将于今年晚些时候上市,AWS、戴尔、谷歌、Meta、微软、OpenAI和特斯拉计划使用 Blackwell GPU。

同时,英伟达还发布了GB200 NVL72液冷机架系统,其中包含36颗GB200 Grace Blackwell Superchips。与当前的H100 GPU相比,该系统的推理工作负载性能最多能提高30倍。

若从训练性能看,在具有1750亿个参数的 GPT-3 LLM 基准测试中,GB200的性能是H100的7倍,并且训练速度是H100的4倍。

可以看到,新一代芯片在推理侧有着突飞猛进的增长,训练端也实现了翻倍。英伟达一直是训练端的王者,但是在推理侧也面临激烈的竞争。

英伟达的另一个优势则在于成本和能效。黄仁勋介绍称,使用前一代Hopper架构产品,以90天的时间训练一个1.8万亿参数规模的大模型,需要动用8000颗GPU,并耗电15兆瓦;若使用Blackwell,则仅需要2000颗GPU,电力消耗亦降低至4兆瓦。

在AI芯片上,英伟达继续一骑绝尘,进一步巩固业界的主导地位。同时,英伟达的同行和客户也在发力自研AI芯片,英特尔、AMD虎视眈眈,大客户云厂商也在加大投入。

对于竞合关系,英伟达相关负责人向21世纪经济报道记者表示:“我们正与云厂商共同工程化,将他们的最佳技术堆栈与NVIDIA的AI技术整合在一起,提供一个为生成性AI专门构建的服务。”

自动驾驶芯片扩大朋友圈

自动驾驶一直是英伟达看重的AI方向之一。英伟达很早就推出了面向汽车智驾的AI计算平台NVIDIA DRIVE,并已经迭代了多系列的自动驾驶芯片,包括Thor、Orin等。

其中,DRIVE Thor是英伟达专为汽车行业的生成式AI应用而打造的车载计算平台,可提供座舱功能、高度自动化驾驶和无人驾驶功能。而英伟达的DRIVE系列芯片平台就要做汽车的最强大脑,目前,其在车规级高算力自动驾驶芯片拥有超过80%的市场份额。

在英伟达看来,NVIDIA DRIVE Thor将改变汽车行业的格局,进入生成式AI定义驾驶体验的时代。如今包括英伟达、英特尔在内的芯片厂商,正在争夺生成式AI芯片的新市场。

汽车厂商也必然不会错过新时代,比亚迪、广汽埃安旗下昊铂、小鹏、理想、极氪等都将在DRIVE Thor上构建下一代电动车。

除乘用车外,DRIVE Thor还将应用于卡车、自动驾驶出租车等细分领域。比如,文远知行正在与联想一同基于DRIVE Thor来创建多个商用L4级自动驾驶解决方案,该解决方案集成在联想首款自动驾驶域控制器AD1中。

文远知行相关负责人向21世纪经济报道记者表示,DRIVE Thor可实现最高2000TOPS算力,较DRIVE Orin提升了八倍之多。并且,文远知行预测革命性变化会出现在对自动驾驶模型的建模方式上。

“现阶段的自动驾驶还是一个以理解(analysis)为主的模型,通过解析传感器数据去理解周边的障碍物和场景,预测它们的行为和意图,然后规划自车(主视角在自己车上)未来的行为轨迹。我们预测一个新的范式是通过生成式的方式去建模,目前仍属于比较前沿的探索领域。”上述负责人说道。

人形机器人大模型GROOT、推理平台NIM来袭

今年人形机器人成为另一个聚光灯焦点,英伟达也在加大投资和研发力度,黄仁勋认为:“机器人的ChatGPT时刻可能很快就会到来。”

在今年GTC上,英伟达也在机器人和具身智能领域放大招。英伟达发布了人形机器人通用基础模型Project GROOT,以及基于 NVIDIA Thor 系统级芯片(SoC)的新型人形机器人计算机Jetson Thor。

大模型GR00T 驱动的机器人将能够理解自然语言,并通过观察人类行为来模仿动作。SoC可提供每秒800万亿次8位浮点运算 AI性能,以运行GR00T等多模态生成式AI模型。

在戴鲲看来,英伟达面向人形机器人推出大模型和相关Jetson Thor软硬件技术栈,会极大加速人形机器人生态体系的技术发展与业务创新。

和英伟达合作的机器人公司包括1X Technologies、Agility Robotics、Apptronik、波士顿动力公司、Figure AI、傅利叶智能、Sanctuary AI、宇树科技和小鹏鹏行等。在发布会上,这些机器人产品和黄仁勋同台,并且还有迪士尼的orange和green登台,和黄仁勋进行互动。

另一个值得关注的软件新产品是NIM微服务。戴鲲向21世纪经济报道记者分析道:“NIM是个推理平台,融合了底层的CUDA、对自身和第三方大模型的支持、对主流推理框架和云平台的集成,可以加速生成式人工智能模型推理全过程,对于包括内容生成、现代知识管理、情景式聊天机器人等各类生成式场景在内的工作负载的加速起到了关键作用,是NVIDIA企业级AI平台的最后一块拼图。”

用黄仁勋的话说,NIM微服务能够帮助开发者面向未来创造新的应用,不需要从零写代码。目前,访问NVIDIA NIM的价格为每小时每GPU 1美元。

此外,英伟达推出了NVIDIA Omniverse Cloud API,通过接口开发者可以将Omniverse的技术直接集成到数字孪生等软件应用程序中,英伟达正在将Omniverse引入Apple Vision Pro。

Brady Wang指出,NVIDIA Omniverse 和 Apple Vision Pro的合作,有望带来革命性的混合现实体验,在工业、生产力和娱乐等领域有具有巨大的潜力。

可以看到,英伟达构建起越来越强大的AI生态,正在引领生成式AI的新纪元。在上一次工业革命中,电是重要能源,百年后新一轮工业革命正在进行,黄仁勋认为,现在我们正在利用基础设施创造新型的电子(能源),现在的工厂是AI工厂,它们将生产具有高价值的AI产品。

在发布会上,黄仁勋还提到了英伟达的灵魂:计算机图形学、物理学、人工智能的交集。从GB200到人形机器人的GROOT,英伟达还在不断拓展边界,GROOT或许隐喻着“I’m ROOT”,似乎要成为全球人工智能的根。

(作者:倪雨晴 编辑:包芳鸣)

倪雨晴

科技记者

关注通信、半导体、智造等硬科技,欢迎找我分享故事,微信18825191742。