英伟达发布Nemotron系列大语言模型 欲推动代理式AI加速崛起

21Tech白杨 2025-01-07 12:53

黄仁勋认为,人工智能正在进入代理式人工智能(agentic AI)的新时代。

21世纪经济报道记者白杨 北京报道

在今日召开的CES 2025大会上,英伟达创始人兼CEO黄仁勋发布了全新的 Llama Nemotron系列大语言模型。

黄仁勋表示,人工智能正在进入一个新时代——代理式人工智能(agentic AI),专业的AI代理可以帮助人们解决复杂问题并自动执行重复性任务。

他进一步表示,借助定制的 AI 代理,各行各业的企业都可以实现前所未有的生产力。然而,这些先进的 AI 代理需要一套针对代理 AI 功能和能力进行优化的多个生成式 AI 模型系统。这种复杂性意味着对强大、高效的企业级模型的需求从未如此强烈。

英伟达此次推出的Llama Nemotron模型,有Nano、Super和Ultra三个不同版本。其中,Nano是最具成本效益、低延迟的模型,适合在PC和边缘设备上部署。

Super是一种高精度模型,在平衡计算效率的同时具有更高的准确性;而Ultra是最高精度模型,专为要求最高性能的数据中心规模应用而设计。

黄仁勋称,这些模型基于Llama 构建,可帮助开发人员在一系列应用程序中创建和部署AI代理,包括客户支持、欺诈检测以及产品供应链和库存管理优化。

在性能上,Llama Nemotron模型经过精简和训练,采用了英伟达的最新技术和高质量数据集。它们在指令跟踪、聊天、函数调用、编码和数学方面表现出色,同时进行了大小优化,可在英伟达广泛的加速计算资源上运行。

据黄仁勋介绍,Llama Nemotron模型系列将以可下载模型和NVIDIA NIM微服务的形式提供,可轻松部署在云端、数据中心、PC 和工作站上。

企业还可以使用 NVIDIA NeMo 微服务针对其特定用例和领域定制模型,以简化数据管理、加速模型定制和评估。同时,借助NVIDIA NeMo Retriever,开发人员可以集成检索增强生成功能,将模型连接到他们的企业数据。

(作者:白杨 编辑:骆一帆)

白杨
向TA提问

IT版记者

关注科技互联网领域报道。