英伟达发布Nemotron系列大语言模型欲推动代理式AI加速崛起

白杨 2025-01-07 12:53

黄仁勋认为，人工智能正在进入代理式人工智能（agentic AI）的新时代。

21世纪经济报道记者白杨北京报道

在今日召开的CES 2025大会上，英伟达创始人兼CEO黄仁勋发布了全新的 Llama Nemotron系列大语言模型。

黄仁勋表示，人工智能正在进入一个新时代——代理式人工智能（agentic AI），专业的AI代理可以帮助人们解决复杂问题并自动执行重复性任务。

他进一步表示，借助定制的 AI 代理，各行各业的企业都可以实现前所未有的生产力。然而，这些先进的 AI 代理需要一套针对代理 AI 功能和能力进行优化的多个生成式 AI 模型系统。这种复杂性意味着对强大、高效的企业级模型的需求从未如此强烈。

英伟达此次推出的Llama Nemotron模型，有Nano、Super和Ultra三个不同版本。其中，Nano是最具成本效益、低延迟的模型，适合在PC和边缘设备上部署。

Super是一种高精度模型，在平衡计算效率的同时具有更高的准确性；而Ultra是最高精度模型，专为要求最高性能的数据中心规模应用而设计。

黄仁勋称，这些模型基于Llama 构建，可帮助开发人员在一系列应用程序中创建和部署AI代理，包括客户支持、欺诈检测以及产品供应链和库存管理优化。

在性能上，Llama Nemotron模型经过精简和训练，采用了英伟达的最新技术和高质量数据集。它们在指令跟踪、聊天、函数调用、编码和数学方面表现出色，同时进行了大小优化，可在英伟达广泛的加速计算资源上运行。

据黄仁勋介绍，Llama Nemotron模型系列将以可下载模型和NVIDIA NIM微服务的形式提供，可轻松部署在云端、数据中心、PC 和工作站上。

企业还可以使用 NVIDIA NeMo 微服务针对其特定用例和领域定制模型，以简化数据管理、加速模型定制和评估。同时，借助NVIDIA NeMo Retriever，开发人员可以集成检索增强生成功能，将模型连接到他们的企业数据。

（作者：白杨编辑：骆一帆）

南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权，任何人不得以任何方式使用。详情或获取授权信息请点击此处。

加载全文

关联专题

白杨
向TA提问

关注科技互联网领域报道。