“百模大战”白热化:大模型落地成焦点,算力协同是关键

合规科技郑雪 2023-07-20 21:25

21世纪经济报道记者 郑雪 北京报道

以ChatGPT为代表的生成式人工智能再次点燃了人工智能发展的热潮。作为大力出奇迹的典型代表,依靠海量数据、算力再结合算法,生成式大模型能力涌现,能够对人类提出的各种问题做出回应。

“百模大战”如火如荼,数据、算力问题如何解决?大模型又该如何与行业结合,提速商业化进程?上述问题的出现则更考验入局者的智慧。

近日,以“促进数实融合 赋能千行百业”为主题的2023(第二十二届)中国互联网大会在京开幕。针对大模型行业落地、算力等方面的实践之问,与会专家、学者提出相关建议措施。针对大模型行业落地,需要重点关注数据和场景积累,而作为大模型燃料的“算力”,则需要加强多元算力协同,加快产业合作体系。

场景、数据助力大模型落地

如何理解大模型?北京智源人工智能研究院院长、北京大学计算机学院教授黄铁军提出了三个关键词:大、通用、涌现。“大,一个模型的网络参数应该达到百亿规模;通用性,不同于之前的专用模型或者专门解决一个问题的模型,今天的人工智能模型可以通过学习训练完成不同的事情;涌现性,模型训练到一定程度之后出现意料之外的能力,虽然其出现机制并不明晰。”

在黄铁军看来,大模型并不是通用人工智能Artificial General Intelligence,而是从通用性人工智能到真正的超人工智能之间的一个过渡阶段,可以称作准AGI或者Near AGI。

虽然尚未正式进入AGI阶段,但是当前大模型已经展现出了足够魅力:或将成为连接万物的新型基础设施,类似于高速公路,赋能千行百业,给予未来足够的想象力。

落地成为大模型真正赋能千行百业的关键一步。那么,大模型应该如何与行业结合?行业大模型发展又该注意哪些问题?

在华为云大数据与AI总经理李伟看来,当前To B的应用大模型还是偏少,海量业务场景迫切需要更多专业的大模型和AI应用解决。

在他看来,通用大模型落地行业时存在三个挑战:一是大模型通用性强,但专业能力较弱,落地行业需要具备专业知识;二是大模型知识虽多,但技能不足,需要结合专家和行业数字环境的反馈进行强化学习;三是对话的专业工具较多,除了人机对话,行业应用中需要更多解决机器与机器、机器与工具的对话。通过上述功能的实现,可以将大模型与业务系统融合,让大模型能调用大量的行业资产和工具。

针对大模型的行业难点,阿里达摩院资深技术专家王巍巍表示,一是关注数据和模型大小:从长期的发展来看,应该把数据做大,把数据质量做高,把模型做小,才可能会有助于规模化的落地;二是使用模型上,应该以成本最小的方式使用。

积累应用场景和数据,有助于下一步真正启用大模型。当所有国内大模型的效果达到类似于现在ChatGPT-4,并开始规模化使用的时候,(如果)我们有一个非常好的数据积累,就可以打出时间差。但如果到时再去积累数据,时间差壁垒则很难形成。”王巍巍说道。

强化算力协同

算力,即对数据的处理能力。如同农业时代的水利、工业时代的电力,算力已成为数字经济发展的核心生产力,也是国民经济发展的重要基础设施。随着百模大战越演愈烈,作为大模型发展的燃料,算力的需求也不断推高。

相关政策也在不断发力。2020年3月,中央层面提出要加快5G网络数据中心等新型基础设施建设的进度,以算力为核心组成的数字信息基础设施建设被提升到了新的高度。算力产业发展进一步加速。新型数据中心发展三年行动计划、“东数西算”等陆续出台,加速算力基础设施建设步伐。

中国互联网大会上发布的《2023中国互联网发展报告》显示,我国算力总量已位居世界第二,云计算市场总量稳定增长。2022年,我国在用数据中心机架总规模超过650万标准机架,算力总规模达180EFLOPS,位居全球第二。云计算市场规模达4550亿元,较2021年增长40.9%。

工信部通信科技委委员周建明表示,随着数字经济的发展和数字化转型的深入,通信、感知、AI大模型及算力会成为新型基础设施的核心,要以控制论、信息论和系统论的模式来思考技术创新的解决方案。他提出打造“三位一体”战略和建立新型“三位一体”的创新体系,需要集中关注核心技术突破、知识产权保护、产业生态标准化

可以看到,人工智能大模型等应用需求对算力基础设施建设提出更高要求。Open Al发布相关数据显示,训练1750亿参数的完整GPT-3模型需要消耗算力3640 PF-days。

中国信通院云大所数据中心部副主任王少鹏提示,在单芯片失效的情况下,如何通过集群、一体化、规模化的协同提高算力解决瓶颈问题,是包括大模型训练在内所需要面对的现实问题。在他看来,可以通过DPU(数据处理芯片,Data Process Unit)这一新型技术来解决。

大模型应该如何布局算力?中国电信研究院云计算研究中心总监赵继壮表示,考虑到大模型的巨大耗电量及大规模液冷的成本压力,大模型基础设施可以考虑在数据中心布局。“基础大模型算力池可以在西部集中建设,但是考虑到行业大模型需要就近进行部署,东西部之间需要建设一条超大带宽的高速公路。”

算力应如何应对来自人工智能等的新算力需求?又该如何高质量发展?算力协同或成破局的关键。

中国互联网协会常务副秘书长陈家春表示,要深化算力产业协同开放合作,加快建立完善产业合作体系,从基础设施层面做起,向IT层和应用层不断拓展。

工业和信息化部信息通信发展司政策标准处处长陆洋则表示,要夯实算力基础设施,加强多元算力协同。进一步优化算力布局,加强区域互补、协同联动发展。调优算力结构,合理提升智能算力比例,积极构建云、边、端协同,算、存、运融合的算力基础设施体系。

(作者:郑雪 编辑:张铭心,包芳鸣)