逐浪AIGC丨AI热潮下的算力供给挑战:“提效降碳”仍是行业归宿

外滩科技眺望张梓桐 2023-09-08 18:55

人类社会短期可能很容易高估一个技术带来的变化,但是长期有可能会低估它带来的变化。

21世纪经济报道记者 张梓桐 上海报道

“百模大战”的火热正在使得当前的算力供给面临着越来越大的能耗挑战。

一方面,算力供给带来巨大的电力消耗。根据国际能源机构(IEA)的数据显示 ,2022年全球数据中心用电量为2400~3400亿千瓦时,约占全球最终电力需求的1%~1.3%。根据信通院统计,我国2022年数据中心能耗总量1300亿千瓦时,同比增长16%,预计到2030年,能耗总量将达到约3800亿千瓦时。

而另一方面,企业IT基础设施投入持续上升,面临降本增效压力。

在算力需求井喷以及国家“双碳”政策规划的双重压力下,承载着底层基础设施功能的数据中心将如何进一步节能减排成为市场与行业关心的核心议题。

“如今数据中心节能降碳正在面临着制冷系统能耗较高、IT设备利用率低、海量的算力需求以及硬件设备的全生命周期管理四重挑战。”浪潮信息服务器产品线总经理赵帅在第二届外滩大会上接受21世纪经济报道记者采访时表示,面向AIGC产业热潮下的新型数据中心基础设施建设需求,数据中心建设和部署模式一方面要持续提高模块化、集成化程度。另一方面则要进一步提升服务器的计算效率。

而小冰CEO李笛则在接受21世纪经济报道记者采访时指出,当前行业存在着一定的算力焦虑,但算力是否真的短缺还要取决于公司的商业模式效果,“如果你能够通过交付生成式AI满足了需求,成功消耗了算力,那么算力就实现了高附加值。”

算力能耗挑战

记者在2023年外滩大会现场了解到,2022年全国数据中心总耗电量已经达到约2700亿千瓦时,占全社会用电量的3.1%,超过2座三峡水电站年发电量,数据中心绿色化转型成为亟待解决的难题。

目前业内普遍认为,从能耗构成看,数据中心总能耗包括IT设备能耗和制冷、配电等系统的能耗,其中,制冷系统用电量已与IT设备相当,占总用电量高达43%。因此,优化制冷系统成为数据中心提高能源效率的重要环节。

而随着芯片功耗与服务器功耗持续上升,全球数据中心单机柜功率也快速增长。“我们预计到2025年平均功率将达到25kW。高功耗芯片,高密度服务器及单机柜密度的演进,导致传统风冷制冷模式在换热性能及能耗优化方面逐步受限。”赵帅在接受记者采访时说道。

其次,赵帅指出,当前算力行业内供给的核心是IT设备,但就其容量而言,IT设备的利用率通常十分低。

例如,服务器的利用率往往只有5%到15%,处理器为10%到20%,存储设备为20%到40%,网络设备的利用率为60%到80%。然而,当设备闲置时,其仍会消耗在最大利用率下消耗的大部分功率,一台标准服务器即使不工作也要消耗30%到40%的最大功率。

“如何最大程度减少IT设备空闲,让闲置的算力跑起来至关重要。同时,在提供每单位算力的同时减少能源消耗,提升能源转换效率也是实现数据中心绿色低碳发展的关键。”赵帅说道。

此外,步入AIGC时代,算力需求愈发呈指数级增长,AIGC的大模型训练、实时交互等均需要海量算力的支撑。赵帅表示,大模型的参数量超过千亿,甚至突破万亿级别,预计智算中心将迎来更快发展。而高算力往往也伴随着高能耗,新型数据中心基础设施建设需要面向AI大算力需求,在提供高算力的同时,实现节能降耗。

绿色数据中心建设路径

有业内人士在现场对记者指出,当前大模型带来的算力井喷需求预计在2025年之前都不会看到衰退。而这背后的核心驱动因素还是人工智能大模型技术变革式的发展。

“我们并不认为模型本身是一个应用,我们认为大模型是一个基础设施。所以,我们现阶段为了达到基础设施的自主可控,就需要从大模型数据的收集、训练、以及最后调优等环节上面全面入手来解决问题。”蚂蚁集团副总裁徐鹏在接受21世纪经济报道记者采访时指出,人类社会短期可能很容易高估一个技术带来的变化,但是长期有可能会低估它带来的变化。因此,就大模型技术本身来看,行业仍然需要持续而坚定的投入。

而在赵帅看来,在算力攻击勉励较大挑战的背景下,绿色数据中心建设就需要着眼“规划设计、绿色产品选择、实施部署、智能运维。”四大方面。

在规划设计层面,赵帅表示,首先机房在选址上应该尽可能地选择在能充分利用风、水、空气等自然冷源,使用太阳能、风能等可再生能源并且拥有地理优势的地区。

在绿色产品选择和新技术的采用上,他表示,可以考虑部件级节能、整机级节能再到数据中心级节能产品的引入。“举个例子来看,不同产品的导入能带来更大的效益,采用高效的冷却系统,引入液冷系统增加10%的初始投入,而它带来的电能节省使其1.5年即可回收成本。”赵帅说道。

而在面对客户不同数据中心的差异的时候,行业在选取新建数据中心和老旧机房改造方案时又该怎样抉择?

对此,赵帅表示,可以提前进行场景规划设计,合理布局,以及尽可能使得资源循环利用,比如将数据中心产生的热量搜集用于区域级供热等;同时实施部署阶段,优化设备配置,根据客户业务需求采用阶段性配置,分期扩容,避免过度。

此外,智能化也是数据中心发展的重要趋势,通过管理系统对数据中心的能耗进行智能化的监控和管理,优化设备整体性能,将进一步提升数据中心的绿色化水平。

赵帅指出,智能运维方面,使用智能监控系统可以实时监测设备的运行状态和能源消耗情况,及时发现和解决问题,减少能源浪费。使用智能调度和优化策略,如基于需求的电力分配、智能散热管理等,可以更高效地管理能源,降低能源消耗。建立能源管理平台,统一管理数据中心的能源利用情况,进行集中监控、分析和优化,提高整体能源利用效率。

(作者:张梓桐 编辑:陶力)

张梓桐

21上海中心记者

关注大科技,欢迎交流。联系方式:18902071207