直击WAIC|对话天数智芯董事长盖鲁江:如何为大模型提供国产芯片算力支持?

21Tech江月 2023-07-08 10:26

这家国产GPU设计商现在关心哪些问题?

南方财经全媒体记者江月 上海报道 7月7日,在上海举行的世界人工智能大会启幕,国产芯片也急需在大模型训练和推理中显身手。在大模型发展的核心三要素中,算力起到底座作用,国产芯片能否撑起国内大模型的发展需求?

国产CPU设计商天数智芯董事长兼CEO盖鲁江向南方财经全媒体记者表示,该公司的通用型GPU(GPGPU)已跑通接近500个大模型,其中覆盖多款主流模型。他还表示,大模型企业对算力需求与日俱增,模型参数也在持续升级,因此将在产品上针对性地对算法进行硬件级优化,以便满足国内大模型发展的算力需求。

在国内,不少互联网大厂、创业型公司等在自制人工智能大模型。获得算力,也就是买到或租用到合适的GPU,可谓这项工程的“第一步”。GPU市场的大部分份额目前为海外厂商所占据,而国产GPU设计商仍在寻求与其进行技术竞争,从而给大模型开发商提供更丰富的选择。

据盖鲁江介绍,天数智芯旗下通用型GPU“天垓100”,目前已经跑通了清华大学的GLM、Meta的LLamA、北京智源研究院的Aquila等大模型。此外,智源研究院的650亿参数大模型,也正在天垓100上进行训练,预计10月可以完成。盖鲁江还表示:“如果有一部分客户从国外的云平台迁回来,急需算力,我可以联合我的合作伙伴给他们搭建算力平台,来支持他们的开发。”

据该公司数据,截至2022年底,天数智芯累计订单接近6亿元,并在当年确认收入2.5亿元。这反映该公司量产的产品已经进入市场。

盖鲁江称,天数智芯重视国际主流软件生态,希望方便客户在API接口层面兼容国际主流终端,并降低迁移成本。“在500多人的研究团队中,软件人员的数量是硬件人员的2倍。”盖鲁江称,他指唯有做好软件优化,硬件性能才有可能呈几何倍数增长。

提及对未来的展望,盖鲁江表示一是要准备好应对国内大模型从“千卡集群”向“万卡集群”升级,二是将联手数据中心做好云平台建设。

盖鲁江指出,天数智芯目前已经和国内主流的服务器厂商完成了服务认证。这意味着天数智芯将以自身GPU搭载主流CPU,加载在第三方服务器上完成联合出货。谈及未来云平台中需要更多数量的GPU,盖鲁江也指出,chiplet和3D封装技术可以成为技术升级中的考虑选项。

面对国内客户或将迁移平台,盖鲁江希望能在此过程中与客户达成更好的互信。“GPU开发商需要客户开放更多底层数据,才能做好软、硬件优化。”他称。

(作者:江月 编辑:陶力)

江月

记者

简介:常驻上海,剑桥大学MBA、FRM、前投行发债人,关注国际金融与科技产业,欢迎联系:jiangyue@sfccn.com