21世纪经济报道记者 张赛男 实习生郭丽君 上海报道
ChatGPT在全球市场的成功,引爆了大模型创业热潮,国内呈现出“百模大战”的竞争格局。在AI大模型竞赛的背后,算力需求的暴涨给相关云计算公司带来空前机遇。
作为科创板首家云计算企业,优刻得(688158.SH)深切地感受到算力需求正扑面而来,自身也正在成为AI大模型产业链上的深度参与者。
优刻得被外界熟知的是其云计算业务,实际上2017年优刻得就提出 “CBA”(Cloud,Big data,AI)三位一体的产品发展战略,在AI领域进行了多年开拓。借着AIGC的浪潮,一方面,优刻得在AI领域的前期布局正在显效;另一方面,公司更积极地投身到大模型的赛道中。
值此科创板四周年之际,优刻得上市也有三年之余,顶着“云计算第一股”、首家“同股不同权”公司的诸多光环,优刻得在本轮AI热潮中有了新的底气。近期,优刻得董事长兼CEO季昕华接受了21世纪经济报道记者的专访,就公司在AI领域的发展目标和策略、对算力未来的发展前景、“百模大战”的最终走向等做了深入解析。
(图为优刻得董事长兼CEO季昕华)
积极入局 定位“大模型算力底座”
《21世纪》:优刻得作为云计算厂商,如何参与到这轮AI浪潮中,有怎样的目标?
季昕华:目前大模型正处于风起云涌的阶段,需要大量的算力服务,这是我们的机会所在。客户的需求正从以前的CPU向GPU调整,巨大的GPU需求将同步带动算力、存储、网络等云计算相关产品的需求。目前AI算力方面最明显的挑战是显卡短缺,以及如何把大模型在实际场景中落地的问题。
优刻得的主要目标是服务更多客户,包括做大模型的公司和用大模型的公司,大模型在每个行业都有发挥空间,潜在客户量也会很多。
《21世纪》:目前公司能提供的算力服务有哪些?
季昕华:目前做大模型的公司一般有三个痛点:买不到设备;买到设备后数据中心的电力供应不足;以及组网出现困难。针对这些痛点,优刻得主要提供5项算力及服务支持。
第一是给已有设备的客户提供数据中心托管服务器服务;第二是为客户的显卡服务器提供机房租赁服务;第三是为组网出现问题的客户进行定制化网络服务;第四是帮助客户把大模型在公有云上进行推理,实现上线运营;最后一项服务是对接客户和数据流通服务。这几项服务中,算力和机房服务是最主要的。
《21世纪》:优刻得自己会做大模型吗?
季昕华:我们是国内唯一一家中立的云计算公司,更希望帮助客户训练和推广大模型应用。例如我们的合作伙伴达观数据推出了“曹植”大模型,需要我们更多的国产化算力服务。有些企业可能什么都想做,包括自己去做大模型;但优刻得就紧紧围绕提供“算力支持”这一定位发展。
《21世纪》:大模型公司在选算力支持时,优刻得为什么是一个好的选择?
季昕华:我们有几个特点:第一,优刻得是中立的,与大模型公司不存在竞争问题;第二,优刻得服务了很多大模型公司,了解大模型训练过程中的技术诉求;第三,比较了解大模型训练公司的痛点,比如购买显卡、部署繁琐等问题,我们可以提供海外模型在中国的镜像,帮助大模型公司快速推进训练和推理工作。也可以利用我们积累的客户资源,帮助大模型公司找到合适的应用侧客户。
大模型发展中的难点和痛点
《21世纪》:当前大模型的发展面临哪些问题?
季昕华:大模型的核心包括四个方面,算力、数据、算法和应用场景。这里存在几个问题:第一,在算力方面,中国处于被“卡脖子”的状态,压力很大,所以我们建议加大对国产GPU的支持,我们也在积极地对接和使用国产GPU。
第二,数据问题,中国的数据是比较不够的,特别是共享数据方面,我们呼吁政府鼓励更多的数据共享,让企业用到数据。
第三是算法,这依靠各家公司自己的努力,加强技术攻关,赶超世界先进公司。
第四是应用场景,这个非常关键。我们一直呼吁政府把工作场景开放出来,提供给国内大模型公司使用。场景用起来有三个好处,一是能形成反馈,从而对模型进行调整;二是能产生更多的经济价值,才能在大模型这样的重工业里投入更多;三是能够帮助各行各业提高效率,解决诸如信息不对称的问题等。
《21世纪》:目前国内的产业链能否满足算力需求?算力短缺会是长期问题吗?
季昕华:目前还不能满足算力需求的缺口,并且以后会越来越缺算力。随着参与大模型训练的企业越来越多,用来训练大模型的数据量越来越大,对推理的要求也越来越高,大模型的应用会越来越广。以上因素作用下,短期内很难能够满足市场的算力需求。
现在我们的客户训练和推理GPU数量的比例大概在3:7,即三万张卡做训练就要对应七万张卡做推理。未来对GPU的需求会越来越大,然而受限于供应链,GPU会全球缺货,此外受限于美国方面出台的政策,相关芯片被限制,我们也希望能找到更多国产GPU的持续供应。
《21世纪》:那推动数据共享的难点在哪?
季昕华:数据的壁垒是真实存在的问题。在ChatGPT中,英文数据占97%左右,中文的数据只有1%左右。在整个全球互联网中,汉语占比虽高,但和英语占比的差距仍然很大。此外,美国有很多公共的数据集,大模型可以训练未出版的文章,形成数据集,这在中国是欠缺的。同时由于中国在法律法规方面比较健全,很多企业不敢把数据拿出来给大模型训练,所以需要隐私计算模式的搭建。
而隐私计算目前在技术上还存在难度,一是因为数据训练需要这类数据进行交互,二是数据训练之后,哪些数据被可能会被使用方拿走没有办法完全控制,所以需要先对核心数据做脱敏工作才能拿去训练,这类工作难度比较大。
我们希望由中国政府主导建立公开的数据。同时希望能通过隐私计算把不同单位之间的数据,在不共享的条件下用来训练。
可控的泡沫是良性的
《21世纪》:在外界认知中,大模型的门槛应该挺高的,但目前国内不断涌现大模型,这似乎违背了这种认知?
季昕华:现在国内市场上有130家公司在做大模型,可以说明一些事实:就是这个行业的前景非常好。此外AI大模型可能会比移动互联网在更大程度上影响人类生活。
我认为大模型确实有蛮高的门槛,第一,不像其他的互联网创业,我们称大模型为互联网的重工业,至少有1000张卡才能做训练,对资金成本要求高;第二,有数据要求,做大模型必须有足够的数据,需要时间和经验的积累;第三个是对算法的要求比较高。
正因为大模型训练需要的门槛比较高,所以只出现了一百多家。如果大模型训练门槛放低,可能会有一千家加入竞争,出现“千模大战”。从历史发展来看,“百模大战”之前,有“百团大战”、“千播大战”。
那为什么现在看起来有很多的公司做大模型呢?因为现在有开源的大模型和很多公开的论文可供参考,所以起步上会简单很多。但要做好大模型的门槛还是高的,像现在的GPT4没有公开后续技术细节,国内很多大模型就很难继续发展。
《21世纪》:就您的观察而言,目前市场上的大模型在技术上有无明显差距?
季昕华:目前国内大模型有很多做得很好,年底能达到GPT3.5的水平,明年能达到GPT4.0水平,我们也拭目以待。目前来看,大模型的发展有几个核心问题:是否有足够的数据、算力、算法,能否实现线上的闭环。在技术实现上,目前国内大模型都没有开源,所以很难从技术手段上判断优劣,需要第三方机构的评测。
《21世纪》:国内的大模型下一步会往哪个方向发展?
季昕华: 我认为未来大模型会分为几种样态::有几种通用大模型,再加上多领域的垂直大模型,并且会包括多种模态。除目前主流的文本以外,还会存在视频、语音、图片等多种形态。所以5-8家多模态的大模型,几十家各种垂直领域的垂直模型,这是相对合理的状态。
国内可能会走出垂直化的趋势,垂直化不需要特别高的技术和算法,用已开源的大模型加上在垂直领域的应用就可以了。
《21世纪》:一个赛道异常火热的情况下难免会有泡沫,怎么看待大模型赛道中的“泡沫”?
季昕华:我喝咖啡特别喜欢喝卡布奇诺,因为它大部分是咖啡,上面有一点点的泡沫,这种味道是比较好的,整个行业发展也是一样,如果没有一点泡沫,资本进不来,那对行业是不好的。有可控的泡沫相对来说是良性的。
资金、人力向AI业务倾斜
《21世纪》: AI在优刻得业务布局中是“三足鼎立”的一足,目前AI这么火热,会考虑在AI业务上投入更多资金和人力吗?
季昕华:会的。我们认为整个AI和大模型正处于快速发展的阶段,所以非常重视。优刻得在内部做了几项改变:第一,要求所有部门的员工都根据岗位和工作内容来使用大模型。第二,在机房建设和服务器采购这类硬件上加大投入,目前我们的数据中心就是按照大模型服务器的电力需求来建设的,因为以前一个机柜可以装十几台服务器,现在的模式下一个机柜只能装下一台A800。第三,在软件的应用方面做了内部转型,通过学习和训练大模型,了解大模型,为大模型提供服务。
《21世纪》:现在云计算领域的竞争也相当激烈,友商也在推出降价策略,优刻得如何能在竞争中保持优势地位?
季昕华:在竞争中,一些公司的降价更多是市场宣传策略,其实是只把一两款非主流产品的价格降下来,但核心服务的价格基本不会改变。我们的价格也不会有大的变化,偶尔也会通过降价一两件产品来做市场营销。从长期来看,为客户提供更好的服务、更低的成本是我们的追求。
对优刻得而言,满足客户需求,提供差异化的产品是核心问题。我们一直强调产品的研发。研发分为三种,一种是技术领先型研发,例如OpenAI;第二种是竞争对手跟随型;第三种是用户需求驱动型,针对用户的需求点来开发产品。(第三种)是我们一直在做的。例如最近很多客户想测试开源大模型,那么优刻得就做国内镜像开源大模型的第一家。用户可能每天都会出现新需求,我们会不断收集这种需求,然后针对需求研发出产品。
《21世纪》:优刻得有很多关于科创板的光环,作为掌舵人,您觉得公司上市之后有一些怎样的变化?有什么建议?
季昕华:在科创板上市的好处第一是提高了公司的知名度,有利于市场开拓,第二增加了融资渠道,第三是能够提高企业的规范性,在管理方面会更有帮助。
一个建议是,公司上市之后,市场对短期的收入和利润财务指标会更关注,但对于公司长期运营来说,需要综合考虑短期和长期效益的平衡问题。
(作者:张赛男,实习生郭丽君 编辑:朱益民)
南方财经全媒体集团及其客户端所刊载内容的知识产权均属其旗下媒体。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。