逐浪AIGC⑱丨迈入混战时代:科技公司竞速AI大模型

21Tech杨清清,倪雨晴,李强 2023-04-11 21:26

目前AI大模型处于百花齐放的状态。

21世纪经济报道记者杨清清、倪雨晴、李强 北京、深圳报道

科技公司对AI大模型的追逐战正在愈演愈烈。

4月11日,在2023阿里云峰会上,阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇正式宣布,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面升级。在他看来,面向AI大模型时代,所有的应用、软件以及服务都值得“重做一遍”。

“通义千问”是阿里最新推出的超大规模语言模型,于4月7日开始邀请用户测试体验。根据21世纪经济报道记者此前体验,通义千问可以进行文案创作、多轮对话等功能。

事实上,近期入局AI大模型的科技公司不仅止于阿里。就在阿里官宣全系产品接入“通义千问”的前一天,4月10日,商汤科技“梭哈”大模型,宣布以“大模型+大算力”推进AGI(通用人工智能)为发展战略。同日,游戏起家的昆仑万维同样放出自家的大模型成果,预告“天工”3.5将于4月17日启动邀请测试。

除了科技大厂之外,AI大模型创业大军也在扩容。同样是4月10日,搜狗创始人王小川宣布,他和前搜狗COO茹立云联合创办了人工智能公司——百川智能,旨在打造中国版的OpenAI基础大模型及颠覆性上层应用。这也是继美团联合创始人王慧文、创新工场创始人李开复之后的又一位AI大模型创业者。

“当前AI大模型仍是新兴技术,未来的竞争格局在一定程度上取决于各厂商的举措、战略方向与资本投资方向,”在接受21世纪经济报道记者采访时,IDC中国助理研究总监卢言霞指出,目前AI大模型处于百花齐放的状态,未来企业要想真正跑赢对手,需要包括数据、场景、软硬一体算力等多重能力。

 

挖掘新故事

你方唱罢我登场。过去的这几天,可谓国内AI大模型的一场狂欢。

从“通义千问”大模型正式开放邀测,到阿里巴巴官宣全系产品接入,阿里巴巴围绕大模型的一系列举措吸引了一众目光。它意味着,继微软、谷歌、百度等企业之后,又一家科技巨头更新了AI大模型的动态。

需要注意的是,虽然注定是巨头的牌桌,但在大模型上重新挖掘市场信心,吸引着一众玩家疯狂跟进。

4月10日,作为上一代AI独立创业公司翘楚的商汤科技“梭哈”大模型,宣布以“大模型+大算力”推进AGI(通用人工智能)为发展战略,并公布该战略下的“日日新SenseNova”大模型体系,推出自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

活动上,商汤展示了“日日新SenseNova”大模型体系下的语言大模型“商量SenseChat”,现场演示写广告词、写邀请函、交替创作儿童故事、看长篇PDF文件并快速做阅读理解、编写代码等多样能力,能够支持包括帮助开发者更高效地编写和调试代码、为用户提供个性化的医疗建议、从复杂文档中提取和概括信息在内的诸多创新应用。

同样在4月10日,另一家游戏起家的昆仑万维也放出自家的大模型成果:“由昆仑万维和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——‘天工’3.5发布在即,并将于4月17日启动邀请测试。”

昆仑万维所提的“智能涌现”,即AI的思维能力并不是随着“投喂”模型参数量的线性变化逐渐出现的,而是当参数规模超过某一阈值后,模型的思维能力突然涌现出来,即所谓大模型的“突现能力”(Emergent Abilities)。

4月9日,三六零正式宣布,基于360GPT大模型开发的人工智能产品矩阵“360智脑”率先落地搜索场景,将面向企业用户开放内测。据了解,企业用户在PC端360搜索首页申请并获得测试资格后,可通过企业安全云体验使用。未来,360智脑将与浏览器、数字助理、苏打办公、智能营销等场景应用深度结合,全面提升用户生产力和创造力。

京东集团副总裁何晓冬近日也公开表示,针对真实的产业需求,京东将在今年发布新一代产业大模型。科大讯飞副总裁、研究院执行院长刘聪亦透露,科大讯飞“1+N认知智能大模型”将在5月6日正式发布。

“各路厂家大模型的推出是仓促应战ChatGPT,”在接受21世纪经济报道记者采访时,浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林表示,“当前国内AIGC存在空窗期,需求有了,产品没有,此时各大厂家抢滩登陆AIGC是正确的策略。”

 

AI军备竞赛

短期来看,无论是OpenAI、微软、谷歌,还是百度、阿里等厂商,短时间内都以其AI大模型布局吸引眼球,AI产业的“iPhone时刻”似乎正在以令人目不暇接的面目奔袭而至。

不过,一切新故事的背后,实则是科技企业长期技术积累后的“军备竞赛”。在ChatGPT引爆热潮之前,科技企业就已经在钻研AI大模型。此前几年大模型在学术界早就是热门话题,2023年才彻底引燃大众市场。

例如近日,随着AI大模型潮涌,外界对华为盘古大模型颇为关注,不过实际上,华为对大模型的探索很早就开启。“AI是华为云的核心竞争力之一,我们持续在AI领域投入研发,大模型是AI的重要技术方向。”华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow田奇向21世纪经济报道记者表示。

据21世纪经济报道记者了解,2019年至2020年,盘古大模型就已在华为云内部立项,并且该模型也完成了与合作伙伴、高校的合作搭建。2021年4月,华为云盘古大模型就正式对外发布。

彼时,田奇就表示:“预训练大模型是解决AI应用开发定制化和碎片化的重要方法。华为云盘古大模型可以实现一个AI大模型在众多场景通用、泛化和规模化复制,减少对数据标注的依赖,并使用ModelArts平台,让AI开发由作坊式转变为工业化开发的新模式。”

百度同样在大模型领域沉淀已久。2019 年,百度推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受数十亿用户的搜索请求和其他百度移动生态app的训练。在搜索方面,自2019年3月以来,文心大模型在改进搜索结果方面发挥了重要作用,带来排名改进和多模态搜索能力。在云方面,AI专业知识为传统行业(如制造、能源和公用事业)提供特定AI解决方案和应用。

阿里巴巴亦自2019年起启动AI大模型研发,2021年4月,发布语言大模型“PLUG”;2021年10月,训练出多模态M6大模型,参数规模10万亿。2022年9月,阿里发布“通义”大模型,包括通义 M6、Alice mine 以及视觉模型。

商汤则近日一连甩出基于“日日新SenseNova”大模型体系的4款生成式AI应用平台。目前,商汤已打造CV(计算机视觉)、NLP(自然语言处理)、AIGC(人工智能内容生成)多个AI大模型,其SenseCore AI大装置拥有27000块GPU,可输出5000 PetaFlops算力,能够以最大4000卡规模集群进行单任务训练,并可做到7天以上不间断的稳定训练。

商汤表示,将基于AI大装置,向客户提供涵盖自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练、开发者效率提升等多种大模型即服务(MaaS,Model-as-a-Service)。

“在开源社区已经发布的大模型之外,目前提供商用的大模型包括微软Azure上整合的GPT大模型、百度智能云以及百度飞桨支持的文心大模型、华为云盘古大模型、阿里云M6大模型。由本土厂商研发的大模型,大多支持本地化部署。”卢言霞向21世纪经济报道记者分析称,“过去几年部署的AI应用,接下来几年都有可能被基于大模型的AI所替代。升级迭代可能会从优先具备海量数据的场景开始。”

 

行业大模型路线

在国内各大科技公司布局AI大模型之际,一个明显的趋势是,B端产业路线成为布局的重要方向。

需要指出的是,注重B端市场的大模型和ChatGPT并非在一个赛场,它们属于两个概念。 ChatGPT是GPT系列大模型的一个应用场景,可以直接面向C端用户群体,而诸如盘古在内的大模型应用场景更多聚焦在B端的千行百业。

由此,行业大模型也随之应运而生。

“(大模型)和行业的结合落地方面,我觉得行业大模型会是一个重要的关键性机制。”此前,在接受21世纪经济报道记者采访时,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜直言道。

事实上,百度也正在提速行业大模型的脚步。去年12月,百度联合多家企业和机构发布5个行业大模型,包括深燃-百度·文心、吉利-百度·文心、泰康-百度·文心、TCL-百度·文心和辞海-百度·文心。至此,文心已累计发布11个行业大模型,涵盖电力、燃气、金融、航天、传媒、城市、影视、制造、社科等领域。

盘古大模型同样积累了多个行业项目。据介绍,华为云AI已经在各行业有超过1000个项目,迄今为止陆续推出了矿山、药物分子、电力、气象、海浪等大模型。中信建投研报指出,目前盘古预训练大模型能力已经在包括能源、零售、金融、工业等领域得到验证。

比如,在医药领域,华为云联合西安交通大学第一附属医院,基于华为云盘古药物分子大模型研发出全新的广谱抗菌药物,将先导药的研发周期从数年缩短至一个月;在煤矿领域,华为云实现一个盘古矿山大模型覆盖矿山采、掘、机、运、通等主业务环节,大幅缩短模型开发时间,保障井下作业安全,2022年,盘古矿山大模型在山东能源集团正式商用。

刘聪同样透露,科大讯飞 "1+N 认知智能大模型中,"1" 是通用认知智能大模型算法研发及高效训练底座平台,"N" 是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。

例如,在智慧教育领域,认知智能大模型可覆盖 " 教、学、考、评、管 " 的全链路场景,在学习评测、学情分析、个性化推荐等方面助力精准教学;在当下火热的 AIGC 领域,通过在文本、图像、音视频的创作上不断创新,认知智能大模型可以驱动 AIGC 的质量不断提升、成为未来内容生成的主力。

“未来三年,我们认为将会是大模型是风起云涌的三年,AI将会和各行各业深度结合,AI for industries将是我们的主要方向。”田奇向21世纪经济报道记者指出。

 

“百花齐放”终局

AI大模型“百花齐放”的过程中,也免不了相互拉扯。

在官宣AI大模型进展之后,不太体面的是,昆仑万维在其官方公众号发文表示,“友商”模型的逻辑推理是靠定向优化来覆盖特定题库,不是靠大模型的智能涌现来解答较为复杂的问题,而靠人工打补丁、定向优化的方式是不能真正实现人工智能的——尽管昆仑万维意在突出自家的大模型效果,但一切仍有待观察。

拉扯与较劲背后,其实新的问题正在浮出水面:在AI大模型“百花齐放”的过程中,最终谁能够“赢家通吃”?中腰部厂商是炒作还是真的存在机会空间?

“天工”3.5官宣当日,昆仑万维披露年报,数据显示2022年公司实现营业收入47.36亿元,同比下降2.35%,归母净利润11.53亿元,同比下降25.49%。而截至2022年末,昆仑万维手里的货币资金为10亿元,与此同时,昆仑万维的现金及现金等价物净增额为负的5.92亿。

在公认国内能上大模型牌桌的厂商数单手可数的情况下,不论是资金实力,还是技术积累,昆仑万维似乎都并没有任何优势,昆仑万维也在公告提醒称,“天工”3.5目前仍在测试阶段,后续仍面临技术研发进展不及预期、应用实践不及预期、商业化落地不确定及行业政策变化等风险。此外,昆仑万维提示称,公司持续加大投入,预计还会对公司 2023 年财务状况产生负面影响。

不过,由于搭上AIGC的东风,今年以来,昆仑万维股价已经从14元一路上涨至4月11日收盘的45元。类似的资本市场AI故事,今年的例子不胜枚举。

“当前AI大模型仍属于新兴技术,未来的竞争格局在一定程度上取决于各厂商的举措、战略方向与资本投资方向,”卢言霞向21世纪经济报道记者指出,从目前各家的布局来看,暂时难以断言未来的格局。

不过她也强调,手握AI大模型的科技企业要想真正跑出来,需要具备多项综合能力。“(科技企业)得有能力聚集海量数据以及垂深数据,同时要具备面向场景、解决方案商业化的能力,以及具备提供软硬一体算力的能力。”

诚然AI大模型竞速愈演愈烈,但在AI大模型的热潮下,也涌动着别样的投资机会。“短期来看,一方面从AI应用本身,将带动云服务厂商的AI收入,这部分短期内收入规模略小,可能影响有限。”卢言霞判断称,“另一方面影响较大的是算力层,在AI大模型有优势的厂商,将显著提升其IaaS层收入,这部分的收入规模变化将转变云行业的市场格局。”

(实习生欧子舒对本文亦有贡献)

(作者:杨清清,倪雨晴,李强 编辑:张星)

杨清清

资深记者

关注数实融合、大国创新、专精特新等新科技风向话题。微信:yangqq1910(添加请备注姓名、公司及职务)

倪雨晴

科技记者

关注通信、半导体、智造等硬科技,欢迎找我分享故事,微信18825191742。