国内厂商的投入并不落后,凭借出色的商业化能力,未来国内的AIGC产品同样值得期待。
21世纪经济报道记者李强 北京报道
面对ChatGPT刮起的风暴,国内科技巨头反应也十分迅速。
2月8日,南财快讯首发报道阿里达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试。阿里巴巴方面对21世纪经济报道记者表示,确实在研发相关产品,目前处于内测阶段,尚没有更多信息透露。
从2019年开始,AI大模型突然爆发,参数规模以指数级的快速增长。从2014年到2018年,AI模型参数规模还在一亿的数量级上下浮动,2019年2月,OpenAI的GPT-2达到了15亿参数规模;2020年6月,GPT-3达到了1750亿参数的规模;2021年1月,谷歌大脑推出了1.6万亿参数规模超级模型,再次刷新规模记录。
而随着AI大模型技术的不断成熟,AIGC技术已经走出实验室,应用场景也已经从初始的文本生成发展到多模态领域。行业人士分析认为,ChatGPT类型产品须以底层数据作为基础,算法只是核心竞争力之一。
跨领域学习
事实上,对于AI行业来说,眼下最迫切的诉求在于扩大应用场景。
2022年9月,阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在降低AI的应用门槛。
“近十年来,AI的研究发展迅猛,但AI的应用始终是一大难题,使用门槛过高限制了AI的潜能。”阿里巴巴集团资深副总裁、达摩院副院长周靖人此前曾表示,AI模型较为复杂,尤其是要应用于行业场景,往往需要重新训练,这使得AI只掌握在少数算法人员手中,难以走向大众化。而魔搭社区提供众多预训练基础模型,只需针对具体场景再稍作调优,就能快速投入使用。
近年来,大模型表现出前所未有的理解与创造能力,且打破了传统AI只能处理单一任务的限制,让人类离通用人工智能的目标近了一步。但是,大模型在实现全模态和全任务的通用性上,仍存在许多技术难点,同时受算力资源限制,其训练与落地应用颇具挑战。
回顾AIGC(AI生产内容)的发展趋势,阿里研究院资深技术专家苏中认为,ChatGPT这一类现象级应用的横空出世与迅速爆红并不意外。“深蓝打败了卡什帕罗夫、AlphaGo战胜了李世石……对于业内人士来说,这些曾经轰动一时的现象级技术进步,仅仅是完成固定任务的弱人工智能。开发具有跨领域学习能力的强人工智能技术,才是人类努力的终极目标。”
在他看来,常识学习、跨领域模型迁移、小样本和零样本学习……一个个技术的拦路虎挡在通往强人工智能的技术道路上,而人工智能超级模型则成为重要的助力。
语音语义增速显著
此前,谷歌旗下的Deepmind公司推出了自主编程应用AlphaCode,在 Codeforces 举办的编程比赛中,超过了 45.7% 的人类参赛者;OpenAI开发的另一款图片生成应用DALL·E-2,入选了时代杂志评选的2022年度最佳发明;英伟达开发了一款3D模型生成工具Magic3D,用户输入文本描述就可以自动生成结构极其复杂的3D模型;阿里巴巴达摩院多模态大模型M6,利用文本输入可以自动驱动人体3D模型的动作合成……
在图文创作、代码生成、3D模型设计、3D动画制作等领域,AIGC技术展示着深厚的潜力,其应用边界也将随着技术的进步与成本的降低扩展到更多领域。
阿里、百度等国内大厂也很早就加入到这一场AI技术竞赛中。阿里巴巴达摩院在2020年初启动中文多模态预训练模型M6项目,同年6月推出3亿参数的基础模型。2021年1月,模型参数规模到达百亿,已经成为世界上最大的中文多模态模型;2021年5月,具有万亿参数规模的模型正式投入使用。
得益于国内厂商的持续投入以及出色的商业化能力,未来国内的AIGC产品同样值得期待。
IDC发布的《2022 H1中国AI云服务市场研究报告》显示,阿里AI在ChatGPT相关的语音语义领域已连续三年多在国内保持引领地位,市场份额达到31.98%,其中阿里对话式AI、语言AI、语音AI市占均为第一。
此外,百度在2月7日正式对外确认将发布类ChatGPT项目“文心一言”(ERNIE Bot)。该产品目前正在做上线前的冲刺,将于三月份完成内测,面向公众开放;百度搜索或将全线接入文心一言。
不过,阿里巴巴推出真正等待类ChatGPT产品仍需时日,躁动的资本市场已经开始收割红利。2月8日,内容社区知乎股价暴涨接近50%,创下历史新高。百度、寺库、云从科技在内的多家公司,股价也纷纷上扬。
值得注意的是,走在前列的百度得到了多位受访人士的肯定,其中有国产GPU开发商的市场部人士对21世纪经济报道记者表示,“百度未来可在中文大语言模型中和微软等国际龙头竞争,以英文为主的ChatGPT,在接受中文问题时,还是不太在行。”
目前,百度官网的介绍显示,这个大模型已经覆盖了自然语言处理、生物计算、视觉等领域。基于“文心大模型”推出的应用“文心百中”和“文心一格”分别是关于文本和图像的应用,均支持中文自然语言搜索,可以说是海外ChatGPT、DALL·E的中文版竞品。
但是,对于巨头来说,每一项新的产品和创新仍然会围绕其主营业务。业内人士分析,阿里早前已部署用大模型技术探索电商跨模态搜索、AI虚拟主播、天猫精灵创作辅助等新场景,类ChatGPT技术在阿里内应用空间广泛,或将引发新一轮技术升级。
(作者:李强 编辑:林曦)
21世纪经济报道及其客户端所刊载内容的知识产权均属广东二十一世纪环球经济报社所有。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。