逐浪AIGC③丨国产版ChatGPT打响“第一枪”:文心一言终亮相

21Tech杨清清 2023-03-16 20:30

先上桌,才能进入快速迭代的飞轮。

逐浪AIGC①丨OpenAI正式发布GPT-4 向超级AI进发? 逐浪AIGC②丨别只盯着ChatGPT了,这波AI浪潮远不止于此 逐浪AIGC④丨新的AI浪潮来临,创业者该做什么? 展开更多

编者按:1956年,人工智能(AI,Artificial Intelligence)的概念首次提出,迄今已逾六十载。60年来,AI历经了从爆发到寒冬、再到野蛮生长的历程,伴随着人机交互、机器学习等技术的提升,AI成为了技术时代的新趋势。

2022年,AI行业再度迎来新的节点,人工智能生成内容(AIGC,AI Generated Content)后来居上,以超出人们预期的速度成为科技革命历史上的重大事件。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,生成式AI正在迅速催生全新的科技革命系统、格局与生态。

时针转至2023年,由AIGC引发的热度不减反增,而全新的智能创作时代在带来深刻生产力变革的同时,也将进而改变人类的思想演进模式。就此,21世纪经济报道数字经济课题组策划了“逐浪AIGC”系列报道,多维解读AIGC带来的技术可能和商业图景。

21世纪经济报道记者杨清清 北京报道

经过长达一个多月的内测后,3月16日,国内首款对标ChatGPT的产品“文心一言”正式现身。

从现场氛围可见外界的期待。早在发布会正式开始前半小时,容量超百人的现场已几乎座无虚席。一天之前,OpenAI正式发布王炸产品GPT-4全面“秀肌肉”,人们都很好奇,百度的文心一言究竟是怎样的产品。

“我自己测试感觉还是有很多不完美的地方。”在文心一言的发布会现场,百度公司创始人、董事长兼CEO李彦宏坦言道。但他同时指出,文心一言对标着ChatGPT甚至GPT-4,门槛是很高的,“全球大厂还没有一个做出来的,百度是第一个。”

作为国产ChatGPT“第一枪”,文心一言在百度内部的地位不言自明。从李彦宏“代言”的态度也可见一斑。发布会结束后,李彦宏罕见地专门预留出时间接受现场提问——上一次他与媒体公开交流的时间点,可回溯至6年前陆奇的入职。

之所以文心一言让李彦宏如此兴奋,源于他对人工智能行业拐点的判断。“过去这一年多的时间内,人工智能领域发生了比较明显的变化,从过去判别式的人工智能转向了生成式的人工智能。”在接受包括21世纪经济报道在内的媒体采访时,李彦宏透露称,百度已经看到在生成式AI领域的强烈市场需求,这也是百度积极研发、迭代并推出文心一言产品的原因。

 文心一言来了

“前几天我拿到了内测账号,测试后觉得整体大大超出了我的预期。”在接受21世纪经济报道记者采访时,体验过文心一言内测的百度员工如是说。

对于该员工而言,文心一言的面世,更像是从0到1的过程。而超出他预期的部分,首先在于这款产品本身的问世,其次在整体效果。“要真正追上ChatGPT确实存在难度,但国内能在短时间有这样的产品出来,就已经很不容易,先上桌,才能进入快速迭代的飞轮。”

从发布会现场来看,通过在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的能力展现,文心一言也确实在一定程度上具备对人类意图的理解能力,回答的准确性、逻辑性、流畅性也都逐渐接近人类水平。

例如,在文学创作场景中,李彦宏以著名科幻小说《三体》为例,围绕小说核心内容、内容续写提问文心一言,在几秒时间内,文心一言给出综合性强、内容提炼度高的回答;在数理推算能力展示中,文心一言对“鸡兔同笼”问题进行作答并纠正了题干给出的错误信息。

此外,文心一言还具备文本、图片、音频和视频的多模态生成能力,在音频方面甚至能够生成四川话等方言语音。“多模态是生成式AI一个明确的发展趋势。”李彦宏表示,“未来,随着百度多模态统一大模型的能力增强,文心一言的多模态生成能力也会不断提升。”

一位业内观察人士向21世纪经济报道表示,文心一言看似简单,其实背后具备很高的技术门槛。“能做应用题,意味着对长文本的理解能力要求很高,整体文生图、文生视频这些多模态生成能力也需要大量的技术积累。”

该人士同时指出,此前ChatGPT给他最大的震撼点在于它是一套通用人工智能系统,这是对于行业的颠覆。“过去的AI深度学习更多是将任务进行拆解和细分,任务拆得越细就越简单,AI就容易处理并达到较好的效果,如今则是一套模型打天下,通过零样本学习具备深层次的通用能力,这件事情是非常难的。”

不过,从整体而言,文心一言这类大语言模型还远未到发展完善的阶段。“作为普通用户来说(与ChatGPT)可能差距不大。”一位参与文心一言测试的用户向21世纪经济报道记者表示,“但作为专业创作者,包括作者、码农,文心一言生成的答案就没那么精准。”

而这背后,有赖于通过真实的用户反馈而逐步迭代,这也是此次文心一言对外发布的意义所在。“文心一言将建立起真实用户反馈、开发者调用和模型迭代之间的飞轮,效果会迅速提升,给你‘士别三日,当刮目相看’的惊喜。”李彦宏表示。

本土化或成优势

尽管目前暂无法与ChatGPT同日而语,但文心一言也有自己的优势。

在发布会现场,李彦宏特别对文心一言的中文理解能力进行了展示。在展示过程中,文心一言正确解释了成语“洛阳纸贵”的含义、“洛阳纸贵”对应的经济学理论,还用“洛阳纸贵”四个字创作了一首藏头诗。

“‘洛阳纸贵’、‘藏头诗’,这很考验AI对中文和中国文化的理解。”李彦宏指出,“作为扎根于中国市场的大语言模型,文心一言具备中文领域最先进的自然语言处理能力。这个例子就比较清楚的展示了我们在中文上的优势。”

“当前ChatGPT的强大是有目共睹的,但在中文领域ChatGPT的成熟度略低。”在接受21世纪经济报道记者采访时,浙江大学国际联合商学院数字经济与金融创新研究中心联席主任盘和林指出。事实上,作为高度本土化的生成式AI产品,文心一言更加匹配国内用户的中文使用习惯,表现出较高的中文语言和中国文化的理解能力。

对中文的准确理解,离不开高密度的中文数据训练。此前在接受21世纪经济报道记者采访时,IDC中国研究总监卢言霞认为,文心一言有中文语言优势,有国内领域相关数据积累。据了解,文心一言大模型的训练数据包括万亿级网页数据,数十亿搜索数据和图片数据,百亿级语音日均调用数据,及5500亿事实的知识图谱。

在盘和林看来,文心一言的另一个优势则在于易得性,相较之下,ChatGPT在国内的使用难度明显较高。

也正是在这种种优势下,大量的企业对文心一言保持着超高的热情。据李彦宏披露,自2月7日百度官宣文心一言后,已有650家企业宣布加入文心一言生态。

而本次发布会上,百度同时公布了文心一言的邀请测试方案:3月16日起,首批用户即可通过邀请测试码,在文心一言官网体验产品,后续将陆续开放给更多用户。

此外,百度智能云即将面向企业客户开放文心一言API接口调用服务。3月16日起正式开放预约,搜索“百度智能云”进入官网,可申请加入文心一言云服务测试。

据21世纪经济报道记者了解,在文心一言发布会后一小时内,排队申请文心一言企业版API调用服务的企业用户已达3万多家,申请产品测试网页多次被挤爆,百度智能云官网流量飙升百倍。

不过需要看到的是,与国外对标下,文心一言仍有提升空间。“当前百度的文心一言面临的是一个强大的对手,一步到位追平的难度很大。”盘和林直言道,“借助中文和应用易得性两项,百度应该会有个不错的开始,但维持优势、提升应用广度还需要很长时间。”

(实习生陈雨若对本文亦有贡献)

(作者:杨清清 编辑:陶力)

杨清清

资深记者

关注数实融合、大国创新、专精特新等新科技风向话题。微信:yangqq1910(添加请备注姓名、公司及职务)