逐浪AIGC⑲丨对话京东云科学家团队:京东将打造产业版ChatGPT,看好AI多模态趋势

21Tech杨清清 2023-05-06 12:43

京东已计划在2023年推出新一代千亿大模型——言犀产业大模型。

21世纪经济报道记者杨清清、实习生师洁 北京报道

人工智能的热潮仍在持续,相关入局者也在加快脚步。

5月6日,第十二届吴文俊人工智能科学技术奖正式公布,京东云旗下的言犀团队凭“任务型智能对话交互关键技术及大规模产业应用”,斩获吴文俊人工智能科学技术奖科技进步奖。

与此同时,京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士荣获了吴文俊人工智能科学技术奖杰出贡献奖。

资料显示,吴文俊人工智能科学技术奖经科学技术部核准设立,由国家级学会——中国人工智能学会发起主办,被誉为“中国智能科技最高奖”,是国内人工智能领域最高荣誉象征。作为唯一一个同时斩获项目奖和个人奖两类殊荣的企业,京东显示了其在人工智能领域的积累和成就。

围绕近期热门的人工智能发展趋势,21世纪经济报道记者亦对话了包括何晓冬在内的京东云科学家团队。京东云团队称,京东已计划在2023年推出新一代千亿大模型——言犀产业大模型,预计大模型首先将在京东内部业务上进行测试,达至开放要求后再推出并服务合作伙伴落地应用。

而面对当前热门的生成式AI趋势,何晓冬认为,AI大模型向多模态方向演进会成为行业重要的发展趋势。“目前AI大模型根据生成内容的差异仍有所细分,未来则有望演变为真正的多模态大模型。”

 

产业版ChatGPT

凭借“任务型智能对话交互关键技术及大规模产业应用”,京东云旗下言犀团队本次摘获吴文俊人工智能科学技术奖。

据介绍,该获奖项目于2022年7月通过中国人工智能学会组织的科技成果鉴定,评价认为其涵盖了知识指导的多模态可控对话生成、极简条件下智能行为感知与数字外观重建、多轮对话决策推理三项技术突破,均达到国际领先水平。

与此同时,项目科研成果形成了系列产品和解决方案,并通过言犀人工智能应用平台对外输出,技术成果规模化推广在多个行业应用,产生了逾20亿元的直接经济效益和良好的社会效益,促进了零售、物流、金融、政务等相关产业的快速发展。

而获奖的背后,并非偶然。自2017年京东全面向技术转型以来,在技术路径的指引下,言犀和京东探索研究院打造了支持京东、服务产业以及探索未来的技术。

而围绕今年以来持续火爆的AI大模型,京东方面透露,针对真实的产业需求,正在AI大模型的方向上持续推进。

据介绍,2021年京东推出10亿级模型K-PLUG,2022年推出百亿级Viga 模型,均在多个比赛里获得奖项。今年2月10日,京东正式宣布,京东云旗下言犀人工智能应用平台将整合过往产业实践和技术积累,于2023年规划推出千亿级大模型“言犀产业大模型”。

目前,京东已公布言犀产业大模型的落地应用路线图“125”计划,即一个平台、两个领域和五个应用。一个平台为言犀产业大模型智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,两个领域为零售和金融。五个应用包括内容生成、人机对话、用户意图理解、信息抽取和情感分类。

当前,国内AI大模型的战况正在愈演愈烈。自去年11月,ChatGPT惊艳亮相后便引发国内外人工智能热潮。随后,百度在国内首次推出“文心一言”,阿里巴巴、商汤科技、昆仑万维等科技公司也纷纷跟进。此次,京东计划推出新一代产业大模式更是为这场AI大模型狂欢添了一把火。

需要注意的是,相较于其他科技公司推出的AI大模型,京东“言犀产业大模型”定位为产业版ChatGPT,旨在打造优势、高频、刚需的产业版通用ChatGPT。“只有将人工智能大规模、系统性地融入产业链的全流程,打造产业AI,才能形成更领先的产业竞争力。”京东集团高级副总裁、京东集团技术委员会主席曹鹏曾表示。

而在京东云言犀团队看来,对于打造产业大模型,京东具备先天优势。一方面,京东自身供应链环节众多,落地场景丰富,可以对AI大模型进行更深度的产业级打磨。另一方面京东除了经营ToC零售业务外,同样耕耘To B领域,拥有零售、物流、健康、工业等领域丰富的实体应用场景,对外连接着金融、交通、能源等庞大而又复杂的产业生态,具备广泛的产业实践场景。

据了解,言犀产业大模型推出后将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动在不同产业中的落地。“京东是基于自身复杂的产业生态来打造产业AI的,同时通过京东自身的产业实践沉淀出一定能力再对外进行赋能。”何晓冬表示。

 

AI多模态趋势

人工智能的热潮在持续涌现,就此,何晓冬也有自己的判断。

ChatGPT自去年11月30日正式推出,它不但能够通过理解和学习人类的语言进行对话和互动,真正像人类一样交流,还能实现文本生成、代码生成,翻译文献,商业文案撰写等一系列任务。

何晓冬认为ChatGPT是第一款真正意义上的AI原生产品,“它在内容生成上达到了半职业水平,真正成为一个生产力的产品。”

随着ChatGPT的热度持续飙升,2023年3月15日 OpenAl 正式推出多模态大模型GPT-4 。相较于ChatGPT,GPT-4从单调的文本交互,升级为可以接受图像、文本作为输入,并表现出更人性化的交互能力。这种能够处理多种类型信息的“多模态”技术成为其最大亮点。

实际上,多模态并非新概念。早在2018年,“多模态”作为AI未来的发展方向之一,已开始成为业界研究的重点。经过多年发展,多模态 AI 技术已取得了亮眼成果。

“展望AI未来,往多模态方向发展是一个重要的趋势。”何晓冬向21世纪经济报道记者表示,“实现多模态大模型,理论上是有可能的。目前,预训练大模型根据生成内容的不同存在一定细分,但或许未来可能变成一个真正的大模型。同时,多模态大模型不同模态之间的数据也可以互相借用,使得整体效果进一步提升。”

何晓冬同时透露,未来的言犀产业大模型也将是一套跨多模态的大模型。

而大模型变大的趋势,或将还会持续一段时间。何晓冬认为,从产业应用层面来说,随着参数规模的愈加增大,定制化模型的需求减少,从产业应用层面来说,部署门槛反而变得更低,这也就意味着,未来随着模型越来越大,产业就愈发不需要定制化模型,常规的大模型经过简单适配便可快速迁移。

“目前各科技公司之所以坚持把大模型做越来越大,就是因为大模型做大以后会有更低的门槛和更高的效率部署到产业上去。”何晓冬表示。

(作者:杨清清 编辑:骆一帆)

杨清清

资深记者

关注数实融合、大国创新、专精特新等新科技风向话题。微信:yangqq1910(添加请备注姓名、公司及职务)