专访腾讯智能平台副总裁李学朝:“数字虚拟人”将成AI语音技术发展新趋势

21世纪经济报道 21财经APP 白杨 北京报道
2020-09-15 11:27

如何让AI语音助手“听得清、听得懂、善交流”?

新基建浪潮下,行业数字化转型如火如荼,在这个过程中,AI语音作为近几年发展最为成熟的人工智能技术方向,也逐渐成为行业数字化不可或缺的“增长基石”。

因为对所有行业来说,转型升级背后都有一个共同的目标,即更好地满足客户的需求。但从实际情况来看,想要达到这个目标对行业来说还是一个技术性的挑战。

在刚刚结束的2020腾讯全球数字生态大会上,腾讯云小微对外发布了全新的AI助手解决方案。据介绍,该方案通过AI语音交互技术与IP视觉形象的结合,以数字虚拟人的形态为企业提供一个“数字员工”,并由他代表企业与用户建立更高效的连结。

随着AI语音技术逐步在行业广泛应用,AI语音助手也走进了越来越多消费者的生活之中,与机器对话,早已不再是科幻电影中的场景。

而对于这次所展示的数字虚拟人,腾讯智能平台产品副总裁李学朝在接受21世纪经济报道记者专访时表示,这其实是AI助手应用的一种延伸,“我们在拓展IoT领域的时候就观测到,AI助手在文旅、政务、教育、出行等行业其实都有比较多的应用场景。”

当然,这背后也有整个腾讯集团都在向B端倾斜的因素,尤其是AI技术,也是腾讯对外能力输出的一个重要组成。

李学朝告诉记者,在明确的业务场景下,机器人在知识理解、交互、形象等方面会有很大提升,这也能够帮助企业最大程度地提升效率、节约成本、增强效果。

打造“数字虚拟人”AI助手

在腾讯全球数字生态大会进行演讲时,李学朝身边还有一位特殊的嘉宾,她是由腾讯云小微和腾讯AI Lab 联合打造的全新数字虚拟人——《镜双城》动画番剧中的“那笙”。

 

透过屏幕可以看到,“那笙”在与李学朝对话的过程中,不仅有丰富的肢体动作,同时在语调上也富有情感。这实际上也是腾讯云小微此次发布的AI助手解决方案的一个实践案例,与其他单纯的语音交互方案相比,腾讯云小微希望能够打造出一个有温度的数字虚拟人。

李学朝告诉记者,一方面从人类交流的演进过程来看,面对面交流仍是最有效率的,可以看到肢体语言和表情,交流也更加立体、丰富;另一方面,从技术的演进来看,AI助手一开始是文本交互,后来是语音,“为了让人与机器的交流体验更好,我们也想做一个技术上多模态的互动演进”。

简单来讲,就是过去的AI助手只能“闻其声”,但腾讯云小微现在要在此基础上还能“见其人”。在李学朝看来,这个技术方向也是语音助手接下来的发展趋势,“要能看到语音输入和输出的结果,并通过肢体动作、面部表情的互动感受到情绪的波动”。

对企业来说,能做到拟人化的沟通肯定是一个最优选项,而且借助这种数字虚拟人的打造,企业可以塑造属于自己的形象IP,这样不仅能够给用户提供更加有亲和力的服务体验,也能让用户在享受服务之后,留下深刻的印象,加深对企业品牌的好感度

另外,随着AI助手越来越拟人化,人类员工是否会被AI替代,也是外界颇为关心的一个话题。对此,李学朝向记者表示,在特定场景下,AI技术能够帮助企业解放重复劳动,提高效率,但很多高附加价值的工作,仍需要人工参与。所以,人与机器应该相互协同,机器主要专注于高重复的工作,这也是当下最务实的目标。

让AI助手“听得懂”更多行业

对于一个AI助手而言,AI语音交互是其最基础的能力,而“听得清、听得懂、善交流”,则是语音交互过程中最重要的三个目标。

首先,“听得清”是要让AI能把人的声音精准转化成文本的能力,过去几年,得益于ASR (自动语音识别技术)和TTS(文本到语音)技术的日趋成熟,AI助手在听和说的能力上已经相对完善。

最难的其实是让AI“听得懂”,而AI能否听得懂,往往取决于知识图谱的丰富度。对于腾讯云小微而言,当服务对象从智能硬件转向行业客户时,如何让AI助手理解更多行业也是一大挑战。

李学朝表示,腾讯云小微主要从两个维度着手,一是基于腾讯云自有的行业团队、专家,由他们去创建专业的行业知识图谱;二是在领域专家缺少的情况下,会跟行业伙伴合作,用技术与他们的数据做结合。

至于“善交流”,为AI助手赋予形象便是促进交流的一种方式。除此之外,借助全双工(Full Duplex)的能力,用户在语音对话的场景中,可以随时打断机器人、也无需每次唤醒,就像和真人交流一样。

李学朝举例说,腾讯云小微目前已经帮助故宫博物院在“玩转故宫”小程序中打造了一个虚拟形象“福大人”。“福大人”作为一个智能导游,不仅能跟游客闲聊互动,还能推荐个性化的游览路线,讲解景点文物,畅聊历史趣闻轶事等。

此外,“福大人”在人物形象上,也被设定为内阁大学士,可以以内阁大学士的口吻与用户互动,这也大大增强了游客在游览过程中的沉浸体验。

借助AI助手解决方案,不仅是文旅行业可以拥有智能导游,像教育行业也可以拥有智能助教,以及所有行业都可以量身制定属于自己的“数字员工”,这实际上也是AI语音技术发展至今,未来继续发展的一个重要趋势。

在李学朝看来,AI技术正推动着各个产业升级,给各行各业带来了新的发展可能。而基于AI助手解决方案打造的“数字员工”,未来则会成为新经济、新基建的基础服务,落地在各个行业中。

(作者:白杨 编辑:徐旭)

白杨

IT版记者

关注科技互联网领域报道。微信:by_xiansheng(加好友请备注姓名、公司及职务)