智眼AI丨声时代的“芯”方案

21世纪经济报道 21财经APP 韩迅,曾婷芳 深圳报道
2018-08-29 17:49

>  观看往期视频  <

“过去两次人工智能浪潮都是技术员在自嗨,但做完以后就发现在产业里面根本应用不起来,但第三次浪潮跟过去完全不一样。”

梁家恩在给21世纪经济报道记者讲述他对人工智能浪潮的看法时,语速飞快,思维敏捷。

中科大毕业的梁家恩,在国内最早进行语音识别的研究机构——中科院自动化所深造5年,面对“技术上做的很漂亮”的研究团队,却深感难以实现产业化。这时,第三次人工智能热潮已经掀起,有一个逻辑被越来越多公司认可,作为人机交互最主要方式之一,智能语音将成为万物互联时代的入口。在这样的背景下,梁家恩决定出来看看。

2011年,他加入了由黄伟刚刚创办的盛大创新院语音分院。2012年初,他从盛大创新院辞职,创办云知声。

产业能不能做起来,最根本还是看应用

“应用场景已经开始起来了,并且有很大的需求在推动这个事情往前走。例如大数据,计算能力,深度学习方法的复兴,都为这个产业应用做了较大的铺垫。”

梁家恩告诉21世纪经济报道记者,语音识别只是交互的一个入口,最重要的还是后台提供的内容服务,也就是指找到合适的应用场景。智能家居是最重要的一个方向,另一个重要的应用场景则是开车时的人车语音交互,为了暂时避开与Nuance、科大讯飞的直接竞争,云知声选择了汽车后装市场。

最终,公司主要业务圈定了智能家居、车载、教育和医疗四个领域。

与手机采用的近场语音识别不同的是,智能家居产品离用户普遍较远,需要采用远场语音识别技术,噪音、声波衰减等等问题都需要解决,芯片自身的功耗必须足够低,并且可以冷唤醒。

机器人市场已经进入“互联网+情感+智能”的时代,陪伴儿童成长的智能儿童机器人已成为儿童产品市场的新一轮“风口”。在梁家恩看来,机器人挑战的难点在情感的认知,情感计算是一门综合性很强的技术,语音识别这10年来的突破,更多还是在感知层面的,而在包括理解在内的认知层面却不多,仍有较多痛点有待解决。

 

“云端芯”+“开源”的战略图谱

2018年是AI芯片市场密集爆发的一年,AI芯片公司频频获得融资,进展迅速。在这样的发展背景下,云端芯片也成为诸多AI芯片企业即将争夺的下一个入口。

梁家恩说,“我们判断人工智能,它未来的智能一定是在云端的,这也是我们做云平台的逻辑。”

正是在这种思想的指导下,云知声一面提供着 IVM 的整体解决方案,一面把自己在 IVM 实际落地场景下积累的经验和参数,落实到自有 AI 芯片的设计中,期望通过芯片,最大可能地把家居场景下的关键部分进行固化,再将该芯片之上的全栈语音交互进行开源。大大降低技术门槛、缩短上市时间,从而确保合作伙伴与云知声的合作都有收获。

兵无常势,水无常形。面对物联网这个碎片化的市场,如何以一个高效的方式应对,云知声给出了自己的回答,通过凝结自己场景落地经验,落实到自有AI芯片,将其上的全栈语音交互方案进行开源,结成统一战线。各个合作伙伴可以在开源方案上将精力更多地放在自己熟悉的细分市场定制化方向,更快更好更多的出货。而云知声聚焦在自己性能改进和芯片迭代,更高性能更低成本。

(文/曾婷芳 采访拍摄/韩迅、曾婷芳 剪辑/王博)

(作者:韩迅,曾婷芳 编辑:王博)