百度宣布免费开放四项全新语音技术接口,包括情感合成、远场方案、唤醒二期技术和长语音方案。
11月22日,百度宣布免费开放四项全新语音技术接口,包括情感合成、远场方案、唤醒二期技术和长语音方案。“这些技术有很大潜力彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会,将为人机交互带来巨大改变。”百度公司首席科学家吴恩达表示。
据介绍,这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。其中,百度情感合成技术聚焦于为合成语音“加入情感”,目前可达到接近真人发声效果;远场方案可使语音识别距离增加到3-5米;唤醒二期技术将设备的语音唤醒率提升到95%以上,同时更省电,误报更少;长语音方案可提升长时间语音识别的准确率。
目前远场方案及唤醒二期技术的代表是百度的“小度机器人人机语音交互点餐”,已在上海肯德基旗舰店投入应用,可远距离随时应答点餐。长语音方案则在诸多内容记录、智能客服、视频转写等应用场景表现出想象空间。
“长语音方案整体的技术已经具备了,但具体做成单独的APP还是嵌入到其他应用中,仍需要进一步落地。”一位业内人士告诉21世纪经济报道记者。
资料显示,百度语音开放平台自2013年10月上线以来,每日在线语音识别要求从2013年的500万上升到今天的1亿4千万,在线语音合成每日请求达2亿次,开发者数量超过14万。
(编辑:陆宇)
21世纪经济报道及其客户端所刊载内容的知识产权均属广东二十一世纪环球经济报社所有。未经书面授权,任何人不得以任何方式使用。详情或获取授权信息请点击此处。
X
分享成功

