科大讯飞杜兰:“语音语言”是人工智能的突破口

21世纪经济报道 黎雨桐 广州
2016-12-27 19:02

12月27日,由21世纪经济报道重磅推出“打造超级金融IP•2016财经新媒体峰会”行业盛会在广州盛大召开。

科大讯飞高级副总裁杜兰作为演讲嘉宾,发表了题为《人工智能+,未来已来》的主题演讲。

杜兰在演讲中表示,人工智能的发展能分为三个阶段,第一阶段是计算智能,第二阶段是感知阶段,第三阶段是最具挑战性的,即机器具备认知智能,要会理解和思考。现在人类做的很多努力都还停留在第二阶段,杜兰认为,“语音语音”是一个能让人工智能突破“智能认知”的入口。

杜兰还认为,自2006年深度学习网络正式提出来以后,第三次人工智能浪找逐渐开始,而值得欣慰的是,在第三次浪潮中中国不再缺席。

1.jpeg

杜兰

全文如下:

各位嘉宾,各位伙伴,大家好!今天在演讲现场,我发现各位观众听得非常认真,因为在大屏幕上通过语音进行文字的实时转写,这也是人工智能的新功能,是我们科大讯飞做的事情。

今年,我想各位都关注到锤子手机发布会上砸出了一个伟大的企业,就是科大讯飞,我们在后台上也查了一下准确率,基本上是达到了95%,其实我们在2015年12月份,就推出了机器转写的系统,我们不仅同频转写中文,还实时出现了英文、日文和维吾尔语,这能给大家的生活和生产带来巨大变化,这是人工智能正在从理论界,科技界,甚至投资界关注的热点,转变为老百姓非常关注的话题,人工智能也正是2016年时尚的社会热点。

任何事物都是多样性的发展。从1956年开始,当第一次人工智能算法语言和人工智能可以证明数学原理的时候,就有人兴奋地说,未来3至8年,人工智能就可以像人一样达到平均水平了。

1980年就出现了第一次人工智能的低潮。随着第一次低潮过后,BB算法出新,大规模神经网络训练成为可能,人们再次对人工智能产生希望,甚至日本雄心勃勃地提出要做第五代的计算机,但其后由于种种困难导致人工智能的冬天再次到来,到2006年深度学习网络正式提出来以后,我们发现第三次人工智能浪找逐渐开始,而值得欣慰的是在第三次浪潮中,中国不再缺席,我们中国科学家参与了其中的一些研发,也在这个过程中,赢取了世界上非常高的位置。

我们看到人工智能的到来比想象中越来越快。前不久,我在和叶老师进行对话的时候,他说未来像我们这种靠文字吃饭的,有多少会被机器所取代呢?我说会有20%的工作会由机器代替人类直接进行输出。麦肯锡也曾提到,20%的CEO会被取代,人工智能将会颠覆全球的就业率,会降低到50%,在中国会到77%,将会有3/4的工作会被机器所取代。

未来我们有哪些产业发展机遇呢?我们认为以语音为主,和键盘交互为辅的人机交互的时代到来,未来5至10年,人工智能会像水和电一样,进入我们千家万户,会深刻改变我们的世界,我们也会把现在的技术现状和产业界的情况和大家做分享。

从人工智能发展阶段来看,我们分为三个阶段,第一个阶段是计算智能,即是国际大师被机器打败。

第二个阶段是感知阶段,第三个阶段才是我们现在人类最为挑战的阶段,就是机器具备认知智能,要会理解和思考,现在做的很多努力都还是在感知智能的阶段。

我们怎么样来突破认知智能呢?在人类发展历程中,人是从200万年前到7万年前的智人。通过语音来组织各种各样的复杂计划,让组织越来越有凝聚力。

科大讯飞就是以语音和语音作为入口。科大讯飞作为这个项目的总牵头单位,我们的研究院院长担任首席科学家在这一块的最后一个评判标准就是让机器人在2020年参加高考,并且考上一本,这就需要机器具备理解,还有语言推理和自主学习的能力。

距离2020年有四年的过程,我们也取得阶段性的成果,有什么体现呢?一方面是屏幕上听的能力已经具备了,机器真的像装了一个耳朵,能够听懂你说什么,这一块是怎样发生互动呢?就是让AI、UI知道你说的话。并且让人工智能具备说的能力。

在认知智能方面,我们也形成了突破。人类和机器学习最大的不同点就是6岁之前,人类具备基本尝试判断能力,而机器在这个领域反而特别困难,大量知识学习对人类来说是很痛苦的,而机器则是很容易达到的。到今天为止,我们非常自豪地说,我们在机器口语翻译,还有人脸识别等多项识别中都获得了全球第一。我们现在已经生产出一款翻译机真的可以实现人机互动。在创新节,以色列的创新之父就现场体验了翻译技术,让人觉得不可思议。在2014年之前,英翻汉是美国第一,汉翻英是日本第一,现在是我们中国第一。

我相信在座的都参加过各种各样的考试,过去是客观题,现在客观题的评卷是机器人做的,现在主观题的评卷也是用这个的。在未来,像中文的作文和英语的作文都可以采用机器来进行评分。

我们和30多家汽车厂家进行合作,汽车会成为娱乐、工作重要的平台,当时速超过100公里的时候,怎么样让机器听懂你说的话,还有教育领域,我们已经有8千多万的师生用了我们这样的产品,还有智慧的城市,智慧的医疗,越来越人工智能的技术正在嵌入到生产和生活中,由于时间关系,我就不再一一举例。

我们可以看一下从2010年开始,我们可以把人工智能创新创业平台开放给大家,截止到目前,我们可以看到在这个平台上,语音这一块的技术90%都是我们提供的,还有我们覆盖终端已经达到9.35亿个,在这上面一起和我们创业创新的开发者达到24个万团队。

非常高兴跟大家分享我们在人工智能领域的发展。我想让世界聆听我们的声音,让人工智能建设美好世界是我们的愿望和使命。谢谢大家!

(作者:黎雨桐 )