百度研究院副院长:万物互联升级商业价值

21世纪经济报道 戴春晨 广州报道
2015-05-24 11:00

万物互联产生的大数据,将使得机器“越来越聪明”,从而提供更加智能化的服务。

大数据时代,从每一个普通人到国家经济运行的状况,都可以做智能的预测。

在5月23日的智能社会科技专家论坛上,百度研究院副院长、深度学习实验室主任余凯提到,万物互联产生的大数据,将使得机器“越来越聪明”,从而提供更加智能化的服务。他认为,在未来,所有设备都将跟手机一样,从过去的单一功能,变成连接人和整个互联网服务的界面。

以下为,余凯演讲实录:

各位观众朋友下午好,我的演讲题目是跟互联网,同时也跟人工智能息息相关。为什么这么说呢?因为互联网天生就是一个大数据的业务,我们今天拥有的数据可以说是多到每天我们产生的数据,大概是整个国家图书馆的20倍的这么一个量。在这么一个大数据的情况下,实际上我们知道关于每一个用户,甚至国家经济运行的状况,很多很多方面的信息,从而做智能的预测。所以百度今天的信息系统研发是跟大数据相关,也是跟人工智能技术相关的搜索引擎,它天然的就是一个人工智能系统,为什么这么说呢?它一边通过免费的服务,但是也获得了很多用户的数据。在另外一边,我们每天去做很多决策,比如说推荐什么样的商品,展示什么样的广告,展示什么样的网页。做很多这样决策,使得这种数据能够实现它的商业价值。

大数据使机器越来越懂你

从数据到价值之间我们需要应用非常多的人工智能的技术,包括机器学习,包括图象识别,包括语音识别。那么我们看一个通用的人工智能系统,当然我们今天在学术界对什么是人工智能有很多的争论,比如说强人工智能或者是弱人工智能。但是对于一个典型的人工智能,它通常会有感知、理解、决策这么几个部分,大家是共同认同的。比如说感知,就是像人的五官一样能够感知环境,能够看得见。通过理解可以知道一些事物的意义是什么,在理解的基础我们可以做很多决策。

目前市场上充斥着各种各样的智能产品,我们百度也在做。我们想一个人工智能必须通过经验不断演化,比如说我们看一个互联网服务,一个用户在用我的服务。他用越来越多的时候,我就越来越懂你,这个就是一个随着经验不断的去演化。这里面一个智能核心的能力,就是它有没有这种学习。就是它随着经验的积累越来越多,它会越来越聪明,所以这是一个人工智能的核心。

我们讲什么叫经验?经验就是数据,数据就是经验,为什么我们今天讲一个伟大的时代要来临,那就是大数据的时代,是因为有了这么多的数据,那我们今天可以去构建越来越多的,具有智能能力的,有学习能力的服务系统工程。

移动互联网的发展实际上把这种大数据的能力,这种现状推到了一个前所未有的一个地步,比如说我们看到2005年,这是在罗马教皇的一个选举,很多人在等待选举的结果。我们看到8年以后新的一届教皇选举,每个人的手持设备都能随时随地在产生数据,甚至你没有在使用它的时候,它也在产生数据,比如说加速度传感器会知道你在跑,还是在睡觉。比如说GPS的传感器,即使你不用它,我们也知道你在什么地方。

所以我们看到移动互联网带来了一个万物互联的时代,不光是连接你的手机,人的话还可以连接到可穿戴设备,比如说刚才讲的汽车,汽车会越来越联网。所以万物互联,每一个连接都是数据的产生。那我们随之而来的就是一个数据爆增的时代,就是更多的数据在产生。对我们人工智能这是一个机会,就是大数据使得人工智能成为可能,大数据使得机器像人这样,通过不断观测数据,学习数据,去学习、分析理解数据里面的规律。

所以说我们从PC互联网到移动互联网,随之而来是一个大数据的时代。这个大数据的时代把我们引入了一个智能的社会。它不光是在云端,也有可能在你的身边。

深度学习是人工智能研究重大突破

最近十年时间,人工智能领域它最重要的一个进展就是深度学习这么一门学科,比如说谷歌,微软,Facebook,还有中国的百度在这方面都有进展。百度成立了一个深度学习研究院,也是百度历史上第一次成立研究机构。到今天百度在整个的技术研发,到产品的实际的上线跟应用方面,可以说深度学习它被应用在我们的最核心的产品的方方面面,其中最重要的4个应用领域就是搜索、广告、图象识别、语音识别。 

为什么讲深度学习技术成为当前人工智能领域最重要的突破呢?我可以分享一下,就是通过我们自己的种种实践,突破主要有四个方面的原因:

第一个原因是深度学习是模拟大脑的行为;

第二个原因是从统计和计算的角度来讲深度特别适合大数据。传统人工智能的方法数据到了一定的规模,它的效果不再增长,但是深度学习效果会不断的增长,这里面是有一些非常深的统计和计算方面的原理;

第三原因是提供了一种非常灵活的建模语言,对于不同的问题它可以构建不同的模型;

第四个原因是一个思维方式的改变,就是端到端的学习。

下面我给大家举几个例子,第一个是我们将深度学习模型用于自然语言。这个可以用在很多的网页排序,我们构建一个规模达到1000亿的训练样本来学习,模型规模达1亿个参数。到今天来说,它是百度搜集排序最重要的模型。深度学习模型,使得我们能抓住不一样的词,但是它内在是有关联的。这里有一个例子,我们用的是时间训练模型,运单手写的电话号码,你看有的字符都不能分割,我们用这种LSTM模型,做联合的解码,这种效果是非常好,这个能达到90%以上的准确率。

那我们再看一个例子,用自然语言描述图片的故事。用这种技术我们可以提升我们的相似图象搜索,比如说我们用一个双层巴士的照片去搜索图象,根据它的统计信息得到的是很多的结果。把这种自然语言跟图象在一起搜索的话,那我们得到的是语义上更加相关的搜索结果。

第四个深度学习对我们是一个方法论的改变,就是所谓的端到端的学习,这里面我用语音识别作为一个实例,语音识别中间每一个过程都是一个专门的处理过程,过去用深入学习代替中间的部分,取得了非常好的结果。今天在百度,我们替换了所有的步骤,整个步骤都是端到端的,深度识别网络来做这个事情。我们获得的效益是什么呢?

这是把网络结构给解开,我们是一个双向的展示。得到的效果是什么?我们跟谷歌的效果比,我们跟苹果的效果比,我们现在是语音识别最好的,这个不是中文的语音识别,这个是英文的语音识别。

那把所有这些图象、语音,包括文字的机器翻译这些技术合在一起的话,比如说这样一个产品,像百度翻译,这是一个人脸识别应用的一个例子,今天的话用深度学习技术在百度,比如说我们在人脸识别LFW的测试上,我们跟微软,Facebook,还有谷歌去比的话,我们现在是最好一个结果。过去的几年整个图象识别的技术,随着每一年的进展,这个错误率是在快速降低。

最后我想给大家看一个更有意思的例子,这里面是一个用在教育里面的例子。因为比如说对于这个图片。(展示一位光着上半身冲浪的运动员照片)你会问他,他站在上面?我们今天的机器能够回答,他站在冲浪板上。你问他有没有穿上衣,机器会说,没有。这些都是机器生成的,这是对整个图片内容非常丰富的理解。

万物互联大趋势

整个人工智能的全貌,这是我们的一个思考,我们刚才说了人工智能,包括从感知到索引,过去搜索引擎主要是互联网去感知,现在由于移动互联网的发展,我们还从物理信息获得信息。我们可以从线上到线下,这也是互联网+的一个过程,就是说我们这个决策机制在线下也在发展,这就需要机器人,需要智能硬件,比如说自动驾驶。

这是百度的一个非常重要的项目,我们今年年底自动驾驶汽车就会在高速公路去行驶,我们改装的车的传感器可以说是武装到了牙齿,非常先进的传感器,实际上360度各个方面,它最远距离能达到距离车头200米的范围。

当然在中国研发自动驾驶的技术它其实有特别的国情。我有时候开玩笑,如果在中国开发自动驾驶的技术,这个肯定是全世界的东西。

这个是自动驾驶技术一个核心的技术型建设,它是一个三维高精度地图。这个三维更精度地图它不光是对精确位置的定义,还有对语义的理解,比如它会标注什么地方是路,什么是护栏,什么是旁边的树木,什么是房子,什么是电线杆,包括路上的道路线,它是一个语义全方位丰富的理解。 结合人工智能的技术对道路上面的车,各种实时的状况和实时场景的理解。

我们也认为自动驾驶它走的是一个渐进式的发展道路,到未来应该是人车一体的这么一个闭环。

最后我想说从万物互联到万物智能三大趋势,我们认为5到10年有三大事情:

第一个事情所有的设备都有智能传感器。

第二个事情所有设备都有云端大脑。

第三个事情就是所有设备都从过去的单一功能,变成连接人和整个互联网服务的界面。比如说我们过去看到的手机完成了这么一个过程,今天手机打电话是很少的功能,大部分是各种各样的服务,那么你这样看的话,其实所有的设备它最终都是一个广义的集结系统,它有机器人系统的精髓,这个精髓是什么呢?就有感知,有理解、有决策。

(编辑 胡欣欣)

X

分享成功