关于数据分享,腾讯和微软怎么看?

21世纪经济报道 藏瑾 深圳报道
2017-04-02 14:27

马化腾和沈向洋谈人工智能时代的“数据分享”。

数据是人工智能技术发展的核心要素,互联网巨头则掌握了大量的数据。

人工智能也是2017年IT峰会的核心议题,在“人工智能:中国机遇与挑战”的对话中,腾讯董事会主席兼首席执行官马化腾和微软全球执行副总裁沈向洋就数据分享问题表达了自己的看法。

以下为对话实录:

主持人吴鹰:有没有可能把数据分享出来,让这些创业公司来用?

马化腾:我们现在观察到很多的AI所谓的“大拿们”,他们更关注怎么落地,能不能把毕生研究成果能够体现出来,所以在我们内部在吸引人才的时候,往往也会说你们微信、手机QQ里面的平台数据能不能给他们用,但是事实上大家都知道,BG、部门里面的平台他们也很希望近水楼台先得月,数据就在我身边流动,我为什么不能招人先研究一把,为什么给你呢。

我们现在还处在内部怎么把数据分享出来这个阶段。

这里面还有一个很复杂的信息安全个人隐私脱敏,你不知道能不能根据数据倒推到哪一个人做了什么事情,我们要把这些处理干净才能往下一步谈。转成什么模式,数据清理用什么标签,才能给其他部门、包括外部合作伙伴怎么用。

同时有很多数据来自合作伙伴,业界其他公司,这样业界还要有一个标准,互惠互利交换,这是一个大方向,还有很长的路要走。

沈向洋:我也想分享一下在微软的工作经验,你说叫这些公司把数据拿出来,让初创公司或者其他公司去用,我觉得不见得很现实、不见得很容易。

Pony刚才解释的很好,但是我想鼓励大家,很多的数据如果我们愿意花时间、花精力做一点处理,比如Pony刚才讲的,然后让研究人员去用,完全是可以做到的。

我们微软出了两个数据集,一个是计算机视觉标准方面的集,这样可以做数据分割、物体分割。另外一个数据集是在自然语言,希望做问题问答。

大家在标准集下,不断把标准集数据越做越多。我们做的方法是用搜索引擎数据,非常小心处理过,包括很多隐私的问题等等。

拿出一些数据让大家做研究是非常实际的,完全可以做到。

 

(编辑:袁一泓)

X

分享成功