网易有道破局AI+教育初阶:多产品线补全数据短板,辅助走向智能化

21世纪经济报道 21财经APP 骆轶琪 广州报道
2019-08-02 17:24

如何用线下补足线上,在不改变教育习惯基础上让教育智能化,是行业共同思考的问题。

随着人工智能技术进一步渗透到生活中,用语音转换文字代替手动输入、实时翻译解决不同语言沟通等应用场景也越来越多。

基于这些大数据基础之上的教育类智能化业务,也走上了发展快车道。在近日举行的全球移动互联网大会(GMIC)期间,网易有道技术总监林会杰指出,对于AI技术来说,目前为止还是以数据驱动的方式。当具备一定的推理和知识的能力,AI就能够辅助人类做一些决策,甚至替代一些重复性、琐碎性工作,比如说学习作业过程中一些重复性练习。

“在教育领域我们也希望能够借助AI技术、机器学习的办法,从教学的练、测、评各个环节提升他们的效率,改造传统的学习方式,这是美好的设想。”林会杰在接受21世纪经济报道记者采访时表示,当前AI+教育仍处在十分初级的阶段,也带来一些落地难的困惑。这主要体现在,数据采集尚不够完善;学生通过AI+教育是否达到了更好的教学效果,尚没有理论基础提供支持;以及教学标准化的衡量等问题。

“让用户不改变传统教育和学习习惯,将技术手段应用进来,是AI+教育的重要话题。几千年来中国的教学方式没发生根本性变化,这几年AI技术的发展也无法将用户习惯完全颠覆。我们在思考如何用技术手段在不改变学生传统使用习惯的基础上,更好赋能教育行业。”林会杰称。

有道的AI基因 

最早期,有道的业务从搜索引擎业务入手,随后孵化出词典、云笔记等工具类应用,紧接着发现,其中绝大部分这些工具产品的用户,实际上与教育类应用诉求有极强相关性。2014年,有道开始关注在线教育业务。

其前身是有道学堂,2016年更名为有道精品课,专注K12的在线教育。在实践过程中有道发现,可以进一步提升效率和技术能力。随后开始将OCR(图像识别)等相关技术应用在课堂中。

林会杰的研究方向是自适应学习,也是AI应用到行业中一个重要技术方向。他向21世纪经济报道记者表示,自适应学习中,一个重点是数据。

这其中包括两部分,其一是知识点图谱数据,需要通过教研实践中,借助建模的方式进行采集,其二是学生在学习过程中产生的诸多数据。

“现在很多公司的应用只是聚焦在线上渠道的数据突破和构建上。但有道是发现,学生本身的数据有很大比例实际上来自线下,我们目前较早关注到如何将线下数据采集起来,并与线上环节的数据结合在一起。从而更好提升的效率和能力。”他进一步解释道。

而对比来看,人类学习和机器学习有一个共同点:人类是通过周边环境事件中探索,总结出来的相关推理和认知;而机器是从数据中学习相关规律,总结知识,从而有基础推理能力。

基于这一特性,有道在题库类产品的研发过程中通过与各学科、各学龄阶段的老师进行合作,将这些老师提出的知识点与有道系统内的题库进行标签化并比对,然后形成基于老师自身教研系统设立的知识图谱题库。“目前我们的题库容量超过5000万,覆盖K12全学龄段、全学科。”林会杰表示。

而有道旗下的多块软硬件产品,包括词典、云笔记、翻译、精品课、智能笔等产品,其数据来源可覆盖全学龄段人群,采集的数据量与维度都为AI模型的进阶训练提供了足够多的“燃料”。 

如何赋能教育 

不过,与零售这种较早实现智慧化的行业不同,教育行业多年来的发展,以及过往主流教授路径的特性,决定了教育与AI的结合也面临一系列需要克服的难点。

林会杰指出,一方面,教育行业已经有几千年历史,学生和老师的角色没有发生太大变化,大家还是习惯纸笔交互的方式进行学习。

“打一个比方,整个教育行业就像是稳健行驶过程中的汽车,我们希望用AI技术使得这个车子换一个轮胎、换更好的发动机,使它发展更好,但是又不能为了更换轮胎、发动机,而使教育行业完全停滞下来。所以我们现在要做的事情像是开车换轮胎,让技术渗透教育,不断去适应传统教育的过程方法,让AI技术更好地提升教育效率。”林会杰如此表示。

另一方面,AI+教育中,数据仍是目前发展较为欠缺的要素。具体来说,学习过程中老师和学生都会积累大量数据,但目前绝大部分数据都是留存于线下,只有将这些线下数据采集到线上,通过不同类型的数据集不断训练AI模型,才能使AI模型更成熟,更能帮助达成学习中所需的个性化服务。

“得数据者得先机,如何更好地采集数据、处理数据、从数据中学习更好地规律,是当前整个AI+教育行业的重点。”他这样说道。

基于这些观察,有道团队总结了AI+教育过程中的金字塔式基本目标,最底部是教育内容数字化,第二层是教育过程自动化,最上层是智能化教育。通过前两个阶段,可以将传统的线下教学或学习过程中生产的各种数据与线上数据有机结合,形成更结构化的数据表达。基于这些数据的收集、分析、处理和认知理解,我们才能实现教学方式智能化,针对每位用户的不同情况从而有机会做到真正的因材施教、个性化教学。

“我们从底层数据收集开始,通过OCR、ASR(语音识别与合成)、文本处理等系列技术,将传统的纸质化材料和内容进行数据化处理和理解。基于抽取理解出来的数据和资源,创造更多个性化应用,比如直播课堂中,以数据理解和采集为中心,后续可以提升互动的效率;在自适应学习领域,我们可以根据丰富的数据辅助,实现更精准个性化推荐。”林会杰续称道。

正在快速到来的5G时代,也将为AI+教育提供进一步赋能。林会杰向21世纪经济报道记者表示,对在线教育方面,5G首先可以进一步提升直播大班课的速度,以往传统大班课直播,延迟甚至会达到5-30s,课堂体验很差。有道精品课自研了一套直播系统SODA,能保证多人情况下300-500毫秒的低延迟,互动时差更像真实课堂。借助5G技术,降低延迟更有保障。

另外,5G还会创造更多交互可能性和内容维度,比如3D、VR、AR等,从而全方位促进在线教育向智能教育的过渡。

(编辑:许望)