谁还会说满语? 人工智能技术已介入语言资源保护

21世纪经济报道 21财经APP 卢常乐 苏州报道
2018-10-19 20:01

当前,在我国城市化快速发展的进程中,人口流动在推动地方经济发展的同时,也客观上不同程度地使不同地方的语言资源在悄然间流失,以地方方言为首的语言资源保护迫在眉睫。

据2015年启动的“中国语言资源保护工程”提供的数据指出,在中国的130多种语言中,有68种使用人口在万人以下,有48种使用人口在5000人以下,其中有25种使用人口不足千人,满语、赫哲语、苏龙语等使用人数不足百人。

为防止我国语言资源的悄然流失,留存与保护正在成为社会各界努力的方向,并在当前逐渐形成了政策与市场两个关键推动力。

2018年初,教育部发布了《中国语言资源保护工程2018年度汉语方言调查工作的通知》,指出在全国范围内共设立汉语方言调查点279个,全力推动由教育部和国家语委于2015年5月启动的“中国语言资源保护工程”的落地与实施。

据了解,目前全国已有超过350所高校和科研机构,约1000个专家团队、4500多名专业技术人员、3346位发音人参与了该工程的建设。截至目前已经完成该计划1500个田野调查的2/3。

与此同时,以科大讯飞为代表的人工智能技术也正在成为当前我国语言资源保护的重要市场补充力量。

10月18日,科大讯飞正式启动了苏州方言的保护计划,在此之前科大讯飞已经实现通过人工智能技术将苏州、上海等地使用的吴语方言进行收集,结合语言识别与合成技术完成了苏州方言完整的复制工作。

科大讯飞消费者事业群市场总监李强军告诉记者,吴语作为我国重要的方言之一,也正在面临着成为濒危语言的可能,在近7400万吴语的总人口中,有近3成的18岁到25岁成年人不能够熟练地运用吴语进行交流,在这种语言资源流失的现状下,通过人工智能技术,将方言保存下来就显得十分必要。

21世纪经济报道记者了解到,目前人工智能语音识别技术正在成为我国语言资源的重要保护手段,自2017年10月24日科大讯飞发布“方言保护计划”的近一年时间内,已经实现了粤语、四川话、东北话和苏州话等在内的23种方言语音的识别。

事实上,语言资源的流失并不仅是中国当前面临的难题,在全球目前已知的大约6700种语言中,其中有约40%已经成为濒危语言。据联合国教科文组织的统计显示,全世界现有6000多种语言中,有96%的语言目前只被4%的人使用。现在这些乡音正以每两周消亡一种的速度在减少,预计本世纪末90%的语言可能消亡。

而为了挽救这些濒临消亡的语言,各国各界也都在争分夺秒。其中澳大利亚政府上世纪70年代便规定在全国实现多语教育制;美国也出台专门保护原著民语言的相关法案,支持原著民语言的项目。

在人工智能技术介入语言资源保护之前,中国也先后出版了汉语方言地图集、音档及系列词典,《中国的语言》及少数民族语言的词典和参考语法等。

李强军告诉记者,虽然人工智能技术介入语言资源保护才仅仅是个开始,但相信未来随着人工智能技术的不断成熟,会有越来越多的方言能够被留存与保护,成为当前各地保护语言资源的重要支撑力量之一。

(编辑:吴红缨)