实测!大模型迎战高考语文

合规科技冯恋阁,郭美婷 2023-06-07 19:09

南方财经全媒体记者 冯恋阁 21世纪经济报道记者 郭美婷 广州报道

6月7日,高考正式拉开序幕。临近中午,在高考作文题目公布时,“AI考生迎战高考语文”的内容也出现在各大APP中。1291万名人类考生正“千军万马过独木桥”,“赛博考生”——大型语言模型在面对试题的时候发挥会更好吗?

南方财经全媒体记者以新课标I卷为例,对ChatGPT、文心一言和通义千问三家大模型进行了实测。

新课标I卷试题的试题内容是:“好的故事,可以帮我们更好地表达和沟通,可以触动心灵、启迪智慧;好的故事,可以改变一个人的命运,可以展现一个民族的形象......故事是有力量的。以上材料引发了你怎样的联想和思考?” 

阿里通义千问以一自然段一个故事的形式,表达了自己对题目的理解和感想。

ChatGPT的《故事的魔力: 改变命运,展现形象》则以简答题的形式,分论点阐释“故事的魔力”。

 百度的文心一言的《用好故事讲述中国力量》同样“引经据典”举出了许多例子。

事实上,ChatGPT这类大型语言模型在教育领域的实践中的应用早在高考前就已被关注。

3月,在GPT-4 发布时,OpenAI同时发布的《GPT-4 Technical Report》就介绍,GPT-4在多个考试展露出较好的表现。 

4 月,德国帕绍大学学者发布了一篇论文《AI, write an essay for me: A large-scale comparison of human-written versus ChatGPT-generated essays》,讨论AI大模型是否能写好议论文。这个研究构建一个评分标准并聘请了100余位高中教师对大模型生成的文章内容进行评分。评分结果显示,类似ChatGPT 的模型在生成议论文方面优于人类。

“当学生想要最大化他们的论文成绩时,他们可以依靠 ChatGPT 等人工智能模型的结果轻松实现。然而,这不是也不可能是教育的目标。”研究者在结论中指出。

研究者认为,ChatGPT与计算器类似,在教育的不同阶段应采取不同的态度。以计算机为例,通用的方式是,低年级学生应该避免使用计算器,锻炼良好的算术技能,在进入高年级后,具备完备计算思维的学生应该被允许和鼓励使用计算器。

“教育培养的是学生思考问题的能力。”中国工程院院士、清华大学计算机科学与技术系教授郑纬民在此前接受21世纪经济报道记者采访时同样表达了相似的看法。他指出,在教育的初期,应该着重锻炼和培育学生的计算思维。在学生已经完全理解了问题的分析、解决过程和思维逻辑后,可以解放双手让ChatGPT帮忙解决一些简单的问题。 

北京师范大学法学院博士生导师、中国互联网协会研究中心副主任吴沈括则指出,ChatGPT这类大型语言模型对知识的汇聚、转化和传播都有积极影响。在知识汇聚上,大型语言模型能够汇聚海量的信息内容,将极大丰富教育的信息素材;在知识的传播上,大型语言模型也将丰富成果的应用场景和社会影响。“总的来说,在做好各类风险预判和防范工作的情况下,无需过度抗拒和担忧大模型走入校园带来的影响。”他指出。 

不过,从理论走向实践,ChatGPT及类似模型在教育领域的应用一波三折。 

早在去年12月上旬,洛杉矶联合学区就暂停了对ChatGPT网站的访问;纽约市公立学校、巴黎政治学院等均有推进过禁制令。 

今年5月,英国爱丁堡大学发布一份指南,引导学生使用ChatGPT等工具。其中要求,学生如果使用任何生成式人工智能工具(如ChatGPT)来协助任意工作(例如生成思路或制定计划),即使在作业中没有包含任何由AI生成的内容,仍应在作业中承认使用,并说明在何时、如何使用了这一工具。

国内,香港大学几度反转,两月内对ChatGPT禁了又放,香港科技大学提出允许学生“有限度使用”ChatGPT。

不过,6月1日,香港科技大学宣布,自6月1日起为全校教职工及学生提供GPT-3.5服务。4日后,香港科技大学(广州)宣布,GPT服务已经完成联调测试,包括GPT-4、ChatGPT的GPT服务将正式上线。

(作者:冯恋阁,郭美婷 编辑:蔡姝越)

郭美婷

记者

数字经济观察者,聚焦数据产业、数据基础制度、个人信息保护等。欢迎探讨交流!微信:gmt_lalala2017