用ChatGPT作弊,老师能发现吗?

作者: 徐锐

来源: 中国科学报

发布日期: 2024-06-28 08:31:30

一项研究发现,使用ChatGPT生成的大学考试答案有94%不会被检测出是由AI生成,且得分往往高于学生真实答案。研究指出,AI技术的发展给教育评估带来挑战,尤其是在无监督的居家考试中。

一项6月26日发表于《公共科学图书馆-综合》的研究发现,在使用ChatGPT生成答案的大学考试答卷中,有94%不会被检测出是由人工智能(AI)生成的,而且这些答案往往比学生真实的答案得分更高。如今,AI技术的兴起和发展,给教育部门出了一道难题,即学校许多形式的评估,都是在没有监考的情况下完成的,而学生很可能利用AI答题。尤其在新冠疫情后,对无监督的居家考试的依赖越发严重。

现场考试使学生很难使用AI作弊。

为此,英国雷丁大学的Peter Scarfe和同事使用ChatGPT生成了雷丁大学心理学本科生学位考试5个模块共63个评估问题的答案。由于学生们是在家里参加这些考试的,所以他们可以查看笔记和参考资料,甚至可能违反规定,使用AI帮助答题。AI生成的答案和学生真实的答案一起被提交,其中前者平均占答卷总数的5%。

阅卷人并不知道他们检查的答卷中有33份来自假学生,而这些假学生的名字也是由ChatGPT生成的。

在所有模块问题的答案中,只有6%的AI生成答案被标记为可能不是学生自己的答案。而有一些非AI生成的模块问题的答案则被标记为存疑。“尽管各模块之间存在一些差异,但平均而言,AI生成的答案得分高于学生提交的答案。在AI提交的对63个问题的答案中,得分超过学生的概率为83.4%。

”Scarfe说,“但AI当前还难以进行更抽象的推理和信息集成。”研究人员表示,他们的工作是迄今同类研究中规模最大、最可靠的。尽管只研究了雷丁大学心理学本科学位的工作,但Scarfe认为这是值得整个学术界关注的问题。“没有理由认为其他学科领域不会有同样的问题存在。”Scarfe说,然而从源头上解决这一问题几乎是不可能的。因此,必须重新考虑评估内容。

UUID: aa099949-0301-45d7-8100-d8d5032e6006

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中国科学报公众号-pdf2txt/2024/中国科学报_2024-06-28_用ChatGPT作弊,老师能发现吗?.txt

是否为广告: 否

处理费用: 0.0025 元