大学物理是理工科学生的基础必修课程,但也因为有一定的难度,令很多学生望而生畏。研究人员提出了用 AI 算法预测,哪些学生物理课有挂科风险,好让老师更好地进行教学指导和调整教育资源的分
配。
不得不说,算法的预测能力越来越强,小到预测夫妻是否会吵架,大到预测地震洪水等何时发生。现在,算法甚至连你的物理课会不会挂科,都能预测出来。这是最近西弗吉尼亚大学和加州理工大学的学者们,在 arxiv.org 上发表的一项最新研究。他们发表了一篇有趣的论文:《使用机器学习来识别物理课上,最有挂科风险的学生》。
论文中表示,通过机器学习算法,可以评估物理基础课中学生的毕业成绩,该预测模型将学生分类为成绩 A、B、C、D、F 和 W(退选)。注:美国大部分院校采用的评分等级与百分制分数对应规则大约为:A:90+;B:80+;C:70+;D:60+;F:不及格;W:退选课程(Withdrawal 的简写)。
对很多理工科学生来说,大学物理的难度系数与高数相当,是最让人头秃的科目之一。国外一项研究显示:曾主修工程和科学(统称为 STEM)但最后转专业,或者没能拿到学位的学生中,其中一半的人就是因为物理和数学等主修课程,实在是太难。
因此,西弗吉尼亚大学和加州理工大学的研究人员提出,用 AI 算法来拯救这些学生吧。他们认为,用机器学习算法,来识别哪些学生有挂科风险。这样教师就可以根据预测结果,有针对性地进行指导,从而提高学生的通过率,也能及时了解他们的掌握情况。
研究人员从来两所大学的抽取了三个样本,来训练预测学生表现的人工智能算法。这些样本数据包括了:学生的 ACT(美国高考)成绩、大学 GPA 、物理课上收集的数据(比如课后作业成绩和考试成绩)。其中,样本一和样本二来自于美国东部一所大学的物理科学和工程专业的学生。
研究中,采用随机森林机器学习算法,来预测学生的入门物理学课程最终成绩。算法最后会将学生分为获得 A、B 或 C 的学生(归为 ABC 类学生)和获得 D、F 或 W 的学生(归为 DFW 类潜在挂科学生)。为了了解算法的性能,他们将数据集分为测试和训练数据集。训练数据集用于开发分类模型,以训练分类器。测试数据集则用于表征模型性能。
经过模型调整与验证,研究者得出了预测结果,但准确率实在不太乐观……模型在三个样本集的表现他们指出,在对整个样本预测结果中,女性和少数民族学生较多的样本,DFW 准确性较低,他们指出,这需要对人口统计学进行模型调整。在第一个样本上训练的算法,预测「DFW 类学生」的准确性仅为 16%,研究人员分析,这可能是因为训练集中,成绩为 DFW 的学生比例很低(12%)所致。
样本一中,模型的最佳表现准确度仅仅达到 57%,也就是仅比随机概率好一点点而已。
面对这个结果,他们认为:对于教育工作者和正在努力学习的学生来说,此类机器学习分类模型,可能是一个强大的工具,可以更好指导教育干预和教育资源的分配。但是,也有批评者认为,像这样的技术,可能会带有偏见或误导性的预测,给学生造成伤害。一直研究表明,即使接受了大型语料库的训练,人工智能在预测复杂结果方面,仍会存在偏差问题。
此前,亚马逊的内部 AI 招聘工具,就因为表现出对女性的偏见,而被停用。因此,人们也担心,这种成绩预测算法,不仅不能起到提高 STEM 学生保留率,反而会加剧不平等现象。