“LLMs 将继续存在,” 英国雷丁⼤学环境科学教授杨洪写道,“以下是我如何将它们融⼊教学⼯作之中。”2022 年 11 ⽉底,我的⼤学教学⼯作突然被⼀个不速之客打乱——ChatGPT,这是⼀个⼤型语⾔模型(LLMs),在庞⼤的语⾔数据集上进⾏训练,可以总结、翻译和创造⽂本。就像很多⽼师⼀样,我对该⼯具最⼤的担忧是,学⽣在写论⽂时利⽤它作弊。我理解确保学⽣作品的原创性和避免学术不诚信的重要性。
⼀些美国⼤学,如美国华盛顿⼤学,已经将 ChatGPT ⽣成的⽂本纳⼊他们对抄袭的定义中,⼀些亚洲⼤学,如中国的⾹港⼤学,已经完全禁⽌使⽤ ChatGPT,但许多机构并没有明确的指导⽅针——包括我任职的英国雷丁⼤学,我在那⾥教授空⽓污染的相关课程。我不认为我们可以完全禁⽌ ChatGPT,因为⽬前的技术很难检测出由模型编写的作品。
我的学⽣很快就会毕业并开始⼯作,他们的雇主可能会要求他们与⼈⼯智能模型⼀起⼯作,如果他们不知道如何正确使⽤这些⼯具,就可能会阻碍学⽣的发展。我们⽆法阻⽌学⽣使⽤计算器或互联⽹,我们也⽆法阻⽌他们使⽤ ChatGPT。最好的办法是了解这个⼯具,并尝试将其融⼊教学之中。
在以往的教学⼯作中,我会给我的学⽣布置⼀份⽂献综述。今年,为了避免抄袭并⿎励创新,我要求学⽣以⼩组形式在校园内收集空⽓质量数据。
然⽽,学⽣们依然是使⽤统计⽅法独⾃分析数据,撰写个⼈论⽂。当然,很多学⽣对创建项⽬并不熟悉。有些⼈努⼒想出⼀个合适的⽅法来评估⼆氧化碳排放——于是,我建议他们使⽤ ChatGPT 来帮助他们设计项⽬,这个模型可以概括出⼏个步骤:从确定⼀个地点,到选择⼆氧化碳监测设备、把设备设置好、收集和分析数据,以及展示和传播结果。
当涉及到科学分析和撰写论⽂时,学⽣们做了所有的⼯作——但他们也学会了⼤型语⾔模型(LLMs)是如何产⽣科学想法并帮助规划⼀般实验的。我的学⽣学习环境科学或地理学,所以⼤多数对如 R、Python 等编程语⾔并不是很熟练,我有时在调试这些语⾔的代码时也会遇到麻烦,⽽ ChatGPT 可以帮助我们解决这个问题。
例如,在我的指导下,学⽣们使⽤ ChatGPT 创建 R 代码,进⾏他们的统计学检验,并分析校园内⾃然(如草原)和⼈为(如教室)场所之间的⼆氧化碳⽔平差异。我发现,只要提示是简单明了的,机器⼈就会⽣成有效的代码。
为了确保我的学⽣能够更好地理解(我提供的)材料并避免抄袭,我还改变了我的评估⽅法。他们不再只是写论⽂,⽽是需要做 10 分钟的⼝头报告,分享他们的发现。这种⽅法不仅减少了抄袭的⼏率,⽽且使评估过程更具互动性和吸引⼒。我向每个学⽣提供个性化的反馈,指出他们需要改进的地⽅,并⿎励他们进⾏原创性思考。
尽管 ChatGPT 能给我们带来很多好处。但事实证明,它对学术机构的多样性和包容性有负⾯影响。
例如,在⼀次关于温室⽓体的讲座中,我要求 ChatGPT 提供⼀份关于⽓候变化的重要书籍及其作者的清单。为了避免任何与种族和语⾔有关的偏⻅,我在提示(prompt)中加⼊了“不分种族和语⾔”(regardless of race and language)。然⽽,ChatGPT 的所有建议都是⽤英语写的,10 位作者中有 9 位是⽩⼈,10 位作者中有 9 位是男性。
使⽤来⾃出版已久的书籍和⼀些⽹站的信息训练 LLMs,可能会导致对边缘社区(marginalized communities)的观点的偏⻅和不准确的表述,同时放⼤那些有权⼒和地位的⼈的声⾳。Galactica 是科技公司 Meta 发布的⼀个 LLMs,由于它产⽣了种族主义相关的内容,⽽不得不被停⽤。由于⽤来训练这些 LLMs 的⼤部分数据都是⽤英语表达的,所以它们在这种语⾔中表现最佳。
LLMs 的⼴泛使⽤可能会加剧特权群体的过度代表性,使那些已经代表性不⾜的⼈进⼀步被边缘化。
这⾥有⼀些关于如何在课堂上有效使⽤ ChatGPT 的建议:1. 花⼀些时间学习和练习在 ChatGPT 中输⼊提示语。2. 使你的(教学)评估多样化,如增加⼝头报告,以避免抄袭。3. 意识到 ChatGPT 加剧不平等的⻛险。4. 确定明确的⽬标:对你想通过 ChatGPT 实现的⽬标有⼀个清晰的认识。
5. 测试和完善提示语:⽤ ChatGPT 测试提示,并根据结果完善提示。重复这个过程,直到达到预期结果。6. 与他⼈⼀起编辑:与其他讲师和你的学⽣合作,审查和完善提示语。