宋明家：生成式AI世代的学术诚信

“生成式人工智能”（generative AI）ChatGPT在去年年底的开放使用，仿如在教育界投入震撼弹，不管是学生、老师或校方管理层，大家都在讨论这天使和魔鬼并存的ChatGPT。

个人最近的一个经验，应该也是许多教授的共同切身体验：在审批某学生的年终作业报告时，发现这作业存在一些格格不入的结构和写法；我找出学生过去的报告，显然这份作业书写水平与风格近乎完美，和他早期缴交的报告相差很大，而Turnitin查重软件报告显示网络资料“相似性指数”（similarity index）只有1%，属于健康水平，意味著无剽窃问题存在。

在人工智能时代的教育界，老师们如何界定抄袭的定义？学生应该如何使用生成式AI工具来提升学习？如何应对学生使用AI工具抄袭的问题？学习和评估模式应作什么改变和改善？AI检测工具的前路何在？此文蜻蜓点水地略述其中争议。

抄袭的定义

在AI世代，我们应该如何定义“抄袭”？ChatGPT未面世前，许多学生已广泛使用诸如Grammarly、Quillbot等改写文字、提供单词或句子的工具，但这些工具不“生成”新文本，而是基于学生自己写好的文本；只要学生适当重写和总结（paraphrasing & summarizing）或引用（quoting）资料来源的内容，以及注明所引用观点的出处（也就是引述citation），就不是抄袭。如学生使用ChatGPT生成作业，有做到以上几点，然后再声明那一部分是由AI生成的，就不算抄袭。但由于许多大学还未完善制定相关政策，这种声明也由教授各自决定要不要实行。

但即便课堂里多了此要求，老师们也无法有效侦测谁使用AI工具。简言之，这条规只适用于原本具备高道德、良好学术伦理的学生，对那些想偷懒的学生是没辙的。

AI内容检测工具

天使和魔鬼并存的ChatGPT，可以成为免费补习老师，但它不是所有科目都在行，也会仙家乱给答案。对老师而言，在学校还未制定完善政策之前，学生的滥用AI抄袭行为是难以被发现的。目前市面上有许多用以检测AI生成文本的检测工具，例如：Compilatio、GPT Zero、Turnitin、Zero GPT都是常见的，但学术界普遍认为它们的功效极低。

德国柏林应用科学大学（HTW Berlin - University of Applied Sciences）研究人员曾评估包括Turnitin、GPT Zero等14种AI检测工具的功效，发现这些声称能辨识ChatGPT生成文本的AI检测工具效率极低；有些内容只要稍加修饰，就能骗过AI检测工具；迄今包括来自美国马里兰大学（University of Maryland）和南非的南非大学（University of South Africa）等研究团队的研究报告，都得出类似结果，即AI内容检测器尚未准备好抓包抄袭行为。

路在何方？

约17年前，当笔者任职的大学开始使用Turnitin来检测学生作业时，就面对了许多技术上的难题；其中主要因素是Turnitin只能标出相似度高的文字，抄袭与否就全由教授决定，不同系或学校对这些尺度也宽严不一。但经过一些时日的磨练和经验，加上Turnitin系统逐渐加强改善，教授们后来都能掌握个中要诀，以提升检测功效。

当前的生成式AI工具和AI检测软件，也处于这种过渡期；学生如何使用AI促进学习、老师对AI检测工具的了解和应用、校方制定的相关课堂政策，这些都还处于磨合期间。

在与AI并进化的过渡期，教授、老师们也该多动动脑筋，设计那些无法使用生成式AI来完成的作业和考题。这是当务之急。在识别AI生成文本方面，AI检测工具和技术都还不够完善，但我们也无法禁止学生使用AI；老师和校方能够做的，是强调“遵守道德标准”准则和实践的同时，也以身作则地在课堂展示如何有效的、凭籍学术伦理，来善用AI工具，协助提升他们的学习。

（本文为2023年华教节特辑系列文章，今年特辑主题为“日常生活中的政治参与”以及“人工智能时代的教育与革新”，由林连玉基金组稿。）