家长和老师对GPTZero等人工智能探测器的指导

综合作者 / 花爷 / 2024-12-08 13:30

教室里有了一个新的助教，家长和老师对它的熟悉程度通常远不如学龄儿童。常识传媒(Com

教室里有了一个新的助教，家长和老师对它的熟悉程度通常远不如学龄儿童。

常识传媒(Common Sense Media)在2023年进行的一项调查显示，在12-18岁的学生中，大多数(58%)表示他们使用过流行的人工智能聊天机器人ChatGPT，而只有30%的家长使用过。

ChatGPT现在已经在各个年龄段的消费者手中——包括K-12和大学生——几个月了。常识媒体的调查报告显示，五分之二的受访学生在老师不知情的情况下使用ChatGPT完成作业，老师和家长都必须面对它在课堂上的存在。

GPTZero和TurnItIn是最受欢迎的人工智能作业筛选工具。Study.com回顾了人工智能工具和新闻报道中的信息，以了解用于筛选学生使用人工智能的课堂作业的不同技术。

人工智能检测器在检测抄袭或人工智能生成的文本方面的有效性各不相同，它们也有一定的局限性。但随着文本生成人工智能模型的进步，教育工作者和家长的检测工具也会进步。

ChatGPT在学校作业中表现如何

即使大多数学生承认，在学校作业中使用自己的批判性思维技能符合他们的最大利益，但当ChatGPT或其他生成式人工智能工具被使用时，教育工作者也很难发现。

像ChatGPT这样的当前会话人工智能模型并不完美，它们的输出可能带有一些迹象，表明某块文本不是由人类生成的——其中主要是剽窃或虚假信息。

应该使用ChatGPT来完成作业吗?向工具本身提出这个问题，它甚至会建议用户:“小心。”

“建议将ChatGPT作为一种获得灵感、产生想法或获得对某个主题的不同视角的工具，”该工具吐出，并补充说它的回答“可能并不总是准确、可靠或适合学术目的。”

虽然工程师们仍在调整ChatGPT的写作方式，但这个工具在许多其他任务上已经相当出色了。例如，数学教授表示，对他们来说，检测人工智能解决数学方程的使用比搜索文本中抄袭的句子更困难，因为数学问题可能有非常具体的解决方案。

“如果ChatGPT为你做了数学运算，那么学生们学到了什么?”纽约石溪大学(Stony Brook University)数学助理教授戴维·卡恩(David Kahn)在接受该校学生新闻机构采访时问道。

尽管存在担忧，但在美国学生考试成绩连续十年下降的背景下，大多数教师都在接受这项技术。

根据沃尔顿家族基金会(Walton Family Foundation)于2023年3月资助的一项研究，51%的教师和三分之一的12-17岁学生在课堂上使用人工智能。沃尔顿家族基金会是拥有沃尔玛的沃尔顿家族的慈善机构。

判断作业提交是否使用ChatGPT生成的最简单方法之一是是否存在明显错误的陈述。学生提交的句子是否似乎对超出课程范围的话题做出了错误的断言?可能不是学生写的。

家长或老师可能会通过仔细阅读来识别这些，但人工智能探测器也在寻找它们。

不幸的是，对于这一代生成式人工智能工具来说，生成不真实陈述的倾向在业内被认为是阿喀琉斯之踵，并被称为“人工智能幻觉”。b谷歌自己的ChatGPT竞争对手Bard甚至在公开发射的现场演示中犯了一个关于太空探索的明显错误。

独立检查和突出这些陈述可以作为与学生讨论他们在工作中可能使用ChatGPT的起点，但不应将其作为学生做了不道德事情的明确证据。就连TurnItIn的首席产品官也建议，在根据该工具的结果采取任何行动之前，与学生进行对话。

了解人工智能为什么会产生如此多的谎言，可以帮助教师、学生和家长更好地理解这些系统是如何工作的，以及用于检测它们使用的工具的局限性

当你在基于聊天的人工智能生成的每个回答中，透过礼貌和权威的声音，你会发现，很明显，该软件本身并没有像人类那样思考。

相反，像ChatGPT这样的会话式人工智能被输入数以百万计的数据点，并经过训练，在单词和主题之间建立合乎逻辑的、基于概率的关联，以最接近用户所要求的语言(无论是西班牙语还是Javascript)的句子或数字组合。

例如，展示ChatGPT强大功能的最流行的方法之一是要求它以名人的风格或声音写作。无论是作家、诗人还是政治家，ChatGPT都会从现有的、有记录的演讲或已发表的文章中提取模仿者的模式。

由于这个原因，ChatGPT在完成任务方面显示了一些特殊的结果，这些任务有可靠的、基于规则的方法来寻找答案。根据埃默里医学院进行的一项研究，它能够非常有效地编写计算机代码，甚至可以像医生一样根据症状诊断眼部健康问题。

人工智能检查员正在使用与他们试图在作业中筛选的工具相同的技术。当使用GPTZero或其他迭代时，它将生成一个置信率——文本由ChatGPT等工具生成的可能性的百分比。

GPTZero宣称准确率为98%。ChatGPT背后的OpenAI公司停止了它的人工智能文本分类器工具，因为它只有26%的成功率。

这些检查器不会对“这个文本是人工智能生成的吗?”这个问题产生是或否的回答。相反，它们是经过训练的大型语言模型，可以观察句子结构的复杂性和句子类型的变化等变量，从而提供一个分数，代表文本是人工智能生成的可能性的估计。

正因为如此，使用人工智能检查器会导致学生发誓他们的作业被错误地标记为人工智能生成的情况。一些大学实际上已经停止使用这些工具，因为担心错误地指责学生做错了。

底线是什么?无论你的孩子是在用人工智能做作业，还是你在用它来检测人工智能的使用，在没有个人验证的情况下，最好不要相信机器的输出。

凯丽·格拉斯和杰夫·英格利斯编辑。Paris Close编辑。

本文最初出现在Study.com上，与Stacker Studio合作制作和发行。

分享到

声明：本文为用户投稿或编译自英文资料，不代表本站观点和立场，转载时请务必注明文章作者和来源，不尊重原创的行为将受到本站的追责；转载稿件或作者投稿可能会经编辑修改或者补充，有异议可投诉至本站。