投稿问答最小化  关闭

万维书刊APP下载

最新研究表明:Turnitin AI检测模型对非英语母语者无显著性偏见

2023/12/19 10:02:31  阅读:36 发布者:

以下文章来源于曼菓 K12 ,作者小曼

最新研究测试表明:Turnitin AI写作检测模型对非英语母语者没有产生显著性偏见。

Turnitin深知检测错误可能给师生造成的负面影响,不仅会损害学生的声誉,还会给教师增加额外的调查工作。因此,Turnitin也在不断测试和优化检测技术,尽可能地降低误报的发生率。

误报是指错误地将人类撰写的文本识别为AI生成的文本。目前,对于AI检测值低于20%的文稿,Turnitin用星号提醒教师该分数仅供参考,数据不一定准确。对于AI检测值高于20%的文稿,误报率将低于1%

除了对误报的担忧,教师也十分关心AI写作检测功能是否会对非英语母语的写作者产生偏见。为了回答这个问题,Turnitin使用开放数据集的样本进行了进一步的测试。

测试过程

Turnitin根据语言背景将开放数据集的样本划分为L1 English(英语母语写作者)和L2 English(非英语母语写作者),并根据字数将文稿分为不满300字或300字及以上。经授权,Turnitin从上述不同组合中最多抽取了2000份样本。(请注意,这些样本并不包含在训练AI写作检测模型的数据集中,仅用于本次测试。)

测试结果

L1 English代表英语母语的写作者

L2 English代表非英语母语的写作者

FPR代表误报率

测试结果表明,对于300字及以上的文稿,L2 English非英语母语组和L1 English英语母语组之间的误报率差异仅为0.1%,不具备统计显著性。这说明Turnitin AI检测模型对非英语母语的写作者不存在显著性偏见。此外,对于太短的文稿,误报率的差异更大,再次验证Turnitin AI写作检测功能在长文稿中的准确性会更高。

结论

经测试,若检测文稿的字数在300字至15000字之间,Turnitin AI写作检测模型并不会对非英语母语的写作者产生显著性偏见。随着大语言模型不断进化,Turnitin将继续改进AI写作检测能力,为教育者提供安全可靠的解决方案。

本文源自首席机器学习科学家David

转自:“学术猫”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com