为什么前后两次查重,有新的重复?
2024/4/2 13:55:41 阅读:22 发布者:
今天要啃的第一个硬骨头:为什么前后两次查重,有新的重复?
具体来说,我第一次查,某一句话没有被标为重复,但我第二次查,怎么就标为重复了呢?你们这不对啊!
首先,我们要确认一点的是,前后两次查重,只要文章完全一样,系统查重结果肯定就一样。除非两次查重间隔时间太长,导致数据库有了变化,那么查重结果也就不一样了。
然后,如果前后两次文章已经有明显的改动,那就会出现重复情况的改变:比如本来一句话第一次查重是不被标为重复,但第二次查重时就重复了,或者第一次被标为重复,第二次就莫名的不重复了。出现这种情况的原因是查重系统的检测结果是根据全文的改变而改变的,某些语句的改动也会影响其它语句的查重结果。
具体原理如下:
1. 判断一句话是否重复,是需要看文章的其它部分。比如有两句话A和B,以前B没有检查出重复,那么A也有可能没有被检测出重复,但如果句子B改变了,那么也会影响句子A(即使句子A没有任何改变)是否被标为重复。
2. 在第一次查重时,某篇文献还不足以作为一个重复源,也就没有显示跟这篇文献有重复的句子。但是文章修改了以后,这篇文献足以作为一个重复源了,那么就会出现以前不是重复的句子现在变为重复。
总之,iThenticate查重系统并不是简单的单词逐一比对,这个是我们很多小伙伴的误区。这种检测方法更能检测和防止抄袭。当然,它也是一把双刃剑,有的时候也会导致查重过于严格和造成很多不合常理的地方。但小伙伴们也不要过分担忧,一篇文章是否能通过重复率检测,出版社和编辑是有自己的经验的,他们不会只因为一个数值就做出最终判断。
转自iThenticate英文论文查重微信公众号,仅作学习交流,如有侵权,请联系本站删除!