论文查重:重复率高低的影响因素有哪些?
2024/5/13 16:09:23 阅读:36 发布者:
为了维护学术诚信,避免抄袭、剽窃、一稿多投等学术不端行为的发生,无论是高校还是出版社,或者别的科研院所都使用论文查重系统来对论文进行检测。而论文查重系统虽然功能强大,但是也受到算法、比对数据资源,以及其他各种因素的制约。那么,影响论文查重查重系统检测结果的因素有哪些呢?
一、查重系统的局限性
1)不同的查重系统,比对数据库文献资料不同,算法也不一样,所以查重系统的选择决定了重复率的高低。所以,即便是同一篇论文,选择不同的查重系统来查重,检测结果会有很大的差别。
2)比对数据库差异。不同的查重系统收录的文献资料不一样,进行比对时,有的能查出来,有的可能会有遗漏。所以、比对数据库中文献资料越丰富,检测结果越准确。
3)算法不同。不同的查重系统判定重复的规则是不一样的,就知网和维普来说,知网的文献资料比维普多,但是,很多时候维普的检测结果比知网还高,主要是因为维普的算法比较变态,除了文字比对、关键字一样也会标红。
4)检测时间。查重系统的比对数据库随时更新的,同一篇文章的查重结果,可能因为查重系统比对数据库的更新而导致重复率变高。
二、论文本身的问题。
1)复制过多。信息技术发展,文献资料获取的渠道更多更便捷,学术裁缝也越来越多,缝缝补补就能出来一篇论文。这样的文章重复率肯定是会比较高的。所以,用自己的语言来表达研究的发现和创新,自己认真书写才是降低重复率的根本。
2)文档格式。论文查重时需要按特定的格式来提交,一般doc、docx、txt、pdf格式的文档都可以检测,但是pdf查重系统需要转换成word格式后才能检测,而转码的过程容易出现误差,影响检测结果。
3)论文格式。引用格式不规范,正常引用的内容也会计算重复;还有目录、参考文献等内容在格式正确的前提下都是不参与检测的,如果这部分格式不正确,系统就没法排除,从而这部分也会参与重复率计算。
4)论文字数。查重率是由相似字数除以论文的总字数得到的,如果论文的总字数或相似部分字数内容有变动也会导致最后的重复率变化。
三、自建库功能。
有的高校有自己的自建库,有的出版社也有,自建库中的内容个人查重的时候可能有,也可能没有。如果最终检测的时候机构选择了自建库,而这部分内容个人查重检测时候没有就会导致最后的查重出现误差。
转自微言微学微信公众号,仅作学习交流,如有侵权,请联系本站删除!