论文查重比率的计算是一个很多人关心的问题。这个数字关系到论文能否通过。我们需要明白查重比率到底是什么。查重比率就是你的论文里和别的文章重复部分占全文的比例。比如一篇一万字的论文,查重系统发现有两千字和其他公开的文章一样,那么查重比率就是百分之二十。这个数字是通过查重系统算出来的。
查重系统有一个很大的数据库。数据库里有以前的学生写的论文,有网上的文章,有期刊杂志,有出版的书籍。你把论文上传到系统里。系统会把你的文章和数据库里的资料一篇一篇进行对比。系统看每一句话,每一个段落。它会找出那些相似的句子和段落。系统不是只找完全一样的字。它还会找意思差不多但换了说法的句子。有些系统很聪明,能看出你是不是只是改了几个词。
系统对比之后会出一个报告。报告里会用颜色标出你的论文。通常红色代表重复的部分,黄色代表可能有点问题,绿色代表没有重复。报告里会告诉你哪些句子和哪篇文章重复了。报告最后会给出一个总的比率。这就是我们说的查重比率。这个数字是一个百分比。
查重比率的算法并不复杂。系统会先找出所有重复的字数。重复的字数除以论文总字数再乘以百分百,就得到了查重比率。但这里面有些细节。比如标点符号算不算?通常标点符号是不算在字数里的。系统计算的是有意义的文字。参考文献算不算?这是一个重要问题。有些学校要求查重时包括参考文献,有些学校则说不包括。这需要看你学校的具体规定。
还有目录和致谢部分。这些部分如果和别人一样,算不算重复?很多查重系统可以设置忽略这些部分。你可以告诉系统不要查目录和致谢。这样算出来的比率就更准确反映你正文的重复情况。脚注和尾注也是这样。如果大段引用别人的话,放在脚注里,可能也会被查出来。系统通常会把引用的部分也算作重复。除非你正确地标注了引用。
不同的查重系统结果可能不一样。因为每个系统的数据库大小不同。有的数据库大,收录的文章多,查出来就严格。有的数据库小,可能有些文章没收录,查出来比率就低。国内常用的查重系统有知网、维普、万方等。知网的数据库很全,很多学校都用它。维普和万方也有自己的数据库。国外常用的有Turnitin这类系统。你用什么系统查,结果就会受那个系统的影响。
学校一般会指定一个查重系统。你必须用学校说的那个系统去查。你自己私下用别的系统查,结果可能和学校的不一样。这会导致你以为通过了,实际上却没通过。所以一定要用学校规定的系统再查一次。查重比率的标准每个学校也不同。有的学校要求很严,不能超过百分之五。有的学校宽松一些,百分之十或者百分之十五也可以。研究生论文通常比本科论文要求更严格。
降低查重比率有一些方法。最根本的办法是自己写。自己思考,自己组织语言。这样写出来的东西自然和别人不一样。不要直接复制别人的话。如果一定要引用,就好好加上引号,注明出处。但即使标注了出处,系统也可能把那部分算作重复。所以引用要适量。你可以多读几篇资料,然后用自己的话把意思说出来。这就是改写。改写不是简单换几个同义词。你要真正理解原文的意思,然后重新组织句子结构。
有些人会用翻译软件来降重。比如把中文翻译成英文,再把英文翻译回中文。这样句子会变得不一样。但这个方法可能让句子读起来不通顺。你需要仔细修改这些不通顺的地方。也有人会调整语序,把主动句改成被动句,或者把长句拆成短句。这些方法都有一定效果。但要注意,不能改变原文的意思。尤其是学术概念,不能乱改。
图表和公式怎么算?大部分查重系统不查图片里的文字。系统主要识别文字部分。所以有些内容可以做成图片放进去。但这个方法不能滥用。你的论文主要还是要有自己的文字内容。公式如果是标准的,那大家写出来都一样,这通常不会被算作重复。
自己查重的时候要注意时间。查重系统不是马上出结果的。它可能需要几分钟甚至几小时。特别是毕业季,很多学生一起查,系统可能会慢。你要留出足够的时间。拿到查重报告后,你要仔细看。看看哪些地方标红了。你要一句一句修改那些标红的地方。修改之后,最好再查一次。有时候你改了一处,另一处又出现新的重复。反复修改几次,直到比率降到学校要求以下。
查重比率只是一个数字。它不能完全代表论文的质量。一篇论文即使查重率很低,也可能没有创新点。一篇论文引用了很多前人的成果,查重率可能偏高,但可能有很高的学术价值。所以不要只盯着这个数字。你要保证论文是你自己研究的成果。你要尊重别人的劳动,该注明出处的地方一定要注明。学术诚信是最重要的。不要抄袭,不要找别人代写。这些行为一旦被发现,后果很严重。
写论文是一个艰苦的过程。查重是其中一个环节。理解查重比率的算法,能帮助你更好地通过这个环节。自己动手写,认真修改,你的论文就能顺利通过查重。这需要耐心,需要时间。没有什么捷径可以走。一步一步做,最终你会完成一篇属于自己的论文。