论文查重是许多学生和研究者关心的问题。什么是重复?怎么判断重复?这些问题很常见。
查重系统的工作原理是这样的。系统把一篇论文和数据库里的文章进行比较。数据库里有期刊文章、学位论文、网页内容等等。系统会检查文字上的相似度。相似度高了,重复率就高了。
怎样的文字算重复呢?最直接的情况是一字不差地照抄别人的话。比如你从一本书里抄了一个句子,一个字都没改。这肯定是重复。系统很容易就能发现这个。这叫做直接复制。
改几个字算不算重复呢?你把别人的句子拿过来,换掉其中一两个词语。比如原句是“这个实验采用了先进的技术”,你改成“这个研究使用了先进的技术”。这依然可能被算作重复。查重系统很聪明,它会看句子结构和核心词汇。关键意思没变,只是换了几个近义词,系统可能还是会判定相似。这属于轻度改写,但本质上还是别人的观点和表述。
还有一种情况是拼凑。你从三篇文章里各找一句话,把它们连在一起,变成你的段落。你以为这是自己的话,其实每一句都是别人写的。查重系统会把每一句话都和原文对比。这样拼凑起来的段落,重复率会很高。这也不是你自己的原创。
复制自己以前写过的文章算重复吗?这也算。这叫做自我抄袭。你已经发表过一篇文章,现在又把这篇文章的一部分用到新论文里。你没有引用自己以前的文章。系统数据库里如果有你以前的文章,它就会标出重复。你需要引用自己以前的工作,像引用别人的工作一样。
观点的重复怎么算?查重系统主要看文字。如果只是观点相同,但文字是你自己重新写的,系统可能不会判定为重复。比如,一个科学结论是“水在零度会结冰”。很多人都写过这个事实。你用你自己的话描述这个现象,这是可以的。但是,如果你描述这个观点的句子和别人非常像,那就可能有问题。关键是文字表达是否独立创作。
哪些内容不容易被算重复?你自己做的实验,你自己记录的数据,你自己得出的分析结论。只要你用自己的话来描述这些内容,重复的可能性就很低。你对数据的独特解读,你提出的新理论模型,这些是原创的核心。查重系统鼓励这些内容。
常见的重复问题在哪里?引言部分容易重复。很多人描述研究背景时,会参考现有文献。如果不小心,就会写成和文献里差不多的话。文献综述部分也是高危区域。你需要总结别人的工作,但总结必须用自己的语言。方法部分也可能重复。如果你使用的是一种标准实验方法,描述上容易和其他论文雷同。这时需要注意表述的差异。
如何避免不必要的重复?读懂你要参考的资料。然后合上书本,完全根据自己的理解来写。不要边看边写。写完之后,再核对事实是否准确。这样能保证语言是你自己的。
引用是必须的。当你使用了别人的具体表述、数据或核心观点时,一定要加上引号并注明出处。正确引用不会被算作抄袭,但会计入总相似度比例。有的学校只看“去除引用后的重复率”。正确引用是学术规范。
技术手段可以帮助你。写完后先用查重系统自己检查一遍。你会看到哪些部分标红了。标红的地方就是系统认为相似度高的地方。你需要修改这些地方。修改不是简单换词,而是理解意思后重新组织句子。可以调整句子顺序,可以换一种说法,可以把一个长句拆成几个短句。
查重系统的数据库很庞大。不仅包括公开出版物,还可能包括互联网资源、往届学生的论文。所以不要以为抄一篇网上不知名的文章就没事。很可能已经被系统收录了。
不同的学校和期刊对重复率的要求不同。有的要求低于百分之十,有的要求低于百分之二十。你要了解自己单位的具体规定。总重复率是一个数字,更重要的是看具体哪些部分重复了。如果是引用部分重复,问题不大。如果是核心内容重复,问题就严重了。
写作是一件诚实的事。论文是你研究成果的展示。重复别人的话,就像拿了别人的东西说是自己的。这不利于你的学习和发展。踏踏实实读书,认认真真思考,老老实实写作。这是最根本的方法。查重系统是一个工具,它的目的是帮助你保持原创性,提醒你注意规范。最终的目标是写出真正属于你自己的文章。
当你用自己的话表达时,即使描述的是同一个事物,也会和别人不同。每个人的思维和语言习惯都是独特的。相信你自己的表达能力。不要害怕写得不够好。初稿可以不完美,但必须是原创的。修改可以慢慢进行。
理解查重的规则,可以帮助你避开陷阱。知道什么是重复,你就知道怎样不重复。这就像知道了交通规则,你就能更安全地走路。学术规范就是学术世界的交通规则。遵守规则,你的道路会更顺畅。
写作是一个创造的过程。这个过程有辛苦,也有快乐。当你看到自己写出的完整论文,知道每一句话都是自己思想的产物,那种满足感是无可替代的。查重只是一个环节,它的存在是为了维护创造的公平和诚实。