查重是论文必须经历的一个步骤。许多同学发现两次查重的结果不一样。这让他们感到困惑。为什么同一个文件两次查重的结果会不同呢。这里面有很多原因。理解这些原因可以减少不必要的担心。
查重系统是一个工具。它把上传的论文和数据库里的资料做对比。数据库是不断更新的。今天数据库里的内容和明天可能就不完全一样。新的期刊文章、新的学位论文、新的网络资源每天都在增加。第一次查重时数据库里可能没有某些资料。第二次查重时这些资料可能已经被收录。这样第二次查重就可能标出更多相似的内容。结果自然就不同了。
使用的查重系统不同结果也会不同。不同的查重系统有不同的数据库。有的系统收录的学术期刊多。有的系统收录的网络资源多。有的系统有专门的英文数据库。你用第一个系统查重。得到一份报告。然后你用第二个系统再查一次。两份报告很可能不一样。有时候差异还很大。就算你两次都用同一个系统也可能有差别。有些系统提供不同的检测版本。比如有“大学生版”和“研究生版”。这两个版本侧重点不一样。结果也会有细微区别。
论文本身的格式会影响查重结果。查重系统不是人眼。它看论文是一堆代码和文字。如果你的论文格式混乱。比如有很多空格、特殊符号、不规范的引用。系统可能无法正确识别。它可能把引用部分也当成正文来比对。这样相似率就高了。你修改了格式再次提交。系统正确识别了参考文献。结果就可能变低。段落划分不一样也会有影响。大段的文字和小段的文字在比对时算法不同。有时调整段落结构。查重率也会变化。
查重系统的算法是一个复杂的东西。但我们可以简单理解。系统不会公开所有计算细节。它可能设置了一些规则。比如连续多少个字相同算重复。比如引用部分怎么处理。比如表格里的数据算不算。这些规则可能随着系统升级而调整。你今天查的时候系统用的是一个算法。下个月系统更新了。算法变了。同样的内容结果就可能不一样。有时候系统为了更准确会优化算法。这也会导致前后结果不一致。
提交论文的方式也是一个因素。有的系统要求提交整篇文档。包括封面、目录、致谢。有的系统只要求提交正文部分。你第一次提交了完整的论文。封面、学校名称、导师信息这些都可能被查出重复。因为很多论文的这些部分都是类似的。第二次你只提交了正文。重复率可能就下降了。另外文件格式也有影响。通常建议提交Word文档。如果你提交了PDF文件。系统在转换时可能出错。识别出的文字和原文有出入。这也会让结果产生偏差。
你自己的修改行为是最大的变量。第一次查重后你看到了报告。你会修改那些标红的部分。你可能会换一种说法。可能会增加一些自己的分析。可能会调整语序。然后你再次查重。结果当然会变。这种变化是你主动造成的。是正常的。需要注意的是有时你觉得自己改了很多。但查重率下降不明显。这可能是因为你修改的地方不够核心。或者你用的新句子和别人又重复了。
时间点的影响不容忽视。高校通常会统一在某个时间段进行查重。比如毕业季。大量学生同时提交论文到查重系统。系统在高峰期压力大。可能会有些异常。可能会排队处理。有时候结果可能不如平时稳定。如果你在深夜或清晨人少的时候查重。系统运行更顺畅。结果可能更准确。但这只是可能。不是绝对的。
查重结果是一个参考数字。它不是绝对的真理。学校看查重报告不只是看那个百分比。也会看具体重复了哪些地方。是不是核心观点重复。是不是引用部分重复。所以不必过度纠结两次数字的不同。只要你的论文确实是认真写的。大部分内容都是自己的话。重复的部分也按要求规范引用了。那就没有问题。如果你的论文重复率本来就很低。比如百分之五。两次查重变成百分之六。这点波动不需要担心。这是正常的误差范围。
如果你对查重结果有疑问。可以仔细对比两份报告。看看是哪里增加了重复。是新出现的重复内容吗。是不是你不小心抄了哪里的句子。是不是引用格式错了。还是系统误判了。有些专业术语、法律条文、公式符号是固定的写法。这些重复系统也会标出来。但通常人工审核时会判断。这些不算抄袭。明白原因你就知道怎么处理了。
论文写作是一件严肃的事情。我们应该自己写。用自己的话表达观点。别人的想法要注明出处。这是基本的态度。查重是帮助我们的工具。不是我们对付的目标。把心思花在写好论文上。而不是花在琢磨查重数字上。查重结果有波动是正常现象。知道可能的原因就好。安心修改论文。达到学校的要求就可以了。