现在发表论文都要查重。查重就是检查重复。你的文章和别人的文章一样吗。你的想法是自己的想法吗。学校要知道。杂志要知道。查重变成了很重要的事情。
每个人写论文都要经过查重。学生毕业要写论文。老师评职称要写论文。研究人员发表成果要写论文。这些论文都不能抄袭。抄袭就是拿走别人的字。抄袭就是拿走别人的想法。以前没有电脑。查重很困难。老师要读很多书。老师要记住很多文章。老师才能发现抄袭。现在有电脑。电脑里有查重软件。把文章放进软件。软件开始工作。软件比较你的文章。软件比较很多很多文章。这些文章在数据库里。数据库很大。有中文文章。有外文文章。有过去的文章。有现在的文章。软件很快就能出结果。结果是一个数字。这个数字叫重复率。重复率百分之五。重复率百分之十。重复率百分之五十。数字越高问题越大。
学校有规定。杂志有规定。重复率不能超过一个数。有的规定是百分之十。有的规定是百分之五。超过规定很麻烦。学生可能不能毕业。老师可能不能评职称。研究人员可能不能发表。大家都很紧张。写论文的时候总想着这个数字。写一句话要想。这句话是我自己的吗。这句话和别人一样吗。我是不是在哪里看过。我是不是无意中记住了。然后写出来。以为是自己想的。其实是别人的。这也很危险。
查重是为了保护原创。原创就是第一个人想出来的。第一个人写出来的。原创很宝贵。大家都尊重原创。如果一个人抄袭。这对原创的人不公平。他花了时间。他花了心思。别人直接拿走。这不对。查重可以阻止抄袭。知道要查重。想抄袭的人会害怕。他们会自己写。这对学术有好处。学术需要新东西。新想法。新发现。抄袭不会带来新东西。查重让环境干净一些。
查重也有问题。问题一。查重只看字一样不一样。想法一样怎么办。两个人可能想一样的事。两个人可能写差不多的字。但他们没有互相抄。他们是独立想的。查重软件不知道。软件只找一样的字。软件会标出这些地方。作者就要解释。很麻烦。问题二。有人会想办法骗过软件。他们改变一些字。他们把句子顺序变一变。意思还是一样。但字不一样了。软件可能查不出来。这叫洗稿。这不是真正的原创。这还是在用别人的核心想法。但查重软件有时候没办法。问题三。查重让写作变得小心。太小心可能写不好。作者总担心重复。不敢用常见的说法。不敢用标准的定义。句子写得奇怪。只是为了不一样。这影响文章清楚。读者读起来困难。
写论文的人怎么做。他们先自己检查。写论文之前读很多资料。读的时候记笔记。记下哪里是别人的想法。记下哪里是自己的思考。写的时候分清楚。这句话是参考资料里的。这句话是我自己的。引用别人的话要标注。告诉读者这是谁说的。从哪本书来。从哪篇文章来。这样是诚实的。查重的时候这些引用不算抄袭。但引用也不能太多。太多引用说明你自己想的少。论文要有自己的东西。
写完论文用查重软件自己查一次。网上有这样的服务。花一点钱。看到重复率。看到哪里标红了。标红的地方就是软件认为重复的。看看这些地方。是不是引用忘了标注。是不是无意中写了和别人一样的话。如果是引用。加上标注。如果是无意重复。改写一下。用别的词。换一种说法。意思不变。字不一样。这样重复率会降低。降到学校的要求。降到杂志的要求。然后才交上去。
学校收到论文。杂志收到论文。他们用正式的软件再查一次。他们的数据库更大。他们的检查更严格。他们的结果更准确。如果通过了。论文进入下一步。如果没有通过。论文会被退回。作者要修改。作者要解释。严重的时候会受到处罚。处罚可能是警告。处罚可能是取消资格。处罚可能记录在档案里。这对未来有影响。
查重软件公司有很多。中国有知网。中国有万方。中国有维普。外国有Turnitin。外国有iThenticate。这些公司收集大量文章。他们的数据库是他们的资本。学校买他们的服务。杂志买他们的服务。这是一门生意。生意很大。因为每个人都必须用。学生交钱查重。学校交钱买系统。公司赚很多钱。这也引起讨论。查重服务应该这么贵吗。学生已经付了学费。为什么查重还要付钱。但目前没有更好的办法。
未来可能改变。人工智能越来越厉害。人工智能可能理解文章的意思。不仅仅是字一样不一样。人工智能能看出想法是不是抄袭。即使字完全不同。但核心想法一样。人工智能也能发现。那时候查重会更聪明。但那时候也有新问题。人工智能怎么判断想法一样。谁来决定。这可能更复杂。
现在的情况就是这样。查重是论文的一部分。像吃饭要用筷子。像出门要穿鞋。写论文的人已经习惯。先写。再查。再改。再提交。心里总有一个数字。重复率。这个数字要合格。合格了才能通过。通不过就要继续改。这是一个过程。每个人都要走这个过程。从学生到教授。从新手到专家。大家都一样。
查重让论文更规范。查重也带来压力。它有好的一面。它有不好的一面。它是这个时代的产物。我们用它。我们讨论它。我们也许有一天会改进它。但现在。它就在这里。是学术世界的一把尺子。量着每一篇论文。量着每一个写字的人。