论文查重这件事情很多学生都知道。现在的大学对论文查得很严格。学生写好的论文必须通过查重系统的检查。查重系统会把论文和数据库里的文章进行对比。数据库里有很多已经发表的论文。还有网络上能找到的各种资料。系统会找出论文中和其他文章相似的部分。相似的部分太多就不行。学校会设定一个相似度的标准。超过这个标准论文就不能通过。学生必须修改论文直到符合要求。这是为了保证论文的原创性。防止有人抄袭别人的作品。
中国的高校开始重视论文查重大概是在二十一世纪初。具体来说,二零零五年是一个比较关键的年份。在这之前,大学对论文抄袭的管理没有那么严格。那时候网络还不像现在这么发达。学生找资料主要靠图书馆的书本。老师检查论文也主要靠自己的阅读和经验。发现抄袭并不容易。有的学生可能会大段抄书。有的学生可能会抄师兄师姐的论文。这种情况是存在的。
二零零五年左右,情况开始发生变化。中国的大学招生规模变大了。每年毕业的学生越来越多。需要写的毕业论文也越来越多。光靠老师人工检查很难完成。同时,互联网发展得非常快。学生上网越来越方便。在网上能找到的资料也爆炸式增长。这给抄袭带来了便利。复制粘贴变得很容易。这就产生了新的问题。学术诚信的问题变得突出起来。学校必须想办法解决这个问题。
也是在这个时候,国外的论文查重系统开始成熟。比如Turnitin这样的系统在国外高校已经使用。中国的一些高校开始了解到这些技术。国内也有公司开始开发类似的技术。最早的一批中文查重系统开始出现。这些系统需要建立一个庞大的中文文献数据库。这个数据库需要收录学术期刊的文章、学位论文、会议论文等等。还需要能够抓取网络上的信息。技术的发展让这件事成为可能。
从二零零五年开始,越来越多的高校开始尝试使用查重系统。最初可能只是在部分重点大学。或者是在研究生阶段使用。因为研究生的学位论文更重要。学校也更重视。试用之后,学校发现这个办法有效。它能快速找出有问题的论文。大大提高了老师的工作效率。也对学生形成了约束。学生知道论文要过机器检查,抄的时候就会多想一想。这在一定程度上减少了抄袭行为。
到了二零零八年,二零零九年,使用查重系统的学校就非常普遍了。很多本科院校也开始要求查重。教育部门也发布了相关的通知。要求高校加强学术道德建设。要使用技术手段来预防学术不端。查重成为毕业论文管理的一个必要环节。学校会统一购买查重系统的服务。学生在提交论文终稿前,必须先通过查重。有的学校甚至允许学生自己先查一次。自己修改好了再交给学校查。这成了毕业论文写作的标准流程。
查重系统的数据库也越来越大。最早可能主要是学术论文。后来加入了更多的资源。包括报纸、杂志、网页、甚至书籍。系统比对的能力也越来越强。不只是看文字是不是一模一样。还能发现一些简单的修改。比如改几个词语,调整一下语序。系统也可能识别出来。这对学生提出了更高的要求。想蒙混过关变得更难。
查重系统的普及也带来了一些讨论。有的人认为查重是好的。它保护了原创。让那些认真写论文的学生得到公平。让抄袭的人受到惩罚。这是对学术的尊重。也有的人觉得查重太死板。论文里有些内容很难完全用新话写出来。比如一些专业的概念定义。一些常用的研究方法描述。这些东西写法本来就差不多。查重系统可能会把这些也算成抄袭。导致论文的相似度变高。学生不得不花很多时间把话“说得不一样”。这有时候只是在玩文字游戏。对论文的质量并没有真正的提高。
还有的学生会想各种办法绕过查重。比如把中文翻译成英文,再把英文翻译回中文。或者用一些同义词替换的软件。这些办法可能暂时降低查重率。但对论文本身没有好处。甚至可能让语句变得不通顺。老师是能看出来的。查重只是一个工具。它不能判断论文的质量。论文写得好不好,最终还是要看内容。看有没有新的观点。看论证是不是扎实。查重只是把好了第一道关,防止抄袭。
现在,所有的大学生都知道写论文要查重。从二零零五年左右起步,到现在已经将近二十年。查重成了大学生活的一部分。它提醒每一个学生,要诚实对待自己的学习。要尊重别人的劳动。要自己动脑筋完成论文。这是上大学的基本要求。
写论文的过程是辛苦的。要读很多文献。要想自己的题目。要组织材料。要一遍又一遍地修改。查重是这个过程里的一道坎。跨过去,论文才算有了一个基础。这是学术训练的一部分。它教会学生遵守规则。教会学生原创的价值。虽然有时候学生会抱怨查重太麻烦。但回过头看,这个制度的存在是有必要的。它让中国的学术环境变得更加干净。让大学的学位更有分量。
从哪一年开始不重要。重要的是它已经成为一种习惯。一种所有学生和老师都接受的学术规范。它还在继续发展。未来的查重技术可能会更智能。可能会更好地区分合理引用和恶意抄袭。但核心不会变。就是鼓励独立思考。保护知识的原创。这是大学精神的一部分。