论文查重是一个常见的问题。许多学生和研究者都会关心这件事。大家想知道论文查重到底查什么。是不是只查那些已经发表过的文章。这是一个需要弄清楚的问题。
论文查重的系统有很多种。这些系统有中国知网。有万方数据。有维普。还有国外的系统比如Turnitin。这些系统的工作原理大致相同。它们都有一个庞大的数据库。数据库里存放了很多资料。
这些资料主要包括已经发表的文章。发表在学术期刊上的文章。发表在会议上的文章。发表在报纸上的文章。这些都是公开的。大家都能够找到。这些文章是数据库的主要部分。除了这些还有学位论文。硕士论文。博士论文。这些论文很多也被收录在数据库里。这些也是公开的。可以在图书馆或者网络上找到。
那么是不是只查这些呢。答案是不止这些。数据库里还有很多别的东西。比如有些书籍。特别是学术书籍。如果这些书籍被数字化了。它们也可能在数据库里。还有一些网页内容。一些网站上的文章。一些公开的报告。一些政府的文件。这些都有可能被收录。一些系统甚至会收录往届学生的作业或者论文。防止互相抄袭。
所以查重不仅仅是查登载过的文章。它的范围更广。它查的是所有可能被收录的文本资料。只要你的文字和别人已经存在的文字相同或者相似。系统就有可能发现。这就叫重复。
为什么大家会觉得只查登载过的文章呢。因为那些是最常见的重复来源。一个研究者写论文。他需要参考别人的成果。他需要引用别人的观点。他最容易接触到的就是已经发表的文章。如果他抄袭了。最有可能就是抄袭这些文章。所以查重的时候。这些文章是检查的重点。但这不代表别的资料不检查。
查重系统的算法很复杂。它会把你提交的论文。切成很多小片段。然后把这些小片段和数据库里的资料一个一个对比。看有没有一样的或者差不多一样的。如果找到了。它就标记出来。告诉你这里可能重复了。重复了多少。从哪里重复的。
这就告诉我们一个道理。写论文不能抄袭。不能直接复制别人的文字。即使你复制了一本书上的话。即使这本书没有正式出版。只要它被录入数据库。系统就可能查出来。复制网页上的内容也不行。复制往届学生的作业更不行。这些都可能被发现。
正确的做法是什么呢。你要自己思考。自己写。看到别人的好观点。你可以学习。但你要用自己的话重新说出来。这就是转述。如果你必须引用别人的原话。你要加上引号。并且注明出处。告诉大家这是谁说的。从哪里来的。这样是允许的。不会算你抄袭。
引用和抄袭是不一样的。引用是光明正大的。是允许的。抄袭是偷偷摸摸的。是不允许的。查重系统也能区分这两者吗。有些聪明的系统可以。如果你正确标注了引用。系统可能会把这一部分排除在重复率计算之外。但这取决于系统的设置和学校的标准。所以最保险的方法。还是尽量自己写。减少大段大段的直接引用。
了解了查重的范围。我们写论文时就会更小心。我们会知道。不能只想着避开那些著名的期刊文章。还要注意那些不太起眼的资料来源。网络上的百科。论坛里的帖子。这些地方的内容也可能被查出来。
有些同学会想。我翻译外文资料可以吗。把英文文章翻译成中文。然后放进我的论文里。这样查重系统查不出来吧。因为数据库里是中文资料。这种想法也是危险的。现在很多查重系统功能很强。数据库也包括外文资料。即使你翻译了。如果你的结构和观点完全照搬。也可能被识别出来。这本质上还是抄袭思想。是不对的。
论文查重是为了维护学术的诚实。是为了鼓励创新。让大家真正动脑筋。做出自己的贡献。如果大家都抄袭。学术就没有进步了。所以这个制度是必要的。
我们明白了查重不只查登载过的文章。我们就会更全面地看待自己的写作。我们会检查每一个部分的来源。确保都是自己的思考和表达。这样写出来的论文才是扎实的。才是经得起检验的。你的心里也会更踏实。不会担心被查出问题。
写论文是一个辛苦的过程。但也是一个成长的过程。自己动手。自己思考。虽然慢一点。难一点。但收获是实实在在的。通过查重的考验。你的论文就站得更稳了。你的学术之路就走得更正了。这是值得的。