计算机系学生写论文时会接触很多代码。论文里经常需要放入代码。代码可能是自己写的。代码也可能是从别的地方找的。这时就会有一个问题。论文查重时代码算重复吗?不同的学校规定不同。不同的老师要求不同。查重系统本身也有自己的规则。我们需要把这件事搞清楚。
查重系统的工作原理是比对文本。系统里有大量的数据库。数据库里有以往的论文。数据库里也有公开的出版物和网络文章。把你的论文上传。系统将论文分成小段。每一段都和数据库里的内容比对。发现相同的字句就标出来。最后算出一个重复率。这就是查重的基本过程。
代码在查重系统里是什么?代码也是文字。代码由字母数字符号组成。系统处理代码和处理普通文字一样。它不认识什么是代码。它只进行机械比对。如果你的代码和数据库里某段代码一样。系统就会标为重复。从技术上讲代码会被查重。
但事情没那么简单。写论文时代码部分很特殊。很多代码是固定的开头和格式。比如写一个C语言程序。你总要写#include