论文查重是一个常见的事情。现在的大学都要对学生的论文进行查重。查重的目的是检查论文有没有抄袭。学生自己写论文的时候也会提前查重。这样可以做到心里有数。查重系统会检测论文的文字部分。文字部分如果和别的文章一样就会被标出来。很多人知道文字会被查重。但是他们不清楚公式和图片会不会被查重。
公式和图片在论文里经常出现。理工科的论文里公式特别多。经济类的论文也可能有很多公式。图片包括照片、图表、流程图。这些内容不是文字。查重系统怎么处理它们呢。我们需要了解查重系统的工作原理。查重系统主要是通过文本匹配来工作的。系统会把论文变成电子文本。然后和数据库里的文章进行比较。数据库里有大量的学术文章。系统找出相同的文字段就算重复。
公式在论文里有两种存在方式。第一种是直接用文字打出来的公式。比如用键盘输入字母和数字。这种公式本质上是文字。查重系统可以识别这些字符。如果公式和别人的一样,系统会认为这是重复。第二种是图片格式的公式。作者可能用软件编辑公式。然后保存成图片插入论文。这种公式是图像。查重系统看不懂图片内容。系统只能看到这里有一张图。图片里面的公式不会被检测。
图片的情况也是类似的。论文里的图片基本都是图像文件。查重系统不能识别图片里的文字。系统也不知道图片表达什么意思。所以图片本身不会算重复。但是图片下面的图注需要注意。图注是文字说明。这些文字会被查重系统检测。如果图注抄袭了别人的描述,那就会算重复。
有人可能会想出一个办法。他们看到图片和公式不会被查重。就把一些文字内容变成图片。比如把一段话截图放进论文。这样查重系统就查不出来了。这个做法是不对的。这是逃避查重的行为。学校老师一眼就能看出来。现在的查重系统也在进步。有些系统可以检测图片里的文字。它们用技术识别图片中的文字。然后把文字拿出来进行比对。不过这个功能还没有完全普及。大多数查重系统还是不查图片的。
写论文的时候应该怎么处理公式呢。如果是自己推导的公式,就不用担心重复。公式本来就是标准的表达方式。很多公式是学术界公认的。比如牛顿第二定律。这种公式大家写出来都一样。不算抄袭。如果是特殊的公式,是自己研究出来的。那就要注意说明。避免和别人撞车。但一般来说,公式重复的可能性很小。
图片的使用也要注意。自己做的实验照片,自己画的图表,这些都是原创的。不会有什么问题。如果引用别人的图片,一定要注明出处。图片本身不算重复,但引用不当就是学术不端。论文查重不只是看重复率。老师还会检查论文的规范性。抄袭别人的图片同样是不允许的。
学生在提交论文前自己查重。查重报告会显示哪些地方重复。公式和图片通常不会在报告里标红。报告主要关注文字部分。看到报告没有重复,学生可能就放心了。但还需要检查公式和图片的引用是否正确。这才是完整的学术规范。
查重系统的数据库很大。包括期刊、学位论文、网页内容。但是数据库一般不收录图片。所以图片比对缺乏数据来源。这也是图片不查重的一个原因。公式如果是文字形式,可能被收录进数据库。不过公式的重复判定会有特殊处理。系统可能设置公式为不查重区域。具体要看系统的设置。
不同学校的查重要求不一样。有的学校查得严格,有的相对宽松。学生应该了解自己学校的规定。直接问老师是最准确的方法。老师会告诉学生查重的范围。有些老师特别强调公式和图片的原创性。他们会在答辩时重点检查这些部分。所以不能因为查重不检测就随便处理。
写论文是一件严肃的事情。论文代表学生的学习成果。学生应该认真对待每一个部分。公式要推导正确,图片要清晰美观。查重只是一个工具。它帮助我们发现无意中的抄袭。但最终还是要靠学生自己的诚信。原创的论文不怕查重。即使公式和图片不查重,也要保证是自己的成果。
现在的技术发展很快。未来的查重系统可能会更智能。也许能完全识别图片中的公式。也许能比对图片的相似度。但那都是以后的事情。目前来说,公式图片不算在查重范围内。学生需要关注的是论文的整体质量。把内容做好,查重自然就能通过。