我的论文写完了。我花了很多时间。我查了很多资料。我做了很多实验。我写了很多字。我觉得自己完成了重要的东西。我要把论文放到知网查重。我知道很多学校用这个系统。我想看看我的论文是不是和别人写的一样。
我打开电脑。我登录知网查重的网站。我上传我的论文文件。我付了钱。我等着出报告。我的心里有点紧张。我怕查重率太高。我怕老师说我的论文有问题。我等了几分钟。报告出来了。我打开报告看。查重率是百分之十五。这个数字不算太高。我松了一口气。但我要仔细看看具体内容。
报告标出了很多红色和黄色的地方。红色是和其他文章完全一样的部分。黄色是意思差不多但换了说法的部分。我仔细看红色的地方。有些是我引用的参考文献。我写了引用标记。这没有问题。但有一些红色部分让我很意外。这些部分不是引用。这些部分是我自己写的句子。报告说这些句子和别的文章一样。我有点不明白。这些句子是我自己想的。怎么会和别人一样呢?
我想了想。我的论文题目不冷门。很多人研究这个方向。也许我们用了同样的资料。也许我们想到了同样的表达。这有可能。但我还是觉得不太对。我点开那些红色句子。系统显示和别的论文重复。我看到那些论文的作者名字。我不认识这些人。我看到那些论文的发表时间。有的论文比我的论文完成时间早。有的论文比我的我的论文完成时间晚。这很奇怪。
我开始看那些比我早的论文。那些论文去年就发表了。我的论文今年才写完。我的论文不可能和去年的一样。除非我去抄了。但我没有抄。我再看那些比我晚的论文。那些论文上个月才发表。我的论文三个月前就写好了。那些论文不可能抄我的。我的论文没有发表。别人看不到我的论文。这到底是怎么回事?
我想到了一个可能。也许别人也用知网查重了。知网系统会保存所有查重的论文。这个我知道。学校老师告诉过我们。知网会把查重的论文放进数据库。以后查重就会和这些论文对比。我的论文上传查重后,就成了数据库里的一篇。别人再查重时,系统就会把我的论文当作对比来源。这就是说,我的论文虽然没有发表,但已经在知网的系统里了。
问题来了。如果别人用了我的论文内容呢?我的论文在知网数据库里。别人查重的时候,能看到重复来源是我的论文吗?查重报告只显示重复,不显示论文被谁用了。我看不到谁用了我的句子。别人也看不到我的名字。这就像一个黑箱子。我们的论文都在里面混在一起。
我突然觉得有点不舒服。我的论文是我的心血。现在它躺在知网的数据库里。别人可能正在用里面的句子。他们不是抄袭我。他们只是查重时撞上了我的句子。但后果可能很严重。如果两个人都用同样的句子,两个人都可能被认定抄袭。这很不公平。
我想起我的同学小李。小李上个月论文查重没过。他的查重率有百分之四十。他很委屈。他说那些重复的部分是自己写的。老师不相信他。老师说查重系统不会错。小李只好重写论文。他现在想想,也许小李的情况和我一样。他的论文先查重,进了数据库。后来别人写了相似的句子,系统判了重复。小李说不清楚。
这真是一个麻烦事。我们写论文,自己辛苦想出来的东西,一查重就成了“公共”的。系统没有恶意。系统只是做对比。但这个机制有漏洞。先查重的人吃亏。后查重的人可能无意中“偷”了先查重的人的句子。大家都不知情。
我该怎么办?我把我的发现告诉了我的导师。导师听了我的想法。他沉默了一会儿。他说他也注意到这个问题了。他说最近几年,这样的情况变多了。很多学生反映自己写的句子被标重复。导师们也很头疼。他们只能相信查重系统。但查重系统不一定完全正确。
导师给我一个建议。以后写论文,尽量早点查重。查重之后,尽快交给学校。学校收录了,就算正式完成了。这样能减少被别人“撞上”的机会。但这个办法不是百分之百有用。如果学校收录慢,还是可能出问题。
我还想到另一个办法。写论文的时候,把句子写得特别一些。不用常见的说法。换一种方式表达。但这也有问题。论文要求准确。有些专业术语不能随便换。有些固定的表达必须用。太特殊的写法,可能显得不专业。
这真是一个两难的问题。我们需要查重系统。查重系统能防止抄袭。但查重系统也可能制造新的问题。它把未发表的论文也收进去。它让无辜的人可能受牵连。
我看着我自己的查重报告。那百分之十五的数字还在那里。我知道其中有一部分是我自己的“原创”重复。这些句子是我写的,现在成了重复来源。以后如果有人写了类似的句子,系统会判他们重复我。他们可能完全不知道我的存在。他们可能以为是自己想出来的句子。他们会被系统警告。他们可能被老师批评。他们无法解释。
这是一个看不见的循环。我们每个人都在这个循环里。我们写论文。我们查重。我们的论文进入数据库。数据库越来越大。重复的可能性越来越高。我们越来越难写出“全新”的句子。因为很多句子已经被人写过了,虽然那些论文没有正式发表。
我想起以前的人写论文。他们没有查重系统。他们靠读书,靠思考,靠手写。他们也可能写出相似的句子。但没有人知道。现在有了查重系统,我们知道得太多了。我们知道自己的句子和别人雷同。但我们不知道这雷同是怎么发生的。是抄袭?是巧合?还是系统制造的错觉?
我的论文通过了。我交了最终稿。但我心里留下一个疙瘩。我知道我的论文在知网的数据库里。它像一粒沙子掉进沙滩。它和无数别的沙子混在一起。分不清谁是谁。后来的人走来,抓起一把沙子。里面可能有我的那粒。但他们不知道。我也不知道。
这也许就是现代学术的困境。我们追求原创。我们害怕重复。我们用工具检查自己。工具本身改变了游戏规则。我们在规则里努力保持清白。但规则本身可能有盲点。我们都在盲点里摸索。
写完论文很久以后,我偶尔还会想起这件事。我想到那些红色标记的句子。它们是我一字一字敲出来的。现在它们属于系统。系统用它们衡量后来的作者。后来的作者可能也在深夜苦思。他们写出同样的句子。他们欢呼自己想到了好表达。然后他们查重。系统告诉他们:这个句子有人写过了。他们失望。他们修改。他们不会知道那个“有人”是我。我也不会知道他们是谁。
我们被一个系统连接在一起。但我们彼此看不见。我们像生产线上的产品。被同一个标准检测。标准本身成了我们之间唯一的联系。这个联系是冰冷的数字。是百分比。是红色黄色的标记。
也许有一天,这个系统会改进。它会区分正式发表和仅查重的论文。它会给出更清晰的来源信息。它会减少误判。但在那天到来之前,我们还要继续。继续写,继续查,继续面对那些似曾相识的红色句子。
我关上电脑。我的论文已经交了。这件事暂时结束了。但我知道,在某个地方,某个人可能正在上传他们的论文。系统正在对比。我的句子可能出现在他们的报告里。他们可能会疑惑。他们可能会苦恼。就像我当时一样。这个循环,还在继续。