查重软件,让你无话可说?

作者: 孔鹏洲

来源: 中国科学报

发布日期: 2016-04-01 16:08:52

本文讨论了查重软件在学术论文中判定抄袭的问题,特别是在医学等特定领域中,由于行业内约定俗成的表达方式,导致即使没有抄袭意图也会被判定为抄袭。文章指出,查重软件虽然减轻了监管负担,但过度依赖文字重复率判断抄袭,忽视了内容的真实性和专业性,呼吁需要综合判断来解决这一问题。

最近一个朋友毕业,让我帮忙把毕业论文查一下重,一查之下,大吃一惊,重复率居然达到了30%多!绝对地抄袭妥妥的啊!可再细细一看,远不是那么一回事。比如说,“收集xxx病患者x例,I期x例,II期x例,III期x例”,这样的话,在医学上几乎是约定俗成的说法了,但是查重软件会毫不犹豫地判定为抄袭,因为别的文章里已经出现过了。那么请问,应该怎么说才不是抄袭啊?

再比如说,“患者行广泛子宫切除加双附件切除加盆腔淋巴结清扫”,这样的话,在临床是也是张口就来的,可以说是高度概括、浓缩的,多一字则多少一字则少的,但是查重软件也会毫不犹豫地判定为抄袭,因为这样的话已经在别人的文章里出现过多次了。废话,这一行的都这么说,难道逼着作者重新想一个新名字?

还有,“xx阳性率x%,xx阳性率x%,xx阳性率x%,”这样的话也会被判定为抄袭,注意xxx都是不同的,就是因为连续的几个阳性率和%,就会被毫不犹豫地判定为抄袭。请问,那该怎么说?要知道,这些话其实在临床上都是天天见的,估计小大夫写病历的时候,一天得写个十几遍的。

朋友告诉我,他的同学,为了应付查重软件,都把写好的中文文章,用google翻译成英文,再用google翻译为中文,再略调一下顺序,然后就......查重,本来是为了预防学术不端的,用软件进行查重,毫无疑问可以大大减轻监管者的工作负担。但各行各业恐怕都有自己一些约定俗成的套话,都说高度概括、凝炼的,如果把你说我说大家都说的一些话,都判定为抄袭,那你让人怎么说话?

好政策,不能变为懒政策,判断抄袭,不是靠简单的文字重复率来判断的,更需要的是综合判断。我不希望,某一天,我写个“我吃了一大碗米饭”都被判定为抄袭,难道我只能说“米饭,一大碗,我吃了”?可惜,这样的说法也是要判定为抄袭的啊。

UUID: ec30096e-e4bf-49bd-8819-3d73aba88748

原始文件名: /home/andie/dev/tudou/annot/AI语料库-20240917-V2/AI语料库/中国科学报公众号-pdf2txt/2015-2016/中国科学报_2016-04-01_查重软件,让你无话可说?.txt

是否为广告: 否

处理费用: 0.0024 元