论文学术不端文献检测系统本站仅为论文查重渠道,非知网官方网站。
中国知网CNKI学术不端检测系统也称为知网查重检测系统,是通过知网查重检测系统对论文的主体进行识别检测的方法,通过系统的运作与计算,以“复制比”或“相似比”的直观形式呈现检测结果。 目前知网查重检测系统不能完全取代人工对比,仍存在较多检测盲区,现就小编使用过程中发现的问题列举如下体会:
1、合理引用与抄袭的区分
引用政府文件、领导人讲话、权威著作、历史材料、法律法规、诊断疗效标准、操作规程等,被误判为段落抄袭或句子抄袭,导致文字复制比偏高。生物医学领域的论文,很多研究方法和临床诊疗方案是相似的,而且论文的格式基本都是固定的,语句较为简单和通用,如:采用SPSS统计软件分析数据,计量资料以X±S表示,组间比较采用t检验;计数资料组间比较采用X2检验;P<0.05为差异有统计学意义。同一方向的研究往往查询的文献相同、采用的技术和方法一致,就连在术语的应用和语言的表达上也容易造成重复。同一作者在前期研究的基础上继续深入,后期文章中前言文字、研究方法、研究仪器、所用材料、统计学分析等很多文字说明与前期文章一致,甚至会引用前期文章中的数据。中医药类论文经常引用经典语句,检测系统尚不能识别这些语句出自经典著作。因此,医学类文章容易出现文字重复,导致文字复制比偏高。也有的论文整体文字复制比偏高,但核心内容基本不重复,利用这些系统检测医学论文的时候可能会出现检测结果“假阳性”。检测系统遏制了明目张胆的抄袭、剽窃,但对文化发展产生了负面影响。依据《著作权法》作者有引用的权利,系统却不能保障。此类情况应由同行评议的方式进行补充评议。
2、检测系统收录文献完整性问题
CNKI、万方、维普数据库与国内众多期刊均有合作,但三家数据库所收录的期刊并不完全重合。造成各家收录论文存在差异性,导致知网查重检测系统的结果出现差异。如果抄袭了回溯建库之前的文献,则数据库无法查实。并且CNKI、万方数据都分别与部分科技期刊编辑部签订了独家合作协议,意味着该刊的所有文献只能在各自的数据库中检索到,造成其他数据库的统计源文献的缺失。此外,目前检测系统对图书的收录还有很大空缺,如果论文抄袭的是图书内容,现有系统无法检测出来。
3、检测技术问题
各检测系统在工作方式、后台数据库、算法特点(对论文关键语义片断识别检测、字段识别、近义同义识别)等方面都存在差异,这些在技术上的不同,会造成不同的检测系统对同一篇论文检测时,得出不同的结论结果,而且有时差异较大。有抄袭者针对检测系统的检测原理研究出“反反抄袭”方法,把论文写作变成了文字游戏,通过对语句顺序的调整、同义词替换、语句表达方式的变动而躲避系统的检测。更有甚者将外文文献翻译成中文后发表,或将自己的中文稿件翻译成英文再投稿。知网查重检测系统在技术上只能检测“文字”而不能检测“思想”,从而只能避免“文字”抄袭而不能防止“思想”抄袭的缺陷[10]。此时需要通过同行评议的方式进行补充评议。
4、文字识别误差
对于同一篇论文,使用Word版与PDF版本进行检测会得到明显的论文重复率的不同,这主要由两者文字识别率不同引起。同时在检测报告中有时也会出现乱码,也是由于提交的PDF版本论文或数据库中论文的文字转换差错所导致。
5、转页文字处理错误
两篇论文共用一页或同一篇论文排版标识为下转某一页时,检测结果可能出现被检测论文与其自身重复或同一文字误作两篇的错误,直接导致复制比增高,必须人工予以鉴别。
6、外文论文检测水平需提高和突破
在检测中发现目前外文论文检测结果复制比较低,这与检测系统收录外文文献底层数据不足、范围受限有关,较低的复制比并不能反映出论文的真实质量水平。
7、检测报告阅读、解释
因检测系统尚未完善,检测报告中可能存在其他问题:⑴部分外文会议论文未标引作者,同作者提交的期刊论文重合部分无法排除;⑵参考文献与其他论文的参考文献重合,也计入了总重合率(虽然系统中有“去除参考文献后复制比”指标,但是有的参考文献未被识别);⑶外文姓名不能自动识别,如Xiao Yong SUN VS Xiao-Yong Sun;⑷文字识别错误,笔者曾检测过一篇论文,检测报告显示“去除本人学位论文会议论文文献复制比”为43.4%,“单篇最大文字复制比”为18.4%。后与原文对比发现检测字数为376字,与原文转换为文本后的4001字差别较大,故考虑为检测系统文字转换有误。咨询相关技术人员解释为:收录数据加工问题所致系统无法读取原文。后经该论文以PDF格式原文上传检测,其结果“去除本人学位论文会议论文文献复制比”为0.9%,“单篇最大文字复制比”为0.9%。
总结:以上七点是小编的知网查重检测系统使用体会。论文抄袭是学术不端的常见形式,知网查重检测系统确实对检测中文论文的内容重复情况具有重要的实用价值,也对部分学术不端者起到了震慑作用。本研究对山东省部分高校4年间9000多篇职称评审论文检测结果的统计分析,部分地反映了当前山东省高校学术论文的学术不端真实状况。知网查重检测系统本身还存在一些问题,这就需要检测人员以高度的责任心对检测报告仔细解读,审慎出具检测结论。同时也提醒检测报告的使用机构必须合理使用报告结果,必要时应进行人工的学术鉴定,而不能只關注检测报告的数据。