知网查重样例–学术不端文献检测系统的产生及应用概况
发布时间:2017-09-29 点击率:0
在上,20世纪70年代就开始了利用技术手段检测不端行为的研发工作。90年代以后,提出了数字指纹等检测方法,并得到了应用,如论文作业抄袭检查平台Turnitin,研发后应用于多所高校及科研机构,包括美国加州大学伯克利分校、杜克大学、德国汉堡大学等;加拿大sciworth公司开发的mydropbox,提供学生作业抄袭检测服务;mydropbox使用微软搜索技术,可以检测互联网资源、可公共存取的部分数据库资源以及机构内部文档,等等。[3]
随后,我国的研发工作也陆续展开,具代表性的是中国学术期刊(光盘版)电子杂志社与同方知网公司的共同研发。他们首先建起了《中国学术文献网络出版总库》,该数据库收录了包括期刊论文、学位论文、工具书、年鉴、报纸、专利等在内的多种文献,覆盖了工程技术、信息技术、自然科学、农业、医学、哲学、人文社会科学、经济与管理等各个领域。它还是上大的连续动态更新的全文数据库,并成为随后研制的学术不端文献检测系统的比对数据库。
2006年下半年,中国学术期刊(光盘版)电子杂志社与同方知网公司开始合作研制学术不端文献检测系统,这“是一个系统工程,涉及检测方法设计、比对数据库建设、规范数据库建设、大规模数据测试、系统性能测试等多个环节。”[4] 2008年12月,学术不端文献检测系统开发完成,研发者宣布将在各相关机构开放使用。
学术不端文献检测系统的比对数据库为《中国学术文献网络出版总库》,检测时输入一篇文章,就能同数据库中的所有文章进行比对,从而发现这篇文章跟数据库中的哪篇文章、哪些句子是重复的。它还是上个以全文文献为比对资源的检测系统,国外的检测系统基本上是题录摘要的检测而非全文检测。
学术不端文献检测系统可用于期刊审稿、学位论文检测、职称评定、项目立项评审、项目验收评审和报告审查等方面。为了从多个角度反映文字复制情况,检测系统设计了总重合字数、总文字数、总文字复制比等多个检测指标。而对于篇幅较大的学位论文,除了设置总检测指标,系统对每一章节都设定了文字复制比、重合字数、引用复制比、段落数、大段长等多个子检测指标,用以检测每一章节的复制情况。该检测系统面世后,迅速地被各相关机构采用,不少机构还以公告形式宣布启用该系统。
例如《浙江大学学报(人文社会科学版)》,在检测系统刚面世的2008年年底,就正式建立了该系统的使用账号,在全国社科期刊中率先采用了这一系统,通过检测后的论文才能进入下一轮的专家审稿流程。《中国肿瘤生物治疗杂志》宣布:“稿件审查过程中,本刊编辑部将采用‘学术不端文献检测系统’,通过大量国内外学术文献的全文比对,对稿件进行学术不端行为的检查。”[5]目前,我国大部分学术期刊已使用该软件对来稿进行不端检测,高等学校、科研机构等也广泛采用了该系统。
以学术不端文献检测系统为标志的反剽窃软件的出现,反映了人们希望净化学术生态环境的良好愿望。然而,学术不端是一个非常敏感的话题,以技术手段检测学术不端行为是个更为敏感的话题。系统投入使用后,迅速引起各方的强烈反响,人们有着许多不同的看法。
“这个‘检测系统’还没正式应用,它的准确性和科学性便受到一些老师和学生的质疑,继而引发了一场争论。”[6]虽然学术不端文献检测系统的范围包括期刊论文、学位论文、职称论文、项目评审等多个领域,但目前对检测系统进行学术研究的多为期刊编辑,所以热烈的学术讨论也基本在期刊编辑中展开。
.—— END ——.