基于局部词频指纹的论文抄袭检测算法

被引:16
作者
秦玉平 [1 ]
冷强奎 [1 ]
王秀坤 [2 ]
王春立 [3 ]
机构
[1] 渤海大学信息科学与工程学院
[2] 大连理工大学电子与信息工程学院
[3] 大连海事大学信息科学技术学院
关键词
抄袭检测; 数字指纹; 局部词频; 相似度;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
提出一种基于局部词频指纹的论文抄袭检测算法。将句子看成文档的基本构成元素,对其进行有效关键词提取排序重构,根据编码和词频联合方式获取句子指纹,以此计算文本间相似度。在新闻网页精简集SOGOU-T上的实验结果表明,该算法在一定程度上克服了现有论文抄袭检测算法检测精度低的缺点,具有较快的检测速度。
引用
收藏
页码:193 / 194+197 +197
页数:3
相关论文
共 7 条
[1]
一种基于段落词频统计的论文抄袭判定算法 [J].
赵俊杰 ;
胡学钢 .
计算机技术与发展, 2009, 19 (04) :231-233+238
[2]
基于本体的论文复制检测系统 [J].
聂规划 ;
付志超 ;
陈冬林 ;
刘平峰 .
计算机工程, 2009, 35 (06) :79-81+84
[3]
基于句子相似度的文档复制检测算法研究 [J].
秦新国 .
现代图书情报技术, 2007, (11) :63-66
[4]
基于篇章结构相似度的复制检测算法 [J].
金博 ;
史彦军 ;
滕弘飞 .
大连理工大学学报, 2007, (01) :125-130
[5]
抄袭论文识别研究与进展 [J].
史彦军 ;
滕弘飞 ;
金博 .
大连理工大学学报, 2005, (01) :50-57
[6]
Collection statistics for fast duplicate document detection [J].
Chowdhury, A ;
Frieder, O ;
Grossman, D ;
McCabe, MC .
ACM TRANSACTIONS ON INFORMATION SYSTEMS, 2002, 20 (02) :171-191
[7]
Exploring the similarity space.[J].Justin Zobel;Alistair Moffat.ACM SIGIR Forum.1998, 1