一种改进的基于句子相似度的检测算法

被引:1
作者
邢长征
孙伟
机构
[1] 辽宁工程技术大学电信学院
关键词
文档复制检测; 句子相似度; 指纹; 词频统计;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
基于句子相似度的文档复制检测算法在抓住了文档的全局特征的同时又兼顾文档的结构信息,在该算法的基础上对相似度算法进行了改进,解决了人工设定阈值的问题,并提高了检测精度。实验证明,该算法是可行的,并减少了响应时间。
引用
收藏
页码:90 / 92
页数:3
相关论文
共 4 条
[1]   一种文本相似性的度量方法和计算方法 [J].
何明 ;
胡彩霞 .
黄山学院学报, 2005, (06) :71-72
[2]   抄袭论文识别研究与进展 [J].
史彦军 ;
滕弘飞 ;
金博 .
大连理工大学学报, 2005, (01) :50-57
[3]   自然语言文档复制检测研究综述 [J].
鲍军鹏 ;
沈钧毅 ;
刘晓东 ;
宋擒豹 .
软件学报, 2003, (10) :1753-1760
[4]   数字商品非法复制的检测算法 [J].
宋擒豹 ;
杨向荣 ;
沈钧毅 ;
齐勇 .
计算机学报, 2002, (11) :1206-1211