基于提取关键词的中文文档复制检测研究

被引:6
作者
麻会东
刘国华
李旭
梁鹏
刘春辉
张凌宇
机构
[1] 燕山大学信息科学与工程学院
关键词
指纹; 剽窃; 文本块; 匹配;
D O I
暂无
中图分类号
TP309.3 [数据备份与恢复];
学科分类号
摘要
文档复制检测技术在保护知识产权和信息索引中起重要作用,它可以防止剽窃事件的发生,提高互联网检索效率。目前,英文复制检测技术已经比较成熟,但中文复制检测技术研究还处于起步阶段。本文提出一种基于关键词的指纹提取方法;提出k-words方法分解句子;定义了数字指纹树概念,并用数字指纹树来存储指纹。最后,用实验验证了所提出的方法。
引用
收藏
页码:63 / 64+88 +88
页数:3
相关论文
共 2 条
[1]   中文文档复制检测系统研究 [J].
金博 ;
史彦军 ;
滕弘飞 .
计算机工程, 2005, (19) :79-81
[2]   数字商品非法复制和扩散的监测机制 [J].
宋擒豹 ;
沈钧毅 ;
不详 .
计算机研究与发展 , 2001, (01) :121-125