共 2 条
基于提取关键词的中文文档复制检测研究
被引:6
作者:
麻会东
刘国华
李旭
梁鹏
刘春辉
张凌宇
机构:
[1] 燕山大学信息科学与工程学院
来源:
关键词:
指纹;
剽窃;
文本块;
匹配;
D O I:
暂无
中图分类号:
TP309.3 [数据备份与恢复];
学科分类号:
摘要:
文档复制检测技术在保护知识产权和信息索引中起重要作用,它可以防止剽窃事件的发生,提高互联网检索效率。目前,英文复制检测技术已经比较成熟,但中文复制检测技术研究还处于起步阶段。本文提出一种基于关键词的指纹提取方法;提出k-words方法分解句子;定义了数字指纹树概念,并用数字指纹树来存储指纹。最后,用实验验证了所提出的方法。
引用
收藏
页码:63 / 64+88
+88
页数:3
相关论文