文档相似度综合计算研究

被引:41
作者
宋玲 [1 ]
马军 [1 ]
连莉 [1 ]
张志军 [2 ]
机构
[1] 不详
[2] 山东大学计算机科学与技术学院
[3] 不详
[4] 山东建筑工程学院计算机科学与技术系
[5] 不详
关键词
对象相似性; 引文图; 结构上下文相似性; 层次域结构;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
论文对几种传统的、具有代表性的文档相似度的计算方法进行了综述,并分析了各自的应用局限性。针对结构化描述的科技论文的特点,提出一种能综合文档特征信息、上下文领域知识和引用关系的新相似度计算算法,并通过原型系统讨论其有效性。
引用
收藏
页码:160 / 163
页数:4
相关论文
共 1 条
[1]   数字文档管理系统的设计与实现 [J].
衣英楠 ;
马军 .
山东大学学报(理学版), 2005, (02) :62-66