融合关键词增补与领域本体的共词分析方法研究

被引:19
作者
唐晓波
肖璐
机构
[1] 武汉大学信息资源研究中心
关键词
共词分析; 增补词典; 领域本体;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对传统共词分析中的不足,提出一个新的共词分析过程模型,该模型从两个方面对传统共词分析方法进行改进。首先,自标引关键词不能全面描述论文主题内容,需对其进行增补。选择高频自标引关键词构成增补词典,利用基于增补词典的分词技术从标题中提取论文候选关键词,按一定规则进行增补。其次,针对共现频次较难准确描述词对相似度,引入领域本体来计算高频关键词对的语义相似度,综合考虑共现频次和语义相似度值得到词对的相关度值。用相关度来描述词对相似度,并作为构建共词矩阵的依据。最后通过实验证明改进方法的有效性。
引用
收藏
页码:60 / 67
页数:8
相关论文
共 19 条