基于同义词链的中文关键词提取算法

被引:12
作者
张颖颖
谢强
丁秋林
机构
[1] 南京航空航天大学信息科学与技术学院
关键词
关键词提取; 同义词链; 语义; 消歧;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对传统中文关键词提取对语义和同义词的不重视而导致的精确度和召回率低的问题,提出基于同义词链的中文关键词提取算法。利用上下文窗口和消歧算法解决词语在上下文中的语义问题,利用文档中的同义词构建同义词链,简化候选词的选取。根据同义词链的特征,得到相应的权重计算公式,对候选词进行过滤。实验结果表明,该算法在同义词较多的文档中精确度和召回率有较大的提高,平均性能也有明显改善。
引用
收藏
页码:93 / 95
页数:3
相关论文
共 2 条