基于词序统计组合的中文文本关键词提取技术

被引:10
作者
苏祥坤 [1 ]
吾守尔斯拉木 [1 ]
买买提依明哈斯木 [1 ,2 ]
机构
[1] 新疆大学信息科学与工程学院新疆多语种信息技术实验室
[2] 和田师范专科学校计算机科学系
关键词
权重; 词序; 关键词; 单文本; 词语组合;
D O I
10.16208/j.issn1000-7024.2015.06.045
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
为进一步改善关键词提取的效果,提出一种基于词序统计组合的关键词提取方法。通过词序统计、词性标注、停用词过滤、词语组合等步骤,实现短语或组合词的生成和候选关键词的过滤;通过其它特征项的引入,进一步提高最终提取关键词的准确度。实验结果表明,该方法对中文文本的关键词提取具有良好的效果。
引用
收藏
页码:1647 / 1651
页数:5
相关论文
共 11 条