共 11 条
基于词序统计组合的中文文本关键词提取技术
被引:10
作者:
苏祥坤
[1
]
吾守尔斯拉木
[1
]
买买提依明哈斯木
[1
,2
]
机构:
[1] 新疆大学信息科学与工程学院新疆多语种信息技术实验室
[2] 和田师范专科学校计算机科学系
来源:
关键词:
权重;
词序;
关键词;
单文本;
词语组合;
D O I:
10.16208/j.issn1000-7024.2015.06.045
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
摘要:
为进一步改善关键词提取的效果,提出一种基于词序统计组合的关键词提取方法。通过词序统计、词性标注、停用词过滤、词语组合等步骤,实现短语或组合词的生成和候选关键词的过滤;通过其它特征项的引入,进一步提高最终提取关键词的准确度。实验结果表明,该方法对中文文本的关键词提取具有良好的效果。
引用
收藏
页码:1647 / 1651
页数:5
相关论文