基于改进TextRank的关键词抽取算法

被引:14
作者
张莉婧
李业丽
曾庆涛
雷嘉丽
杨鹏
机构
[1] 北京印刷学院
关键词
TextRank-CM算法; TextRank算法; G1赋权法; 关键词抽取;
D O I
10.19461/j.cnki.1004-8626.2016.04.013
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了解决TextRank算法的初始权值问题,提高关键词的抽取质量,在TextRank算法的基础上,引入了G1赋权法对TF-IDF算法的词语位置、词语长度和词性等3个属性赋予不同的权重,设计并实现了综合权重法的关键词抽取算法——TextRank-CM算法。将TextRank-CM算法、TextRank+TF-IDF算法和TextRank算法分别应用于中文关键词的抽取,结果表明:TextRank-CM算法在中文关键词抽取中的准确率和召回率明显优于另两种算法。
引用
收藏
页码:51 / 55
页数:5
相关论文
共 9 条
[1]   结合词语分布信息的TFIDF关键词抽取方法研究 [J].
徐振强 ;
李保利 .
中原工学院学报, 2014, 25 (06) :59-63
[2]   词语位置加权TextRank的关键词抽取研究 [J].
夏天 .
现代图书情报技术, 2013, (09) :30-34
[3]   基于语义的中文文本关键词提取算法 [J].
王立霞 ;
淮晓永 .
计算机工程, 2012, 38 (01) :1-4
[4]   基于G1赋权法的部队装备保障演练考核指标体系权重研究 [J].
冯向敏 ;
阮拥军 ;
赵武奎 .
科技广场, 2009, (05) :17-20
[5]  
TF-IDF与规则结合的中文关键词自动抽取研究[D]. 牛萍.大连理工大学. 2015
[6]  
基于信息融合的Web信息可信度研究[D]. 罗庆平.中南大学. 2014
[7]  
文本挖掘关键词提取算法的研究[D]. 王良芳.浙江工业大学. 2013
[8]  
An Extended Keyword Extraction Method[J] . Bao Hong,Deng Zhen.Physics Procedia . 2012
[9]   Using lexical chains for keyword extraction [J].
Ercan, Gonenc ;
Cicekli, Ilyas .
INFORMATION PROCESSING & MANAGEMENT, 2007, 43 (06) :1705-1714