词语位置加权TextRank的关键词抽取研究

被引:78
作者
夏天 [1 ,2 ]
机构
[1] 中国人民大学数据工程与知识工程教育部重点实验室
[2] 中国人民大学信息资源管理学院
关键词
抽取; 词排序; TextRank; 图模型; LDA;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
把关键词抽取问题看作是构成文档词语的重要性排序问题,基于TextRank基本思想,构建候选关键词图,引入覆盖影响力、位置影响力和频度影响力用于计算词语之间的影响力概率转移矩阵,通过迭代法实现候选关键词分值计算,并挑选前N个作为关键词抽取结果。实验结果表明,对词语位置加权的TextRank方法优于传统的TextRank方法和基于LDA主题模型的关键词抽取方法。
引用
收藏
页码:30 / 34
页数:5
相关论文
共 5 条
[1]   基于主题特征的关键词抽取 [J].
刘俊 ;
邹东升 ;
邢欣来 ;
李英豪 .
计算机应用研究, 2012, 29 (11) :4224-4227
[2]   中心网页中主题网页链接的自动抽取 [J].
夏天 .
山东大学学报(理学版), 2012, 47 (05) :25-31
[3]   基于扩展标记树的网页正文抽取 [J].
夏天 .
广西师范大学学报(自然科学版), 2011, 29 (01) :133-137
[4]   基于LDA模型的主题词抽取方法 [J].
石晶 ;
李万龙 .
计算机工程, 2010, 36 (19) :81-83
[5]   Learning algorithms for keyphrase extraction [J].
Turney P.D. .
Information Retrieval, 2000, 2 (4) :303-336