结合主题分布与统计特征的关键词抽取方法

被引:17
作者
刘啸剑 [1 ]
谢飞 [2 ]
机构
[1] 合肥工业大学计算机与信息学院
[2] 合肥师范学院计算机学院
关键词
主题分布; 关键词抽取; 统计特征; 主题信息; 候选词语;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
120506 [数字人文];
摘要
传统人工抽取关键词耗时耗力,为了能自动从文档中抽取出高质量的关键词,提出一种关键词自动抽取方法。该方法基于文档和词语的主题信息并结合词语的统计特征为候选词语打分,最终选择TopK得分的候选词作为文档关键词。实验结果表明,该方法在准确率、召回率以及F值上均优于现有的基本关键词抽取方法,能有效从文档中抽取出关键词。
引用
收藏
页码:217 / 222
页数:6
相关论文
共 6 条
[1]
基于语义的中文文本关键词提取算法 [J].
王立霞 ;
淮晓永 .
计算机工程, 2012, 38 (01) :1-4
[2]
基于词汇链的中文新闻网页关键词抽取方法 [J].
胡学钢 ;
李星华 ;
谢飞 ;
吴信东 .
模式识别与人工智能, 2010, 23 (01) :45-51
[3]
基于语义联系的新闻网页关键词抽取 [J].
谢飞 ;
吴信东 ;
胡学钢 ;
李星华 ;
江兆中 .
广西师范大学学报(自然科学版), 2009, 27 (01) :145-148
[4]
基于主题描述模型的相关性判断在网页信息抽取中的应用.[J].谭胜;马静;吴一占;.情报学报.2011, 02
[5]
Learning algorithms for keyphrase extraction [J].
Turney P.D. .
Information Retrieval, 2000, 2 (4) :303-336
[6]
Improving browsing in digital libraries with keyphrase indexes [J].
Gutwin, Carl ;
Paynter, Gordon ;
Witten, Ian ;
Nevill-Manning, Craig ;
Frank, Eibe .
Decision Support Systems, 1999, 27 (01) :81-104