基于多特征的中文关键词抽取方法

被引:6
作者
杨颖 [1 ]
戴彬 [2 ]
机构
[1] 川北医学院基础医学院
[2] 西华师范大学商学院
关键词
关键词抽取; 词频; 关联度; 文本聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
关键词抽取是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在分析传统中文关键词抽取方法不足的基础上,提出一种基于多特征的中文关键词提取方法。该方法在抽取中文关键词过程中,从词频、关联度、词性以及位置等多种特征来全面考查关键词,有效地避免了传统关键词提取方法产生的偏差。实验结果表明,与传统方法相比,该方法在不同测试集上关键词提取的平均召回率均得到明显提升。
引用
收藏
页码:109 / 112
页数:4
相关论文
共 11 条
[1]   基于互信息和粗糙集理论的特征选择 [J].
朱颢东 ;
李红婵 .
计算机工程, 2011, 37 (15) :181-183
[2]   基于词汇链的关键词自动标引方法 [J].
李纲 ;
戴强斌 .
图书情报知识 , 2011, (03) :67-71
[3]   基于小世界模型的复合关键词提取方法研究 [J].
马力 ;
焦李成 ;
白琳 ;
周雅夫 ;
董洛兵 .
中文信息学报, 2009, 23 (03) :121-128
[4]   一种基于复杂网络特征的中文文档关键词抽取算法 [J].
赵鹏 ;
蔡庆生 ;
王清毅 ;
耿焕同 .
模式识别与人工智能, 2007, 20 (06) :827-831
[5]   一种基于词汇链的关键词抽取方法 [J].
索红光 ;
刘玉树 ;
曹淑英 .
中文信息学报, 2006, (06) :25-30
[6]   基于文本分类TFIDF方法的改进与应用 [J].
张玉芳 ;
彭时名 ;
吕佳 .
计算机工程, 2006, (19) :76-78
[7]   基于最小词频阈值的文档特征选择 [J].
陈晓云 ;
李荣陆 ;
胡运发 .
模式识别与人工智能, 2006, 19 (04) :531-537
[8]   Faster Dimension Reduction [J].
Ailon, Nir ;
Chazelle, Bernard .
COMMUNICATIONS OF THE ACM, 2010, 53 (02) :97-104
[9]  
Optimal feature selection for support vector machines[J] . Minh Hoai Nguyen,Fernando de la Torre.Pattern Recognition . 2009 (3)
[10]  
Feature subset selection in large dimensionality domains[J] . Iffat A. Gheyas,Leslie S. Smith.Pattern Recognition . 2009 (1)