基于高维聚类技术的中文关键词提取算法

被引:2
作者
高学东
吴玲玉
机构
[1] 北京科技大学经济管理学院
关键词
关键词提取; 小词典分词; 高维聚类; CABOSFV;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
关键词提取是中文信息处理技术研究中的热点和难点,基于统计信息的方法是其中一个重要分支。本文针对基于统计信息关键词提取方法准确率低的问题,提出基于高维聚类技术的中文关键词提取算法。算法通过依据小词典的快速分词、二次分词、高维聚类和关键词甄选4个步骤实现关键词的提取。理论分析和实验显示,基于高维聚类技术的中文关键词提取方法具备更好的稳定性、更高的效率和更准确的结果。
引用
收藏
页码:23 / 27
页数:5
相关论文
共 5 条
[1]   一种基于复杂网络特征的中文文档关键词抽取算法 [J].
赵鹏 ;
蔡庆生 ;
王清毅 ;
耿焕同 .
模式识别与人工智能, 2007, 20 (06) :827-831
[2]   Keyword Extraction Based on tf/idf for Chinese News Document [J].
LI JuanziFAN QinaZHANG Kuo Department of Computer Science and TechnologyTsinghua UniversityBeijing China .
Wuhan University Journal of Natural Sciences, 2007, (05) :917-921
[3]   一种基于词汇链的关键词抽取方法 [J].
索红光 ;
刘玉树 ;
曹淑英 .
中文信息学报, 2006, (06) :25-30
[4]   基于新的关键词提取方法的快速文本分类系统 [J].
罗杰 ;
陈力 ;
夏德麟 ;
王凯 .
计算机应用研究, 2006, (04) :32-34
[5]  
高维稀疏聚类知识发现[M]. 冶金工业出版社 , 武森等著, 2003