基于自动文本分类的关键词抽取算法

被引:17
作者
张虹
机构
[1] 潍坊学院计算机与通信工程学院
关键词
文本分类; 分词技术; 关键词抽取; 遗传算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来,准确完成抽取关键词的工作,并具有一定的通用性。
引用
收藏
页码:145 / 147
页数:3
相关论文
共 3 条
[1]   Bayes文本分类器的改进方法研究 [J].
鲁明羽 .
计算机工程, 2006, (17) :63-65
[2]  
信息检索理论与技术[M]. 科学技术文献出版社 , 苏新宁主编, 2004
[3]  
"Improved Automatic Keyword Extraction Given MoreLinguistic Knowledge," .2 A.Hulth. Proceedings of the Conference on Empirical Methods in Natural Language Processing (EMNLP'03) . 2003