基于自动文本分类的关键词抽取算法

被引：17

作者：

张虹

机构：

[1] 潍坊学院计算机与通信工程学院

来源：

关键词：

文本分类; 分词技术; 关键词抽取; 遗传算法;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

081203 ; 0835 ;

摘要：

分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来,准确完成抽取关键词的工作,并具有一定的通用性。

引用

页码：145 / 147

页数：3