共 2 条
基于多重启发式规则的中文文本特征值提取方法
被引:2
作者:
邹娟
周经野
邓成
刘玲
机构:
[1] 湘潭大学信息工程学院
来源:
关键词:
文本分类;
特征值提取;
自然语言处理;
D O I:
暂无
中图分类号:
TP391.1 [文字信息处理];
学科分类号:
081203 ;
0835 ;
摘要:
本文根据中文文本的特点,以一种新的同义概念来替代传统的词为单位,并给出了同义概念之间权值的全新计算方法。我们不仅考虑了文本中词汇概率信息,还结合文本语义等多方面来提取文本特征值,从而提出了一种基于多重启发式规则的中文文本特征值提取方法,并给出了特征值提取模型和算法。通过与传统特征值提取方法的比较实验,证明本文中提出的特征值提取方法能有效地提高文本分类正确率,并达到了有效降低特征向量维数的目的。
引用
收藏
页码:78 / 80+104
+104
页数:4
相关论文