基于语义特征的自动文本分类方法

被引:1
作者
胡晓辉
徐也可
刘斌
机构
[1] 江西机电职业技术学院信息与管理工程系
关键词
文本分类; 语义特征; 向量空间模型; 图形模型; 算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
自动文本分类是指在给定的分类体系下,让计算机根据文本的内容确定与它相关联的类别。现有的文本分类算法大都基于向量空间模型,因而不能充分表达文档的语义特征信息,从而影响了分类器性能。针对此问题,本文通过训练文档构造相似矩阵,从中获得每个类别的主题信息,由此构造分类器,最后与经典的分类器进行组合以确定文本类别。实验系统证明本文提出的分类方法较大改进了分类器性能。
引用
收藏
页码:9 / 11+15 +15
页数:4
相关论文
共 8 条
[1]   基于随机森林的文本分类模型研究 [J].
张华伟 ;
王明文 ;
甘丽新 .
山东大学学报(理学版), 2006, (03) :139-143
[2]   向量空间法中单词权重函数的分析和构造 [J].
陆玉昌 ;
鲁明羽 ;
李凡 ;
周立柱 .
计算机研究与发展, 2002, (10) :1205-1210
[3]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[4]  
基于模糊—粗糙集的文本分类模型[D]. 付雪峰.江西师范大学. 2005
[5]  
统计学习基础[M]. 电子工业出版社 , (美)TrevorHastie等著, 2004
[6]  
模式识别[M]. 清华大学出版社[美]J.P.MarquesdeSa著, 2002
[7]  
模式识别[M]. 清华大学出版社 , 边肇祺等编著, 2000
[8]   INSTANCE-BASED LEARNING ALGORITHMS [J].
AHA, DW ;
KIBLER, D ;
ALBERT, MK .
MACHINE LEARNING, 1991, 6 (01) :37-66