一个基于字特征的文本分类模型

被引:2
作者
王梦云
王素格
机构
[1] 山西大学计算机科学系
[2] 山西大学数学系 太原
[3] 太原
关键词
字; 文本分类; 分类矩阵; 特征向量;
D O I
暂无
中图分类号
TP391.12 [];
学科分类号
081203 ; 0835 ;
摘要
提出了一种基于字特征的中文文本分类方法。该方法的出发点是变常用的基于表层的匹配为基于概念的匹配,用汉字特征向量作为文本的表示方法。算法根据文本中汉字的特征建立文本表示矩阵和类别表示矩阵,并通过线性最小二乘算法形成分类矩阵。
引用
收藏
页码:64 / 65+191 +191
页数:3
相关论文
共 4 条
[1]   一种基于向量空间模型的多层次文本分类方法 [J].
刘少辉 ;
董明楷 ;
张海俊 ;
李蓉 ;
史忠植 .
中文信息学报, 2002, (03) :8-14+26
[2]   一个基于概念的中文文本分类模型 [J].
苏伟峰 ;
李绍滋 ;
李堂秋 .
计算机工程与应用, 2002, (06) :193-195
[3]   基于字频向量的中文文本自动分类系统 [J].
王梦云 ;
曹素青 .
情报学报, 2000, (06) :644-649
[4]   一个中文文本自动分类数学模型 [J].
曹素青 ;
曾伏虎 ;
曹焕光 .
情报学报, 1999, (01) :27-32