共 4 条
一个基于字特征的文本分类模型
被引:2
作者:
王梦云
王素格
机构:
[1] 山西大学计算机科学系
[2] 山西大学数学系 太原
[3] 太原
来源:
关键词:
字;
文本分类;
分类矩阵;
特征向量;
D O I:
暂无
中图分类号:
TP391.12 [];
学科分类号:
081203 ;
0835 ;
摘要:
提出了一种基于字特征的中文文本分类方法。该方法的出发点是变常用的基于表层的匹配为基于概念的匹配,用汉字特征向量作为文本的表示方法。算法根据文本中汉字的特征建立文本表示矩阵和类别表示矩阵,并通过线性最小二乘算法形成分类矩阵。
引用
收藏
页码:64 / 65+191
+191
页数:3
相关论文