矩阵的奇异值分解在文本分类研究中的应用

被引:14
作者
刘贵龙
王慧玲
宋柔
机构
[1] 北京语言文化大学计算机科学与技术系
[2] 北京语言文化大学计算机科学与技术系 北京
[3] 北京
[4] 北京
关键词
奇异值分解; 文本分类; 训练语料; 矢量;
D O I
暂无
中图分类号
TP182 [专家系统、知识工程];
学科分类号
1111 ;
摘要
用向量空间的方法对文本进行分类是指通过对训练语料的学习,对每个类建立反映该类特征的向量,然后对每一个新的文本,提取其反映该文本特征的向量以确定其类别的过程。文章利用矩阵的奇异值分解理论,把被测文本的向量与所建立的标准向量(降维后)逐一比较,自动确定该文本的分类,经过开放式试验,获得了较好的效果。
引用
收藏
页码:17 / 18+100 +100
页数:3
相关论文
共 1 条
  • [1] 汉语文本按语体分类的研究[A]. 王慧玲,宋柔,戴伟长.自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C]. 2001