学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
矩阵的奇异值分解在文本分类研究中的应用
被引:14
作者
:
刘贵龙
论文数:
0
引用数:
0
h-index:
0
机构:
北京语言文化大学计算机科学与技术系
刘贵龙
王慧玲
论文数:
0
引用数:
0
h-index:
0
机构:
北京语言文化大学计算机科学与技术系
王慧玲
宋柔
论文数:
0
引用数:
0
h-index:
0
机构:
北京语言文化大学计算机科学与技术系
宋柔
机构
:
[1]
北京语言文化大学计算机科学与技术系
[2]
北京语言文化大学计算机科学与技术系 北京
[3]
北京
[4]
北京
来源
:
计算机工程
|
2002年
/ 12期
关键词
:
奇异值分解;
文本分类;
训练语料;
矢量;
D O I
:
暂无
中图分类号
:
TP182 [专家系统、知识工程];
学科分类号
:
1111 ;
摘要
:
用向量空间的方法对文本进行分类是指通过对训练语料的学习,对每个类建立反映该类特征的向量,然后对每一个新的文本,提取其反映该文本特征的向量以确定其类别的过程。文章利用矩阵的奇异值分解理论,把被测文本的向量与所建立的标准向量(降维后)逐一比较,自动确定该文本的分类,经过开放式试验,获得了较好的效果。
引用
收藏
页码:17 / 18+100 +100
页数:3
相关论文
共 1 条
[1]
汉语文本按语体分类的研究[A]. 王慧玲,宋柔,戴伟长.自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C]. 2001
←
1
→
共 1 条
[1]
汉语文本按语体分类的研究[A]. 王慧玲,宋柔,戴伟长.自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C]. 2001
←
1
→