基于支持向量机的中文文本自动分类研究

被引:26
作者
都云琪
肖诗斌
机构
[1] 西安电子科技大学计算机学院
[2] 北京信息工程学院中文信息处理研究中心 西安
[3] 北京
关键词
文本分类; 线性支持向量机; 招回率; 准确率;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
根据文本数据学习的特点,采用线性支持向量机(LSVM)学习算法,实现了一个中文文本自动分类系统,并对该系统进行了针对大规模真实文本的试验测试。结果发现,系统的招回率较低,而准确率较高,该文对此结果进行了分析,并提出了一种采用训练中拒识样本信息对分类器输出进行改进的方法,试验表明,该方法有效地提高了系统的性能,取得了令人满意的结果。
引用
收藏
页码:137 / 138+289 +289
页数:3
相关论文
共 2 条
[1]  
统计学习理论的本质.[M].(美)VladimirN.Vapnik著;张学工译;.清华大学出版社.2000,
[2]   独立于语种的文本分类方法 [J].
黄萱菁 ;
吴立德 ;
石崎洋之 ;
徐国伟 .
中文信息学报, 2000, (06) :1-7