文本分类及算法综述

被引:17
作者
张征杰
王自强
机构
[1] 河南工业大学
关键词
文本分类; 文本表示; 向量空间模型; 特征选择; 权重; 分类算法;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
为了能在海量的文本中及时准确地获得有效的信息,文本分类技术受到了广泛的关注。该文概括地介绍了文本分类的一般分类过程,详细阐述文本表示、特征选取和权重的计算,并对几种典型文本分类算法的基本思想、优缺点等进行了讨论。
引用
收藏
页码:825 / 828+841 +841
页数:5
相关论文
共 5 条
[1]   中文分词算法概述 [J].
龙树全 ;
赵正文 ;
唐华 .
电脑知识与技术, 2009, 5 (10) :2605-2607
[2]   基于概念的文本表示模型 [J].
陈龙 ;
范瑞霞 ;
高琪 .
计算机工程与应用, 2008, (20) :162-164
[3]   文本的图表示初探 [J].
周昭涛 ;
卜东波 ;
程学旗 .
中文信息学报, 2005, (02) :36-43
[4]  
基于贝叶斯模型的文档分类及相关技术研究[D]. 古平.重庆大学. 2006
[5]  
基于统计方法的中文文本自动分类研究[D]. 骆昌日.华中师范大学. 2004