文本分类关键技术

被引:2
作者
谷峰
吴扬扬
机构
[1] 华侨大学计算机科学系
关键词
文本分类; 特征选择; 向量空间模型; 潜在语义模型; 概率模型;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
本文介绍了文本分类的基本原理及关键技术,讨论目前的一些主要算法,对现有的文本分类算法进行分析和比较,并针对目前文本分类技术的不足之处,提出今后文本分类研究的方向和目标。
引用
收藏
页码:5 / 6+8 +8
页数:3
相关论文
共 9 条
[1]   汉语分词技术综述 [J].
龚汉明 ;
周长胜 .
北京机械工业学院学报, 2004, (03) :52-55+61
[2]   文本分类中的特征选择方法 [J].
程泽凯 ;
陆小艺 .
安徽工业大学学报(自然科学版), 2004, (03) :220-224
[3]   一种基于层次结构的科技论文分类模型 [J].
姚力群 ;
吴高巍 .
计算机工程与应用, 2004, (06) :18-22
[4]   基于本体实现对网页文本的自动主题分类 [J].
刘娇蛟 ;
龚丽 ;
李建华 .
计算机工程, 2003, (11) :95-97
[5]   主动贝叶斯网络分类器 [J].
宫秀军 ;
孙建平 ;
史忠植 .
计算机研究与发展, 2002, (05) :574-579
[6]   基于序列的文本自动分类算法 [J].
解冲锋 ;
李 星 .
软件学报, 2002, (04) :783-789
[7]   基于向量空间模型的文本自动分类系统的研究与实现 [J].
庞剑锋 ;
卜东波 ;
白硕 .
计算机应用研究, 2001, (09) :23-26
[8]   Lazy learning of Bayesian rules [J].
Zheng, ZJ ;
Webb, GI .
MACHINE LEARNING, 2000, 41 (01) :53-84
[9]   SUPPORT-VECTOR NETWORKS [J].
CORTES, C ;
VAPNIK, V .
MACHINE LEARNING, 1995, 20 (03) :273-297