网页与文本自动分类综述

被引:4
作者
王明文
付雪峰
左家莉
机构
[1] 江西师范大学计算机信息工程学院
[2] 南昌工程学院计算机科学与技术系
[3] 江西师范大学计算机信息工程学院 江西南昌
[4] 江西南昌
关键词
文本分类; 维数约简; 分类模型;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
文本自动分类是组织和管理文本信息的有力手段,可以在较大程度上解决信息杂乱无章的问题,使用户更容易更准确地定位所需的信息.目前,文本自动分类是信息检索领域中最前沿的研究热点之一,国内外均有大量学者从事这方面的研究.研究组对文本自动分类进行了深入细致的研究,针对文本自动分类目前存在的问题,提出了一些新的模型,大规模数据集上的实验表明该模型性能优异,表现优于很多方法.
引用
收藏
页码:20 / 25
页数:6
相关论文
共 9 条
[1]  
维数约简在网页分类中的应用.[A].万中英;王明文;廖海波;左家莉;.NCIRCS2004第一届全国信息检索与内容安全学术会议.2004,
[2]   基于核方法的潜在语义文本分类模型 [J].
罗远胜 ;
王明文 ;
曾雪强 .
清华大学学报(自然科学版), 2005, (S1) :1853-1856
[3]   基于投影寻踪回归文本自动分类的模型 [J].
廖海波 ;
万中英 ;
王明文 .
清华大学学报(自然科学版), 2005, (S1) :1823-1827
[4]   基于潜在语义的多类文本分类模型研究 [J].
叶浩 ;
王明文 ;
曾雪强 .
清华大学学报(自然科学版), 2005, (S1) :1818-1822
[5]   基于投影寻踪的中文网页分类算法 [J].
万中英 ;
王明文 ;
廖海波 .
中文信息学报, 2005, (04) :60-67
[6]   基于模糊-粗糙集的文本分类方法 [J].
付雪峰 ;
王明文 .
华南理工大学学报(自然科学版), 2004, (S1) :73-76
[7]   一种基于潜在语义结构的文本分类模型 [J].
曾雪强 ;
王明文 ;
陈素芬 .
华南理工大学学报(自然科学版), 2004, (S1) :99-102
[8]  
基于RBF网络的文本自动分类的研究.[D].王晓庆.江西师范大学.2003, 03
[9]   Text categorization based on regularized linear classification methods [J].
Zhang, T ;
Oles, FJ .
INFORMATION RETRIEVAL, 2001, 4 (01) :5-31