半监督文本分类综述

被引:10
作者
牛罡
罗爱宝
商琳
机构
[1] 南京大学计算机软件新技术国家重点实验室
关键词
文本分类; 半监督学习; 朴素贝叶斯; 流形和谱图;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
文本分类是人们日常工作中经常遇到的问题,也是机器学习的重要研究内容。半监督学习算法同时考虑有标记和无标记数据,能显著提升学习效果。给出了文本分类的定义和特点,介绍了传统的监督学习分类算法和评价指标,对半监督文本分类的特点和基础理论进行了分析,并具体介绍了一些半监督文本分类算法,如贝叶斯方法和正则化方法。
引用
收藏
页码:313 / 323
页数:11
相关论文
共 3 条
[1]   Machine learning in automated text categorization [J].
Sebastiani, F .
ACM COMPUTING SURVEYS, 2002, 34 (01) :1-47
[2]  
Maximum Likelihood from Incomplete Data via the EM Algorithm[J] . A. P. Dempster,N. M. Laird,D. B. Rubin.Journal of the Royal Statistical Society. Series . 1977 (1)
[3]  
Learning from labeled and unlabeled data using graph mincuts .2 Blum A,Chawla S. Proceedings of International Conference on Machine Learning (ICML) . 2001