一种基于正则化的半监督多标记学习方法

被引:19
作者
李宇峰
黄圣君
周志华
机构
[1] 计算机软件新技术国家重点实验室(南京大学)
关键词
机器学习; 多标记学习; 半监督学习; 网页分类; 基因功能分析;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
多标记学习主要用于解决单个样本同时属于多个类别的问题.传统的多标记学习通常假设训练数据集含有大量有标记的训练样本.然而在许多实际问题中,大量训练样本中通常只有少量有标记的训练样本.为了更好地利用丰富的未标记训练样本以提高分类性能,提出了一种基于正则化的归纳式半监督多标记学习方法——MASS.具体而言,MASS首先在最小化经验风险的基础上,引入两种正则项分别用于约束分类器的复杂度及要求相似样本拥有相似结构化多标记输出,然后通过交替优化技术给出快速解法.在网页分类和基因功能分析问题上的实验结果验证了MASS方法的有效性.
引用
收藏
页码:1272 / 1278
页数:7
相关论文
共 6 条
[1]   一种针对弱标记的直推式多标记分类方法 [J].
孔祥南 ;
黎铭 ;
姜远 ;
周志华 .
计算机研究与发展, 2010, (08) :1392-1399
[2]   Learning multi-label scene classification [J].
Boutell, MR ;
Luo, JB ;
Shen, XP ;
Brown, CM .
PATTERN RECOGNITION, 2004, 37 (09) :1757-1771
[3]  
BoosTexter: A Boosting-based System for Text Categorization[J] . Robert E. Schapire,Yoram Singer.Machine Learning . 2000 (2-3)
[4]   ON THE CONVERGENCE OF THE COORDINATE DESCENT METHOD FOR CONVEX DIFFERENTIABLE MINIMIZATION [J].
LUO, ZQ ;
TSENG, P .
JOURNAL OF OPTIMIZATION THEORY AND APPLICATIONS, 1992, 72 (01) :7-35
[5]  
A unified model for multilabel classification and ranking .2 K. Brinker,J. Furnkranz,E. Hullermeier. Proceedings of the 17th European Conference on Artificial Intelligence . 2006
[6]  
Multi-label text classification with a mixture model trained by EM .2 MCCALLUM A.K. Proceedings of the AAAI‘99 Workshop on Text Learning . 1999