基于分层高斯混合模型的半监督学习算法

被引:23
作者
孙广玲
唐降龙
不详
机构
[1] 哈尔滨工业大学计算机科学与技术学院
[2] 哈尔滨工业大学计算机科学与技术学院 哈尔滨
[3] 哈尔滨
关键词
半监督学习; 高斯混合模型; 分层高斯混合模型; EM算法;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
提出了一种基于分层高斯混合模型的半监督学习算法 半监督学习算法的学习样本包括已标记类别样本和未标记类别学习样本 如用高斯混合模型拟合每个类别已标记学习样本的概率分布 ,进而用高斯数为类别数的分层高斯混合模型拟合全部 (已标记和未标记 )学习样本的分布 ,则形成为一个基于分层的高斯混合模型的半监督学习问题 基于EM算法 ,首先利用每个类别已标记样本学习高斯混合模型 ,然后以该模型参数和已标记样本的频率分布作为分层高斯混合模型参数的初值 ,给出了基于分层高斯混合模型的半监督学习算法 以银行票据印刷体数字识别做实验 ,实验结果表明 ,本算法能够获得较好的效果
引用
收藏
页码:156 / 161
页数:6
相关论文
共 1 条
[1]   Text Classification from Labeled and Unlabeled Documents using EM [J].
Kamal Nigam ;
Andrew Kachites Mccallum ;
Sebastian Thrun ;
Tom Mitchell .
Machine Learning, 2000, 39 :103-134