一种增强差异性的半监督协同分类算法

被引:9
作者
于重重 [1 ,2 ]
商利利 [2 ]
谭励 [2 ]
涂序彦 [1 ]
杨扬 [1 ]
王竞燕 [2 ]
机构
[1] 北京科技大学计算机与通信工程学院
[2] 北京工商大学计算机与信息工程学院
关键词
半监督协同分类算法; Tr-iTraining算法; 增强差异性策略; 分层抽样法;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
摘要
半监督学习中的Tr-i Training算法打破了以往算法对充分冗余视图的限制,并通过利用三个分类器处理标记置信度和样本预测问题提高了标记效率.为进一步增强协同训练过程中分类器之间的差异性以提高性能,本文在其理论基础上提出了一种增强差异性的半监督协同分类算法.该算法利用三个不同的分类器进行学习;考虑到分类模型在更新过程中,可能会因随机抽样导致性能恶化,该算法利用基于标记类别的分层抽样法来对已标记样本集进行抽样,并通过基于分类正确率的加权投票法实现了分类器的集成,提高了预测准确率.本文通过实验对所提出算法与Tr-i Training算法做了性能比较,实验结果表明本文所提出的方法在分类问题上具有较好的性能,验证了该算法的有效性和可行性.
引用
收藏
页码:35 / 41
页数:7
相关论文
共 5 条
[1]  
Creating diversity in ensembles using artificial data.[J].Prem Melville;Raymond J. Mooney.Information Fusion.2004, 1
[2]  
机器学习及其应用.[M].王珏;周志华;周傲英主编;.清华大学出版社.2006,
[3]   基于图的Co-Training网页分类 [J].
侯翠琴 ;
焦李成 .
电子学报, 2009, 37 (10) :2173-2180+2219
[4]   基于随机子空间的半监督协同训练算法 [J].
王娇 ;
罗四维 ;
曾宪华 .
电子学报, 2008, 36(S1) (S1) :60-65
[5]   基于差异性评估对Co-training文本分类算法的改进 [J].
唐焕玲 ;
林正奎 ;
鲁明羽 .
电子学报, 2008, 36(S1) (S1) :138-143