基于主动学习的模式类别挖掘模型

被引:8
作者
郭虎升 [1 ]
王文剑 [1 ,2 ]
机构
[1] 山西大学计算机与信息技术学院
[2] 计算智能与中文信息处理教育部重点实验室(山西大学)
关键词
模式类别挖掘; 主动学习; PMAL模型; 差异度; 标记代价;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
在实际应用问题中,由于客观世界物质的多样性、模糊性和复杂性,经常会遇到大量未知样本类别信息的数据挖掘问题,而传统方法往往都依赖于已知样本类别信息才能对数据进行有效挖掘,对于未知模式类别信息的多类数据目前还没有有效的处理方法.针对未知类别信息的多类样本挖掘问题,提出了一种基于主动学习的模式类别挖掘模型(pattern class mining model based on active learning,PMAL)来解决未知类别信息的模式类别挖掘问题.该模型通过衡量已得到的模式类别与未标记样本间的关系,引入样本差异度的方法来抽取最有价值样本,通过主动学习方式以较小的标记代价快速挖掘无标记样本所蕴含的可能模式类别,从而有助于将无类别标记的多分类问题转化成有类别标记的多分类问题.实验结果表明,PMAL算法能够以较小的标记代价处理无类别信息的模式类别挖掘问题.
引用
收藏
页码:2148 / 2159
页数:12
相关论文
共 9 条
[1]
一种新的支持向量机主动学习策略 [J].
白龙飞 ;
王文剑 ;
郭虎升 .
南京大学学报(自然科学版), 2012, 48 (02) :182-189
[2]
Combining Committee-Based Semi-Supervised Learning and Active Learning [J].
Hady, Mohamed Farouk Abdel ;
Schwenker, Friedhelm .
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2010, 25 (04) :681-698
[3]
一种新的SVM主动学习算法及其在障碍物检测中的应用 [J].
韩光 ;
赵春霞 ;
胡雪蕾 .
计算机研究与发展, 2009, 46 (11) :1934-1941
[4]
主动贝叶斯网络分类器 [J].
宫秀军 ;
孙建平 ;
史忠植 .
计算机研究与发展, 2002, (05) :574-579
[5]
Efficient classifiers for multi-class classification problems [J].
Lin, Hung-Yi .
DECISION SUPPORT SYSTEMS, 2012, 53 (03) :473-481
[6]
Two faces of active learning [J].
Dasgupta, Sanjoy .
THEORETICAL COMPUTER SCIENCE, 2011, 412 (19) :1767-1781
[7]
A novel framework for multi-class classification via ternary smooth support vector machine.[J].Chih-Cheng Chang;Li-Jen Chien;Yuh-Jye Lee.Pattern Recognition.2010, 6
[8]
A stopping criterion for active learning.[J].Andreas Vlachos.Computer Speech & Language.2007, 3
[9]
Selective sampling using the query by committee algorithm [J].
Freund, Y ;
Seung, HS ;
Shamir, E ;
Tishby, N .
MACHINE LEARNING, 1997, 28 (2-3) :133-168