一种具有增量学习能力的PU主动学习算法

被引:1
作者
陈文
晏立
周亮
机构
[1] 江苏大学计算机科学与通信工程学院
关键词
PU学习; 支持向量机; 基于网格的聚类;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
在正例和无标记样本增量学习中,初始正例样本较少且不同类别正例的反例获取困难,使分类器的分类和泛化能力不强,为解决上述问题,提出一种具有增量学习能力的PU主动学习算法,在使用3个支持向量机进行协同半监督学习的同时,利用基于网格的聚类方法进行无监督学习,当分类与聚类结果不一致时,引入主动学习对无标记样本进行标记。实验结果表明,将该算法应用于Deep Web入口的在线判断和分类能有效提高入口判断的准确性及分类的正确性。
引用
收藏
页码:214 / 215+226 +226
页数:3
相关论文
共 5 条
[1]   基于Deep Web的教育资源检索系统 [J].
张世明 ;
覃正 ;
徐和祥 ;
夏德元 .
计算机工程, 2010, 36 (03) :76-78+82
[2]   基于网页上下文的Deep Web数据库分类 [J].
马军 ;
宋玲 ;
韩晓晖 ;
闫泼 .
软件学报, 2008, (02) :267-274
[3]   使用分类器自动发现特定领域的深度网入口(英文) [J].
王辉 ;
刘艳威 ;
左万利 .
软件学报, 2008, (02) :246-256
[4]   SVM based adaptive learning method for text classification from positive and unlabeled documents [J].
Peng, Tao ;
Zuo, Wanli ;
He, Fengling .
KNOWLEDGE AND INFORMATION SYSTEMS, 2008, 16 (03) :281-301
[5]  
STING: A statistical information grid approach to spatial data mining .2 Wang W,Yang J,Muntz RR. Proceedings of the 23rd International Conference on Very Large Data Bases . 1997