半监督聚类算法的研究与应用

被引:0
作者
管仁初
机构
[1] 吉林大学
关键词
机器学习; 半监督聚类; 吸引子传播算法; k-means算法;
D O I
暂无
年度学位
2010
学位类型
博士
导师
摘要
本文主要针对半监督学习中的聚类算法展开研究: 1.提出了3-集合相似性度量,它是一种包含结构信息的非欧空间度量。在相似特征集、排斥特征集和仲裁特征集的基础上,提出了新的相似性度量和新的聚类算法:权吸引子传播算法。 2.提出了融合3-集合相似性度量、半监督学习策略和吸引子传播算法的种子吸引子传播算法。它降低了文本聚类算法复杂性,避免了随机初始化和陷入局部极小的缺陷,提高了准确率,并具有更好的鲁棒性。 3.提出了融合增量学习的增量吸引子传播半监督聚类算法。该算法将标记样本的先验信息嵌入到相似性矩阵中并运用增量学习策略将它们扩散开来。实验结果表明新算法具有更优良的性能。 4.分析了已标记样本数量对半监督聚类算法的影响。5种算法在3个数据集上的实验结果表明:已标记样本数目的增长能够帮助半监督聚类算法获得更好的性能。但当数目增长超过关键点位置时,这种改进将变得迟缓甚至停滞。 5.分析了未标记样本数量对半监督聚类算法的影响。4种新的半监督聚类算法在 3个数据集上的实验结果表明:在多数情况下,较少未标记样本的增量学习能够帮助半监督聚类算法得到更好的结果。但是,未标记样本规模增长超过关键点时,改进将减少甚至起反作用。
引用
收藏
页数:99
共 37 条
[1]
多关系聚类分析方法研究 [D]. 
高滢 .
吉林大学,
2008
[2]
广义染色体遗传算法与迭代式最小二乘支持向量机回归算法研究 [D]. 
吴春国 .
吉林大学,
2006
[3]
Elman神经网络与进化算法的若干理论研究及应用 [D]. 
时小虎 .
吉林大学,
2006
[4]
Top 10 algorithms in data mining.[J].Xindong Wu;Vipin Kumar;J. Ross Quinlan;Joydeep Ghosh;Qiang Yang;Hiroshi Motoda;Geoffrey J. McLachlan;Angus Ng;Bing Liu;Philip S. Yu;Zhi-Hua Zhou;Michael Steinbach;David J. Hand;Dan Steinberg.Knowledge and Information Systems.2009, 1
[5]
Multinomial mixture model with feature selection for text clustering [J].
Li, Minqiang ;
Zhang, Liang .
KNOWLEDGE-BASED SYSTEMS, 2008, 21 (07) :704-708
[6]
An active learning framework for semi-supervised document clustering with language modeling.[J].Ruizhang Huang;Wai Lam.Data & Knowledge Engineering.2008, 1
[7]
Combined use of association rules mining, and clustering methods to find relevant links between binary rare attributes in a large data set [J].
Plasse, Marie ;
Niang, Ndeye ;
Saporta, Gilbert ;
Villerninot, Alexandre ;
Leblond, Laurent .
COMPUTATIONAL STATISTICS & DATA ANALYSIS, 2007, 52 (01) :596-613
[8]
Clustering for data mining: A data recovery approach. [J].
Rutkowski, Leslie .
PSYCHOMETRIKA, 2007, 72 (01) :109-110
[9]
Principal component analysis with optimum order sample correlation coefficient for image enhancement [J].
Cheng, Qiuming ;
Jing, Linhai ;
Panahi, Alireza .
INTERNATIONAL JOURNAL OF REMOTE SENSING, 2006, 27 (16) :3387-3401
[10]
Locally linear metric adaptation with application to semi-supervised clustering and image retrieval [J].
Chang, Hong ;
Yeung, Dit-Yan .
PATTERN RECOGNITION, 2006, 39 (07) :1253-1264