基于遗传算法等技术的数据与文本聚分类研究

被引:0
作者
郝占刚
机构
[1] 天津大学
关键词
聚类; 属性约简; 数据挖掘; 文本挖掘; 遗传算法; 社会演化算法;
D O I
暂无
年度学位
2006
学位类型
博士
导师
摘要
数据挖掘和文本挖掘是当前信息技术中的一个重要研究领域;将软计算方法之一的遗传算法应用于数据及文本挖掘方法研究,具有较大的理论意义和实用价值。本文研究了基于遗传算法和社会演化算法的数据挖掘和文本挖掘方法,主要包括数据挖掘和文本挖掘中的属性约简问题、聚类问题。所做主要工作内容包括: 提出一种基于遗传算法和k-medoids算法的新的聚类方法。该方法既可以很好地解决局部最优的问题,也可以很好地解决孤立点的问题,同时用于和k-medoids算法相结合,可以加快遗传算法的收敛速度,节约了时间成本。 采用遗传算法和模式聚合进行文本特征降维。模式聚合可以有效降低文本特征的维数,使得特征从几千维降为几百维,在此基础上采用遗传算法继续降维。 采用遗传算法和潜在语义索引进行文本特征降维。潜在语义索引通过奇异值分解可以有效地降低向量空间的维数。在此基础上采用遗传算法继续降维。 采用社会演化算法进行聚类。K均值聚类算法通常只能以局部最优结束,很难找到全局最优。本文提出一种基于社会演化算法和K均值算法相结合的聚类新方法。在该方法中提出了认知主体在聚类中对范式学习的新的方式。 采用混沌社会演化算法进行聚类。在认知主体对范式的背叛中采用混沌变异算子。实验证明该方法不但能提高聚类的效率而且能提高聚类的精度。
引用
收藏
页数:113
共 37 条
[1]
神经网络设计.[M].(美)MartinT.Hagan等著;.机械工业出版社.2002,
[2]
Lower dimensional representation of text data based on centroids and least squares [J].
Park, H ;
Jeon, M ;
Ben Rosen, J .
BIT, 2003, 43 (02) :427-448
[3]
Efficient reinforcement learning through symbiotic evolution.[J].David E. Moriarty;Risto Miikkulainen.Machine Learning.1996, 1
[4]
DYNAMIC PARAMETER ENCODING FOR GENETIC ALGORITHMS [J].
SCHRAUDOLPH, NN ;
BELEW, RK .
MACHINE LEARNING, 1992, 9 (01) :9-21
[5]
社会演化算法在机组组合中的应用 [J].
王喆 ;
余贻鑫 ;
张弘鹏 .
中国电机工程学报, 2004, (04)
[6]
数据挖掘综述 [J].
王光宏 ;
蒋平 .
同济大学学报(自然科学版), 2004, (02) :246-252
[7]
基于潜在语义分析的信息检索 [J].
盖杰 ;
王怡 ;
武港山 .
计算机工程, 2004, (02) :58-60
[8]
文本挖掘技术综述 [J].
梅馨 ;
邢桂芬 .
江苏大学学报(自然科学版), 2003, (05) :72-76
[9]
遗传LVQ聚类算法 [J].
闫德勤 ;
迟忠先 .
计算机工程与应用, 2003, (26) :100-101
[10]
基于C-均值和免疫遗传算法的聚类分析 [J].
高坚 .
计算机工程, 2003, (12) :65-66+194