基于谱系聚类的粗糙集数据挖掘预处理方法

被引:10
作者
韩中华
马斌
许可
李宏亮
机构
[1] 沈阳建筑大学信息与控制工程学院
关键词
粗糙集; 离散化; 谱系聚类; 类平均距离; SAS;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
介绍了一种基于统计分析的数据离散化方法——谱系聚类法,以胶合板缺陷检测数据为应用对象进行了基于谱系聚类的数据离散化研究,并与其它离散化方法进行了对比分析,对比结果表明经谱系聚类方法离散化后的数据,再进行粗糙集约简时,会有更多的冗余属性和记录被约掉,从而可以降低模型的复杂程度,加快获取知识的进程,提高分类的准确率。工程实践证明谱系聚类是一种有效的可用于数据预处理的离散化方法,结合粗糙集算法可以获取满意的数据挖掘结果。
引用
收藏
页码:194 / 196
页数:3
相关论文
共 3 条
[1]   软计算方法在数据挖掘中的应用 [J].
吴成东 ;
许可 ;
王欣 ;
韩中华 .
计算机测量与控制, 2005, (03) :294-297
[2]   ROUGH SETS [J].
PAWLAK, Z ;
GRZYMALABUSSE, J ;
SLOWINSKI, R ;
ZIARKO, W .
COMMUNICATIONS OF THE ACM, 1995, 38 (11) :89-95
[3]  
SAS统计分析及应用.[M].黄燕;吴平等编著;.机械工业出版社.2006,