基于决策树归纳的聚类方法与实现

被引:11
作者
王喆
陆楠
周春光
机构
[1] 吉林大学计算机科学与技术学院
[2] 深圳大学信息工程学院
[3] 吉林大学计算机科学与技术学院 吉林长春 
[4] 广东深圳 
[5] 吉林长春 
关键词
数据挖掘; 决策树归纳; 聚类分析; 相似度;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
采用一种改进后的决策树归纳聚类算法和交互式CLTree(ClusteringbasedondecisionTrees)剪枝,对商业数据的某些问题实现了聚类挖掘。对交易数据的实际聚类分析表明,该方法不仅可以处理数值型属性,还可以处理枚举型属性。实验结果表明,该方法在处理混合类型数据时具有良好的挖掘效果。对商业数据聚类分析,可以得到合理的市场分段,预测顾客的购买行为。
引用
收藏
页码:132 / 137
页数:6
相关论文
共 5 条
  • [1] Rainforest:Aframeworkforfastdecisiontreeconstructionoflargedatasets. GehrkeJ,RamarrishmanR,GantiV. Proc1998IntConfVeryLargeDataBases (VLDB’’98) . 1998
  • [2] Clusteringthroughdecisiontreeconstruction. LiuB,XiaY,YuP. http://www.comp.nus.edu.sg/liub/publications/bib.html . 2001
  • [3] Rock: a robust clustering algorithm for categorical attributes. Sudipto Guha,Rajeev Rastogi,Kyuseok Shim. In Proceedings of the 15th International Conference on Data Engineering 1999 . 1999
  • [4] Automaticsubspaceclusteringforhighdimensionaldatafordataminingapplications. AgrawalA,GrhrkeJ,GunopulosD,RaghavanP. SIGMOD-98 . 1998
  • [5] CURE:Anefficientclusteringalgorithmforlargedatabases. GuhaS,RastogiR,ShimK. SIGMOD-98 . 1998