基于自适应聚类的数据预处理算法I

被引:9
作者
陈莉
焦李成
机构
[1] 西安电子科技大学雷达信号处理国家重点实验室
关键词
数据预处理; 自适应聚类; 自组织特征映射神经网络; 目标数据子集;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了KDD的一种逻辑模型。以数据库或数据仓库中的数据为例 ,根据先验知识或可能的挖掘目标 ,利用SQL命令滤除无关属性 ,形成基于某种概念分层的归纳数据库或汇总数据库。针对数据库中的属性 ,利用非监督学习算法 ,获取相应聚类 ,从而形成面向任务的目标数据子集 ,以保证数据挖掘结果的质量和有效性
引用
收藏
页码:28 / 29+47 +47
页数:3
相关论文
共 10 条
  • [1] A Distribution-Based Clustering Algorithm for Mining in Large Spatial Databases. Xu X. Ester M. Kriegel H. P. et al. Proceedings of the 14th International Conference on Data engineering . 1998
  • [2] NeuralNetworksforPatternRecognition. BisgopC .M. . 1995
  • [3] NeuralNetworkFAQ .PeriodicPostingtoUsenatNewsgroupComp.ai.neural net. SarleW .S. ftp:∥ftp.sas.com pub neuralFAQ .html . 1999
  • [4] BIRCH :AnEfficientDataClusteringMethodforVeryLargeDatabases. ZhangT,RamakrishnanR,LivnyM. ProceedingsoftheACMSIGMODInterna tionalConferenceonManagementofData . 1996
  • [5] KnowledgeAcquistionfromQuantita tiveDataUsingtheRoughSetTheory. HongT .P,WangT .T,WangS .L. IntelligentDataAnalysis . 2000
  • [6] UncertaintyMeasuresofRoughnessofKnowledgeandRoughSets. LiangJ,XuZ. IncompleteInformationSystem.TheThirdWorldCongressonIntelli gentControlandAutomation . 2000
  • [7] RoughClassificationinIncompleteInformationSystem. SlowinskiR,StafanowskiJ. MathematicalandComputerModelling . 1989
  • [8] BayesianNetworksforLosslessDatasetCompression. DaviesS,MooreA. ProceedingsKDD’’99 . 1999
  • [9] FastDimensionalityReductionandSimplePCA. MatthewP,RafaelA .C. IntelligentDataAnalysis . 1998
  • [10] Automatic Subspace Clustering of High Dimension Data for Data Mining Applications. Agrawal R. Gehrke J. Gunopolos D. et al. Proceedings of the ACM SIGMOD International Conference on Management of Data . 1998