数据挖掘中的数据预处理模型与算法研究

被引:20
作者
沈睿芳
郭立甫
时希杰
机构
[1] 河北经贸大学信息技术学院
[2] 天津大学管理学院 石家庄
[3] 石家庄
关键词
数据挖掘; 数据预处理; 模型; 算法; 属性约简;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
本文首先介绍了数据预处理的概念,然后将数据预处理无缝集成于数据仓库的构建过程中,提出了一种数据预处理过程模型。对于不同阶段所使用的数据预处理技术和算法,本文也进行了总结分析,并以粗糙集的属性约简为例给出了一种算法的具体实现步骤。
引用
收藏
页码:44 / 46+70 +70
页数:4
相关论文
共 5 条
[1]   基于动态规划的缩写发现算法 [J].
李华 ;
易宝林 ;
桂浩 .
武汉大学学报(工学版), 2004, (01) :128-131
[2]   基于优先队列的增量式重复记录识别 [J].
佘春红 .
计算机应用, 2003, (09) :61-63
[3]   数据集成中不一致性数据相似性比较的加权算法 [J].
张艳秋 ;
徐六通 ;
王柏 .
计算机科学, 2003, (08) :92+186-92
[4]   数据挖掘中的数据预处理 [J].
刘明吉 ;
王秀峰 ;
黄亚楼 .
计算机科学, 2000, (04) :54-57
[5]  
数据仓库技术[M]. 电子工业出版社 , (美)[J.比肖夫]JoyceBischoff,(美)[T.亚历山大]TedAlexander著, 1998