数据预处理方法在移动通信行业中的应用

被引:4
作者
董艳
机构
[1] 合肥工业大学管理学院
基金
国家自然科学基金重点项目;
关键词
数据预处理; 数据挖掘; 数据清洗; 多重插补; 缺失值;
D O I
暂无
中图分类号
TP311.13 []; TN929.5 [移动通信];
学科分类号
1201 ; 080402 ; 080904 ; 0810 ; 081001 ;
摘要
解决数据本身的质量问题,以某移动通信用户离网原因分析及预测为主题及为数据挖掘模型处理出需要的数据是文章的主要目的。文中运用了数据预处理中,维规约,属性集成与构造,多重插补,离散化,规范化,数据抽样等方法来得到一个完整的、近似真实的数据集。针对所处理数据含有大量缺失值的特点,选取了插补的方法进行处理。包括方法的插补方法的选择,到最后使用多重插补方法对缺失数据进行修正。预处理后的数据应用到具体数据挖掘模型后提高了数据挖掘的效率,降低了数据挖掘复杂度。
引用
收藏
页码:225 / 228
页数:4
相关论文
共 7 条
[1]   抽样调查中缺失数据的插补方法 [J].
杨军 ;
赵宇 ;
丁文兴 .
数理统计与管理, 2008, (05) :821-832
[2]   SAS中处理数据集缺失值方法的对比研究 [J].
殷杰 ;
石锐 .
计算机应用, 2007, (S1) :438-439
[3]   缺失值处理方法比较研究 [J].
胡红晓 ;
谢佳 ;
韩冰 .
商场现代化, 2007, (15) :352-353
[4]  
数据仓库与数据挖掘.[M].安淑芝等编著;.清华大学出版社.2005,
[5]  
数据挖掘与知识发现.[M].李雄飞;李军编著;.高等教育出版社.2003,
[6]  
SPSS for Windows统计分析.[M].卢纹岱主编;.电子工业出版社.2002,
[7]  
Problems;Methods;and Challenges in Comprehensive Data Cleansing..Muller H;Freytag J C;.http://www.dbis;informatik.hu-berlin.de/fileadmin/reserach/pa-pers/techreports/2003-hub-ib-164-muller.pdf.2003,