基于数据挖掘的启发式抽样方法研究

被引:4
作者
黎娅 [1 ]
郭江娜 [2 ]
机构
[1] 河南经贸职业学院信息管理系
[2] 郑州大学计算机科学与技术
关键词
数据挖掘; 启发式; 抽样; 样本容量;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
在数据挖掘中应用抽样技术,可以显著提高数据挖掘任务的效率。通过采用不同的抽样方法,使得数据挖掘算法可以针对比原始数据集小得多的样本数据集进行分析,从而大幅度提高性能。随之而来的问题就是,由于采用了抽样方法,在大幅提高性能的同时,对分析的精确性就会产生影响。如何选取合适的反映总体数据水平的样本成为数据挖掘中的关键问题。传统意义上的抽样大多采用单一的抽样方法,进行单一抽样,抽取的样本在一定程度上具有局限性。本文对传统抽样方法和样本容量的选取进行总结,对传统的分层抽样思想进行改进,提出了一种新的基于数据挖掘的启发式抽样思想,大大提高了抽取样本的精确性。
引用
收藏
页码:216 / 217+199 +199
页数:3
相关论文
共 8 条
[1]   数据挖掘中抽样技术的应用 [J].
朱梅红 .
统计与决策, 2007, (16) :147-150
[2]   基于数据挖掘的新产品竞争预测模型 [J].
蔡元萃 ;
陈立潮 .
微计算机信息, 2007, (09) :193-194
[3]   数据挖掘系统研究 [J].
王冠 ;
司建辉 ;
杨昌锋 .
北京工业大学学报, 2005, (04) :383-387
[4]   关联规则挖掘的新模型 [J].
刘建华 .
福建师范大学学报(自然科学版), 2004, (02) :32-35
[5]   浅议在数据挖掘中应用抽样技术 [J].
林琳 .
江苏统计, 2003, (06) :12-13
[6]  
多目标分层次复合抽样设计研究.[D].林才生.厦门大学.2006, 01
[7]  
数据挖掘导论.[M].(美)Pang-NingTan;(美)MichaelSteinbach;(美)VipinKumar著;范明;范宏建等译;.人民邮电出版社.2006,
[8]  
卫生统计学.[M].方积乾主编;.人民卫生出版社.2003,