数据挖掘算法及其应用研究

被引:0
作者
黄雯
机构
[1] 南京邮电大学
关键词
数据挖掘; DBSCAN; 粗糙集; BP神经网络; 短期电力负荷预测; 个性化推送;
D O I
暂无
年度学位
2013
学位类型
硕士
导师
摘要
随着全球信息技术的迅速发展和互联网的快速普及,现代信息系统进入了大数据时代,人们日常工作和生活都面对着数据过量和信息爆炸的情况,迫切需要一种有效的技术手段帮助人们从这些海量数据中挖掘出真正需要的、有价值的知识,因此数据挖掘算法成为了研究热点。 本文以提高数据挖掘算法的时间效率和应用性为目的,进行了经典数据挖掘算法及其应用方面的研究。论文从课题的研究背景和意义展开,介绍了数据挖掘的相关概念、意义与基本技术;主要研究了基于密度的聚类算法DBSCAN、粗糙集属性约简算法和BP神经网络算法。 针对聚类,以减少算法执行时间为目的,通过对DBSCAN算法加以改进,设计了一种基于网格的快速密度聚类算法GF-DBSCAN,并通过仿真实验验证了该算法的性能。 本文也综合运用多种数据挖掘算法,提出了一种基于多种数据挖掘技术的短期电力负荷预测策略,该策略包括预测模型和各层方法。第一层利用DBSCAN算法来有效地进行数据的聚类和离群数据的识别与修正;第二层利用粗糙集属性约简算法有效地筛选出与决策相关的最小属性集从而保障挖掘效率;第三层用BP神经网络算法的复杂的多层多节点的网络结构及其不断反向修正误差的的能力获得预测值。在真实数据上所做的实例计算与分析结果表明,所提出的短期电力负荷预测策略对预测结果精确度较高。 本文还设计了一种适用于电子商务运营平台的基于GF-DBSCAN算法的个性化推送服务技术方案。该方案使用GF-DBSCAN算法挖掘用户基本信息从而将用户分类,再对每类用户使用top-k排序算法进行兴趣分析,从而将所得结果进行推送。以购书网站为例的应用效果表明了GF-DBSCAN算法的实用性。 本文在数据挖掘算法及应用方面做了有益的研究工作。
引用
收藏
页数:75
共 25 条
[1]
电力市场环境下的负荷预测研究 [J].
李燚 .
中国高新技术企业, 2011, (22) :5-7
[2]
数据挖掘及其一种关联规则算法 [J].
蒋晖 ;
陈允锋 .
计算机与数字工程, 2011, 39 (06) :32-35
[3]
BP神经网络在化探数据分类中的应用 [J].
阴江宁 ;
肖克炎 ;
李楠 ;
邹伟 .
地质通报, 2010, 29 (10) :1564-1571
[4]
RSS信息推送技术在农村信息化中的应用 [J].
曾慧敏 ;
阳卫文 .
中国农村小康科技, 2010, (07) :21-24
[5]
基于扩展粗糙集的短期电力负荷预测模型 [J].
刘学琴 ;
吴耀华 ;
崔宝华 .
电力系统保护与控制, 2010, 38 (05) :25-28+38
[6]
一种基于密度最大值的聚类算法 [J].
王晶 ;
夏鲁宁 ;
荆继武 .
中国科学院研究生院学报, 2009, 26 (04) :539-548
[7]
基于RSS的图书馆信息推送技术 [J].
雷丽 ;
杨文花 .
现代情报, 2008, (07) :181-182+187
[8]
数据挖掘技术在电子商务中的应用研究 [J].
杨青杰 ;
胡明霞 .
商场现代化, 2008, (16) :57
[9]
嵌入式数据挖掘概述 [J].
黄浩锋 .
福建电脑, 2008, (04) :31-32
[10]
基于粗糙集的数据挖掘的应用研究 [J].
杨霞 .
乐山师范学院学报, 2007, (12) :67-69