基于数据仓库的可视化数据挖掘系统的设计与实现

被引:0
作者
张宇
机构
[1] 中国地质大学(北京)
关键词
数据挖掘; 分类; 聚类; 可视化;
D O I
暂无
年度学位
2007
学位类型
硕士
导师
摘要
近年来,随着信息技术的广泛应用,各个行业积累的数据越来越多,人们希望能够在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是目前所拥有的数据分析工具很难对数据进行深层次的处理,难以得到感兴趣的知识,形成数据丰富而知识缺乏的局面,数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。 目前,学术界提出了很多数据挖掘算法,许多IT公司也推出了自己的数据挖掘产品。但是以上产品存在主动性差、智能性较低、系统集成困难和结果难以理解等缺陷,文中给出了一个基于数据挖掘的可视化系统,分析了该系统的系统架构和模型的可扩展性,力图弥补现有数据挖掘系统存在的缺陷,减少用户对系统的依赖性。该系统由数据预处理、数据可视化、模型可视化和挖掘算法子系统组成,给出了各部件的功能和结构,并讨论了系统的组织、算法的实现等关键技术问题。主要内容如下:第一章介绍了数据挖掘技术的背景,意义和研究现状。第二章介绍了与数据挖掘相关的数据仓库,ETL等技术和数据挖掘的流程。第三章设计和实现了应用于移动领域的可视化数据挖掘的系统,学习和研究了数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;根据挖掘方法的不同可分为:机器学习方法、统计方法、神经网络方法和数据库方法等。最后实现了分类算法,聚类算法,应用模板设计模式,方便了系统将来的扩展。第四章介绍了数据可视化和模型可视化,使得不具有专业背景的数据挖掘技术的人使用数据挖掘来进行商业决策成为可能。最后对论文的工作进行总结并提出以后进一步的研究方向。
引用
收藏
页数:63
共 6 条
[1]
事件驱动式商务智能——商业竞争的新利器 [J].
姚卫新 ;
黄丽华 .
科技导报, 2004, (02) :59-61
[2]
用事件-条件-动作规则表示模糊知识的方法 [J].
郭海英 ;
钟廷修 .
上海交通大学学报, 2003, (05) :758-761
[3]
商业数据的预测模型及其算法研究 [J].
周春光 ;
邢辉 ;
徐振龙 ;
王哲 .
吉林大学学报(信息科学版), 2002, (03) :53-60
[4]
基于ECA规则和活动分解的工作流模型 [J].
胡锦敏 ;
张申生 ;
余新颖 .
软件学报, 2002, (04) :761-767
[5]
一种基于遗传算法的知识挖掘算法 [J].
刘明吉 ;
王秀峰 ;
王治宝 ;
黄亚楼 .
计算机工程, 2000, (08) :13-14+61
[6]
多Agent系统的理论、技术及其应用 [J].
胡舜耕 ;
张莉 ;
钟义信 .
计算机科学, 1999, (09) :20-24+39