近年来,随着信息技术的广泛应用,各个行业积累的数据越来越多,人们希望能够在对已有的大量数据分析的基础上进行科学研究、商业决策或者企业管理,但是目前所拥有的数据分析工具很难对数据进行深层次的处理,难以得到感兴趣的知识,形成数据丰富而知识缺乏的局面,数据挖掘正是为了解决传统分析方法的不足,并针对大规模数据的分析处理而出现的。
目前,学术界提出了很多数据挖掘算法,许多IT公司也推出了自己的数据挖掘产品。但是以上产品存在主动性差、智能性较低、系统集成困难和结果难以理解等缺陷,文中给出了一个基于数据挖掘的可视化系统,分析了该系统的系统架构和模型的可扩展性,力图弥补现有数据挖掘系统存在的缺陷,减少用户对系统的依赖性。该系统由数据预处理、数据可视化、模型可视化和挖掘算法子系统组成,给出了各部件的功能和结构,并讨论了系统的组织、算法的实现等关键技术问题。主要内容如下:第一章介绍了数据挖掘技术的背景,意义和研究现状。第二章介绍了与数据挖掘相关的数据仓库,ETL等技术和数据挖掘的流程。第三章设计和实现了应用于移动领域的可视化数据挖掘的系统,学习和研究了数据总结、聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常和趋势发现等等;根据挖掘方法的不同可分为:机器学习方法、统计方法、神经网络方法和数据库方法等。最后实现了分类算法,聚类算法,应用模板设计模式,方便了系统将来的扩展。第四章介绍了数据可视化和模型可视化,使得不具有专业背景的数据挖掘技术的人使用数据挖掘来进行商业决策成为可能。最后对论文的工作进行总结并提出以后进一步的研究方向。