随着计算机硬件和信息技术的迅速发展,使得海量数据的处理已经成为研究与生产中一项重要的工作,数据挖掘技术应运而生。同时,如何帮助用户和分析人员更快更直观地找到感兴趣的信息或是直接提供新颖的结论成为新的问题。而可视化技术一直是人们解决复杂问题的一种有利工具。研究如何将可视化技术有效地使用在数据挖掘中是一件长远而有意义的工作。
将可视化技术应用于数据挖掘中,有利于用户直观的了解数据挖掘的过程,获得挖掘结果,从而做出决策。不同的挖掘模式,需要不同的挖掘算法,并需要选择不同的可视化处理方法与之对应。可视化的数据挖掘技术是数据挖掘研究领域的一个热点问题。
本文在总结国内外可视化数据挖掘的研究成果基础上,主要从两个方面进行了研究。
着重对关联规则的挖掘算法进行研究。特别研究了多种关联规则挖掘算法,针对多层结构下的跨层次关联规则存在的冗余问题,提出了一种冗余删除方法,改进基于修补项的挖掘算法,通过仿真实验证明这种改进后的算法具有较好的性能。
通过比较研究各种关联规则的可视化方法,对它们的优缺点进行讨论。设计了一种基于坐标轴的可视化用于直观的体现关联规则的相关属性的方法。该方法较多的考虑了用户与系统中的交互性。对设计的关联规则可视化挖掘系统涉及到的每一个步骤讲行描述与实现。