一种基于搜索算法的关联规则发现及其更新研究

被引:0
作者
李环宇
机构
[1] 山东科技大学
关键词
数据库; 数据挖掘; 关联规则; 项集; 整合项集; 更新;
D O I
暂无
年度学位
2005
学位类型
硕士
导师
摘要
挖掘关联规则及规则的更新是数据挖掘领域的一个重要研究方向。目前已经提出了许多用于高效地发现大规模数据库中关联规则的算法,这些算法都有各自的特点。基于不同的关联规则发现算法有不同的规则增量更新算法。本文首先介绍了一种基于搜索算法的关联规则发现算法——QAIS算法,通过把它与基于层次算法Apriori算法进行比较,可以知道该算法有优于Apriori算法的方面。论文还分析了关联规则发现中项集的组成特点,指出了QAIS算法中的不足之处:首先是该算法在生成项集及获取项集支持度方面效率较低;其次该算法虽然提出了整合项集的概念,但却没有明确提出使用一个什么样的方法去实现其功能。根据以上对QAIS算法的认识,论文有针对性的提出了解决的方案,形成了NewQAIS算法。相对于QAIS算法,NewQAIS算法有自己的特点,该算法不但更适合于关联规则的发现,而且还适合于高效地更新关联规则。以NewQAIS算法为基础,本文提出了新的更新算法,该算法屏弃了其他更新算法要逐一计算项集支持度来判断项集是不是属于频繁集的做法,而是根据本文所使用整合项集的数据结构,采取了将项集分类比较,整体判断的方法。该方法最大限度地避免了逐个比较和判断项集的归属问题,所以有一定的有效性和优越性。
引用
收藏
页数:76
共 6 条
[1]
基于序列模式的关联规则Apriori算法的研究与优化 [J].
吴卫华 ;
袁宁 .
山东机械, 2003, (05) :44-46+64
[2]
数据挖掘中的数据预处理 [J].
刘明吉 ;
王秀峰 ;
黄亚楼 .
计算机科学, 2000, (04) :54-57
[3]
数据挖掘原理与算法.[M].邵峰晶;于忠清编著;.中国水利水电出版社.2003,
[4]
数据挖掘.[M].朱明编著;.中国科学技术大学出版社.2002,
[5]
数据采掘入门及应用.[M].张尧庭等编;.中国统计出版社.2001,
[6]
数据结构.[M].张莲治等编著;.大连理工大学出版社.1989,