关联规则是由Agrawal等人提出是KDD数据研究的重要内容,也是当前比较热门的研究课题,关联规则挖掘算法的性能好坏直接决定了数据挖掘在现实世界中的应用。
本文首先对经典关联规则挖掘算法进行分析,讨论其优缺点,包括Apriori算法、Sampling算法和partition算法等,然后针对经典算法采用水平数据布局事务数据库数据压缩不足的问题,给出了事务数据库垂直数据布局形式的TDA存储结构,并研究基于TDA存储结构的TDA关联规则挖掘算法及TDA关联规则并行挖掘算法。接着针对当前经典算法存在的项目公平性问题,提出了加权关联规则算法,其中包括垂直加权关联规则、水平加权关联规则以及混合加权关联规则。
最后,使用TDA-J关联规则仿真实验系统,对Apriori、TDA、以及TDA加权算法的效率以及用户关注度进行了比较。