基于分解数据库的FP-growth算法关联规则研究

被引:10
作者
刘艺 [1 ]
张海涛 [2 ]
刘奇燕 [2 ]
石硕 [1 ]
机构
[1] 中国海洋大学信息科学与工程学院
[2] 云南中烟工业有限责任公司技术中心
基金
国家重点研发计划;
关键词
改进FP-growth算法; 关联规则; 散列表; 数据库分解; 规则提取; 糖尿病并发症;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
论文针对频繁模式增长算法(FP-growth)中存在的频繁模式树(FP-tree)占据空间过大等问题,提出了一种改进的FP-growth算法,该算法采用分解数据库思想对事务数据库进行分类后分别挖掘以提高算法效率,并在提取规则时增加约束条件以更好地适用于所研究的医疗数据。实验结果表明,该算法的计算效率、产生的关联规则数量方面的性能明显优于经典的Apriori算法和FP-growth算法。通过对糖尿病以及它的三种主要并发症的关联规则的研究,获得糖尿病主要并发症发病概率定量关系(高血压>高脂血症>冠心病)以及肥胖增大患糖尿病并发症概率的规则,对于糖尿病并发症的前期预防有一定参考价值。
引用
收藏
页码:1306 / 1310+1416 +1416
页数:6
相关论文
共 11 条
[11]   一种基于数据库分解的关联规则挖掘新算法 [J].
杨翠明 ;
刘喜苹 ;
熊高峰 ;
罗隆福 .
湖南师范大学自然科学学报, 2007, (02) :30-34