基于分解数据库的FP-growth算法关联规则研究

被引:10
作者
刘艺 [1 ]
张海涛 [2 ]
刘奇燕 [2 ]
石硕 [1 ]
机构
[1] 中国海洋大学信息科学与工程学院
[2] 云南中烟工业有限责任公司技术中心
基金
国家重点研发计划;
关键词
改进FP-growth算法; 关联规则; 散列表; 数据库分解; 规则提取; 糖尿病并发症;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
论文针对频繁模式增长算法(FP-growth)中存在的频繁模式树(FP-tree)占据空间过大等问题,提出了一种改进的FP-growth算法,该算法采用分解数据库思想对事务数据库进行分类后分别挖掘以提高算法效率,并在提取规则时增加约束条件以更好地适用于所研究的医疗数据。实验结果表明,该算法的计算效率、产生的关联规则数量方面的性能明显优于经典的Apriori算法和FP-growth算法。通过对糖尿病以及它的三种主要并发症的关联规则的研究,获得糖尿病主要并发症发病概率定量关系(高血压>高脂血症>冠心病)以及肥胖增大患糖尿病并发症概率的规则,对于糖尿病并发症的前期预防有一定参考价值。
引用
收藏
页码:1306 / 1310+1416 +1416
页数:6
相关论文
共 11 条
[1]   FP-Growth算法的改进 [J].
杨云 ;
罗艳霞 .
计算机工程与设计, 2010, 31 (07) :1506-1509
[2]   应用Apriori算法研究2型糖尿病与其并发症的关系 [J].
程远 ;
曾熙芳 .
激光杂志, 2011, 32 (01) :82-83
[3]  
The Application of FP-Growth AlgorithmBased on Distributed Intelligence in Wisdom MedicalTreatment. Xu F,Lu H. International Journal of Pattern Recognitionand Artificial Intelligence . 2016
[4]  
An implementation of the FP-growth al-gorithm. Christian Borgelt. Proceedings of the 1st international work-shop on open source data mining:frequent pattern miningimplementations . 2005
[5]  
Association rule extraction from medical transcripts of diabetic patients. Lakshmi K S,Kumar G S. Applications of Digital Information and Web Technologies (ICADIWT),2014 Fifth International Conference on the . 2014
[6]   Mining frequent patterns without candidate generation [J].
Han, JW ;
Pei, J ;
Yin, YW .
SIGMOD RECORD, 2000, 29 (02) :1-12
[7]  
数据挖掘:概念与技术[M]. 机械工业出版社 , (美) 韩家炜等, 2006
[8]   关联规则挖掘算法综述 [J].
毕建欣 ;
张岐山 .
中国工程科学, 2005, (04) :88-94
[9]   基于关联规则的医疗处方智能监督方法的研究 [J].
赵连朋 .
计算机工程与应用, 2006, (32) :223-225
[10]   基于关联规则的电子病历挖掘算法研究与应用 [J].
丁卫平 ;
祁恒 ;
董建成 ;
管致锦 .
微电子学与计算机, 2007, (03) :69-73+76