基于量化概念格的关联规则挖掘模型研究

被引:0
作者
王德兴
机构
[1] 合肥工业大学
关键词
数据挖掘; 关联规则; 概念格; 频繁项目集;
D O I
暂无
年度学位
2003
学位类型
硕士
导师
摘要
数据库中的知识发现是当前涉及人工智能、数据库等学科的一门相当活跃的研究领域。数据挖掘是从数据中提取人们感兴趣的、潜在的、可用的知识,并表示成用户可理解的形式。关联规则挖掘是数据挖掘的一个重要分支,是描述数据库中数据项(属性、变量)间存在的潜在关系。 概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述。在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格。本文是基于量化概念格的关联规则挖掘为中心而展开的。 本文中创新性的主要内容如下: ①提出了基于量化概念格的关联规则及基于兴趣度加权的量化概念格的关联规则挖掘的思想、算法以及性能分析。基于兴趣度加权的量化概念格关联规则挖掘选择大于兴趣度加权阈值的项目构造量化概念格,在此基础上交互地挖掘感兴趣的关联规则。 与Apriori算法相比,两种方法所挖掘出的规则结果完全吻合,前者具有较好的时间性能,规则表示更直观,减少了算法的搜索空间和计算量,提高了挖掘的效率和准确性。 ②改进了传统的购物篮分析,由于传统的购物篮分析只关心顾客是否购买商品,忽略其购买的数量,因而在实际应用中,有很大的局限性,在本文中,不仅要关心顾客是否购买商品,而且考虑顾客购买的数量,在传统的购物篮分析中,引入兴趣度加权思想,并提出了如何获取兴趣度加权阈值的方法,因此在改进了传统的购物篮分析基础上,基于量化概念格所挖掘出的关联规则有更贴近于实际和应用价值。
引用
收藏
页数:85
共 5 条
[1]
基于量化概念格的关联规则挖掘 [J].
王德兴 ;
胡学钢 ;
王浩 .
合肥工业大学学报(自然科学版), 2002, (05) :678-682
[2]
概念格与关联规则发现 [J].
谢志鹏 ;
刘宗田 .
计算机研究与发展, 2000, (12) :1415-1421
[3]
概念格上规则提取的一般算法与渐进式算法 [J].
王志海 ;
胡可云 ;
胡学钢 ;
刘宗田 ;
张奠成 .
计算机学报, 1999, (01)
[4]
KDD研究现状及发展 [J].
陈栋 ;
刘兵 ;
徐洁磐 .
计算机科学, 1996, (06) :38-42
[5]
大规模数据库中的知识获取 [J].
丁德恒 .
计算机科学, 1994, (05) :48-50