概率数据库中近似函数依赖挖掘算法

被引:6
作者
苗东菁
刘显敏
李建中
机构
[1] 哈尔滨工业大学计算机科学与技术学院
关键词
近似函数依赖; 数据挖掘; 概率数据库; 数据质量; 不一致性;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
一个近似函数依赖(approximate functional dependency,AFD)是一个几乎成立的函数依赖,目前大部分工作仅限于从一般数据上挖掘近似函数依赖.有时数据是被组织成概率数据的形式,为了从挖掘概率数据中挖掘出可用的近似函数依赖,定义了概率近似函数依赖,它不同于任何一种以往的定义,并给出了在不确定数据中,置信概率的动态规划求解算法,由于动态规划算法复杂度较高,导出了候选依赖的概率下界来进行剪枝,随后给出了基于字典序的挖掘方法以及相应的剪枝策略,最后,在真实和合成的数据集上进行充分的实验,说明了挖掘算法的可扩展性和剪枝策略的高效性,并展示了有趣的挖掘结果.
引用
收藏
页码:2857 / 2865
页数:9
相关论文
共 4 条
  • [1] 一种局部相关不确定数据库快照集合上的概率频繁最近邻算法
    苗东菁
    石胜飞
    李建中
    [J]. 计算机研究与发展, 2011, 48 (10) : 1812 - 1822
  • [2] Mining functional dependencies from data
    Yao, Hong
    Hamilton, Howard J.
    [J]. DATA MINING AND KNOWLEDGE DISCOVERY, 2008, 16 (02) : 197 - 219
  • [3] On approximation measures for functional dependencies[J] . Chris Giannella,Edward Robertson.Information Systems . 2003 (6)
  • [4] Relational decomposition through partial functional dependencies
    Berzal, F
    Cubero, JC
    Cuenca, F
    Medina, JM
    [J]. DATA & KNOWLEDGE ENGINEERING, 2002, 43 (02) : 207 - 234