大数据模式分解的隐私保护研究

被引:5
作者
李宁
朱青
机构
[1] 中国人民大学信息学院计算机系
关键词
数据隐私保护; 属性聚类; 模式分解;
D O I
暂无
中图分类号
TP309.2 [数据安全];
学科分类号
摘要
现有的大多数隐私保护技术往往忽略了敏感属性不同取值和准标识符属性之间存在的特殊关联,并且各领域对数据隐私保护的多方面要求,使得发布的匿名数据需要满足复合隐私约束。对近似敏感属性值和复合隐私约束进行分析,提出了基于大数据模式分解和聚类分析的隐私保护算法。给出了聚类敏感属性值保护相似值方法,设置不同权重的敏感属性,保留重要的属性。使用三维不规则结构矩阵的效用矩阵,来获取精度较高的匿名数据,实现匿名数据的模式分解。在真实数据集上的大量实验结果表明,该算法的数据精确率、数据纠错率都有明显提升,近似攻击率降低。
引用
收藏
页码:961 / 973
页数:13
相关论文
共 6 条
  • [1] 面向查询服务的数据隐私保护算法
    朱青
    赵桐
    王珊
    [J]. 计算机学报, 2010, 33 (08) : 1315 - 1323
  • [2] 一种基于聚类的数据匿名方法
    王智慧
    许俭
    汪卫
    施伯乐
    [J]. 软件学报, 2010, 21 (04) : 680 - 693
  • [3] 隐私保护数据发布中身份保持的匿名方法
    童云海
    陶有东
    唐世渭
    杨冬青
    [J]. 软件学报, 2010, 21 (04) : 771 - 781
  • [4] 数据发布中面向多敏感属性的隐私保护方法
    杨晓春
    王雅哲
    王斌
    于戈
    [J]. 计算机学报, 2008, (04) : 574 - 587
  • [5] Combining Fragmentation and Encryption to Protect Privacy in Data Storage
    Ciriani, Valentina
    Di Vimercati, Sabrina De Capitani
    Foresti, Sara
    Jajodia, Sushil
    Paraboschi, Stefano
    Samarati, Pierangela
    [J]. ACM TRANSACTIONS ON INFORMATION AND SYSTEM SECURITY, 2010, 13 (03)
  • [6] User manual of Texas hospital discharge data public use data file .2 Texas Department of State Health Services. http://www.dshs.state.tx.us/thcic/Hospitals/HospitalData.shtm . 2010