一种考虑属性权重的隐私保护数据发布方法

被引:16
作者
徐勇 [1 ,2 ]
秦小麟 [1 ]
杨一涛 [1 ]
杨种学 [1 ]
黄灿 [1 ]
机构
[1] 南京航空航天大学信息科学与技术学院
[2] 安徽财经大学计算机科学与技术系
基金
高等学校博士学科点专项科研基金;
关键词
数据发布; 隐私保护; 权重; k-匿名; 泛化;
D O I
暂无
中图分类号
TP309 [安全保密];
学科分类号
081201 ; 0839 ; 1402 ;
摘要
k-匿名模型是数据发布领域用于对原始待发布数据集进行匿名处理以阻止链接攻击的有效方法之一,但已有的k-匿名及其改进模型没有考虑不同应用领域对匿名发布表数据质量需求不同的问题.在特定应用领域不同准码属性对基于匿名发布表的数据分析任务效用的贡献程度是不同的,若没有根据发布表用途的差异区别处理各准码属性的泛化过程,将会导致泛化后匿名发布表数据效用较差、无法满足具体数据分析任务的需要.在分析不同应用领域数据分析任务特点的基础上,首先通过修正基本ODP目录系统建立适用于特定问题领域的概念泛化结构;然后在泛化过程中为不同准码属性的泛化路径设置权重以反映具体数据分析任务对各准码属性的不同要求;最后设计一种考虑属性权重的数据匿名发布算法WAK(QI weight-aware k-anonymity),这是一种灵活地保持匿名发布表数据效用的隐私保护问题解决方案.示例分析和实验结果表明,利用该方案求解的泛化匿名发布表在达到指定隐私保护目标的同时,能够保持较高的数据效用,满足具体应用领域特定数据分析任务对数据质量的要求.
引用
收藏
页码:913 / 924
页数:12
相关论文
共 5 条
[1]   普适计算隐私保护策略研究 [J].
魏志强 ;
康密军 ;
贾东宁 ;
殷波 ;
周炜 .
计算机学报, 2010, 33 (01) :128-138
[2]   基于有损分解的数据隐私保护方法 [J].
刘玉葆 ;
黄志兰 ;
傅慰慈 ;
印鉴 .
计算机研究与发展, 2009, (07) :1217-1225
[3]   基于邻域属性熵的隐私保护数据干扰方法 [J].
倪巍伟 ;
徐立臻 ;
崇志宏 ;
吴英杰 ;
刘腾腾 ;
孙志挥 .
计算机研究与发展, 2009, (03) :498-504
[4]   Privacy-preserving incremental data dissemination [J].
Byun, Ji-Won ;
Li, Tiancheng ;
Bertino, Elisa ;
Li, Ninghui ;
Sohn, Yonglak .
JOURNAL OF COMPUTER SECURITY, 2009, 17 (01) :43-68
[5]  
个性化搜索中隐私保护的关键问题研究.[D].臧铖.浙江大学.2008, 07