数据表k-匿名化的微聚集算法研究

被引:39
作者
韩建民 [1 ,2 ]
岑婷婷 [2 ]
虞慧群 [1 ]
机构
[1] 华东理工大学计算机科学与工程系
[2] 浙江师范大学数理与信息工程学院
关键词
k-匿名; 泛化/隐匿; 微数据; 微聚集; 隐私保护;
D O I
暂无
中图分类号
TP309.2 [数据安全];
学科分类号
081201 ; 0839 ; 1402 ;
摘要
数据表的k-匿名化(k-anonymization)是数据发布时保护私有信息的一种重要方法.泛化/隐匿是实现k-匿名的传统技术,然而,该技术存在效率低、k-匿名化后数据的可用性差等问题.近年来,微聚集(Microaggregation)算法被应用到数据表的k-匿名化上,弥补了泛化/隐匿技术的不足,其基本思想是:将大量的数据按相似程度划分为若干类,要求每个类内元组数至少为k个,然后用类质心取代类内元组的值,实现数据表的k-匿名化.本文综述了微聚集算法的基本思想、相关技术和当前动态,对现有的微聚集算法进行了分类分析,并总结了微聚集算法的评估方法,最后对微聚集算法的研究难点及未来的发展趋势作了探讨.
引用
收藏
页码:2021 / 2029
页数:9
相关论文
共 11 条
[1]   一种基于层次距离计算的聚类算法 [J].
彭京 ;
唐常杰 ;
程温泉 ;
石葆梅 ;
乔少杰 .
计算机学报, 2007, (05) :5786-5795
[2]   支持多约束的K-匿名化方法 [J].
杨晓春 ;
刘向宇 ;
王斌 ;
于戈 .
软件学报, 2006, (05) :1222-1231
[3]   基于特征加权的模糊聚类新算法 [J].
李洁 ;
高新波 ;
焦李成 .
电子学报, 2006, (01) :89-92
[4]   一种基于CSA的混和属性特征大数据集聚类算法 [J].
李洁 ;
高新波 ;
焦李成 .
电子学报, 2004, (03) :357-362
[5]  
A polynomial-time approximation to optimal multivariate microaggregation[J] . Josep Domingo-Ferrer,Francesc Sebé,Agusti Solanas.Computers and Mathematics with Applications . 2007 (4)
[6]  
TFRP: An efficient microaggregation algorithm for statistical disclosure control[J] . Chin-Chen Chang,Yu-Chiang Li,Wen-Hung Huang.The Journal of Systems & Software . 2007 (11)
[7]  
Efficient multivariate data-oriented microaggregation[J] . Josep Domingo-Ferrer,Antoni Martínez-Ballesté,Josep Maria Mateo-Sanz,Francesc Sebé.The VLDB Journal . 2006 (4)
[8]   Probabilistic information loss measures in confidentiality protection of continuous microdata [J].
Mateo-Sanz, JM ;
Domingo-Ferrer, J ;
Sebé, F .
DATA MINING AND KNOWLEDGE DISCOVERY, 2005, 11 (02) :181-193
[9]  
Ordinal, Continuous and Heterogeneous k -Anonymity Through Microaggregation[J] . Data Mining and Knowledge Discovery . 2005 (2)
[10]   On the complexity of optimal microaggregation for statistical disclosure control [J].
Oganian, Anna ;
Domingo-Ferrer, Josep .
Statistical Journal of the United Nations Economic Commission for Europe, 2001, 18 (04) :345-353