基于聚类的敏感属性-多样性匿名化算法

被引:5
作者
滕金芳
钟诚
机构
[1] 广西大学计算机与电子信息学院
关键词
隐私泄露; 匿名化; -多样性; 敏感属性; 聚类;
D O I
10.16208/j.issn1000-7024.2010.20.038
中图分类号
TP393.08 [];
学科分类号
0839 ; 1402 ;
摘要
提出了基于聚类的敏感属性-多样性匿名化算法,该算法生成的每个聚类至少有个不同的敏感属性值,每个聚类的大小介于和2-1之间,以达到最优划分并提高数据的安全性。同时,该算法生成聚类候选记录集以减少不必要的计算和比较,生成聚类时总是选择与聚类质心信息损失最小的记录,提高了算法效率并减少信息的损失。实验结果表明,该算法是高效的,且生成的匿名数据集具有较高的可用性。
引用
收藏
页码:4378 / 4381
页数:4
相关论文
共 2 条
[1]   Thoughts on k-anonymization [J].
Nergiz, M. Ercan ;
Clifton, Chris .
DATA & KNOWLEDGE ENGINEERING, 2007, 63 (03) :622-645
[2]  
Efficient multivariate data-oriented microaggregation[J] . Josep Domingo-Ferrer,Antoni Martínez-Ballesté,Josep Maria Mateo-Sanz,Francesc Sebé.The VLDB Journal . 2006 (4)