基于敏感等级划分的(l,t)-相近性匿名算法

被引：2

作者：

杨静

张冰

张健沛

谢静

机构：

[1] 哈尔滨工程大学计算机科学与技术学院

来源：

华中科技大学学报(自然科学版) | 2014年 / 42卷 / 08期

基金：

高等学校博士学科点专项科研基金;

关键词：

隐私保护; 敏感等级; (l,t)-相近性; 自信息; Hellinger距离; 聚类; 匿名;

D O I：

10.13245/j.hust.140803

中图分类号：

TP309 [安全保密];

学科分类号：

081201 ; 0839 ; 1402 ;

摘要：

针对t-相近性模型实现方法信息损失大和算法执行代价高的问题,提出一种基于敏感等级划分的(l,t)-相近性模型.该模型放宽了t-相近性模型对等价类的约束,要求等价类中敏感等级的分布与数据集中敏感等级的分布间距离不大于阈值t,并使用Hellinger距离度量敏感等级分布间的距离,以避免传统EMD距离须人工设定基准距离、计算量高的问题;同时,提出了一种基于聚类的(l,t)-相近性匿名算法((l,t)-CCA),使用敏感值的自信息来度量敏感度以实现敏感属性的等级划分,并以聚类的思想形成等价类来实现(l,t)-相近性模型.实验结果表明:该算法不仅能够抵御相似性攻击,而且信息损失低,时间开销少,能够更加有效地实现数据发布中数据的可用性与隐私安全间的平衡.

引用

页码：12 / 17

页数：6