基于邻域属性熵的隐私保护数据干扰方法

被引:17
作者
倪巍伟
徐立臻
崇志宏
吴英杰
刘腾腾
孙志挥
机构
[1] 东南大学计算机科学与工程学院
基金
高等学校博士学科点专项科研基金;
关键词
隐私保护; 聚类挖掘; 邻域属性熵; 邻域主属性; 数据干扰;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
隐私保护微数据发布是数据隐私保护研究的一个热点,数据干扰是隐私保护微数据发布采用的一种有效解决方法.针对隐私保护聚类问题,提出一种隐私保护数据干扰方法NETPA,NETPA干扰方法通过对数据点及邻域点集的分析,借助信息论中熵的理论,提出邻域属性熵和邻域主属性等概念,对原始数据中数据点的邻域主属性值用其k邻域点集内数据点在该属性的均值进行干扰替换,在较好地维持原始数据k邻域关系的情况下达到保护原始数据隐私不泄露的目的.理论分析表明,NETPA干扰方法具有良好地避免隐私泄露的效果,同时可以较好地维持原始数据的聚类模式.实验采用DBSCAN和k-LDCHD聚类算法对干扰前后的数据进行聚类分析比对.实验结果表明,干扰前后数据聚类结果具有较高的相似度,算法是有效可行的.
引用
收藏
页码:498 / 504
页数:7
相关论文
共 1 条