共 1 条
基于邻域属性熵的隐私保护数据干扰方法
被引:17
作者:
倪巍伟
徐立臻
崇志宏
吴英杰
刘腾腾
孙志挥
机构:
[1] 东南大学计算机科学与工程学院
来源:
基金:
高等学校博士学科点专项科研基金;
关键词:
隐私保护;
聚类挖掘;
邻域属性熵;
邻域主属性;
数据干扰;
D O I:
暂无
中图分类号:
TP311.13 [];
学科分类号:
1201 ;
摘要:
隐私保护微数据发布是数据隐私保护研究的一个热点,数据干扰是隐私保护微数据发布采用的一种有效解决方法.针对隐私保护聚类问题,提出一种隐私保护数据干扰方法NETPA,NETPA干扰方法通过对数据点及邻域点集的分析,借助信息论中熵的理论,提出邻域属性熵和邻域主属性等概念,对原始数据中数据点的邻域主属性值用其k邻域点集内数据点在该属性的均值进行干扰替换,在较好地维持原始数据k邻域关系的情况下达到保护原始数据隐私不泄露的目的.理论分析表明,NETPA干扰方法具有良好地避免隐私泄露的效果,同时可以较好地维持原始数据的聚类模式.实验采用DBSCAN和k-LDCHD聚类算法对干扰前后的数据进行聚类分析比对.实验结果表明,干扰前后数据聚类结果具有较高的相似度,算法是有效可行的.
引用
收藏
页码:498 / 504
页数:7
相关论文