政府数据中敏感数据识别与隐私计量研究

被引:11
作者
臧国全 [1 ,2 ]
王家振 [1 ]
毕崇武 [1 ,2 ]
耿瑞利 [1 ,2 ]
机构
[1] 不详
[2] 郑州大学信息管理学院
[3] 不详
[4] 郑州市数据科学研究中心
[5] 不详
关键词
政府数据; 数据隐私; 个人隐私; 语义词表; 隐私计量;
D O I
10.13266/j.issn.0252-3116.2022.15.007
中图分类号
D63 [国家行政管理]; TP309 [安全保密];
学科分类号
1204 ; 120401 ; 081201 ; 0839 ; 1402 ;
摘要
[目的/意义]通过分析政府数据隐私相关文本,设计敏感数据识别方案,构建隐私计量模型,计量敏感数据的隐私值,为政府数据隐私保护提供理论依据。[方法/过程]首先筛选政府数据隐私的相关文本构建样本库;然后依据文本的句法结构,抽取敏感数据项、核心动词、程度词、否定词等词汇,构建政府数据隐私语义词表;最后以上述词汇组成的敏感数据单元为基础,构建隐私计量模型。[结果/结论]该方法基于隐私相关文本,准确析出政府数据的敏感数据,客观计量政府数据对象的隐私值,可为政府数据的隐私风险防范及隐私保护规范化提供支持。
引用
收藏
页码:66 / 75
页数:10
相关论文
共 32 条
[1]   基于类信息的TF-IDF权重分析与改进 [J].
姚严志 ;
李建良 .
计算机系统应用, 2021, 30 (09) :237-241
[2]   基于被引-逆文档权重的专家专长识别与分析——以图情领域为例 [J].
唐晓波 ;
周禾深 ;
李诗轩 ;
牟昊 .
图书情报工作, 2021, 65 (15) :111-119
[3]   基于可靠度确定属性权重的三角模糊数多属性决策方法 [J].
蒋斌 ;
梁小安 ;
高杨军 ;
张洋铭 .
模糊系统与数学, 2021, 35 (04) :113-123
[4]   基于云模型和多层权重求解的多粒度语言大群体决策方法 [J].
王佩 ;
张婧 ;
张威威 .
控制与决策, 2021, 36 (09) :2257-2266
[5]   基于科技政策文本的程度词典构建研究 [J].
郑新曼 ;
董瑜 .
数据分析与知识发现, 2021, 5 (10) :81-93
[6]   泄露概率情境下的个人数据隐私计量研究 [J].
张凯亮 ;
臧国全 .
图书情报工作, 2021, 65 (09) :62-69
[7]   政府数据开放中个人信息保护路径研究 [J].
商希雪 ;
韩海庭 .
电子政务, 2021, (06) :113-124
[8]   基于依存句法分析的科技政策领域主题词表无监督构建 [J].
邵卫 ;
化柏林 .
情报工程, 2020, 6 (06) :33-44
[9]   医疗数据中病种隐私的计量与分析 [J].
臧国全 ;
贾瑞莹 .
现代情报, 2020, 40 (05) :161-168
[10]   个人数据价值计量研究——基于改造的BDM机制 [J].
臧国全 ;
张凯亮 ;
闫励 .
图书情报工作, 2020, 64 (07) :103-109