中文医疗文本匿名化方法研究

被引:9
作者
徐益辉 [1 ]
姚琴 [1 ]
袁冬生 [1 ]
周天舒 [1 ]
李劲松 [2 ]
机构
[1] 浙江大学生物医学工程与仪器科学学院、电子病历与智能专家系统教育部工程研究中心
[2] 浙江大学生物医学工程与仪器科学学院
关键词
中文分词; 隐私保护; 关联信息;
D O I
暂无
中图分类号
R197.324 [医院自动化管理];
学科分类号
120407 [卫生政策与管理];
摘要
医疗文档的匿名化工作能够有效保护患者隐私,推动中国电子病历匿名化的发展。但传统的人工筛检患者隐私信息方法不仅效率低下,错检、漏检频繁,且消耗大量人力资源。针对这一问题,引入中文分词技术,提出并实现了一种基于中文分词技术的识别并处理中文人名的算法。该方法通过对医疗文本当中的自然句切割和切词以及充分挖掘姓名和其上下文信息的关联程度,实现了在电子病历中批量处理中文医疗文档。通过此方法,人名的检出率达到96.80%,超过临床人员对PHI的人工平均检出率81%,同时获得了90.57%的精确率。在保护患者隐私的同时,最大化地减少匿名化对医疗文档临床医用价值的影响。
引用
收藏
页码:19 / 21
页数:3
相关论文
empty
未找到相关数据