中文电子病历命名实体和实体关系语料库构建

被引:140
作者
杨锦锋 [1 ]
关毅 [1 ]
何彬 [1 ]
曲春燕 [1 ]
于秋滨 [2 ]
刘雅欣 [3 ]
赵永杰 [4 ]
机构
[1] 哈尔滨工业大学语言技术研究中心网络智能研究室
[2] 哈尔滨医科大学附属第二医院病案室
[3] 哈尔滨医科大学附属第二医院呼吸内科
[4] 哈尔滨医科大学附属第四医院神经内科
关键词
中文电子病历; 命名实体; 实体关系; 标注规范; 标注语料构建;
D O I
10.13328/j.cnki.jos.004880
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
电子病历是由医务人员撰写的面向患者个体描述医疗活动的记录,蕴含了大量的医疗知识和患者的健康信息.电子病历命名实体识别和实体关系抽取等信息抽取研究对于临床决策支持、循证医学实践和个性化医疗服务等具有重要意义,而电子病历命名实体和实体关系标注语料库的构建是首当其冲的.在调研了国内外电子病历命名实体和实体关系标注语料库构建的基础上,结合中文电子病历的特点,提出适合中文电子病历的命名实体和实体关系的标注体系,在医生的指导和参与下,制定了命名实体和实体关系的详细标注规范,构建了标注体系完整、规模较大且一致性较高的标注语料库.语料库包含病历文本992份,命名实体标注一致性达到0.922,实体关系一致性达到0.895.为中文电子病历信息抽取后续研究打下了坚实的基础.
引用
收藏
页码:2725 / 2746
页数:22
相关论文
共 23 条
  • [1] 电子病历命名实体识别和实体关系抽取研究综述
    杨锦锋
    于秋滨
    关毅
    蒋志鹏
    [J]. 自动化学报, 2014, 40 (08) : 1537 - 1562
  • [2] 面向中文电子病历的词法语料标注研究
    蒋志鹏
    赵芳芳
    关毅
    杨锦锋
    [J]. 高技术通讯, 2014, 24 (06) : 609 - 615
  • [3] 电子病历中命名实体的智能识别
    叶枫
    陈莺莺
    周根贵
    李昊旻
    李莹
    [J]. 中国生物医学工程学报, 2011, 30 (02) : 256 - 262
  • [4] Health Recommender Systems: Concepts, Requirements, Technical Basics and Challenges[J] . Wiesner, Martin,Pfeifer, Daniel.International Journal of Environmental Research and Public Health . 2014 (3)
  • [5] Supervised methods for symptom name recognition in free-text clinical records of traditional Chinese medicine: An empirical study[J] . Yaqiang Wang,Zhonghua Yu,Li Chen,Yunhui Chen,Yiguang Liu,Xiaoguang Hu,Yongguang Jiang.Journal of Biomedical Informatics . 2014
  • [6] Extracting important information from Chinese Operation Notes with natural language processing methods[J] . Hui Wang,Weide Zhang,Qiang Zeng,Zuofeng Li,Kaiyan Feng,Lei Liu.Journal of Biomedical Informatics . 2013
  • [7] Implementing the lifelong personal health record in a regionalised health information system: The case of Lombardy, Italy[J] . Fulvio Barbarito,Francesco Pinciroli,Antonio Barone,Fabrizio Pizzo,Riccardo Ranza,John Mason,Luca Mazzola,Stefano Bonacina,Sara Marceglia.Computers in Biology and Medicine . 2013
  • [8] Towards comprehensive syntactic and semantic annotations of the clinical narrative
    Albright, Daniel
    Lanfranchi, Arrick
    Fredriksen, Anwen
    Styler, William F.
    Warner, Colin
    Hwang, Jena D.
    Choi, Jinho D.
    Dligach, Dmitriy
    Nielsen, Rodney D.
    Martin, James
    Ward, Wayne
    Palmer, Martha
    Savova, Guergana K.
    [J]. JOURNAL OF THE AMERICAN MEDICAL INFORMATICS ASSOCIATION, 2013, 20 (05) : 922 - 930
  • [9] Evaluating temporal relations in clinical text: 2012 i2b2 Challenge[J] . Weiyi Sun,Anna Rumshisky,Ozlem Uzuner.Journal of the American Medical Informatics Association . 2013 (5)
  • [10] Electronic Medical Records (EMRs), Epidemiology, and Epistemology: Reflections on EMRs and Future Pediatric Clinical Research[J] . Richard C. Wasserman.Academic Pediatrics . 2011 (4)