中医医案文献自动分词研究

被引:9
作者
张帆
刘晓峰
孙燕
机构
[1] 北京中医药大学
关键词
中医医案文献; 自动分词; 中医领域词典; 层叠隐马模型; 词性标注;
D O I
暂无
中图分类号
TP391.1 [文字信息处理]; R249 [医案、医话(临床经验)];
学科分类号
摘要
目的研究适用于中医医案文献自动分词的方案。方法使用层叠隐马模型作为分词模型,建立相关中医领域词典及测试语料库,对语料库中古代医案文献和现代医案文献各300篇进行分词及评测。结果在未使用中医领域词典时,两类医案文献分词准确率均为75%左右;使用中医领域词典后,古代医案文献的分词准确率达到90.73%,现代医案文献的分词准确率达到95.66%。在未使用中医领域词典时,词性标注准确率古代医案文献为56.74%,现代医案文献为64.81%;使用中医领域词典后,现代医案文献为91.45%,明显高于古代医案文献的78.47%。结论现有分词方案初步解决了中医医案文献的分词问题,对现代医案文献的词性标注也基本正确,但古代医案文献的词性标注影响因素较多,还需进一步研究。
引用
收藏
页码:38 / 41
页数:4
相关论文
共 8 条
  • [1] 国内中文自动分词技术研究综述
    奉国和
    郑伟
    [J]. 图书情报工作, 2011, (02) : 41 - 45
  • [2] 基于CRF的先秦汉语分词标注一体化研究
    石民
    李斌
    陈小荷
    [J]. 中文信息学报, 2010, 24 (02) : 39 - 45
  • [3] 基于层叠隐马模型的汉语词法分析
    刘群
    张华平
    俞鸿魁
    程学旗
    [J]. 计算机研究与发展, 2004, (08) : 1421 - 1429
  • [4] 常用中药名与别名手册.[M].郝近大; 主编.人民卫生出版社.2008,
  • [5] 中医临床常见症状术语规范.[M].黎敬波;马力主编;刘叶;叶舟编写;.中国医药科技出版社.2005,
  • [6] 中华本草.[M].国家中医药管理局《中华本草》编委会[编];.上海科学技术出版社.1999,
  • [7] 中华本草.[M].国家中医药管理局《 中华本草》编委会 编.上海科学技术出版社.1998,
  • [8] 中国中医药学主题词表.[M].吴兰成主编;中国中医研究院中医药信息研究所编制;.中医古籍出版社.1996,