中医针灸领域术语自动抽取研究

被引:6
作者
孙水华 [1 ,2 ]
黄德根 [1 ]
牛萍 [1 ]
机构
[1] 大连理工大学计算机科学与技术学院
[2] 福建工程学院信息科学与工程学院
关键词
中医针灸领域术语; 术语种子集迭代算法; 术语过滤规则;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
针对中医针灸领域术语的构成特点,该文建立了一种基于规则的领域术语抽取算法模型,该模型首先对中医针灸领域术语种子集进行有限次的迭代,生成中医针灸领域术语构件集;然后,以术语构件集为领域词典,采用最大向前匹配算法对中文针灸医学文献中的句子进行切分,并抽取候选术语;最后,利用语言规则对候选术语进行过滤处理,筛选出中医针灸领域专业术语。分别以关键字集和中医词典为种子集进行实验,开式测试的F值分别达到76.96%和35.59%。
引用
收藏
页码:118 / 124
页数:7
相关论文
共 15 条
  • [1] 基于词频分布变化统计的术语抽取方法
    周浪
    张亮
    冯冲
    黄河燕
    [J]. 计算机科学, 2009, 36 (05) : 177 - 180
  • [2] 一种基于加权投票的术语自动识别方法
    游宏梁
    张巍
    沈钧毅
    刘挺
    [J]. 中文信息学报, 2011, 25 (03) : 9 - 16
  • [3] Domain-specific term extraction from free texts. Zhang,C. et al. Fuzzy Systems and Knowledge Discovery (FSKD),2012 9th International Conference on . 2012
  • [4] Surface grammatical analysis for the extraction of terminological noun phrases. Didier B. Proceedings of the 14th conference on Computational Linguistics . 1992
  • [5] Chinese Terminology Extrac-tion Using Window-based Contextual Information. Ji L,Sum M,Lu Q,et al. Computational Linguistics and Intelligent Text Process-ing . 2007
  • [6] 浅谈中医学术语的特点和研究方法
    蒋锦文
    于鹏
    [J]. 天津中医学院学报, 2000, (03) : 33 - 33
  • [7] A cascaded approach to biomedical named entity recognition using a unified model. CHAN S K,LAM W,YU X F. Proceedings of the 7th IEEE International Conference on Data Mining . 2007
  • [8] 基于质子串分解的中文术语自动抽取
    何婷婷
    张勇
    [J]. 计算机工程, 2006, (23) : 188 - 190
  • [9] Recognizing biomedical named en-tities in Chinese research abstracts. GUB,POPOWICHF,DAHL V. Advances in Artificial Intel-ligence . 2008
  • [10] A Domain-Specific Chinese Term Extraction Method Based on Prefix and Suffix. Li D,Wang Q,Li Y,et al. Proceedings of the Computer Science&Service System (CSSS),2012 International Conference on . 2012