生物医学文本挖掘技术的研究与进展

被引:21
作者
王浩畅
赵铁军
机构
[1] 哈尔滨工业大学教育部—微软语言语音重点实验室
关键词
计算机应用; 中文信息处理; 生物信息学; 文本挖掘; 信息抽取; 机器学习;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
生物医学研究是二十一世纪最受关注的研究领域之一,该领域发表了巨量的研究论文,已经达到年平均60万篇以上。如何在规模巨大的研究文献中有效地获取相关知识,是该领域研究者所面临的挑战。作为生物信息学分支之一的生物医学文本挖掘技术就是一项高效自动地获取相关知识的新探索,近年来取得了较大进展。这篇综述介绍了生物医学文本挖掘的主要研究方法和成果,即基于机器学习方法的生物医学命名实体识别、缩写词和同义词的识别、命名实体关系抽取,以及相关资源建设、相关评测会议和学术会议等。此外还简要介绍了国内研究现状,最后对该领域近期发展作了展望。
引用
收藏
页码:89 / 98
页数:10
相关论文
共 3 条
  • [1] Text mining and its potential applications in systems biology
    Ananiadou, Sophia
    Kell, Douglas B.
    Tsujii, Jun-ichi
    [J]. TRENDS IN BIOTECHNOLOGY, 2006, 24 (12) : 571 - 579
  • [2] Au-tomatic extraction of biological information from sci-entific text:protein-protein interactions .2 Blaschke,Christian,Miguel A.Andrade,et al. ISMB-99 . 1999
  • [3] Medstract:creating large-scale information serv-ers for biomedical libraries .2 James Pustejovsky,Jose Castano,Jason Zhang,et al. Proc.workshop on natural language processing in the biomedical domain . 2002