基于隐马尔可夫模型的引文信息提取

被引:10
作者
张玲
黄铁军
高文
机构
[1] 中国科学院计算技术研究所
[2] 中国科学院计算技术研究所 北京
[3] 中国科学院研究生院
[4] 北京
[5] 北京
关键词
隐马尔可夫模型; 信息提取; 引文; 特征提取; 宏平均; 微平均;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
提出一种基于符号特征提取的HMM结构学习方法,并利用修改的Viterbi算法进行引文信息提取。在实验结果的评价上,除了常用的准确率(Precision)、查全率(Recall)、综合评价指标(F)之外,引入了两个评价标准:宏平均和微平均来综合评价算法的性能。试验表明该方法用于引文信息提取的正确率较高。
引用
收藏
页码:33 / 34+54 +54
页数:3
相关论文
共 7 条
  • [1] Information Extraction Using Hidden Markov Models. Leek, T. R. . 1997
  • [2] Hidden Markov Models for Information Extraction. Zhang N R. . 2001
  • [3] Learning Hidden Markov ModelStructure for Information Extraction. Seymore K,McCallum A,Rosenfel R. AAAI99 Workshop on MachineLearning for Information Extraction .
  • [4] Information Extraction with HMMs and Shrinkage. Freitag D,MaCallum A K. .
  • [5] Machine Learning for Information Extraction in Informal Domains. Freitag D. Computer Science Department, Carnegie Mellon University,Pittsburgh, PA . 1998
  • [6] Bibliography Extraction with Hidden MarkovModels. Connan J,Omlin C W. Technical Report US-CS-TR-00-6.Department of Computer Science,University of Stellenbosch . 2000
  • [7] Information Extraction with HMM Structures Learned by Stochastic Optimization. Freitag D,McCallum A. . 2000