一种启发式的信息抽取算法

被引:8
作者
吴芬芬
刘磊
肖宪
机构
[1] 吉林大学计算机科学与技术学院
关键词
启发式算法; 文本分块; A*算法;
D O I
10.13413/j.cnki.jdxblxb.2007.01.014
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
提出一种启发式的信息抽取算法,并利用该算法建立一个信息抽取系统.该系统基于文本分块,利用文本的语义特征和结构特征,抽取具有特征的状态,在此基础上,利用反向动态规划和正向A*算法,抽取剩余的无特征状态.通过对100篇论文头部进行测试的结果表明,精确度和召回率比基于单词和传统Viterbi算法的方法均有所提高,启发式算法的性能优于Viterbi算法.
引用
收藏
页码:73 / 76
页数:4
相关论文
empty
未找到相关数据