基于最大熵的隐马尔可夫模型文本信息抽取

被引:48
作者
林亚平
刘云中
周顺先
陈治平
蔡立军
机构
[1] 湖南大学计算机与通信学院
基金
湖南省自然科学基金;
关键词
人工智能; 文本信息抽取; 隐马尔可夫模型; 最大熵;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本信息抽取是处理海量文本的重要手段之一 .最大熵模型提供了一种自然语言处理的方法 .提出了一种基于最大熵的隐马尔可夫模型文本信息抽取算法 .该算法结合最大熵模型在处理规则知识上的优势 ,以及隐马尔可夫模型在序列处理和统计学习上的技术基础 ,将每个观察文本单元所有特征的加权之和用来调整隐马尔可夫模型中的转移概率参数 ,实现文本信息抽取 .实验结果表明 ,新的算法在精确度和召回率指标上比简单隐马尔可夫模型具有更好的性能 .
引用
收藏
页码:236 / 240
页数:5
相关论文
共 1 条
  • [1] RepositoryofOnlineInformationSourcesUsedinInformationExtractionTasks .2 RISE. http://www.isi.edu/info agents/RISE .