基于二阶隐马尔可夫模型的文本信息抽取

被引:25
作者
周顺先 [1 ]
林亚平 [1 ]
王耀南 [2 ]
易叶青 [1 ]
机构
[1] 湖南大学计算机与通信学院
[2] 湖南大学电气与信息工程学院
关键词
文本信息抽取; 一阶隐马尔可夫模型; 二阶隐马尔可夫模型; 精确度;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
隐马尔可夫模型是文本信息抽取的重要方法之一.在一阶隐马尔可夫模型中,假设状态转移概率和观察值输出概率仅依赖于模型当前的状态,一定程度降低了信息抽取的精确度.而二阶隐马尔可夫模型合理地考虑了概率和模型历史状态的关联性,对错误信息有更强的识别能力.提出了基于二阶隐马尔可夫模型的文本信息抽取算法;分析了二阶隐马尔可夫模型在文本信息抽取中的有效性;仿真实验表明,新的算法比基于一阶隐马尔可夫模型的算法具有更高的抽取精确度.
引用
收藏
页码:2226 / 2231
页数:6
相关论文
共 5 条