基于隐马尔可夫模型的文本信息抽取

被引:52
作者
刘云中
林亚平
陈治平
机构
[1] 湖南大学计算机与通信学院
关键词
隐马尔可夫模型; 信息抽取; 文本分块; 机器学习;
D O I
10.16182/j.cnki.joss.2004.03.038
中图分类号
TP391.1 [文字信息处理];
学科分类号
摘要
文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐马尔可夫模型进行文本信息抽取。仿真结果表明,新的算法在精确度和召回率方面有明显的提高。
引用
收藏
页码:507 / 510
页数:4
相关论文
共 1 条