基于多模板隐马尔可夫模型的文本信息抽取算法

被引:8
作者
钟敏娟 [1 ]
郝谦 [2 ]
刘云中 [3 ]
机构
[1] 江西财经大学信息管理学院
[2] 江西科技师范学院数学与计算机科学系
[3] 深圳中兴通讯公司CDMA事业部
关键词
信息抽取; 隐马尔可夫模型; 多模板; 聚类;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
针对训练数据来源的多样化,提出了基于多模板隐马尔可夫模型的文本信息抽取算法。该算法利用形式的聚类方法将训练数据聚成几个类,每个类代表一个模板,在聚类的基础上利用隐马尔可夫模型进行文本的信息抽取。实验结果表明,新算法具有较高的精确度和召回率。
引用
收藏
页码:203 / 205
页数:3
相关论文
共 2 条
[1]   一种基于Markov链模型的动态聚类方法 [J].
邢永康 ;
马少平 ;
不详 .
计算机研究与发展 , 2003, (02) :129-135
[2]   Learning Information Extraction Rules for Semi-Structured and Free Text [J].
Stephen Soderland .
Machine Learning, 1999, 34 :233-272