基于HMM的Web信息抽取算法的研究与应用

被引:10
作者
祝伟华
卢熠
刘斌斌
机构
[1] 重庆大学软件学院
关键词
隐马尔可夫模型; 信息抽取; 机器学习;
D O I
暂无
中图分类号
TP393.09 []; O211.62 [马尔可夫过程];
学科分类号
080402 ; 020208 ; 070103 ; 0714 ;
摘要
随着因特网技术的迅速发展,网上信息成几何级数增长,如何从这些海量联机非结构化文本中自动抽取出结构化信息成为目前重要的研究课题。研究了基于隐马尔可夫模型的Web信息抽取算法,着重探讨了隐马尔可夫模型在文本信息抽取中应该如何应用,数据应该如何标记,并对隐马尔可夫模型在文本信息抽取中的应用提出了几个改进的方法,建立了基于HMM的Web信息抽取模型,并对信息抽取后的数据进行了分析对比,验证了改进算法的有效性。
引用
收藏
页码:203 / 206
页数:4
相关论文
共 7 条
[1]   基于浏览行为量化分析的兴趣网页提取 [J].
朱征宇 ;
周智 ;
罗颖 ;
李力沛 .
重庆工学院学报(自然科学版), 2009, (07) :79-84
[2]   基于多模板隐马尔可夫模型的文本信息抽取算法 [J].
胡宇舟 ;
王雷 ;
顾学道 .
计算机应用, 2008, (03) :699-702
[3]   基于文本分块的多模板隐马尔可夫模型的文本信息抽取 [J].
王雷 ;
陈治平 ;
李志成 .
山东大学学报(理学版), 2006, (03) :21-24
[4]   基于多模板隐马尔可夫模型的文本信息抽取算法 [J].
钟敏娟 ;
郝谦 ;
刘云中 .
计算机工程, 2006, (02) :203-205
[5]   基于最大熵的隐马尔可夫模型文本信息抽取 [J].
林亚平 ;
刘云中 ;
周顺先 ;
陈治平 ;
蔡立军 .
电子学报, 2005, (02) :236-240
[6]   二阶隐马尔可夫模型及其在计算语言学中的应用 [J].
杜世平 ;
李海 .
四川大学学报(自然科学版), 2004, (02) :284-289
[7]   一种基于Markov链模型的动态聚类方法 [J].
邢永康 ;
马少平 ;
不详 .
计算机研究与发展 , 2003, (02) :129-135