共 7 条
基于HMM的Web信息抽取算法的研究与应用
被引:10
作者:
祝伟华
卢熠
刘斌斌
机构:
[1] 重庆大学软件学院
来源:
关键词:
隐马尔可夫模型;
信息抽取;
机器学习;
D O I:
暂无
中图分类号:
TP393.09 [];
O211.62 [马尔可夫过程];
学科分类号:
080402 ;
020208 ;
070103 ;
0714 ;
摘要:
随着因特网技术的迅速发展,网上信息成几何级数增长,如何从这些海量联机非结构化文本中自动抽取出结构化信息成为目前重要的研究课题。研究了基于隐马尔可夫模型的Web信息抽取算法,着重探讨了隐马尔可夫模型在文本信息抽取中应该如何应用,数据应该如何标记,并对隐马尔可夫模型在文本信息抽取中的应用提出了几个改进的方法,建立了基于HMM的Web信息抽取模型,并对信息抽取后的数据进行了分析对比,验证了改进算法的有效性。
引用
收藏
页码:203 / 206
页数:4
相关论文