混合遗传算法和隐马尔可夫模型的Web信息抽取

被引:14
作者
肖基毅
邹腊梅
李传琦
机构
[1] 南华大学计算机科学与技术学院
基金
湖南省自然科学基金;
关键词
遗传算法; 隐马尔可夫模型; Web信息抽取; Baum-Welch算法; 最大似然算法;
D O I
暂无
中图分类号
TP18 [人工智能理论]; TP391.1 [文字信息处理];
学科分类号
120506 [数字人文]; 140502 [人工智能];
摘要
传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数。提出了一种使用遗传算法优化HMM模型参数的Web信息抽取混合算法。该算法使用实数矩阵编码表示染色体,似然概率值为适应度取值,将GA与Baum-Welch算法相结合对HMM模型参数进行全局优化,并且调整GA-HMM的Baum-Welch算法参数实现Web信息抽取。实验结果表明,新的算法在精确度和召回率指标上比传统HMM具有更好的性能。
引用
收藏
页码:132 / 135
页数:4
相关论文
共 4 条
[1]
基于隐马尔可夫模型的文本信息抽取 [J].
刘云中 ;
林亚平 ;
陈治平 .
系统仿真学报, 2004, (03) :507-510
[2]
Structural Hidden Markov Models Using a Relation of Equivalence: Application to Automotive Designs.[J] D. Bouchaffra;J. Tan Data Min. Knowl. Discov. 2006,
[3]
Automated data extraction from the web with conditional models[J] Xuan-Hieu Phan; Susumu Horiguchi; Tu-Bao Ho Int. J. of Business Intelligence and Data Mining 2005,
[4]
The hybrid heuristic genetic algorithm for job shop scheduling[J] Hong Zhou;Yuncheng Feng;Limin Han Computers & Industrial Engineering 2001,