一种改进的基于HMM的信息抽取模型

被引:6
作者
洪流
张巍
肖明军
蔡庆生
机构
[1] 中国科学技术大学计算机科学技术系
关键词
信息抽取; 隐马尔可夫模型; 互联网;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
摘要
隐马尔可夫模型(HMM)作为一种有效的概率工具,已成为信息抽取领域中一个新的研究方向.本文针对其在Web信息抽取中存在的网页结构特征利用不足的问题,给出了一种改进的模型.它通过扩展HMM中输出符号的定义,由一维扩展到多维,实现对网页结构特性的有效利用试验表明,改进后的模型是稳定有效的,准确率平均提高了约10%.
引用
收藏
页码:347 / 351
页数:5
相关论文
共 1 条
[1]
知识发现.[M].史忠植著;.清华大学出版社.2002,