基于动态异构的Web信息集成网页分析方法

被引:8
作者
李昌清 [1 ]
李艳霞 [1 ]
李胜利 [2 ]
王剑 [1 ]
机构
[1] 河南科技大学电子信息工程学院
[2] 华中科技大学计算机科学与技术学院
关键词
网页分析; 信息抽取; 模式匹配;
D O I
暂无
中图分类号
TP393.092 [];
学科分类号
080402 ;
摘要
将动态异构的Web信息资源进行抽取以统一的方式供用户查询和使用,是当前迫切需要解决的问题。介绍了分析相关Web页面的方法和经验,实现了自动提交HTML表单获得所需页面和对页面的信息抽取。最后,实验证明了此方法的有效性。
引用
收藏
页码:204 / 206
页数:3
相关论文
共 5 条
[1]   基于本体的文档引文元数据信息抽取 [J].
郭志鑫 .
微计算机信息, 2006, (18) :304-306
[2]   基于Internet的军事演习信息抽取系统 [J].
李跃进 ;
赵晶 ;
林鸿飞 .
计算机工程与应用, 2006, (14) :214-218
[3]   异构Web数据库集成检索系统的网页分析技术 [J].
宋武伟 .
情报杂志 , 2006, (03) :102-104
[4]   信息抽取研究综述 [J].
李保利 ;
陈玉忠 ;
俞士汶 .
计算机工程与应用, 2003, (10) :1-5+66
[5]  
Nicholas Kushmerick.Wrapper induction: Efficiency and expressiveness[J].Artificial Intelligence,2000(1)