学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
基于动态异构的Web信息集成网页分析方法
被引:8
作者
:
论文数:
引用数:
h-index:
机构:
李昌清
[
1
]
李艳霞
论文数:
0
引用数:
0
h-index:
0
机构:
河南科技大学电子信息工程学院
河南科技大学电子信息工程学院
李艳霞
[
1
]
李胜利
论文数:
0
引用数:
0
h-index:
0
机构:
华中科技大学计算机科学与技术学院
河南科技大学电子信息工程学院
李胜利
[
2
]
王剑
论文数:
0
引用数:
0
h-index:
0
机构:
河南科技大学电子信息工程学院
河南科技大学电子信息工程学院
王剑
[
1
]
机构
:
[1]
河南科技大学电子信息工程学院
[2]
华中科技大学计算机科学与技术学院
来源
:
计算机应用研究
|
2007年
/ 12期
关键词
:
网页分析;
信息抽取;
模式匹配;
D O I
:
暂无
中图分类号
:
TP393.092 [];
学科分类号
:
080402 ;
摘要
:
将动态异构的Web信息资源进行抽取以统一的方式供用户查询和使用,是当前迫切需要解决的问题。介绍了分析相关Web页面的方法和经验,实现了自动提交HTML表单获得所需页面和对页面的信息抽取。最后,实验证明了此方法的有效性。
引用
收藏
页码:204 / 206
页数:3
相关论文
共 5 条
[1]
基于本体的文档引文元数据信息抽取
[J].
论文数:
引用数:
h-index:
机构:
郭志鑫
.
微计算机信息,
2006,
(18)
:304
-306
[2]
基于Internet的军事演习信息抽取系统
[J].
李跃进
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
李跃进
;
赵晶
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
赵晶
;
论文数:
引用数:
h-index:
机构:
林鸿飞
.
计算机工程与应用,
2006,
(14)
:214
-218
[3]
异构Web数据库集成检索系统的网页分析技术
[J].
宋武伟
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学
宋武伟
.
情报杂志 ,
2006,
(03)
:102
-104
[4]
信息抽取研究综述
[J].
李保利
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
李保利
;
陈玉忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
陈玉忠
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
俞士汶
.
计算机工程与应用,
2003,
(10)
:1
-5+66
[5]
Nicholas Kushmerick.Wrapper induction: Efficiency and expressiveness[J].Artificial Intelligence,2000(1)
←
1
→
共 5 条
[1]
基于本体的文档引文元数据信息抽取
[J].
论文数:
引用数:
h-index:
机构:
郭志鑫
.
微计算机信息,
2006,
(18)
:304
-306
[2]
基于Internet的军事演习信息抽取系统
[J].
李跃进
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
李跃进
;
赵晶
论文数:
0
引用数:
0
h-index:
0
机构:
大连理工大学计算机系
赵晶
;
论文数:
引用数:
h-index:
机构:
林鸿飞
.
计算机工程与应用,
2006,
(14)
:214
-218
[3]
异构Web数据库集成检索系统的网页分析技术
[J].
宋武伟
论文数:
0
引用数:
0
h-index:
0
机构:
西北工业大学
宋武伟
.
情报杂志 ,
2006,
(03)
:102
-104
[4]
信息抽取研究综述
[J].
李保利
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
李保利
;
陈玉忠
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
陈玉忠
;
俞士汶
论文数:
0
引用数:
0
h-index:
0
机构:
北京大学计算机科学与技术系计算语言学研究所
俞士汶
.
计算机工程与应用,
2003,
(10)
:1
-5+66
[5]
Nicholas Kushmerick.Wrapper induction: Efficiency and expressiveness[J].Artificial Intelligence,2000(1)
←
1
→