学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
Web数据抽取技术研究进展
被引:13
作者
:
张成洪
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学管理学院
张成洪
古晓洪
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学管理学院
古晓洪
白延红
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学管理学院
白延红
机构
:
[1]
复旦大学管理学院
[2]
复旦大学管理学院 上海
[3]
上海
[4]
上海
来源
:
计算机科学
|
2004年
/ 02期
关键词
:
Web数据抽取;
Web查询;
包装器;
抽取规则;
D O I
:
暂无
中图分类号
:
TP393.09 [];
学科分类号
:
080402 ;
摘要
:
由于Web上存在着大量有用而复杂的信息,近年来学术界和企业界开发了许多从Web中抽取数据的方法和工具。本文总结了Web数据抽取技术的研究进展和从Web中抽取数据的主要原理、过程、方法和抽取规则,并讨论了未来的研究方向。
引用
收藏
页码:129 / 131+151 +151
页数:4
相关论文
共 2 条
[1]
A Conceptual Model and Rule-Based Query Language for HTML[J] . Mengchi Liu,Tok Wang Ling.World Wide Web . 2001 (1)
[2]
The Lorel query language for semistructured data
[J].
Serge Abiteboul
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Serge Abiteboul
;
Dallan Quass
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Dallan Quass
;
Jason McHugh
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Jason McHugh
;
Jennifer Widom
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Jennifer Widom
;
Janet L. Wiener
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Janet L. Wiener
.
International Journal on Digital Libraries,
1997,
1
(1)
:68
-88
←
1
→
共 2 条
[1]
A Conceptual Model and Rule-Based Query Language for HTML[J] . Mengchi Liu,Tok Wang Ling.World Wide Web . 2001 (1)
[2]
The Lorel query language for semistructured data
[J].
Serge Abiteboul
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Serge Abiteboul
;
Dallan Quass
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Dallan Quass
;
Jason McHugh
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Jason McHugh
;
Jennifer Widom
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Jennifer Widom
;
Janet L. Wiener
论文数:
0
引用数:
0
h-index:
0
机构:
Department of Computer Science,
Janet L. Wiener
.
International Journal on Digital Libraries,
1997,
1
(1)
:68
-88
←
1
→