Web数据抽取技术研究进展

被引:13
作者
张成洪
古晓洪
白延红
机构
[1] 复旦大学管理学院
[2] 复旦大学管理学院 上海
[3] 上海
[4] 上海
关键词
Web数据抽取; Web查询; 包装器; 抽取规则;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
由于Web上存在着大量有用而复杂的信息,近年来学术界和企业界开发了许多从Web中抽取数据的方法和工具。本文总结了Web数据抽取技术的研究进展和从Web中抽取数据的主要原理、过程、方法和抽取规则,并讨论了未来的研究方向。
引用
收藏
页码:129 / 131+151 +151
页数:4
相关论文
共 2 条
[1]  
A Conceptual Model and Rule-Based Query Language for HTML[J] . Mengchi Liu,Tok Wang Ling.World Wide Web . 2001 (1)
[2]   The Lorel query language for semistructured data [J].
Serge Abiteboul ;
Dallan Quass ;
Jason McHugh ;
Jennifer Widom ;
Janet L. Wiener .
International Journal on Digital Libraries, 1997, 1 (1) :68-88