Deep Web数据集成研究综述

被引:132
作者
刘伟 [1 ]
孟小峰 [1 ]
孟卫一 [2 ]
机构
[1] 中国人民大学信息学院
[2] 纽约州立大学计算机科学系
关键词
World Wide Web; Deep Web; Web数据库; 查询接口; Deep Web数据集成;
D O I
暂无
中图分类号
TP393.09 [];
学科分类号
080402 ;
摘要
随着World Wide Web(WWW)的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速地增长.这些信息要通过查询接口在线访问其后端的Web数据库.尽管丰富的信息蕴藏在Deep Web中,由于Deep Web数据的异构性和动态性,有效地把这些信息加以利用是一件十分挑战性的工作.Deep Web数据集成至今仍然是一个新兴的研究领域,其中包含有若干需要解决的问题.总体来看,在该领域已经开展了大量的研究工作,但各个方面发展并不均衡.文中提出了一个Deep Web数据集成的系统架构,依据这个系统架构对Deep Web数据集成领域中若干关键研究问题的现状进行了回顾总结,并对未来的研究发展方向作了较为深入的探讨分析.
引用
收藏
页码:1475 / 1489
页数:15
相关论文
共 14 条
[1]  
Structured databases on the web[J] . Kevin Chen-Chuan Chang,Bin He,Chengkai Li,Mitesh Patel,Zhen Zhang.ACM SIGMOD Record . 2004 (3)
[2]  
Automatic integration of Web search interfaces with WISE-Integrator[J] . Hai He,Weiyi Meng,Clement Yu,Zonghuan Wu.The VLDB Journal . 2004 (3)
[3]  
DEByE – Data Extraction By Example[J] . Alberto H.F. Laender,Berthier Ribeiro-Neto,Altigran S. da Silva.Data & Knowledge Engineering . 2002 (2)
[4]   Concept Hierarchy-Based Text Database Categorization [J].
Weiyi Meng ;
Wenxian Wang ;
Hongyu Sun ;
Clement Yu .
Knowledge and Information Systems, 2002, 4 (2) :132-150
[5]   Building efficient and effective metasearch engines [J].
Meng, WY ;
Yu, C ;
Liu, KL .
ACM COMPUTING SURVEYS, 2002, 34 (01) :48-89
[6]  
Hierarchical Wrapper Induction for Semistructured Information Sources[J] . Ion Muslea,Steven Minton,Craig A. Knoblock.Autonomous Agents and Multi-Agent Systems . 2001 (1)
[7]  
Wrapper induction: Efficiency and expressiveness[J] . Nicholas Kushmerick.Artificial Intelligence . 2000 (1)
[8]  
SG-WRAP:A schema-guided wrapper generator .2 Meng X,Lu H,Wang H,Gu M. Proceedings of the18th Interna-tional Conference on Data Engineering . 2002
[9]  
Discovering complex matchings across web query interfaces: a correlation mining approach .2 He B,Chang K. C,Han J. Proceedings of the 10th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . 2004
[10]  
Light-weight Domain-based form assistant: Querying Web databases on the fly .2 Zhang Zhen,He Bin,Chang Kevin Chen-Chuan. Proceedings of the 31st VLDB Conference . 2005