定向查询引擎在Web化学数据库集成检索中的应用

被引:13
作者
储春梅
李晓霞
郭力
机构
[1] 中国科学院过程工程研究所,中国科学院过程工程研究所,中国科学院过程工程研究所北京,,北京,,北京,
关键词
定向查询引擎; 深层网; Web数据挖掘; 分布式数据库; 集成检索; XML;
D O I
10.16866/j.com.app.chem2005.08.021
中图分类号
TP392 [各种专用数据库];
学科分类号
摘要
Internet上的化字数据库是重要的专业资源,基于超链按分析的搜索引擎还不能索引这类资源。本论文以充分利用In- ternet上的化学数据库数据为目标,将“一个查询发动多个同级检索引擎,并以结构化的方式组织信息”的方案应用于以化合物标识信息为检索入口的Web化学数据库,建立了一个基于多站点集成检索的Web数据库定向查询引擎。该引擎是一个包括用户交互层、中间检索层、数据提供层的三层Web模型。各层在系统内部分别对应于响应用户检索请求的客户端代理模块、集成远程Web信息的服务器端代理模块,以及提供缓存和检索的关系数据库模块。模型采用JSP+Java组件的开发方式, 在HTTP协议标准发送方法的基础上,采用XML技术对检索返回文档进行结构化数据的提取和表示,利用XML-DBMS实现XML数据的存储和检索,建立了一套针对深层Web数据交换的解决方案。依此方案所建立的ChemDB Portal Search实现了四个分布式Web化学数据库的有效加入、同时检索和统一显示。该系统是针对深层Web信息的挖掘和集成检索的一次尝试, 它可为其它领域建立类似的系统提供借鉴。
引用
收藏
页码:91 / 98
页数:8
相关论文
共 1 条
[1]  
XML完全探索.[M].(美)StevenHolzner著;师夷工作室译;.中国青年出版社.2001,