ReDE:一个基于正则表达式的生物数据抽取方法

被引:8
作者
邓绪斌 [1 ]
朱扬勇 [2 ]
机构
[1] 浙江财经学院信息学院
[2] 复旦大学计算机与信息技术系
关键词
生物数据源; 数据抽取; 元数据; 正则表达式; 抽取算法;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量·基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系数据库模式生成算法和通用抽取与组装算法,其特点是:RE是惟一的元数据,易于管理和维护·该方法奠定了生物数据库辅助设计工具和高自动化抽取工具的基础,已用于构建国内第1个整合的生物信息在线数据仓库·
引用
收藏
页码:2184 / 2191
页数:8
相关论文
共 2 条