学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
ReDE:一个基于正则表达式的生物数据抽取方法
被引:8
作者
:
论文数:
引用数:
h-index:
机构:
邓绪斌
[
1
]
朱扬勇
论文数:
0
引用数:
0
h-index:
0
机构:
复旦大学计算机与信息技术系
浙江财经学院信息学院
朱扬勇
[
2
]
机构
:
[1]
浙江财经学院信息学院
[2]
复旦大学计算机与信息技术系
来源
:
计算机研究与发展
|
2005年
/ 12期
关键词
:
生物数据源;
数据抽取;
元数据;
正则表达式;
抽取算法;
D O I
:
暂无
中图分类号
:
TP311.13 [];
学科分类号
:
1201 ;
摘要
:
从异构生物数据源抽取数据,建立查询分析平台是目前研究的热点,而抽取过程会涉及大量相互依赖的元数据,充分利用这种依赖关系可降低维护工作量·基于正则表达式(RE)提出了ReDE抽取方法:通过围绕RE组建立分析树,设计了基于RE的关系数据库模式生成算法和通用抽取与组装算法,其特点是:RE是惟一的元数据,易于管理和维护·该方法奠定了生物数据库辅助设计工具和高自动化抽取工具的基础,已用于构建国内第1个整合的生物信息在线数据仓库·
引用
收藏
页码:2184 / 2191
页数:8
相关论文
共 2 条
[1]
一种基于树结构的Web数据自动抽取方法
胡东东
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民大学信息学院
胡东东
论文数:
引用数:
h-index:
机构:
孟小峰
[J].
计算机研究与发展,
2004,
(10)
: 1607
-
1613
[2]
RE-tree: an efficient index structure for regular expressions[J] . Chee-Yong Chan,Minos Garofalakis,Rajeev Rastogi.The VLDB Journal . 2003 (2)
←
1
→
共 2 条
[1]
一种基于树结构的Web数据自动抽取方法
胡东东
论文数:
0
引用数:
0
h-index:
0
机构:
中国人民大学信息学院
胡东东
论文数:
引用数:
h-index:
机构:
孟小峰
[J].
计算机研究与发展,
2004,
(10)
: 1607
-
1613
[2]
RE-tree: an efficient index structure for regular expressions[J] . Chee-Yong Chan,Minos Garofalakis,Rajeev Rastogi.The VLDB Journal . 2003 (2)
←
1
→