基于二分频率变换的序列相似性查询处理技术

被引:16
作者
王国仁
葛健
徐恒宇
郑若石
机构
[1] 东北大学信息科学与工程学院
关键词
序列相似性查询; 范围查询; 编辑距离; 生物信息学;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
摘要
作为基因功能预测的主要手段,序列相似性查询技术是生物信息学领域的研究热点.基因序列和结构的相似性往往决定了基因功能的相似性,因此可以通过基因序列的相似性查找来预测新基因的功能.分析了MRS索引中频率变化和小波变换等相关技术,讨论了它们的缺点和不足,提出了一种基于二分频率变换2-PFT的序列相似性查询处理技术.首先,设计了二分频率变换和相应的距离函数,使得系统较之频率变换和小波变换具有更高的过滤能力,极大地提高了系统的性能;其次,解决了处理任意长度查询的问题.理论证明和实验结果均表明,2-PFT系统的性能远远优于MRS系统.
引用
收藏
页码:232 / 241
页数:10
相关论文
共 2 条
[1]
A sublinear algorithm for approximate keyword searching.[J].E. W. Myers.Algorithmica.1994, 4
[2]
An O ( ND ) difference algorithm and its variations.[J].Eugene W. Myers.Algorithmica.1986, 1