遗传密码和DNA序列的高维空间数字编码

被引:18
作者
陈惟昌
陈志华
陈志义
王自强
邱红霞
机构
[1] 中日友好临床医学研究所生物物理研究室!北京,中日友好临床医学研究所生物化学与分子生物学研究室!北京,中国科学院自动化研究所国家模式识别实验室!北京,中日友好临床医学研究所生物物理研究室!北京,中日友好临床医学研究所生物物理研究室!北京
关键词
数字编码; DNA序列; 遗传密码; 高维空间; 汉明距离; 生物计算机;
D O I
暂无
中图分类号
Q617 [生物结构理论];
学科分类号
071011 ;
摘要
二进制数字化编码是信息科学最基本的编码方式。用0(00)、1(01)、2(10)和3(11)4个数码对4种碱基(C、T、A、G)进行二进制数字编码 ,共有24种可能的编码组合 ,其中8种满足碱基互补法则 ,它们是拓扑等价的。按碱基分子量大小排列的编码格式 :0123/CTAG是最理想的编码格式。用二进制数对DNA的字符序列进行编码 ,有以下优点 :1)压缩信息冗余度 ,提高编码效率 ;2)可以对碱基的结构、功能基团、碱基互补、氢键强弱等性质进行编码 ;3)DNA序列的数字编码具有严格的大小顺序 ,即具有全序性质 ;4)DNA数字编码的对称性程度 ,与遗传密码简并度的对称性一致 ,并可得出氨基酸遗传密码的高维空间连通性简并法则 ;5)可以方便求出任意碱基重复单元的重复系列的数字编码法则 ;6)根据高维空间汉明编码距离的定义 ,可以确定任意多个DNA序列之间的信息距离和它们的交空间和并空间 ,对DNA序列生物信息学的分析研究有重要意义 ;7)DNA序列的数字编码可以方便进行各种数学运算和逻辑运算 ,对促进DNA生物计算机的发展 ,可有重大推动作用。
引用
收藏
页码:760 / 768
页数:9
相关论文
共 11 条
[1]  
DNAcomputing on sur-face. Liu Q H,Wang L M,Fruto A G. Nature . 2000
[2]   遗传密码表与《易经》 [J].
王文清 ;
周成 ;
刘枫 ;
李凌云 ;
李云 .
北京大学学报(自然科学版), 1998, (04) :59-68
[3]   世纪之交生物学发展趋势 [J].
邹承鲁 .
中国科学基金, 1999, (06) :31-33
[4]  
Improvingthesensitivityofprogressivesequencealignmentthroughsequenceweighting,positionspecific gappenaltiesandweightmatrixchoice. ThompsonH,ClustalW,etal. NuclAcidsRes . 1994
[5]   脊髓小脑变性疾病中神经元损伤的分子生物学机制 [J].
陈惟昌,陈志华,范慕贞,周永兴,王国相 .
基础医学与临床, 1995, (06) :14-18
[6]   生物信息学 [J].
陈润生 .
生物物理学报, 1999, (01) :6-13
[7]  
物理学家看生命[M]. 湖南教育出版社 , 罗辽复编著, 1994
[8]  
DNA computing on a chip. Ogihara M,Ray A. Nature . 2000
[9]   遗传密码的简并及其高维空间的拓扑结构 [J].
陈惟昌 ;
陈志华 ;
陈志义 ;
王自强 .
自然科学进展, 1999, (02) :81-84
[10]  
Proteindatabasesearchesformultiplealignments. AltschulS,LipmanD. Proceedings of the National Academy of Sciences of the United States of America . 1990