代谢组学研究中数据处理新方法的应用

被引:35
作者
李晶
吴晓健
刘昌孝
元英进
机构
[1] 天津大学化工学院制药工程系
基金
国家高技术研究发展计划(863计划);
关键词
代谢组学; 离群样本点诊断; 非保守性代谢组分; 数据尺度同一化; 主成分分析法;
D O I
10.16438/j.0513-4870.2006.01.009
中图分类号
R96 [药理学];
学科分类号
100602 ; 100706 ;
摘要
目的探索代谢组学研究中数据处理的新方法。方法本文提出了在代谢组学数据预处理中,用稳健PCA的方法进行离群样品点的诊断,用变量的类内差异和类间差异的比较来判断非保守性代谢组分,用尺度同一化的方法进行数据预处理来消除数据的尺度差异。并以Arabidopsis thaliana属的四个基因型的植株代谢组学的数据为例,用以上的方法进行数据预处理后再用PCA的方法分析。结果与结论研究表明这三种数据预处理方法的应用会明显的改善代谢组学生物信息学分析中聚类分析的结果和生物标志物识别的准确性及全面性。
引用
收藏
页码:47 / 53
页数:7
相关论文
共 2 条
  • [1] Multi- and megavariate data analysis:principles and applications. Eriksson L,Johansson E,Wold NK. Umetrics Academy . 2001
  • [2] So what's the deal with metabonomics. Lindon JC,Holmes E,Nicholson JK. Analytical Chemistry . 2003