随机森林回归分析及在代谢调控关系研究中的应用

被引:32
作者
李贞子
张涛
武晓岩
李康
机构
[1] 哈尔滨医科大学卫生统计学教研室
关键词
随机森林; 多元回归分析; 代谢组学; 代谢调控网络;
D O I
暂无
中图分类号
O212.1 [一般数理统计];
学科分类号
020208 ; 070103 ; 0714 ;
摘要
目的探讨随机森林回归处理非线性、具有交互作用数据的性能,并将其应用于高维代谢组学数据的代谢网络变量筛选。方法通过模拟试验验证随机森林回归在具有交互作用和非线性情况下回归分析的效果,同时应用于卵巢良恶性肿瘤鉴别的代谢组学数据分析。结果模拟实验结果显示:对于具有交互作用及其他非线性关系的模拟数据,随机森林回归模型的效果明显优于多元线性回归模型;卵巢癌代谢组学数据分析显示,使用随机森林回归分析能够获得更为理想的结果。结论随机森林回归作为一种非参数回归技术,在一定的样本含量下(如n>100),能够在高维数据中有效地分析具有交互作用和非线性关系的数据。
引用
收藏
页码:158 / 160+163 +163
页数:4
相关论文
共 2 条
[1]   基因表达数据的随机森林逐步判别分析方法 [J].
武晓岩 ;
闫晓光 ;
李康 .
中国卫生统计, 2007, (02) :151-154
[2]   基因表达数据判别分析的随机森林方法 [J].
武晓岩 ;
李康 .
中国卫生统计, 2006, (06) :491-494