基于决策森林特征基因的两种识别方法

被引:11
作者
吕飒丽
汪强虎
李霞
郭政
机构
[1] 哈尔滨医科大学生物信息学系
[2] 哈尔滨医科大学生物信息学系 黑龙江哈尔滨
[3] 黑龙江哈尔滨
关键词
BOOTSTRAP; 决策森林; 人工神经网络; 特征基因;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
081102 [检测技术与自动化装置];
摘要
应用DNA芯片可获得成千上万个基因的表达谱数据。寻找对疾病有鉴别力的特征基因 ,滤掉与疾病无关的基因是基因表达谱数据分析的关键问题。利用决策森林方法的集成优势 ,提出基于决策森林的两种特征基因识别方法。该方法先由决策森林按照一定的显著性水平滤掉大部分与疾病类别无关的基因 ,然后采用统计频数法和扰动法 ,根据所选特征对分类的贡献程度对初选的特征基因作更加精细地选择。最后 ,选用神经网络作为外部分类器对所选的特征基因子集进行评价 ,将提出的方法应用于 4 0例结肠癌组织与 2 2例正常组织中 2 0 0 0个基因的表达谱实验数据。结果表明 :上述两种方法选出的特征基因均具有较高的疾病鉴别能力 ,均可获得最优特征基因子集 ,基于决策森林的统计频数法优于扰动法。
引用
收藏
页码:19 / 22
页数:4
相关论文
共 2 条
[1]
医学信息分析方法.[M].郭政等主编;.哈尔滨出版社.2001,
[2]
模式识别.[M].边肇祺等编著;.清华大学出版社.2000,