基于马氏距离的缺失值填充算法

被引:24
作者
杨涛
骆嘉伟
王艳
吴君浩
机构
[1] 湖南大学计算机与通信学院
基金
湖南省自然科学基金;
关键词
微阵列; 缺失值估计; 马氏距离; 信息熵;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
提出了一种基于马氏距离的填充算法来估计基因表达数据集中的缺失数据。该算法通过基因之间的马氏距离来选择最近邻居基因,并将已得到的估计值应用到后续的估计过程中,然后采用信息论中熵值的概念计算最近邻居的加权系数,得到缺失数据的填充值。实验结果证明了该算法具有有效性,其性能优于其他基于最近邻居法的缺失值处理算法。
引用
收藏
页码:152 / 155
页数:4
相关论文
共 4 条
[1]  
多元统计分析.[M].何晓群编著;.中国人民大学出版社.2004,
[2]  
信息论.[M].傅祖芸编著;.电子工业出版社.2001,
[3]  
统计学.[M].贾俊平;何晓群;金勇进 编著.中国人民大学出版社.2000,
[4]  
Knowledge-based analysis of microarray gene expression data by using support vector machines..Brown MPS; Grundy WN; Lin D; et al;.Proceedings of the National Academy of Sciences of the United States of Amercia.2000, 01