一种基于二次互信息的双聚类算法

被引:4
作者
闫雷鸣
孙志挥
机构
[1] 东南大学计算机科学与工程系
关键词
双聚类; 二次互信息; 基因表达数据;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
081202 ;
摘要
双聚类模型有助于聚类存在相关性的局部模式。论文提出了一种可识别多种相关模式的双聚类算法,以二次互信息作为相关性标准,并以Parzen窗口法有效估算高维变量之间的互信息;同时提出了最大相关维簇的概念。算法以多个最大相关维簇为种子,通过迭代细化聚类,可有效地发现高维数据环境内相关的长模式。真实基因表达数据的实验证明了算法的有效性。
引用
收藏
页码:158 / 160
页数:3
相关论文
共 1 条
[1]  
生物信息学基础[M]. 清华大学出版社 , 孙啸, 2005