一种基于粗糙k均值的双聚类算法

被引:29
作者
胡云
苗夺谦
王睿智
陈敏
机构
[1] 同济大学计算机科学与技术系
关键词
粗糙集; k均值聚类; 双聚类分析; 基因表达数据;
D O I
暂无
中图分类号
TP301.6 [算法理论];
学科分类号
080201 [机械制造及其自动化];
摘要
双聚类算法是为了发现基因表达数据矩阵中局部相似性而提出的新聚类方法。本文根据Cheng和Church的打分理论采用自底向上的策略,首先用粗糙k均值算法生成初始的基因数据块,再对这些数据块添加行和列,生成初始的双聚类。然后,删除初始的双聚类中一致性波动不好的行和列,从而得到最终的双聚类。实验表明,该算法能够高效地生成具有共表达水平的双聚类,更能找到一致波动水平很高的双聚类。
引用
收藏
页码:174 / 177
页数:4
相关论文
共 4 条
[1]
Interval Set Clustering of Web Users with Rough <Emphasis Type="Italic">K</Emphasis>-Means.[J].Pawan Lingras;Chad West.Journal of Intelligent Information Systems.2004, 1
[2]
ROUGH SETS [J].
PAWLAK, Z .
INTERNATIONAL JOURNAL OF COMPUTER & INFORMATION SCIENCES, 1982, 11 (05) :341-356
[3]
粗糙集理论中概念与运算的信息表示 [J].
苗夺谦 ;
王珏 .
软件学报, 1999, (02)
[4]
关于Rough Set理论与应用的综述 [J].
王珏 ;
苗夺谦 ;
周育健 .
模式识别与人工智能, 1996, 9 (04) :337-344