基因表达聚类结果的信息熵评价方法

被引:6
作者
易东
杨梦苏
李辉智
黄明辉
王文昌
机构
[1] 第三军医大学预防医学系卫生统计学教研室
[2] 香港城市大学基因组科技应用研究中心
[3] 西南政法大学刑侦学院电子技术教研室
[4] 重庆
关键词
基因表达; 聚类分析; 评价; entropy信息熵;
D O I
10.16016/j.1000-5404.2004.04.014
中图分类号
R311 [医用数学];
学科分类号
摘要
目的 探讨基因表达数据聚类结果信息熵评价方法 ,为合理地选择聚类方法提供一种定量评价依据。方法 采用entropy信息熵方法 ,考察常用的六种聚类方法所得到的分类结果与部分已知功能基因分类之间的符合程度 ,并将该指标作为一种评价依据。结果 将该方法应用于Lyer的血清刺激表达数据集聚类结果的评价 ,给出了六种聚类方法的entropy图。结论 本研究首次提出用熵理论评价聚类结果 ,并观察到同一数据集由于功能聚类信息的不同而引起的评价结果的差异。并且结果显示SOM和模糊聚类算法对分析处理Lyer的血清刺激的基因表达数据更为合理
引用
收藏
页码:317 / 319
页数:3
相关论文
共 2 条
[1]   基于伪F统计量的模糊聚类方法在基因表达数据分析中的应用 [J].
易东 ;
张彦琦 ;
王文昌 ;
张蔚 ;
杨梦苏 ;
黄明辉 ;
方志俊 .
中国卫生统计, 2002, (03) :18-22
[2]   Mathematical programming in data mining [J].
Mangasarian, OL .
DATA MINING AND KNOWLEDGE DISCOVERY, 1997, 1 (02) :183-201