图像-文本相关性挖掘的Web图像聚类方法

被引:11
作者
吴飞
韩亚洪
庄越挺
邵健
机构
[1] 浙江大学计算机科学与技术学院
关键词
图聚类; 复杂图; 可见度; LDA(latent Dirichlet allocation); 谱聚类;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
为了实现Web图像检索结果的聚类,提出了一种Web图像的图聚类方法.首先定义了两种类型关联:单词与图像结点之间的异构链接以及单词结点之间的同构链接.为了克服传统的TF-IDF方法不能直接反映单词与图像之间的语义关联局限性,提出并定义了单词可见度(visibility)这一属性,并将其集成到传统的tf-idf模型中以挖掘单词-图像之间关联的权重.根据LDA(latent Dirichlet allocation)模型,单词-单词之间关联权重通过一个定义的主题相关度函数来计算.最后,应用复杂图聚类和二部图协同谱聚类等算法验证了在图模型上引入两种相关性关联的有效性,达到了改进了Web图像聚类性能的目的.
引用
收藏
页码:1561 / 1575
页数:15
相关论文
共 3 条
[1]   复杂网络聚类方法 [J].
杨博 ;
刘大有 ;
金弟 ;
马海宾 .
软件学报, 2009, 20 (01) :54-66
[2]   一种基于内容相关性的跨媒体检索方法 [J].
张鸿 ;
吴飞 ;
庄越挺 ;
陈建勋 .
计算机学报, 2008, (05) :820-826
[3]   基于Labeled-LDA模型的文本分类新算法 [J].
李文波 ;
孙乐 ;
张大鲲 .
计算机学报, 2008, (04) :620-627