一种基于上下文语义信息的图像块视觉单词生成算法

被引:87
作者
刘硕研 [1 ]
须德 [1 ]
冯松鹤 [1 ]
刘镝 [2 ]
裘正定 [2 ]
机构
[1] 北京交通大学计算机科学系
[2] 北京交通大学信息科学研究所
基金
中国博士后科学基金;
关键词
场景分类; 视觉单词; 概率潜在语义分析模型; Markov随机场模型; 上下文语义信息;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
基于视觉单词的词包模型表示(Bag-of-Words)算法是目前场景分类中的主流方法.传统的视觉单词是通过无监督聚类图像块的特征向量得到的.针对传统视觉单词生成算法中没有考虑任何语义信息的缺点,本论文提出一种基于上下文语义信息的图像块视觉单词生成算法:首先,本文中使用的上下文语义信息是视觉单词之间的语义共生概率,它是由概率潜在语义分析模型(probabilistic Latent Semantic Analysis)自动分析得到,无需任何人工标注.其次,我们引入Markov随机场理论中类别标记的伪似然度近似的策略,将图像块在特征域的相似性同空间域的上下文语义共生关系有机地结合起来,从而更准确地为图像块定义视觉单词.最后统计视觉单词的出现频率作为图像的场景表示,利用支持向量机分类器完成图像的场景分类任务.实验结果表明,本算法能有效地提高视觉单词的语义准确性,并在此基础上改善场景分类的性能.
引用
收藏
页码:1156 / 1161
页数:6
相关论文
共 6 条
[1]
基于模糊C均值与Markov随机场的图像分割 [J].
蔡涛 ;
徐国华 ;
徐筱龙 .
计算机工程, 2007, (20) :34-36+39
[2]
The role of context in object recognition [J].
Oliva, Aude ;
Torralba, Antonio .
TRENDS IN COGNITIVE SCIENCES, 2007, 11 (12) :520-527
[3]
Semantic modeling of natural scenes for content-based image retrieval [J].
Vogel, Julia ;
Schiele, Bernt .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2007, 72 (02) :133-157
[4]
Distinctive image features from scale-invariant keypoints [J].
Lowe, DG .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (02) :91-110
[5]
Modeling the shape of the scene: A holistic representation of the spatial envelope [J].
Oliva, A ;
Torralba, A .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2001, 42 (03) :145-175
[6]
Unsupervised learning by probabilistic latent semantic analysis [J].
Hofmann, T .
MACHINE LEARNING, 2001, 42 (1-2) :177-196