基于空间金字塔模型的图像分类方法研究

被引:0
作者
郭敏杰
机构
[1] 江西理工大学
关键词
SPM模型; 图像分类; 特征融合; 空间视觉词典; 稀疏编码;
D O I
暂无
年度学位
2014
学位类型
硕士
导师
摘要
图像分类技术是计算机视觉领域中的一个重要研究方向,它的目的在于根据某些特征和需求对图像进行分类。较经典的分类模型主要包括BOF模型和SPM模型,其中,SPM模型在图像分类领域越来越受到关注,它考虑了视觉单词之间的空间关系,避免了BOF模型在分类过程中造成的一些有用的图像空间结构信息的丢失,减少了图像信息的损失,带来了高效的分类性能。 本论文基于SPM模型的基本框架来研究图像分类问题,主要围绕集成学习思想和特征融合技术,通过改进空间视觉词典的构建方式,进一步对生成的图像描述采用不同的处理方法,对图像分类展开了研究。 鉴于集成学习方法的优越性,提出了一种集成多特征与稀疏编码的图像分类方法,结合多种可用于提高图像分类性能的方法来分类图像。该方法首先对图像进行空间金字塔划分,结合SIFT和HOG特征之间的优势互补性,提取得到不同的特征集。然后,在不同的特征集上用不同的聚类方法得到不同的视觉词典,在每个词典上分别进行LLC和SC编码,得到不同的图像描述集。最后对得到的多个结果采用投票决策方法决定最终的分类情况。 为了挖掘空间视觉词典在对图像表述上的潜力,本文进行了两个方面的研究:多级空间视觉词典集体的方法和构建强判别力的空间视觉词典的方法。前者,提出了一种多级空间视觉词典集体的构造方法,构造不同层级上的视觉词典,从全局视觉词典一直到划分比较细的子空间视觉词典,从而可以综合不同层级或不同粒度的图像信息进行分类。图像各子区域内的特征基于其对应的空间视觉词典进行LLC稀疏编码,根据各层次、各子区域对图像贡献程度的不同赋予不同的权重,将所有加权量化特征向量连接形成最终的图像描述。后者,提出了一种构建强判别力的空间视觉词典的方法,它的基本出发点是通过对图像进行空间金字塔划分后,对每个子区域提取最具有区分意义的视觉单词生成视觉词典。把所有训练图像的该子区域中的所有特征集合起来,统计特征集中各特征出现的次数来选择出现概率最大的单词,生成该子区域最终的视觉词典。
引用
收藏
页数:71
共 32 条
[1]
聚类集成理论与其在图像分类中的应用.[M].罗会兰; 著.科学出版社.2012,
[2]
基于BoW模型的图像分类方法研究 [D]. 
王莹 .
哈尔滨工程大学,
2012
[3]
基于PLSA-BOW模型的医学影像分类算法的研究 [J].
曹春红 ;
赵大哲 ;
张斌 ;
刘岳 .
计算机应用与软件, 2012, 29 (12) :103-107
[4]
一种基于局部随机子空间的分类集成算法 [J].
杨明 ;
王飞 .
模式识别与人工智能, 2012, 25 (04) :595-603
[5]
基于高斯混合模型与PCA-HOG的快速运动人体检测 [J].
汪成亮 ;
周佳 ;
黄晟 .
计算机应用研究, 2012, 29 (06) :2156-2160
[6]
一种基于随机化视觉词典组和查询扩展的目标检索方法 [J].
赵永威 ;
李弼程 ;
彭天强 ;
高毫林 .
电子与信息学报, 2012, 34 (05) :1154-1161
[7]
一种基于稀疏编码的多核学习图像分类方法 [J].
亓晓振 ;
王庆 .
电子学报, 2012, 40 (04) :773-779
[8]
基于改进的图像兴趣点特征提取匹配研究 [J].
张静 ;
董伟 ;
李红娟 ;
刘旭宁 .
计算机仿真, 2012, 29 (02) :288-290+331
[9]
基于稀疏编码和多类SVM的入侵检测 [J].
崔振 .
计算机工程与设计, 2011, 32 (11) :3606-3608+3612
[10]
基于多特征和改进SVM集成的图像分类 [J].
付燕 ;
鲜艳明 .
计算机工程, 2011, 37 (21) :196-198