基于空间金字塔模型的图像分类方法研究

被引：0

作者：

郭敏杰

机构：

[1] 江西理工大学

关键词：

SPM模型; 图像分类; 特征融合; 空间视觉词典; 稀疏编码;

D O I：

暂无

年度学位：

2014

学位类型：

硕士

导师：

罗会兰;

摘要：

图像分类技术是计算机视觉领域中的一个重要研究方向，它的目的在于根据某些特征和需求对图像进行分类。较经典的分类模型主要包括BOF模型和SPM模型，其中，SPM模型在图像分类领域越来越受到关注，它考虑了视觉单词之间的空间关系，避免了BOF模型在分类过程中造成的一些有用的图像空间结构信息的丢失，减少了图像信息的损失，带来了高效的分类性能。本论文基于SPM模型的基本框架来研究图像分类问题，主要围绕集成学习思想和特征融合技术，通过改进空间视觉词典的构建方式，进一步对生成的图像描述采用不同的处理方法，对图像分类展开了研究。鉴于集成学习方法的优越性，提出了一种集成多特征与稀疏编码的图像分类方法，结合多种可用于提高图像分类性能的方法来分类图像。该方法首先对图像进行空间金字塔划分，结合SIFT和HOG特征之间的优势互补性，提取得到不同的特征集。然后，在不同的特征集上用不同的聚类方法得到不同的视觉词典，在每个词典上分别进行LLC和SC编码，得到不同的图像描述集。最后对得到的多个结果采用投票决策方法决定最终的分类情况。为了挖掘空间视觉词典在对图像表述上的潜力，本文进行了两个方面的研究：多级空间视觉词典集体的方法和构建强判别力的空间视觉词典的方法。前者，提出了一种多级空间视觉词典集体的构造方法，构造不同层级上的视觉词典，从全局视觉词典一直到划分比较细的子空间视觉词典，从而可以综合不同层级或不同粒度的图像信息进行分类。图像各子区域内的特征基于其对应的空间视觉词典进行LLC稀疏编码，根据各层次、各子区域对图像贡献程度的不同赋予不同的权重，将所有加权量化特征向量连接形成最终的图像描述。后者，提出了一种构建强判别力的空间视觉词典的方法，它的基本出发点是通过对图像进行空间金字塔划分后，对每个子区域提取最具有区分意义的视觉单词生成视觉词典。把所有训练图像的该子区域中的所有特征集合起来，统计特征集中各特征出现的次数来选择出现概率最大的单词，生成该子区域最终的视觉词典。

引用

页数：71

共 32 条

[1]

聚类集成理论与其在图像分类中的应用.[M].罗会兰; 著.科学出版社.2012,

[2]

基于BoW模型的图像分类方法研究 [D].