基于深度学习的图像合成技术研究

被引:0
作者
沈卓荟
机构
[1] 华东师范大学
关键词
图像合成; 深度学习; 图像抠取; 图像补全; 图像融合;
D O I
暂无
年度学位
2018
学位类型
硕士
导师
摘要
图像合成技术是在输入图像中抠取指定目标并融合至新图像的一种计算机技术,其研究具有一定的实际意义。传统的图像合成方法主要基于图像的颜色信息与先验知识进行研究,从而带来局限性,无法满足复杂应用需求。而深度学习方法通过卷积神经网络结构,学习高级语义特征,有助于克服传统方法的缺陷与瓶颈。本论文采用深度学习策略对图像合成问题进行研究,提供了基于深度学习的有效解決方案。论文中研究了图像合成的关键技术,着重探索了三个方面的问题:前景目标抠取策略,背景图像补全算法以及前景与背景的融合策略。首先,在前景抠取策略中,建立了低分辨率与高分辨率结合的深度学习架构,解决了数据集质量不均的问题,并定义了合理的网络结构与损失函数,以确保深度学习模型的质量和性能。通过自然图像与合成图像混合数据集的建立,解决了数据集匮乏的问题。所提出的图像抠取算法避免了传统问题研究的三分图输入的条件限制,实现了对前景目标的自动抠取,能够获得较为精细的图像抠取结果。其次,在背景补全算法中,设计了两阶段的图像补全策略,包括语义补全阶段及真实感增强阶段。在语义补全网络中,设计了有效的内容损失函数,保证了样本贡献的一致性;而在真实感增强网络中,使用初步补全结果作为输入,减少了输入中无用信息的影响,结合内容损失与对抗损失定义了合理的损失函数,确保最终补全结果具有真实感。实现了对任意大小、任意形状缺失区域的补全功能,能够得到符合语义、具有真实感细节的补全结果。此外,探索了前景与背景图像融合的策略,提出了一种无监督式的图像融合方法,设计了基于Lab颜色空间的图像融合策略,实现了前景色调的保留,并使用生成器-对抗器结构的深度学习模型对图像的明度通道进行预测,保证了融合区域的明暗一致性。设计了一种梯度损失项,并利用复合损失函数对网络训练进行控制,保留了融合后前景部分的固有语义信息,获得了具有真实感与明暗一致性的融合效果。总之,论文通过对前景抠取算法,背景补全算法及前景与背景图像融合策略关键技术的探索,为图像合成技术研究提供了基于深度学习的解决方案,具有一定的借鉴意义和价值。
引用
收藏
页数:87
共 10 条
[1]
Deep learning in neural networks: An overview.[J].Jürgen Schmidhuber.Neural Networks.2015,
[2]
Edge-Based Image Coarsening [J].
Fattal, Raanan ;
Carroll, Robert ;
Agrawala, Maneesh .
ACM TRANSACTIONS ON GRAPHICS, 2009, 29 (01)
[3]
Coordinates for Instant Image Cloning [J].
Farbman, Zeev ;
Hoffer, Gil ;
Lipman, Yaron ;
Cohen-Or, Daniel ;
Lischinski, Dani .
ACM TRANSACTIONS ON GRAPHICS, 2009, 28 (03)
[4]
Efficient gradient-domain compositing using quadtrees [J].
Agarwala, Aseem .
ACM TRANSACTIONS ON GRAPHICS, 2007, 26 (03)
[5]
Drag-and-drop pasting [J].
Jiaya, Jia ;
Sun, Jian ;
Tang, Chi-Keung ;
Shum, Heung-Yeung .
ACM TRANSACTIONS ON GRAPHICS, 2006, 25 (03) :631-636
[6]
Poisson matting [J].
Sun, J ;
Jia, J ;
Tang, CK ;
Shum, HY .
ACM TRANSACTIONS ON GRAPHICS, 2004, 23 (03) :315-321
[7]
GrabCut - Interactive foreground extraction using iterated graph cuts [J].
Rother, C ;
Kolmogorov, V ;
Blake, A .
ACM TRANSACTIONS ON GRAPHICS, 2004, 23 (03) :309-314
[8]
Poisson image editing [J].
Pérez, P ;
Gangnet, M ;
Blake, A .
ACM TRANSACTIONS ON GRAPHICS, 2003, 22 (03) :313-318
[9]
A MULTIRESOLUTION SPLINE WITH APPLICATION TO IMAGE MOSAICS [J].
BURT, PJ ;
ADELSON, EH .
ACM TRANSACTIONS ON GRAPHICS, 1983, 2 (04) :217-236
[10]
数字图像合成技术综述 [J].
吴昊 ;
徐丹 .
中国图象图形学报, 2012, 17 (11) :1333-1346