面向增强现实的实时三维跟踪

被引:0
作者
董子龙
机构
[1] 浙江大学
关键词
实时; 增强现实; 三维跟踪; 关键帧; 双层分割;
D O I
暂无
年度学位
2010
学位类型
博士
导师
摘要
随着计算机运算能力的不断增强,计算机视觉研究得到了持续的发展,在监控、检索、识别、导航、医疗、教育等领域的应用为人的视觉提供有效的补充,甚至在某些方面很好地替代了人的视觉。虚实混合作为计算机视觉的重要应用之一,是通过特殊的设备,将计算机产生的虚拟信息与现实环境无缝融合,给人们提供额外的信息,如说明文字、视频教程、三维动画等。 本文涉及的增强现实是虚实混合技术的一种,利用相关计算机视觉技术分析现实场景中的物体和环境特征,并在指定的位置绘制计算机生成的附属信息,帮助人们更好地理解场景。一般的增强现实系统,包括视频输入、特征分析、摄像机定位、虚实融合等模块,其中特征分析和摄像机定位是最核心的模块。离线增强现实已经在电影工业,视频广告中得到广泛应用,然而实时增强现实更多地处在实验阶段。本文主要研究实时增强现实的三维跟踪技术,即实时地恢复摄像机与场景之间的相对空间方位,内容包括多线程技术框架设计、图像特征分析、大规模场景的关键帧表达、和纯旋转相机下的双层分割方法。总体来说,本文希望能促进实时三维跟踪技术在增强现实中的应用,主要贡献在以下几个方面。 ·提出统一的实时增强现实系统框架。在关键技术充分模块化,模块接口标准化的基础上,将各种现实环境下的增强现实统一在一个多线程并行框架里,用户可以便捷地在此基础上开发新的增强现实应用,而且这个框架充分利用了多核机器的计算能力,使系统在适应各种复杂环境的情况下保证高效可靠的性能。 ·提出改进的基准标志系统。在一些桌面增强现实应用中,系统不能从自然场景中提取足够的特征定位摄像机,必须辅以基准标志。本文提出的基准标志是包围在黑色方框中的汉字图像。为了在复杂的光影下也能稳定地检测出标志,系统利用边缘信息检测标志的包围框。同时,本文将汉字的结构表达为汉字轮廓到边框的距离场,增加了汉字标志的可识别度。另一方面,传统的基准标志一般是黑白图案,从视觉上看很不美观,本文于是利用自然图像作为基准标志的补充。 提出基于关键帧的场景表达和快速选择候选关键帧方法。在大规模自然场景中,系统利用Structure-from-Motion技术从预处理视频序列中恢复场景的稀疏三维点云。由于大规模场景的特征过于丰富,特征匹配在时间和数量上的性能都会明显下降。本文通过贪婪优化方法,从输入预处理视频序列中自动选择一些关键帧,这些关键帧将包含比较稳定的,特征明显的三维特征点。三维跟踪通过图像识别算法,为输入图像选择相似的候选关键帧,然后只跟候选关键帧进行特征匹配。为了获得更稳定的跟踪结果,本文还利用极线约束,连续帧跟踪等方法匹配更多特征点。 提出摄像机纯旋转运动下,快速稳定地分离前景背景物体的方法。由于场景和摄像机运动的双重复杂性,场景层次分割是处理增强现实中的虚实遮挡的重要方法,同时也是非常难解决的问题。本文尝试解决在摄像机只有旋转运动情况下前背景之间的遮挡,这事实上是一个前背景分割问题。系统首先建立背景的全景图,然后将实时输入图像与背景全景图配准,估计背景信息,并利用图割算法进行分割。针对复杂背景和背景配准误差,本文结合过分割方法对背景全景图建立局部颜色模型,同时压制背景的颜色反差信息。系统得到精确的分割结果,并实现了一系列特殊的增强现实效果。
引用
收藏
页数:117
共 31 条
[1]
Fast exact k nearest neighbors search using an orthogonal search tree [J].
Liaw, Yi-Ching ;
Leou, Maw-Lin ;
Wu, Chien-Min .
PATTERN RECOGNITION, 2010, 43 (06) :2351-2358
[2]
Video SnapCut.[J].Xue Bai;Jue Wang;David Simons;Guillermo Sapiro.ACM Transactions on Graphics (TOG).2009, 3
[3]
EPnP: An Accurate O(n) Solution to the PnP Problem [J].
Lepetit, Vincent ;
Moreno-Noguer, Francesc ;
Fua, Pascal .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2009, 81 (02) :155-166
[4]
A novel linear algorithm for P5P problem [J].
Tang, Jianliang ;
Chen, Wen-Sheng ;
Wang, Jie .
APPLIED MATHEMATICS AND COMPUTATION, 2008, 205 (02) :628-634
[5]
Description of interest regions with local binary patterns.[J]..Pattern Recognition.2008, 3
[6]
Modeling the world from Internet photo collections [J].
Snavely, Noah ;
Seitz, Steven M. ;
Szeliski, Richard .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2008, 80 (02) :189-210
[7]
Video abstraction.[J].Ba Tu Truong;Svetha Venkatesh.ACM Transactions on Multimedia Computing; Communications; and Applications (TOMCCAP).2007, 1
[8]
Evaluation of Features Detectors and Descriptors based on 3D Objects.[J].Pierre Moreels;Pietro Perona.International Journal of Computer Vision.2006, 3
[9]
An innovative algorithm for key frame extraction in video summarization [J].
Gianluigi, Ciocca ;
Raimondo, Schettini .
JOURNAL OF REAL-TIME IMAGE PROCESSING, 2006, 1 (01) :69-88
[10]
PnP problem revisited [J].
Wu, YH ;
Hu, ZY .
JOURNAL OF MATHEMATICAL IMAGING AND VISION, 2006, 24 (01) :131-141