基于音视频融合的定位跟踪算法

被引:0
作者
谢静
机构
[1] 天津大学
关键词
音频跟踪; 视频跟踪; 信息融合; 广义互相关; 均值偏移; 粒子滤波;
D O I
暂无
年度学位
2009
学位类型
硕士
导师
摘要
目标定位跟踪技术在军事目标跟踪、监控系统、说话人识别等许多领域都有广泛的应用。传统的音频和视频跟踪方法利用单一的音频信息或视频信息进行跟踪,在复杂环境下鲁棒性差,研究复杂场景中具有鲁棒性和实时性的跟踪方法具有重要的意义。因此本文对基于音视频信息融合的定位跟踪算法进行了研究。 本文首先研究了音频跟踪技术和视频跟踪技术。音频跟踪部分主要介绍了基于时延的麦克风阵列声源定位算法,并重点研究了广义互相关时延估计算法。视频跟踪部分主要研究了利用均值偏移算法的目标跟踪方法,利用目标的颜色特征实现跟踪,并对其进行了仿真。均值偏移算法是一种基于密度梯度上升的非参数化方法,通过迭代运算寻找目标位置,具有计算量小,实时性强的优点。然后,对粒子滤波进行了介绍,它是重要的信息融合工具之一。粒子滤波是蒙特卡罗方法和贝叶斯滤波方法的结合,通过预测和更新两个步骤迭代地估计系统的状态,用一组加权的粒子来表示目标状态的后验概率估计,适用于非线性非高斯系统,并具有从目标暂时丢失中恢复的优点。之后,提出了一种粒子滤波框架下的音视频融合跟踪算法。利用麦克风阵列通过基于时延的声源定位算法获取音频信息,从摄像头得到的视频序列中获取颜色特征信息。为增强跟踪系统的鲁棒性,利用粒子滤波融合音视频两部分的信息来进行跟踪。为了增强跟踪系统的实时性,将均值偏移算法嵌入粒子滤波中。
引用
收藏
页数:70
共 20 条
[1]
基于音频视频信息融合的人物跟踪及其应用 [D]. 
李昕 .
清华大学,
2005
[2]
多源信息融合.[M].韩崇昭;朱洪艳;段战胜等著;.清华大学出版社.2006,
[3]
多传感器信息融合及应用.[M].何友等著;.电子工业出版社.2000,
[4]
蒙特卡罗方法.[M].徐钟济 编著.上海科学技术出版社.1985,
[5]
基于动态贝叶斯网络的音视频联合说话人跟踪 [J].
金乃高 ;
殷福亮 ;
陈喆 .
自动化学报, 2008, (09) :1083-1089
[6]
非线性贝叶斯滤波算法综述 [J].
曲从善 ;
许化龙 ;
谭营 .
电光与控制, 2008, (08) :64-71
[7]
粒子滤波评述 [J].
程水英 ;
张剑云 .
宇航学报, 2008, (04) :1099-1111
[8]
基于粒子滤波和贝叶斯估计的目标跟踪 [J].
任伟建 ;
山茂泉 ;
谢锋 ;
王文东 .
大庆石油学院学报, 2008, (03) :67-70+137
[9]
一种多特征融合的粒子滤波跟踪新算法 [J].
王欢 ;
任明武 ;
杨静宇 .
计算机工程与应用, 2007, (25) :21-24+53
[10]
机动目标跟踪的非线性算法 [J].
于国桥 ;
张安清 .
火力与指挥控制, 2007, (06) :15-17+24