融合多模型和帧间信息的行人检测算法

被引：12

作者：

王斌 ^{[1
,2
]}

刘洋 ^{[3
]}

唐胜 ^{[1
]}

郭俊波 ^{[1
]}

机构：

[1] 中国科学院计算技术研究所智能信息处理重点实验室

[2] 中国科学院大学

[3] 国家计算机网络应急技术处理协调中心

来源：

计算机辅助设计与图形学学报 | 2017年 / 29卷 / 03期

基金：

北京市自然科学基金;

关键词：

行人检测; 卷积神经网络; 模型融合; 帧间信息融合;

D O I：

暂无

中图分类号：

TP391.41 [];

学科分类号：

080203 ;

摘要：

行人检测在车辆辅助驾驶、视频监控、智能机器人等领域具有重要的应用价值.针对当前行人检测算法在视频分辨率低和背景复杂的情况下存在很多误检及漏检的问题,提出一种融合多模型和帧间信息的行人检测算法.首先融合Fast R-CNN和Faster R-CNN模型的互补检测结果获取精准的检测窗口;然后采用视频帧间上下文融合算法来弥补单帧图像检测算法存在的漏检和误检.实验结果表明,在Caltech行人检测数据库上,在每幅图像虚警率(FPPI)为10%的条件下,该算法丢失率仅为14.04%,比Faster R-CNN单模型丢失率(16.09%)降低2.05%;利用多模型和帧间信息融合对行人检测结果进行校正,能提高行人检测性能.

引用

页码：444 / 449

页数：6