一种联合文本和图像信息的行人检测方法

被引:12
作者
周炫余 [1 ,2 ]
刘娟 [1 ,2 ]
卢笑 [3 ]
邵鹏 [1 ,2 ]
罗飞 [1 ,2 ]
机构
[1] 武汉大学软件国家重点实验室
[2] 武汉大学计算机学院
[3] 湖南大学电气与信息工程学院
关键词
行人检测; 马尔科夫随机场; 文本-图像信息联合; 共指关系; 指代消解;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对纯视觉行人检测方法存在的误检、漏检率高,遮挡目标以及小尺度目标检测精度低等问题,提出一种联合文本和图像信息的行人检测方法.该方法首先利用图像分析的方法初步获取图像目标的候选框,其次通过文本分析的方法获取文本中有关图像目标的实体表达,并提出一种基于马尔科夫随机场的模型用于推断图像候选框与文本实体表达之间的共指关系(Coreference Relation),以此达到联合图像和文本信息以辅助机器视觉提高交通场景下行人检测精度的目的.在增加了图像文本描述的加州理工大学行人检测数据集上进行的测评结果表明,该方法不仅可以在图像信息的基础上联合文本信息提高交通场景中的行人检测精度,也能在文本信息的基础上联合图像信息提高文本中的指代消解(Anaphora Resolution)精度.
引用
收藏
页码:140 / 146
页数:7
相关论文
共 8 条
[1]   基于层次过滤模型的中文指代消解 [J].
周炫余 ;
刘娟 ;
邵鹏 ;
罗飞 ;
刘洋 .
吉林大学学报(工学版), 2016, 46 (04) :1209-1215
[2]   基于后验HOG特征的多姿态行人检测 [J].
刘威 ;
段成伟 ;
遇冰 ;
柴丽颖 ;
袁淮 ;
赵宏 .
电子学报, 2015, 43 (02) :217-224
[3]   行人检测技术综述 [J].
苏松志 ;
李绍滋 ;
陈淑媛 ;
蔡国榕 ;
吴云东 .
电子学报, 2012, 40 (04) :814-820
[4]   Cutting-plane training of structural SVMs [J].
Joachims, Thorsten ;
Finley, Thomas ;
Yu, Chun-Nam John .
MACHINE LEARNING, 2009, 77 (01) :27-59
[5]   A machine learning approach to coreference resolution of noun phrases [J].
Soon, WM ;
Ng, HT ;
Lim, DCY .
COMPUTATIONAL LINGUISTICS, 2001, 27 (04) :521-544
[6]   A trainable system for object detection [J].
Papageorgiou, C ;
Poggio, T .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2000, 38 (01) :15-33
[7]  
On coreference resolution performance metrics .2 LUO X Q. Proceedings of HLT-EMNLP . 2005
[8]  
Baby talk:understanding and generating simple image descriptions .2 Kulkarni G,Premraj V,Dhar S,et al. IEEE Transactions on Pattern Analysis and Machine Intelligence . 2013