时空域深度卷积神经网络及其在行为识别上的应用

被引:24
作者
刘琮
许维胜
吴启迪
机构
[1] 同济大学电子与信息工程学院
关键词
时空域; 卷积神经网络; 深度学习; 动作特征; 行为识别;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
近年来深度卷积神经网络在静态图像识别上取得了较大进展,但在行为视频上建模运动信息的能力较弱。但是,运动信息是行为识别区别于静态图像识别的关键。基于滤波器响应积提出了时空域深度卷积神经网络。该网络先将相邻帧对应的卷积核分为两组,近似地形成傅里叶基函数对,后续的乘法层将不同帧产生的响应两两相乘后再输入加法层求和,从而将相邻帧映射到变换矩阵的特征值对应的不变子空间上,依靠相邻帧在不变子空间上的旋转角度检测它们之间的运动特征。理论分析证明,网络既对运动敏感,又对内容敏感。实验表明,该网络能对行为视频做出更准确的分类,并与近年出现的其他6种算法进行比较,结果体现了本算法的优越性。
引用
收藏
页码:245 / 249
页数:5
相关论文
共 9 条
[1]   深度学习及其在目标和行为识别中的新进展 [J].
郑胤 ;
陈权崎 ;
章毓晋 .
中国图象图形学报 , 2014, (02) :175-184
[2]   基于视觉的人体动作识别综述 [J].
胡琼 ;
秦磊 ;
黄庆明 .
计算机学报, 2013, 36 (12) :2512-2524
[3]   改进DV-HOP输电线路上的WSN节点定位 [J].
范瑞娟 ;
王倩 ;
罗强 .
计算机仿真, 2013, 30 (09) :131-134
[4]   基于可伸缩语义网络距离的Web多维信息识别算法 [J].
孔邵颖 ;
郭宏亮 .
科技通报, 2013, 29 (04) :33-35
[5]   基于主题隐马尔科夫模型的人体异常行为识别 [J].
朱旭东 ;
刘志镜 .
计算机科学, 2012, 39 (03) :251-255+275
[6]  
Gabor face recognition by multi-channel classifier fusion of supervised kernel manifold learning[J] . Zeng-Shun Zhao,Li Zhang,Meng Zhao,Zeng-Guang Hou,Chang-Shui Zhang.Neurocomputing . 2012
[7]  
Fusing appearance and distribution information of interest points for action recognition[J] . Matteo Bregonzio,Tao Xiang,Shaogang Gong.Pattern Recognition . 2011 (3)
[8]  
Circulant matrices and time-series analysis[J] . D. S. G. Pollock.International Journal of Mathematical Education in Science and Technology . 2002 (2)
[9]  
Deep learning from temporal coherence in video .2 H. Mobahi,R. Collobert,J.Weston. 7 International Conference of Machine Learning . 2009