基于深度学习的人体行为识别算法综述

被引:129
作者
朱煜
赵江坤
王逸宁
郑兵兵
机构
[1] 华东理工大学信息科学与工程学院
关键词
行为识别; 深度学习; 卷积神经网络; 限制玻尔兹曼机;
D O I
10.16383/j.aas.2016.c150710
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
人体行为识别和深度学习理论是智能视频分析领域的研究热点,近年来得到了学术界及工程界的广泛重视,是智能视频分析与理解、视频监控、人机交互等诸多领域的理论基础.近年来,被广泛关注的深度学习算法已经被成功运用于语音识别、图形识别等各个领域.深度学习理论在静态图像特征提取上取得了卓著成就,并逐步推广至具有时间序列的视频行为识别研究中.本文在回顾了基于时空兴趣点等传统行为识别方法的基础上,对近年来提出的基于不同深度学习框架的人体行为识别新进展进行了逐一介绍和总结分析;包括卷积神经网络(Convolution neural network,CNN)、独立子空间分析(Independent subspace analysis,ISA)、限制玻尔兹曼机(Restricted Boltzmann machine,RBM)以及递归神经网络(Recurrent neural network,RNN)及其在行为识别中的模型建立,对模型性能、成果进展及各类方法的优缺点进行了分析和总结.
引用
收藏
页码:848 / 857
页数:10
相关论文
共 8 条
  • [1] Deep learning in neural networks: An overview[J] . Jürgen Schmidhuber.Neural Networks . 2014
  • [2] Application of Deep Belief Networks for Natural Language Understanding
    Sarikaya, Ruhi
    Hinton, Geoffrey E.
    Deoras, Anoop
    [J]. IEEE-ACM TRANSACTIONS ON AUDIO SPEECH AND LANGUAGE PROCESSING, 2014, 22 (04) : 778 - 784
  • [3] Effective 3D action recognition using EigenJoints[J] . Xiaodong Yang,YingLi Tian.Journal of Visual Communication and Image Representation . 2013
  • [4] Learning multiple layers of representation[J] . Geoffrey E. Hinton.Trends in Cognitive Sciences . 2007 (10)
  • [5] Free viewpoint action recognition using motion history volumes[J] . Daniel Weinland,Remi Ronfard,Edmond Boyer.Computer Vision and Image Understanding . 2006 (2)
  • [6] Long short-term memory
    Hochreiter, S
    Schmidhuber, J
    [J]. NEURAL COMPUTATION, 1997, 9 (08) : 1735 - 1780
  • [7] Long-term recurrent convolutional networks for visual recognition and description .2 Donahue J,Hendricks L A,Guadarrama S,et al. . 2014
  • [8] Notes on Convolutional Neural Networks .2 Bouvrie J. MIT-CBCL Technical Reports . 2006