面向智能交互的图像识别技术综述与展望

被引:91
作者
蒋树强
闵巍庆
王树徽
机构
[1] 中国科学院智能信息处理重点实验室(中国科学院计算技术研究所)
基金
国家自然科学基金重点项目;
关键词
图像识别; 智能的视觉识别; 智能交互; 视觉描述; 视觉问答; 深度学习;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
视觉在人与人交互以及人与自然界的交互过程中起到非常重要的作用,让终端设备具有智能的视觉识别和交互能力是人工智能和计算机技术的核心挑战和远大目标之一.可以看到,近年来视觉识别技术发展飞速,新的创新技术不断涌现,新的研究问题不断被提出,面向智能交互的应用呈现出一些新的动态,正在不断刷新人们对此领域的原有认识.从视觉识别、视觉描述和视觉问答3个角度对图像识别技术进行综述,对基于深度学习的图像识别以及场景分类技术进行了具体介绍,对视觉描述和问答技术的最新技术进行了分析和讨论,同时对面向移动终端和机器人的视觉识别和交互应用进行了介绍,最后对该领域的未来研究趋势进行了分析.
引用
收藏
页码:113 / 122
页数:10
相关论文
共 2 条
  • [1] 50 Years of object recognition: Directions forward[J] . Alexander Andreopoulos,John K. Tsotsos.Computer Vision and Image Understanding . 2013 (8)
  • [2] The treasure beneath convolutional layers:Cross-convolutional-layer pooling for image classification .2 Liu Lingqiao,Shen Chunhua,Hengel A. Proc of the IEEE Conf on Computer Vision and Pattern Recognition . 2015