多媒体内容理解的研究现状与展望

被引:100
作者
彭宇新
綦金玮
黄鑫
机构
[1] 北京大学计算机科学技术研究所
关键词
多媒体内容理解; 图像细分类与检索; 视频分类与目标检测; 跨媒体检索; 视觉描述与生成; 视觉问答;
D O I
暂无
中图分类号
TP37 [多媒体技术与多媒体计算机];
学科分类号
080201 [机械制造及其自动化];
摘要
随着多媒体和网络技术的迅猛发展,海量的图像、视频、文本、音频等多媒体数据快速涌现.这些不同媒体的数据在形式上多源异构,语义上相互关联.认知科学研究表明,人脑生理组织结构决定了其对外界的感知和认知过程是跨越多种感官信息的融合处理.如何对不同媒体的数据进行语义分析和关联建模以实现多媒体内容理解,成为了一个研究和应用的关键问题,受到了学术界和工业界的广泛关注.选取了多媒体内容理解的5个最新热点研究方向:图像细分类与检索、视频分类与目标检测、跨媒体检索、视觉描述与生成、视觉问答,分别阐述了它们的基本概念、代表性方法、研究现状等,并进一步阐述了多媒体内容理解面临的重要挑战,同时给出未来的发展趋势,旨在帮助读者全面了解多媒体内容理解的研究现状,吸引更多研究人员投身相关研究并为他们提供技术参考,推动该领域的进一步发展.
引用
收藏
页码:183 / 208
页数:26
相关论文
共 11 条
[1]
跨媒体分析与推理:研究进展与发展方向(英文) [J].
Yuxin PENG ;
Wenwu ZHU ;
Yao ZHAO ;
Changsheng XU ;
Qingming HUANG ;
Hanqing LU ;
Qinghua ZHENG ;
Tiejun HUANG ;
Wen GAO .
Frontiers of Information Technology & Electronic Engineering, 2017, 18 (01) :44-58
[2]
基于Bag-of-phrases的图像表示方法.[J].张琳波;王春恒;肖柏华;邵允学;.自动化学报.2012, 01
[3]
Transductive Zero-Shot Action Recognition by Word-Vector Embedding [J].
Xu, Xun ;
Hospedales, Timothy ;
Gong, Shaogang .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2017, 123 (03) :309-333
[4]
Discriminative latent semantic feature learning for pedestrian detection.[J].Chao Zhu;Yuxin Peng.Neurocomputing.2017,
[5]
Exploiting distinctive topological constraint of local feature matching for logo image recognition.[J].Panpan Tang;Yuxin Peng.Neurocomputing.2017,
[6]
A Multi-View Embedding Space for Modeling Internet Images, Tags, and Their Semantics [J].
Gong, Yunchao ;
Ke, Qifa ;
Isard, Michael ;
Lazebnik, Svetlana .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2014, 106 (02) :210-233
[7]
Selective Search for Object Recognition [J].
Uijlings, J. R. R. ;
van de Sande, K. E. A. ;
Gevers, T. ;
Smeulders, A. W. M. .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2013, 104 (02) :154-171
[8]
Dense Trajectories and Motion Boundary Descriptors for Action Recognition [J].
Wang, Heng ;
Klaeser, Alexander ;
Schmid, Cordelia ;
Liu, Cheng-Lin .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2013, 103 (01) :60-79
[9]
Semantic hashing.[J].Ruslan Salakhutdinov;Geoffrey Hinton.International Journal of Approximate Reasoning.2008, 7
[10]
On space-time interest points [J].
Laptev, I .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2005, 64 (2-3) :107-123