使用异构互联网图像组的视频标注

被引:14
作者
王晗
吴心筱
贾云得
机构
[1] 北京理工大学计算机学院智能信息技术北京市重点实验室
基金
高等学校博士学科点专项科研基金;
关键词
知识迁移; 视频标注; 互联网图像搜索引擎; 共同特征子空间;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
摘要
标注用户视频中的事件是一项极具挑战性的工作.目前的研究主要关注如何从大量的已标注视频中获取视频相关概念,并用来标注未知的用户视频.现实场景下的视频具有复杂性和多样性的特点,建模需要收集大量已标注的视频训练样本,这个过程非常费时费力.为了缓解这一问题,作者利用大量互联网图像来建立模型,这些图像数据涵盖了各种环境下的各种事件.然而,从互联网上得到的知识变化多样且有噪声,如果不加选择而盲目进行知识迁移,反而会影响视频标注的效果.因此,作者提出了一种联合组权重学习框架来权衡互联网上不同但相关的图像组,并用这些知识建立视频标注模型.在该框架下,作者采用联合优化的方法来获得不同图像组的权重,每一个权重值表示了相应的图像组在知识迁移中所起的作用.为了解决视频与图像特征的异构问题,作者建立了一个共同特征子空间来连接视频和图像这两个特征空间.两个视频数据库上的实验结果表明了文中方法的有效性.
引用
收藏
页码:2062 / 2069
页数:8
相关论文
共 2 条
[1]
Canonical correlation analysis: An overview with application to learning methods [J].
Hardoon, DR ;
Szedmak, S ;
Shawe-Taylor, J .
NEURAL COMPUTATION, 2004, 16 (12) :2639-2664
[2]
Distinctive image features from scale-invariant keypoints [J].
Lowe, DG .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 2004, 60 (02) :91-110