基于张量表示的直推式多模态视频语义概念检测

被引:8
作者
吴飞
刘亚楠
庄越挺
机构
[1] 浙江大学计算机科学与技术学院数字媒体计算与设计实验室
关键词
多模态; 张量镜头; 时序关联共生; 高阶SVD; 降维; 直推式支持张量机;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
提出了一种基于高阶张量表示的视频语义分析与理解框架.在此框架中,视频镜头首先被表示成由视频中所包含的文本、视觉和听觉等多模态数据构成的三阶张量;其次,基于此三阶张量表达及视频的时序关联共生特性设计了一种子空间嵌入降维方法,称为张量镜头;由于直推式学习从已知样本出发能对特定的未知样本进行学习和识别.最后在这个框架中提出了一种基于张量镜头的直推式支持张量机算法,它不仅保持了张量镜头所在的流形空间的本征结构,而且能够将训练集合外数据直接映射到流形子空间,同时充分利用未标记样本改善分类器的学习性能.实验结果表明,该方法能够有效地进行视频镜头的语义概念检测.
引用
收藏
页码:2853 / 2868
页数:16
相关论文
共 6 条
[1]   基于支持向量机的渐进直推式分类学习算法 [J].
陈毅松 ;
汪国平 ;
董士海 .
软件学报, 2003, (03) :451-460
[2]   基于内容的视频多模式检索方法 [J].
胡楠 ;
王英武 ;
吕凝 .
吉林大学学报(信息科学版), 2006, (03) :265-270
[3]   一种基于内容相关性的跨媒体检索方法 [J].
张鸿 ;
吴飞 ;
庄越挺 ;
陈建勋 .
计算机学报, 2008, (05) :820-826
[4]   Supervised tensor learning [J].
Dacheng Tao ;
Xuelong Li ;
Xindong Wu ;
Weiming Hu ;
Stephen J. Maybank .
KNOWLEDGE AND INFORMATION SYSTEMS, 2007, 13 (01) :1-42
[5]   A tutorial on Support Vector Machines for pattern recognition [J].
Burges, CJC .
DATA MINING AND KNOWLEDGE DISCOVERY, 1998, 2 (02) :121-167
[6]  
A multilinear singular value decomposition .2 Lathauwer L D,Moor B D,Vandewalle J. SIAM Journal of Matrix Analysis and Applications . 2000