镜头内容分析及其在视频检索中的应用

被引:39
作者
林通
张宏江
封举富
石青云
机构
[1] 北京大学视觉与听觉信息处理国家重点实验室
[2] 微软亚洲研究院
[3] 北京大学视觉与听觉信息处理国家重点实验室 北京
[4] 北京
关键词
基于内容的视频检索; 镜头内容分析; 镜头相似性度量; 场景结构提取;
D O I
10.13328/j.cnki.jos.2002.08.033
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
提出了一种镜头内容分析方法及其在视频检索中的两个应用:镜头检索与场景结构提取.为了刻画一个镜头的内容变化,首先引入两个新的内容描述子:主色直方图和空间结构直方图.主色直方图能够捕捉那些持续时间最长的颜色,而这些颜色是这段视频所关注的对象或背景的主要颜色.从颜色块图提取的空间结构直方图是描述图像空间信息的一组特征.一个变化较大的镜头可以划分为几个内容一致的子镜头,两个镜头的相似性可以从对应子镜头的相似性计算得到.镜头相似性度量可以直接用于镜头检索,还可用于场景结构提取.另外,还提出分裂与合并力量竞争的场景结构提取方法.在大容量视频数据库上进行实验所得结果证实了该方法在镜头检索和场景提取的优异表现.
引用
收藏
页码:1577 / 1585
页数:9
相关论文
empty
未找到相关数据