基于聚类的视频字幕提取方法

被引:10
作者
宋砚 [1 ,2 ,3 ]
刘安安 [1 ,2 ]
张勇东 [1 ,2 ]
林守勋 [1 ,2 ]
机构
[1] 中国科学院计算技术研究所,前瞻实验室
[2] 中国科学院计算技术研究所,智能信息处理重点实验室
[3] 中国科学院研究生院
关键词
文字提取; OCR; K均值聚类;
D O I
暂无
中图分类号
TP391.41 [];
学科分类号
080203 ;
摘要
针对现有方法的不足,提出了一种视频中字幕提取的方法。该方法在文字定位步骤中采用多尺度文字定位以及文字区域精确化的方法;得到文字区域后,在文字分割步骤中使用一种改进的K均值聚类方法对其中的像素进行聚类,获得二值化的图像;最后用OCR软件识别得到文字。实验结果表明,该方法应用于网络视频敏感词语检测具有良好的效果。
引用
收藏
页码:136 / 140
页数:5
相关论文
共 2 条
[1]   Fast and robust text detection in images and video frames [J].
Ye, QX ;
Huang, QM ;
Gao, W ;
Zhao, DB .
IMAGE AND VISION COMPUTING, 2005, 23 (06) :565-576
[2]  
Texture-based approach for text detection in images using support vector machines and continuously adaptive mean shift algorithm. K. I. Kim,K. Jung,J. H. Kim. IEEE Transactions on Pattern Analysis and Machine Intelligence . 2005