基于最大-最小相似度学习方法的文本提取

被引:10
作者
付慧
刘峡壁
贾云得
机构
[1] 北京理工大学计算机科学与技术学院智能信息技术北京市重点实验室
关键词
文本提取; 高斯混合模型; 判别学习; 最大-最小相似度学习; 最小分类错误学习;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
140502 [人工智能];
摘要
应用最大-最小相似度(maximum-minimum similarity,简称MMS)学习方法,对基于高斯混合模型的文本区域提取方法中的有关参数进行优化.该学习方法通过最大化正样本相似度和最小化反样本相似度获得最佳分类能力.根据这种判别学习思想,建立了相应的目标函数,并利用最速梯度下降法寻找目标函数最小值,以得到文本区域提取方法的最优参数集合.文本区域提取实验结果表明:在用期望最大化(expectation maximization,简称EM)算法获得参数的极大似然估计值后,使用最大-最小相似度学习方法,使文本提取综合性能明显提高,开放实验的召回率和准确率分别达到98.55%和93.56%.在实验中,最大-最小相似度学习方法的表现还优于常用的判别学习方法——最小分类错误(minimum classification error,简称MCE)学习方法.
引用
收藏
页码:621 / 629
页数:9
相关论文
共 8 条
[1]
Robust speech recognition method based on discriminative environment feature extraction [J].
Han, JQ ;
Gao, W .
JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2001, 16 (05) :458-464
[2]
Automatic text location in images and video frames [J].
Jain, AK ;
Yu, B .
PATTERN RECOGNITION, 1998, 31 (12) :2055-2076
[3]
用于文本区域提取的边缘像素聚类方法 [J].
付慧 ;
刘峡壁 ;
贾云得 .
计算机辅助设计与图形学学报, 2006, (05) :729-734
[4]
一种新的语言模型判别训练方法 [J].
于浩 ;
高剑峰 ;
步丰林 .
计算机学报, 2005, (10) :1708-1715
[5]
基于主动判别函数的手写体识别(英文) [J].
孙广玲 ;
刘家锋 ;
唐降龙 ;
石大明 ;
赵巍 .
软件学报, 2005, (04) :523-532
[6]
一种基于边缘检测和线条特征的视频字符检测算法 [J].
刘洋 ;
薛向阳 ;
路红 ;
郭跃飞 .
计算机学报, 2005, (03) :427-433
[7]
复杂彩色文本图像中字符的提取 [J].
陈又新 ;
刘长松 ;
丁晓青 .
中文信息学报, 2003, (05) :55-59
[8]
最优化理论与方法.[M].袁亚湘;孙文瑜著;.科学出版社.1997,