隐马尔可夫模型的研究及其在图像识别中的应用

被引:0
作者
李杰
机构
[1] 清华大学
关键词
隐马尔可夫模型; 图像识别; 脱机手写体汉字识别; 人脸识别; 自适应隐马尔可夫模型;
D O I
暂无
年度学位
2004
学位类型
博士
导师
摘要
图像识别技术在生产生活中有着十分广泛的应用,复杂图像的识别问题一直是近年来模式识别和图像处理研究的热点。本文基于隐马尔可夫模型进行图像识别问题的研究。如何将已经在语音识别领域取得了广泛应用的隐马尔可夫模型成功引入到图像识别中来是近年来相关研究讨论的热点。本文认为,针对不同对象建立合适的伪二维隐马尔可夫模型是目前最可行和有效的方法。本文首先提出了一种适用于脱机手写体汉字识别的嵌套伪二维隐马尔可夫模型。嵌套伪二维结构是对二维结构的一种合理简化,而这种简化是基于对汉字结构的深入分析以及对邻点和邻域相关性的全面考察。这种模型在国标一级汉字字库上具有91.8%和95.2%的一选和十选识别率。本文对人脸识别问题进行了类似的研究,并提出了一种简化伪二维隐马尔可夫模型。这种模型在ORL人脸库上具有99.5%的识别率,而复杂度比已有的人脸隐马尔可夫模型小。 针对隐马尔可夫模型在上述的具体应用中出现的问题,本文提出经典隐马尔可夫模型理论具有状态集固定的缺陷。这种缺陷影响了隐马尔可夫模型对随机信号建模的能力,并限制了基于隐马尔可夫模型的分类器的性能。因此,本文提出了一种全新的自适应隐马尔可夫模型,可表示为θ(N,A,B,π)。它具有可变的状态集,目的是为了自动匹配信号的“真正”隐含状态集,提取更多的结构信息。它采用了一种基于确定性退火全局优化技术的收缩训练算法,这种算法以最大后验概率为优化标准。实验结果表明该自适应模型具有理论和实践上的双重意义:更符合信号的内在结构,能提取更多的结构信息,可提高隐马尔可夫模型对随机信号建模的能力和在复杂图像识别应用中的性能。本文提出的嵌套伪二维隐马尔可夫模型经过自适应改造后可使脱机手写体汉字的一选和十选识别率分别提高到95.9%和99.0%。
引用
收藏
页数:115
共 9 条
[1]
数字图像处理.[M].(美)RafaelC.Gonzalez;(美)RichardE.Woods著;.电子工业出版社.2002,
[2]
计算机图像处理与识别技术.[M].王耀南等编著;.高等教育出版社.2001,
[3]
模式识别.[M].边肇祺等编著;.清华大学出版社.2000,
[4]
图象识别导论.[M].程民德等 编著.上海科学技术出版社.1983,
[5]
Filters, random fields and maximum entropy (FRAME): Towards a unified theory for texture modeling [J].
Zhu, SC ;
Wu, YN ;
Mumford, D .
INTERNATIONAL JOURNAL OF COMPUTER VISION, 1998, 27 (02) :107-126
[6]
改进的多层判别回归树算法及其在遥感图像分析中的应用 [J].
王增进 ;
危辉 .
计算机学报, 2004, (01) :92-98
[7]
一种基于数学形态学的手写汉字方向特征提取方法 [J].
金连文 ;
徐睿 ;
高学 ;
尹俊勋 .
计算机工程, 2003, (20) :38-39
[8]
模糊C-均值聚类法在医学图像分析中的应用 [J].
田捷 ;
韩博闻 ;
王岩 ;
罗希平 .
软件学报, 2001, (11) :1623-1629
[9]
基于模糊方向线素特征的手写体汉字识别 [J].
马少平 ;
夏莹 ;
朱小燕 .
清华大学学报(自然科学版), 1997, (03)