多知识综合判决的字符切分算法

被引:6
作者
刘刚
丁晓青
彭良瑞
刘长松
机构
[1] 清华大学电子工程系智能技术与系统国家重点实验室
关键词
光学字符识别; 字符切分; 上下文分析;
D O I
暂无
中图分类号
TP391.43 [];
学科分类号
摘要
高性能的印刷体文字识别系统中,在单字识别技术比较成熟的条件下,字符切分成为比较关键的环节。字符切分可以看作是对字符边界正确切分位置的一个决策过程,该决策需要同时考虑字符局部的识别情况和全局的上下文关系。该文通过对中日韩三国文字字符切分的研究,提出一种基于多知识综合判决的字符切分算法。该算法成功应用于AsiaOCR项目,对于东方文字中常见的混排英文问题也能很好处理。实验结果表明,和以前的算法相比,新算法在中日韩三国文字识别系统中的切分错误率平均下降50%。
引用
收藏
页码:59 / 61+72 +72
页数:4
相关论文
共 1 条
  • [1] SinglecharactertypeidentificationJ. YefengZheng,ChangsongLiu,XiaoqingDing. . 2002