数学公式识别系统:MatheReader

被引:13
作者
靳简明
江红英
王庆人
机构
[1] 南开大学机器智能研究所
关键词
公式定位; 公式识别; 公式分析; 自动性能评估; 文档图像处理;
D O I
暂无
中图分类号
TP391.4 [模式识别与装置];
学科分类号
0811 ; 081101 ; 081104 ; 1405 ;
摘要
数学公式广泛存在于各类文献之中,但是公式的识别远比文字段落的识别困难.文章介绍了一个数学公式图像识别系统MatheReader,重点阐述了其在公式定位及公式分析方面的技术方案.在公式定位方面,抽取版式特征,采用Parzen分类器区分独立公式和普通文字行,在普通文字行内检测二维结构定位内嵌公式.在公式分析方面,定义十一种基本公式类型,并用产生式规则限定每类公式的唯一分解方法,提出先识别公式类型,然后分解为子表达式的公式分析方法.和已有系统比较,MatheReader的功能更加强大,能够处理的公式更加丰富.
引用
收藏
页码:2018 / 2026
页数:9
相关论文
共 4 条
  • [1] 数学公式图像处理综述
    靳简明
    江红英
    王庆人
    [J]. 模式识别与人工智能, 2005, 18 (04) : 429 - 440
  • [2] Error detection, error correction and performance evaluation in on-line mathematical expression recognition[J] . Kam-Fai Chan,Dit-Yan Yeung.Pattern Recognition . 2001 (8)
  • [3] Optical Character Recognition and Parsing of Typeset Mathematics 1[J] . Richard J. Fateman,Taku Tokuyasu,Benjamin P. Berman,Nicholas Mitchell 2.Journal of Visual Communication and Image Representation . 1996 (1)
  • [4] EXTRAFOR: Automatic EXTRAction of mathematical FORmulas .2 Kacem A,Belaid A,Ahmed M. B. Proceedings of the 5 th International Conference on Document Analysis and Recognition . 1999