中文OCR的发展现状及其最新技术

被引:1
作者
郭繁夏
丁晓青
机构
[1] 清华大学电子工程系
关键词
OCR; 误识率; 符号; 印刷质量; 汉字识别系统; 识别率; 文本识别; 中文;
D O I
暂无
中图分类号
TP391.1 [文字信息处理];
学科分类号
081203 ; 0835 ;
摘要
<正> 汉字是形、声、义有机组合的方块文字,其特点是数量浩大(常用汉字在4000到7000个)、结构繁杂、字体字形变化多端。要利用OCR技术来解决汉字的计算机自动输入问题面临着很大挑战。从80年代开始,我国国家863高技术发展计划、国家自然科学基金等对汉字自动识别输入的研究就给予了充分的重视,经过十多年的发展,印刷体汉字识别技术的进展及其应用,已受到世人瞩目。 一、中文OCR技术及其研究简介 中文OCR技术包括以下几个部分:
引用
收藏
页码:28 / 30
页数:3
相关论文
empty
未找到相关数据