一种字符识别算法在自动识别系统中的应用_刘春雨

  • 格式:pdf
  • 大小:134.11 KB
  • 文档页数:3

下载文档原格式

  / 3
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

25卷 第3期2008年3月

微电子学与计算机

MICROELECTRONICS &COMPUTER

Vol.25 No.3March 2008

收稿日期:2007-05-08

一种字符识别算法在自动识别系统中的应用

刘春雨,李 俊

(中国科学院计算机网络信息中心,北京100080)

摘 要:基于车牌识别系统的开发,提出一种基于二值图像的字符识别算法.在该算法中,提取字符的点阵特征、特征线和网格特征,分类器采用神经网络.为充分利用各组特征向量的互补作用,采取层次结构来获得系统的最佳性能.实验表明此算法非常有效.

关键词:字符识别;网格特征;神经网络

中图分类号:TP393 文献标识码:A 文章编号:1000-7180(2008)03-0071-03

A Character Recognition Algorithm in the Application of

Vehicle License Plate Recognition System

LIU Chun 2yu,LI Jun

(Computer Network Information Center,Chinese Academy of Sciences,Beijing 100080,China)

Abstr act:We extract the features including the Lattice Structure,Key Line and Gr id F eatures.T he network is used as t he classificat ion.To make full of use of all kinds of featur e vectors,the hierarchical algorithm is adapted for optimal per 2formance.We test our algorithms in car number plate database.As the experimental results show,our algor ithm is very efficient.

Key words:OCR;grid featur es;nerve network

1 引言

车牌识别系统就是利用光学字符识别技术解决汽车牌照识别的典型系统,它的开发与应用有利于交通的控制与管理,是智能交通系统(IT S)中一个重要组成部分.车牌识别系统的软件部分主要由四部分组成,包括预处理、车牌定位、字符定位与字符识别.这四部分是顺序执行,而每个处理模块都为下一步处理作铺垫,其中字符识别模块是最后一步,也是衡量系统整体性能的一步.

字符识别涉及两个方面,即特征提取和识别方法,二者是继承互补的关系.关于字符的特征提取,目前已有许多经典的算法被提出来.根据字符的图像类型不同,特征提取可以分为彩色特征提取、灰度特征提取和二值特征提取;根据字符特征提取的基础可以分为点阵式统计特征提取,骨架或者细化特

征提取;根据字符特征提取的内容可以分为统计特征的提取,逻辑特征或者笔画特征提取等.

利用二值图像进行字符识别已提出多种算法[126],但识别效率和计算复杂度尚不能令人满意.为此提出新的字符识别算法.

2 算法

经过以上的字符预处理,将二值字符图像送入识别模块,完成字符识别任务.对于二值图像作如下几个步骤:归一化、细化和识别.

2.1 归一化和细化

把分割的二值图像进行线性缩放归一化,这样有利于特征提取和字符识别.归一化就是对实际提取的字符进行缩放操作,最后得到预定大小的字符图像.根据车牌号图片库中提取的4万多个字符样本,统计出样本的平均宽高为:20@16像素,因此利

用式(1)将字符都归一化到20@16大小.

[x c,y c]=

0,if(ori[x,y]==0+[x,y]|Rect)

1,else

(1)

v Ratio=OriHeight/PreHeight

h Ratio=OriWidth/PreWidth

x c=OriWidth/2+(x-PreWidth/2)*

h Ratio

y c=y*v Ratio(2)式中,OriH eight表示原始字符高度,PreH eight表示预定义字符高度,OriWidth表示原始字符宽度, Pre H eight表示预定义字符宽度;v Ratio与h Ratio 分别表示竖直和水平放缩比例;x与y表示在原始图像上的坐标,X c与Y c表示归一化图像上的坐标; ori[x,y]表示原始图像在(x,y)处的像素值,[x c, y c]表示归一化图像下(x c,y c)处的像素值;Rect表示原始图像所在的矩形框,[x,y]|Rect表示该像素点不在图像的矩形框内,则归一化后的像素点值为0.通过归一化处理,得到PreHeight*PreWidth 大小的字符图像.

根据形态学操作中的/中与丢0(hit and mass)原理,对归一化的二值图像进行细化,得到字符的骨架.

2.2识别算法

提取字符的笔画特征,利用模板匹配进行分类,这种方法主要应用于混淆字符或者难以辨别的字符的识别.

2.2.1特征提取

(1)点阵特征:该组特征基于细化的二值图像.二值细化字符图像的点阵结构反映了一个字符的整体结构特征,如果细化效果很好并且待识别的字符字体变换不大,不经过任何处理的点阵特征向量能够作为特征用于识别.通常,分类器采用模板匹配,利用距离函数计算模板与当前字符之间的相似度,其中相似度最小的那个模板所代表的字符即为识别出的字符.这种方法简单易行,并且计算复杂度低,适合印刷体的实时识别.

(2)特征线:如图1所示,统计偶数行和列的线段数目,组成(PreWidth+PreHeight)/2维特征向量.该组特征基于原始图像.这种方法的特点是将点阵结构进行重组,更有效地表达字符.但如果细化效果不好

,或者字符字体变化很大,这种方法就失效了.

图中,1表示前景像素,0表示背景像素;H line1~H line8表示统计的偶数行中所含的线段个

图1偶数行特征线段提取示意图

(H line i表示第i行的线段个数)

数.同样,也统计竖直方向偶数行中线段个数.线段在一定程度上反映了字符在某一方向的笔画密度,而字符笔画是联贯的,所以只需要统计单数行的线段数就能表示一个字符.

(3)网格特征:该组特征基于细化的二值特征.对字符进行分块,然后统计每一个块内前景像素的个数作为统计特征,组成PreWidth/BLOCKSIZEH *Pre H eight/BLOCKSIZEV维向量(其中,BLOCK2 SIZEH和BLOCKSIZEV表示水平和竖直方向划分块的尺寸).这种方法是对点阵结构的分区,也在一定程度上缩小了特征向量的维数.网格特征与特征线都反映了字符的局部特征如图2所示.

以上特征是有互补关系的:点阵特征反映字符的整体特征;特征线和网格特征反映字符的局部特征.所以,有效地利用上述特征,充分发挥各个特征向量的作用,系统性能就会提高.

2.2.2识别算法

利用BP神经网络来分类字符.BP神经网络包括3层:输入层、隐藏层和输出层.输入神经元的个数与特征向量的的尺寸有关,即点阵特征有PreWidth@PreHeight个输入神经元,特征线共有12+(PreWidth+PreH eight)/2个输入,网格特征共有PreWidth/BLOCKSIZEH*PreHeight/BLOCK2 SIZEV个输入,而霍夫矩共有7个输入.隐藏层包括16个神经元,而输出层的神经元个数为数字10个,字母26个.使用log sigmode作为学习函数来训练样本,设置最大叠代次数为1200.为了降低算法的计算复杂度,采取层次识别算法,即先用一些特征

72微电子学与计算机2008年