关于文字识别中两种倾斜校正算法的比较研究

  • 格式:doc
  • 大小:22.50 KB
  • 文档页数:3

下载文档原格式

  / 3
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

关于文字识别中两种倾斜校正算法的比较研究

摘要:本文针对字符识别中的倾斜校正(即调整字符角度)问题,提出了一种新的校正方法,先经过灰度化,二值化的预处理,再提取字符图像每列的边缘点,经过公示算法计算出这些点所在的参考直线的倾斜角度,这个角度就是字符图像的倾斜角度,本文将这种方法与常用的hough变换校正法进行了比较,实验结果表明本文的算法不仅校正效果更好,而且大量节约了系统资源和简化了计算难度。

关键字:图像处理,计算机字符识别,倾斜校正,hough变换法比较

【中图分类号】tp391.41

文字识别是模式识别的重要内容之一,在进行文字识别的过程中由于种种人为因素或角度问题,待识别图像往往是存在一定的倾斜角度的。当倾斜角度较大时就会对后续的字符分割和字符识别的结果造成很大的影响。所以,在进行字符识别之前,进行文档图像的倾斜校正是非常有必要的。

1 本文采用的参考直线校正法

本文处理的文字识别图像需不包含复杂的背景图像,首行没有图表的干扰。

本文算法首先对原图像做预处理,包括灰度变换、阈值设定去噪和二值化处理。校正算法的大致思想是利用检测直线拟合,先检测每列的第一个非零点(即每个汉字的最上缘)作为边缘点,将他们

代入拟合的检测直线,看是否最多的符合检测直线,如果边缘点符合直线方程的越多,越可以认为这条直线就是符合图像文字倾斜的倾斜直线。求文档图像倾斜角度的关键就在于找到文档图像的参考直线并计算这条线的倾斜角度,进而求出图像的倾斜角度。

本文选用matlab语言编写程序,依次对图像做灰度化处理,二值化处理,将字符图像处理为字符部分为1,背景部分为0的形式。为了避免其他费字符部分的灰度干扰,本文在二值化之前加上了一组判定语句,将灰度化之后的图像灰度值大于120的像素点变为255,其余像素点变为0,这样,字符图像就只包含有两种数值,进行二值化后,就只有字符部分和背景部分了,去除非字符部分干扰。由分析可知本文的算法只提取字符图像每列的元素值,并计算这些值所在直线倾斜的角度,所以这种方法大大缩减了计算量,减少了计算的复杂性,并且大量节省了存储空间,这是它最大的优点。

2 hough变换法进行文档图像的倾斜校正

hough变换的基本原理是利用图像空间中的目标像素坐标计算参数空间中参考点的可能轨迹,并在累加器中给计算出的参考点计数,进行变换时要将经过空间直线的点(x,y)对应的直线斜率a 和截距b分别求出,每一次求出a和b都要进行累加,由于可能存在竖直线即a为无穷大的情况,所以参数空间一般采用极坐标的形式。

3 试验对比结果及结论

由以上分析可知,hough变换的优点是抗噪性能较好,能连接共

线的直线,缺点是需要耗费大量的时间和空间,而且校正结果有时并不理想;而利用本文的算法校正结果比较好,校正角度更为精确,由于本文的校正算法只提取最边缘点,所以计算量和所需存储空间并不大,但抗噪性能不如hough变换,所以本文程序中加入了对待检测图像灰度变换后的阈值限制,进行初步去噪,由于噪声点大都低于字符的灰度,所以这样去噪也能达到很好的效果。

参考文献:

1 张华,张航.汉字识别方法综述.计算机工程,2010,36(20):194-197

2 j.illingworth and j.kittle.a survey of the hough transform.cvgip.vol.44,1988,87-116

3 吴佑寿,丁晓青.汉字识别原理方法与实现,高等教育出版社,1992

4 k.hansen,j.d.anderson.understanding the hough transform:hough cell support and its utilization,image and vision computing,vol.15,1997,20-218

5 张忻中.汉字识别技术[m].清华大学出版社.1992