文档之家
首页
教学研究
幼儿教育
高等教育
外语考试
建筑/土木
经管营销
自然科学
当前位置:
文档之家
›
智能信息处理文字识别联机识别and脱机识别
智能信息处理文字识别联机识别and脱机识别
格式:ppt
大小:538.51 KB
文档页数:33
下载文档原格式
下载原文件
/ 33
下载本文档
合集下载
下载提示
文本预览
1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
预处理
预处理是脱机手写识别系统中需要解决问题最多的一个模 块。预处理通常包括以下几个过程: 1、二值化 2、消除干扰 3、细化
原图像
二值化
细化
版面分析 版面分析与理解是文字识别的前处理技术之一。它是利用图 像处理、人工智能等技术完成文档图像文件中的文字域的分拣 工作。其难度取决于版面的复杂程度,是文字识别系统提高实 用化水平的主要技术指标之一。
•
手写识别,是指将在手写设备上书写时产生的有序轨迹信 息化转化为汉字内码的过程,实际上是手写轨迹的坐标序列到 汉字的内码的一个映射过程,是人机交互最自然、最方便的手 段之一。
•
联机手写识别是指将在手写设备上书写时产生的有序轨迹信 息转化为汉字内码的过程,实际上是手写轨迹的坐标序列到汉 字内码的一个映射过程。
•
其中联机识别是指将字符书写在与计算机相连的书写板上,由 计算机根据字符的书写轨迹进行实时识别,因此联机识别主要 是针对手写体而言的;脱机识别是指将字符书写或打印在纸张 上,用扫描仪或其他光电转换装置将其转换成电信号输入到计 算机中,再由机器进行识别。因此,脱机识别又称为光学文字 识别,即我们通常所说的OCR(Optical Character Recognition)。
数据获取:输入模式转换成适合于机器处理的形式的过程。 预处理的目的是去除噪声,加强有用的信息,对由输入设备 或其他因素造成的退化现象进行复原,以利于特征提取 经过预处理后的数据维数很高,为了有效地实现分类识别, 需要对原始数据进行变换,得到最能反映原始模式本质的特 征向量。把原始数据组成的空间叫做测量空间,把分类识别 赖以进行的空间叫做特征空间。通过变换可以把在维数较高 的测量空间中表示的模式变为在维数较低的特征空间中表示 的模式,这就是特征的提取和选择。 分类决策是在特征空间中用所设计的分类器把被识别对象归 为某一类别。
• 限制性(Constrainted)和非限制性(Unconstrained)手写体字符 识别(或称自由手写体字符识别)。 • 无论是联机还是脱机手写体字符识别,都经历了一个由限制性 识别到非限制性识别的过程。目前,人类所使用的各种文字, 绝大多数都只包含很小的字符集。如英文字符集由26个字母组 成,俄文由32个字母组成,这些字母及其变化的不同组合构成 了具有不同含义的文字,是这类文字的基本组成部分。对于小 类别数的字符集,如阿拉伯数字,手写体识别已经可以做到对 书写者不加任何限制。但对于大类别数的字符集,如汉字,还 必须对书写者施加某些限制,以保证较高的识别率。未来随着 技术的发展,将逐步放松限制,最终可以达到最自由手写体文 本的识别。
联机识别
联机识别是指将字符书写在与计算机相连的书写 板上,由计算机根据字符的书写轨迹进行实时识 别,因此联机识别主要是针对手写体而言的; 手写识别能够使用户按照最自然、最方便的输入 方式进行文字输入,易学易用,可取代键盘或者 鼠标。用于手写输入的设备有许多种,比如电磁 感应手写板、压感式手写板、触摸屏、触控板、 超声波笔等。
• 特征提取部分是从整形和规范化的信号中抽取反映字符本身的 有用信息,供识别部分进行识别。作为特征提取的内容是比较 多的,可以是几何特征,如文字线条的端点、折点和交点等。 • 识别判断部分则是根据抽取的特征,运用一定的识别原理,对 文字进行分类,确定其属性,达到识别的目的,实际上判断部 分就是一个分类器。
• 文字识别系统的原理及组成 • 文字识别属于模式识别的范畴,模式这个概念的内涵是很丰富 的。“我们把凡是人类能用其感官直接或间接接受的外界信息 都称为模式”。比如:文字、图片、景物、声音、语言等;模 式识别的目的就是要研究出能自动进行模式分类和描述的机器 系统,以完成人类的模式识别的功能。一个模式识别主要分为 四个组成部分,其框图如下:
脱机手写体字符识别系统结构
待识别文档 扫描仪或 数码相机 灰度图或二值图 预处理 预处理图像 版面分析 文字块图像 行分割 字符特征 识别 单词 后处理 修正后的单词结果
文字行图像 字符分割 单一字符图像
特征提取
图像的输入
原始文稿通过光电扫描仪或数码相机等输入设备转换成原 始的二维图像信号,可以是彩色图像、灰度图像(grayscale image)或二值图像(binary image)。这个模块仅仅需要的是 在获取图像过程中,尽可能的保证原始文稿的二维图像有比 较好的质量,从而有利于后面识别模块的识别。
2.大小归一化
对不同大小的文字做变换,使之成为同一尺寸大小的文字,这个过程被称做 大小归一化。通过大小归一化,许多特征就能够用于识别不同字号混排的文字。
两种方法:1、将文字的外边框按比例线性放大或缩小成为规定尺寸的文字
2、根据水平和垂直两个方向文字黑像素的分布进行大小归一化
特征提取
稳定特征的抽取是整个识别系统的核心之一, 它决定了识别系统的性能。
• 模式识别的过程具体化到文字识别系统中,则分为下面的几个 过程 :
• 光电变换检测部分的主要功能,是对纸面上的文字进行光电转 换,然后经模数转换成具有一定灰度的数字信号,送往其后的 各部分进行处理和识别。 • 常用的检测设备是扫描仪,摄像头等。
• 灰度:灰度使用黑色调表示物体。 每个灰度对象都具有从 0% (白色)到 100%(黑色)的亮度值。
·
• 这边东西有点多, 到word里边去看
脱机识别
概述
由于有些场合,不能采用书写板等专用的输入设备输入文字, 或文字信息已经存在,如果要利用计算机进行文字识别,就只 能进行脱机识别。
OCR概念
OCR技术是光学字符识别(Optical Character Recognition) 的缩写,是通过扫描等光学输入方式将各种票据、报刊、书 籍、文稿及其它印刷品的文字转化为图像信息,再利用文字 识别技术将图像信息转化为可以使用的计算机输入技术。
1、图像定位 2、倾斜校正
原图像
校正后
字符的分割
1、行切割
对于输入的二值化文字图像,首先要逐行地把各文字行图像切割出来,行 切割的方法是:对二值化图像从上到下逐行扫描并同时计算每个扫描行的像素, 以获取图像的水平投影,根据水平投影值确定文字行的位置,利用文字行间空 白间隔造成的水平投影空白间隙,即可将各行文字分割出来
• 文字图像分割的目的就是根据文字图像的特征实现文字图像区 域的定位和分割,将真正的文字图形分割出来,以便后续进行 识别。 • 识别预处理部分的功能是将已分割出的文字图形信息加以区分, 去除信号中的污点、空白等噪声,增强文字图像的信息。并根 据一定的准则除掉一些非本质信号,对文字的大小、位置和笔 画粗细等进行规范化,以便简化判断部分的复杂性。
• 文字是人类相互交流信息的重要工具。 • 社会发展进入信息时代,人们已经不再停留在自己的耳朵和眼 睛去直接获得这些信息,而是使用计算机将文字自动的输入计 算机,用计算机对他们进行处理,随时以各种方式满足人们的 不同需要。因此,研究如何用计算机自动识别文字图像,解决 文字自动输入计算机,并进行高速加工处理的问题已引起大家 的关注。
• 通俗的说,文字识别就是由计算机自动识别各种字符,如字母、 数字、汉字或其他语言中的字符。文字识别有如下分类: • 根据识别对象的不同,文字识别可分为西文识别、数字识别和 汉字识别等。 • 这些字符可以是手写体和印刷体,因此文字识别又可分为手写 体文字识别和印刷体文字识别。 • 根据采用的输入设备不同,文字识别可分为联机识别和脱机识 别。
用于脱机手写字符识别的统计特征,根据特征 抽取屈居的不同可粗略地分为全局统计特征和局部 统计特征两大类。 全局统计特征是将整个汉字点阵作为研究对象, 从整体上抽取特征。 局部统计特征是将字符点阵图像分割成不同区域 或网络,在各个小区域内分别抽取统计特征
识别
识别也即分类器的设计,良好性能的分类 器的设计也是整个识别系统的核心之一,它 直接决定了识别系统的性能。 识别的方法很多,多方案集成是近年来文 字识别领域的一个主要研究方向,任何一种特 征、任何一种识别方法都有其优点和局限性, 借鉴印刷体字符识别的成功经验,走多特征融 合、多方案集成的道路,是脱机字符识别系统 走向实用化的有效途径。
(1)基本笔画变化。横不平,竖不直,直笔变弯,折笔的 拐角变成圆弧等。 (2)笔画模糊,不规范,该连的不连,不该连的却相连。 (3)笔画与笔画之间、部件与部件之间的位置发生变化。 (4)笔画的倾斜角、笔画的长短、部件的大小发生变化。 (5)对于脱机手写字符,不同人使用不同的书写笔可能造 成笔画的粗细变化。
后处理
文本识别后处理是指对的确认或纠错。通常,在识 别实际文本时,需要对单字识别的结果进行基于上下文关系 的识别后处理。利用后处理技术,应该能够实现对单字识别 结果的确认或纠错,并进一步区分相似字。
手写识别中存在的问题及困难
由于手写变形的存在,使得手写体中相似字符的区 分比印刷体要困难的多,因不同人书写风格的差异 造成手写字符的变形很大,具体变现在以下几个方 面:
2、字切割
字切割是从行切割后得到的文字图像中将单个汉字的图像分割出来。
基本方法是利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隙 将单个汉字的图像切割开来。
汉字的构造决定了字切割是更为困难的
文字归一化 1. 位置归一化
为了消除汉字点阵位置上的偏差,需要把整个汉字点阵图形移动到规定的位置 上,这个过程被称作为位置归一化 两种方法:1、基于质心的位置归一化 2、基于文字外边框的位置归一化
智能信息处理
第3章 文字识别技术 3.1-3.3
张宝健
第3章 文字识别技术 3.1-3.3
• 3.1文字识别系统
• 3.2脱机文字识别 • 3.3联机文字识别
第3章 文字识别技术 3.1-3.3
• 3.1文字识别系统
主要介绍模式识别中的文字识别的原理 对分类器的具体实现做了详细剖析 列举常见的文字识别方法 对于文字识别的前景与挑战的分析
文档推荐
最新文档
安徽省蚌埠市数学高二下学期文数期末考试试卷
关于时间的名人名言_4
【精品】八年级语文上册第5单元第17课《花儿为什么这样红》学案
情境教学法在小学语文课堂中的有效尝试
疫缺陷病ImmunodeficiencydiseaseI
工程分包商合同范本
解析建筑工程电气仪表安装施工要点
建筑工程施工分包范本
职业年金内控制度模板
抒情作文 曾经,多少美丽绽放-精品