机器视觉技术发展现状文献综述 (2)
- 格式:doc
- 大小:96.50 KB
- 文档页数:7
机器视觉技术发展现状
人类认识外界信息的80%来自于视觉,而机器视觉就是用机器代替人眼来做测量和判断,机器视觉的最终目标就是使计算机像人一样,通过视觉观察和理解世界,具有自主适应环境的能力。作为一个新兴学科,同时也是一个交叉学科,机器视觉是通过对相关的理论和技术进行研究,从而建立由图像或多维数据中获取“信息”的人工智能系统,其特点是可提高生产的柔性和自动化程度。目前机器视觉技术已经在很多工业制造领域得到了应用,并逐渐进入我们的日常生活。
一、机器视觉简介
机器视觉就是用机器代替人眼来做测量和判断。机器视觉主要利用计算机来模拟人的视觉功能,再现于人类视觉有关的某些智能行为,从客观事物的图像中提取信息进行处理,并加以理解,最终用于实际检测和控制。机器视觉是一项综合技术,其包括数字处理、机械工程技术、控制、光源照明技术、光学成像、传感器技术、模拟与数字视频技术、计算机软硬件技术和人机接口技术等,这些技术相互协调才能构成一个完整的工业机器视觉系统[1]。
机器视觉强调实用性,要能适应工业现场恶劣的环境,并要有合理的性价比、通用的通讯接口、较高的容错能力和安全性、较强的通用性和可移植性。其更强调的是实时性,要求高速度和高精度,且具有非接触性、实时性、自动化和智能高等优点,有着广泛的应用前景[1]。
一个典型的工业机器人视觉应用系统包括光源、光学成像系统、图像捕捉系统、图像采集与数字化模块、智能图像处理与决策模块以及控制执行模块。通过CCD或CMOS摄像机将被测目标转换为图像信号,然后通过A/D 转换成数字信号传送给专用的图像处理系统,并根据像素分布、亮度和颜色等信息,将其转换成数字化信息。图像系统对这些信号进行各种运算来抽取目标的特征,如面积、数量、位置和长度等,进而根据判别的结果来控制现场的设备动作[1]。
机器视觉一般都包括下面四个过程:
二、机器视觉的发展历史
机器视觉是在20 世纪50 年代从统计模式识别开始,当时的工作主要集中在二维图像分析、识别和理解上。从20 世纪70 年代才真正开始发展,并涌现出了主动视觉理论框架、基于感知特征群岛物体识别理论框架等新的概念、方法及理论。Marr 视觉计算机理论是视觉研究迄今较为完善的理论,其使视觉研究有了一个较为明确的体系[2]。
Marr视觉理论从计算视觉理论出发,将立体视觉分为自上而下的三个阶段,即早期的二维视觉数据获取、中期的要素处理和后期三维信息的形成和表达。经历这单个阶段即可完成二维到三维的转换工作.
图2 Marr理论框架的三个阶段
早期阶段的“要素图”(primarysketch)是由二维图像中的点、直线、曲线和纹理等特征组成,早期阶段的处理是从图像中获取这些特征。中期阶段的处理是处理特征要素的位置和相互关系,从而完成对物体的识别、运动分析和形状恢复等操作,该阶段处理的结果仅仅是对空间场景的二维半描述。如若要完成对空间场景的真正三维描述,还需第三阶段的后期视觉处理,将物体自身坐标统一到一个世界坐标系中[3]。
作为立体视觉的基础理论,Marr理论具有极其重要的指导作用,但Marr理论自身有缺陷,如单向性(视觉处理只能从前至后处理)、被动性(视觉处理只能是给什么图像处理什么图像)、目的单一性(视觉处理的目标一般只是恢复空间场景中的物体形状和位置)等。经过几十年的发展,许多学者纷纷提出了Marr 理论的改进框架,如在框架前增加图像拾取模块,使其能根据分析要求和分析结果自主获取图像;增加反馈环节,使视觉处理结果能反向指导图像获取环节,前后互动;增加高层指导模块和视觉目的模块,使整个视觉处理按照视觉目的的要求,在高层指导模块的指导下完成不同的视觉处理操作,实现其功能多样化.总之,改进的Marr理论框架使立体视觉趋于自动化、智能化和多功能化[3]。
三、机器视觉相关技术
1、图像采集技术——机器视觉的基础
图像采集部分一般由光源、镜头、数字摄像机和图像采集卡构成。采集过程可简单描述为在光源提供照明的条件下,数字摄像机拍摄目标物体并将其转化为图像信号,最后通过图像采集卡传输给图像处理部分。在设计图像采集部分时,要考虑到多方面的问题,主要是关于数字摄像机、图像采集卡和光源方面的问题。(1)光源照明
照明是影响机器视觉系统输入的重要因素,其直接影响输入数据的质量和应用效果。到目前为止,还未有哪种机器视觉照明设备能通用各种应用,因此在实际应用中,需针对应用选择相应的照明设备以满足特定需求。在光源照明方案选择过程中,应尽可能地突出物体特征,在物体需要检测的部分与不重要部分之间尽量产生明显的区域,增加对比度,同时还应保证足够的整体亮度,而物体位置的变化不应影响成像的质量。
照明系统按其照射方法可分为:背向照明、前向照明、结构光和频闪光照明等。其中,背向照明是指将被测物放在光源和摄像机之间,以提高图像的对比度。前向照明是光源和摄像机位于被测物的同侧,其优点是便于安装。结构光照明是将光栅或线光源等投射到被测物上,并根据其产生的畸变,解调出被测物的三维信息。频闪光照明是将高频率的光脉冲照射到物体上,摄像机拍摄要求与光源同步[1]。
(2)光学摄像头
光学摄像头的任务就是进行光学成像,一般在测量领域都又专门的用于测量的摄像镜头,因为其对成像质量有着关键性的作用。摄像头需要注意的一个问题是畸变。这个就需要使用相应的畸变校正方法,目前也开发出了很多自动畸变自动校正系统。
(3)CCD 摄像机及图像采集卡
CCD( Charge Coupled Device) 摄像机及图像采集卡共同完成对目标图像的采集与数字化。目前CCD,CMOS等固体器件的应用技术,线阵图型敏感器件,像元尺寸不断减小,阵列像元数量不断增加,像元电荷传输速率也得到大幅提高。在基于PC机的机器视觉系统中,图像采集卡是控制摄像机拍照来完成图像的采集与数字化,并协调整个系统的重要设备。
图像采集卡直接决定了摄像头的接口为:黑白、彩色、模拟、数字等形式。
2、图像处理与分析——机器视觉的核心
用于机器视觉的图像处理与分析方法的核心是,解决目标的检测识别问题。为此,提出方法的思想中心是如何获得可正确描述目标物与非目标物的特征。当所需要识别的目标比较复杂时,就需要通过几个环节,从不同的侧面综合来实现。
对目标进行识别提取的时候,首先是要考虑如何自动地将目标物从背景中分离出来。目标物提取的复杂性一般就在于目标物与非目标物的特征差异不是很大,在确定了目标提取方案后,就需要对目标特征进行增强。增强方法有颜色特征的增强、累计特征的增强等。经过特征增强后,最后就是目标物的提取了。这里也有很多不同的方法,比如伪目标删除方法、自适应阈值方法、逐步骤类方法、多信息融合方法等[4]。
随着计算机技术、微电子技术以及大规模集成电路的发展,图像信息处理工作越来越多地借助硬件完成,如DSP 芯片、专用的图像信号处理卡等。软件部分主要用来完成算法中并不成熟又较复杂或需不断完善改进的部分。这一方面提高了系统的实时性,同时又降低了系统的复杂度。
四、机器视觉的发展现状及应用
目前,最先进的机器视觉技术仍然由欧美、日本等国家掌握,发达国家针对工业现场的应用开发出了相应的机器视觉软硬件产品。中国目前正处于由劳动密集型向技术密集型转型的时期,对提高生成效率、降低人工成本的机器视觉方案