基于TWSVM算法的发动机故障识别方法
- 格式:pdf
- 大小:817.75 KB
- 文档页数:6
基于SVM的车载发动机故障诊断系统设计的开题报告一、论文选题背景车辆已成为我们日常生活中的必需品,而车辆发动机是整个汽车系统的核心部件之一,它的性能也直接影响着汽车的性能和稳定性。
随着汽车技术的不断发展,车载发动机故障仍然是汽车领域中的一个难点问题。
因此,设计一种高效、准确的车载发动机故障诊断系统具有重要意义。
支持向量机(SVM)是一种广泛应用于模式识别和机器学习的分类算法,它具有处理高维数据和解决非线性问题的能力。
因此,基于SVM的车载发动机故障诊断系统设计是一种值得探讨的研究方向。
二、研究目的和意义本研究旨在设计一种基于SVM的车载发动机故障诊断系统,并对该系统进行实验验证,以提高发动机故障诊断的准确性和效率。
具体目标包括:1. 分析车载发动机故障的特点和类型。
2. 探究SVM算法在车载发动机故障诊断中的应用。
3. 根据SVM算法原理和车载发动机故障特征,设计一种基于SVM的发动机故障诊断系统。
4. 对该系统进行实验验证,验证其发动机故障诊断准确性和效率。
本研究的意义主要体现在以下几个方面:1. 提高车辆安全性和稳定性,避免因发动机故障引发的交通事故发生。
2. 降低维修成本,提高车辆可靠性,满足消费者对汽车品质的需求。
3. 推进机器学习算法在汽车领域的应用,促进汽车智能化发展。
三、研究内容和方法1. 研究车载发动机故障的特点和类型。
分析发动机正常工作和故障状态下的信号波形,描述故障类型和特点。
2. 探究SVM算法在车载发动机故障诊断中的应用。
了解SVM算法原理和特点,了解如何在发动机故障诊断中应用SVM算法。
3. 设计基于SVM的车载发动机故障诊断系统。
根据车载发动机故障的特点和SVM算法原理,设计基于SVM算法的发动机故障诊断系统,包括信号采集、特征提取、特征编码和SVM分类器四个阶段。
4. 对该系统进行实验验证。
利用实验数据对系统进行性能评估,分析系统的准确性和效率。
研究方法主要包括文献综述、实验数据采集、特征提取和模型训练等。
svm 故障诊断综述
支持向量机(SVM)是一种广泛使用的机器学习算法,但在实际使
用过程中可能会遇到故障,影响算法的性能和输出结果的准确性。
本
文将对SVM故障诊断进行综述。
SVM故障的主要原因可以分为三类:数据集问题、算法参数问题
和编程语言问题。
对于数据集问题,SVM需要依赖于输入数据,如果输入数据存在问题,就会直接影响SVM的性能。
常见的数据集问题包括
噪声、异常值、数据不平衡等。
解决这些问题的关键是数据清洗和特
征选择。
算法参数问题指的是在使用SVM的过程中,可能会使用不合适的
算法参数,从而导致模型过拟合或欠拟合。
这些参数包括核函数的类型、正则化参数和惩罚参数等。
通常需要通过交叉验证等技术来优化SVM的参数,以获得更好的性能。
编程语言问题是指在编写SVM程序的过程中,可能会出现语法错
误或编译错误。
这通常是由于程序员的疏忽或对编程语言的不熟悉所致。
为了避免这些问题,程序员应该熟悉所使用的编程语言,并遵循
良好的编程习惯。
总之,SVM作为一种常见的机器学习算法,在实际应用中可能会
遇到多种故障。
针对这些故障,需要程序员具备基础知识和分析能力,及时识别和解决问题,保证算法的性能和输出结果的准确性。
基于SVM的物联网设备故障诊断与预测方法研究随着现代科技的不断进步和物联网技术的普及,越来越多的设备接入到了互联网的世界中。
无论是家居设备还是工业设备,都需要长时间的运行和使用。
这就使得设备的故障诊断和预测变得尤为重要。
在这一背景下,基于SVM的物联网设备故障诊断与预测方法应运而生。
一、SVM原理SVM,即支持向量机,是一种基于监督学习的分类模型。
它的基本原理是将数据映射到高维空间中,使得不同类别的数据之间在这个空间中有明显的边界,同时可以使得各数据点到这个边界的距离最大。
SVM通过对数据进行训练学习,得到一个最佳的分类面,然后将新数据点映射到这个分类面上进行分类。
二、物联网设备故障诊断与预测方法在物联网设备的故障诊断和预测中,我们可以采用基于SVM的方法,来建立一个故障分类模型。
具体步骤如下:1.数据采集:首先需要对物联网设备进行数据采集,包括各种设备传感器的数据、设备状态等信息。
2.数据清洗:对采集到的数据进行清洗,去除噪声和异常值。
3.特征提取:通过对清洗后的数据进行特征提取,获取更具代表性的特征。
不同的设备可能需要不同的特征提取方法。
4.特征选择:对提取到的特征进行选择,并结合领域知识,选择最具代表性的特征。
5.训练模型:将选定的特征输入到SVM中进行训练,建立设备故障分类模型。
6.测试模型:将新采集到的数据输入到模型中进行测试,判断是否存在故障,同时预测故障类型和预计发生时间。
三、优缺点分析基于SVM的物联网设备故障诊断与预测方法有着许多优点。
首先,它可以对原始数据进行特征提取和选择,提高分类的准确性和预测的精度。
其次,SVM模型具有较强的泛化能力和鲁棒性,能够适应不同的数据集和环境。
此外,SVM算法还可以处理高维度、非线性和大规模数据,应用广泛。
不过,基于SVM的物联网设备故障诊断与预测方法也存在一些限制和缺点。
首先,数据质量对于模型的性能十分重要,不良数据可能导致模型性能下降。
其次,SVM模型的参数设置需要一定的经验和技巧,不当的参数设置可能会影响模型性能。
基于SVM的智能运维故障预警方法研究随着网络技术的不断发展,智能化、信息化已经成为了许多领域发展的趋势,尤其是在工业、生产等领域,智能化和信息化更是成为了重要的手段。
而运维作为企业生产力的重要组成部分,也需要实现智能化和信息化。
其中,故障预警是其中非常重要的一环节。
基于SVM的智能运维故障预警方法研究,成为了企业实现智能化和信息化运维的重要途径。
一、SVM算法的原理首先,我们来介绍一下SVM算法的原理。
SVM是Support Vector Machine的缩写,即支持向量机。
它是一种二分类模型,是通过求解二次优化问题的方式来获得分类超平面的。
SVM在处理线性可分问题时,能够获得较优解,而在处理非线性可分问题时,SVM通过核函数的方式将样本投影到高维空间中,再通过超平面分离得到分类结果。
因此,SVM具有很好的分类效果。
二、智能运维故障预警的意义运维故障预警的目标就是在系统运行过程中,发现问题和异常,及时采取措施避免故障的发生。
故障预警作为运维的重要部分,对于保障系统的稳定运行、提高生产效率、降低运维成本、提高运维效率等方面都具有重要的意义。
三、基于SVM的智能运维故障预警方法在运用SVM算法进行故障预警时,需要将机器运行日志中的数据进行分析,将数据转化为特征值,以特征值为输入参数训练模型,并预测故障的发生。
基于SVM的智能运维故障预警方法包括以下几个步骤:1. 收集数据:通过网络等方式,收集到机器运行状态的数据,比如CPU使用率、内存使用率、网络带宽等数据。
2. 数据处理:对收集到的数据进行清洗、筛选、去重等操作,并对数据进行特征值提取。
在特征值提取过程中,需要选取合适的特征值,如均值、方差、最大值、最小值等。
3. 模型训练:将特征值作为输入参数进行模型训练,训练出的模型将用于后续的故障预测。
4. 故障预测和报警:根据训练好的模型,对机器的运行状态进行预测,当预测结果达到一定的阈值时,将会触发预警机制,及时通知管理员进行处理。
基于SVM的故障诊断技术研究随着工业自动化程度的不断提高,工艺设备越来越复杂,随之带来的故障诊断难度也不断增加。
出现故障时,如何快速准确地定位故障原因,是保证设备正常运转的关键。
传统的故障诊断方法主要依赖于经验判断或者专家推断,无疑存在着效率低、准确率不高等问题。
而基于机器学习的故障诊断技术,则可以有效解决这些问题,提高故障诊断的自动化水平。
本文将探讨一种基于SVM的故障诊断技术。
一、SVM 算法简介支持向量机(SVM)是一种广泛应用于分类与回归分析的监督学习方法,它的基础理论是在高维空间中构造间隔最大的分类超平面,并将分类问题转化为求解一个凸二次规划问题来获得最优解。
SVM 的核心思想在于,通过选取一定数量的样本点,并将它们划分到不同的分类区域内,使得分类区域之间的距离最大化。
这些样本点被称为支持向量,它们可以有效地表达样本分布的特征。
在分类时,若新的样本点被划分到已经确定好的分类区域中,则该样本是属于该分类的;反之则属于另一个分类。
二、基于SVM的故障诊断技术流程1. 数据采集与预处理对于故障诊断来说,数据采集是一个非常重要的环节。
只有获得了足够量和充分的数据,才能够开展有效的故障诊断工作。
在实际应用中,通常采用传感器对工艺设备进行实时监测,获取相关物理量的数据,然后进行处理。
处理包括滤波、降噪等,以达到更好的信号质量。
2. 特征提取在获得了处理好的数据之后,需要进一步提取出有用的特征信息。
常用的特征包括信号的平均值、标准差、峰值等统计量,以及时域、频域等不同的特征参数。
目的是找到最能区分各种故障的特征。
3. 特征归一化由于不同的特征之间具有不同的量纲,因此需要将它们归一化到同一量级。
常用的归一化方法包括最小-最大归一化、z-score标准化等。
4. 训练 SVM 模型在数据预处理和特征提取等工作完成后,就可以开始训练 SVM 模型了。
在分类时,将已知类型的样本作为训练集,通过SVM算法得到分类规则,并将其应用到新的样本上,以判断它所属的故障类型。
第37卷(2019)第1期内 燃 机 学 报 Transactions of CSICEV ol.37(2019)No.1收稿日期:2018-03-23;修回日期:2018-07-26.基金项目:国家自然科学基金资助项目(51779050);黑龙江省自然科学基金资助项目(F2016022). 作者简介:柳长源,博士,副教授,硕士研究生导师,E-mail :5616171@.DOI: 10.16236/ki.nrjxb.201901012基于TWSVM 算法的发动机故障识别方法柳长源1, 2,车路平1,毕晓君2(1. 哈尔滨理工大学 电气与电子工程学院,黑龙江 哈尔滨 150080; 2. 哈尔滨工程大学 信息与通信工程学院,黑龙江 哈尔滨 150009)摘要:为了快速有效地诊断出汽油发动机故障,提出了一种基于孪生支持向量机(TWSVM )的发动机故障诊断方法.该方法利用HC 、CO 、CO 2、O 2和NO x 共5种尾气参数值,并对其进行规范化处理,然后把这些数据作为特征向量,用于孪生支持向量机构成的多分类器中进行训练和测试,从而达到识别故障类别的目的.试验结果表明:采用孪生支持向量机分类方法比利用传统支持向量机具有更好的分类效果,且训练速度更快;在小样本数据情况下,故障诊断正确率可达到98.4%,能有效描述汽车尾气成分变化与发动机故障状态之间的复杂关系. 关键词:汽油机;故障诊断;孪生支持向量机;汽车尾气;分类器;核函数中图分类号:TK418 文献标志码:A 文章编号:1000-0909(2019)01-0084-06Engine Fault Identification Based on TWSVM AlgorithmLiu Changyuan 1, 2,Che Luping 1,Bi Xiaojun 2(1. School of Electrical and Electronic Engineering ,Harbin University of Science and Technology ,Harbin 150080,China ;2. Institute of Information and Communication ,Harbin Engineering University ,Harbin 150009,China ) Abstract :In or der to diagnose the failur e of gasoline engine quickly and effectively ,an engine fault diagnosismethod based on twin support vector machine was proposed. The method is to use the five exhaust gas parameters such as HC ,CO ,CO 2,O 2,NO x ,and normalize the data ,extract the eigenvector as the learning sample ,and then use the multi-classifier based on the twin support vector machine to train and test ,so as to achieve the purpose of identify-ing the type of failure. The experimental results show that the classification method of twin support vector machine has stronger classification ability than that of the traditional support vector machine ,and the training speed is faster. In the case of less samples data ,the correctness of fault diagnosis can reach 98.4%. This can effectively describe the compli-cated relationship between the car exhaust composition changes and the engine fault state.Keywords :gasoline engine ;fault diagnosis ;twin suppo t vecto machine (TWSVM );automobile exhaust ;classifier ;kernel function发动机工作状态的好坏直接影响着汽车的性能,由于发动机排气中各成分体积分数值含有大量燃烧过程的信息,不同故障情况下,其尾气中各成分体积分数值不同,尤其是HC 、CO 2、CO 、O 2和NO x 气体的体积分数含量有很大的变化.因此,利用发动机排气成分中的各气体体积分数值的不同来推断发动机故障,是现在汽车发动机故障诊断的重要趋势,如今许多文献都对汽车尾气成分含量和发动机故障之间的关系进行了研究[1-4]. 由于支持向量机(support vector machine ,SVM )具有较强的泛化能力和分类能力,所以运用支持向量机建立尾气成分含量和发动机故障的模型是目前发动机故障诊断的一种常用方法[5],然而SVM 的训练算法训练时间长,且不适合大量样本的分类.针对这些问题,Jayadeva 等在传统SVM 的基础上提出了一种新的学习算法,称为孪生支持向量机(twin support vector machine ,TWSVM ).TWSVM 的训练学习速度更快,计算复杂度更低,仅为传统SVM2019年1月 柳长源等:基于TWSVM 算法的发动机故障识别方法 ·85·训练时间的1/4[6-8].随着时间的发展,TWSVM 算法针对不同的需求有了很多的改进,如最小二乘法的孪生支持向量机、带有局部信息的加权孪生支持向量机等,但是孪生支持向量机的本质是相同的,即解决两个二次规划问题,也是对传统支持向量机的一个有效拓展,现如今孪生支持向量机已得到广泛应用,如徐凯[9]的滚动轴承故障诊断和王立国等[10]的图像半监督分类等.笔者引入孪生支持向量机到汽车发动机故障诊断这个领域,结合孪生支持向量机和汽车尾气成分的变化规律的特点,并在其基础上进行发动机故障诊断模型分析,通过试验比较传统支持向量机和孪生支持向量机的诊断结果,以获得发动机故障诊断的最优 结果.1 孪生支持向量机1.1 TWSVM 的基本思想TWSVM 的基本原理是寻求两个不平行的超平面,并且使每个超平面尽可能接近一个类而远离另一个,与SVM 利用支持向量构造与两类样本等距离平行的超平面不同[11].图1所示方块表示一类,圆形表示另一类.TWSVM 是通过产生两个非平行超平面,来求解一对小尺寸的二次规划问题(QPP ),使每个超平面更接近一类而远离另一类,而不是像传统支持向量机那样求解一个大尺寸的二次规划问题来进行分类.理论上,TWSVM 相比传统的SVM 来说,TWSVM 的训练学习速度更快,计算复杂度更低,仅为传统SVM 的1/4[12].图1 TWSVM 的分类面构成Fig.1 Classification of TWSVM1.2 孪生支持向量机分类算法孪生支持向量机是基于支持向量机的思想提出来的,是采用两个非平行的分类超平面来对相应的样本进行拟合.假设存在一个训练样本集为:(,)i j j x y ,i =1,2; j =1,2,…,l ;∈i n j x R {1,1}∈−j y ,其中,i j x 表示第i 类样本中的第j 个样本,j y 表示训练样本的标签.训练样本集的总数为l =l 1+l 2,其中,1l 表示第一类样本的总数,2l 表示第二类样本的总数.令矩阵1×∈l n R A 表示第一种类别的样本集合,矩阵2×∈l nR B 表示第二种类别的样本集合.TWSVM 的优化问题就可以表示为一对不等式优化问题TWSVM 1和TWSVM 2[6],即(1)(1)T (1)(1)T111(TWSVM )min ()()2w b w b c ξ+++112A e A e e (1)(1)s.t (),0w b ξξ−++22B e e ≥≥ (1)(2)(2)T (2)(2)T221(TWSVM )min ()()2w b w b c η+++221B e B e e (2)(2)s.t (),0w b ηη−++12A e e ≥≥ (2)式中:(1)w 和(2)w 表示两个超平面的法向量;(1)b 和(2)b 表示两个超平面的偏移量;1T (1,,1)l =∈1 e R ;2T (1,,1)l =∈2 e R .对于TWSVM 1不等式的优化问题来说,通过引入拉格朗日函数,对其求解得式(3).(1)(1)(1)(1)T 1(,,,,)()2L w b w b βξ=+⋅1A e α(1)(1)T T11()w b c c ξξ+++−122A e e e T (1)(1)T ()w b αξξ⎡⎤−++−−⎣⎦22B e e β (3)式中:2T 1(,,)l αα=⋅⋅⋅α;2T 1(,,)l ββ=⋅⋅⋅β.令(1)(1)(,,,,)L w b ξαβ对(1)w 、(1)b 和ξ的偏导数为零,由此可得:T (1)(1)T ()0w b ++=1A A e βα(4)T (1)(1)T()0w b ++=112e A e e α (5)10c −−=2e αβ (6)由式(6)可知: 10c ≤≤α (7)联合式(4)和(5)可得:T T (1)(1)T T T[][ ][][]0w b +=112A e A e B e α (8)若定义T T []=1H A e ,T T[]=2G B e ,(1)(1)T []w b =u ,则式(8)变为 T T 0+=H Hu G α(9)根据式(4)~(7)可得优化问题TWSVM 1的对偶问题为T T 1T T1min ()2−−2G H H G e αα1(0)c ≤≤α (10)同理可得到优化问题TWSVM 2的对偶问题为T T 1T T 11min ()2P γγ−−Q Q P e γ2(0)c ≤≤γ (11)一旦求得u 和v ,就可得出两个决策超平面,即T (1)(1)0w b +=x(12)·86· 内 燃 机 学 报 第37卷 第1期T (2)(2)0w b +=x(13)因此,TWSVM 分类决策函数为T ()()Label()arg min{}arg min i i i d w b ==+=x x12class 1;1,2class 2d i d ⇒⎧⎫=⎨⎬⇒⎩⎭(14)通过引入具体的核函数,可将TWSVM 进一步推广到非线性分类情况.对于非线性二分类问题,用K (x ,y )表示核函数,构造两个基于核函数的超平 面[13]为T T T T 1122(,)0(,)0K u b K u b +=+=x c x c 和(15)为得到上述两个超平面,非线性TWSVM 求解优化问题为2T T11111(TWSVM )min (,)2K u b c ξ++12A C e e T 11s.t (,),0K u b ξξ⎡⎤−++⎣⎦22BC e e ≥≥(16)2T T22221(TWSVM )min (,)2K u b c η++21B C e eT12s.t (,),0K u b ηη⎡⎤−++⎣⎦12A C e e ≥≥(17)其中矩阵C 代表所有训练样本,它的每一行即为一个训练样本.非线性情况下,TWSVM 的决策规则仍可归纳为:测试样本离哪个超平面近就被归于哪个类.具体的决策函数为T TLabel()arg min (,)k kx K u b ⎡=+⎣x C(1,2,,)=⋅⋅⋅i k (18)1.3 分类器的设计由于孪生支持向量机本身是基于SVM 发展而来的,属于二元分类器,对于多类别分类诊断,就需要构造出多元分类器.“一对一”(one-versus-one ,OVO )策略分类方法最早是由Knerr 为多分类SVM 提出的,将该策略与传统TWSVM 结合得到的一对一孪生支持向量机(OVOTWSVM )具有比OVOSVM 更好的分类性 能[13-15].假设对于M 类分类问题来说,“一对一”分类方法需要在任意两类样本之间构建一个二分类TWSVM 子分类器,需要构造m (m -1)/2个二分类器,也即构造m (m -1)个超平面来区分m 个类别.在对测试样本进行分类前,先要将所有的训练样本在每一个二分类向量机模型中进行独立训练,从而得到m (m -1)个二分类TWSVM 子分类器,当输入一个新的测试样本时,先利用每个二分类器对其进行单独判别.设任意一个分类器的分类函数为f ij ,当 f ij <0时,则判定x 属于第i 类,则i 类就可以得到一票;当f ij >0时,则判定x 属于第j 类,则j 类就得一票,累加所有m (m -1)个子分类器的得票数,最后得票最多的类别即为该测试样本的类别[13,16].“一对一”孪生支持向量机的示意,如图2所示.图2 OVOTWSVM 示意Fig.2 Schematic diagram of OVOTWSVM2 基于TWSVM 的发动机故障诊断2.1 试验方案及特征提取以桑塔纳AJR 汽油发动机为台架试验对象,所用的桑塔纳AJR 发动机(1.8L 2VQSEA827NF )为2气门、横流扫气的汽油发动机.发动机性能的具体参数,如表1所示.表1 发动机性能参数Tab.1 Engine performance parameters参数数值缸径/mm 81.0 活塞行程/mm 86.4 排量/L 1.781 压缩比 9.5 最大功率/kW 74(5200r/min ) 最大转矩/(N ·m ) 155(3800r/min )利用发动机机故障试验平台将发动机状态设置为正常、氧传感器信号故障、节气门控制器电位计反馈信号故障、2缸和3缸点火圈故障以及2缸喷油器控制故障共5种状态,并用K81故障解码器验证故障设置准确性,将这5种状态的故障编码f 分别设置为(1,2,3,4,5),利用A VL4000尾气分析仪测取发动机怠速和加速时不同故障状态下的尾气排放试验数据,通过K81解码器读取发动机运行状况的数据流即发动机转数和负荷(每循环喷油持续时间).每组试验包含怠速和加速时的数据,每个故障重复采集50次共100组数据,即5种状态下500组试验数据,输出为每一组向量对应的故障码.每种状态的输入特征向量为{CO ,CO 2,O 2,HC ,NO x },其中CO 、CO 2、O 2、HC 和NO x 分别为汽车尾气排放的体积分数或气体的质量分数.部分数据见表2.2019年1月 柳长源等:基于TWSVM 算法的发动机故障识别方法 ·87·表2 发动机尾气排放与不同故障状态关系的部分数据Tab.2 Relationship between engine exhaust emissions and different fault conditions of partial data故障编码 CO 排放/% CO 2排放/%O 2排放/% HC 排放/10-3NO x 排放/10-3发动机转速/(r ·min -1) 喷油持续时间/ms1 2.65 4.10 13.2 6.166 0.546 800 3.55 1 5.82 4.70 10.4 7.709 0.572 2480 3.25 1 2.77 4.10 13.4 6.270 0.578 760 3.50 1 5.55 4.90 10.4 7.784 0.590 2560 3.25 1 2.57 4.00 13.4 6.192 0.570 800 3.50 1 5.69 4.80 10.4 7.955 0.617 2560 3.30 2 0.42 4.70 13.5 2.045 0.581 800 3.05 2 0.77 6.70 10.8 6.517 1.198 2560 2.75 2 0.16 4.70 13.7 5.032 0.607 800 2.75 2 0.75 6.70 10.8 6.489 1.145 2600 2.65 2 0.13 4.70 13.8 4.978 0.655 760 2.75 2 0.60 6.90 10.7 6.552 1.210 2720 2.65 3 2.36 4.00 13.4 5.638 0.302 800 3.05 3 5.48 4.80 10.4 7.511 0.360 2480 2.80 3 2.51 4.10 13.4 5.837 0.327 760 3.25 3 5.51 4.80 10.5 7.440 0.365 2440 2.80 3 2.53 3.70 13.6 5.109 0.323 800 2.95 3 5.53 4.80 10.3 7.188 0.338 2520 2.70 4 2.36 3.80 13.5 5.621 0.232 800 2.45 4 4.95 5.00 10.4 7.360 0.329 2400 2.55 4 2.51 3.80 13.4 5.697 0.241 800 2.40 4 5.29 4.90 10.3 7.645 0.337 2360 2.55 4 2.58 3.60 13.6 5.502 0.204 800 2.50 4 5.23 4.90 10.3 7.464 0.296 2320 2.60 5 0.18 4.60 13.8 2.944 0.354 800 2.75 5 0.68 6.80 10.7 3.687 0.931 2200 2.55 5 0.21 4.50 13.9 2.902 0.346 800 2.75 5 0.66 6.80 10.7 3.657 0.893 22402.455 0.13 4.50 14.0 2.889 0.290 800 2.65 5 0.58 6.84 10.4 3.715 0.87721602.50由于输入特征向量的取值范围不同,需对每一组样本数据进行归一化处理.为了提高数据的稳定性,采用归一化公式为min max min ()=−−i i y x x x x (19)式中:x i 、y i 为样本转换前、后的值;x min 、x max 为样本的最小值和最大值.利用该归一化公式将每一类别的样本数据值归一化到[0,1]区间,从而使诊断结果更加准确[17]. 2.2 孪生支持向量机诊断模型的构建笔者选择的是“一对一”分类器算法,并在小样本训练数据的情况下,对发动机故障诊断分类效果进行分析.首先,把要进行训练和测试的样本集以及对应的标签设置好;再用归一化的方式对数据进行预处理,根据类别数目的多少构建分类器;接下来把数据放入分类器进行训练和测试,根据“一对一”分类投票原则进行票数统计,从而得到分类结果.其模型流程示意,如图3所示.图3 OVOTWSVM 流程示意Fig.3 OVOTWSVM process·88·内 燃 机 学 报第37卷 第1期3数据测试3.1不同条件下故障检测准确率对比试验同传统支持向量机方法相似的是,TWSVM对于核函数的选择也比较敏感,为了找到合适的核函数,设置了3种核函数的试验,分别对应线性核函数、径向基核函数和多项式核函数[6].为了得到更好的试验结果,对支持向量机和孪生支持向量机进行了试验比较,选取相同数量的样本数据,通过比较在3种不同核函数情况下的准确率,选取对两种算法的准确率影响最大的核函数.因为这每一组测试样本数据都有对应的实际故障状态,把测试样本的实际故障状态与通过算法预测出来的故障状态(即故障码)进行比对,如果两者相同,则预测结果正确.用所有预测结果正确的数量除以所有测试样本的数量就可以得到其准确率.试验过程为:(1)表2的500组样本数据集是由5种故障状态且每种故障状态有100组数据组成的,数据采集后,首先对表2的样本数据进行归一化处理,在归一化数据的基础上进行了试验;(2)试验是从整个500组样本数据随机选取75%,即375组数据进行训练,剩余25%,即125组数据进行测试,共进行20次试验,取平均值作为最终准确率.试验数据结果如表3所示.表中数据都是20次试验结果的平均值,很明显能够看出相同样本数据情况下,对孪生支持向量机影响最大的核函数是线性核函数,对标准支持向量机影响最大的核函数是径向基核函数.标准支持向量机最好的结果是在选取径向基核函数的时候,其准确率为95.4%.孪生支持向量机最好的核函数是线性核函数,其准确率为98.4%.表3不同核函数的诊断准确率比较Tab.3Comparison of diagnostic accuracy of different kernel functions %参数线性核函数径向基核函数多项式核函数支持向量机 92.3 95.4 88.2 孪生支持向量机 98.4 93.5 91.6 为了更直观地对比SVM和TWSVM之间的差别,用MATLAB编程,把测试集实际分类和测试集预测分类以图片的形式表现出来.选取了以375组样本数据训练,125组样本数据测试.由于标准支持向量机最好的结果是在选取径向基核函数的时候,故选取了SVM径向基核函数20次试验分类结果图中的一个,如图4a所示.同样孪生支持向量机最好的结果是选取线性核函数的时候,故选取了TWSVM线性核函数20次试验分类结果图中的一个如图4b所示.(a)SVM分类(b)TWSVM分类图4SVM和TWSVM分类Fig.4SVM and TWSVM classification diagram由图4可知,测试集的实际分类结果用圆圈“○”表示,测试集的预测结果用十字“+”表示,如果符号为“,则说明预测结果和实际结果相对应,即试验结果是预测正确的.在图4a中可以明显看出,有较多标识符“+”没有与“○”相对应,形成“,说明预测结果和实际结果不匹配,即预测错误.图4b预测的基本上都是“,即预测结果成功率高,说明孪生支持向量机的预测效果比传统支持向量机的预测效果要好.3.2数据运行时间的对比汽车发动机故障诊断软件的运行环境为:操作系统为Window7,CPU:Core(TM)i5-3210M,主频为2.5 GHZ,硬盘为500G,运行内存为4GB,MATLAB2012b.为了进一步比较TWSVM与SVM 之间的差别,对其运行时间进行了比较,对每一个不同数据模型进行测试,选取20次试验的运行时间的平均数进行了最终的统计,如表4所示.2019年1月柳长源等:基于TWSVM算法的发动机故障识别方法 ·89·由表4可知,随数据样本的增多,孪生支持向量机的运行时间会比支持向量机的运行时间大大减少.样本数据越多,孪生支持向量机的运行时间就越占优势,两者的运行时间差距甚至成级数上涨.试验进一步验证了利用汽车尾气分析发动机故障,孪生支持向量机比传统支持向量机的诊断效果更有优势.表4不同数据模型的运行时间对比Tab.4Comparison of running time of different data models运行时间/s试验样本数SVM TWSVM 100 0.84 0.15200 3.71 0.84500 20.83 4.39在工程应用上,尤其是在诊断大量汽车发动机故障和紧急状况的时候,用这个诊断方法能够节省大量的人力和物力,减少了诊断故障的时间,能够为汽修人员快速地指明故障类型,从而高效地解决汽车发动机故障.4结 论(1) 线性孪生支持向量机比标准支持向量机的故障诊断精度高且达到98.4%.(2) 孪生支持向量机的运行时间也比传统支持向量机短,随着样本数据的扩大,这种优势更加明显.(3) 基于孪生支持向量机的分类方法具有更好的诊断效果.参考文献:[1]张光磊,刘堂胜. 汽车发动机故障诊断与检修[J]. 装备制造技术,2015(8):248-250.[2]田径,刘忠长,许允. 柴油机瞬变过程烟度排放的劣变分析[J]. 内燃机学报,2016,34(2):125-134.[3]柳长源. 相关向量机多分类算法的研究与应用[D]. 哈尔滨:哈尔滨工程大学信息与通信工程学院,2013.[4]徐亚丹,王俊. 基于BP人工神经网络和尾气分析的汽车故障诊断方法研究[J]. 农业装备与车辆工程,2008,208(11):15-17.[5]李增芳,金春华,何勇. 基于废气成分分析和支持向量机的发动机故障诊断[J]. 农业工程学报,2010,26(4):143-146.[6]邱建坤. 基于孪生支持向量机的特征选择与多类分类算法研究[D]. 秦皇岛:燕山大学电气工程学院,2015.[7]Jayadeva,Khemchandani R,Chandra S. Twin support vector machines for pattern classification[J]. IEEET ransactions on Pattern Analysis & MachineIntelligence,2007,29(5):905-910.[8]Qi Z,T ian Y,Shi Y. Robust twin support vector ma-chine for pattern classification[J]. Pattern Recognition,2013,46(1):305-316.[9]徐凯. 孪生支持向量机在滚动轴承振动故障诊断中的应用[J]. 煤矿机械,2016,37(4):147-150. [10]王立国,杜心平. K均值聚类和孪生支持向量机相结合的高光谱图像半监督分类[J]. 应用科技,2017,44(3):1-7.[11]Li D,T ian Y,Xu H. Deep twin support vector ma-chine[J]. IEEE International Conference on Data MiningWorkshop,2015,29(1):65-73.[12]Xu Y. Maximum margin of twin spheres support vector machine for imbalanced data classification[J]. IEEET ransactions on Cybernetics,2016,47(6):1540-1550.[13]丁世飞,张建,张谢锴,等. 多分类孪生支持向量机研究进展[J]. 软件学报,2014,10(11):65-73. [14]于俊钊. 孪生支持向量机及其优化方法研究[D]. 北京:中国矿业大学计算机科学与技术学院,2014. [15]Shao Y H,Chen W J,Wang Z,et al. Weighted linear loss twin support vector machine for large-scale classifi-cation[J]. Knowledge-Based Systems,2015,73(1):276-288.[16]T omar D,Agarwal S. Multi-class twin support vector machine for pattern classification[C]// Proceedings of3rd International Conference on Advanced Computing,Networking and Informatics,Springer India,2016:97-110.[17]孙逊. 基于BP神经网络的电控发动机故障诊断研究[D]. 北京:北京林业大学车辆工程学院,2012.。