基于主元分析的故障诊断(ppt)

  • 格式:ppt
  • 大小:1.93 MB
  • 文档页数:25

下载文档原格式

  / 25
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
主成分分析试图保证数据信息丢失最少的原则下,对多面辆的数据表进行最佳综合 简化,也就是说,对高维变量空间进行降维处理。显然辨识系统在一个低维空间要比在 一个高维空间容易很多。
主元分析(PCA)的几何解释
主元分析(PCA)的几何解释
设有n个样品,每个样品有两个观测变量x1和x2,在由变量x1和x2所定的二维平面 中,n个样本点所散布的情况如椭圆状。
在进行主成分分析后,他竟以97.4%的精度,用三个新变量就取代了原来17个变量。 根据经济学知识,斯通给这三个新变量分别命名为总收入F1、总收入变化率F2和经济 发展或衰退的趋势F3(这三个变量其实是可以通过直接测量得到的)。
在现在的研究中,为了全面系统地分析和研究问题,必须考虑许多指标,这些指标 能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,也就 是这些信息之间具有一定的相关性。
F1 F2
cos sin
sin cos
x1 x2
U
'
x
为旋转变换矩阵,它是正交矩阵,则有
U' U1,U'UI
F1,F2除了可以对包含在X1,X2中的信息起着浓缩作用之外,还具有不相关的性 质,这就使得在研究复杂问题时避免了信息重叠所带来的虚假性。二维平面上的n个点 的方差大部分都归结在F1轴上,而F2轴上的方差很小。F1和F2成为原始变量x1和x2的 综合变量。F简化了系统结构,抓主了主要矛盾。
基于主元分析的故 障诊断(ppt)
(优选)基于主元分析的故障 诊断
多元统计分析
多元统计分析是从经典统计学中发展起来的一个分支,是一种综合分析方法, 它能够在多个对象和多个指标互相关联的情况下分析它们的统计规律。主要内 容包括多元正态分布及其抽样分布、多元正态总体的均值向量和协方差阵的假设 检验、多元方差分析、直线回归与相关、多元线性回归、主成分分析与因子分析、 判别分析与聚类分析、Shannon信息量及其应用。
主成分分析通常的做法是,寻求原指标的线性组合Fi:
F1 u11X1 u21X2 F2 u12 X1 u22 X2 Fk u1k X1 u2k X2
up1X p up2X p
upk X p
主元分析(PCA)的一般化模型
模型满足如下条件: 每个主成分的系数平方和为1,即
u12i u22i u2pi 1
先从一个简单的物理实验的例子开始说明这种思想。
主元分析(PCA)的目的
对于一个有先验知识的实验者来说,这个实验很容易。球的运动之在x轴方向上发 生,y轴和z轴冗余的,只需要记录一下x轴上的运动序列并加以分析即可。
可是,在真实世界中,对于第一次做实验的人来说(或者在实验科学中遇到的一种 新情况),是不会刚开始就舍弃y和z轴的信息的。一般来说,实验者会记录球的三维位 置,得到球在空间中的运动序列然后进行分析。
常用的多元统计分析的方法有两种:主元Fra Baidu bibliotek析(PCA)和偏最小二乘(PLS)。
主元分析(PCA)的思想
PCA是Principal component analysis的缩写,是一种对数据进行分析的技术,最重 要的应用是对原有的数据进行简化。主元分析法可以有效地找出数据中最“主要”的元 素和结构,取出噪音和冗余,将原有的复杂数据降维,揭示隐藏在复杂数据背后的简单 结构。
主元分析(PCA)的一般化模型
一般化,假设我们所讨论的实际问题中,有p个指标,我们把这p个指标看作p个随 机变量,记为X1,X2,…XP,主要成分分析就是要把这p个指标的问题,转变为讨论p个指 标的线性组合的问题,而这些新的指标F1,F2,…,Fk(k<=p),按照保留主要信息量的 原则充分反映原指标的信息,并且相互独立。建立新指标的过程也就是实现降维的过程。
主成分之间相互独立,即无重叠的信息:
C o v (F i,F j) 0 ,i j,i,j 1 ,2 , ,p
主成分的方差依次递减,重要性依次递减:
V a r(F 1 ) V a r(F 2 )V a r(F p )
主元分析(PCA)的步骤(含例子)
接下来,用一个实例来陈述主元分析的具体步骤:
如果每个个体有多个观测数据,或者从数学上说,如果个体的观测数据能表 为P维欧几里得空间的点,那么这样的数据叫做多元数据,而分析多元数据的统 计方法就叫做多元统计分析 。
基于多元统计分析的故障诊断方法
基于多元统计分析的故障诊断方法是利用过程多个变量之间的相关性对过程进行 故障诊断。这类方法根据过程变量的历史数据,利用多元投影的方法将多变量样本空间 分解成由主元空间张成的较低维的投影子空间和一个相应的残差子空间,并分别在这两 个子空间进行投影,并计算相应的统计量指标用于过程监控,从而达到故障检测和诊断 的目的。
在没有先验知识的情况下,利用测到的数据将实验数据中的冗余变量剔除并化归到 x轴上,这就是简单的主元分析达到得的效果(显然x轴方向是上述问题的主元)。
主元分析(PCA)的思想
主元分析一项十分著名的工作是美国的统计学家斯通在1947年关于国民经济的研究。 他曾用美国在1929—1938年各年的数据,得到了17个反映国民收入与支出的变量要素, 例如雇主补贴、消费资料和生产资料、纯公共指出、净增库存、股息、利息和外贸平衡 等等。
如图可以看出这n个样本点无论是沿着x1轴的方向还是x2轴方向都具有较大的离散 型,其离散的程度可以分别用观测变量x1的方差和x2的方差定量地表示。显然,如果只 考虑x1和x2中的任何一个,那么包含在原始数据中的信息将会有较大的损失。
主元分析(PCA)的几何解释
主元分析(PCA)的几何解释
如果我们将x1轴和x2轴先平移,再同时按逆时针方向旋转角度 ,得到新坐标轴F1 和F2。F1和F2是两个新变量。
旋转变换的目的是为了使n个样品点在F1轴方向上的离散程度最大,即F1的方差最 大。变量F1代表了原始数据的绝大部分信息,在研究某些问题时,即使不考虑变量F2 也无损大局。经过上述变换,原始数据的大部分信息集中到F1轴上,对数据中包含的信 息起到了浓缩作用。
主元分析(PCA)的几何解释
FF21xx11csoisnxx22scions