主成分分析法的步骤和原理[技巧]
- 格式:doc
- 大小:22.50 KB
- 文档页数:3
主成分分析法的步骤和原理[技巧]
(一)主成分分析法的基本思想
主成分分析(Principal Component Analysis)是利用降维的思想,将多个变量转化为少数几个综合变量(即主成分),其中每个主成分都是原始变量的线性组合,各主成分之间互不相关,从而这些主成分能够反映始变量的绝大部分信息,
[2]且所含的信息互不重叠。
采用这种方法可以克服单一的财务指标不能真实反映公司的财务情况的缺点,引进多方面的财务指标,但又将复杂因素归结为几个主成分,使得复杂问题得以简化,同时得到更为科学、准确的财务信息。
(二)主成分分析法代数模型
假设用p个变量来描述研究对象,分别用X,X…X来表示,这p个变量12p t构成的p维随机向量为X=(X,X…X)。设随机向量X的均值为μ,协方差矩12p
阵为Σ。假设 X 是以 n 个标量随机变量组成的列向量,并且μk 是其第k
个元素的期望值,即,μk= E(xk),协方差矩阵然后被定义为:
Σ=E{(X-E[X])(X-E[X])}=(如图
对X进行线性变化,考虑原始变量的线性组合:
Z1=μ11X1+μ12X2+…μ1pXp
Z2=μ21X1+μ22X2+…μ2pXp
…… …… ……
Zp=μp1X1+μp2X2+…μppXp
主成分是不相关的线性组合Z,Z……Z,并且Z是X1,X2…Xp的线性组12p1 合中方差最大者,Z是与Z不相关的线性组合中方差最大者,…,Zp是与Z,211Z ……Z都不相关的线性组合中方差最大者。 2p-1
(三)主成分分析法基本步骤
第一步:设估计样本数为n,选取的财务指标数为p,则由估计样本的原始数据可得矩阵X=(x),其中x表示第i家上市公司的第j项财务指标数据。ijm×pij 第二步:为了消除各项财务指标之间在量纲化和数量级上的差别,对指标数据进行标准化,得到标准化矩阵(系统自动生成)。
第三步:根据标准化数据矩阵建立协方差矩阵R,是反映标准化后的数据之间相关关系密切程度的统计指标,值越大,说明有必要对数据进行主成分分析。其中,R(i,j=1,2,…,p)为原始变量X与X的相关系数。R为实对称矩阵ijij (即R=R),只需计算其上三角元素或下三角元素即可,其计算公式为:ijji n
X(kjX,iX)(kjX,j),
k,1Rij,
n 22(Xkj,Xi)(Xkj,Xj),
k,1
第四步:根据协方差矩阵R求出特征值、主成分贡献率和累计方差贡献率,,E,R,0确定主成分个数。解特征方程,求出特征值λ(i=1,2,…,p)。i 因为R是正定矩阵,所以其特征值λi都为正数,将其按大小顺序排列,即
λ1?λ2?…?λi?0。特征值是各主成分的方差,它的大小反映了各个主成分的p
,,,影响力。主成分Z的贡献率W=,累计 i i jj,1
jmp
,,贡献率为。根据选取主成分个数的原则,特征值要求大于1,,jj
,1,1jj且累计贡
献率达80%-95%的特征值λ1,λ2,…,λm所对应的1,2,…,m(m?p),其中整数m即为主成分的个数。
第五步:建立初始因子载荷矩阵,解释主成分。因子载荷量是主成分Z与i原始指标X的相关系数R(Z,X),揭示了主成分与各财务比率之间的相关程度,iii 利用它可较好地解释主成分的经济意义。
第六步:计算企业财务综合评分函数F,计算出上市公司的综合值,并进m 行降序排列:
F=WZ+ WZ+…+ WZ m11 22ii