SPSS典型相关分析
- 格式:pdf
- 大小:329.33 KB
- 文档页数:16
SPSS数据统计分析与实践
第二十二章:典型相关分析
(Canonical Correlation)
主讲:周涛副教授
北京师范大学资源学院
教学网站:/Courses/SPSS
典型相关分析(Canonical Correlation)本章内容:
一、典型相关分析的基本思想
二、典型相关分析的数学描述
三、SPSS实例
四、小节
典型相关分析的基本思想
z典型相关分析是研究两组变量之间相关关系的一种多元统计方法。
z简单相关系数;复相关系数;典型相关系数
z典型相关分析首先在每组变量中找出变量的线性组合,使其具有最大相关性;
z然后再在每组变量中找出第二对线性组合,使其与第一对线性组合不相关,而第二对本身具有最大相关性;
z如此继续下去,直到两组变量之间的相关性被提取完毕为止;
z这些综合变量被称为典型变量(canonical variates);第I对典型变量间的相关系数则被称为第I 典型相关系数(一般来说,只需提取1~2对典型变量即可较为充分的概括样本信息)。
典型相关分析的目的
T
q T
p Y Y Y Y X X X X )
,,,(),,,(2121K K ==设两组分别为p 与q 维(p ≤q)的变量X ,Y :
设p + q 维随机向量协方差阵,⎟⎟⎠⎞⎜⎜⎝
⎛=Y X Z ⎟⎟⎠
⎞
⎜⎜⎝⎛Σ
ΣΣΣ=Σ22
21
1211其中Σ11是X 的协方差阵,Σ22是Y 的协方差阵,Σ12=ΣT 21是X ,Y 的协方差阵
典型相关分析用X 和Y 的线性组合U =a T X , V =b T Y 之间的相关来研究X 和Y 之间的相关性。其目的就是希望找到向量a 和b ,使ρ(U ,V )最大,从而找到替代原始变量的典型变量U 和V 。
典型相关分析的数学描述
z
典型相关系数的数学定义为:
b
b a a b
a V Var U Var V U Cov V U T T T 221112)()(),(),(ΣΣΣ=
=ρ由于随机变量乘以常数不改变其相关系数,为防止不必要的结果重复出
现,最好在其中附加如下的约束条件:
1
)(1)(2211=Σ==Σ=b b V Var a a U Var T T 记,,则有2112212111ΣΣΣΣ=−−A 12
11121122ΣΣΣΣ=−−B b Bb a Aa 22,λλ==其中既是A 又是B 的特征根,a 和b 就是对应于A 和B 的特征向量。
2
λ
SPSS 实例
为研究运动员体力与运动能力的关系,对某高一年级男生38人进行体力测试(共7项指标)及运动能力测试(共5项指标)。
运动能力测试指标:Y1 50米跑(秒)Y2跳远(cm )Y3投球(m )
Y4引体向上(次)Y5耐力跑(s )
体力测试指标:
X1反复横向跳(次)X2纵跳(cm )X3背力(kg )X4握力(kg )
X5台阶试验(指数)X6立定体前屈(cm )X7俯卧上体后仰(cm )
SPSS实例
SPSS操作
z SPSS采用’Canonical correlation.sps’宏程序来实现。
输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数
由体力测试指标内部相关系数看,各指标间相关系数较小,即指标间没有多大的重复。如果两个指标相关系数很大,可能这两个指标反映的是同一个方面,可以考虑合并。
输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数
运动能力测试指标间的相关系数也比较类似(各指标间的相关系数较小),不过y2(跳远)和y4(引体向上)之间的相关系数较大,达到0.6067
输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数
上表输出的是体力与运动能力之间的相关系数,从二者直接相关系数看,只有X2(纵跳)和y2(跳远)之间关联程度较大(R=0.5584),而其他体力指标和运动能力指标间的直接关联不大,更多的可能是综合影响。
由于变量间的交互作用,因此,这个简单相关系数矩阵只能作为参考,不能真正反映两组变量间的实质联系。
典型相关系数及显著性检验
第一典型相关系数为0.763,第二典型相关系数为0.706,第三典型相关系数为0.607,它们均比体力指标和运动能力指标两组间的任一个相关系数大,即综合的典型相关分析效果要好于简单相关分析。
典型相关系数及显著性检验
由于此处的典型相关系数是从样本数据算得的,和简单相关系数一样,有必要进行总体系数是否为0的假设检验。此处采用的是Bartlett的χ2检验,零假设为对应的典型相关系数为0。
上面的输出结果表明:在α=0.05的情况下,第一与第二典型相关系数是显著的。
典型变量的系数-体力变量
标准化变量(Standardized
Canonical Coefficients)的典型
相关变量的换算系数
e.g. 来自体力指标的第一典型变
量的计算公式为:
U1=0.314X1 + 0.628X2 +
0.295X3 + 0.309X4 + 0.335X5
+ 0.033X6 + 0.077X7
原始变量(Raw Canonical
Coefficients)的典型相关变量
的换算系数