SPSS典型相关分析

  • 格式:pdf
  • 大小:222.73 KB
  • 文档页数:16

下载文档原格式

  / 16
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

SPSS数据统计分析与实践

第二十二章:典型相关分析

(Canonical Correlation)

主讲:周涛副教授

北京师范大学资源学院

教学网站:/Courses/SPSS

典型相关分析(Canonical Correlation)本章内容:

一、典型相关分析的基本思想

二、典型相关分析的数学描述

三、SPSS实例

四、小节

典型相关分析的基本思想

z典型相关分析是研究两组变量之间相关关系的一种多元统计方法。

z简单相关系数;复相关系数;典型相关系数

z典型相关分析首先在每组变量中找出变量的线性组合,使其具有最大相关性;

z然后再在每组变量中找出第二对线性组合,使其与第一对线性组合不相关,而第二对本身具有最大相关性;

z如此继续下去,直到两组变量之间的相关性被提取完毕为止;

z这些综合变量被称为典型变量(canonical variates);第I对典型变量间的相关系数则被称为第I 典型相关系数(一般来说,只需提取1~2对典型变量即可较为充分的概括样本信息)。

典型相关分析的目的

T

q T

p Y Y Y Y X X X X )

,,,(),,,(2121K K ==设两组分别为p 与q 维(p ≤q)的变量X ,Y :

设p + q 维随机向量协方差阵,⎟⎟⎠⎞⎜⎜⎝

⎛=Y X Z ⎟⎟⎠

⎜⎜⎝⎛Σ

ΣΣΣ=Σ22

21

1211其中Σ11是X 的协方差阵,Σ22是Y 的协方差阵,Σ12=ΣT 21是X ,Y 的协方差阵

典型相关分析用X 和Y 的线性组合U =a T X , V =b T Y 之间的相关来研究X 和Y 之间的相关性。其目的就是希望找到向量a 和b ,使ρ(U ,V )最大,从而找到替代原始变量的典型变量U 和V 。

典型相关分析的数学描述

z

典型相关系数的数学定义为:

b

b a a b

a V Var U Var V U Cov V U T T T 221112)()(),(),(ΣΣΣ=

=ρ由于随机变量乘以常数不改变其相关系数,为防止不必要的结果重复出

现,最好在其中附加如下的约束条件:

1

)(1)(2211=Σ==Σ=b b V Var a a U Var T T 记,,则有2112212111ΣΣΣΣ=−−A 12

11121122ΣΣΣΣ=−−B b Bb a Aa 22,λλ==其中既是A 又是B 的特征根,a 和b 就是对应于A 和B 的特征向量。

2

λ

SPSS 实例

为研究运动员体力与运动能力的关系,对某高一年级男生38人进行体力测试(共7项指标)及运动能力测试(共5项指标)。

运动能力测试指标:Y1 50米跑(秒)Y2跳远(cm )Y3投球(m )

Y4引体向上(次)Y5耐力跑(s )

体力测试指标:

X1反复横向跳(次)X2纵跳(cm )X3背力(kg )X4握力(kg )

X5台阶试验(指数)X6立定体前屈(cm )X7俯卧上体后仰(cm )

SPSS实例

SPSS操作

z SPSS采用’Canonical correlation.sps’宏程序来实现。

输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数

由体力测试指标内部相关系数看,各指标间相关系数较小,即指标间没有多大的重复。如果两个指标相关系数很大,可能这两个指标反映的是同一个方面,可以考虑合并。

输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数

运动能力测试指标间的相关系数也比较类似(各指标间的相关系数较小),不过y2(跳远)和y4(引体向上)之间的相关系数较大,达到0.6067

输出结果解释-两组变量间的相关系数SPSS在三个方框中分别输出的是体力测试指标内部的相关系数、运动能力测试指标内部的相关系数,以及两组指标间的相关系数

上表输出的是体力与运动能力之间的相关系数,从二者直接相关系数看,只有X2(纵跳)和y2(跳远)之间关联程度较大(R=0.5584),而其他体力指标和运动能力指标间的直接关联不大,更多的可能是综合影响。

由于变量间的交互作用,因此,这个简单相关系数矩阵只能作为参考,不能真正反映两组变量间的实质联系。

典型相关系数及显著性检验

第一典型相关系数为0.763,第二典型相关系数为0.706,第三典型相关系数为0.607,它们均比体力指标和运动能力指标两组间的任一个相关系数大,即综合的典型相关分析效果要好于简单相关分析。

典型相关系数及显著性检验

由于此处的典型相关系数是从样本数据算得的,和简单相关系数一样,有必要进行总体系数是否为0的假设检验。此处采用的是Bartlett的χ2检验,零假设为对应的典型相关系数为0。

上面的输出结果表明:在α=0.05的情况下,第一与第二典型相关系数是显著的。

典型变量的系数-体力变量

标准化变量(Standardized

Canonical Coefficients)的典型

相关变量的换算系数

e.g. 来自体力指标的第一典型变

量的计算公式为:

U1=0.314X1 + 0.628X2 +

0.295X3 + 0.309X4 + 0.335X5

+ 0.033X6 + 0.077X7

原始变量(Raw Canonical

Coefficients)的典型相关变量

的换算系数

相关主题