- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第9章 因子分析 章
9.1
因子分析的定义和数学模型 SPSS中实现过程 SPSS中实现过程
9.2
因子分析是将现实生活中众多相关, 因子分析是将现实生活中众多相关,重叠 的信息进行合并和综合, 的信息进行合并和综合,将原始的多个变量和 指标变成较少的几个综合变量和综合指标, 指标变成较少的几个综合变量和综合指标,以 利于分析判定.本章介绍因子分析的定义, 利于分析判定.本章介绍因子分析的定义,因 子分析的数学模型,以及因子分析在SPSS SPSS中的 子分析的数学模型,以及因子分析在SPSS中的 实现过程. 实现过程.
9.1.5 构造因子变量
因子分析中有多种确定因子变量的方法, 因子分析中有多种确定因子变量的方法, 如基于主成分模型的主成分分析法和基于因子 分析模型的主轴因子法,极大似然法, 分析模型的主轴因子法,极大似然法,最小二 乘法等. 乘法等.其中基于主成分模型的主成分分析法 是使用最多的因子分析方法之一. 是使用最多的因子分析方法之一.
表9-2
合作性 16 18 17 17 16 20 18 16 18 17 17 16 20 18 16 18 17 17 16 20
20名大学生的9项测验结果 20名大学生的 名大学生的9
分 配 16 19 17 17 15 17 16 16 19 17 17 15 17 16 16 19 17 17 15 17 出发点 13 15 17 17 16 16 16 13 15 17 17 16 16 16 13 15 17 17 16 16 工作投入 18 16 14 16 16 17 20 18 16 14 16 16 17 20 18 16 14 16 16 17 发展机会 16 18 17 19 18 18 15 16 18 17 19 18 18 15 16 18 17 19 18 18 社会地位 17 18 18 18 18 18 16 17 18 18 18 18 18 16 17 18 18 18 18 18 权力距离 15 18 16 19 15 17 19 15 18 16 19 15 17 19 15 18 16 19 15 17 职位升迁 16 17 16 20 16 19 14 16 17 16 20 16 19 14 16 17 16 20 16 19 领导风格 16 19 16 19 16 18 17 16 19 16 19 16 18 17 16 19 16 19 16 18
9.1.6 因子变量的命名解释
在实际分析工作中, 在实际分析工作中,主要是通过对载荷矩 的值进行分析, 阵A的值进行分析,得到因子变量和原变量的 关系,从而对新的因子变量进行命名. 关系,从而对新的因子变量进行命名.
9.1.7 计算因子得分
计算因子得分是因子分析的最后一步. 计算因子得分是因子分析的最后一步.因 子变量确定以后,对每一样本数据, 子变量确定以后,对每一样本数据,希望得到 它们在不同因子上的具体数据值, 它们在不同因子上的具体数据值,这些数值就 是因子得分,它和原变量的得分相对应. 是因子得分,它和原变量的得分相对应.有了 因子得分,在以后的研究中, 因子得分,在以后的研究中,就可以针对维数 少的因子得分来进行. 少的因子得分来进行.
9.2.2 SPSS结果解释 结果解释
(1)SPSS输出结果文件中的第一部分如 SPSS输出结果文件中的第一部分如 下表所示. 下表所示.
(2)SPSS输出结果文件中的第二部分如 SPSS输出结果文件中的第二部分如 下表所示. 下表所示.
(3)SPSS输出结果文件中的第三部分如 SPSS输出结果文件中的第三部分如 下表所示. 下表所示.
9.2 SPSS中实现过程 SPSS中实现过程 9.2.1 SPSS中实现步骤 中实现步骤
研究问题 所示为20名大学生关于价值观的9 20名大学生关于价值观的 表9-2所示为20名大学生关于价值观的9项 测验结果,包括合作性,对分配的看法, 测验结果,包括合作性,对分配的看法,行为 出发点,工作投入程度,对发展机会的看法, 出发点,工作投入程度,对发展机会的看法, 社会地位的看法,权力距离,对职位升迁的态 社会地位的看法,权力距离, 以及领导风格的偏好. 度,以及领导风格的偏好.
9.1.2 数学模型
因子分析中的几个概念 1.因子载荷 2.变量共同度 公共因子Fj Fj的方差贡献 3.公共因子Fj的方差贡献
9.1.3 因子分析的 个基本步骤 因子分析的4个基本步骤
因子分析有两个核心问题: 因子分析有两个核心问题:一是如何构造 因子变量;二是如何对因子变量进行命名解释. 因子变量;二是如何对因子变量进行命名解释. 因子分析有下面4个基本步骤. 因子分析有下面4个基本步骤. (1)确定待分析的原有若干变量是否适 合于因子分析. 合于因子分析. 构造因子变量. (2)构造因子变量. (3)利用旋转使得因子变量更具有可解 释性. 释性. 计算因子变量的得分. (4)计算因子变量的得分.
(10)SPSS输出结果文件中的第十部分如 10)SPSS输出结果文件中的第十部分如 下表所示. 下表所示.
(11)SPSS输出结果文件中的第十一部分 11)SPSS输出结果文件中的第十一部分 如下表所示. 如下表所示.
(12)SPSS输出结果文件中的第十二部分 12)SPSS输出结果文件中的第十二部分 如图9 所示. 如图9-9所示.
因子分析有如下特点: 因子分析有如下特点: (1)因子变量的数量远少于原有的指标 变量的数量, 变量的数量,对因子变量的分析能够减少分析 中的计算工作量. 中的计算工作量. (2)因子变量不是对原有变量的取舍, 因子变量不是对原有变量的取舍, 而是根据原始变量的信息进行重新组构, 而是根据原始变量的信息进行重新组构,它能 够反映原有变量大部分的信息. 够反映原有变量大部分的信息. 因子变量之间不存在线性相关关系, (3)因子变量之间不存在线性相关关系, 对变量的分析比较方便. 对变量的分析比较方便. 因子变量具有命名解释性, (4)因子变量具有命名解释性,即该变 量是对某些原始变量信息的综合和反映. 量是对某些原始变量信息的综合和反映.
(7)SPSS输出结果文件中的第七部分为 SPSS输出结果文件中的第七部分为 Explained表格 表格. Total Variance Explained表格.如下表所 示.
(8)SPSS输出结果文件中的第八部分如 SPSS输出结果文件中的第八部分如 所示. 图9-8所示.
(9)SPSS输出结果文件中的第九部分如 SPSS输出结果文件中的第九部分如 下表所示. 下表所示.
9.1 因子分析的定义和数学模型 9.1.1 统计学上的定义
定义:在社会,政治, 定义:在社会,政治,经济和医学等领域的研 究中往往需要对反映事物的多个变量进行大量的观 收集大量的数据以便进行分析,寻找规律. 察,收集大量的数据以便进行分析,寻找规律.在 大多数情况下,许多变量之间存在一定的相关关系. 大多数情况下,许多变量之间存在一定的相关关系. 因此, 因此,有可能用较少的综合指标分析存在于各 变量中的各类信息, 变量中的各类信息,而各综合指标之间彼此是不相 关的,代表各类信息的综合指标称为因子. 关的,代表各类信息的综合指标称为因子.因子分 析就是用少数几个因子来描述许多指标或因素之间 的联系, 的联系,以较少几个因子反映原资料的大部分信息 的统计学方法. 的统计学方法.
(4)SPSS输出结果文件中的第四部分如 SPSS输出结果文件中的第四部分如 下表所示. 下表所示.
(5)SPSS输出结果文件中的第五部分如 SPSS输出结果文件中的第五部分如 下表所示. 下表所示.
(6)SPSS输出结果文件中的第六部分如 SPSS输出结果文件中的第六部分如 下表所示. 下表所示.
(13)SPSS输出结果文件中的第十三部分 13)SPSS输出结果文件中的第十三部分 如下表所示. 如下表所示.
(14)SPSS输出结果文件中的第十四部分 14)SPSS输出结果文件中的第十四部分 如下表所示. 如下表所示.
9.2.3 讨论
因子分析是对现实生活中众多的相关, 因子分析是对现实生活中众多的相关,重 叠信息进行合并和综合,它以最少的信息丢失, 叠信息进行合并和综合,它以最少的信息丢失, 将原始的众多变量和指标变成较少的几个综合 变量,以利于分析判定. 变量,以利于分析判定. 在研究中, 在研究中,因子分析得到的结果经常用于 综合判定. 综合判定.
对多变量的平面数据进行最佳综合和简化, 对多变量的平面数据进行最佳综合和简化, 即在保证数据信息丢失最少的原则下,对高维 即在保证数据信息丢失最少的原则下, 变量空间进行降维处理.显然, 变量空间进行降维处理.显然,在一个低维空 间解释系统, 间解释系统,要比在一个高维系统空间容易得 多. 英国统计学家Moser Scott在1961年对英 英国统计学家Moser Scott在1961年对英 157个城镇发展水平进行调查时 个城镇发展水平进行调查时, 国157个城镇发展水平进行调查时,原始测量 的变量有57 57个 而通过因子分析发现, 的变量有57个,而通过因子分析发现,只需要 个新的综合变量( 用5个新的综合变量(它们是原始变量的线性 组合),就可以解释95%的原始信息. ),就可以解释95%的原始信息 组合),就可以解释95%的原始信息.对问题 的研究从57维度降低到5个维度, 57维度降低到 的研究从57维度降低到5个维度,因此可以进 行更容易的分析. 行更容易的分析.
图9-5 "Factor Analysis:Rotation"对话框 Analysis:Rotation"对话框
图9-6 "Factor Analysis:Facfor Scores"对话框 Analysis: Scores"对话框
图9-7 "Factor Analysis:Options"对话框 Analysis:Options"对话框
小 结
因子分析是由Charles Spearman在1904年首次提出 年首次提出, 因子分析是由Charles Spearman在1904年首次提出,其 在某种程度上可以被看成是主成分分析的推广和扩展. 在某种程度上可以被看成是主成分分析的推广和扩展.因子 分析就是用少量几个因子来描述许多指标或因素之间的联系, 分析就是用少量几个因子来描述许多指标或因素之间的联系, 以较少的几个因子反应原资料的大部分信息的统计方法. 以较少的几个因子反应原资料的大部分信息的统计方法. 因子分析有两个核心问题:一是如何构造变量, 因子分析有两个核心问题:一是如何构造变量,二是如何 对因子变量命名解释.因子分析的基本步骤有四步:( :(1 对因子变量命名解释.因子分析的基本步骤有四步:(1)确 定带分析的原有若干变量是否适于因子分析;( ;(2 定带分析的原有若干变量是否适于因子分析;(2)构造因子 变量;( ;(3 利用旋转使得因子变量更具有可解释性;( ;(4 变量;(3)利用旋转使得因子变量更具有可解释性;(4) 计算因子变量得分. 计算因子变量得分. 选中SPSS中 选中SPSS中"Analyze"/"Data Reduction"/"Factor"子 SPSS 菜单可进行因子分析,应计算相应的因子得分. 菜单可进行因子分析,应计算相应的因子得分.
9.1.4 确定待分析的原有若干变量是否适合于因子分析 因子分析是从众多的原始变量中构造出少数几个具有代 表意义的因子变量,这里面有一个潜在的要求, 表意义的因子变量,这里面有一个潜在的要求,即原有变量 之间要具有比较强的相关性. 之间要具有比较强的相关性.如果原有变量之间不存在较强 的相关关系, 的相关关系,那么就无法从中综合出能反映某些变量共同特 性的少数公共因子变量来.因此,在因子分析时, 性的少数公共因子变量来.因此,在因子分析时,需要对原 有变量作相关分析. 有变量作相关分析. 最简单的方法就是计算变量之间的相关系数矩阵. 最简单的方法就是计算变量之间的相关系数矩阵.如果 相关系数矩阵在进行统计检验中,大部分相关系数都小于0.3 0.3, 相关系数矩阵在进行统计检验中,大部分相关系数都小于0.3, 并且未通过统计检验, 并且未通过统计检验,那么这些变量就不适合于进行因子分 析. 巴特利特球形检验( Sphericity) 1.巴特利特球形检验(Bartlett Test of Sphericity) 反映像相关矩阵检验(Anti- 2.反映像相关矩阵检验(Anti-image correlation matrix) matrix) KMO(Kaiser-Meyer-Olkin) 3.KMO(Kaiser-Meyer-Olkin)检验
ቤተ መጻሕፍቲ ባይዱ 实现步骤
图9-1 在菜单中选择"Factor"命令 在菜单中选择"Factor"命令
图9-2 "Factor Analysis"对话框 Analysis"对话框
图9-3 "Factor Analysis:Descriptives"对话框 Analysis:Descriptives"对话框
图9-4 "Factor Analysis:Extraction"对话框 Analysis:Extraction"对话框