相关分析和一元线性回归分析SPSS报告
- 格式:doc
- 大小:586.00 KB
- 文档页数:14
用下面的数据做相关分析和一元线性回归分析:
选用普通高等学校毕业生数和高等学校发表科技论文数量做相关分析和一元线性回归分析。
一、相关分析
1.作散点图
普通高等学校毕业生数和高等学校发表科技论文数量的相关图
从散点图可以看出:普通高等学校毕业生数和高等学校发表科技论文数量的相关性很大。
2.求普通高等学校毕业生数和高等学校发表科技论文数量的相关系
数
把要求的两个相关变量移至变量中,因为都是定距数据,选择相关系数中的Pearson,点击确定,可以得到下面的结果:
Correlations
普通高等学校毕业生数(万人)高等学校发表科技论文数量(篇)
普通高等学校毕业生数(万人)Pearson Correlation1.998**
Sig. (2-tailed).000
N1414
高等学校发表科技论文数量(篇)Pearson Correlation.998**1 Sig. (2-tailed).000
N1414
**. Correlation is significant at the 0.01 level (2-tailed).
两相关变量的Pearson相关系数=0.0998,表示呈高度正相关;相关系数检验对应的概率P值=0.000,小于显著性水平0.05,应拒绝原假设(两变量之间不具有相关性),即毕业生人数好发表科技论文数之间的相关性显著。
3.求两变量之间的相关性
选择相关系数中的全部,点击确定:
Correlations
(万人)(篇)
Kendall's tau_b(万人)Correlation Coefficient 1.000 1.000**
Sig. (2-tailed)..
N1414
(篇)Correlation Coefficient 1.000** 1.000
Sig. (2-tailed)..
N1414
Spearman's rho(万人)Correlation Coefficient 1.000 1.000**
Sig. (2-tailed)..
N1414
(篇)Correlation Coefficient 1.000** 1.000
Sig. (2-tailed)..
N1414
**. Correlation is significant at the 0.01 level (2-tailed).
注解:两相关变量(毕业生数和发表论文数)的Kendall相关系数=1.000,呈正相关;无相关系数检验对应的概率P值,应接受原假设(两变量之间不具有相关性),即毕业生数与发表论文数之间相关性不显著。
两相关变量(毕业生数和发表论文数)的Spearman相关系数=1.000,呈正相关;无相关系数检验对应的概率P值,应接受原假设(两变量之间不具有相关性),即毕业生数与发表论文数之间相关性不显著。
4.普通高等学校毕业生数和高等学校发表科技论文数量的相关系数
将所求变量移至变量,将控制变量移至控制中,选中显示实际显著性水平,点击确定:
Correlations
普通高等学校毕业生数(万人)高等学校发表科技论文数量(篇)
注解: 两相关变量(普通高校毕业生数和发表论文数)的偏相关系数=0.998,呈正相关;对应的偏相关系数双侧检验p值0,小于显著性水平0.05,应拒绝原假设(两变量之间不具有相关性),即普通高校毕业生数与发表论文数之间相关性显著。
二、一元线性回归
从前面的相关分析可以看出普通高等学校毕业生数和高等学校发表科技论文数量呈高度正相关关系,所以,下面对这两个变量做一元线性回归分析。
1.建立回归方程
Variables Entered/Removed b
Model Variables
Entered
Variables
Removed Method
1(篇)a.Enter
a. All requested variables entered.
b. Dependent Variable: (万人)
此图显示的是回归分析方法引入变量的方式。
Model Summary
Model R R Square Adjusted R
Square
Std. Error of the
Estimate
1.998a.996.99611.707
a. Predictors: (Constant), (篇)
此图是回归方程的拟合优度检验。
注解:上图是回归方程的拟合优度检验。
第二列:两变量(被解释变量和解释变量)的相关系数R=0.998.
第三列:被解释变量(毕业人数)和解释变量(发表科技论文数)的判定系数=0.996是一元线性回归方程拟合优度检验的统计量;判定系数越接近1,说明回归方程对样本数据的拟合优度越高,被解释变量可以被模型解释的部分越
多。
第四列:被解释变量(毕业人数)和解释变量(发表科技论文数)的调整判定系数=0.996。这主要适用于多个解释变量的时候。
第五列:回归方程的估计标准误差=11.707.
ANOVA b
Model Sum of Squares df Mean Square F Sig.
1Regression448318.6641448318.6643271.335.000a Residual1644.53512137.045
Total449963.19913
a. Predictors: (Constant), (篇)
b. Dependent Variable: (万人)
第二列:被解释变量(毕业人数)的总离差平方和=449963.199,被分解为两部分:回归平方和=448318.664;剩余平方和=1644.535.
F检验统计量的值=3271.335,对应概率的P值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验的原假设(回归系数与0不存在显著性差异),结论:回归系数不为0,被解释变量(毕业人数)与解释变量(发表科技论文数)的线
Coefficients a
Model Unstandardized Coefficients
Standardized
Coefficients
t Sig.
B Std. Error Beta
1(Constant)-316.25914.029-22.543.000 (篇).001.000.99857.196.000 a. Dependent Variable: (万人)
注解:回归方程的回归系数和常数项的估计值,以及回归系数的显著性检验。
第二列:常数项估计值=-316.259;回归系数估计值=0.001.
第三列:回归系数的标准误差=0.000
第四列:标准化回归系数=0.998.