多元回归(多重共线,异方差,残差检验eviews,spss)
- 格式:doc
- 大小:996.50 KB
- 文档页数:7
数据处理: 4.3 模型建立
设年末实有耕地面积,有效灌溉率,农用塑料薄膜使用量,农药使用量,农业机械总动力,农业从业人数,农业投资额分别为127,,,X X X ;农业产值为Y 。在
此我们假设上述七个变量都与农业产值有显著影响,在SPSS 中用进入法对其做
出预判。
表4-3 回归预判表
模型 非标准化系数
标准化系数
T 显著性 共线性统计 B 标准误差 Bata 允差 VIF
(常数) 1.987E-15 .018
.000 1.000
年末实有耕地面积 .225 .291 .225 .775 .464 .004 239.655 有效灌溉率
.208 .116 .208 1.797 .115 .026
38.086
农用塑料薄膜使用量
-.396 .489 -.396 -.810 .445 .001 677.462 农药使用量 -.426 .564 -.426 -.756 .475 .001 899.494 农业机械总动力 .831 .282 .831 2.946 .022 .004 225.582 农业从业人数 .024 .179 .024 .136 .895 .011 90.381 农业投资额
.197
.140
.197
1.401
.204
.018
55.747
因变量: 农业产值
可以从表中得出回归方程:
12345670.2250.2080.3960.4260.8310.0240.197Y X X X X X X X =+---++
从显著性水平上看,小于0.05的只有一个农业机械动力,显然不能够准确的表达出与农业产值之间的关系。根据表中的VIF 值均大于10,其中四个大于了100,这说明模型中存在严重的多重共线性。并且在相关系数表中(附表1-2),我们也能够看出各个自变量之间相关系数较大,有较大的相关性。为了保证得到的回归模型能较好的反映真实意义,就要解决多重共线性问题。解决多重共线性我们一般使用逐步回归的方法。
4.3.1 逐步回归
将标准化后的数据输入EVIEWS ,首先找出与因变量拟合度最高自变量,的经过回归拟合可以得出7个变量的拟合优度,按降序排列如下表:
表4-4 拟合优度表
变量 拟合优度 5X 0.984325 3X 0.972272 4X 0.972024 1X 0.906987 7X 0.903033 2X 0.84501 6X
0.684597
拟合优度的大小也能在一定程度上表现出自变量与因变量的影响大小。这里
5X 是农业机械总动力,说明农业机械总动力对农业产值有较大的影响。在近年来江苏省整体经济发展迅速,科技水平大大提高,使农业的机械化水平发展迅速,机械设备的使用极大促进了农业产值的提高。
由表44-得,Y 与5X 的拟合优度最高,故Y 5X 作为基本方程。依次按拟合优度降序排列进入模型,检验新进入的变量是否显著并且拟合优度是否提高。拟合优度排第二的是变量3X ,所以将3X 进入基础模型。
3X 进入基本方程,结果如下图:
图4-1 变量判断图
从图41-的运行结果我们可以看出,3X 的估计量对应的0.8094p =大于
0.05,不显著,所以3X 不符合回归模型。3X 是农膜使用量,可以看出其对农业
产值的影响不显著。农膜主要使用在经济作物的种植中,近年来有部分农户利用地膜覆盖技术和塑料大棚进行种植、栽培瓜果蔬菜,获得了可观的收益,但是普及率不是很高,是一个对农业产值的影响不是很大。
所以我们不选择变量3X ,再将4X 进入基本方程。
图4-2 第一步逐步回归图
由图42-可以看出,4X 的估计量对应的0.8548p =值大于0.05,所以没有显著性,所以4X 同样不符合回归模型,故删去变量4X 。4X 为农药使用量,所以农药使用量对农业产值没有显著影响。
再将1726,,,X X X X 依次进入方程判断最优拟合方程,1X ,6X 不显著,7X 显著,2X 也是具有显著性的,表明农业投资额,有效灌溉率对农业产值也有显著影响,但是农业投资额对农业产值的影响大还是有效灌溉率对农业产值的影响大,还需要进一步比较。
表4-5 拟合优度表
变量 系数
标准差
t 值
p 值 拟合优度
1
常数
-1.57E-07 0.022013 -7.11E-06 1.0000 0.9937700 5X 0.76519 0.057883 13.21969 0.0000 7X
0.246876 0.057883 4.26518 0.0011 2
常数
8.13E-10 0.03293 2.47E-08 1.0000 0.986058 2X 0.999922 0.0818 1.221544 0.2453 5X
0.901298
0.0818
11.01832
0.0000
由表45-可得,但由于模型Y 5X 7X 的拟合优度为0.993770,模型Y 2X 5
X 的拟合优度为0.986058,比较他们两个的拟合优度,发现模型Y 5X 7X 的拟合优度较大,故选则Y 5X 7X 作为基本方程。然后按照第一次逐步回归法的步骤依次添加变量,并根据p 值判断其显著性。
可以得出Y
5X 7X 2X 为最终方程,p 值分别为
20.0107p =,20.0000p =,20.0001p =,均显著。经过逐步回归依次得到农业机械总动力,农业投资额,有效灌溉率对农业产值的影响较为显著。估计结果如下图:
图4-3 逐步回归模型结果图
从图43-中可以得出系数:
702571.5910,0.129540,0.263208,0.263208ββββ-=-⨯===,
所以写出对应的估计方程为:
72571.59100.1295400.6324180.263208Y X X X -=-⨯+++。
得出估计方程还要进行各项检验,只有通过检验才能说明我们得到的方程有效,才具有实际意义。
4.3.2 F 检验
F 检验的原假设和备择假设如下:
001:0n H βββ====;
1:(0,1,,)i H i n β=不全为零。
从图43-中可以看出F 检验(F-statistic)对应的p 值小于0.05,所以拒绝0H ,所以我们得出的估计方程存在显著的线性关系。
4.3.3 t 检验
t 检验的原假设和备择假设为: