第三章多元线性回归模型案例
- 格式:pdf
- 大小:654.85 KB
- 文档页数:17
第三章多元线性回归模型案例
第三章 多元线性回归模型案例
⼀、邹式检验(突变点检验、稳定性检验) 1.突变点检验1985—2002年中国家⽤汽车拥有量(t y ,万辆)与城镇居民家庭⼈均可⽀配收⼊(t x ,元),数据见表3.1。
表3.1 中国家⽤汽车拥有量(t y )与城镇居民家庭⼈均可⽀配收⼊(t x )数据
年份 t y (万辆)t x (元)
年份 t y (万辆)t x (元)
1985 28.49 739.1 1994 205.42 3496.2 1986 34.71 899.6 1995 249.96 4283 1987 42.29 1002.2 1996 289.67 4838.9 198860.42 1181.4 1997 358.36 5160.3 1989 73.12 1375.7 1998 423.65 5425.1 1990 81.62 1510.2 1999 533.88 5854 1991 96.041700.6 2000 625.33 6280 1992 118.2 2026.6 2001 770.78 6859.6 1993
155.77
2577.4
2002
968.98
7702.8
下图是关于t y 和t x 的散点图:
从上图可以看出,1996年是⼀个突变点,当城镇居民家庭⼈均可⽀配收⼊突破4838.9元之后,城镇居民家庭购买家⽤汽车的能⼒⼤⼤提⾼。现在⽤邹突变点检验法检验1996年是不是⼀个突变点。H 0:两个⼦样本(1985—1995年,1996—2002年)相对应的模型回归参数相等 H 1:备择假设是两个⼦样本对应的回归参数不等。
在1985—2002年样本范围内做回归。
在回归结果中作如下步骤:输⼊突变点:得到如下验证结果:
由相伴概率可以知道,拒绝原假设,即两个样本(1985—1995年,1996—2002年)的回归参数不相等。所以,1996年是突变点。 2.稳定性检验
以表3.1为例,在⽤1985—1999年数据建⽴的模型基础上,检验当把2000—2002年数据加⼊样本后,模型的回归参数时候出现显著性变化。
因为已经知道1996年为结构突变点,所以设定虚拟变量:0,19851995
11,19962002
D -??
-?
对1985—2002年的数据进⾏回归分析:做邹模型稳定性检验:输⼊要检验的样本点:得到如下检验结果:
由上述结果可以知道,F 值对应的概率为0.73,所以接受原假设,模型加⼊2000、2001和2002年的样本值后,回归参数没有发⽣显著性变化。 ⼆、似然⽐(LR )检验有中国国债发⾏总量(t DEBT ,亿元)模型如下:0123t t t t t DEBT GDP DEF REPAY u ββββ=++++
其中t GDP 表⽰国内⽣产总值(百亿元),t DEF 表⽰年财政⾚字额(亿元),t REPAY 表⽰年还本付息额(亿元)。1980—2001年数据见表3.2。
表3.2 国债发⾏总量t DEBT 、t GDP 、财政⾚字额t DEF 、年还本付息额(t REPAY )数
据
年份 DEBT GDP DEF REPAY 年份 DEBT GDP DEF REPAY 1980 43.01 45.178 68.9 28.58 1991 461.4 216.178 237.14246.8 1981 121.74
48.624 -37.38 62.89 1992 669.68 266.381 258.83 438.57 1982 83.86 52.947 17.65 55.52 1993
739.22
346.344 293.35 336.22 1983 79.41 59.345 42.57 42.47 1994 1175.25 467.594 574.52 499.36 1984
77.34
71.71 58.16 28.9 1995 1549.76 584.781 581.52 882.96 1985 89.85
89.644
-0.57 39.56 1996 1967.28 678.846 529.56 1355.03 1986 138.25 102.022 82.9 50.17 1997 2476.82 744.626 582.42 1918.371987 223.55 119.625
62.83
79.83 1998 3310.93 783.452 922.23
2352.92
1988 270.78 149.283 133.97 76.76 1999 3715.03 820.6746 1743.59 1910.53
1989 407.97 169.092 158.88 72.37 2000 4180.1 894.422 2491.27 1579.82 1990 375.45 185.479 146.49 190.07
2001
4604
959.3332516.54 2007.73
得到如下输出结果:
对应的回归表达式为:4.310.35 1.000.88t t t t DEBT GDP DEF REPAY =+++
(0.2) (2.2) (31.5) (17.8)
20.999, 2.1,5735.3R DW F ===
现在⽤似然⽐(LR )统计量检验约束t GDP 对应的回归系数1β等于零是否成⽴。 过程如下:输⼊要检验的变量名:
得到如下输出结果:
输出结果上部是关于约束GDP系数为零的F检验和LR检验。由于两种检验的相应概率均
不为零,模型中应该保留解释变量GDP。
⼩于0.05,即拒接原假设,GDP系数1
输出结果下部是去掉了GDP变量的约束模型估计结果。
三、Wald检验(以表3.2为例进⾏Wald检验,对输出结果进⾏检验。)检验过程如下:输⼊约束表达式:得到如下结果:
从输出结果上部可以看出,相应概率⾮常⼤,远远⼤于0.05,表明原假设成⽴,即约束条件3*(2)(3)c c =成⽴,2β是1β的3倍。输出结果的下部给出了约束条件3*(2)(3)0c c -=的样本值和样本标准差,分别为0.04和0.48。
四、表3.3中列出了中国2000年按⾏业分的全部制造业国有企业及规模以上制造业⾮国有企业的⼯业总产值Y ,资产合计K 及职⼯⼈数L 。
表3.3 中国2000年按⾏业分的全部制造业国有企业及规模以上制造业⾮国有企业的⼯业
总产值Y ,资产合计K 及职⼯⼈数L
序号 ⼯业总产值Y/亿元 资产合计K/亿元 职⼯⼈数L/万⼈
序号 ⼯业总产值Y/亿元 资产合计K/亿元 职⼯⼈数L/
万⼈ 1 3722.700 3078.220 113.0000 17 812.7000 1118.810 43.00000 2 1442.520 1684.430 67.00000 18 1899.700 2052.16061.00000 3 1752.370 2742.770 84.00000 19 3692.850 6113.110 240.0000 4 1451.290 1973.820 27.00000 20 4732.9009228.250 222.0000 5 5149.300 5917.010 327.0000 21 2180.230 2866.650 80.00000 6 2291.160 1758.770 120.0000 222539.760 2545.630 96.00000 7 1345.170 939.1000 58.00000 23 3046.950 4787.900 222.0000 8 656.7700 694.940031.00000 24 2192.630 3255.290 163.0000 9 370.1800 363.4800 16.00000 25 5364.830 8129.680 244.0000 10
1590.360
2511.990
66.00000
26
4834.680
5260.200
145.0000
11 616.7100 973.7300 58.00000 27 7549.580 7518.790 138.0000 12 617.9400 516.0100 28.00000 28 867.9100 984.520046.00000 13 4429.190 3785.910 61.00000 29 4611.390 18626.94 218.0000 14 5749.020 8688.030 254.0000 30 170.3000610.9100 19.00000 15 1781.370 2798.900 83.00000 31
325.5300
1523.190
45.00000
16
1243.070
1808.440
33.00000设定模型为:Y AK L e αβµ
=
(1) 利⽤上述资料,进⾏回归分析;
(2) 回答:中国2000年的制造业总体呈现规模报酬不变状态吗? 将模型进⾏双对数变换如下:ln ln ln ln Y A K L αβµ=+++
1)进⾏回归分析:得到如下回归结果:
于是,样本回归⽅程为:ln 1.1540.609ln 0.361ln Y
K L =++ (1.59) (3.45) (1.79)
20.8099,0.7963,59.66R R F ===
从回归结果可以看出,模型的拟合度较好,在显著性⽔平0.1的条件下,各项系数均通过了t 检验。从F 检验可以看出,⽅程对Y 的解释程度较少。
0.7963R =表明,⼯业总产值对数值的79.6%的变化可以由资产合计对数与职⼯的对数值的变化来解释,但仍有20.4%的变化是由其他因素的变化影响的。
从上述回归结果看,??0.971αβ+=≈,即资产与劳动的产出弹性之和近似为1,表明中国制造业在2000年基本呈现规模报酬不变的状态。
下⾯进⾏Wald 检验对约束关系进⾏检验。 过程如下:结果如下:
由对应概率可以知道,不能拒绝原假设,即资产与劳动的产出弹性之和为1,表明中国制造业在2000年呈现规模报酬不变的状态。 五、已知数据如表:Y X1 X2 1 1 10 3 2 9 8 3 5 15 4 1 28
5
-6
1、 0111i i i Y X u αα=++ 0222i i i Y X u λλ=++ 01122i i i i Y X X u βββ=+++
(1) 回答下列问题:11αβ=吗?为什么?22λβ=吗?为什么? 对上述3个⽅程进⾏回归分析,结果分别如下: