多元线性回归模型案例分析
- 格式:doc
- 大小:170.50 KB
- 文档页数:7
多元线性回归模型案例分析
——中国人口自然增长分析一·研究目的要求
中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的降到1980年,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。
影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。
二·模型设定
为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。
从《中国统计年鉴》收集到以下数据(见表1):
表1 中国人口增长率及相关数据
,
设定的线性回归模型为:
1222334t t t t t Y X X X u ββββ=++++
三、估计参数
利用EViews 估计模型的参数,方法是:
1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对
话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年
年份 @
人口自然增长率
(%。)
国民总收入
(亿元) 居民消费价格指数增长
率(CPI )%
人均GDP (元) 1988
15037 1366 1989 …
17001 18 1519 1990
18718 1644 1991 【
21826 1893 1992
26937 2311 1993 .
35260 2998 1994
48108 4044 1995 —
59811 5046 1996
70142 5846 1997 ~
78061 6420 1998
83024 6796 1999 【
88479 7159 2000
98000 7858 2001 [
108068 8622 2002
119096 9398 2003 :
135174 10542 2004
159587 12336 2005 、
184089 14040 2006
213132
16024
度),并在“Start date”中输入开始时间“1988”,在“end date”中输入最后时间“2005”,点击“ok”,出现“Workfile UNTITLED”工作框。其中已有变量:“c”—截距项“resid”—剩余项。在“Objects”菜单中点击“New Objects”,在“New Objects”对话框中选“Group”,并在“Name for Objects”上定义文件名,点击“OK”出现数据编辑窗口。
2、输入数据:点击“Quik”下拉菜单中的“Empty Group”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的格,在命令栏输入“Y”,点下行键“↓”,即将该序列命名为Y,并依此输入Y的数据。用同样方法在对应的列命名X2、X
3、X4,并输入相应的数据。或者在EViews命令框直接键入“data Y 2X X3 X4…”,回车出现“Group”窗口数据编辑框,在对应的Y、X2、X3、X4下输入响应的数据。
3、估计参数:点击“Procs“下拉菜单中的“Make Equation”,在出现的对话框的“Equation Specification”栏中键入“Y C X2X3 X4”,在“Estimation Settings”栏中选择“Least Sqares”(最小二乘法),点“ok”,即出现回归结果:
表
…
根据表中数据,模型估计的结果为:
432005109.0047918.0000332.060851.15X X X Y t -++=Λ
t=
930526.02=R 915638.02
=R
F=
四、模型检验
1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长 1%,人口增长率增长%;在假定其它变量不变的情况下,当年人均GDP 没增加一元,人口增长率就会降低%。这与理论分析和经验判断相一致。
2、统计检验
:
(1)拟合优度:由表中数据可以得到:930526.02
=R ,修正的
可决系数为915638
.02
=R
,这说明模型对样本的拟合很好。
(2)F 检验:针对0234:0H βββ===,给定显著性水平0.05α=,在F 分布表中查出自由度为k-1=3和n-k=14的临界值34.3)14,3(=αF 。由表中得到F= ,由于F= >(3,21) 3.075F α=,应拒绝原假设
0234:0H βββ===,说明回归方程显著,即“国民总收入”、“居民消
费价格指数增长率”、“人均GDP ”等变量联合起来确实对“人口自然增长率”有显著影响。
(3)t 检验:分别针对0H :0(1,2,3,4)j j β==,给定显著性水平0.05α=,
查t 分布表得自由度为n-k=14临界值145.2)(2/=-k n t α。
由表中数据可得,与^
1β、^
2β、^
3β、^
4β对应的t 统计量分别为、 、、
除^
3β,其绝对值均大于145.2)(2/=-k n t α,这说明分别都应当拒
绝0H :)4,2,1(0==j j β,也就是说,当在其它解释变量不变的情况下,
解释变量“国民总收入”、“人均GDP ”分别对被解释变量“人口自然增长率”Y 都有显著的影响。
^
3β的绝对值小于145.2)(2/=-k n t α,:这说明接受0H :03=β,
X3系数对t 检验不显著,这表明很可能存在多重共线性。
所以计算各解释变量的相关系数,选择X2、X3、X4数据,点”view/correlations ”得相关系数矩阵(如表):
表
.
由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。