当前位置:文档之家› 6多重共线性

6多重共线性

6多重共线性
6多重共线性

第六章 多重共线性

一、单项选择题

1、当模型存在严重的多重共线性时,OLS 估计量将不具备【 】

A 线性

B 无偏性

C 有效性

D 一致性

2、经验认为,某个解释变量与其他解释变量间多重共线性严重的情况是这个解释变量的VIF 【 】

A 大于1

B 小于1

C 大于5

D 小于5 3、模型中引入实际上与解释变量无关的变量,会导致参数的OLS 估计量【 】 A 增大 B 减小 C 有偏 D 非有效

4、对于模型i i i i u x b x b b y +++=22110,与12r =0相比,当12r =0.15时,估计量1?b 的方差var (1

?b )将是原来的【 】 A 1倍 B 1.33倍 C 1.96倍 D 2倍 5、模型中引入一个无关的解释变量【 】 A 对模型参数估计量的性质不产生任何影响 B 导致普通最小二乘估计量有偏 C 导致普通最小二乘估计量精度下降

D 导致普通最小二乘估计量有偏,同时精度下降

6、如果方差膨胀因子VIF =10,则认为什么问题是严重的【 】 A 异方差问题 B 序列相关问题

C 多重共线性问题

D 解释变量与随机项的相关性

7、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在【 】

A 多重共线性

B 异方差性

C 序列相关

D 高拟合优度 8、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,即有i i kX X 21=,其中k 为非零常数,则表明模型中存在【 】

A 方差非齐性

B 多重共线性

C 序列相关

D 设定误差

9、假定正确回归模型为t t t t t u X X X Y ++++=3322110ββββ,若遗漏了解释变量X2,且X1、X2线性相关则1β的普通最小二乘法估计量【 】 A 无偏且一致 B 无偏但不一致 C 有偏但一致 D 有偏且不一致

二、多项选择题

1、下列哪些回归分析中很可能出现多重共线性问题【 】 A “资本投入”、“劳动投入”两个变量同时作为生产函数的解释变量 B “消费”作为被解释变量,“收入”作解释变量的消费函数

C “本期收入”和“前期收入”同时作为“消费”的解释变量的消费函数

D “商品价格”、“地区”、“消费风俗”同时作为解释变量的需求函数

E “每亩施肥量”、“每亩施肥量的平方”同时作为“小麦亩产”的解释变量的模型 2、当模型中解释变量间存在高度的多重共线性时【 】 A 各个解释变量对被解释变量的影响将难于精确鉴别 B 部分解释变量与随机误差项之间将高度相关 C 估计量的精度将大幅下降

D 估计量对于样本容量的变动将十分敏感

E 模型的随机误差项也将序列相关

3、下述统计量可以用来检验多重共线性的严重性【 】 A 相关系数 B DW 值 C 方差膨胀因子 D 特征值 E 自相关系数

4、多重共线性产生的原因主要有【 】 A 经济变量之间往往存在同方向的变化趋势 B 经济变量之间往往存在密切的关联度 C 在模型中采用滞后变量也容易产生多重共线性

D 在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性

E 以上都不正确

5、多重共线性的解决方法主要有【 】 A 保留重要的解释变量,去掉次要的或可替代的解释变量 B 利用先验信息改变参数的约束形式

C 变换模型的形式

D 综合使用时序数据与截面数据

E 逐步回归法以及增加样本容量

6、当线性回归模型的解释变量之间存在较严重的多重共线性时,可使用的有偏估计方法有【】

A 加权最小二乘法

B 工具变量法

C 岭回归估计法 C 主成分回归估计法

E 间接最小二乘法

7、检测多重共线性的方法有【】

A 简单相关系数检测法

B 样本分段比较法

C方差膨胀因子检测法D判定系数增量贡献法

E工具变量法

三、判断题

1、尽管有完全的多重共线性,OLS估计量仍然是最优线性无偏估计量。()

2、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。()

R值,则高度共线性的存在是肯定无疑的了。()3、如果有某一辅助回归显示出高的2

i

4、变量的两两高度相关并不表示高度多重共线性。()

5、如果分析的目的仅仅是预测,则多重共线性是无害的。 ( )

6、在多元回归中,根据通常的t检验,每个参数都是统计上不显著的,你就不会得到一个高

R值。 ( )

的2

7、变量不存在两两高度相关表示不存在高度多重共线性。 ( )

四、填空题

1、存在近似多重共线性时,回归系数的标准差趋于_____, T趋于_______。

2、方差膨胀因子(VIF)越大,OLS估计值的_____________将越大。

3、存在完全多重共线性时,OLS估计值是__________。

4、检验样本是否存在多重共线性的常见方法有:___________________和逐步回归检验法。

5、处理多重共线性的方法有:保留重要解释变量、去掉不重要解释变量、____________、

___________________。

五、简答与论述题

1、什么是多重共线性?产生多重共线性的经济背景是什么?

2、多重共线性对模型的主要影响是什么?

3、什么是方差膨胀因子(VIF )?根据VIF=1/(1-2R ),你能说出VIF 的最小可能值和最大可能值吗?VIF 多大时,认为解释变量间的多重共线性是比较严重的?

4、简述检验多重共线性与消除多重共线性的方法。

5、用诸如GDP 、失业、货币供给、利率、消费支出等经济时序数据进行回归分析时,常常怀疑存在多重共线性,为什么?

6、对于线性回归模型Y=XB+U 的最小儿乘估计量B ?=Y X X X ''-1

)(

(1)当X 之间出现不完全共线性时,B

?会出现什么情况? (2)用什么方法检验不完全多重共线性?

7、建立产出(y )对资本投入(K )和劳动(L )的生产函数模型的过程中,可能遇到的问题是什么?

8、完全多重共线性与不完全多重共线性之间的区别是什么? 9、为什么说追加样本信息是解决多重共线性问题的一条有效途径?

六、计算与分析题

1、下表是某种商品的需求量、价格和居民收入的统计资料:

检验2x 与3x 之间的多重共线性,并建立适当的回归方程。

2、下表给出了以美元计算的每周消费支出(Y ),每周收入(2X )和财富(3X )等的假想数据。

Y 2X

3X

70

80

810

65 100 1 009 90 120 1 273 95 140 1 425 110 160 1 633 115 180 1 876 120 200 2 252 140 220 2 201 155 240 2 435 150

260

2 686

(1) 作Y 对2X 和3X 的普通最小二乘回归。

(2) 这一回归方程中是否存在着共线性?你是如何知道的? (3) 分别作Y 对2X 和3X 的回归,这些回归结果表明了什么? (4) 作2X 对3X 的回归,这一回归结果表明了什么?

(5) 如果存在严重的共线性,你是否会除去一个解释变量?为什么 3、下表给出了美国1971—1986年期间新客车年销售量等的数据。

Y=新客车销售量(单位:千);

2x =新车价格指数,1967年为100; 3x =消费价格指数(CPI ),1967年为100;

4x =个人可支配收入(单位:10亿美元);

5x =利率;

6x =从业人数(单位:千)。

现考虑以下对客车的总体需求函数:

t t t t t t t L n x L n x L n x L n x L n x L n y μββββββ++++++=66554433221 请回答以下问题:

(1) 同时把两种价格指数2x 和3x 引入模型的理由是什么? (2) 把就业人数6x 引入模型的理由是什么? (3) 利率变量5x 在此模型中的作用是什么? (4) 用普通最小二乘法估计此模型; (5) 此模型是否存在多重共线性?

(6) 如果存在,估计各种可能的辅助回归模型,并找出哪些解释变量之间具有高度共线

性?

(7) 如果存在高度共线性,你将舍去那个解释变量?为什么? (8) 你认为较合适的需求函数是什么?

4、下表是被解释变量Y ,解释变量1X 、2X 、3X 、4X 的时间序列观测值。

(1) 采用适当的方法检验多重共线性; (2) 用逐步回归法确定一个较好的回归模型。

5、下表是某国1959~1968年服装消费量Y 、可支配收入1X 、流动资产2X 、服装价格指数

3X 、一般商品价格指数4X 的数据资料。

估计服装消费的有关数据 年份

Y (百万镑)

1X

(百万镑) 2X

(百万镑) 3X

(1963年=100) 4X

(1963年=100) 1959 8.4 82.9 17.1 92 94 1960 9.6 88.0 21.3 93 96 1961 10.4 99.9 25.1 96 97 1962 11.4 105.3 29.0 94 97 1963 12.2 117.7 34.0 100 100 1964 14.2 131.0 40.0 101 101 1965 15.8 148.2 44.0 105 104 1966 17.9 161.8 49.0 112 109 1967 19.3 174.2 51.0

112 111 1968

20.8

184.7

53.0

112

111

检验模型的多重共线性,试用逐步回归法确定一个较好的回归模型。 6、下表给出了一组消费支出(y )、周收入(1x )和财富(2x )的假设数据:

请回答以下问题:

(1) 估计模型t t t t u x b x b b y +++=22110。 (2) 存在多重共线性吗?为什么?

(3) 估计模型t t t u x b b y ++=110,t t t u x b b y ++=210。你从中了解了些什么? (4) 估计模型t t t u x b b y ++=110,你从中发现了什么?

(5) 如果1x 、 2x 存在严重的共线性,你将舍去一个解释变量吗?为什么?

7、某公司经理试图建立识别对管理有利的个人能力模型,他选取了15名新近提拔的职员,作一系列测试,确定他们的交易能力(1x )、与他人联系的能力(2x )及决策能力(3x )、每名职员的工作情况(y )依次对上述三个变量作回归,原始数据如下表。

请回答以下问题:

(1)建立回归模型t t t t t u x b x b x b b y ++++=3322110,并进行回归分析。 (2)模型是否显著?

(3)计算每个i b 的方差膨胀因子VIF ,并判断是否存在多重共线性?

第6章 多重共线性

第6章 多重共线性 本章专门讨论古典假设中无多重共线性假定被违反的情况,主要内容包括多重共线性的概念、产生的原因和表现、产生的后果、多重共线性的检验方法及无多重共线性假定违反后的解决方法。 6.1多重共线性的概念 在第三章的多元线性回归模型的建立中,强调了无多重共线性,即假定各解释变量之间不存在线性关系,或者各解释变量的观测值之间线性无关。计量经济学中的多重共线性是指模型中各解释变量的线性关系,它不仅包括解释变量之间精确的线性关系,还包括解释变量之间近似的线性关系,因此多重共线性也就表现为完全多重共线性和近似多重共线性。 6.1.1完全多重共线性 从数学意义上去说明多重共线性,就是对于解释变量k X 、、X X 32,如果存在不全为0的数k λλλ,2,1 ,能使得 n ,2, ,1i 033221 ==++++ki k i i X X X λλλλ ( 6.1.1 ) 则称解释变量k X X X ,,,32 之间存在着完全的多重共线性 用矩阵表示,解释变量的数据矩阵为: X=?? ??? ???????kn n n k k X X X X X X X X X 322 32 22 1 31211 11 (6.1.2) 当矩阵X 的秩小于k 时,表明其中至少有一个列向量可以用其余的列向量线性表示,则说明存在完全多重共线性。 6.1.2不完全的多重共线性 在实际经济问题中,完全的多重共线性并不多见。比较常见的是解释变量 k X X X ,,,32 之间存在不完全的多重共线性。所谓不完全的多重共线性,是指对于解释变 量k X 、、X X 32,存在不全为0的数k λλλ,2,1 ,使得 n ,2, ,1i 033221 ==+++++i ki k i i u X X X λλλλ (6.1.3) 其中,i u 为随机变量。这表明解释变量k X 、、X X 32存在一种近似的线性关系。 如果k 个解释变量之间不存在完全或不完全的线性关系,则称无多重共线性①。若用矩阵表示,这时X 为满秩矩阵,即Rank(X)=k 。 总之,回归模型中解释变量的关系用相关系数表示出来有三种情形: ①0=j x i x r ,解释变量间不存在线性关系,变量间相互正交。这时不需要作多元回归,可以通过Y 对X j 的多个一元回归来估计每个参数值βj 。 ②1=j x i x r ,解释变量间存在完全共线性。此时模型参数将无法估计。当两变量按同一方式 ① 解释变量之间不存在线性关系,并非不存在非线性关系,当解释变量存在非线性关系时,并不违反无多 重共线性假定。

EVIEWS案例:(消除多重共线性)影响国内旅游市场收入的主要因素分析

第四章 案例分析 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长 22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的 1994—2003年的统 计数据,如表4.2所示: 表4.2 1994年—2003年中国旅游收入及相关数据

数据来源:《中国统计年鉴2004》 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3 由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据, Views/Open Selected/One Windows/Open Group 点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

多重共线性回归分析及其实验报告

实验报告 实验题目:多重共线性的研究指导老师: 学生一: 学生二: 实验时间:2011年10月

多重线性回归分析及其实验报告 实验目的:为了更好地了解财政收入构成,需要定量地分析影响财政收入的因素 模型设定及其估计:经分析,影响财政收入的主要因素,农业增加值X1,工业增加值X2,建筑业增加值X3,总人口X4,受灾面积X5.为此设定了如下形式的计量经济模型: Y=β 1+β 2 X1+β 3 X2+β 4 X3+β 5 X4+β 6 X5+u0 其中,Y为财政收入(元),X1农业增加值(元),X2为工业增加值(元),X3为建筑业增加值(元),X4为总人口(万人),X5为受灾面积(千公顷) 为估计模型参数,收集1978~2007年财政收入及其影响因素数据,如图: 1978~2007年财政收入及其影响因素数据 年份 财政收入CS/亿 元 农业增加值 NZ/亿元 工业增加值 GZ/亿元 建筑业增加 值JZZ/亿元 总人口 TPOP/万 人 受灾面积 SZM/千公顷1978 1132.3 1027.5 1607 138.2 96259 50790 1979 1146.6 1270.2 1769.7 143.8 97542 39370 1980 1159.9 1371.4 1996.5 195.5 98705 44526 1981 1175.8 1559.5 2048.5 207.1 100072 39790 1982 1212.3 1777.4 2162.3 220.7 101654 33130 1983 1367 1978.5 2375.8 270.6 103008 34710 1984 1642.5 2316.1 2789 316.7 104357 31890 1985 2004.6 2564.3 3448.5 417.9 105851 44365 1986 2122 2788.7 3987.5 525.7 107507 47170 1987 2199.4 3233 4565.9 665.8 109300 42090 1988 2357.6 3865.4 5062 810 111026 50870 1989 2664.5 5062 8087.3 794 112704 46991 1990 2937.4 5342.3 10284.5 859.4 114333 38474

计量经济学Eviews多重共线性实验报告

计量经济学E v i e w s多重共线性实验报告 Company Document number:WUUT-WUUY-WBBGB-BWYTT-1982GT

实验报告课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日 广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。

四、预备知识:最小二乘法估计的原理、t检验、F检验、2R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ () 录入数据,得到图。 2.2.1)采用OLS 估计参数 在主界面命令框栏中输入 ls y c x1 x2 x3 x4 x5 x6 x7回车,即可得到参数的估计结果。 由此可见,该模型的可决系数为,修正的可决系数为,模型拟和很好,F 统计量为,回归方程整体上显着。 可是其中的lnX3、lnX4、lnX6对lnY 影响不显着,不仅如此,lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。 3、多重共线性模型的识别

多重共线性考试考试与答案

第七章 多重共线性习题与答案 1、多重共线性产生的原因是什么? 2、检验多重共线性的方法思路是什么?有哪些克服方法? 3、考虑一下模型: Y t =β1+β2X t +β3X 1-t +4βX 2-t +5βX 3-t +6βX 4-t +u t 其中Y =消费,X =收入,t =时间。上述模型假定了时间t 的消费支出不仅是时间t 的收入,而且是以前多期的收入的函数。例如,1976年第一季度的消费支出是同季度收入合1975年的四个季度收入的函数。这类模型叫做分布滞后模型(distributed lag models )。我们将在以后的一掌中加以讨论。 (1) 你预期在这类模型中有多重共线性吗?为什么? (2)如果预期有多重共线性,你会怎么样解决这个问题? 4、已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。随机扰动项μ的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释α和β。 (2)OLS 估计量α ?和β?满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由。 5、根据1899—1922年在美国制造业部门的年度数据,多尔蒂(Dougherty )获得如下回归结果: LogY=2.81 - 0.53logK+ 0.91logL + 0.047t Se =(1.38)(0.34) (0.14) (0.021) R 2=0.97 F=189.8 其中Y =实际产生指数,K=实际资本投入指数,L=实际劳力投入指数,t =时间或趋势。利用同样数据,他又获得一下回归: (1)回归中有没有多重共线性?你怎么知道? (2)在回归(1)中,logK 的先验符号是什么?结果是否与预期的一致?为什么或为什么不? (3)你怎样替回归的函数形式(1)做辩护:(提示:柯柏—道格拉斯生产函数。) (4)解释回归(1)在此回归中趋势变量的作用为何? (5)估计回归(2)的道理何在? (6)如果原先的回归(1)有多重共线性,是否已被回归(2)减弱?你怎样知道?

多重共线性 多重共线性实验案例与独立实验问题

实验五 多重共线性模型的检验与处理(1) 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设 施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示: 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3

由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 三、消除多重共线性 采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示: 表4.5

计量经济学多元线性回归、多重共线性、异方差实验报告记录

计量经济学多元线性回归、多重共线性、异方差实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到亿人次,同比增长%,国内旅游收入万亿元,同比增长%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β 1 X 1 +β 2 X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

多重共线性

城乡居民消费水平研究 —解决多重共线性 一、文献综述 长期以来,我国处于商品短缺的困扰之中,不得不采用配给制的办法限制居民的消费选择自由;随着供求关系的变化,人们的消费取向正在发生根本改变。因此,了解目前城乡居民的消费水平以及其影响因素对于把握国内不同群体消费需求的变化,指导生产、引导消费、开拓市场、发展循环经济、建立和谐社会具有重要意义。 影响消费的因素很多,如价格水平、利率水平、收入水平、消费偏好、家庭财产、风俗习惯、制度模式等。其中,收入是影响消费的最重要因素。改革开放以来,我国居民的收入水平在不断提高,居民消费情况也有明显变化。在居民总体收入逐渐增加的同时,居民的收入差距也有所扩大,形成了高、中、低不同阶层的收入与消费群体。根据国家统计局的调查资料显示,不同消费群体之间的消费与投资倾向已有很大差异,受此影响,社会消费结构也已发生了较大变化。如今生活宽裕的高收入居民,十分关注生活质量的提高,消费倾向也出现明显变化,投资意识日益高涨。调查显示,越来越多的高收入居民,在消费时追求精神消费和服务消费,教育、文化、通信、保健、住宅等成为消费热点,追求时尚化与个性化日趋明显。高收入家庭的投资是社会民间投资中极为重要的部分,在国民经济运行中的作用不可低估. 中等收入群体占到城镇家庭总数的60%以上,收入占到居民收入总数的50%多,是我国消费的主体部分,他们的消费行为对我国整体消费状况的影响是最大的,对这一层次居民消费的启动将直接关系到我国经济启动的成败。这一消费群体的消费特征表现为对未来收入与支出不良预期的影响.所以基于这个问题的重要性,决定研究城乡居民的消费水平及其影响因素。 二、数据资料初步分析 数据的收集来源于2009年中华人民共和国国家统计局公布的年度数据,并选取城乡居民消费水平、城乡居民家庭人均可支配收入、职工平均工资、人均国内生产总值、城乡居民消费价格指数、城乡新建住房面积来研究其对城镇居民消费水平的影响。通过初步的线性回归发行这些数据都能较好的解释城镇居民消费水平。由于财富数据较难取得,所以用城乡新建住房面积来表示这一指标,并且取得较好的效果。所以将以上6个指标定位解释变量。其中城乡居民家庭人收入为城镇居民家庭人均可支配收入与农村居民家庭人均纯收入之和。

第六章 多重共线性

第六章多重共线性 前面两章所讲的异方差性和自相关性都是表现在随机误差项中的,我们下面所讲的多重共线性讨论的是模型中的解释变量违背基本假设的问题。 回忆以下我们在讲多元线性回归模型时,基本假定与简单线性回归模型不同的是哪一点?——就是无多重共线性假定:即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关。 这一章我们讨论的多重共线性就是当解释变量违背了这一条基本假定的情形。 第一节多重共线性概念 先看一个实例:我们研究某个地区家庭消费及其影响因素。我们除了引入收入X1以外,还引入了消费者的家庭财产X2作为第2个解释变量。根据抽样数据回归得到以下结果: Y^=24.7747+0.9415X1-0.0424X2 t=(3.6690) (1.1442) (-0.5261) R2=0.9635 R2——=0.9531 F=92.4020 这一回归结果说明什么? 1、可决系数和修正可决系数都很理想 2、F统计量高度显著,说明X1、X2联合对Y的影响显著 3、各变量参数的t检验都不显著,不能否定等于零的假设 4、财产变量的系数竟然与预期的符号相反。 为什么会出现这样的结果呢? 再看一个例子:分析某地区汽车保养费用支出与汽车的行程数以及汽车拥有的时间建立模型,通过样本数据估计得:Y^=7.29+27.58X1-151.15X2 t= (0.06) (0.958) (-7.06) R2——=0.946 F=52.53 这个结果修正可决系数理想,F检验也显著,但X的T检验不显著,X2的T检验虽然显著,但系数符号与经济意义不符。为什么也出现这种结果? 一、多重共线性的概念: 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。 完全共线性与不完全共线性表示的是一种线性相关程度。比如我们在第一个例子中,发现可支配收入与家庭财富之间有明显的共线性关系,他们的相关系数高达0.9989,第二个例子中汽车的行程数与拥有汽车的时间的相关系数也为0.9960,表明两个变量之间存在一种不完全的线性相关关系,我们可以认为他们之间有程度很高的多重共线性. 不存在多重共线性只说明解释变量之间没有线性关系,而不排除他们之间存在某种非线性关系。 二、产生多重共线性的原因 1、许多经济变量在随时间的变化过程中往往存在共同的变动趋势。这就使得它们之间 容易产生多重共线性。例如在经济繁荣时期,收入、消费、储蓄、投资、就业都趋 向于增长;在经济衰退时期,都趋向于下降。如果将这些变量作为解释变量同时引 入模型,则它们之间极有可能存在很强的相关性。时间序列中的这种增长因素和趋 向因素是造成多重共线性的主要根源 2、用截面数据建立回归模型时,根据研究的具体问题选择的解释变量常常从经济意义 上存在着密切的关联度。比如P69以某一行业的企业为样本建立企业生产函数模型,以产出量为解释变量,选择资本、劳动、技术等投入要素为解释变量。而这些投入 要素的数量往往与产出量呈正比,产出量高的企业,投入的各种要素都比较多,这 就使得投入要素之间出现线性相关性。 3、在模型中大量采用滞后变量也容易产生多重共线性。因为滞后变量从经济性质来看 与原来的变量无区别,只是时间上有所不同,从经济意义上这些变量之间的关联度 比较紧密。P69 一般来讲,解释变量之间存在多重共线性是难以避免的,所以在多元线性回归模型中,我们关心的并不是多重共线性的有无,而是多重共线性的程度。当多重共线性程度过高时,给最小二乘估计量带来严重的后果。因此,我们追求的也是使多重共线性的程度尽可能地减弱。

计量经济学Eviews多重共线性实验报告

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期: 2014 年 05 月 11日

广东商学院教务处制姓名实验报告成绩 评语: 指导教师(签名)

年月日 说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 R值。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98 至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ (2.1) 2.1录入数据,得到图。

多重共线性的几点认识

多重共线性: 可分为完全多重共线性和近似多重共线性“或称高度相关性” 检验多重共线性问题是否严重: 1.若回归模型的R2值高(如>0.8),或F检验值显著,但单个解释变 量系数估计值却不显著; 2.若两个解释变量之间的相关系数高,比如说大于0.8,则可以认为 存在严重的共线性。 对多重共线性本质的认识: 1.多重共线性是由变量之间的性质引起的:这一认识沿袭了传统经 济计量学对多重共线性的认识,而现代经济计量学否定了这一认识; 不管数据以什么形式取得,数据取样是大是小,都会出现解释变量间高度相关问题。 2.多重共线性是数据问题引起的:指即使总体诸解释变量没有线性关系, 但在具体样本中仍可能有线性关系。当n=2时,两点总能连成一条直线,即时,使性质上原本并不存在线性关系的两个变量,由于样本数据问题产生了共线性;时序解释变量之间几乎肯定会出现谬回归,必然导致多重共线性。 线性回归模型解释变量间存在多重共线性可能产生如下后果: 1.增大最小二乘估计量的方差; 2.参数估计值不稳定,对样本变化敏感; 3.检验可靠性降低,产生弃真错误。由于参数估计量方差增大,在进 行显著性检验时,t检验值将会变小,可能使某些本该参数显著的检

验结果变得不显著,从而将重要变量舍弃。 多重共线性的修正: 若多重共线性程度较轻微,并不严重影响系数估计值(符号正确,t 值显著),则可以忽略多重共线性问题。 1.删除不必要的变量 2.改变解释变量的形式:差分法,对于时间序列数据而言,若原始 变量存在严重的多重共线性,则可以考虑对变量取差分形式,可在一定程度上降低多重共线性的程度 3.当模型中有较多解释变量的滞后值,并存在严重共线性时,可以 考虑用被解释变量的滞后值代替解释变量的滞后值;以人均形式的变量代替总体变量在某些状况下也可以在一定程度上降低多重共线性的程度

计量经济学多元线性回归、多重共线性、异方差实验报告概要

计量经济学实验报告

多元线性回归、多重共线性、异方差实验报告 一、研究目的和要求: 随着经济的发展,人们生活水平的提高,旅游业已经成为中国社会新的经济增长点。旅游产业是一个关联性很强的综合产业,一次完整的旅游活动包括吃、住、行、游、购、娱六大要素,旅游产业的发展可以直接或者间接推动第三产业、第二产业和第一产业的发展。尤其是假日旅游,有力刺激了居民消费而拉动内需。2012年,我国全年国内旅游人数达到30.0亿人次,同比增长13.6%,国内旅游收入2.3万亿元,同比增长19.1%。旅游业的发展不仅对增加就业和扩大内需起到重要的推动作用,优化产业结构,而且可以增加国家外汇收入,促进国际收支平衡,加强国家、地区间的文化交流。为了研究影响旅游景区收入增长的主要原因,分析旅游收入增长规律,需要建立计量经济模型。 影响旅游业发展的因素很多,但据分析主要因素可能有国内和国际两个方面,因此在进行旅游景区收入分析模型设定时,引入城镇居民可支配收入和旅游外汇收入为解释变量。旅游业很大程度上受其产业本身的发展水平和从业人数影响,固定资产和从业人数体现了旅游产业发展规模的内在影响因素,因此引入旅游景区固定资产和旅游业从业人数作为解释变量。因此选取我国31个省市地区的旅游业相关数据进行定量分析我国旅游业发展的影响因素。 二、模型设定 根据以上的分析,建立以下模型 Y=β 0+β1X 1 +β2X 2 +β 3 X 3 +β 4 X 4 +Ut 参数说明: Y ——旅游景区营业收入/万元 X 1 ——旅游业从业人员/人 X 2 ——旅游景区固定资产/万元 X 3 ——旅游外汇收入/万美元 X 4 ——城镇居民可支配收入/元

第七章 多重共线性

第七章 多重共线性 若线性模型不满足假定6,就称模型有多重共线性。 §7.1 多重共线性的概念 一. 基本概念: 假定6 ()1k r X k n =+<,是指模型中所有自变量12,,,,k x x x ??????1线性 无关,也可理解为矩阵X 的列向量线性无关。若不满足该假定,即 ()1k r X k <+, 则称12,,,,k x x x ??????1存在完全多重共线性,12,,,,k x x x ??????1存在严格的线性关系,这 是一种极端情况;若12,,,,k x x x ??????1之间的线性关系不是严格的,而是一种近似的线性关系,则称高度相关或存在不完全多重共线性。如,01122i i i i y x x u βββ=+++ 若12,λλ?不全为零, 使11220i i x x λλ+=, 完全多重共线性 11220i i i x x v λλ++= 不完全多重共线性 完全多重共线性和不完全多重共线性统称为多重共线性。 解释变量(自变量)之间的线性关系可用拟合优度2i R 描述,2i R 表示i x 对其它解 释变量的拟合优度,21i R = 完全 21i R ≈ 高度 20i R = 无 二. 产生的原因: 在实际经济问题中主要是不完全多重共线性。其产生的主要原因是: 1. 两个解释变量具有相同或相反的变化趋势;(家庭能耗与住房面积、人口) 生产、需求....... 2. 数据收集的范围过窄,造成解释变量之间有相同或相反变化的假象; 3. 某些解释变量之间存在某种近似的线性关系;(各解释变量有相同的时间趋势) 4. 一个变量是另一个变量的滞后值;供给 5. 解释变量的选择不当也可能引起变量间的多重共线性。 6. 过度决定模型。(观测值个数少于参数个数) 对于正确设置的模型,多重共线性基本上是一种样本现象。 §7.2 多重共线性的后果 一. 完全多重共线性

多重共线性

第六章 6.6 (1)判断多重共线性 做y 与x1,x2,x3,x4x5,x6的线性回归方程,得到 由表中的VIF 值可知x1,x2,x3,x4,x5的方差膨胀因子远大于10,这几个变量之间存在很高的线性相关性,说明回归方程存在多重共线性。 (2)逐步回归法 得到回归方程:215^ 353.0611.0637.06.874x x x y --+= 方程通过了三大检验。 其中,x1为农业,x2为工业,x5为社会消费总额,由方程表明农业每增加一亿元,财政收入减少0.611亿元;工业每增加一亿元,财政收入减少0.353亿元;社会消费总额每增加一亿元,财政收入增加0.637亿元。结合实际可看出该回归方程不合理。 由表中的VIF 值可知三个自变量的方差膨胀因子远大于10,说明逐步回归法得到的回归方程仍然存在多重共线性。 (3)VIF 后退法 由(1)判断得知原方程存在严重的多重共线性,要消除多重共线性利用VIF 后退法。 首先剔除VIF 值最大的自变量x2,得到

由表中的VIF 值可知除x6外其他自变量的方差膨胀因子仍然大于10 ,方程仍存在多重共线性。 再剔除VIF 值最大的自变量x5,得到 由表中的VIF 值可知除x6外其他自变量的方差膨胀因子仍然大于10,方程仍存在多重共线性。 再剔除VIF 值最大的自变量x1,得到 由表中的VIF 值可知剩余自变量的方差膨胀因子都小于10,说明方程的多重共线性已消除。 所以得到回归方程:643^ 004.0.031.0359.1332.2296 x x x y +++-= 方程通过了R 检验和F 检验,但是x6没有通过t 检验,说明不显著,所以剔除x6,得到

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见,该模型,可决系数很高,F 检验值 173.3525,明显显著。但是当时,不仅、 系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵 表3 由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法,去检验和解决多重共线性问题。 分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示 变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为:X3、X6、X2、X5、X4。 以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为: t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1:1994年—2003年中国游旅收入及相关数据

第七章 多共线性及其处理

第七章 多重共线性及其处理 第一部分 学习辅导 一、本章学习目的与要求 1.理解多重共线性的概念; 2.掌握多重共线性存在的主要原因; 3.理解多重共线性可能造成的后果; 4.掌握多重共线性的检验与修正的方法。 二、本章内容提要 本章主要介绍计量经济模型的计量经济检验。即多重共线性问题。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 (一)多重共线性及其产生的原因 当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。 1.多重共线性的基本概念 多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。 如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21ΛΛ间存在完全多重共线性。解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。因此,必有一个列向量可由其余列向量线性表示。 同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。 2.多重共线性产生的原因 多元线性回归模型产生多重共线性的原因很多,主要有: (1)经济变量的内在联系 这是产生多重共线性的根本原因。 (2)解释变量中含有滞后变量 (3)经济变量变化趋势的“共向性” 必须指出,多重共线性基本上是一种样本现象。因为人们在设定模型时,总是尽量避免将理论上具有严格线性关系的变量作为解释变量收集在一起,因此,实际问题中的多重共线性并不是解释变量之间存在理论上或实际上的线性关系造成的,而是由所收集的数据(解释变量观察值)之间存在近似的线性关系所致。 (二)多重共线性的影响 多重共线性会产生以下问题: (1)增大了OLS 估计量的方差 (2)难以区分每个解释变量的单独影响 (3)回归模型缺乏稳定性 (4)t 检验的可靠性降低 (三)多重共线性的判别 在应用多元回归模型中,人们总结了许多检验多重共线性的方法。 1.系数判定法

多重共线性

第六章 多重共线性问题 一、 实验目的 熟练使用EViews 软件进行计量分析,理解多重共线性的检验和估计的基本方法。 二、 基本知识点: 多重共线性的基本概念,多重共线性的后果,检验是否存在的基本方法——样本决定系数检验、参数估计值的经济检验和参数估计值的统计检验,多重共线性的解决办法——逐步回归法。 三、 实验内容及要求: 依据经济学理论,以实际数据(实验数据五)为基础,①建立反映天津市粮食市场需求状况的粮食需求函数。②检验所建立的粮食需求函数是否存在多重共线性。③如果存在多重共线性,使用恰当的方法加以解决。 四、 实验指导: 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数X1,城镇居民人居旅游支出X2、农村居民人均旅游支出X3、公路里程X4和铁路里程X5。为此设定如下的对数形式的计量经济模型:t t t t t t t X X X X X Y μββββββ++++++=54321543210 Y t ——第年全国旅游收入; X1t ——国内旅游人数(万人); X2t ——城镇居民人均旅游支出(元); X3t ——农村居民人均旅游支出(元); X4t ——公路里程(万公里); X5t ——铁路里程(万公里)。 数据见实验指导数据五,来源于《中国统计年鉴年》 STEP1:参数估计 在Eviews 中点击NEW 项,建立Workfile 输入Y 、X1、X2、X3、X4、X5的数据。点 击Quick ,选Estimate Equation 项,在OLS 对话框中,键入Y C X1 X2 X3 X4 X5,输出结果。见图6.4.1。 Dependent Variable: Y Method: Least Squares Date: 12/12/10 Time: 08:35 Sample: 1994 2006 Included observations: 13 Variable Coefficient Std. Error t-Statistic Prob. C 658.4612 1822.588 0.361278 0.7285 X1 0.046675 0.006842 6.821912 0.0002 X2 6.161783 1.608916 3.829772 0.0065 X3 2.372393 1.083468 2.189629 0.0647 X4 1.134097 1.417467 0.800087 0.4500 X5 -853.5124 426.8085 -1.999755 0.0857

第七章计量经济学

第七章:多重共线性 第一部分:学习目的和要求 在经典多元线性回归模型中,其中一个重要假设就是各变量之间是线性无关的。但在现实中我们建立的多元线性回归模型的各变量之间都会存在一定程度上的线性相关——即存在多重共线性。本章就是讨论存在多重共线性的情形,主要介绍了多重共线性的概念,多重共线性的理论后果,几种检测多重共线性的方法,以及对多重共线性进行补救的措施。通过本章的学习我们需要掌握以下几个问题: (1)多重共线性的概念,完全多重共线性和近似多重共线性的异同。 (2)了解多重共线性产生的原因。 (3)理解多重共线性的理论及实际后果,对统计量估计的后果、对参数显著性检验和预测的影响。 (4)掌握并学会运用多重共线性的几种监测方法,主要有样本决定系数检验法、相关系数检验法、辅回归模型检验法、容许度与方差膨胀因子检验法及特征值检验法。 (5)掌握并学会运用多重共线性的补救措施:利用先验信息法、变换模型法、综合使用横截面数据和时间序列数据法、增加样本容量法、删除变量和设定偏误法。 第二部分:练习题 一、术语解释 1、多重共线性 2、完全多重共线性与近似多重共线性 3、辅回归 4、容许度与方差膨胀因子 5、条件指数与病态指数 二、简答题 1、导致多重共线性的原因有哪些? 2、多重共线性为什么会使得模型的预测功能失效? 3、如何利用辅回归模型来检验多重共线性? 4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。 (1)尽管存在完全的多重共线性,OLS估计量还是最优线性无偏估计量(BLUE)。 (2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。 R值,则必然会存在高度的多重共线性。 (3)如果某一辅回归显示出较高的2 i (4)变量之间的相关系数较高是存在多重共线性的充分必要条件。 (5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。 (6)和VIF相比,容许度(TOL)是多重共线性的更好度量指标。

多重共线性

第四章 多重共线性 第一节 什么是多重共线性 一、多重共线性的含义 所谓多重共线性,不仅包括解释变量之间完全(精确)的线性关系,还包括解释变量之间近似的线性关系。 对于解释变量23,,,k X X X ,如果存在不全为零的数123,,,,k λλλλ ,能使得 12233i i k ki X X X λλλλ++++ =0 ,(i =1,2,,n )——即解释变量的数据矩阵的列 向量组线性相关。 则称解释变量23,,,k X X X 之间存在着完全的线性关系。 用数据表示,解释变量的数据矩阵为 X =21 31122 32223111k k n n kn X X X X X X X X X ????? ???? ? ?? 当()r X

相关主题
文本预览
相关文档 最新文档