第四章 异 方 差
- 格式:ppt
- 大小:581.50 KB
- 文档页数:49
第4章违背基本假设的情况思考与练习参考答案4.1 试举例说明产生异方差的原因。
答:例4.1:截面资料下研究居民家庭的储蓄行为Y i=β0+β1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例4.2:以某一行业的企业为样本建立企业生产函数模型Y i=A iβ1K iβ2L iβ3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
4.2 异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
异方差问题1.什么是异方差?i ki k i i i u X X X Y +++++=ββββ 22110,ni ,,2,1 =221),,|(i i i i X X u Var σ= ,n i ,,2,1 =或者 2)(i i u V a r σ=,n i ,,2,1 =同方差异方差2.异方差性的两个例子⏹收入与储蓄⏹打字出错个数与打字练习小时数3.异方差的类型同方差递增方差4.异方差性的后果(1)OLS 估计量仍然具有线性性和无偏性 证明:我们以一元线性回归模型为例来证明。
∑∑∑∑∑∑+-++=-==21010221)]()[()(ˆii i i i i i i i i ΔX X u X ΔX ΔX Y Y ΔX ΔX ΔY ΔX βββββ ∑+=i i u k 1β,其中∑=2iii ΔX ΔX k 。
⏹ 证明无偏性时只使用到两个假设:解释变量是外生的,误差的均值为零 ⏹下面证明OLS 估计量方差在同方差与异方差情况下不相等。
当假设为同方差时,1ˆβ的方差为 )var()var()ˆvar(11∑∑=+=i i i i u k u k ββ (由随机扰动项的无自相关性假设) ∑∑==)var()var(2i i i i u k u k (由同方差假设)∑∑∑∑=⎥⎥⎦⎤⎢⎢⎣⎡==22222222)(ii i iΔXΔX ΔX k σσσ当方差为异方差是,1ˆβ的方差为 ∑∑==2221)var()ˆvar(i i i i k u k σβ 22222222)()()(∑∑∑∑=⎥⎥⎦⎤⎢⎢⎣⎡=i i i i i i ΔX ΔX ΔX ΔX σσ (2)变量的显著性检验失去意义说明:如果在存在异方差的情况下,仍然使用常用的OLS 估计量表达式,则计算得到的方差通常是有偏的。
由于t 统计量和F 统计量的表达式中都包含样本标准差,因此计算得到的t 统计值和F 统计值都是有偏误的,则建立在其上的假设检验也是不可靠的。
异方差异方差的性质● 经典回归的一个重要假定之一是:u i 的条件方差为常数, 即:E (2i u )= 2σ● 异方差(heterscedasticity ):E (2iu )=2i σ, 不同的(heter )分散程度(scedasticity )● (图)消费和收入, 消费随收入的增加而增加,但变异也在增加● u i 变动的几个理由:- 按照边错边改学习模型(error-learning models ),人们在学习的过程中,其行为误差随时间而减少,如:打字出错的个数- 随着收入的增长,人们有更多的备用收入,从而如何支配他们的收入有更大的选择范围- 随着数据采集技术的改进,2iσ可能减少- 异方差性还会因为异常值的出现而产生。
包括一个异常值,尤其样本较小时,会在很大程度上改变回归分析的结果- 异方差性的另一来源来自CLRM 的假定9的破坏,即:回归模型的设定是不正确的。
● 异方差常见于横截面数据中,因为观测范围大小不一● 异方差的后果:仍然是无偏的,但不是最有效的了(1) 无偏性βββ=+==-- )](')'[(]')'[()ˆ(11U X X X X E Y X X X E E(2) 非有效性1121111)'(')'()'()'(')'(]'')'][(')'[()'ˆ)(ˆ(------Φ==--=--X X X X X X X X X UU E X X X Y X X X Y X X X E E σββββββ● 同方差性时,βˆ的协方差矩阵为: 12)'(-X X σ,会夸大或缩小真实的方差和协方差● 由此会导致β的相关检验和置信区间失效,进而引起预测失效● 以双变量模型为例:i i i u X Y ++=10ββ进行显著性检验时,构造的t 统计量)ˆ(ˆ11ββS t =)ˆ(1βS 变动,所以1ˆβ的置信区间也不稳定异方差性的侦察● 侦破异方差性并没有严明的法则,只有少数的经验规则● 因为除非我们知道对应于选定的X 值的整个Y 总体,否则2i σ是无从获知的●大多数的方法都基于对我们所能观测到的OLS残差i uˆ的分析,而不是对干扰u i的分析非正式的方法●问题的性质:-往往根据所考虑的性质就能判别是否会遇到异方差性-例如:围绕消费对收入的回归,残差的方差随收入的增加而增加●图解法:-可先在无异方差性的假定下做回归分析,然后对残差的平方2ˆi u作一事后检查,看看这些2ˆi u是否呈现任何系统性的样式-(图)-2ˆi u是对应于i Yˆ而描绘的,除此之外,还可将他们对解释变量之一描点-当我们考虑2个或多个X变量的模型时,可将2ˆi u 相对于模型中的任一个变量描点正式方法(1)帕克(park )检验● 提出2i σ是解释变量X i 的某个函数,他建议的函数形式为:iv i ie X βσσ22=或:i i i v X ++=ln ln ln 22βσσ● 由于2iσ通常是未知的,帕克建议用2ˆi u 作为替代变量并作如下回归:ii i i v v X u++=++=i 22lnX ln ln ˆln βαβσ **● 如果β表现为统计上显著的,就表明数据中有异方差性● 帕克检验分两阶段:一是做回归,而不考虑异方差性问题,从这一回归获得i uˆ,然后在第二阶段作如** 的回归戈德菲尔德-匡特检验 (Goldfeld-Quandt test )● 适用于异方差性方差2i σ同回归模型中的解释变量之一有正相关的情形● 步骤一:从最小X 值开始,按X 值的大小顺序将观测值排列步骤二:略去居中的C 个观测值,其中C 是预定的,并将其余的(n-c )个观测值分成两组,每组(n-c)/2个步骤三:分别对头(n-c )/2个观测值和末(n-c)/2 个观测值各拟合一个回归,并分别获得残差平方和RSS 1 和RSS 2步骤四:计算比值:dfRSS dfRSS //12=λ, 如果假定i uˆ是正态分布的,并且如果同方差性假定真实,则λ遵循分子和分母自由度各为(n-c-2k )/2 的F 分布● C 个观测值是为了突出或激化小方差组(即RSS 1)与大方差组(即RSS 2 )之间的差异● 通常当n=30 时,取c =4, 当n=60 时,取c=10为宜● 当模型中有多于1个X 变量时,在检验的步骤一中,就可按任一个X 的大小顺序将观测值排列● 例:消费支出 – 收入, 30 观测值,略去居中4 个观测值后,对开头的13个和末尾的13个观测值分别作OLS 回归:17.377RS S 6968.04094.3ˆ1=+=i i X Y 8.1536RS S 7941.00272.28ˆ2=+-=i iX Y得:07.411/17.37711/8.1536//12===df RSS df RSS λ怀特(white )的一般异方差性检验● Goldfeld-Quandt 检验要求按照被认为是引起异方差性的X 变量把观测值重新排序● White 检验并不要求排序,而且易于付诸实施● 步骤一: 对给定的数据回归(两个解释变量),并获得残差i uˆ步骤二:再做如下(辅助)回归:ii i i i i i i v X X a X a X a X a X a a u ++++++=326235224332212ˆ从这个(辅助)回归中求得R 2步骤三:在无异方差性的虚拟假设下,2nR 渐进的遵循自由度等于辅助回归元(不包括常数项)个数的2χ分布步骤四:如果2χ值超过临界值,结论就是有异方差性,如果不超过,就没有,即:065432=====a a a a a● 例: Y= 贸易税收(进口与出口税收)与政府总收入之比,X 2 =进出口总和与GNP 之比,X 3 =人均GNP , 假设Y 与X 2 正相关,Y 与X 3 成反比White test :1148.0R ))(ln T rade 0.0015(ln )(ln 0491.0)(ln 4081.0 ln 6918.0ln 5629.28417.5ˆ2i 222=+--++-=i i i i i i GNP GNP Trade GNP Trade u7068.4)1148.0(41.2==R n● 如果模型有多个回归元,回归元的平方(或更高次方)项以及它们的交叉项就会耗掉许多的自由度● 遇到统计量显著的情形,原因也许不一定是异方差性异方差的修正方法 – 加权最小二乘法(广义最小二乘法)● 以消费-收入为例,消费异方差,设计一种估计方案:对来自变异较大的总体的观测值作较小的加权,而对来自较小的总体的观测值作较大的加权● OLS 方法对每一观测之同样重视或同等加权● 广义最小二乘法(generalized least square-GLS )利用了异方差的信息,因而能产生BLUE估计量● 利用双变量模型:i i i i u X X Y ++=201ββ其中对每个i, X0i=1● 假定相异的方差2i σ已知,用σ通除上式得:)()()(201iiiiiiiiu X X Y σσβσβσ++=为了易于阐述,将它写为:i i i i u X X Y ******201++=ββ● 转换原始模型中,转换干扰项i u *的方差,现在有了同方差性1)(1)(1)()*()*var(2222i22=====iiiiii i u E u E u E u σσσσ● OLS应用到转换模型将产生BLUE估计量● GLS是对满足标准最小二乘假定的转换变量的OLS● 21*ˆ*ˆββ和的估计步骤是最小化: 220112)**ˆ**ˆ*(*ˆii i X X Y u ββ--=∑∑● *ˆ2β的GLS 估计量为: ∑∑∑∑∑∑∑--=222)())(())(())((*ˆi i i i i i i i i i i i i X w X w w Y w X w Y X w w β 其中2/1i i w σ=● OLS和GLS 的差别:OLS要求最小化:2212)ˆˆ(ˆii i X Y u ββ--=∑∑ GLS要求最小化:2212)ˆˆ(ˆii i i i X Y w u w ββ--=∑∑● GLS中最小化一个以2/1i i w σ=为权的加权残差平方和,而在OLS中最小化一个无权或等权的残差平方和● 这种形式的GLS 被称为加权最小二乘法(weighted least square – WLS )● 若i σ是已知的,异方差的问题似乎已经得到了解决,但大多数情况下,方差是未知的●加权最小二乘法至多只能用于未知方差容易被描述的那些情况●看一下课本中的例子。
第4章违背基本假设的情况思考与练习参考答案试举例说明产生异方差的原因。
答:例:截面资料下研究居民家庭的储蓄行为Y i=?0+?1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例:以某一行业的企业为样本建立企业生产函数模型Y i=A i?1K i?2L i?3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
异方差带来的后果有哪些?答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显着性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。
第四章异方差性例4.1.4一、参数估计进入Eviews软件包,确定时间范围,编辑输入数据;选择估计方程菜单:(1)在Workfile对话框中,由路径:Quick/Estimate Equation,进入Equation Specification对话框,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果;(2)直接在命令栏里输入“ls log(y) c log(x1) log(x2)”,按Enter,得到样本回归估计结果;(3)在Group的当前窗口,由路径:Procs/Make Equation,进入Equation Specification窗口,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果。
如表4.1:表4.1图4.1估计结果为:(3.14) (1.38) (9.25)R2=0.7798 D.W.=1.78 F=49.60 RSS=0.8357括号内为t统计量值。
二、检验模型的异方差(一)图形法(1)生成残差平方序列。
①在Workfile的对话框中,由路径:Procs/Generate Series,进入Generate Series by Equation对话框,键入“e2=resid^2”,生成残差平方项序列e2;②直接在命令栏里输入“genr e2=resid^2”,按Enter,得到残差平方项序列e2。
(2)绘制散点图。
①直接在命令框里输入“scat log(x2) e2”,按Enter,可得散点图4.2。
②选择变量名log(x2)与e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),再按路径view/graph/scatter/simple scatter,可得散点图4.2。
③由路径quick/graph进入series list窗口,输入“log(x2) e2”,确认并ok,再在弹出的graph窗口把line graph换成scatter diagram,再点ok,可得散点图4.2。
计量经济学练习题第一章导论一、单项选择题⒈计量经济研究中常用的数据主要有两类:一类是时间序列数据,另一类是【 B 】A 总量数据B 横截面数据C平均数据 D 相对数据⒉横截面数据是指【A 】A 同一时点上不同统计单位相同统计指标组成的数据B 同一时点上相同统计单位相同统计指标组成的数据C 同一时点上相同统计单位不同统计指标组成的数据D 同一时点上不同统计单位不同统计指标组成的数据⒊下面属于截面数据的是【D 】A 1991-2003年各年某地区20个乡镇的平均工业产值B 1991-2003年各年某地区20个乡镇的各镇工业产值C 某年某地区20个乡镇工业产值的合计数D 某年某地区20个乡镇各镇工业产值⒋同一统计指标按时间顺序记录的数据列称为【B 】A 横截面数据B 时间序列数据C 修匀数据D原始数据⒌回归分析中定义【 B 】A 解释变量和被解释变量都是随机变量B 解释变量为非随机变量,被解释变量为随机变量C 解释变量和被解释变量都是非随机变量D 解释变量为随机变量,被解释变量为非随机变量二、填空题⒈计量经济学是经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关理论,可以理解为数学、统计学和_经济学_三者的结合。
⒉⒊现代计量经济学已经形成了包括单方程回归分析,联立方程组模型,时间序列分析三大支柱。
⒋⒌经典计量经济学的最基本方法是回归分析。
计量经济分析的基本步骤是:理论(或假说)陈述、建立计量经济模型、收集数据、计量经济模型参数的估计、检验和模型修正、预测和政策分析。
⒍⒎常用的三类样本数据是截面数据、时间序列数据和面板数据。
⒏⒐经济变量间的关系有不相关关系、相关关系、因果关系、相互影响关系和恒等关系。
三、简答题⒈什么是计量经济学?它与统计学的关系是怎样的?计量经济学就是对经济规律进行数量实证研究,包括预测、检验等多方面的工作。
计量经济学是一种定量分析,是以解释经济活动中客观存在的数量关系为内容的一门经济学学科。
第四章异方差性例4.1.4一、参数估计进入Eviews软件包,确定时间范围,编辑输入数据;选择估计方程菜单:(1)在Workfile对话框中,由路径:Quick/Estimate Equation,进入Equation Specification对话框,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果;(2)直接在命令栏里输入“ls log(y) c log(x1) log(x2)”,按Enter,得到样本回归估计结果;(3)在Group的当前窗口,由路径:Procs/Make Equation,进入Equation Specification窗口,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果。
如表4.1:表4.1图4.1估计结果为:(3.14) (1.38) (9.25)R2=0.7798 D.W.=1.78 F=49.60 RSS=0.8357括号内为t统计量值。
二、检验模型的异方差(一)图形法(1)生成残差平方序列。
①在Workfile的对话框中,由路径:Procs/Generate Series,进入Generate Series by Equation对话框,键入“e2=resid^2”,生成残差平方项序列e2;②直接在命令栏里输入“genr e2=resid^2”,按Enter,得到残差平方项序列e2。
(2)绘制散点图。
①直接在命令框里输入“scat log(x2) e2”,按Enter,可得散点图4.2。
②选择变量名log(x2)与e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),再按路径view/graph/scatter/simple scatter,可得散点图4.2。
③由路径quick/graph进入series list窗口,输入“log(x2) e2”,确认并ok,再在弹出的graph窗口把line graph换成scatter diagram,再点ok,可得散点图4.2。
计量经济学讲义第四讲(共⼗讲)第四讲异⽅差⼀、同⽅差与异⽅差:图形展⽰⾼斯-马尔科夫假定四即同⽅差假定:22iεδδ=。
维持其他假定,并假设真实模型是12i i i y x ββε=++,那么这意味着:12222()iii iy E y x εββδδδ=+==为了理解该假定,我们先考察图⼀。
图⼀同⽅差情况在图⼀中,空⼼圆点代表(,())i i x E y ,实⼼圆点代表观测值(,)iix y 观测,iy观测是随机变量i y 的⼀个实现【注意,按照假定,i x 是⾮随机的,即在重复抽样的情况下,给定i 的取值,ix 不随样本的变化⽽变化】,倾斜的直线代表总体回归函数:12()i i E y x ββ=+。
图⼀显⽰了⼀个重要特征,即,尽管12,,...y y 的期望值随着12,,...x x 的不同⽽随之变化,但由于假定222iiy εδδδ==,它们的离散程度(⽅差)是不变的。
然⽽,假定误差项同⽅差从⽽被解释变量同⽅差可能并不符合经济现实。
例如,如果被解释变量y代表居民储蓄,x代表收⼊,那么经常出现的情况是,低收⼊居民间的储蓄不会有太⼤的差异,这是因为在满⾜基本消费后剩余收⼊已不多。
但在⾼收⼊居民间,储蓄可能受消费习惯、家庭成员构成等因素的影响⽽千差万别。
图⼆能够展⽰这种现象。
图⼆异⽅差情况在图⼆中,依据x1所对应的分布曲线形状,x5所对应的实⼼圆点看起来是⼀个异常点,但依据x5所对应的分布曲线形状,它也许是正常的,因为x5所对应的分布曲线形状表明,随机变量y5的⽅差很⼤。
如果我们有很多观测值,那么在上述情况下,⼀个典型的散点图如图三所⽰。
事实上,利⽤散点图来初步识别异⽅差现象在实践中经常被采⽤。
图三异⽅差情况下的散点图笔记:应该注意的是,如果第⼀个⾼斯-马尔科夫假定被违背,即模型设定有误,那么也可能出现“异⽅差”现象。
例如,正确模型是⾮线性的,但我们错误地设定为线性,以这个线性模型为参照,散点图也许显⽰出明显的异⽅差症状。
第四章异方差性例一、参数估计进入Eviews软件包,确定时间范围,编辑输入数据;选择估计方程菜单:(1)在Workfile对话框中,由路径:Quick/Estimate Equation,进入Equation Specification对话框,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果;(2)直接在命令栏里输入“ls log(y) c log(x1) log(x2)”,按Enter,得到样本回归估计结果;(3)在Group的当前窗口,由路径:Procs/Make Equation,进入Equation Specification窗口,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果。
如表:表图估计结果为:R2= .= F= RSS=括号内为t统计量值。
二、检验模型的异方差(一)图形法(1)生成残差平方序列。
①在Workfile的对话框中,由路径:Procs/Generate Series,进入Generate Series by Equation对话框,键入“e2=resid^2”,生成残差平方项序列e2;②直接在命令栏里输入“genr e2=resid^2”,按Enter,得到残差平方项序列e2。
(2)绘制散点图。
①直接在命令框里输入“scat log(x2) e2”,按Enter,可得散点图。
②选择变量名log(x2)与e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),再按路径view/graph/scatter/simple scatter ,可得散点图。
③由路径quick/graph进入series list窗口,输入“log(x2) e2”,确认并ok,再在弹出的graph窗口把line graph换成scatter diagram,再点ok,可得散点图。
图由图可以看出,残差平方项e2对解释变量log(X2)的散点图主要分布图形中的下三角部分,大致看出残差平方项e2随log(X2)的变动呈增大的趋势,因此,模型很可能存在异方差。
应用回归分析第4章课后习题参考答案第4章违背基本假设的情况思考与练习参考答案试举例说明产生异方差的原因。
答:例:截面资料下研究居民家庭的储蓄行为Y i=0+1X i+εi其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。
由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。
例:以某一行业的企业为样本建立企业生产函数模型Y i=A i1K i2L i3eεi被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。
由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。
这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。
异方差带来的后果有哪些答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1、参数估计量非有效2、变量的显著性检验失去意义3、回归方程的应用效果极不理想总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。
简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。
答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。
其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。
在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。
然而在异方差的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。
由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。
所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。
ii i i i i i i X X X X X X e εαααααα++++++=215224213221102~第四章异方差1.异方差的概念和类型概念:对于模型 如果出现 即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。
异方差一般可归结为三种类型:(1)单调递增型: σi 2随X 的增大而增大(2)单调递减型: σi 2随X 的增大而减小(3)复杂型: σi 2与X 的变化呈复杂形式2.几种异方差的检验方法(描述原理即可)(1)图示检验法①用X-Y 的散点图进行判断:看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)②用X-的散点图进行判断:看是否形成一斜率为零的直线(2)帕克(Park)检验与戈里瑟(Gleiser)检验选择关于变量X 的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。
(3)G-Q 检验先将样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造统计量进行异方差检验。
由于该统计量服从F 分布,因此假如存在递增的异方差,则F 远大于1;反之就会等于1(同方差)、或小于1(递减方差)。
(4)怀特(White )检验怀特检验不需要排序,且适合任何形式的异方差。
以二元为例 先进行OLS 回归,得到 然后做辅助回归 可以证明,在同方差假设下,从该辅助回归所得到的可决系数R2与样本容量n 的乘积,渐进地服从自由度为辅助回归方程中解释变量个数的卡方分布:(R2为辅助回归的可决系数,h 为辅助回归法人解释变量的个数)如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数并且某一参数的t 检验值较大。
3.异方差的后果(1)参数估计量非有效OLS 估计量仍然具有无偏性,但不具有有效性。
因为在有效性证明中利用了而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。
第四章异方差性例4.1.4一、参数估计进入Eviews软件包,确定时间范围,编辑输入数据;选择估计方程菜单:(1)在Workfile对话框中,由路径:Quick/Estimate Equation,进入Equation Specification对话框,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果;(2)直接在命令栏里输入“ls log(y) c log(x1) log(x2)”,按Enter,得到样本回归估计结果;(3)在Group的当前窗口,由路径:Procs/Make Equation,进入Equation Specification窗口,键入“log(y) c log(x1) log(x2)”,确认ok,得到样本回归估计结果。
如表4.1:表4.1图4.1估计结果为:LnŶ=3.266+0.1502LnX1+0.4775LnX2(3.14) (1.38) (9.25)R2=0.7798 D.W.=1.78 F=49.60 RSS=0.8357括号内为t统计量值。
二、检验模型的异方差(一)图形法(1)生成残差平方序列。
①在Workfile的对话框中,由路径:Procs/Generate Series,进入Generate Series by Equation对话框,键入“e2=resid^2”,生成残差平方项序列e2;②直接在命令栏里输入“genr e2=resid^2”,按Enter,得到残差平方项序列e2。
(2)绘制散点图。
①直接在命令框里输入“scat log(x2) e2”,按Enter,可得散点图4.2。
②选择变量名log(x2)与e2(注意选择变量的顺序,先选的变量将在图形中表示横轴,后选的变量表示纵轴),再按路径view/graph/scatter/simple scatter,可得散点图4.2。
③由路径quick/graph进入series list窗口,输入“log(x2) e2”,确认并ok,再在弹出的graph窗口把line graph换成scatter diagram,再点ok,可得散点图4.2。