第二章11计量经济学

  • 格式:ppt
  • 大小:5.98 MB
  • 文档页数:62

下载文档原格式

  / 50
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
Yi ? Y?i ? ??i ? ??0 ? ??1 Xi ? ei
式中, e i 称为样本残差或剩余项,代表了其他影
响 Yi 的随机因素的集合,可看成 ? i 的估计量 ??i 。
Yi ? E(Y Xi ) ? ?i ? ?0 ? ?1Xi ? ?i Y?i为E(Y Xi )的估计量; ??i为?i的估计量,i ? (0,1)
第二章 一元线性回归模型
?§ 2.1 回归分析概述 ?§ 2.2 一元线性回归模型的参数估计 ?§ 2.3 一元线性回归模型检验 ?§ 2.4 一元线性回归模型预测 ?§ 2.5 实例
§2.1 回归分析概述
一、回归分析的基本概念 二、总体回归函数 三、随机扰动项 四、样本回归函数( SRF)
回归分析概念
? ? ? yi2 ? ei2 ? y?i2
拟合优度检验
对于所有样本点,则需考虑这些点与样本均值离 差的平方和 ,可以证明:
? ? ? yi2 ? ei2 ? y?i2

? 总体平方和 TSS ? y?i2 ? 回归平方和 ESS ? y?i2 TSS=ESS+RSS
? 残差平方和 RSS ? ei2
参数的普通最小二乘估计
参数的最小二乘估计
给定一组样本观测值( Xi, Yi)(i=1,2,…n ) 要求样本回归函数尽可能好地拟合这组值 .
普通最小二乘法 (Ordinary least squares, OLS)给出的判断标准是:二者之差的平方和
n
n
? ? Q ? (Yi ? Y?i ) 2 ? (Yi ? (??0 ? ??1 Xi ))2
1078 1254 1496 1683 1925 1122 1298 1496 1716 1969 1155 1331 1562 1749 2013 1188 1364 1573 1771 2035 1210 1408 1606 1804 2101
1430 1650 1870 2112 1485 1716 1947 2200
回归分析概念
变量间的相关形式,有 线性相关和非线性相关 。
变量间线性相关程度 可用相关系数来测度:
? XY ?
Cov( X , Y) Var (X)Var (Y)
如果给出 X与Y的一组样本,则样本相关系数为:
n
? ( Xi ? X)(Yi ? Y)
rXY ?
i?1 n
n
? ? ( Xi ? X)2
从该样本估计总体回归函数 PRF?
表2.1.3 家庭消费支出与可支配收入的一个随机样本 Y 800 1100 1400 1700 2000 2300 2600 2900 3200 3500 X 594 638 1122 1155 1408 1595 1969 2078 2585 2530
样本回归函数
假设 2、随机误差项 ? 具有零均值、同方差和不序列 相关性:
E( ? i)=0 Var ( ? i)=? ?2 Cov( ? i, ? j)=0
i=1,2, …,n i=1,2, …,n i ≠j i,j= 1,2, …,n
假设3、随机误差项 ? 与解释变量 X之间不相关:
Cov( Xi , ? i ) ? 0
TSS
可决系数的取值范围: [0,1],R2越接近1,说
明实际观测点离样本线越近,拟合优度越高。
变量的显著性检验
变量的显著性检验
主要思想: 对模型中被解释变量与解释变量 之间的线性关系是否显著成立作出推断,针对 变 量的参数真值是否为零来进行显著性检验的 。所 应用的方法是数理统计学中的 假设检验 。
Y (元)
500
0
500
1000
1500 2000 2500 3000 3500 每月可支配收入 X(元)
4000
总体回归函数
在给定解释变量 Xi条件下被解释变量 Yi的期望 轨迹称为 总体回归线 ,或更一般地称为 总体回归曲 线,相应的总体回归函数为: E(Y | Xi ) ? f (Xi )
函数形式: 可以是线性或非线性的。
3500 2299 2321 2530 2629 2860 2871
15510
总体回归函数
描出散点图发现:随着收入的增加,消费 “平均地说”也在增加,且 Y的条件均值均落在 一根正斜率的直线上。这条直线称为 总体回归线 。
3500
3000 每 月 2500
消 2000 费 支 1500
出 1000
(2)其他随机或非确定性部分 ? i。
随机干扰项
随机误差项主要包括下列因素的影响:
1)代表未知的影响因素; 2)代表残缺数据; 3)代表众多细小影响因素; 4)代表数据观测误差; 5)代表模型设定误差; 6)变量的内在随机性
样本回归函数
样本回归函数
总体回归函数实际上是未知的。 例2.2:在例2.1的总体中有如下一个样本,能否
该样本的散点图(scatter diagram) :
由于样本取自总体,可用该线近似地代表总 体回归线。该线称为 样本回归线。
样本回归函数
记样本回归线的函数形式为:
Y?i ? f ( Xi ) ? ??0 ? ??1 Xi
注意:与总体回归函数进行比较。
样本回归函数
同样地,样本回归函数也有如下的随机形式:
Yi ? ? 0 ? ? 1 Xi ? ? i
i=1,2,…,n
Y为被解释变量, X为解释变量, ?0与? 1为待估
参数, ? 为随机干扰项
估计方法有多种,其种最广泛使用的是普 通 最小二乘法 (ordinary least squares, OLS )。
一元线性回归模型的基本假设
假设 1、解释变量 X是确定性变量,不是随机变量;
总体回归函数
每 月 家 庭 消 费 支 出 Y (元)
共计
800 561 594 627 638
2420
表 2.1.1 某社区家庭每月收入与消费支出统计表 每月家庭可支配收入 X(元)
1100 1400 1700 2000 2300 2600 638 869 1023 1254 1408 1650 748 913 1100 1309 1452 1738 814 924 1144 1364 1551 1749 847 979 1155 1397 1595 1804 935 1012 1210 1408 1650 1848 968 1045 1243 1474 1672 1881
样本回归函数
注意:这里PRF可能永远无法知道。
§2.2 一元线性回归模型的参数估计
一、一元线性回归模型的基本假设 二、参数的普通最小二乘估计( OLS) 三、参数估计的最大似然法 (ML) 四、最小二乘估计量的性质 五、参数估计量的概率分布及随机干
扰项方差的估计
一元线性回归模型的基本假设
一元线性回归模型: 只有一个解释变量
1
1
最小。
参数的最小二乘估计
根据微分运算,可推得用于估计 ??0 、??1 的下列 方程组:
方程组( *)称为正规方程组 (normal equations )。
参数的最小二乘估计
上述参数估计量可以写成: ?
? ?
??1
?
? xi yi ? xi2
?? ??0 ? Y ? ??1 X
称为OLS估计量的 离差形式(deviation form )。
(Yi ? Y)2
i?1
i?1
多变量间的线性相关程度,可用复相关系数和偏
相关系数来度量。
回归分析概念
回归分析构成计量经济学的方法论基础,其 主要内容包括: (1)根据样本观察值对经济计量模型参数进行估
计,求得回归方程; (2)对回归方程、参数估计值进行显著性检验; (3)利用回归方程进行分析、评价及预测。
最小二乘估计量的性质
最小二乘估计量的性质
(1)线性性, 即它是否是另一随机变量的线性 函数;
(2)无偏性, 即它的均值或期望值是否等于总 体的真实值;
(3)有效性, 即它是否在所有线性无偏估计量中具 有最小方差。
这三个准则也称作估计量的 小样本性质。 拥有这类性质的估计量称为 最佳线性无偏估计量 (best liner unbiased estimator, BLUE )。
度量拟合优度的指标: 判定系数(可决系 数) R2
1、总离差平方和的分解
已知由一组样本观测值( Xi,Yi),i=1,2…,n 得到如下样本回归直线
Y?i ? ??0 ? ??1 Xi
而Y的第i个观测值与样本均值的离差 yi ? Yi ? Y 可分解为两部分之和。
拟合优度检验
yi ? Yi ? Y ? (Yi ? Y?i ) ? (Y?i ? Y) ? ei ? y?i
将居民消费支出看成是其可支配收入的线性函
数时:
E(Y | Xi ) ? ? 0 ? ? 1 Xi
称为线性总体回归函数。 其中,?0,?1是未知参
数,称为 回归系数。
随机干扰项
随机干扰项
总体回归函数说明在给定的收入水平 Xi下,该社 区家庭平均的消费支出水平。但对某一个别的家庭,
其消费支出可能与该平均水平有偏差。
最小二乘估计量的性质
1、线性性 即估计量 ??0 、??1 是 Yi 的线性组合。
最小二乘估计量的性质
2、无偏性 即估计量 ??0 、??1 的均值(期望)等于
总体回归参数真值 ? 0与 ? 1 。
? ? E(??1 ) ? E(? 1 ? ki ? i ) ? ? 1 ? ki E(? i ) ? ? 1
差ei出发,对总体方差进行估计。
可以证明, ? 2的最小二乘估计量 为
? ??2 ?
ei2
n? 2
它是关于 ? 2的无偏估计量。
居民人均消费支出与人均GDP回归
§2.3 一元线性回归模型统计检验
? 一、拟合优度检验 ? 二、变量的显著性检验 ? 三、参数的置信区间
拟合优度检验
拟合优度检验:检验模型对样本观测值的 拟合程度。
i=1,2, …,n
一元线性回归模型的基本假设
假设4、随机误差项 ? 服从零均值、同方差、零
协方差的正态分布
? i ~ N(0,? 2 )
i=1,2, …,n
假设5:随着样本容量的无限增加,解释变量 X
的样本方差趋于一有限常数。即
? (Xi ? X)2 / n ? Q,
n? ?
假设6:回归模型是正确设定的
? ? E(??0 ) ? E(? 0 ? wi ? i ) ? E(? 0 ) ? wi E(? i ) ? ? 0
3、有效性 (最小方差性)即在所有线性无偏估计 量中,最小二乘估计量 ??0、??1 具有最小方差。
参数估计量的概率分布 和随机扰动项方差估计
参数估计量的概率分布
普通最小二乘估计量 ??0 、??1 分别是
拟合优度检验
TSS=ESS+RSS
Y的观测值围绕其均值的 总离差可分解为两部 分:一部分来自回归线 (ESS),另一部分则来自随机 势力(RSS)。在给定样本中, TSS不变,如果实际观 测点离样本回归线越近,则 ESS在TSS中占的比重 越大,因此
可决系数 R2 ? ESS ? 1 ? RSS
TSS

? i ? Yi ? E(Y | Xi )
称? i为观察值Yi围绕它的期望值 E(Y|Xi)的离差,是一
个不可观测的随机变量 ,又称为随机干扰项 或随机
误差项 。
随机干扰项
例2.1:个别家庭的消费支出为:
(*)
即,给定收入水平 Xi ,个别家庭的支出可表示为两 部分之和 :
(1)该收入水平下所有家庭的平均消费支出 E(Y|Xi),称为系统性或确定性部分 ,
相关分析与回归分析的相同点与不同点
相同点: 两者都是研究非确定性变量之间的统计依赖 关系,并能测度线性依赖程度的大小。
不同点: 一、变量间是否有因果关系 二、变量的对称性和随机性 三、预测性能
总体回归函数
总体回归函数
例2.1:一个假想的社区有100户家庭组成,要研究该社
区每月家庭消费支出Y与每月家庭可支配收入X的关系。 即 如果知道了家庭的月收入,能否预测该社区家庭的平均月消 费支出水平。为达到此目的,将该100户家庭划分为组内收 入差不多的10组,以分析每一收入组的家庭消费支出。
合,因此,??0 和 ??1 的概率分布取决于
Yi 的线性组
Y的分布特征

在 ?是正态分布的假设下,来自百度文库Y是正态分布,则
??0、 ??1 也服从正态分布,因此:
? ??1 ~ N(? 1,
?2
xi2 )
?? ??0 ~ N(? 0 , n
X
2 i
?
2)
xi2
随机扰动项方差估计
由于随机项 ? i不可观测,只能从 ? i的估计——残
2002 4950 11495 16445 19305 23870 25025
2900 1969 1991 2046 2068 2101 2189 2233 2244 2299 2310
3200 2090 2134 2178 2266 2354 2486 2552 2585 2640
21450 21285