统计学一元线性回归课后习题答案【精选】
- 格式:ppt
- 大小:523.01 KB
- 文档页数:53
第二章经典单方程计量经济学模型:一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。
同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的内容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=σ2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, σ2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n )仍满足基本假定。
求β1的最小二乘估计 解: 得:2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。
证明:∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ其中:即: ∑e i =0 ,∑e i X i =021112)ˆ()ˆ(i ni i ni ii e X Y Y Y Q β∑∑==-=-=01ˆˆˆˆi iii iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂2.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。
答:由于εi ~N(0, σ2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , σ2 ) 最大似然函数:使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。
同时发现使得Ln (L )最大就是使得下式最小,∑∑+-=-=nii i n i X Y Y Y Q 121021))ˆˆ(()ˆ(ββ上式恰好就是最小二乘估计的目标函数相同。
第十一章一元线性回归练习题答案二.填空题 1. 不能;因为该相关系数为样本计算出的相关系数,它的大小受样本数据波动的影响,它是否显著尚需检验;t 检验;2.图1;不能;因为图1反映的是线性相关关系,图2反映的是非线性性相关关系,相关系数只能反映线性相关变量间的相关性的强弱,不能反映非线性相关性的强弱。
三.计算题1.(1) SSR 的自由度是1,SSE 的自由度是18。
(2)2418/6080220/1/==-=SSE SSR F(3)判定系数%14.57140802===SST SSR R 在y 的总变差中,由57.14%的变差是由于x 的变动说引起的。
(4)7559.05714.02-=-=-=R r相关系数为-0.7559。
(5)线性关系显著和:线性关系不显著和y x y x H 10H :因为414.424=>=αF F,所以拒绝原假设,x 与y 之间的线性关系显著。
2.(1)方差分析表df SS MS F Significance F回归分析 1 425 425 85 0.017 残差 15 75 5 - - 总计16500---(2)判定系数%8585.05004252====SST SSR R表明在维护费用的变差中,有85%的变差可由使用年限来解释。
(3)9220.085.02===R r二者相关系数为0.9220,属于高度相关(4)x y248.1388.6ˆ+= 分布;显著。
的自由度为t n r n r t 2);12||2---=回归系数为1.248,表示每增加一个单位的产量,该行业的生产费用将平均增长1.248个单位。
(5)线性关系显著性检验:线性关系显著:生产费用和产量之间性关系不显著生产费用和产量之间线10:H H因为Significance F=0.017<05.0=α,所以线性关系显著。
(6)348.3120248.1388.6248.1388.6ˆ==⨯++=x y当产量为10时,生产费用为31.348万元。
一元线性回归模型一、单项选择题1、变量之间的关系可以分为两大类__________;AA 函数关系与相关关系B 线性相关关系和非线性相关关系C 正相关关系和负相关关系D 简单相关关系和复杂相关关系 2、相关关系是指__________;DA 变量间的非独立关系B 变量间的因果关系C 变量间的函数关系D 变量间不确定性的依存关系 3、进行相关分析时的两个变量__________;AA 都是随机变量B 都不是随机变量C 一个是随机变量,一个不是随机变量D 随机的或非随机都可以 4、表示x 和y 之间真实线性关系的是__________;CA 01ˆˆˆt tY X ββ=+ B 01()t t E Y X ββ=+ C 01t t t Y X u ββ=++ D 01t t Y X ββ=+5、参数β的估计量ˆβ具备有效性是指__________;B A ˆvar ()=0βB ˆvar ()β为最小C ˆ()0ββ-= D ˆ()ββ-为最小 6、对于01ˆˆi i iY X e ββ=++,以σˆ表示估计标准误差,Y ˆ表示回归值,则__________;B A i i ˆˆ0Y Y 0σ∑=时,(-)=B 2iiˆˆ0Y Y σ∑=时,(-)=0 C ii ˆˆ0Y Y σ∑=时,(-)为最小 D 2iiˆˆ0Y Yσ∑=时,(-)为最小 7、设样本回归模型为i 01i iˆˆY =X +e ββ+,则普通最小二乘法确定的i ˆβ的公式中,错误的是__________;DA ()()()i i 12iX X Y -Y ˆX X β--∑∑=B ()i iii122iin X Y -X Y ˆn X -X β∑∑∑∑∑=C ii122iX Y -nXY ˆX -nX β∑∑= D i i ii12xn X Y -X Y ˆβσ∑∑∑=8、对于i 01i iˆˆY =X +e ββ+,以ˆσ表示估计标准误差,r 表示相关系数,则有__________;D A ˆ0r=1σ=时, B ˆ0r=-1σ=时, C ˆ0r=0σ=时, D ˆ0r=1r=-1σ=时,或 9、产量X,台与单位产品成本Y,元/台之间的回归方程为ˆY356 1.5X -=,这说明__________;DA 产量每增加一台,单位产品成本增加356元B 产量每增加一台,单位产品成本减少元C 产量每增加一台,单位产品成本平均增加356元D 产量每增加一台,单位产品成本平均减少元10、在总体回归直线01ˆE Y X ββ+()=中,1β表示__________;B A 当X 增加一个单位时,Y 增加1β个单位 B 当X 增加一个单位时,Y 平均增加1β个单位 C 当Y 增加一个单位时,X 增加1β个单位 D 当Y 增加一个单位时,X 平均增加1β个单位11、对回归模型i 01i i Y X u ββ+=+进行检验时,通常假定i u 服从__________;CA 2i N 0) σ(, B t(n-2) C 2N 0)σ(, D t(n)12、以Y 表示实际观测值,ˆY表示回归估计值,则普通最小二乘法估计参数的准则是使__________;Di i 2i i i i 2i i ˆA Y Y 0ˆB Y Y 0ˆC Y Y ˆD Y Y ∑∑∑∑ (-)= (-)= (-)=最小 (-)=最小13、设Y 表示实际观测值,ˆY表示OLS 估计回归值,则下列哪项成立__________;D ˆˆA YY B Y Y ˆˆC YY D Y Y = = = =14、用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点_________;DˆA X Y B X YˆC X YD X Y (,) (,) (,) (,)15、以Y 表示实际观测值,ˆY表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01iˆˆˆY X ββ+=满足__________;A ii2i i 2i i 2i i ˆA Y Y 0B Y Y 0ˆC Y Y 0ˆD Y Y 0∑∑∑∑ (-)= (-)= (-)= (-)=16、用一组有30个观测值的样本估计模型i 01i i Y X u ββ+=+,在的显著性水平下对1β的显著性作t 检验,则1β显著地不等于零的条件是其统计量t 大于__________;D A 30 B 30 C 28 D 2817、已知某一直线回归方程的判定系数为,则解释变量与被解释变量间的线性相关系数为__________;BA B C D18、相关系数r 的取值范围是__________;DA r ≤-1B r ≥1C 0≤r ≤1D -1≤r ≤1 19、判定系数R 2的取值范围是__________;CA R2≤-1B R2≥1C 0≤R2≤1D -1≤R2≤120、某一特定的X 水平上,总体Y 分布的离散度越大,即σ2越大,则__________;AA 预测区间越宽,精度越低B 预测区间越宽,预测误差越小C 预测区间越窄,精度越高D 预测区间越窄,预测误差越大 22、如果X 和Y 在统计上独立,则相关系数等于__________;C A 1 B -1 C 0 D ∞23、根据决定系数R 2与F 统计量的关系可知,当R 2=1时,有__________;D A F =1 B F =-1 C F =0 D F =∞24、在C —D 生产函数βαK AL Y =中,__________;A A.α和β是弹性 和α是弹性 和β是弹性 是弹性25、回归模型i i i u X Y ++=10ββ中,关于检验010=β:H 所用的统计量)ˆ(ˆ111βββVar -,下列说法正确的是__________;DA 服从)(22-n χ B 服从)(1-n t C 服从)(12-n χ D 服从)(2-n t26、在二元线性回归模型i i i i u X X Y +++=22110βββ中,1β表示__________;A A 当X2不变时,X1每变动一个单位Y 的平均变动; B 当X1不变时,X2每变动一个单位Y 的平均变动; C 当X1和X2都保持不变时,Y 的平均变动;D 当X1和X2都变动一个单位时,Y 的平均变动;27、在双对数模型i i i u X Y ++=ln ln ln 10ββ中,1β的含义是__________;DA Y 关于X 的增长量B Y 关于X 的增长速度C Y 关于X 的边际倾向D Y 关于X 的弹性26、根据样本资料已估计得出人均消费支出Y 对人均收入X 的回归模型为i i X Y ln 75.000.2ln +=,这表明人均收入每增加1%,人均消费支出将增加__________;CA 2%B %C %D %28、按经典假设,线性回归模型中的解释变量应是非随机变量,且__________;A A 与随机误差项不相关 B 与残差项不相关 C 与被解释变量不相关 D 与回归值不相关29、根据判定系数R 2与F 统计量的关系可知,当R 2=1时有__________; C =1 =-1 =∞ =0 30、下面说法正确的是__________; DA.内生变量是非随机变量B.前定变量是随机变量C.外生变量是随机变量D.外生变量是非随机变量31、在具体的模型中,被认为是具有一定概率分布的随机变量是__________;A A.内生变量 B.外生变量 C.虚拟变量 D.前定变量 32、回归分析中定义的__________;B A.解释变量和被解释变量都是随机变量B.解释变量为非随机变量,被解释变量为随机变量C.解释变量和被解释变量都为非随机变量D.解释变量为随机变量,被解释变量为非随机变量33、计量经济模型中的被解释变量一定是__________;C A .控制变量 B .政策变量 C .内生变量 D .外生变量 二、多项选择题1、指出下列哪些现象是相关关系__________;ACDA 家庭消费支出与收入B 商品销售额与销售量、销售价格C 物价水平与商品需求量D 小麦高产与施肥量E 学习成绩总分与各门课程分数2、一元线性回归模型i 01i i Y X u ββ+=+的经典假设包括__________;ABCDEA ()0t E u =B 2var()t u σ=C cov(,)0t s u u =D (,)0t t Cov x u =E 2~(0,)t u N σ3、以Y 表示实际观测值,ˆY表示OLS 估计回归值,e 表示残差,则回归直线满足__________;ABEii2i i 2i i i i A X Y ˆB Y YˆC Y Y 0ˆD Y Y 0E cov(X ,e )=0∑∑∑∑ 通过样本均值点(,) = (-)= (-)= 4、ˆY 表示OLS 估计回归值,u 表示随机误差项,e 表示残差;如果Y 与X 为线性相关关系,则下列哪些是正确的__________;ACi 01ii1ii 01i i i1iii 01i A E Y X ˆˆB Y X ˆˆC Y X e ˆˆˆD YX e ˆˆE E(Y )X ββββββββββ+++++++ ()= = ===5、ˆY表示OLS 估计回归值,u 表示随机误差项;如果Y 与X 为线性相关关系,则下列哪些是正确的__________;BEi 01i i 01i ii1iii 01i ii1iA Y XB Y X u ˆˆC Y X u ˆˆˆD Y X u ˆˆˆE YX ββββββββββ+++++++ = =+ ===6、回归分析中估计回归参数的方法主要有__________;CDE A 相关系数法 B 方差分析法 C 最小二乘估计法 D 极大似然法 E 矩估计法7、用OLS 法估计模型i 01i i Y X u ββ+=+的参数,要使参数估计量为最佳线性无偏估计量,则要求__________;ABCDEA i E(u )=0B 2i Var(u )=σC i j Cov(u ,u )=0D i u 服从正态分布E X 为非随机变量,与随机误差项i u 不相关;8、假设线性回归模型满足全部基本假设,则其参数的估计量具备__________;CDE A 可靠性 B 合理性 C 线性 D 无偏性E 有效性9、普通最小二乘估计的直线具有以下特性__________;ABDE A 通过样本均值点(,)X YBˆii Y Y =∑∑C 2ˆ()0iiY Y-=∑ D 0ie =∑E (,)0i i Cov X e =10、由回归直线i 01iˆˆˆY X ββ+=估计出来的i ˆY 值__________;ADE A 是一组估计值 B 是一组平均值C 是一个几何级数D 可能等于实际值YE 与实际值Y 的离差之和等于零11、反映回归直线拟合优度的指标有__________; A 相关系数 B 回归系数C 样本决定系数D 回归方程的标准差E 剩余变差或残差平方和12、对于样本回归直线i 01i ˆˆˆY X ββ+=,回归变差可以表示为__________;ABCDE A 22i i i iˆY Y -Y Y ∑∑ (-) (-) B 221iiˆX X β∑(-) C 22ii R Y Y ∑(-)D 2iiˆYY ∑(-) E 1iiiiˆ X X Y Y β∑(-()-) 13对于样本回归直线i 01iˆˆˆY X ββ+=,ˆσ为估计标准差,下列决定系数的算式中,正确的有__________;ABCDEA 2i i 2iiˆY Y Y Y ∑∑(-)(-) B 2i i 2iiˆY Y 1Y Y ∑∑(-)-(-)C 221ii 2iiˆX X Y Y β∑∑(-)(-) D 1i ii i2i iˆX X Y Y Y Y β∑∑(-()-)(-)E 22iiˆn-2)1Y Y σ∑(-(-)14、下列相关系数的算式中,正确的有__________;ABCDE A X YXY XYσσ-BiiiiX YX X Y Y n σσ∑(-()-)C X Ycov (X,Y)σσDX X Y Y (-()-) E2X Y -nX Y∑15、判定系数R 2可表示为__________;BCEA 2RSSR =TSS B 2ESS R =TSSC 2RSS R =1-TSS D 2ESS R =1-TSS E 2ESS R =ESS+RSS16、线性回归模型的变通最小二乘估计的残差i e 满足__________;ACDEAi e 0∑= B i i e Y 0∑=C i iˆe Y0∑= D i ie X 0∑=E i i cov(X ,e )=017、调整后的判定系数2R 的正确表达式有__________;BCDA 2i i 2iiY Y /(n-1)ˆY Y /(n-k)∑∑(-)1-(-) B 2ii2iiˆY Y /(n-k-1)1Y Y /(n-1)∑∑(-)-(-)C 2(n-1)1(1-R )(n-k-1)- D 22k(1-R )R n-k-1-E 2(n-k)1(1+R )(n-1)- 18、对总体线性回归模型进行显著性检验时所用的F 统计量可表示为__________;BC AESS/(n-k)RSS/(k-1) B ESS/(k-1)RSS/(n-k)C 22R /(k-1)(1-R )/(n-k)D 22(1-R )/(n-k)R /(k-1) E 22R /(n-k)(1-R )/(k-1)三、名词解释函数关系与相关关系 线性回归模型总体回归模型与样本回归模型 最小二乘法高斯-马尔可夫定理 总变量总离差平方和 回归变差回归平方和 剩余变差残差平方和 估计标准误差 样本决定系数 相关系数 显著性检验 t 检验 经济预测 点预测 区间预测 拟合优度 残差 四、简答1、在计量经济模型中,为什么会存在随机误差项答:①模型中被忽略掉的影响因素造成的误差;②模型关系认定不准确造成的误差;③变量的测量误差;④随机因素;这些因素都被归并在随机误差项中考虑;因此,随机误差项是计量经济模型中不可缺少的一部分;2、古典线性回归模型的基本假定是什么答:①零均值假定;即在给定x t 的条件下,随机误差项的数学期望均值为0,即t E(u )=0;②同方差假定;误差项t u 的方差与t 无关,为一个常数;③无自相关假定;即不同的误差项相互独立;④解释变量与随机误差项不相关假定;⑤正态性假定,即假定误差项t u 服从均值为0,方差为2σ的正态分布;3、总体回归模型与样本回归模型的区别与联系;答:主要区别:①描述的对象不同;总体回归模型描述总体中变量y 与x 的相互关系,而样本回归模型描述所观测的样本中变量y 与x 的相互关系;②建立模型的不同;总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的;③模型性质不同;总体回归模型不是随机模型,样本回归模型是随机模型,它随着样本的改变而改变;主要联系:样本回归模型是总体回归模型的一个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型;4、试述回归分析与相关分析的联系和区别;答:两者的联系:①相关分析是回归分析的前提和基础;②回归分析是相关分析的深入和继续;③相关分析与回归分析的有关指标之间存在计算上的内在联系;两者的区别:①回归分析强调因果关系,相关分析不关心因果关系,所研究的两个变量是对等的;②对两个变量x 与y 而言,相关分析中:xy yx r r =;但在回归分析中,01ˆˆˆt ty b b x =++和01ˆˆˆt t xa a y =++却是两个完全不同的回归方程;③回归分析对资料的要求是:被解释变量y 是随机变量,解释变量x 是非随机变量;相关分析对资料的要求是两个变量都随机变量;5、在满足古典假定条件下,一元线性回归模型的普通最小二乘估计量有哪些统计性质答:①线性,是指参数估计量0ˆb 和1ˆb 分别为观测值t y 和随机误差项t u 的线性函数或线性组合;②无偏性,指参数估计量0ˆb 和1ˆb 的均值期望值分别等于总体参数0b 和1b ;③有效性最小方差性或最优性,指在所有的线性无偏估计量中,最小二乘估计量0ˆb 和1ˆb 的方差最小; 6、简述BLUE 的含义;答:在古典假定条件下,OLS 估计量0ˆb 和1ˆb 是参数0b 和1b 的最佳线性无偏估计量,即BLUE,这一结论就是著名的高斯-马尔可夫定理;7、对于多元线性回归模型,为什么在进行了总体显著性F 检验之后,还要对每个回归系数进行是否为0的t 检验答:多元线性回归模型的总体显著性F 检验是检验模型中全部解释变量对被解释变量的共同影响是否显著;通过了此F 检验,就可以说模型中的全部解释变量对被解释变量的共同影响是显著的,但却不能就此判定模型中的每一个解释变量对被解释变量的影响都是显著的;因此还需要就每个解释变量对被解释变量的影响是否显著进行检验,即进行t 检验;五、综合题X:年均汇率日元/美元 Y:汽车出口数量万辆 问题:1画出X 与Y 关系的散点图; 2计算X 与Y 的相关系数;其中X 129.3=,Y 554.2=,2X X 4432.1∑(-)=,2YY 68113.6∑(-)=,()()X X Y Y ∑--=16195.43若采用直线回归方程拟和出的模型为ˆ81.72 3.65YX =+ t 值 R 2= F=解释参数的经济意义; 解答:1散点图如下:30040050060070080100120140160180X Y2()()XY X X Y Y r --===3截距项表示当美元兑日元的汇率为0时日本的汽车出口量,这个数据没有实际意义;斜率项表示汽车出口量与美元兑换日元的汇率正相关,当美元兑换日元的汇率每上升1元,会引起日本汽车出口量上升万辆;2、已知一模型的最小二乘的回归结果如下:i iˆY =101.4-4.78X 标准差 n=30 R 2=其中,Y :政府债券价格百美元,X :利率%; 回答以下问题:1系数的符号是否正确,并说明理由;2为什么左边是iˆY 而不是Yi ; 3在此模型中是否漏了误差项u i ;4该模型参数的经济意义是什么;答:1系数的符号是正确的,政府债券的价格与利率是负相关关系,利率的上升会引起政府债券价格的下降;2 34常数项表示在X 取0时Y 的水平,本例中它没有实际意义;系数-表明利率X 每上升一个百分点,引起政府债券价格Y 降低478美元;3、估计消费函数模型i i i C =Y u αβ++得i i ˆC =150.81Y +t 值 n=19 R 2= 其中,C :消费元 Y :收入元已知0.025(19) 2.0930t =,0.05(19) 1.729t =,0.025(17) 2.1098t =,0.05(17) 1.7396t =; 问:1利用t 值检验参数β的显著性α=; 2确定参数β的标准差; 3判断一下该模型的拟合情况;答:1提出原假设H 0:0β=,H1:0β≠统计量t =,临界值0.025(17) 2.1098t =,由于>,故拒绝原假设H 0:0β=,即认为参数β是显著的;2由于ˆˆ()t sb ββ=,故ˆ0.81ˆ()0.043318.7sb t ββ===; 3回归模型R 2=,表明拟合优度较高,解释变量对被解释变量的解释能力为81%,即收入对消费的解释能力为81%,回归直线拟合观测点较为理想;4、已知估计回归模型得i iˆY =81.7230 3.6541X + 且2X X 4432.1∑(-)=,2Y Y 68113.6∑(-)=,求判定系数和相关系数; 答:判定系数:22122()()b X X R Y Y -=-∑∑=23.65414432.168113.6⨯==相关系数:0.9321r == 5、、有如下表数据1设横轴是U,纵轴是P ,画出散点图; 2对下面的菲力普斯曲线进行OLS 估计;1P u U αβ=++已知P3计算决定系数; 答:1散点图如下:27、根据容量n=30的样本观测值数据计算得到下列数据:22XY 146.5X 12.6Y 11.3X 164.2Y =,=,=,=,=134.6试估计Y 对X 的回归直线;8、表2-4中的数据是从某个行业5个不同的工厂收集的,请回答以下问题: 表2-4 总成本Y 与产量X 的数据Y80 44 51 70 61 X12 4 6 11 81估计这个行业的线性总成本函数:i 01iˆˆˆY =b +b X 201ˆˆb b 和的经济含义是什么3估计产量为10时的总成本;9、有10户家庭的收入X,元和消费Y,百元数据如表2-5; 表2-5 10户家庭的收入X 与消费Y 的资料X 20 30 33 40 15 13 26 38 3543 Y7 9 8 11 5 4 8 10 9 101建立消费Y 对收入X 的回归直线; 2说明回归直线的代表性及解释能力; 3在95%的置信度下检验参数的显著性;4在95%的置信度下,预测当X =45百元时,消费Y 的置信区间; 10、已知相关系数r =,估计标准ˆ8σ=误差,样本容量n=62; 求:1剩余变差;2决定系数;3总变差; 11、在相关和回归分析中,已知下列资料:222X Y i 16,10,n=20,r=0.9,(Y -Y)=2000σσ∑==1计算Y 对绵回归直线的斜率系数;2计算回归变差和剩余变差;3计算估计标准误差;12、已知:n=6,22i i i i i i X =21,Y =426,X =79,Y =30268,X Y =1481∑∑∑∑∑; 1计算相关系数;2建立Y 对的回归直线;3在5%的显著性水平上检验回归方程的显著性;13、根据对某企业销售额Y 以及相应价格X 的11组观测资料计算:22XY 117849X 519Y 217X 284958Y =,=,=,=,=490461估计销售额对价格的回归直线;2销售额的价格弹性是多少14、假设某国的货币供给量Y 与国民收入X 的历史如表2-6;图上;2如何解释回归系数的含义;3如果希望1997年国民收入达到15,那么应该把货币供给量定在什么水平15、假定有如下的回归结果 tt X Y 4795.06911.2ˆ-= 其中,Y 表示美国的咖啡消费量每天每人消费的杯数,X 表示咖啡的零售价格单位:美元/杯,t 表示时间;问:1这是一个时间序列回归还是横截面回归 做出回归线;2如何解释截距的意义它有经济含义吗如何解释斜率3能否救出真实的总体回归函数4根据需求的价格弹性定义: YX ⨯弹性=斜率,依据上述回归结果,你能救出对咖啡需求的价格弹性吗如果不能,计算此弹性还需要其他什么信息解答:1这是一个时间序列回归;图略2截距表示咖啡零售价在每磅0美元时,美国平均咖啡消费量为每天每人杯,这个没有明显的经济意义;斜率-表示咖啡零售价格与消费量负相关,表明咖啡价格每上升1美元,平均每天每人消费量减少杯;3不能;原因在于要了解全美国所有人的咖啡消费情况几乎是不可能的;4不能;在同一条需求曲线上不同点的价格弹性不同,若要求价格弹性,须给出具体的X 值及与之对应的Y 值;16、下面数据是依据10组X 和Y 的观察值得到的:李子奈书P181110=∑i Y ,1680=∑i X ,204200=∑i i Y X ,3154002=∑i X ,1333002=∑i Y 假定满足所有经典线性回归模型的假设,求10β,1β的估计值及其标准差;2决定系数2R ;3对0β,1β分别建立95%的置信区间;利用置信区间法,你可以接受零假设:01=β吗。
线性回归习题答案线性回归是统计学中一种常见的数据分析方法,用于建立自变量与因变量之间的线性关系模型。
在实际应用中,线性回归模型常用于预测、趋势分析和关联度分析等领域。
下面将通过一些典型的线性回归习题来探讨其应用。
习题一:某公司根据过去几年的销售数据,建立了一个线性回归模型来预测未来的销售额。
已知公司的广告费用与销售额之间存在着一定的线性关系。
根据模型,当广告费用为1000元时,预测的销售额为15000元。
求该模型的回归方程。
解答:假设回归方程为y = a + bx,其中y表示销售额,x表示广告费用。
根据已知条件,可以得到一个方程:15000 = a + 1000b。
进一步,如果再给出另外一个广告费用与销售额的数据点,就可以求解出回归方程的具体参数a和b。
习题二:某城市的房价与房屋面积之间存在一定的线性关系。
已知一套房子的面积为120平方米,根据线性回归模型预测其价格为80万元。
求该模型的回归方程。
解答:假设回归方程为y = a + bx,其中y表示房价,x表示房屋面积。
根据已知条件,可以得到一个方程:80 = a + 120b。
同样地,如果再给出另外一个房屋面积与价格的数据点,就可以求解出回归方程的具体参数a和b。
习题三:某公司根据市场调研数据,建立了一个线性回归模型来分析产品销售量与价格之间的关系。
已知当产品价格为10元时,预测的销售量为1000个。
根据该模型,求当产品价格为15元时的预测销售量。
解答:假设回归方程为y = a + bx,其中y表示销售量,x表示产品价格。
根据已知条件,可以得到一个方程:1000 = a + 10b。
根据该方程,可以求解出参数a和b的具体值。
然后,将x取15,代入回归方程中,即可得到当产品价格为15元时的预测销售量。
通过以上习题的解答,我们可以看到线性回归模型在实际问题中的应用。
通过建立合适的回归方程,我们可以通过已知的自变量值来预测因变量的取值。
这对于企业决策、市场分析以及经济预测等方面都具有重要意义。
第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=σ2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n 假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, σ2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n)仍满足基本假定。
求β1的最小二乘估计 解: 得:2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。
证明:其中:即: ∑e i =0 ,∑e i X i =0∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ21112)ˆ()ˆ(ini i ni i i e X Y Y Y Q β∑∑==-=-=01ˆˆˆˆi ii i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂2.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。
答:由于εi ~N(0, σ2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , σ2 ) 最大似然函数:使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。
同时发现使得Ln (L )最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。
值得注意的是:最大似然估计是在εi ~N (0, σ2 )的假设下求得,最小二乘估计则不要求分布假设。
第11章一元线性回归一、思考题1.解释相关关系的含义,说明相关关系的特点。
答:变量之间存在的不确定的数量关系,称为相关关系。
相关关系的特点:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。
对这种关系不确定的变量是不能用函数关系进行描述的。
2.相关分析主要解决哪些问题?答:相关分析就是对两个变量之间线性关系的描述与度量,它要解决的问题包括:(1)变量之间是否存在关系;(2)如果存在关系,它们之间是什么样的关系;(3)变量之间的关系强度如何;(4)样本所反映的变量之间的关系能否代表总体变量之间的关系。
3.相关分析中有哪些基本假定?答:在进行相关分析时,对总体主要有以下两个假定:(1)两个变量之间是线性关系;(2)两个变量都是随机变量。
4.简述相关系数的性质。
答:相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r 。
相关系数的性质:(1)r 的取值范围在-1~+1之间,即-1≤r ≤1。
若0<r ≤1,表明x 与y 之间存在正线性相关关系;若-1≤r <0,表明x 与y 之间存在负线性相关关系;若r =+1,表明x 与y 之间为完全正线性相关关系;若r =-1,表明x 与y 之间为完全负线性相关关系。
可见当|r |=1时,y 的取值完全依赖于x ,二者之间即为函数关系;当r =0时,说明y 的取值与x 无关,即二者之间不存在线性相关关系。
(2)r 具有对称性。
x 与y 之间的相关系数xy r 和y 与x 之间的相关系数yx r 相等,即xy r =yx r 。
(3)r 数值大小与x 和y 的原点及尺度无关。
改变x 和y 的数据原点及计量尺度,并不改变r 数值大小。
(4)r 仅仅是x 与y 之间线性关系的一个度量,它不能用于描述非线性关系。
第二章 一元线性回归分析思考与练习参考答案2.1 一元线性回归有哪些基本假定?答: 假设1、解释变量X 是确定性变量,Y 是随机变量;假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=σ2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, σ2 ) i=1,2, …,n2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n误差εi (i=1,2, …,n)仍满足基本假定。
求β1的最小二乘估计 解: 得:2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。
证明:∑∑+-=-=nii i ni X Y Y Y Q 121021))ˆˆ(()ˆ(ββ其中:即: ∑e i =0 ,∑e i X i =02.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。
21112)ˆ()ˆ(ini i n i i i e X Y Y Y Q β∑∑==-=-=01ˆˆˆˆi i i i iY X e Y Y ββ=+=-0100ˆˆQQββ∂∂==∂∂答:由于εi ~N(0, σ2 ) i=1,2, …,n所以Y i =β0 + β1X i + εi ~N (β0+β1X i , σ2 ) 最大似然函数:使得Ln (L )最大的0ˆβ,1ˆβ就是β0,β1的最大似然估计值。
同时发现使得Ln (L )最大就是使得下式最小,上式恰好就是最小二乘估计的目标函数相同。
值得注意的是:最大似然估计是在εi ~N (0, σ2 )的假设下求得,最小二乘估计则不要求分布假设。