回归分析的基本思想及其初步应用(第三课时)
- 格式:doc
- 大小:67.82 KB
- 文档页数:2
第42课时 回归分析基本思想及其初步应用( 三)学习目标:1、掌握线性回归模型与线性回归方程的关系及其参数、变量的意义;2、了解将非线性回归问题转化为线性回归问题的方法; 教学重点;非线性回归问题转化为线性回归问题的方法 教学难点:非线性回归问题转化为线性回归问题 教学工具:Powerpoint 、Excel 教学过程:(一) 复习引入1、(1))(∧∧+-=-=a x b y y y e i i i i i (i =1,2,……,n )称为相应于点(x i ,y i )的残差(residual ),它是随机误差e i =y i -(bx i +a ) (i =1,2,……,n )的估计值. (2)回归模型拟合效果评价①残差分析法:残差点比较均均地落在水平的带状区域中,说明选用的模型比较适合. 这样的带状区域越窄,说明模型的拟合精度越高,回归方程的预报精度越高.②相关指数法:定义相关指数∑∑==∧---=ni i ni i i y y y y R 12122)()(1, 其表示解释变量对预报变量变化的贡献率,R 2越接近1,表示回归效果越好.(二) 推进新课例1为了研究某种细菌随时间x (天)变化繁殖的个数,收集数据如右:(1)用天数作解释变量,繁殖个数为预报变量,作出这些数据的散点图; (2)描述解释变量与预报变量之间的关系,试建立y 关于x 回归方程. 解:根据收集的数据作出散点图.在散点图中,样本点并没有分布在某个带状区域内,因此两个变量不呈线性相关关系,不能直接利用线性回归模型来刻画两个变量之间的关系.根据已有的函数知识,可以发现样本点分布在某一条指数函数曲线xc ec y 21=的周围,其中21c c 和是待定参数.或者也可以认为样本点集中某二次曲线423c xc y +=的附近,其中43c c 和是待定参数.(方案一)若用xc ec y21=模型拟合,则令abx z c b c a y z+====时,21,ln ,ln 为线性直线的附近,因此可以且线性回归方程来拟合.由上表中的数据,用计算器或Excel 得到线性回归方程为:116.16902.0+=∧x z ,因此细菌繁殖个数关于天数的非线性回归方程为:116.16902.0+∧=x ey(方案二)若用423c xc y+=模型拟合,令2xt=,则43c t c y+=为线性回归模型,下面是布在一条直线的周围,因此不宜用线性回归方程来拟合它,即不宜用二次函数423c xc y +=来拟合y 和x 之间的关系.当然对于上表中的数据用计算器或Excel 也可以得到“线性回归”方程为:46.14096.5-='∧t y ,因此细菌繁殖个数关于天数的另一个非线性回归方程为:46.14096.52-='∧xy思考:怎样评价以上两个模型的拟合效果?其中∧e =116.16902.0+∧-=-x ey y y,)46.14096.5(2--='-='∧∧xy y y e从表中的残差∧e 、∧'e 可以看出,指数函数模型的|∧e |显然要比二次函数模型的|∧'e |小,因此指数函数模型拟合效果比二次函数模型的拟合效果好. 方法二:相关指数法下面给出两个回归模型的相关指数22,R R '计算由上面的残差分析法易知:54.6)(261612=-=∑∑=∧=∧i i i i i y y e ,73.1403)(261612='-='∑∑=∧=∧i i i i i y y e又因83.24642)(261=-∑=i i y y , 所以2R=9997.083.2464254.61=-,2R '=94304.083.2464273.14031=-显然22R R '>,因此指数函数模型拟合效果比二次函数模型的拟合效果好.知识形成:1、两个非线性相关回归模型确定 (1)画散点图;(2)观察图并根据经验判断适合何种模型; (3)恰当变换,转化成线性回归模型;(4)检验模型的拟合效果.(根据相关指数R 2越大,模型拟合精度越高来优选.)(三)典例分析1、对于下列非线性回归模型相应的回归方程,请做适当的变换,使成为线性回归方程;(1)y =cx 2+d ,令t =x 2,可得dct y+=∧;(2),c xk y +=令xt 1=,可得ckt y+=∧;(3),ln d x c y +=令x t ln =,可得dct y+=∧;(4))0(>=c ceydx,令ytln =,可得cdx tln +=∧;2、已知两个变量的非线性回归方程为xy22.1⨯=∧,则样本点(1,4)的残差为 1.6 .3、已知样本点(1,2.25)、(2,1.85)、(3,1.64)、(4,1.46)满足的回归模型,c xk y+=则通过变换变成线性回归模型后新的样本点的中心为( D )A (0.50,1.72)B (0.50,1.74)C (0.54,1.76)D (0.52,1.80) 4、如果用指数函数模型xc ec y 21=拟合原始模型,设yzln =,且(z x ,)为(165.25,3.99),则回归方程为( C )A 712.85849.0-=x e y B712.85849.0--=x ey C3295.10161.0+=x ey D3295.10161.0+-=x ey5、已知两相关变量 x ,y 的三组观测值如下表: 根据经验知y 对x 的回归模型为abxy+=2,试求出该回归方程.解:令t =x 2,则y 与t 的回归方程为y =bt +a . 相关数据为:则30431=∑=i i i y t ,338,667.7,667.8612===∑=i it y t所以有929.033261231≈-⨯-=∑∑==∧tt yt y t b i ii i ixb y a ∧∧-==-0.385,所以y 与t 的回归方程为385.0929.0-='∧t y ,由t =x 2得y 与x 的回归方程为385.0929.02-='∧x y(四)巩固练习P 导航66页T 1-4 (五)课时小结1非线性回归模型求解及拟合效果检验;2常见非线性回归模型变换为线性回归模型 (六)作业P 教材90页,T 2。
回归分析的基本思想及初步应用回归分析是一种用于研究变量之间关系的统计方法。
其基本思想是通过建立一个数学模型来描述自变量(独立变量)和因变量(依赖变量)之间的关系,并根据已有数据对模型进行拟合和估计,以了解两个变量之间的关系程度。
回归分析最早是由英国统计学家弗朗西斯·高尔顿在19世纪中叶提出的。
他注意到,人口增长与时间之间似乎存在其中一种关系,于是使用统计方法将时间作为自变量,人口数量作为因变量,建立了一个数学模型。
这个数学模型称为“回归方程”,后来成为了回归分析的基础。
在建模阶段,我们首先要确定自变量和因变量,并根据问题目标和已有数据选取适当的变量。
然后,我们需要选择一个适当的回归模型来描述自变量和因变量之间的关系。
常见的回归模型包括线性回归模型、多项式回归模型、指数回归模型等。
模型的选择通常基于对自变量和因变量之间关系的推测和理论的支持。
同时,还需要根据数据特点和拟合效果选择回归模型的阶数和形式。
在推断阶段,我们需要对模型进行估计和检验。
首先,我们使用已有数据对回归模型进行拟合,根据最小二乘法估计出回归系数的值,并计算出模型预测的因变量值。
然后,通过各种统计方法对模型的拟合程度进行评估。
常用的评估指标有残差分析、R平方和调整R平方等。
此外,还可以进行t检验和F检验来检验回归系数和模型整体的显著性。
这些检验能够帮助我们判断回归模型是否能够很好地描述自变量和因变量之间的关系,并对未来值进行预测和推断。
回归分析的应用非常广泛。
它在社会科学、经济学、医学、生态学等领域都有着重要的应用。
在经济学中,回归分析可以用于预测和解释宏观经济变量之间的关系,如GDP与就业率之间的关系。
在医学中,回归分析可以用于研究因素对疾病发生的影响,如吸烟与肺癌之间的关系。
此外,回归分析还可以用于分析市场需求、产品定价、销售预测等问题,为决策提供科学依据。
总而言之,回归分析是一种用于研究变量关系的重要统计方法。
通过建立数学模型,估计和检验回归系数,可以帮助我们了解变量之间的关系程度,并利用这种关系进行预测和推断。
回归分析的基本思想及其初步应用2 回归分析的基本思想及其初步应用教学要求:通过典型案例的探究,进一步了解回归分析的基本思想、方法及初步应用.教学重点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学难点:了解评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.教学过程:一、复习准备:1.由例1知,预报变量(体重)的值受解释变量(身高)或随机误差的影响.2.为了刻画预报变量(体重)的变化在多大程度上与解释变量(身高)有关?在多大程度上与随机误差有关?我们引入了评价回归效果的三个统计量:总偏差平方和、残差平方和、回归平方和.二、讲授新课:教学总偏差平方和、残差平方和、回归平方和:(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即 .残差平方和:回归值与样本值差的平方和,即 .回归平方和:相应回归值与样本均值差的平方和,即 .(2)学习要领:①注意、、的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即;③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数来刻画回归的效果,它表示解释变量对预报变量变化的贡献率. 的值越大,说明残差平方和越小,也就是说模型拟合的效果越好.2. 教学例题:例2 关于与有如下数据:2 4 5 6 830 40 605070为了对、两个变量进行统计分析,现有以下两种线性模型:,,试比较哪一个模型拟合的效果更好.分析:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论。
学校:临清二中 学科:数学 编写人:赵孝金 审稿人:马英济3.1.1回归分析的基本思想及其初步应用【教学目标】1.了解回归分析的基本思想方法及其简单应用. 2.会解释解释变量和预报变量的关系. 【教学重难点】教学重点:回归分析的应用.教学难点: a、b 公式的推到. 【教学过程】一、设置情境,引入课题引入:对于一组具有线性相关关系的数据112233(,),(,),(,),,(,).n n x y x y x y x y 其回归直线方程的截距和斜率的最小二乘法估计公式分别为:ay b x =- 121()()()nii i nii xx y y b xx ==--=-∑∑11nii x xn==∑ 11ni i y y n==∑(,)x y 称为样本点的中心。
如何推到着两个计算公式?二、引导探究,推出公式从已经学过的知识,截距 a和斜率b 分别是使21(,)()ni i i Q y x αββα==--∑取最小值时,αβ的值,由于212212211(,)[((]{[(2[([(][(]}[(2[([(](nii i nii i i i nnii i i i i Q yx y x y x yx y x y x y x y x y x yx y x y x y x y x n y x αββββαβββββαβαβββββαβα=====-----=---+-----+--=---+-----+--∑∑∑∑ )+))])])))])]))因为1111[((([(([(]([(]0,nnii i i i i nni i i i yx y x y x y x y x y x y x y x n y x y x n y n x n y x βββαβαβββαβββαββ====-----=-----=-----=-----=∑∑∑∑)])))]))))所以2212222111222221122111[([(]()2()()()(()()[()()](()[]()()()nii i nnnii i ii i i nnii i i ni i iinni i iii i Q yx y x n y x xx x x y y yy n y x xx y y x x y y n y x xx yy xx xx αββββαβββαβαβ==========---+--=----+-+------=--+---+---∑∑∑∑∑∑∑∑∑(,))])))1n=∑在上式中,后两项和,αβ无关,而前两项为非负数,因此要使Q 取得最小值,当且仅当前两项的值均为0.,既有121()()()nii i nii xx y y xx β==--=-∑∑ y x αβ=-通过上式推导,可以训练学生的计算能力,观察分析能力,能够很好训练学生数学能力,必须在老师引导下让学生自己推出。
第三章、统计案例3.1回归分析的基本思想及其初步应用(共计4课时) 授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。
二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。
2、过程与方法 本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R 的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。
3、情感、态度与价值观 通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。
加强与现实生活的联系,以科学的态度评价两个变量的相关系。
教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。
体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。
培养学生运用所学知识,解决实际问题的能力。
三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。
1.1回归分析的基本思想及其初步应用(第三课时)课型:新授 执笔:张一为 时间:2007-3-3学号:__________ 姓名:_____________教学目标:1.由“散点图”选择适当的数据模型,以拟合两个相关变量。
虽然任何两个变量的观测数据都可以用线性回归模型来拟合,但不能保证这种拟合模型对数据的拟合效果最好。
为更好地刻画两个变量之间的关系,要根据观测数据的特点来选择回归模型。
2.通过探究使学生认识到:有些 线性模型非线性模型转换−−→− ,即借助于线性回归模型研究呈非线性关系的两个变量之间的关系:⎩⎨⎧⇒⇒归模型来拟合数据作变换,在利用线性回区域分布在一个曲线状带形合数据;选用线性回归模型来拟区域分布在一个直线状带形散点图 ①如模型为:12ln 1212lnc x c z lnc x c lny e c y z y x c +=−−−−→−+=−−−→−==转换:令取自然对数②如模型为:212212c t c y c x c y t x +=−−−−→−+==转换:令3.初步体会不同模型拟合数据的效果。
计算不同模型的相关指数,通过比较相关指数的大小来比较不同模型的拟合效果。
(这只是模型比较的一种方法,还有其他方法。
)教学重点:体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。
教学难点:了解常用函数的图像特点,选择不同的模型建模,并通过比较相关指数(如“残差平方和”)对不同的模型进行比较优劣。
教学过程:1.回忆:建立模型的基本步骤;2.新课: (例2)①背景分析,画散点图;②观察散点图,分析解释变量与预报变量更可能是什么函数关系;③建立数学模型;④转换:将非线性模型通过变换转化成线性模型;⑤对数据进行变换后,对新数据建立线性模型,求出回归方程;⑥再转换:转化为原来变量的模型(方程),并计算相关指数(“残差平方和”或R 2),比较两个不同模型的拟合效果。
1.1.2回归分析的基本思想及其初步应用
第三课时
班别: 姓名: 学号: 等级:
[学习目标]
1、进一步了解回归分析的基本思想、方法及初步应用。
2、了解常用函数的图象特点,选择不同的模型建模,体会有些非线性模型通过变换可以转化为线性回归模型。
【自学指导】
仔细阅读课本P6例2——7页
1、回忆建立线性回归模型的大致步骤。
2、例2中为什么不能直接利用线性回归方程来建立两个变量之间的关系?
3、P7中的线性回归方程z=bx+a 是由哪个等式通过怎样变换得来的?
4、表1-4中的数据是怎么求得的?图1.1-6是由哪个表格中的数据得出来的?
5、表1-5中的数据是怎么求得的?图1.1-7是由哪个表格中的数据得出来的? 8分钟后比比谁能答对以上问题。
【课时小结】
这节课你有什么收获?
【活学活用】
1、有下列关系:(1)人的年龄与他(她)拥有的财富之间的关系;(2)曲线上的点与该点的坐标之间的关系;(3)苹果的产量与气候之间的关系;(4)森林中的同一种树木,其断面直径与高度之间的关系;(5)学生与他(她)的学号之间的关系,其中有相关关系的是
2、对于回归方程 4.75257y x =+,当x=28时,有y 估计值为________。
3、线性回归模型y=bx+a+e 中,b=_______,a=_________e 称为_________
4、 在两个变量的回归分析中,作散点图的目的是 。
5、如右表中给出五组数据(x,y ),从中选出四组使其线性相关最大,且保留第一组(-5,-3),那么,应去掉第 组。
【当堂检测】
必做题
1、回归直线方程为y=0.5x-0.81,则x=25时,y的估计值为
2、许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程如下ˆ0.8 4.6
=+,斜率的估计等于0.8说明y x
,成年人受过9年或更少教育的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数 (填充“大于0”或“小于0”)
选做题
假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:
x 2 3 4 5 6
y 22 38 55 65 70
若由资料可知y对x呈线性相关关系
试求:
(1)线性回归方程;
(2)估计使用年限为10年时,维修费用是多少?。