回归模型的建立和分析

  • 格式:ppt
  • 大小:492.50 KB
  • 文档页数:18

下载文档原格式

  / 18
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(8 分 )
^ yi ^ ei
6.443
11.101 19.125 32.950 56.770 128.381 290.325
9.23 -13.381 34.675
0.557 -0.101 1.875 -8.950
(10分) (3)当x=40时,y=e0.272x-3.849≈1 131. (12分)
y
n
6.06
12.09
24.09
48.04
95.77
190.9
6
12
25
n
49
2
95
n
190
2 2 ˆ ˆ e ( y y ) i i i 3.1643, i=1 i 1
n
2 2 ( y y ) y ny 25553.3. i i i 1 i=1
3.1643 R 1 0.9999. 25553.3
解:(1)散点图如右所示
天数
(2)由散点图看出样本点分布在一条指数函数C y= eC2 x 1 的周围,于是令Z=lny,则 x Z
1 1.79
2
2.48
3
3.22
4
3.89
5
4.55
6
5.25
0.69x 1.112 ˆ ˆ y =e 由计数器算得 Z=0.69X 1.112 则有
( 3)
ˆ ywk.baidu.com
小结
解决非线性回归问题的方法及步骤
(1)确定变量:确定解释变量为x,预报变量为y; (2)画散点图:通过观察散点图并与学过的函数(幂、指数、
对数函数、二次函数)作比较,选取拟合效果好的函数模型;
(3)变量置换:通过变量置换把非线性问题转化为线性回归问 题;
(4)分析拟合效果:通过计算相关指数等来判断拟合效果;
2
回归模型的拟合效果较好.
(3)由残差表中的数值可以看出第3个样本点的残差比较大,
需要确认在采集这个数据的时候是否有人为的错误,如果 有的话,需要纠正数据,重新建立回归模型;由表中数据 可以看出残差点比较均匀地落在不超过0.15的狭窄的水平 带状区域中,说明选用的线性回归模型的精度较高,由以
上分析可知,弹簧长度与拉力成线性关系.
yi-^ yi yi-- y
6
0.05
0.005
-0.08 -0.045 0.41
0.04 1.41
0.025 2.31
-2.24 -1.37 -0.54
2 6
所以 (yi-^ y i) ≈0.013 18, (yi-- y )2=14.678 4.
i=1 i=1
0.013 18 所以,R =1- ≈0.999 1, 14.678 4
残差点比较均匀地落在水平的带状区域内,说明选 残差 用的模型比较适合,这样的带状区域的宽度越窄, 图法 说明模型拟合精度越高
残差平 方和
越小 , i=1 残差平方和为__________ ,残差平方和_____ 模型拟合效果越好
y )2 (yi-^
n
i=1
y i 2 yi-^
n
n
相关指 数R2
规律方法 当资料点较少时,也可以利用残差表进行残差 分析,注意计算数据要认真细心,残差分析要全面.
【例2】 下表为收集到的一组数据:
x y 21 7 23 11 25 21 27 24 29 66 32 115 35 325
(1)作出x与y的散点图,并猜测x与y之间的关系; (2)建立x与y的关系,预报回归模型并计算残差; (3)利用所得模型,预报x=40时y的值. 审题指导 (1)画出散点图或进行相关性检验,确定两变
10
8.12
15
8.95
20
9.90
25
10.9
30
11.8
(1)作出散点图并求线性回归方程; (2)求出R2; (3)进行残差分析.
[思路探索] 作残差分析时,一般从以下几个方面予以说
明:(1)散点图;(2)相关指数;(3)残差图中的异常点和样 本点的带状分布区域的宽窄.
[自主解答] (1)散点图如图
课题导入
前面我们已经初步学习了线性回归分析这节课我们继 续来对回归模型的建立和分析做一些探讨
本节课我们将介绍相关知识
目标引领
了解随机误差、残差、残差分析的概念; 会用残差分析判断线性回归模型的拟合效 果; 掌握建立回归模型的步骤; 通过对典型案例的探究,了解回归分析的 基本思想方法和初步应用.
1 - x = (5+10+ 15+ 20+25+30)=17.5, 6 1 - y = (7.25+ 8.12+ 8.95+ 9.90+10.9+11.8)≈9.487, 6 x2 i =2 i=1

6
275, xiyi= 1 076.2
i=1
6
计算得,^ b ≈0.183,^ a ≈6.285, 所求回归直线方程为^ y =0.183x+6.285. (2)列表如下:

独立自 学
回归分析 1.
相关关系 的两个变量进行统计分析的一 回归分析是对具有_________ 种常用方法. 线性回归模型 2. (1)由散点图易发现,样本点散布在某一条直线附近,而不
是一条直线上,不能用一次函数y=bx+a描述它们之间的
关系,因此用线性回归模型y=bx+a+e来表示,其中a、b 随机误差 . 为未知参数,e为_________
的非线性回归方程了,数据可以转化为:
x z
21
23
25
27
29
32
35
1.946 2.398 3.045 3.178 4.190 4.745 5.784
求得回归直线方程为^ z =0.272x-3.849, ∴^ y =e0.272x- 3.849. 残差
yi 7 11 21 24 66 115 325
2
即解释变量天数对预报变量繁殖细菌得个数解释了99.99%.
强化补清

完成教材全解相关内容
当堂诊学 为了研究某种细菌随时间 x 变化,繁殖的个数,收
集数据如下:
天数x/ 天
繁殖个数 y/个
1 6
2 12
3 25
4 49
5
95
6 190
(1)用天数作解释变量,繁殖个数作预报变量,作出这些 数据的散点图; 繁殖个数 (2) 描述解释变量与预报变量 之间的关系; (3) 计算残差、相关指数R2.
R2 = 1 -
解释 变量对 , R2 表示 _____
i=1
y 2 yi--
预报 变量变化的贡献率,R2 越接近于 1,表 _____ 示回归的效果越好
引导探究
【例1】 为研究重量x(单位:克)对弹簧长度y(单位:厘米)的影 响,对不同重量的6个物体进行测量,数据如下表所示:
x
y
5
7.25
3.刻画回归效果的方式
^i)是随 数据点和它在回归直线上相应位置的差异(yi-y ^i=yi-y ^i 为残差, ^i 称为相应于点(xi, 机误差 .称e e yi)的
残差
n
残差.

i =1
^i)2 称为残差平方和 (yi-y
残差 图
残差, 利用图形来分析残差特性,作图时纵坐标为_____ 样本编号 ,或_________ 身高数据 ,或 横坐标可以选为_________ 体重估计值 等,这样作出的图形称为残差图 ___________
(5)写出非线性回归方程.
目标升华:
一般地,建立回归模型的基本步骤为:
(1)确定研究对象,明确哪个变量是解释变量,哪个变量 是预报变量。 (2)画出确定好的解释变量和预报变量的散点图,观察它 们之间的关系(如是否存在线性关系等)。 (3)由经验确定回归方程的类型(如我们观察到数据呈线 性关系,则选用线性回归方程y=bx+a). (4)按一定规则估计回归方程中的参数(如最小二乘法)。 (5)得出结果后分析残差图是否有异常(个别数据对应 残差过大,或残差呈现不随机的规律性,等等),过存在 异常,则检查数据是否有误,或模型是否合适等。
量x、y是否线性相关.由散点图得x、y之间的回归模型.
(2)进行拟合,预报回归模型,求回归方程.
[规范解答] (1)作出散点图如下图,从散点图可以看出x与y
不具有线性相关关系,根据已有知识可以发现样本点分布
在某一条指数函数曲线y=c1ec2x的周围,其中c1、c2为待 定的参数. (4分)
(2)对两边取对数把指数关系变为线性关系,令z=ln y,则 有变换后的样本点应分布在直线z=bx+a,(a=ln c1,b= c2)的周围,这样就可以利用线性回归模型来建立y与x之间