线性回归分析与统计案例PPT课件

  • 格式:pptx
  • 大小:1.68 MB
  • 文档页数:10

下载文档原格式

  / 10
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
线性回归分析与统计案例
-
1
…2018 考纲下载… 1.会作两个有关联变量的数据的散点图,会利用散点图认 识变量间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归方程系 数公式建立线性回归方程. 3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法 以及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计 a+c b+d a+b+c+d
构造一个随机变量 K2=(a+b)(cn+(da)d-(bac+)c2)(b+d),
其中 n=a+b+c+d 为样本容量.
(3)独立性检验. 利用随机变量 K2 来确定是否能有一定把握认为“两个分类 变量有关系”的方法称为两个分类变量的独立性检验.
4.(2018·河南开封一模)下列说法错误的是( ) A.自变量取值一定时,因变量的取值带有一定随机性的两 个变量之间的关系叫做相关关系 B.在线性回归分析中,相关系数 r 的值越大,变量间的相 关性越强 C.在残差图中,残差点分布的带状区域的宽度越狭窄,其 模型拟合的精度越高 D.在回归分析中,R2 为 0.98 的模型比 R2 为 0.80 的模型拟 合的效果好
(5)事件X,Y关系越密切,则由观测数据计算得到的K2的观 测值越大.
(6)由独立性检验可知,在犯错误的概率不超过1%的前提下 认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他 有99%的可能物理优秀.
答案 (1)× (2)√ (3)√ (4)× (5)√ (6)×
2.最小二乘法的原理是( )
答案 B 解析 根据相关关系的概念知 A 正确;当 r>0 时,r 越大, 相关性越强,当 r<0 时,r 越大,相关性越弱,故 B 不正确;对 于一组数据的拟合程度的好坏的评价,一是残差点分布的带状区 域越窄,拟合效果越好,二是 R2 越大,拟合效果越好,所以 R2 为 0.98 的模型比 R2 为 0.80 的模型拟合的效果好,C,D 正确, 故选 B.
独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别, 像这样的变量称为分类变量. (2)列联表:列出两个分类变量的频数表,称为列联表.假设 有两个分类变量 X 和 Y,它们的可能取值分别为{x1,x2}和{y1, y2},其样本频数列联表(称为 2×2 列联表)为
2×2 列联表
y1
3.(2018·江西赣州期末)已知变量 x,y 成负相关,且由观测
数据算得样本平均数x-=3,y-=3.5,则由该观测数据算得的线性
回归方程可能是( )
A.y=0.4x+2.3
B.y=2x+2.4
C.y=-2x+9.5
D.y=-0.4x+4.4
答案 C 解析 由已知,变量 x,y 成负相关,排除 A,B.∵回归直线 必过点(x-,y-),经验算可知,选项 C 满足.

直线方程: y =0.254x+0.321.由回归直线方程可知,家庭年收入 每增加1万元,年饮食支出平均增加________万元.
答案 0.254 解析 由题意知,[0.254(x+1) +0.321] -(0.254x+0.321) = 0.254.
(x-,y-)称为样本点的中心点.
(3)回归分析:对具有相关关系的两个变量进行统计分析的一 种常用方法.
(4源自文库相关系数.
①r=

②当 r>0 时,表明两个变量正相关; 当 r<0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0 时,表明两个变量之间几乎不存在线性相关 关系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性.
n
A.使得∑[yi-(a+bxi)]最小 i=1
n
B.使得∑[yi-(a+bxi)2]最小 i=1
n
C.使得∑[yi2-(a+bxi)2]最小 i=1
n
D.使得∑[yi-(a+bxi)]2 最小 i=1
答案 D
解析 根据回归方程表示到各点距离之和最小的直线方程,
n
即总体偏差最小,亦即∑[yi-(a+bxi)]2 最小. i=1
请注意 1.以考查线性回归系数为主,同时可考查利用散点图判断 两个变量间的相关关系. 2.以实际生活为背景,重在考查回归方程的求法.
课前自助餐
-
4
两个变量的线性相关 (1)正相关. 在散点图中,点散布在从左下角到右上角的区域.对于两 个变量的这种相关关系,我们将它们称为正相关. (2)负相关. 在散点图中,点散布在从左上角到右下角的区域,两个变 量的这种相关关系称为负相关.
5.在一项打鼾与患心脏病的调查中,共调查了 1 671 人,经 过计算得 K2=27.63,根据这一数据分析,我们有理由认为打鼾 与患心脏病是____________的(有关,无关).
答案 有关 解析 K2>10.828 就有 99.9%的理由认为两个量是有关的.
6.(2018·衡水中学调研卷)调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与 年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归
1.判断下面结论是否正确(打“√”或“×”). (1)相关关系与函数关系都是一种确定性的关系,也是一种 因果关系. (2)“名师出高徒”可以解释为教师的教学水平与学生的水 平成正相关关系. (3)只有两个变量有相关关系,所得的回归模型才有预测价 值.
(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得 回归方程∧y =-2.352x+147.767,则气温为2 ℃时,一定可卖出 143杯热饮.
(3)线性相关关系、回归直线. 如果散点图中点的分布从整体上看大致在一条直线附近,就 称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
回归方程 (1)最小二乘法.求回归直线使得样本数据的点到回归直线的 距离平方和最小的方法叫做最小二乘法.
(2)回归方程. 方程∧y =∧b x+∧a 是两个具有线性相关关系的变量的一组数据 (x1,y1),(x2,y2),…,(xn,yn)的回归方程,其中∧a ,∧b 是待定 参数.