高考总复习概率与统计

格式：ppt
大小：417.50 KB
文档页数：5

下载文档原格式

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

第十模块概率与统计第四十八讲随机抽样､用样本估计总体､变量间的相互关系､统计案例
回归课本
1.样本及抽样的定义
(1)在数理统计中称研究对象的全体为总体,组成总体的每一个基本单元为个体,从总体中抽取若干个个体x1,x2,…,xn, 这样的n个个体x1,x2,…,xn称为大小为n(容量为n)的一个样本.
方程为 yˆabx,则
我们将这个方程叫做回归直线方程,a,b叫做回归系数,相应的直线叫做回归直线.
(2)最小二乘法使离差平方和Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2为
最小的方法,叫做最小二乘法.
7.回归分析
n
xi yi nxy
(1)回归直线方程
y
=bx+a中,
(3)总体密度曲线如果样本容量不断增大,分组的组距不断缩小,则频率分布直
方图实际上越来越接近于总体在各小组内所取值的个数与总数比值的大小,它可以用一光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线. (4)茎叶图表示数据有两个突出的优点,其一是统计图上没有原始数据的损失,所有信息都可以从这个茎叶图中得到,其二是在比赛时随时记录,方便记录与表示.
1.(2010·重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本.若样本中的青年职工为7人,则样本容量为( )
A.7
B.15
C.25
D.35
解析:设样本容量为n,则依题意有 3 5 0 750
总体中所有个体的平均数叫做总体平均数.
样本中所有个体的平均数叫做样本平均数,如果在n个数据中
,x1出现了f1次,x2出现f2次,…,xk出现fk次(这里
f1+f2+…+fk=n),那么 x 1 叫做这n个数的加权平均数n .
(x1f1+x2f2+…+xkfk),
2样本方差,标准差设样本的元素为x1,x2,,xn,样本的
(2)抽样:抽样是为了获取总体的信息,特别在客观实际中对总体的全部个体逐一进行研究,有的是不适宜､不可能或不必要的.因此,抽样调查是获取总体信息的重要方法.
2.随机抽样 (1)简单随机抽样:从一个总体中通过逐个抽取的方法从中抽
取一个样本,且每次抽取时各个个体被抽到的概率相等,这样的抽样称为简单随机抽样.这样抽出的样本称为简单随机样本.简单随机抽样的基本方法有抽签法和随机数表法.
平均数为x,定义s2
1 n[(x1
x)2
(x2
x)2
(xn x)2],
s
1 n[(x1
x)2
(x2
x)2
(xn x)2],其中s2表示样本
方差,s表示样本标准差.
Fra Baidu bibliotek
5.两个变量的相关关系 (1)当自变量的取值一定时,因变量的取值带有随机性,这两
个变量之间的关系叫做相关关系. 如果一个变量的值由小变大时,另一个变量的值也在由小到
大,这种相关称为正相关;反之,如果一个变量的值由小变大时,另一个变量的值在由大到小,这种关系称为负相关. 变量间的这种关系与函数关系不同,它是一种非确定关系.
(2)散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图.
6.回归直线方程
(1)一般地,设x和y是具有相关关系的两个变量,且对应于n个观测值的n个点大致分布在一条直线的附近,若所求的直线
b
i1 n
xi2
2
nx
, a y bˆx,
i1
上述方程对应的直线叫做回归直线,而对两个变量所进行的
上述统计分析叫做线性回归分析.
相关系数
n
xi yi nxy
r
i1
xi2
2
nx
n
yi2
n
2
y
i1
i1
用相关系数来描述线性相关关系的强弱.当r>0时,两个变量正相关;当r<0时,两个变量负相关,r的绝对值越接近1,表明两个变量的线性相关性越强,r的绝对值接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于r0.05 时,认为两个变量有很强的线性相关关系,因而求回归直线方程才有意义.
(2)系统抽样:系统抽样被称为等距抽样或机械抽样.它按照时间或空间的等距间隔抽取样本,即将总体分成几个部分, 然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样称为系统抽样.系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时, 采用的是简单随机抽样.
(3)分层抽样:当总体中一部分个体与另一部分个体有明显的差异且易于区别时,常将相近的个体归成一组,然后按照各部分所占的比例进行抽样,这种抽样称为分层抽样.其中所分成的各部分称为层.分层抽样时,每一个个体被抽到的概率都是相等的.
(2)2×2列联表
一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2} 和{y1,y2},其样本频数列联表(称为2×2列联表)为
n(adbc)2
K2= (ab)(cd)(ac)(bd)
用它的大小
可以决定是否拒绝原来的统计假设H0,如果K2值较大,就拒
绝H0,即拒绝事件A与B无关.
考点陪练
3.频率分布表､频率分布直方图与茎叶图 (1)频率分布
样本中所有数据(或者数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或者数据组)的频率的分布变化规律叫做频率分布,可以用频率分布表､频率分布直方图､频率分布折线图､茎叶图等来表示.
(2)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.
数据点和它在回归直线上相应位置的差异(y1- y
i)是随机
误差效应,称e
y i=yi-
n
i为残差,将所得值平方后加起
来,用数学符号表示为 y
(yi-
i)2称为残差平
方和,它代表了随i 1机误差的效应.
8.独立性检验 (1)分类变量的定义如果某种变量的不同“值”表示个体所属的不同类别,像这
样的变量称为分类变量.
4.用样本的数字特征估计总体的数字特征 (1)众数,中位数,平均数在一组数据中,出现次数最多的数据叫做这组数据的众数. 将一组数据按大小依次排列,把处在中间位置的一个数据(或
中间两个数据的平均数)叫做这组数据的中位数.
如果n个数,x1,x2,…,xn,那么
x1 n
(x1+x2+…+xn)叫做这n个数的平均数.

高考总复习概率与统计

合集下载

相关主题

文档推荐

最新文档

高考总复习 概率与统计

合集下载

相关主题

文档推荐

最新文档

高考总复习概率与统计