电子课件 [统计学原理与实务(第3版)][曹印革][电子教案和习题解答] 第八章 抽样推断分析

  • 格式:ppt
  • 大小:681.50 KB
  • 文档页数:41

下载文档原格式

  / 41
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

(2)根据已给定的置信度,求抽样极限误差。具体步 骤是: 1.抽取样本,计算抽样指标,作为总体指标的估计值, 并计算样本标准差以推算抽样平均误差。 2.根据给定的置信度,查正态分布概率表求得概率度 值。 3.根据概率度和抽样平均误差推算抽样极限误差,并 根据抽样极限误差求出被估计总体指标的上、下限。
x X
x
x
Pp p Pp
由于总体指标是未知的,它要用实测的样本来估 计,因而极限抽样误差的实际意义是希望总体平均数 和总体成数落在根据抽样平均数(成数)所确定的范 围内。
因此上述不等式可推导为 :
x X x
x
x
pp P pp
(二)抽样推断的概率度 抽样极限误差与抽样平均误差的比值。
数理统计证明,当抽样总体的单位数足够大时,抽 样平均数和抽样成数都接近于以全及总体平均数或成数 为中心的正态分布,正态分布具有两个重要特征:
2.特点 (1)抽样推断是由部分推算总体的一种认识方法。 (2)抽样推断是建立在按随机原则抽取样本的基础上。 (3)抽样推断是运用概率估计的方法。 (4)抽样推断产生的误差可以事先计算、并加以控制。
二、抽样推断的作用 1.应用抽样推断法可对某些不可能或不容易进行全面 调查而又要了解其全面情况的社会经济现象进行数量 方面的统计分析。 2.应用抽样法可对全面调查的结果加以补充或订正。 3.应用抽样法可对生产过程中产品质量进行检查和控 制。 4.应用抽样推断法可对总体的某种假设进行检验,判 断假设的真伪。
样本平均数:
x x n
x xf f
样本标准差:
2
xx
s
n
2
xx f s
f
样本成数:
xp p
三、重复抽样和不重复抽样
1.重复抽样(重置抽样、回置抽样)。是指从总体N个单位中随 机抽取容量为n的样本时,每次从总体中抽取一个单位,把结果 登记下来后,重新返回,再从全及总体中抽取下一个样本单位。 一般地说,从总体N个单位中,随机抽取n个单位构成样本,则样 本可能数目为Nn个。
P —— 总体成数
(三)抽样平均误差的实际计算公式 1.平均数抽样平均误差
重复抽样条件下: 不重复抽样条件下:
当N很大时
x
2
nn
2 n N x n N 1
x
2
n
1
n N
2.成数的抽样平均误差
重复抽样条件下:
P1 P
p
n
不重复抽样条件下:
p
P 1 P N n
n N 1
解: 合格率: p 915 91.5% 1000
重复抽样条件下: p
p(1 p) 0.88% n
不重复抽样条件下:
p
p(1 p) (1 n ) 0.88%
n
N
四、抽样极限误差
(一)抽样极限误差 是指样本指标和总体指标之间抽样误差的可能范围。
xX x
p pP
上面等式可以变换为 : X
t 2 2 N
n
x N 2 t 2 2
x
t 2 P(1P)N np
N p2 t 2 P(1 P)
三、确定必要样本容量应注意的问题 1.必要抽样单位数应大于30 。 2.实际调查时可对计算的必要抽样单位数进行调整。 3.当总体单位数不多时,如果采用不重复抽样的方 法抽取样本单位时,必须应用不重复抽样的计算公 式计算必要的抽样单位数;当总体单位数很多时, 虽然采用不重复抽样方法,亦可采用重复抽样的计 算公式计算必要的抽样单位数。
4.当抽样调查是为了检验全面统计数字的质量时,全 及总体的标志变异指标或是有实际资料的,可以直接 代入公式计算必要的抽样单位数。 5.如有几个方差可以选用时,宜选择最大数值。对于 成数方差,如果没有资料时,可取其最大值0.25。 6.一个总体往往可以同时计算抽样平均数和抽样成数。 由于它们的方差和允许误差范围不同,因此,需要的 必要抽样单位数也不相同。为了防止由于样本单位数 不足而扩大抽样误差,在实际工作中往往根据比较大 的必要抽样单位数进行抽样,以满足共同的需要。
【例】从某厂生产的10000只日光灯管中随机抽取100只进行检 查,假如该产品平均使用寿命的标准差为100小时,试计算该 厂日光灯管平均使用寿命的平均误差。
解:在重复抽样条件下:
=10(小时)
xn
在不重复抽样条件下:
2 n
(1 ) 9.995(小Байду номын сангаас)
x nN
【例】从某厂生产的10000件产品中,随机抽取1000件进行 调查,测得有85件为不合格。试求产品合格率的抽样平均误 差。
第三节 抽样误差
一、抽样误差的概念 是指样本指标与总体指标之间的离差,具体
地讲,就是样本平均数与总体平均数的离差,或 样本成数与总体成数的离差。按照形成原因的不 同,分为登记性误差和代表性误差两种。

登记性误差(非抽样误差)



系统误差


代表性误差
随机误差(偶然性误差)
二、影响抽样误差的因素 1.样本容量n的大小。 2.总体内各单位被研究标志的变异程度。 3.抽样组织形式。 4.抽样方法。
(五)多阶段抽样 是把整个抽样过程分为若干个阶段,逐级抽出样本
单位。在大多数情况下,抽样调查都是针对一个极大的 总体进行的,在这种情况下,直接进行纯随机抽样是不 现实的。例如,在某省100多万农户中抽取1000户,调查 农户生产性投资情况,此时构造数百万人的名单就将是 一个非常浩大的工程。实际进行抽样时,可以多阶段抽 样法,具体如下。 第一阶段:从省内全部县中抽取5个县 第二阶段:从抽中的5个县中各抽4个乡 第三阶段:从抽中的20个乡中各抽5个村 第四阶段:从抽中的100个村中各抽10户 则样本单位数为:1000户
第八章 抽样推断分析
内容提要
本章包括抽样推断的含义、特点;几种常 见的抽样方式、方法和抽样推断的基本要 求;抽样误差的含义及各种抽样平均误差 的计算方法;总体指标的推断方法和必要 的样本单位数的确定方法。
第一节 抽样推断的概念和作用
一、抽样推断的概念和特点
1.抽样推断的概念 (1)从广义的角度理解,凡是抽取一部分单位进行观 察,根据观察结果来推断全体的都是抽样调查,可分 为随机抽样和非随机抽样两种。 (2)从狭义的角度理解,抽样推断是在抽样调查的基 础上,运用数理统计的原理,以被抽取部分单位的数 量特征为代表,从数量上对总体做出具有一定可靠程 度的估计与推断的一种统计分析方法。
2.不重复抽样(不重置抽样、不回置抽样)。是指从总体N个单 位中随机抽取容量为n的样本时,每次从总体中抽取一个单位, 不再放回去,下一次则从剩下的总体单位中继续进行抽取,如 此反复构成一个样本。 一般地讲,从总体N个单位中,随机不 重复抽取n个单位构成一样本,则样本可能数目为CNn个。
四、抽样方式
1.抽样指标高于或低于总体指标的概率分布是完全 对称的;
2.抽样平均数愈接近总体平均数,出现的可能性越 大,概率越大;反之,抽样平均数越离开总体平均数, 出现的可能性越小,概率越小,而趋于0。
由此可见抽样误差的概率就是概率度的函数。将这 种对应函数关系编成《正态分布概率表》给定的值,便 可以直接从表上查找抽样误差的概率,即估计置信度或 概率保证程度、把握程度。
第二节 抽样推断中的几个基本概念
一、全及总体和样本总体
1. 全及总体(简称总体或母体) 指所要认识的研究对象的全体,总体中的单位数通常用
“N”来表示,N总是很大的数,全及总体是唯一确定的。
2.样本总体(简称样本或子样) 是指从全及总体中按随机原则抽取的部分单位的集合体。
样本总体的单位数通常用 “n”表示,一般来说,样本单位数 达到或超过30称为大样本,而在30以下称为小样本。
二、总体指标和样本指标
1.总体指标也称为母体参数,它是根据全及总体各单位的标志 值或标志特征计算的,反映总体某种特征的综合指标。
总体平均数:
X X N
X Xf f
总体标准差:
2
XX
N
2
XX f
f
总体成数:
P N1 N
2.样本指标也称样本统计量,是根据抽样总 体中各单位的标志值或标志特征计算的综合指标。
注:极限误差与概率度和抽样平均误差三者之 间存在如下关系:
1.在平均误差保持不变的情况下,增大概率度 的值,把握程度相应增加,误差范围也随之扩大, 这时估计的精确度将降低;反之,要提高估计的精 确度,就得缩小概率度值,此时把握程度也会相应 降低。
2.在概率度保持不变的情况下,抽样平均误差 小,则误差范围就就小,估计的精确度就高;反之, 抽样平均误差大,误差范围就大,估计的精确度就 低。
谢谢!
第四节 必要样本容量的确定
一、影响样本容量的因素
1 1.总体被研究标志的变异程度
2
2.允许的抽样误差的大小
3
3.概率保证程度的高低
4 4.抽样调查的组织方式和方法
5 5.人力、物力和财力的允许条件
二、必要样本容量的计算
1.重复抽样条件下:
t 2 2
n
x
2
x
t 2 P(1P) np
p 2
2.不重复抽样条件下:
等距抽样示意图
(四)整群抽样 也称集团抽样、区域抽样,是将总体各单位按时
间或空间形式划分成许多群,然后按纯随机抽样或机 械抽样方式从中抽取部分群,对中选的所有单位进行 全面调查的抽样组织方式。
【例】假设某大学共有100个班级,每班都是30名学生, 总共有3000名学生,现要抽300学生作为样本进行调查, 如果采用整群抽样的方法,就不是直接去抽一个个的 学生,而是从学校100个班级中,采取简单随机抽样的 方法(或是类型抽样、等距抽样的方法)抽取10个班 级,然后由这10个班级的全体学生构成调查的样本。
当N很大时
p
P1 P (1 n )
n
N
计算抽样平均误差时要注意两点: 1.公式中的全及总体的标准差和成数,通常是不知 道的,一般通过以下方法解决。 (1)用样本的标准差和成数来代替,得到近似值; (2)可以用过去的经验资料; (3)还可以用试验资料 (4)成数标准差的最大值可以取为0.25。
2.不重复抽样误差总是小于重复抽样误差。
(三)等距抽样 也称机械抽样或系统抽样,是将总体各单位按某
一标志顺序排列,然后按固定顺序和相等距离或间隔 抽取样本单位的抽样组织方式,有两种形式:
1.无关标志排队。指排队的标志与总体单位标志值的 大小无关,抽样间隔为:
kN n
2.有关标志排队:指排队的标志与总体单位标 志值的大小有密切的关系,为增强抽样调查的代 表性,采取对称等距抽样的方法。
五、抽样估计的方法
(一)点估计 是以抽样指标数值直接作为总体指标估计值的一种估计方
法,判别标准有三个:
1.无偏性

2.一致性 3.有效性
lim P ˆ 1 n
D ˆ1 D ˆ2
(二)区间估计
1.涵义。根据一定的概率保证程度,利用抽样指标 和极限误差,推断总体指标可能存在的区间范围的 方法。
㈠简单随机抽样 也叫纯随机抽样,是按纯随机原则直接从总
体中抽取一部分单位来组成样本的抽样组织方式, 是抽样中最基本、最简单的抽样组织形式 ,有 三种具体做法:
1
1.直接抽选法
2
2.抽签法
3
3.随机数表法
(二)类型抽样 先对总体各单位按一定标志分类(层),然后再
从各类(层)中按随机原则抽取样本,组成一个样本 的抽样组织形式,类型抽样的样本单位数有三种分 配方法: 1.等数分配类型抽样 2.等比分配类型抽样 3.不等比例类型抽样
置信区间:(x
,x x
x)(p
p,p
p)
★区间估计的三要素是:估计值,误差范围,概率保证程度。
2.两种模式 (1)根据给定的抽样误差范围,求概率保证程度, 具体步骤是: 第一步,抽取样本,计算抽样平均数和抽样成数, 作为总体指标的估计值,并计算样本标准差,以此 计算抽样平均误差。 第二步,根据给定的抽样误差范围(极限误差), 估计总体指标的上限和下限。 第三步,根据抽样极限误差和抽样平均误差,计算 概率度的数值,查《正态分布概率表》,求出相应 的概率保证程度。
三、抽样平均误差 (一)涵义 指所有可能样本的抽样指标与总体的全及指标之
间的平均误差,是以全部可能样本指标为变量,以总 体指标为平均数计算得到的标准差,作为反映抽样误 差一般水平的指标。
(二)抽样平均误差的理论计算公式
2
xX
x
K
p P2
p
K
x—— 样本平均数
X—— 总体平均数
p—— 样本成数