第6章 抽样推断
- 格式:ppt
- 大小:15.32 MB
- 文档页数:105
第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
第六章抽样推断二、单项选择题1.抽样平均误差是( A )。
A.抽样指标的标准差B.总体参数的标准差C.样本变量的函数D.总体变量的函数2.抽样调查所必须遵循的基本原则是( B )。
A.准确性原则B.随机性原则C.可靠性原则D.灵活性原则3.在简单随机重复抽样条件下,当抽样平均误差缩小为原来的1/2时,则样本单位数为原来的( C )。
A.2倍B.3倍C.4倍D.1/4倍4.按随机原则直接从总体N个单位中抽取n个单位作为样本,这种抽样组织形式是( A )。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样5.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为( C ) 。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样6.在一定的抽样平均误差条件下( A )。
A.扩大极限误差范围,可以提高推断的可靠程度B.扩大极限误差范围,会降低推断的可靠程度C.缩小极限误差范围,可以提高推断的可靠程度D.缩小极限误差范围,不改变推断的可靠程度7.映样本指标与总体指标之间的平均误差程度的指标是( C )。
A,平均数离差 B,概率度C,抽样平均误差 D,抽样极限误差8 以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标值本身,这一标准称为( A )。
A.无偏性B.一致性C.有效性D.准确性9.在其他条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( B )。
A.随之扩大B.随之缩小C.保持不变D.无法确定10.对某种连续生产的产品进行质量检验,要求每隔一小时抽出10分钟的产品进行检验,这种抽查方式是( D )。
A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样三、多项选择题1.抽样推断的特点是(ABCE) 。
A.由推算认识总体的一种认识方法B.按随机原则抽取样板单位C.运用概率估计的方法D.可以计算,但不能控制抽样误差E.可以计算并控制抽样误差2. 抽样估计中的抽样误差(ACE) 。
第6章抽样推断统计试题习题一、单选题1.抽样调查的目的在于()。
A、了解总体的基本情况B、用样本指标推断总体指标C、对样本进行全面调查D、了解样本基本情况2.在抽样推断中,必须遵循()抽取样本。
A、随意原则B、随机原则C、可比原则D、对等原则3.某企业连续性生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是()。
A、整群抽样B、简单随机抽样C、类型抽样D、等距抽样4.置信区间的大小表达了区间估计的()。
A、可靠性B、准确性C、显著性D、及时性5.为提高类型抽样的效果,应当合理分组,尽可能做到()。
A、缩小组内和组间的差异B、扩大组内和组间的差异C、缩小组内差异,扩大组间差异D、扩大组内差异,缩小组间差异6.为提高整群抽样的效果,应当合理分群,尽可能使()。
A、群内和群间的差异扩大B、群内和群间的差异缩小C、群内差异缩小,群间差异扩大D、群内差异扩大,群间差异缩小7.在重复的简单随机抽样中,当概率保证度(置信度)从68.27%提高到95.45%时(其他条件不变),必要的样本容量将会()。
A、增加1倍B、增加2倍C、增加3倍D、减少一半8.在其他条件不变的情况下,抽样单位数目增加一半,则抽样平均误差()。
A、缩小为原来的81.6%B、缩小为原来的50%C、缩小为原来的25%D、扩大为原来的4倍9.当置信水平一定时,置信区间的宽度()。
A、随样本量的增大而减小B、随样本容量的增大而增大C、与样本量的大小无关D、与样本量的平方根成正比10.一个95%的置信区间是指()。
A、总体参数有95%的概率落在这一区间B、总体参数有5%的概率为落在这一区间内C、在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D、在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数11.当正态总体的方差未知,且为小样本的条件下,估计总体均值使用的分布为()。
统计试题A、正态分布B、t分布C、2分布D、F分布12.当正态总体的方差未知,在大样本的条件下,估计总体均值使用的分布是()。
第六章抽样推断一、单项选择题1. 抽样调查的主要目的在于()。
A。
计算和控制误差 B. 了解总体单位情况C. 用样本来推断总体 D。
对调查单位作深入的研究2。
抽样调查所必须遵循的基本原则是( ).A. 随意原则 B。
可比性原则C. 准确性原则 D. 随机原则3。
下列属于抽样调查的事项有( )。
A. 为了测定车间的工时损失,对车间的每三班工人中的第一班工人进行调查B。
为了解某大学生食堂卫生状况,对该校的一个食堂进行了调查C。
对某城市居民1%的家庭调查,以便研究该城市居民的消费水平D。
对某公司三个分厂中的第一个分厂进行调查,以便研究该工厂的能源利用效果4。
无偏性是指().A。
抽样指标等于总体指标 B. 样本平均数的平均数等于总体平均数C。
样本平均数等于总体平均数 D. 样本成数等于总体成数5。
一致性是指当样本的单位数充分大时,抽样指标( )。
A。
小于总体指标 B. 等于总体指标C. 大于总体指标 D. 充分靠近总体指标6. 有效性是指作为优良估计量的方差与其他估计量的方差相比,有( )。
A。
前者小于后者 B. 前者大于后者C。
两者相等 D。
两者不等7。
能够事先加以计算和控制的误差是( )。
A。
抽样误差 B。
登记误差C。
代表性误差 D. 系统性误差8.对两个工厂工人平均工资进行不重复的随机抽样调查,抽查的工人人数一样,两工厂工人工资方差相同,但第二个厂工人数比第一个厂工人数整整多一倍.抽样平均误差()。
A。
第一工厂大 B。
第二个工厂大C. 两工厂一样大 D. 无法做出结论9。
抽样平均误差是指抽样平均数(或抽样成数)的()。
A. 平均数 B。
平均差C. 标准差 D. 标准差系数10.在同样情况下,不重复抽样的抽样平均误差与重复抽样的抽样平均误差相比,是( ).A。
两者相等 B。
两者不等C。
前者小于后者 D. 前者大于后者。
11。
反映抽样指标与总体指标之间抽样的可能范围的指标是()。
A。
抽样平均误差 B. 抽样误差系数C. 概率度 D. 抽样极限误差。
第六章 抽样推断一、本章学习要点(一)总体参数,也称总量指标,是由总体各单位标志值计算而来的,样本统计量则由样本各单位标志值计算而来的指标。
通常有平均数、标准差、成数等。
重复抽样与不重复抽样的样本统计量分布是不同的。
如果样本的n 个个体完全来自于某一正态总体N (X ,2σ),则当方差已知时,样本均值服从正态分布;如果总体方差未知,则样本均值服从t (n-1)分布,且对于大样本,样本均值趋于正态分布。
即使总体分布未知,根据中心极限定理,大样本下的样本均值近似服从正态分布。
对于大样本,样本成数同样趋于服从正态分布。
(二)抽样估计就是利用样本指标值来估计相应总体指标的数值,又称参数估计,它有点估计和区间估计两种。
点估计就是用样本指标的实际值直接作为相应总体参数的估计值,如X =x ,区间估计就是根据给定的概率保证度,利用实际资料计算出总体参数的估计区间(上限和下限),并以这一区间作为总体参数的估计值。
优良估计量应该满足无偏性、一致性、有效性。
抽样误差有几种不同的形式。
实际抽样误差是指样本统计量所得的抽样统计值与总体参数真值之间的绝对离差;抽样平均误差(抽样标准误差)是样本统计量抽样分布的标准差。
通常有用x μ、p μ或者σ(x )、σ(p )表示;抽样极限误差是指以样本统计量统计总体参数时所允许的最大误差范围。
通常用 x ∆或 p ∆ 表示。
影响抽样误差的因素有:总体内在差异程度、样本容量、抽样方法、抽样组织形式。
抽样极限误差Δ与抽样标准误差μ 所得的相对数称抽样误差的概率度,用t 表示。
xx t μ∆= 或pp t μ∆= ,它是测定抽样估计可靠程度的一个参数。
(三)不同抽样组织形成的含义、要求、效果及估计方法是不同的,具体表现为点估计值、抽样标准误差及样本容量的计算公式不同。
其中最基本的是简单随机抽样,下表给出了二、本章思考题及练习题(一) 填空题1.抽样推断是按照,从总体中抽取样本,然后以样本的观察结果来估计总体的数量特征。
第六章抽样推断简答题1.什么是抽样推断?有何特点?简述其作用。
抽样推断:是按照随机的原则,在抽样调查的基础上,利用样本实际资料计算样本指标,并推断总体相应指标数值的统计方法。
特点:(1)是一种由部分认识总体的统计方法(2)抽取样本时按随机性原则抽取的(3)是用样本指标从数量上推断总体指标(4)抽样误差是不可避免的,但可以计算和控制作用:(1)在无法或很困难进行全面调查的情况下,可以应用抽样法来了解全面情况;(2)应用抽样法不但比全面调查有更大的优越性,并可对全面调查的结果加以补充和订正;(3)用于生产过程中产品质量的检查和控制;(4)可以对总体的某种假设进行检验。
2.什么是抽样误差?影响抽样误差大小的各因素与抽样误差的关系如何?抽样误差:是样本指标与总体指标之间的平均离差。
影响因素:(1)在其他条件一定时,总体的变异程度与抽样误差成正比关系。
(2)在其他条件一定时,样本单位数与抽样误差成反比关系。
(3)在其他条件一定时,重复抽样的抽样误差大于不重复抽样的抽样误差。
(4)在其他条件一定时,所选择的组织方式不同,抽样误差的大小不同。
3.影响抽样单位数目的各因素与抽样单位数目的关系如何?(1)在其他条件一定时,总体的变异程度与抽样单位数成正比关系。
(2)在其他条件一定时,概率保证程度与抽样单位数成正比关系。
(3)在其他条件一定时,极限误差大小与抽样单位数成反比关系。
(4)在其他条件一定时,所选择的组织方式不同,需要的抽样单位数目也不相同。
(5)在其他条件一定时,重复抽样所需要的抽样单位数大于不重复抽样。
4.简要说明各种抽样组织方式有什么特点?(1)简单随机抽样:是抽样中最基本、最单纯的方式,它是按随机的原则直接从总体中抽取样本单位,适用于均匀总体。
这种抽样方式在理论上最符合随机原则,它的抽样误差容易得到理论上的论证,因此可以作为其他更复杂的抽样设计的基础,同时也是衡量其他抽样方式抽样效果的比较标准。
但在实践上受到许多限制,如当总体很大时,要首先对每个单位加以编号,就有很大困难;又如对于正在继续生产的产品加以编号是不可能的,在这种情况下,就不能用简单随机抽样。
第六章抽样推断一、填空题1.抽样推断是按照原则,从全部研究对象中抽取部分单位进行调查.2.抽样推断的组织方式有抽样、抽样、等距抽样、整群抽样和抽样.3.抽样推断是用指标推断总体指标的一种统计方法.4.抽样平均误差与极限误差之间的关系为 .5.抽样极限误差是指指标和指标之间最大可能的误差范围.二、判断题1.抽样推断的目的是用样本指标从数量上推断全及总体指标.2.对各种不同型号的电冰箱进行使用寿命的检查,最好的方法是抽样推断.3.为了保证抽样指标的分布趋近于正态分布,抽样时,一般样本容量应大于或等于30,这时的样本称为大样本.4.某厂产品质量检查,按连续生产时间顺序每20小时抽取1小时的全部产品进行检验,这种方式是等距抽样.5.在其他条件一定时,重复抽样的抽样平均误差大于不重复抽样的抽样平均误差.6.抽样平均误差是样本指标与总体指标之间的平均离差.7.在抽样推断中,可能没有抽样平均误差.8.点估计是直接用样本指标代替总体指标.9.在其他条件一定的情况下,将重复抽样改为不重复抽样可以缩小抽样误差.10.在其他条件一定时,增大样本容量,抽样平均误差不变.三、单项选择题1.抽样调查的目的在于 .A.用样本指标推断总体指标B.对调查单位作深入的研究C.对全及总体作一般的了解D.提高调查的准确性和时效性2.对烟花爆竹进行质量检查,最好采用 .A.重点调查B.抽样调查C.典型调查D.普查3.从生产线上每隔1小时随机抽取10分钟的产品进行检验,这种方式属于 .A.等距抽样B.类型抽样C.整群抽样D.简单随机抽样4.在其他条件不变的情况下,如果重复抽样的极限误差缩小为原来的1/2,则样本容量 .A.扩大为原来的4倍B.扩大为原来的2倍C.缩小原来的1/2D. 缩小原来的1/45.纯随机抽样重复的抽样平均误差的大小取决于 .A.样本单位数B.总体方差C.总体单位数和总体方差D.样本单位数和总体方差6.从纯理论出发,最符合随机性原则的抽样方式是 .A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样7.根据对某超市100名顾客等候结账情况的调查,得知每次平均等候时间为4分钟,标准差为2分钟,在概率保证程度为95.45%的要求下,估计顾客平均等候时间的区间为 .z=2A.3.9~4.1分钟之间B.3.8~4.2分钟之间C.3.7~4.3分钟之间D.3.6~4.4分钟之间四、多项选择题1.缩小抽样误差的途径有 .A.缩小总体方差B.增加样本单位数C.减少样本单位数D.将重复抽样改为不重复抽样E.将不重复抽样改为重复抽样2.抽取样本的方法有 .A.简单随机抽样B.类型抽样C.重复抽样D.等距抽样E.不重复抽样3.抽样的组织方式有 .A.纯随机抽样B.类型抽样C.整群抽样D.等距抽样E.阶段抽样4.影响样本单位数多少的因素有 .A.总体的变异程度B.所要求的把握程度大小C.极限误差的大小D.抽样的组织方式E.抽取样本的方法5.影响平均抽样误差大小的因素有 .A.总体的变异程度B.抽取样本的方法C.抽样的组织方式D.样本单位数的多少E.是有限总体还是无限总体6.抽样推断中的抽样误差 .A.是不可不免要产生的B.是可以通过改进调查方法消除的C.只能在调查后才能计算D.既不能减小也不能消除E.其大小是可以控制的7.点估计,下列说法正确的有 .A.点估计是直接用样本指标作为总体指标的估计值B.这种估计没有表明抽样估计的误差大小C.这种估计能指出误差在一定范围内的概率保证程度的大小D.点估计是一种参数估计的方法E.点估计所得到的总体参数是一个区间范围8.抽样推断的特点有 .A.是用样本指标从数量上推断总体指标B.抽取样本时按随机性原则抽取的C.抽样误差可以计算和控制D.抽样误差是不可避免的E.是一种由部分认识总体的统计方法五、简答题1.什么是抽样误差 影响抽样误差大小的各因素与抽样误差的关系如何2.影响抽样单位数目的各因素与抽样单位数目的关系如何3.简要说明各种抽样组织方式有什么特点4.什么是抽样推断 有何特点六、计算题1.从某制药厂仓库中随机抽取100瓶c v 进行检验,其结果平均每瓶c v 为99片,样本标准差为3片,如果可靠程度为99.73%,计算该仓库平均每瓶c v 的区间范围;如果极限误差减少到原来的1∕2,可靠程度仍为99.73%,问需要调查多少瓶c v1已知:n=100 s=3 99=x z=33.010092===n s x μ 99-3×0.3≤X ≤99+3×0.3 98.1≤X ≤99.92已知:s=3 t=3 △=3×0.3∕2=0.45 222994000.2025z s n ⨯===∆ 2.某大学有学生6000人,欲调查学生的人均月生活费情况,现抽取60名学生进行调查,得到月生活费在500元以上的有42名,以95%的概率保证程度计算全体学生中月生活费在500元以上学生比重的区间范围;如果极限误差减少为5.8%,概率保证程度仍为95%,需要抽取多少名学生1已知:n=60 p=42∕60=70% z=1.96%660%30%70)1(=⨯=-=n p p p μ 70%-1.96×6%≤P ≤70%+1.96×6% 58.24%≤P ≤81.76%2已知:z=1.96 △=5.8%2222(1) 1.9670%30%2405.8%z p p n -⨯⨯===∆。
第六章抽样推断一、单项选择题1. 抽样调查必须遵循的基本原则是()A. 灵活性原则B. 准确性原则C. 随机原则D. 可靠性原则2. 抽样误差是()A. 代表性误差B. 登记性误差c. 系统性误差 D. 随机误差3. 抽样平均误差和极限误差的关系是()A. 抽样平均误差小于极限误差B.抽样平均误差大于极限误差C. 抽样平均误差等于极限误差D. 抽样平均误差可能大于、等于或小于极限误差4. 在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A. 扩大为原来的4倍B. 每个大为原来的2倍C. 缩小为原来的1/4倍D. 缩小为原来的1/2倍5. 一般来说, 在抽样组织形式中,抽样误差较大的是()A. 简单抽样B. 分层抽样C. 整群抽样D. 等距抽样6. 根据抽样的资料, 一年级优秀生比重为10%, 二年级为20%,在人数相等时,优秀生比重的抽样误差()A. 一年级较大B. 二年级较大C.相同 D. 无法判断7. 根据重复抽样的资料, 甲单位工人工资方差为25,乙单位为100,乙单位人数比甲单位多3倍, 则抽样误差()A. 甲单位较大B. 无法判断C.乙单位较大 D. 相同8.一个全及总体()A. 只能抽取一个样本B. 可以抽取多个样本C. 只能计算一个指标 D.只能抽取一个单位9. 最符合随机原则地抽样组织形式是()A. 整群抽样B. 类型抽样C. 阶段抽样D. 简单随机抽样10.差错比率指标是用于()A. 点估计法B. 区间估计法C. 直接换算法 D.系数修正法二、多项选择题1.抽样估计的抽样平均误差()A. 是不可以避免的B.是可以改进调查方法消除的C. 是可以事先计算的D.只有调查结束之后才能计算E. 其大小是可以控制的2.影响样本客量的因素有()A. 推断的可靠程度 B.抽样方式C. 抽样方法D. 允许误差的大小E. 总体各单位标志变异程度3.抽样估计的特点是()A. A.运用归纳推理B. 运用演绎推理C. 运用数学分析法D. 运用概率分析法,E. 抽样误差和抽样估计的可靠程度有关4. 提高推断的可靠程度, 可以采取的办法是()A.扩大估计值的误差范围 B.缩小估计值的误差范围C. 增大概率度D. 降低概率度E. 增加样本容量5. 影响整群抽样的抽样误差的因素有()A. 总方差B. 组内方差C. 组间方差D. 总体群数E. 样本群数6. 抽样估计的优良标准是()A.无偏性B. 随机性C.一致性D. 有效性E.代表性7. 影响抽样平均误差的因素有()A. 总体标志变异程度 B.样本容量C. 抽样方法D. 抽样组织形式E. 样本指标值的大小8. 抽样调查遵循随机原则的原因是()A. 样本客量有限B. 保证总体中每个单位有同等机会被抽中C. 能确定抽样方法D. 能确定推断的可靠程度E. 能计算抽样误差9. 和重复抽样相比,不重复抽样的特点是()A. 总体单位数在抽选过程中逐渐减少B. 总体中每个单位都有被重复抽中的可能C.总体中每个单位没有被重复抽中的可能D. 样本可能数目要多些E. 样本可能数目要少些10.总体标准差未知时, 常用的替代办法有()A. 用过去调查的同类问题的经验数据B. 用样本的标准C.凭调查者经验确定D. 用总体方差E. 先组织试验性抽样,用试验样本的标准差11. 抽样调查的主要目的是()A. 对调查单位作深入研究B. 用样本指标推断总体的指标C. 计算和控制误差D. 广泛运用数学方法E.对总体进行科学的估计和判断12. 区间估计的基本要素是()A. 概率度B. 点估计C.误差范围 D.抽样数目E. 总体单位数三、填空题1.调查是用________推断________的一种调查方法。