- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
总体均值的区间估计
1、总体服从正态分布、小样本、未知
2、使用t分布统计量
t x ~ t(n 1)
sn
3、总体均值 在1-置信水平下的置信区
间为
x t 2
s n
【例】谢尔工业公司拟采用一项计算机辅助程序来培训 公司的维修职员掌握及其维修的操作,以减少培训工人 所需要的时间。为了评价这种培训方法,生产经理需要 对这种程序所需要的平均时间进行估计。以下是利用新 方对15名职员进行培训的培训天数资料。
或推断。
通常,把用来估计总体特征的样本指标叫估计 量或统计量,待估计的总体指标叫总体参数。
1、它在逻辑上运用归纳推理而不是演绎推理。
特 2、在方法上运用不确定的概率估计方法,而不 点 是运用确定的数学分析方法。
3、抽样估计存在抽样误差。
点估计
从总体中抽取一个随机样本,计算与总 体参数相应的样本统计量,然后把该统 计量视为总体参数的估计值,称为参数 的点估计。
-1.96 x
+1.96x
90%的样本
95% 的样本
99% 的样本
一、总体均值的区间估计
STAT
大样本(n≥30)的情形
【例】Duotu公司是一家专营体育设备和附件的公司, 为了监控公司的服务质量,Duotu公司每月都要随即 的抽取一个顾客样本进行调查以了解顾客的满意分 数。根据以往的调查,满意分数的标准差稳定在20 分左右。最近一次对100名顾客的抽样显示,满意分 数的样本均值为80分,试建立总体满意分数的区间。
一致性 估计量将在概率意义下越来越接近
于总体真实值
若 越大 越小,则称 为 的一致估计量
limP( ) 1 n
无偏性
• 无偏性:估计量抽样分布的数学期望等于被 估计的总体参数 。
P(ˆ)
无偏
A
有偏
B
ˆ
有效性
• 有效性:与离散度相联系。对同一总体参数 的两个无偏点估计量,有更小标准差的估计
结论:在置信水平为95%时,所有女子高尔夫球手中有 40.76%到47.24%的人对得到的球座开球数感到满意。
第三节 样本容量的确定 STAT
一、总体均值估计时样本容量的确定 二、总体比率估计时样本容量的确定
一、总体均值估计时样本容量的确定 STAT
【例】拥有工商管理硕士学位的毕业生每年年薪底薪的标 准差大约为2000元,假定希望估计每年年薪底薪的95%的 置信区间。如果研究者期望的极限误差为200元,样本容 量应当有多大?
居民
28 29 30 31 32 33 34 35 36
汽车里 程数
34 39 34 35 42 53 28 49 39
分析:区间估计包括两个部分——点估计和误差边际,只需分 别求出即可到的总体的区间估计。
解:已知
(1)样本的汽车里程数
n 3(6 大样本), 1 90%,Z 1.645 2
解:依题意,1 95%,Z 1.96, 2000, 200 2
可得
n
(z )2 2
2
E2
1.962 20002 2002
量更有效。
P(ˆ)
ˆ1 的抽样分布
B
A
ˆ2 的抽样分布
ˆ
一致性
• 一致性:随着样本容量的增大,估计量的 值越来越接近被估计的总体参数。
P(ˆ) 较大的样本容量
B
较小的样本容量
A
ˆ
抽样估计量的优良标准
数理统计证明:
x 为 X的无偏、有效、一致估计量;
S
为
n 1
的无偏、有效、一致估计量;
总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值
的区间估计。
样本平均数 x x 52 44 55 63 53.87
n
15
样本标准差 s
2
(x x) 651 .73 6.82
n 1
14
误差边际
s
6.82
x
t 2
2.145 * n
p 为 P的无偏、有效、一致估计量。
第二节 单个总体均值和比率的区间估计
一、总体均值的区间估计:大样本 (n≥30)的情形
总体标准差已知 总体标准差未知
二、总体均值的区间估计:小样本 (n<30)的情形 三、总体比率的区间估计
区间估计
1. 在点估计的基础上,给出总体参数估计的一个区间 范围,该区间由样本统计量加减抽样误差而得到的
第6章 总体参数估计 STAT
本章重点 1、单个总体均值的区间估计; 2、样本容量的确定; 3、两个总体均值之差的区间估计。
本章难点 1、小样本情形下总体参数的区间估计; 2、其他组织形式总体参数的区间估计及样本容量的确 定。
第一节 参数估计的基本问题
也叫抽样估计,就是根据样本指
参数估计 标数值对总体指标数值作出估计
量要优于另一个?
抽样估计量的优良标准
设 为待估计的总体参数, 为样本统 计量,则 的优良标准为:
无偏性 指样本指标的均值应等于被估计 的总体指标
若 估计量
,则称 为 的无偏
抽样估计量的优良标准
有效性
作为优良的估计量,除了满足无偏 性的要求外,其方差应比较小
若
,则称 为比 更有效的估计量
指随着样本单位数 的增大,样本
2. 根据样本统计量的抽样分布能够对样本统计量与总 体参数的接近程度给出一个概率度量
– 比如,某班级平均分数在75~85之间,置信水平 是95%
置信区间
样本统计量 (点估计)
置信下限
置信上限
区间估计的图示
x z 2 x
x
- 2.58x
x
-1.65 x
+1.65x + 2.58x
n
36
(3)90%的置信区间为39.5 ±2.13 即(37.37,41.63)里。
注意
(1)置信系数一般在抽样之前确定,根据样本所建立的区间能 包含总体参数的概率为
(2)置信区间的长度(准确度)在置信度一定的情况下,与样 本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样 本容量来达到。
二、总体均值的区间估计
(一)抽样误差
STAT
抽样误差:一个无偏估计与其对应的
总体参数之差的绝对值。
x x
(实际未知)
x , x
x
x
(二)抽样误差的概率表述 STAT
由概率论可知,
Z x 服从标准正态分布,即 Z ~ N(0,1)
x
x
有以下关系式成立: P(
Z ) 1 2
3、总体均值 在1-置信水平下的置信区
间为
(三)总体均值的区间估计
1、大样本、未知 2、使用正态分布统计量Z
Z X ~ N (0,1) n
3、总体均值 在1-置信水平下的置信区
间为
【例】某市交通部门为了对城市的环境进行监测,定期公 布该市居民每天小汽车的里程数,抽取了36个居民作为一 个简单随机样本,得到资料如下。试构造该市居民每天小 汽车里程数的总体均值的95%的置信区间。
由于产品的数量大,进行全面的检验是不可能的,可行的 办法是抽样,然后用样本数据估计平均每袋的重量。质检科从 某天生产的一批食品中随机抽取了25袋,下表是对每袋食品重 量的检验结果。(假定该种袋装食品重量服从正态分布。)
案例导入
STAT
25袋食品的重量(克)
112.5 102.6 100.0 116.6 136.8
居民
1 2 3 4 5 6 7 8 9
汽车里 程数
32 50 40 24 33 44 45 48 44
居民
10 11 12 13 14 15 16 17 18
汽车里 程数
47 31 36 39 46 45 39 38 45
居民
19 20 21 22 23 24 25 26 27
汽车里 程数
27 43 54 36 34 48 23 36 42
估计误差不超过4克。产品的合格率在95.68%~64.32%之间,其
中,估计的可信程度为95%,估计误差不超过15.68%。
案例导入
STAT
质检报告提交后,企业高层领导人提出几点意见:一是抽 取的样本大小是否合适?能不能用一个更大的样本进行估计? 二是能否将估计的误差在缩小一点?比如,估计平均重量时估 计误差不超过3克,估计合格率时误差不超过10%。三是总体平 均重量的方差是多少?因为方差的大小说明了生产过程的稳定 性,过大或过小的方差都意味着应对生产过程进行调整。
小样本(n<30)的情形
STAT
在小样本的情况下,样本均值的抽样分布依 赖于总体的抽样分布。
小样本n 30总总体体标标准准差差未已知知x服x服从从t分正布态(分s 布 ) t分布的图形和标准正态分布的图形类似
标准正态分布
t分布(自由度为20) t分布(自由度为10)
0
标准正态分布与t分布的比较
101.0 107.5 123.5 95.4 102.8
103.0 95.0 102.0 97.8 101.5
102.0 108.8 101.6 108.4 98.4
100.5 115.6 102.2 105.0 93.3
根据表中数据,质检科估计出该天生产的食品每袋的平均
重量在101.57~109.14克之间,其中,估计的可信程度为95%,
分析:区间点估计 误差边际
解: n 90( 2 大样本), 1 95%,Z 1.96 2
(1)样本比例 p m 397 0.44 n 902
(2)误差边际
p(1 p)
0.44 0.56
P
Z 2
1.96 n
Baidu Nhomakorabea
0.0324 902
(3)95%的置信区间0.44 ±0.0324 即(0.4076,0.4724)。
职员 1 2 3 4 5
时间 52 44 55 44 45
职员 6 7 8 9 10
时间 59 50 54 62 46
职员 11 12 13 14 15
时间 54 58 60 62 63
根据上述资料建立置信度为95%的总体均值的区间估 计。(假定培训时间总体服从正态分布)。
解:依题意,总体服从正态分布,n=15(小样本),此时
x
一般称,1 为置信度,可靠程度等,反映估计结果
的可信程度。若事先给定一个置信度,则可根据标准
正态分布找到其对应的临界值 Z 。进而计算抽样误
2
差
x
x
Z 2
x
(三)总体均值的区间估计
1、大样本、已知 2、使用正态分布统计量Z
Z X ~ N (0,1) n
3.78 15
95%的置信区间为
53.87 ±3.78 即(50.09,57.65)天。
三、总体比率的区间估计
1、样本比例近似服从正态分布
n 30, np 5, n(1 p) 5
2、使用正态分布统计量 z z p ~ N (0,1)
p(1 p)
n
3、总体比例在1-置信水平下的置信区间为
(2)误差边际 x x 32 50 40 36 39.5
n
36
x
Z 2
n
总体标准差 (未知)
样本标准差 s
样本标准差
s
(
x
2
x)
7.77
误差边际
n 1
x
Z 2
Z
n
2
s 1.645 * 7.77 2.13
p z 2
(1 )
n
或
p
z
2
p(1- p) ( 未知时)
n
【例】1997年菲瑞卡洛通讯公司对全国范围每内的902 名女子高尔夫球手进行了调查,以了解美国女子高尔夫球 手对自己如何在场上被对待的看法。调查发现,397名女 子高尔夫球手对得到的球座开球次数感到满意。
试在95%的置信水平下估计总体比例的区间。
优点 简单,具体明确
缺点
无法控制误差,仅适用于对推断的准 确程度与可靠程度要求不高的情况
x的抽样分布
点估计的最大好处:给出确定的值 点估计的最大问题:无法控制误差
估计值的优良标准
问题:
x
不是那第一一,个我统m们计e为量什来么估以计这某一个个总而体
参数?
mo
估计第值二的,优如良果标有两准个:以上的统计 无量估偏可计以结性用果、来是有估否效计一性某致个?、总是一体否致参一性数个,统其计
第一节 参数估计的基本问题 第二节 单个总体均值和比率的区间估计 第三节 样本容量的确定 第四节 两个总体均值和比率差异的区间估计 第五节 分层抽样、整群抽样和等距抽样的区
间估计
案例导入
STAT
一家食品生产企业以生产袋装食品为主,每天的产量约为 8000袋左右。按规定每袋的重量应不低于100克,否则即为不合 格。为对产量质量进行检测,企业设有质量检查科专门负责质 量检验,并经常向企业高层领导提交质检报告。质检的内容之 一就是每袋重量是否符合要求。