- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P
p(1 p) n
P (1 P ) 0.0252 n
p z / 2 p 4.15%
总体优质品率 p 的置信度为 90%的置信区间为
85% 4.15% p 85% 4.15% 即80.85% p 89.15%
若这批产品共有 2000 只,则可进一步推算出这批产品中优质品总数 Np 的置信区间为
样本均值 X 791.1 克,样本标准差 S 17.136 克
x t / 2,n1
S 17.136 2.262 12.26 克 n 10
平均重量的置信区间[791.1-12.26,791.1+12.26],即[778.84,803.36] 总重量的置信区间
[800*778.84,800*803.36],即[623072,642688]
2
X
于是:
tinv( , n 1)
重复抽样时,区间的上下限为:
X t
2
, n 1
S n
不重复抽样时,区间的上下限为: 大样本时,t分布与标准正态 分布非常接近,可直接从标准 t , n 1 正态分布表查临界值 2
X t
2
, n 1
S n
N n N 1
对某型号的电子元件进行耐用性能检查,抽查资料分组如下表,要求 估计该批电子元件的平均耐用时数的置信区间(置信度95%)。
本节主要内容:
第一节 点估计和区间估计 第二节 参数估计中样本量的确定 第三节 不同抽样组织形式下的参数 估计*
一、总体参数估计概述
参数估计的两个要求: 精度:估计误差的最大范围,通过极限误差来反映。 显然,Δ越小,估计的精度要求越高,Δ越大,估计的 精度要求越低。
ˆ, 设待估计的总体参数是θ,用以估计该参数的统计量是 ˆ 抽样估计的极限误差是Δ,即: 极限误差是根据研究对象的变异程度和分析任务的性质来确 定的在一定概率下的允许误差范围。
1 2 6 25 43 9 3 1
100
( X X )2 f Xf 52.17(小时) X 1055.5(小时) S f 1 f
X
S
F (z) 0.95 z 1.96 abs(normsinv(1 / 2))
52.17 5.217(小时) n 100 用Excel函数求z值
z z
X
X
1.96 5.217 10.23
X
X S/ n
所以X 1055.5 10.23 1045.27
X 1055.5 10.23 1065.73 平均耐用时数在1045.27 1065.73小时间, 可靠程度为95%。
N n N 1
2
, n 1
S n
如果不是正态总体,或分布未知
X / n
总体方差已知 且是大样本
X
近似服从
X
~
N (0,1)
或
n
N n N 1
总体方差未知 且是大样本
X 近似服从 ~ N (0,1)
X
X S / n
或 S n N n N 1
此时不考虑小样本情况
X
X
) 1
的估计区间是[ X , X ]
X
当σ已知时,根据相关的抽样分布定理, X
服从标准正态分布
用Excel函数求 / X的值
N(0,1)。查正态分布概率表, F ( / X ) 1 normsinv(1 / 2)
可得 / X (一般记为 z / 2 ),则 z / 2 X ,根据重复抽 样与不重复抽样的 X 求法的不同,进一步可得总体平均数的估计区 间:
对总体平均数或成数的区间估计时,使用下面的
式子
p( X ) 1 (式中Δ是极限误差)
有两种模式:
1、根据置信度1-α,求出极限误差Δ,并指出总体平均数的 估计区间。 2、给定极限误差,求置信度。
p( X ) 1 p(
X
P z P
2
P
p 1 p n
P
p 1 p N n n N 1
注意:在实践中,由于总体成数常常未知,这时,抽样平 均误差公式中的总体成数用样本成数代替。 大样本的条件:np≥5且n(1-p) ≥5,由于总体成数p通常未 知,可以用样本成数来近似判断。
对某型号的电子元件进行耐用性能检查,抽查资料分组如下表, 设该 厂的产品质量检验标准规定,元件耐用时数达到1000小时以上为合格 品。要求估计该批电子元件的合格率,置信水平95%。 P 91 91% 耐用时数 组中值 元件数 100 900 以下 875 1 p(1 p) (总体成数未知, 用样本成数代替) 900—950 925 2 n 950—1000 975 6 P(1 P) 2.86% 1000—1050 1025 25 n 1050—1100 1075 43 F ( z) 95%, z 1.96 1125 9 1100—1150 1175 3 1150—1200 z P 1.96 2.86% 5.61% 1225 1 1200 以上
经数学证明,X 是的无偏、一致且有效的估计量。 2 2 ( x x ) S 总体方差的无偏估计量为样本方差 n 1
点估计完全正确的概率通常为0。因此,我们更多的是考虑用 样本统计量去估计总体参数的范围 区间估计。
(一)区间估计的含义:估计总体参数的区间范围,并 给出区间估计成立的概率值。
[2000 80.85%, 2000 89.15%] 即[1617, 1783]
某商场从一批食品(共800袋)中随机抽取40袋(假设用 重复抽样),测得每袋平均重量为791.1克,标准差为 17.136克,要求以95%的把握程度,估计这批食品的平均 每袋重量以及这批食品总重量的区间范围。
p( z
X
)
2
1
/2
0 0.5 1 1.5 2 2.5
/2
-2.5 -2 -1.5 -1 -0.5
0.05 0
/ X
p(
X
X
X
) 1
若总体方差未知,则在计算 X 时,使用样本方差代替总 X 体方差,此时 服从自由度为n-1的t分布。查t分布表可 X 用Excel函数求 / 的值 得 / X ,并记为t ,n1
因此,大样本情况下,直接用 标准正态分布求置信区间即可。
总体成数估计区间的上下限
只考虑大样本情况(请记住大样本条件)
P z
P z
P 1 P
2
n
P 1 P N n n N 1
2
在对总体平均数进行区间估计的基础上,可进一步推
断相应的总量指标,即用总体单位总数N分别乘以总 体平均数的区间下限和区间上限,便得到相应总量 (Nμ)的区间范围。
也可以写成 p( X X ) 1
X3
X3 X4 X4
表示有(1 ) 100%的 区间包含了
给定极限误差,求置信度
p( X ) 1
p(
X
X
X
2
) F(
X
) 1
通过临界值 z
x
,去查标准正态分布,可得出上式的置信度是 1-α。
例:经抽样调查计算样本亩产粮食600公斤,并求得抽样 平均误差为3公斤,现给定允许极限误差为6公斤,求置信 区间包含总体平均亩产的概率,即求置信水平。
结果表明,如果多次反复抽样, p( X X ) p( X ) 每次都可以由样本值确定一个估 计区间,每个区间或者包含总体 X 参数的真值,或者不包含总体参 p( ) 数的真值,包含真值的区间占 X X F(z),即每一万次抽样,就有 X 9545个样本区间包括总体亩产, 因为 服务标准正态分布 X 其余455个样本区间不包括总体 F (2) 95.45% 平均数,即若接受估计区间的判 所以上式 F ( ) 断要冒4.55%的机会犯错误的风 X 险。
p(1 2 ) 1
其中: 1-α (0< α <1)称为置信度(或概率保证程度); α是区间估计的显著性水平,其取值大小由实际问题确 定,经常取1%、5%和10%。
对上式的理解: 例如抽取了1000个样本,根据每一个样本均构造了一个置信区间,如 果α=5%,这样,由1000个样本构造的总体参数的1000个置信区间中, 有95%的区间包含了总体参数的真值,而5%的置信区间则没有包含。
ˆ) ,即满足无偏性。 E(
有效性: ˆ 和 ˆ 都是的无偏估计量,而 2 2 ,则称 ˆ 更有效。 若 ˆ ˆ 1 2 1
1 2
一致性:当样本容量充分大时,样本统计量充分靠近总 体参数本身。 ˆ ) 1 ( 为任意小的正数) lim P(
n
X
S/ n
注意求
S/ n
时, 查的是标准正态分布表
如果查t分布表,则等于1.984
X的抽样分布
p( X ) 1
可以写成 p( X ) 1
68.27%的样本
X
X1 X1
X2
X
X2
总体平均数估计区间的 上下限
总体方差 已知
/ n
X z
X z
2
N(0,1) 不重复抽样
n
N n N 1
n
N n N 1
2
n
总体方差 未知
t(n-1)
大样本时近 似服从N(0,1)
重复抽样
S/ n
X t
X t
2
, n 1
S n
N n N 1
不重复抽样
S n
来自百度文库
可靠性:估计正确性的一个概率保证,通常称为估计 的置信度。
(一)点估计的含义:直接以样本统计量作为相应 总体参数的估计量,又称为定值估计。
X p P 2 S 2
X X
n 1
2
无偏性:要求样本统计量的平均数等于被估计的总体参 数本身。 若是总体参数,ˆ是估计的样本统计量。
P
合计
—
100
P 91%5.6% 85.4% P 91%5.6% 96.6%
合格率在85.4% — 96.6%间,可靠性为 95%。
p( X ) 1
如果是正态总体
X
p(
X
X
X
) 1
X
所服从的分布
X
重复抽样
X
已知:X 600, X 3, 6
6 2, 简便解法:z F ( z) F (2) 95.45% 3
由于总体的分布是(0,1)分布,只有在大样本的情况下, 才服从正态分布。总体成数可以看成是一种特殊的平均数, 类似于总体平均数的区间估计,总体成数的区间估计的上 下限是:
组中值 元件数
耐用时数 900 以下 900—950 950—1000 1000—1050 1050—1100 1100—1150 1150—1200 1200 以上 合计
p( p( X
875 925 975 1025 1075 1125 1175 1225
—
) 1 ) 1
X x X x N (X x ) N N (X x )
某厂对一批产品的质量进行抽样检验,采用重复抽样抽取 样品200只,样本优质率为85%,试计算当把握程度为90% 时优质品率的区间范围。
n=200,P = 0.85, z / 2 1.645
重复抽样时,区间的上下限为: X z
2
n
不重复抽样时,区间的上下限为: X z
2
n
N n N 1
p(
X
X
为什么记0.45 / X 为z / 2 ?
) 1
0.4 0.35 0.3 0.25 0.2 0.15 0.1
X
p( z
X
) 1