《应用统计学》第6章:置信区间估计

  • 格式:ppt
  • 大小:1.24 MB
  • 文档页数:33

下载文档原格式

  / 33
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
零的常数 c1, c2, ···, cn, 使
c1 X1+ c2 X2 + ···+ cn Xn = 0
则称变量 X1, X2, ···, Xn 线性相关,或称它们间存在 一个线性约束条件;若 X1, X2, ···, Xn 间存在 k 个独立 的线性约束条件,则它们中仅有 n-k 个独立的变量,
并称平方和 的自由度为 n-k。
/2=0.025, n=10, 查表得 t0.025(9)=2.2622
d t /2(n 1)S / n 2.2622 196 .5 / 10 140.6
故所求 的 95% 置信区间为
(x d, x d) (1282.5, 1563.7)
可用 Excel 的【工具】→“数据分析”→“描述统 计”
15
t 分布的右侧 分位点 t(n)
t(n)为 t 分布中满足下式的右侧 分位点: P{ t > t ( n ) }=
由给定的概率 ,可查表得到 t(n)。
由 t 分布的对称性,可得:t1-(n)=-t(n)。
f (x)
x
16
t1-(n) = - t(n) 0
t(n)
用 Excel 求 t /2(n)
2.总体比例区间估计时样本容量的确定
由 d Z /2 p(1 p) / n ,可得
n
Z2/ 2 p(1 d2
p)
其中样本成数 p 同样可先通过小规模抽样 作出估计,也可根据其他信息估计,或取 0.5。
29
某企业要重新制【定产例品7抽】样检验的规范。
已知过去检验的次品率在3.6%左右,现要求 允许误差不超过2%,置信度为95%。问每次 至少应抽查多少产品?
2 0.025
(9)
=
9196.52/19.023
=
135.22
(n-1)S2/
2 0.975
(9)
=
9196.52/2.7
=
358.82
故所求 2的置信区间为
(135.22,358.82)
9
课堂练习1
某车床加工的缸套外径尺寸 X ~ N(μ, σ 2),现 随机测得的 10 个加工后的某种缸套外径尺寸 (mm) 如下:
,
(n
2 1
/2
1)S 2 (n 1)
012 / 2 (n 1)
/2
2/2 (n 1) x
【解例:2】由求例例11中,元S件2 =寿19命6方.5差2,n2 的=1905,% 置/信2=区0间.02。5,
1-/2=0.975,
2 0.025
(9)
19.023,
2 0.975
(9)
2.7
(n-1)S2/
(x d, x d) , d Z/2 / n
12其中 d 称为估计的允许误差。
用 Excel 求 Zα
可用 Excel 的统计函数 NORMSINV 返回 Z 。
语法规则如下:
格式:NORMSINV(1-)
功能: 返回 Z 的值。
说明: NORMSINV() 返回的是 Z1- 的
值。
13
3. t 分布



求 μ 的置信度为95%的置信区间;
21
【例4】某厂为了解产品的质量情况,随机抽取了300件产品 进行检验,其中有5件次品,求该厂产品次品率的置信度为 95%的置信区间。
解:产品次品率为比例, =1-0.95=0.05, /2=0.025,n=300,,查表得 Z0.025=1.96,
样本成数
P{Z / 2
pP P(1 P) / n
Z /2} 1
用样本比例代替总体比例, 可得总体成数 P 的置信度
为 1- 的置信区间为
19 ( p d, p d ) , d Z /2 p(1 p) / n
解【:例由3】例求1例,1x中=元14件23平.1均,S寿=命196.5的,95%=置1-信0.9区5=间0。.05,
抽取的样本容量过大,虽然可以提高统计 推断的精度,但将增加不必要的人力、物力、 费用和时间开支;
如果抽取的样本容量过小,则又会使统计 推断的误差过大,推断结果就达不到必要的 精度要求。
确定样本容量的原则
26
——在满足所需的置信度和允许误差条件
1.总体均值区间估计时样本容量的确定
在给定置信度和允许误差 d 的条件下,由
p 5 / 300 1.67%
d Z /2 p(1 p) / n
1.96 0.0167(1 0.0167) / 300 1.45%
该厂产品次品率的置信度为95%的置信区间为
( p d, p d) (0.22%, 3.12%)
22
案例思考题
国外民意调查机构在进行民意调查时,通 常要求在95%的置信度下将调查的允许误差 (即置信区间的 d 值)控制在3%以内。
2
(n 1)S 2
2

2 (n 1)

P{12 / 2 (n 1)
(n 1)S 2
2
2 / 2 (n 1)} 1
可得
P{ (n 1)S 2 2 (n 1)S 2 } 1
2/ 2 (n 1)
2 1
/
2
(n
1)
从而 2 的置信度为1-
的置信区间为:
f (x)
/2
1-
8
(n
2 /
1)S 2 2 (n 1)
设 X~N(0, 1),Y~ 2(n), 且 X 与 Y 相互
独立, 则随机变量
t X
Y/n 服从自由度为 n 的 t 分布,记为 t~t(n)。
14
t 分布密度函数的图形
f (x) n = ∞,N (0, 1) n = 10 n=4 n=1
x 0
标准正态分布分布是 t 分布的极限分布。 当 n 很大时,t 分布近似于标准正态分布。
可用 Excel 的统计函数 TINV 返回 t (n)。 语法规则如下:
格式:TINV( 2 , n )
功能:返回 t (n)的值。
说明:TINV(, n )返回的是 t/2(n)的值。
17
4. 未知时总体均值 μ 的区间
估计
设总体 X~N( μ, σ 2 ), X1, X2, ···, Xn 为 X 的容量为 n
第6章 置信区间估计
本章教学目标: (1) 单个正态总体均值和方差的区间估计。 (2) 总体比例的区间估计。 (3) 均值和比例置信区间估计中的样本容量
确定。 (4) 两个正态总体的均值差和方差比的区间
估计。 (5) 单侧置信区间估计。
1
区间估计
由于点估计存在误差,因此仅对总体参数作出点 估计是不够的,还需要了解估计的精度及其误差。
解:由题意,要推断的是总体成数,
p =0.036,1-p = 0.964,d = 0.02,α = 0.05,
zαn/2=Zz20/ 2.0pd2(521=
1p).96
1.96 2
0.036 0.02 2
0.964
333 .3 (件)
故每次至少应抽查 334 件产品。
由此可知,在总体比例的区间估计问题中,要达 到30一定的精度要求,样本容量至少要在几百以上。
一. 总体方差 2 的区间估计 1. 2 分布
设总体 X~N (0, 1), X1, X2, ···, Xn 为 X 的 一个样本,则它们的平方和
2
n
X
2 i
i 1
为服从自由度为 n 的 2 分布,记为
2 ~ 2(n)
3
“自由度”的含义
若对于随机变量 X1, X2, ···, Xn,存在一组不全为
求解正态总体均值 的置信区间。
20
课堂练习2:
某车床加工的缸套外径尺寸 X~N( μ, σ 2 ),
下面是随机测得的10个加工后的缸套外径尺 寸(mm),
90.01,90.01,90.02,90.03,89.99
8x9.9980,.00819.97,S 2900.0.001,859302 .01,89.99
n
X
2 i
i 1
4
2 分布密度函数的图形
f (x)
n=1 n=4
n=10
o
x
5
2 (n)
2 分布的右侧 分位点
2 (n) 为 2分布中满足下式的的右侧 分位
点: P{ 2 2 (n) }
f (x)
o
x 2 (n)
由给定的概率 和自由度,可查表得到 2 (n)
6

Excel

2
(n)
7.3
8
d 142.3
可知取 n =10 已能满足所给精度要求。

n
z0.005S
2
2.58196.5
2
12.7
13
d 142.3
可知此时取 n =20 就能满足所给精度要求。
在总体均值的区间估计中,通常 n =30 就称为大样本。
在28 大样本时,无论总体服从什么分布,都可用前述公式进 行区间估计。
⑴在95%的置信度下,使估计求的允许误差不超过其平均寿命
的10%,并设已得到例1的先期抽样数据。求所需的最低样本容 量。
⑵其他条件不变,在99%的置信度下求所需最低样本容量。
解:⑴由例1,x 1423.1, S=196.5,d = 1423/10 =142.3
n
z0.025S
2
1.96
196.5
2
Z X / n
~N(0,1)
/2
对给定的置信度1-, 有
f (x)
1-
/2
P{Z / 2
X
/
n
Z /2}
1
-z/2
0
z/2 x
由此可得 P{x Z /2 / n x Z /2 / n}1
从而的置信度为 1- 的置信区间为
( x Z /2 / n , x Z /2 / n )
为便于记忆和理解,将 的置信区间表示为如下形式:
参数的区间估计就是在给定的可信度下,估计未 知参数的可能取值范围。
设 为总体分布的未知参数,若由样本确定的两 个统计量 θˆ1 和 θˆ2, 对给定的概率 (0<<1),满足
P{ˆ1 ˆ2} 1 则称随机区间 ( ˆ1, ˆ2 )为 的置信度为1- 的
置信区间。
2 2
§6.1 单个正态总体均值和方差的区间估计
18 (x d, x d) , d t /2(n 1)S / n
§6.2 总体比例的区间估计
设总体比例为 P, 则当 nP 和 n (1-P) 都大于5时, 样本成数 p 近似服从均值为 P,方差为 P (1-P)/n 的正态 分布。从而
pP
P(1 P) / n 近似服从 N (0, 1)
对给定的置信度1-,由
n
1.962 0.5 0.5 0.032
1067.1
1068(人)
24
案例思考题解答(2)
如果要求置信度达到99%,则 Z/2=Zn0.0025.=5725.502 .70503.,25 0.5 1841.8 1842(人)
25
§6.3 样本容量确定
前面的分析都是在给定的样本容量和样本 数据下求置信区间。但在实际应用中,应当 在随机抽样前就确定所需抽取的样本容量。
可用 Excel 的统计函数 CHIINV 2 (n) 返语回法规则如下:
格式:CHIINV ( , n )
功能:返回 2 (n) 的值。
7
2. 总体方差 2 的区间估计
设总体 X~N( μ, σ2 ), X1, X2, ···, Xn 为 X 的容量为n的样本,
X 和 S2 分别为样本均值和样本方差。 可以证明,
d t /2 (n 1)S / n
可得 n t /2 (n 1)S 2 z /2 2 z /2S 2
d d d
其中总体标准差或样本标准差也是未知的,通 常可以先通过小规模抽样作出估计。
由于使用的是近似公式,可知实际采用的最低 样本容量应比计算结果稍大。
27
【例6】在例3 元件平均寿命的区间估计问题中,要
的样本, X 和 S2 分别为样本均值和样本方差。
可以证明:
t X ~
S/ n
t(n-1)
因此,对给定的置信度 1-,有
P{t /2 (n 1)
X
S/ n
t / 2 (n 1)}
Leabharlann Baidu
1
即 P{X t /2(n 1)S / n X t /2(n 1)S / n} 1
由此可得 的置信度为 1- 的置信区间为
P{ Z > Z } =
f (x)
1-
0
z x
如图所示, ( Z )=1- ,因此, 可由正态分布表
得到 Z 。 如:要查 Z0.025, 由正态分布表可查得:
11 (1.96) = 0.975 = 1-0.025, 故 Z0.025 =1.96
2.σ 2 已知时总体均值μ的区间估计
由正态分布的性质可得
⑴问为满足该调查精度要求,至少需要多 大的样本?
⑵如果要求置信度达到99%,调查误差仍 为3%,此时至少需要多大的样本?
23
案例思考题解答(1)
由 d Z /2 p(1 p) / n ,可得
n
Z2 / 2
p(1 d2
p)
本案例中,当 p 0.5时,p(1 p) 达到最大值,
故需要的样本容量至少为
90.01,90.01,90.02,90.03,89.99
89.98,89.97,90.00,90.01,89.99
S 2 0.018532
(
)
求 σ 2 的置信度为 95% 的置信区间。
10
二. 总体均值μ的区间估计
1. 标准正态分布的右侧 分位点 Z
Z 是标准正态分布中满足下式的右侧分位点: