数理统计第四章 方差分析

  • 格式:ppt
  • 大小:1.31 MB
  • 文档页数:31

下载文档原格式

  / 31
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

均值(x i ) 1680
A1 A2 A3 A4
1580
1460 1510
1640
1550 1520
1640
1600 1530
1700
1620 1570
1750
1640 1600
1662
1636.25 1568.33
希望通过上表推断:灯泡不同配料方案对灯泡寿命有无显著影响。 如果影响显著,那么用那一种配料为好。 在统计学上,称灯泡品种为因素,称因素的不同状态为水平。 这里有4种水平— A , A, A, A 4 。 3 2 1
1
2
3
4
1
2
3
4
1
2
3
4
0
1
2
3
4
4
下面对更一般问题建立数学模型
母体
X X
1
子样
X X
11
子样均值
X X
12


X X
1 n1
X X
1
2
21
22
2 n2
2

X
r

X
r1

X
r2

X
rnr

X
r

2
假定 那么
X
i
N ( i ,
2
) ,

ij
X ij i N (0 , ).
3
• • •
• • • • •
从eg1中分析: 1.灯泡的寿命是一个随机变量; 2.令每一种灯丝的配料方案生产出灯泡的寿命构成一个母体, X X 共有四个母体 X , , ,X 。现检验灯丝不同配料方案对灯泡平均寿 X X 命是否有显著影响,即只须检验 X 、 、 、X 是否有相同分布。 在实际中,总是假定母体具有正态分布且母体方差相等。上述 问题就简化为检验几个具有相同方差的正态分布其均值是否相等的问题。 对于例1,也就是假定 2 X X 1) X , ,X , 相互独立,X i N ( i , ) , i 1, 2 , 3 , 4 ; 2) X i j 是分别从母体 X i 中所抽得的简单随机子样。 要求检验假设 H : 。
X
可写作 ij
X
i ij , i 1, , r .
ij N ( 0 , )
2
2
其中,各 i j 相互独立 , i , 为未知参数。
5

1)在上作假设: H 0 : 1 2 r
H 1 : 1 , 2 , r 不全相等
15
• • • •
一)下面介绍一般数学模型: 设因子A有r个不同水平A1,A2,…, Ar ; 因子B有s个不同水平B1,B2,…,Bs 。 pq 对每种情况Ai Bj进行一次独立试验,共得 个试验结果 Xij ,由下表给出
因子B
因子A
B1 A1
A2
X 11 X
21
B2
X 12 X
22

2

1
r
n
ni i
8
i 1
• • • •

SE
2
QE nr
QA r 1
2
则 则
2
ESE ,
2 2
SA
2
ES A
2
2

r 1
1
r
ni ( i ) .
2
i 1
显然有
ESE ES A.
(柯赫伦定理) 设 X 从于 N ( 0 ,1) ,又设
r

i 1
( X i X ) ( X
j 1 r ni
ni
ij
X i)

• • • •


i 1
( X i X ) ( X
j 1
ij
ni X i )
2)如果 H 0 不成立,作出 i j 的区间估计 下面利用离差分解法处理 记X i
1 ni 1
0

i 1 r
X i,
X
j
相互独立
( X i X j ) (i j )


N ( 0 ,1) 1 1 ni nj 1 2 Q E (n r ) 2
T
( X i X j ) (i j ) SE 1 ni 1 nj
秩为(n-r)。 秩为(r-1)。
QA
,它有一个线性关系
i 1
ni ( X i X ) 0 .
QA


n( X )
2
秩为1,且 n-r+r-1+1=n。
2
由柯赫伦定理,可得 Q E /
QA /
(n r ) ;
2
2
( r 1) .
2

因此在 H 0
F
nr
r-1
2
QA r 1 QE nr
r
QE

i 1
r
( X ij X i )
j 1
nr
n-r n-1
SE

QT

i 1 j 1
( X ij X )
2
11
5 •) 如果F F ,则拒绝原假设 H ,即有显著影响; • 如果 F F ,则接受原假设 H ,即无显著影响。 • eg1. 给定 5 % ,问灯丝配料方案对灯泡寿命有无显著影响。
氧化锌B 促进剂A
B1
B2
B3
B4
A1
A2
32
35
35.5
38.5
33.5
36
36.5
37.5
38
39.5
39.5
43
A3
• •
问不同促进剂、不同份量氧化锌分别对定强有无显著影响? 此例中有A,B二个因子,因而因子A有三种水平A1,A2, A3,因子B有四种水平B1,B2,B3,B4 ,在每种组合Ai Bj上 作一次试验获得了试验值,问因子A、B分别对试验结果有无显著 影响?

i 1
ni
(X
n
j
i1
X 1)
2

i 1
nr
(X
ir
Xr)
2
注意到
i 1
(X
ij
X j)
2
为母体
nj
N ( j , )
2
样本方差的 n j倍,
( n j 1) ,
2
由抽样分布定理得
i 1
( X ij X j )
2

2
又据 X i j相互独立 则

Bs
X
1s
X
i
均值
1
X X
X
2s
2

Ar

X
r1

X
r2

X
X
rs
s

X
r
均值 X j
X
1
X
2

X
其中
X
i

1 s
s

j 1 r
X
ij
,
i 1, 2 , , r ,
X
j

1 r 1

i 1 r
X
s
ij
,
j 1, 2 , , s , 1 r
r
X
rs

: 1 2 r
Q A / ( ( r 1))
2
成立下,作统计量
SA SE
2 2
Q E / ( ( n r ))
2

Q A / ( r 1) Q E / (n r )
F ( r 1, n r ).
10

3 )

给定显著性水平 使得
t(n r )
13

给定置信概率 1 ,使 得
p { | T | t ( n r ) } 1 .
2

p{ X i X
j
t ( n r ) S E
2
1 ni

1 nj
i 1 ni 1 nj
j
Xi X
j
t ( n r ) S E
的利用实验结果的信息,这就是方差分析。
2
一、一元方差分析
eg1. 某灯泡厂用四种不同配料方案制成的灯丝生产四批灯泡,在每 一批中取若干个做寿命实验,得如下数据(单位:小时)。
灯泡种类 ( Ai )
寿命(单位:h)( x ij ) 1600 1610 1650 1680 1700 1720 1660 1680 1800 1740 1800
QE
r

2
( ( n i 1) ) ( n r ) .
2 2 i 1
则E ( Q E )
r
( n r ) .
2
2 )

• •
E (Q A )

i 1
ni E ( X i X )
r 2
2
( r 1)


i 1
ni ( i ) ,
6
r

因此 Q
T


i 1 r j 1 ni
ni
r
(X
ij
X )
2


i 1 r j 1
ni
[( X
ij
X i) (X
i
X )]
2


i 1 j 1
(X
ij
X i)
2

i 1
ni ( X
i
X )
2

• •
QT
QE QA
QT Q E Q A
2

} 1.
置信区间:
(Xi X t (n r ) S E
2
百度文库1 ni
j

1 nj
,Xi X
j
t (n r ) S E
2
1 ni

1 nj
).
习题.
P167
2, 3, 5, 6.
14
二、 二元方差分析
• • •
二元方差分析分两种情况:非重复试验和重复试验。 (ǀ)非重复试验的二元方差分析 eg1. 在某种橡胶的配方中,考虑了三种不同的促进剂,四种不同份 量 的氧化锌。各种配方试验一次,测得300%定强如下:
ni
X ij ,
i 1, 2 , , r (组内平均)(1)
r
X
n

i 1
j 1 ni r
X ij ,
其中 n
j 1

i 1
n(总平均) i


因此 X

1 n
ni X
i
(2)
据(1),(2)可得
r

i 1 j 1
ni
(X
ij
X i )( X
i
X ) 0
0 0 0 0

解:据 r=4, n1 =7, n2 =5, n3 =8, n4 =6, n=26. 方差来源 组间 组内 离差平方和 44374.6 149970.8 自由度 3 22 均方离值 14791.5 6816.8 2.17 F值
总和
• •
194345.4
,据
25
F 0 F 0 .0 5 ( 3 , 2 2 )

例如在农业科学试验中,为了提高农作物的收获量,因地制宜的选择 品种,常常需要比较不同品种的种子,施不同种类、不同数量的肥料对农作 物收获量的影响。并从中找出最适宜于该地区的作物品种、肥料的种类和数 量,以提高单位面积的产量。

为了解决这类问题,一般需要做下面两步工作。第一,设计一个实验,
使得这个实验能很好的反映出我们所感兴趣的因素的作用,并使实验的次数 尽可能少,节约人力、物力和时间,这就是正交实验设计;第二,如何充分
p { F F ( r 1, n r ) }
• •
4 )

得到拒绝域 F
F ( r 1, n r ) .
列出方差分析表,计算 方差来源 组间 组内 总和
F0
离差平方和
r
自由度
2
均方离值
SA
2 2
F值
F0 SA SE
2 2
QA

i 1
ni ( X i X )
i i

k

i 1
ni n.
9

当 H 成立时, 1
0
2 r
ni 2
可得到
r

i 1 j 1
( X ij ) Q E Q A n ( X ).
nr
• •
QE
,它有 r 个线性关系
j 1 r
(X
ij
X i ) 0.
QE
1
, X 2 , , X
n
是相互独立同分布的随机量,且同服
n
Q1 Q k

i 1
X
2 i
• •
其中 Q ( i 1, , k ) 为秩为 n i 的 ( X 1 , X 2 , , X n ) 的非负二次型, 则 Q ( i 1, , k ) 相互独立 2 ( n i )
Q Q 为总离方差 ; E 组内离方差; A 组间离方差。
Q T : 描述全部数据离散成都; :
•Q

E
描述 X i j 抽样误差的大小程度;
反映了各母体均值 i 之间差异程度。
QA :
7
• • • • • • •
二)为了作出假设 H 的统计量,下面讨论 Q 和Q 的统计性质。
0
E
A
1 )

QE
方差分析
本章内容: 方差分析的有关概念、自由度的计算;柯赫伦分解定理 (不证);单因素、双因素实验数据方差分析法。 重点: 单因素、双因素方差分析 本章课时: 6~8 课时
1
• •
引言: 在工农业生产及产品试制中,常常需要分析哪几种因素对生产的质量 和产量起显著影响,并希望知道起显著作用的因素在什么时候,对生产起最 好的影响。
i 1 j 1
X
ij


i 1
X
i

1 s
s

j 1
X
j
.
16
• • •
类似假定: X 令
ij
N ( ij ,
2
)
相互独立。
i 1, , r ; j 1, , s .
ij i j ,
r s i
其中
i 1


j 1
F 0 .0 5 (3, 2 2 ) 3 .0 5
0
接受原假设 H ,无显著影响。
12
• 原假设不成立时,需要对未知参数作区间估计
拒绝
H
0
,作出

2
i k (i k )
)
区间估计
ni 2 X j N ( j , ) nj E (X i X j) i j 1 1 2 D(X i X j) ( ) ni nj X i N (i,