第五章 方差分析

  • 格式:ppt
  • 大小:287.01 KB
  • 文档页数:30

下载文档原格式

  / 30
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因为对多个样本平均数进行方差分析时所作的F-test是假定这些样本皆从
各自的正态总体中抽出的前提下进行的,以完全随机设计为例:
Y11、 Y12、 Y13、┅ ┅ Y1n Y21、 Y22、 Y23、┅ ┅ Y2n ┇ ┇ ┇ ┇┇
Ӯ1 Ӯ2 ┇
S12 S2 2 ┇
N1(μ1,σ12) N2(μ2,σ22) ┇
这些例题所用的原始数据已从其来源和性质进行“把关”,并根据其变化特点 予
以“把握”,使方差的同质(也叫“齐性”)有了一个基本的保证,具体有三 条:
⑴根2据020数/6/7据的来源和性质,判断其是否符合方差分析的正态性假定;
第四节 三个假定与数据转换
一、正态性
指数据的各组观察值必须围绕其相应的平均数作正态分布。
然条件限制或其它原因导致个别小区无法得到观察值时,就可以参照本例按各组
观察值个数不同的数据结构进行分析。
由于取样观察所依据的原理是以概率论中定义的“随机试验”为出发点,因 此,
试验统计中讲授取样调查结果决不算“离题”,也就是说,对教材名称中的“试 验”
一词要全面理解,这是本课程简称“试验统计”比简称“生物统计”好的理由之 一。
由于区组可以不止一个方向,这就产生了两向甚至三向分组数据的分析问题 , 前者最典型的是随机区组试验数据,后者则以拉丁方试验结果为代表,两者都是 经典试验设计与统计分析内容;并且和完全随机试验一样,可以是单因素试验, 也可以是复因素试验。鉴于复因素试验要专门安排一章来讲授,本节只介绍单因 素随机区组和拉丁方试验数据的方差分析。
Yi1、 Yi2、 Yi3、┅ ┅ Yin ┇ ┇ ┇ ┇┇
Ӯi
Si 2


Ni(μi,σi2) ┇
Yk1、 Yk2、 Yk3、┅ ┅ Ykn
Ӯk
Sk 2
Nk(μk,σk2)
换一种说法,就是所得数据的来源和性质须满足以下两点要求:
①各组观察值必须是用随机方法获得的;
②各正态总体的μi与σi2无任何函数关系,或者说μi与σi2彼此Leabharlann Baidu立。
7 (6+8+7)
6 (7+8+7)
8 (7+6+7)
7 (7+6+8)
no6=.98 3
3
3
3
=
7+6
+8+7
本例说明取样调查得到的数据观察结果可按单向分组数据的模型进行方差分
析, 而不论各组取样获得的观察值个数是否相同(参见例5.1)。
实际应用中,某些完全随机试验设计即使各处理的小区个数相同,但因为自
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
第四节 三个假定与数据转换
在显著性检验一章知,针对两个小样本的平均数进行 t-est 时,只有方差 同 质(即两个样本方差 S2 经F-test不显著)的情形才能合并方差进而求算 t 值。 在例5.1中介绍SS、df 的可加性时,对组内SSe、dfe进行分析,知其实质 就 是多个样本的合并方差,既然方差分析说到底依然是对多个样本平均数的两两 差数做若干次连续的显著性检验(SSR-test或q-test),自然也应该在多个样 本 的方差合并之前证实它们同质才行,这可是方差分析的条件问题!即使是多元 统计分析中建立生产过程的回归模型(现代生物统计技术)也少不得这个前提。 但本章从例5.1讲到例5.5,也并没有明示上述前提条件是否存在,这是因 为
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
2020/6/7
第二节 单向分组数据
n 组次数平均数 o 的另一种计算公式:
2020/6/7
第四节 三个假定与数据转换
①各组观察值必须是用随机方法获得的; ②各正态总体的μi与σi2无任何函数关系,或者说μi与σi2彼此独立。 因此,首先务必明确方差分析只能用于经过随机排列(分组)设计获得的试 验数据,或者是通过随机取样得到的调查结果,不能用于顺序排列(分组)设计 获得的试验数据或者未经随机取样得到的调查结果。 二项资料的百分数或统计次数,其实质乃二项总体抽样所得,这类总体 的
第五章 方差分析(一)
• 第一节

• 第二节

• 第三节

• 第四节

方差分析原理
(一个性质、两个分布、三个假定)
单向分组数据
(各组观察值个数有相同和不相同之分)
多向分组数据
(含两向分组、三向分组实例)
三个假定与数据转换
(正态性、可加性、同质性)
2020/6/7
第五章要点提示 方差分析是本课程的重点,它与试验研究 联系最为密切。学习时①要从完全随机设计(单 向分组)的试验数据着手,结合显著性检验的知 识,深刻理解方差分析原理的全部内涵,即一个 性质、两个分布和 三个假定(某些情况下作数 据转换的必要性); ②区分LSR法多重比较与ttest的异同点; ③重点掌握单因素随机区组和拉 丁方试验结果的方差分析法,能熟练地运用字母
方差是平均数的函数,即σi2 = piqi=μi (1-μi),服从的是二项分布;
稀有现象的次数数据,如单位面积内的某种杂草的株数或者昆虫的头数 , 某块载玻片上细菌群落的计数,每毫升溶液中某种微生物个体数,每个显微镜
例5.4 用生长素作用于豌豆,连对照共6个处理。待种子发芽后,分别在每 盆 中移植四株,每组( 一个重复 ) 分为 6 盆,每盆一个处理。试验共4 组, 排于温 室 时只保证同组各盆的环境条件一致。观察值为每盆见第一朵花时记录的四株豌豆 (试验单元)的总节间数,结果如下表,试予方差分析。
2020/6/7
至20于20/6动/7 物试验研究中按交叉设计得到的数据,其方差分析因为是用二水平差
第三节 多向分组数据
试验统计过程中,象前面三例那样只需按不同试验处理( 即一个可控因素 ) 对数据进行分组是很不够的,因为农业及生物学领域所进行的试验研究由于受自 然条件的制约,导致试验所得各观察值出现差异的可控因素决不仅仅局限于试验 因素。比如在实施了局部控制的试验方案设计中,各区组之间的差别就反映了系 统因素效应,此时的试验数据除了要按不同试验处理分组之外,还必须按不同的 区组进行分组。