统计学第11讲 第11章 两样本显著性检验

  • 格式:ppt
  • 大小:746.50 KB
  • 文档页数:30

下载文档原格式

  / 30
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

8-15
当n→∞时, d 值的分布服从正态分布,d 可看作 从d值总体中抽取的一个样本平均数,因此 d 也服 从正态分布。其总平均:d 1 2
因d X 1 X 2
ˆ Sd
2 Sd n1
8-16 b
这时对 d 的显著性检验即对 X 1 X 2 的显著性 检验,由于Sd2是从样本得到的方差,故用 t 检验:
有两个在某些指标 上相同的男女总体
m f
很容易偶 然获得
从两总体抽取两 样本,多数情况 两组是相似的 有5%的机遇获得 很难获得,大约 0.001的机遇
Xm Xm
Xm X f
X
f
X
f
在双样本情况下,假设我们从一个总体中成对抽取 两个样本,分别计算样本平均数,计算二者之差, 得到差值的分布,就是平均数差值(△)的抽样分布。 见图11.2
1X2
1
X
X
1X 2
2
称为平均数差异的标准误=
2 2 X X
1
2
统计量 z
( X 1 X 2 ) ( 1 2 )
X
服从标准正态分布
1X 2
利用这个标准正态的 z 统计量,可做假设检验
11.2 通过样本数据估计标准误 X 1 X 2
只有总体标准差σ已知时,才能使用 z 检验。但是总 体标准差σ一般是未知的,根据中心极限定理和大样 本下(N≥30或100),z 和t 值之间差异较小,可以采 用 t 检验。 估计标准误:
表11-2 七名高血压患者服用Captopril前后的舒张压 患者 1 药前 98 药后 82 d 16 d2 256 2 3 4 5 6 7 96 140 120 130 125 110 72 90 108 72 80 98 24 50 12 58 45 12 576 2500 144 3364 2025 144 和 819 602 217
第11章 统计推论:两样本
11.1 两个独立样本的统计检验
问题1 1989年前,抑制免疫系统的首选药物是环孢 霉素,1989年末据柳叶刀杂志报道,日本从土壤真 菌中提炼出新药FK506,药效比环孢好,如何证明 这种说法属实呢?
问题2 大部分科研涉及两个或两个以上样本的比较 ,借此判断两样本是否来自不同的总体。如果计算 出两样本平均数不同,能否判断样本来自两个不同 的总体? 答案:不能,结论取决于计算结果。
…….假如这样继续下去,把这些 差值看做一组原始分数,则可以 构建频次分布,这个分布是什么 样的呢?
进一步描述两样本均数差值的分布,即便不是从同 一总体抽取的两个样本,其结论是: 样本平均数差异的分布服从正态分布 样本均数差值的总体平均数=
1 2 样本均数差值的标准差= X X
11.6 独立样本设计与相关样本设计的比较 高血压治疗的案例中,如果采用独立样本设计
X 1 X 2 31
S X 1 X 2 8.033
独立组设计 相关组设计 31 d 31 t 4.206 t 3.859 ˆ S d 7.371 8.033 结论:独立组分母大于相关组的分母,即误差大一些 精确性取决于配对的成功与 否 总之,选用什么样的设计,要看那一种更能好地服 务于研究目的
t X1 X2 S n1
2 d

X1 X2 ( d )2 d2 n n( n 1)
dF=n-1
11.5.2 相关样本 t 检验应用实例 治疗7 位原发性高血压患者,长期服用Captopril, 无人知道这种高血压产生的病因。根据目前初步研 究,Captopril 有镇静剂作用,评价此药,采取有方 向性的假设。 1. H0: d 0 服药后患者的舒张压不变或升高 2 . H1: d 0 服药后患者的舒张压下降 3. 前后组设计,采用 t 检验 4. 显著性水平:α=0.01 ,单尾的检验 5. 抽样分布;服从自由度=N-1=7-1=6的 t 分布 6. 临界区间 | t |≥3.143
配对组设计差值的 t 检验(参考张厚粲P244)
di=X1i-X2i , 其中X1i、X2i 分别表示取自两组的第 i 对数据 d i ( X 1i X 2i ) X 1 X 2 8-14 d n n n 个 d值的方差为:
( d )2 2 d2 (d d ) 2 n Sd n n
9009
ˆ Sd
( d )2 d2 2 Sd 9009 2172 / 7 n n1 n( n 1) 76
54.333 7.371
d 217/ 7 31.000
d 31 .000 t 4.206 ˆ 7.371 Sd
结论:因为 t=4.206>3.143,所以拒绝H0,那么, 我们是否可以作出结论,卡普托利引起疗患者舒张 压的显著变化呢? 不一定,前后组设计的问题之一,就是无法控制安 慰剂效应(也就是说,患者病情好转时因为他们相 信服用此药能使病情有显著改善)。 解决此问题的方法是引入控制组(只服用安慰剂 的组),或更好地使用一个已知效果药物的组来做 对比。利用独立组的 t 检验,此时实验组与控制组 并未进行任何配对。
SX1X 2 S
2 X1
S
2 X2
2 r S X 1 S X 2
如果被试是随机分配到实验环境中的,则 r=0,为 什么?
在很多实验情境下,我们不能随机分配被试到实验 环境中。这时,需要采取前后组设计和配对设计。 前后组设计(before-after designs) 在操作实验变量 前后对被试进行研究的实验设计。 例如在反应时实验中,快的还是快,慢的还是慢。 配对组设计(matched-group designs) 参与研究的被 试根据与因变量有关的某些已知变量相匹配。每一 对中的一个分到实验组,另外一个分到控制组。 配对设计的优点: 1. 保证实验组最初的能力相等。 2. 利用最初能力的相关性,有效减少实验误差。
2 1
X
Y
2 S1
来自百度文库
N ( 2 , ) 样本Y1,Y2,…,Yn
2 2
S
2 2
计算中取样本方差中较大者为分子,较小者为分母 H0:
2 1 2 2
2 S大 F 2 df1=n分子-1,df2=n分母-1 S小
称为方差齐性检验,并且常用单侧检验 实验组 N1=10, 控制组 N2=10, SS1/9=452.1/9=50.23 SS2/9=258.9/9=28.77
SX1X 2
2 2 SX1 SX 2
如果样本量不等,估计的标准误属于有偏估计。 如果两总体σ2未知但已知
2 1 2 2 2
SX1 X 2
SS1 SS2 1 1 n1 n2 2 n1 n2
11-1
但是,如果n1=n2,那么公式简化为:
50.23 F 1.746 28.77 查F分布表,双尾F0.05/2(9,9)=4.03 。 因为1.746<4.03,不拒绝H0,两样本总体方差相等
为什么要关注方差齐性检验呢?
答案:方差不齐说明实验有双重影响(尤其是实验组 的方差大于控制组的方差),较大的方差说明在分布 的两端有更多的极端分数。 敏锐的研究者会发现这个问题,并且以此为基础研 究这样一种可能:即自变量对某些个体有正向作用 ,对另外一些个体有负向作用。 实验研究:焦虑是促进还是妨碍人们在复杂心理任 务中的表现? 答案:焦虑具有双重作用,提高焦虑水平会使其更 加关注自己的任务,另外一些个体则会“崩溃”。
m f
平均数差值△ 的抽样分布
Xm X f
Xm X f
假设一个总体是μ=5.00,σ=0.99 ,采取有放回抽样 。每次抽取两个样本,样本量分别为2和3.
X1=5 X2=6 X 5.5
X1 X 2 ?
=0.5
μ=5.00 σ=0.99
X1=4 X2=4 X3=7
X 5
SX1 X 2
SS1 X 12
2 SS2 X 2
SS1 SS 2 n1 ( n1 1)
( X 1 )2 n1 2 ( X 2 ) n2
=11803-3292/10=258.9 =8461 -2832/10=452.1
( 32.9 28.3) 0 ( X 1 X 2 ) ( 1 2 ) t SX1X 2 258.9 452.1 10 9
=4.6/2.81=1.637
df=18
因为|t |<2.101 ,按照0.05双尾水平不拒绝H0。差别 无统计意义,我们不能肯定先幽默后恐怖对情绪的 影响。 如果样本增大,也许这两组的差异会达到显著性。
图11-3 对一大一小两 个样本平均数差异的 分布,进行两样本平 均数的比较时,样本 大小会影响其差异的 显著性
实验组平均数 X 1 =32.9,控制组平均数 X 2=28.3
1. H0:μ1-μ2=0 2. H1:μ1-μ2 ≠0 3. 统计检验:因为σ未知,所以使用 t 检验
4. 显著性水平:α=0.05 , 双尾 5. 抽样分布:自由度df=n1+n2-2=18的 t 分布 6. 拒绝H0的临界区间:| t |≥2.101
11.5 两个相关样本的统计比较 行为科研的重要问题之一就是数据的变异问题,由于 这种变异,才使我们研究推论统计。 对两个或多个组进行比较,计算集中量数的差异, 问题:“这种差异是否是偶然因素引起的?” 答案:仅凭肉眼观测是无法回答。因为实验组之间有 许多重叠之处。反过来,实验重叠之处是由实验组的 被试本身的表达能力、熟练程度、对测量的不同动机 等引起的。 被试在因变量上的得分至少反映三个影响: 1. 被试执行任务的能力和熟练程度 2. 实验变量的影响:就是我们想要评估的
11.4 t 比率与方差齐性 使用 t 分布的基本假设 1. 平均数差异的抽样分布是正态分布 2. 对 X X 即 S X 的无偏估计
1 2
1
X2
的估计是基于对总体方差
2 1 2 2 3. 方差齐性(homogeneity of variance ) 2
X1
X2
图11-4 等方差
SX1 X 2
其中
SS1 X 12
SS1 SS 2 n1 ( n1 1)
( X 1 )2 n1
2 SS2 X 2
( X 2 )2 n2
11.3 统计假设检验: t 检验 H0:μ1-μ2=0 H1: μ1-μ2≠0
( X 1 X 2 ) ( 1 2 ) t SX1X 2
3. 随机误差:受内外因素影响而产生的并且无法消除 。例如:实验过程中,被试之间的差异、外在的注意 力分散物、注意力的广度与被试动机之类的瞬间波动 大部分研究中,被试之间的个体差异是影响因变量分 数以及这些分数的变异性的主要因素。要尽量减少个 体差异,有助于我们估计实验变量对因变量的影响。 达此目的而常用的方法就是使用相关样本。 11.5.1 相关组之间平均数差异的标准误
X1
不等方差
X2
方差齐性检验 在成组比较中,两总体方差相等称为方差齐性,两 总体方差不等称为方差不齐。检验两组资料的方差 是否齐性,以决定采用适宜的检验统计量。方差齐 性的检验假设如下:
2 2 H 0 : 1 2 H1 : 1 2 2 2
成组 比较
N (1 , ) 样本X1,X2,…,Xn
df=n1+n2-2
11.3.1 t 检验的应用举例 某学者研究先验情绪对后续情绪的影响,将20名 男性被试平分为实验组和控制组两组,实验组先看6 个幽默电视画面,再看5个恐怖画面,控制组仅看恐 怖画面。测验分数越高,则不愉快程度越高,测验分 数 见表11-1.
实验组X 36 31 36 20 41 34 32 34 32 33 和 329 1296 961 1296 400 1681 1156 1024 1156 1024 1089 X2 和 11083 控制组X 29 34 27 33 10 28 26 31 30 35 和 283 841 1156 729 1089 100 784 676 961 900 1225 X2 和 8461