第十章 卡方检验

  • 格式:ppt
  • 大小:583.50 KB
  • 文档页数:43

下载文档原格式

  / 43
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

Table Probability (P) Two-sided Pr <= P
0.0541 0.1217
• P153:例10-2
Statistic Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V
样本率与总体率比较
例: • 全国高血压病调查结果:城市人口高血 压病患病率19.6%; • 某调查获得有高血压病家族史者358人, 其中高血压病者127人(P=35.47%) 问:有高血压病家族史者患病率是否高于 一般人群?
实际(A) 理论(T)
+ 合计 127 231 358 70.168 287.832 358
Chi-Square =57.252
第一节 2× 2表 检验
2
目的:推断两个总体率(构成比)是 否有差别 (和u检验等价)
资料:两样本的两分类个体数排列成四 格表资料
四格表资料检验的专用公式
2
(ad bc) n (a b)(a c)(b d )(c d )
2
分布是一连续型分布,而四格
DF
Value
Prob
1 2.7384 0.0980 1 2.7481 0.0974 1 1.9455 0.1631 1 2.7184 0.0992 0.1414 0.1400 0.1414
Fisher's Exact Test Cell (1,1) Frequency (F) Left-sided Pr <= F Right-sided Pr >= F 68 0.9726 0.0816
两相关样本率检验(McNemar检验)
配对四格表资料的 检验
2
P155:例10-4 :
检验统计量为
(b c) , 1 bc
2 2

2 c
( b c 1) bc
2
, =1
注意:
本法一般用于样本含量不太大的资料。因
为它仅考虑了两法结果不一致的两种情况 (b, c),
如果 值很大,即相对应的P 值很小,若 P ,则反过来 推断A与T相差太大,超出了抽样误差允许的范围,从而怀 疑 H0 的正确性 , 继而拒绝 H0 ,接受其对立假设 H1 ,即 π1≠π2 。
2
2 ( A T ) 值的大小还取决于 由公式还可以看出: T 2 ( A T) 个数的多少(严格地说是自由度ν的大小)。由于各 T 2
2
表资料属离散型分布,由此计算得的

2 统计量的抽样分布亦呈离散性质。为
改善 统计量分布的连续性,则进行
2
连续性校正。
四格表资料 检验公式选择条件:
2
公式;
n 40, T 5,不校正的理论或专用
, 校正公式 n 40, 1 T 5 , 直接计算概率。 n 40 或 T 1
本章教学目的:
推断:
两个总体率或构成比之间有无差别
多个总体率或构成比之间有无差别
两个分类变量之间有无关联性
频数分布拟合优度的检验
检验的基本思想
2
处理组 甲 乙 合 计
发生数
未发生数
合计 a+b c+d n
a c a+c
b d b+d
四格表资料的基本形式
基本思想:可通过 检验的基本公式 来理解。
Fisher's Exact Test Cell (1,1) Frequency (F) Left-sided Pr <= F Right-sided Pr >= F 28 0.9852 0.0994
Table Probability (P) Two-sided Pr <= P
0.0845 0.1628
2
皆是正值,故自由度ν愈大, 值也会愈大;所以只有考虑 2 了自由度ν的影响, 值才能正确地反映实际频数 A和理论频 数T 的吻合程度。
检验的自由度取决于可以自由取值的格子 2 数目,而不是样本含量 n 。四格表资料只有 ,即在周边合计数固定的情 两行两列, =1 况下, 4 个基本数据当中只有一个可以自由 取值。
而未考虑样本含量n和两法结果一致的两种情况 (a, d) 。所以,当 n很大且 a 与 d的数值很大(即
两法的一致率较高), b与 c的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往
往也不大。
第二节
R ×C表 检验
2
行×列表资料
② 两个样本的构成比比较时,有2行C列,称 2×C表; ③ 多个样本的构成比比较,以及双向无序分类资 料关联性检验时,有行列,称为R ×C表。
2 连续性校正仅用于 1 的四格表资料,当 2
时,一般Hale Waihona Puke Baidu作校正。
四格表资料检验的校正公式

2 c
( A T 0.5) T
2
n 2 (| ad - bc | - ) n 2 2 c = (a +b)(c + d )(a + c)(b+ d )
P151:例10-1
DF
Value
Prob
1 3.0922 0.0787 1 2.9330 0.0868 1 1.6871 0.1940 1 3.0250 0.0820 0.2593 0.2510 0.2593
WARNING: 50% of the cells have expected counts less than 5. Chi-Square may not be a valid test.
2
2
( AT ) , (行数-1)(列数 1) T
2
式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。
检验统计量 的吻合程度。
值反映了实际频数与理论频数
若检验假设 H0:π1=π2 成立,四个格子的实际频数 A 与 理论频数T 相差不应该很大,即统计量 2 不应该很大。
Statistic Chi-Square Likelihood Ratio Chi-Square Continuity Adj. Chi-Square Mantel-Haenszel Chi-Square Phi Coefficient Contingency Coefficient Cramer's V