- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非参数检验
6.1 符号检验 6.2 Wilcoxon符号秩检验 6.3 WMW秩和检验 6.4 Kruskal-Wallis检验
什么是非参数检验?
• 非参数检验是相对于参数检验而言的
• 传统的统计推断(参数统计)一般都是在给定或假 设总体的分布形式或分布族,或具有足够大的样本 或已知的总体的某些参数的基础上对总体的未知参 数进行估计或检验。
• 然而在实践中,我们对所研究的总体可能知之不多, 要给出或假设总体的分布十分困难,或者总体的分 布并不满足假定的前提,或者不知道推断时需要的 总体参数值,或者没有足够多的样本。此时,参数 统计的方法不适用,必须应用非参数统计的方法。
• 非参数统计一般不涉及总体参数,也不 依赖于对总体分布作出假定,往往仅依 据数据的顺序量或等级资料等即可进行 统计推断,在实际中得到了极为广泛的 应用。
值为
P(Zz;)而(对z)于双边检验 值为P
2P (Zz)2 (z)
• 例1. 解:
① H0 :Me 23 H1 :Me 23
② d i :0,-5,-1,-2,4,2,-4,-2,1,-6
S 3 S 6 n 9
③a.查表。根据 0.05,n=9查表得临界界
S
域为(2,7)。S 和 均落入界域内,
• Z注意(K:n2当)/ nn较4 大近时似,服二从项标分准布正逼态近分正布态,分我布们,可N (以n2 , n4 ) 用Z检验量进行检验。不过,由于正态分布是连
续分布,所以在对离散的二项分布的近似中,要
用连续性修正量: K 0 .5 n
Z
2ห้องสมุดไป่ตู้
n
4
•
当K
n 2
时取加号,反之取减号。对于单边检验P ,
• ②计算 P 值作出判断
P (K k ) i k 0P (K i) i k 0 C n i i( 1 )n i 2 1 ni k 0 C n i
式中
K m in (S ,S ),km in (s,s),
1 2
• 双侧检验:2P ,拒绝 H 0;2P ,不能拒绝 H 0 • 单侧检验:P ,拒绝 H 0 ;P ,不能拒绝 H 0
即:
• 和数据本身的总体分布无关的检验称为非 参数检验。
– 不假定总体的具体背景分布形式;
– 多根据数据观测值的相对大小建立检验统计量, 然后找到在零假设下这些统计量的分布,看这 些统计量的数据实现是否在零假设下属于小概 率事件。
非参数检验有什么优越性?
• 在总体分布未知时,如果还假定总体有 诸如正态分布那样的已知分布,在进行 统计推断就可能产生错误甚至灾难。
• 1、提出假设。
如H0 :0 H 1 : 0 或 H 1 : 0 或 H 1 : 0 2、作差数d i 。 di xi i 3、求S , S 。d i 0 ,记作 S ; d i 0,记作 S
• 4、作出决策
• ①查表判断
• 根据一定的显著性水平 和符号数目n(nS S )
查《符号检验界域表》求得临界界域,此表是利 用二项分布计算出来的。如果 S 和 S 落在相应的 界域以外(含落在界域点上)表明 S 和S 的差异 很显著。拒绝H 0 ;否则不能拒绝 H 0 。
• 非参数检验总是比传统检验安全(更不 容易拒绝原假设)。
• 但是在总体分布形式已知时,非参数检 验不如传统方法效率高。
非参数检验的应用场合
• 如果需要对定性数据做假设检验,则需要使用非 参数方法
• 如果需要对中位数做检验,则需要使用非参数的 方法。
• 如果需要对统计分布做检验,例如检验数据是否 来自正态总体,检验两个总体的统计分布是否相 同等,则需要用非参数方法。
故 中不位能数拒是2绝3厘H 0 ,米可。以认为该产品直径的
b.计算 值。 P
P(S3)219 i 30C9i 0.2539
2P (K3)0.5078 。由于P 值> 0.05 ,所
以不能拒绝 H
,可以认为该产品直径的
0
中位数是23厘米。
• 例6.2 联合国人员在世界上66个大城市的 生活花费指数(以纽约市1996年12月为 100)按由小至大的次序排列如下。
• 当参数检验需要的假设不成立时, 需要采用非参 数检验方法。特别的,非正态总体、小样本的情 况下,传统的t检验是不能使用的。
符号检验
• 符号检验法是一种最简单的非参数方法,它不要 求知道被检验量的分布规律,仅依据某种特定的 正负号之数目多少来对某种假定作出统计推断, 所以称为符号检验。
• 符号检验法非常直观、简便,常被用于检验总体 的均值、中位数等位置参数是否为某一数值,或 判断总体分布有无变化、是否相同等。
66 75 78 80 81 81 82 83 83 83 83 84 85 85 86 86 86 86 87 87 88 88 88 88 88 89 89 89 89 90 90 91 91 91 91 92 93 93 96 96 96 97 99 100 101 102 103 103 104 104 104 105 106 109 109 110 110 110 111 113 115 116 117 118 155 192
• 这显然是一系列贝努里实验,大于 M e 的样本
点本个 点数 个( 数符 (号 符为号正为,负记。为记S为 )S 与)小均于服M从e均的值样
为1/2,方差为n/4的二项分布 。S 和 S 可以用 作检验统计量,为计算方便,一般取两者中 较小的一个作检验量, 记作 Kmin(S,S)。
Me
检验步骤
0.05
• 分析:如果产品直径的中位数是23厘米,就意味 着样本点 x1,x2, ,(xn 本例n=10)中大于23的概率
P 与于小23于的2情3的 况概 (率连续P 随应机当变相量同的。样如本果点排等除于样M本e 的点概等 率为零,故可以将等于M e 的样本点去掉,相应减
少n),
P P 12。可见,如果产品直径的中位数是23厘 米的假设成立,则每一样本点都以0.5的概率小 于 M e ,也以0.5的概率大于 M e 。
• 尤其在实际中,我们常常会碰到无法用数字去描 述的问题,这时符号检验法就是一种简单而有效 的检验方法。
基本思路
• 例6.1 今从生产线上随机抽取10件产品 进行检验,测得产品的直径数据(单位; 厘米)为:23,18,22,21,27,25, 19,21,24,17。问:能否认为该产品 的直径的中位数( )是M 2e 3厘米?( )