第五章 假设检验(1)
- 格式:ppt
- 大小:149.51 KB
- 文档页数:22
第五章假设检验本章介绍假设检验的基本概念以及参数检验与非参数检验的主要方法。
通过学习,要求:1.掌握统计检验的基本概念,理解该检验犯两类错误的可能;2.熟练掌握总体均值与总体成数指标的各种检验方法;包括:z 检验、t 检验和p-值检验;4.掌握基本的非参数检验方法,包括:符号检验、秩和检验与游程检验;5.能利用Excel 进行假设检验。
第一节假设检验概述一、假设检验的基本概念假设检验是统计推断的另一种方式,它与区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假设检验是以小概率为标准,对总体的状况所做出的假设进行判断。
假设检验与区间估计结合起来,构成完整的统计推断内容。
假设检验分为两类:一类是参数假设检验,另一类是非参数假设检验。
本章分别讨论这两类检验方法。
进行假设检验,首先要对总体的分布函数形式或分布的某些参数做出假设,然后再根据样本数据和“小概率原理”,对假设的正确性做出判断。
这种思维方法与数学里的“反证法”很相似,“反证法”先将要证明的结论假设为不正确的,作为进一步推论的条件之一使用,最后推出矛盾的结果,以此否定事先所作的假设。
反证法所认为矛盾的结论,也就是不可能发生的事件,这种事件发生的概率为零,该事件是不能接受的现实。
其实,我们在日常生活中,不仅不肯接受概率为0的事件,而且对小概率事件,也持否定态度。
比如,虽然偶尔也有媒体报导陨石降落的消息,但人们不必担心天空降落的陨石会砸伤自己。
所谓小概率原理,即指概率很小的事件在一次试验中实际上不可能出现。
这种事件称为“实际不可能事件”。
小概率的标准是多大?这并没有绝对的标准,一般我们以一个所谓显著性水平α(0<α<1)作为小概率的界限,α的取值与实际问题的性质有关。
所以,统计检验又称显著性检验。
下面通过一个具体例子说明假设检验是怎样进行的。
【例5-1】消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。
第五章假设检验5.1 现实中的统计案例一:时下不少大学生在一边学习的同时也不断寻找一些机会打些零工以赚点钱弥补学习和生活之需,这已经是学生们之间人所共知的事情。
这没有丝毫的让人好奇之处,让人好奇的是这些打工的学生究竟一个月平均能赚多少钱?假设有人说:这个数据是500元,你觉得信不信它呢?当然,你首先需要收集证据,没有证据是肯定说明不了任何问题的。
又假设有人通过组织调查取得过如下数据(调查到一共30人,单位:元):350 500 900 100 100 200 240 300 100 320450 260 650 380 290 400 800 400 250 400290 870 540 320 140 160 300 400 500 340 这时你该做何结论?就算是你得到以上数据的平均数等于423元,你是否就可以作出“是”或“不是”的回答?因为你要作出的回答是针对整个总体的,根据却又只是来自部分总体——即样本,所以事实上不论你最终作出的是“是”还是“不是”的回答,其实都存在犯错误的可能。
那么,如何以样本的数据去对总体参数下结论才最科学?才最不容易犯错误呢?这就是一个属于单个总体参数假设检验的问题了,是本章需要解决的问题。
案例二:你可能认为每一个美国人都知道像这样一些简单历史问题的答案“在美国国旗上有多少颗星?有多少条条纹?星代表什么?条纹又代表什么?”。
非常有意思的是,并非每一个人都知道问题的答案,而且当你知道问题的答案时,你也许会大吃一惊的。
1998年美国杂志《Today’s America》就确实做过这么一个调查,所得到的数据肯定多多少少会出乎很多人的意料之外。
下面就是按性别和美国地区列出的知道星的数目的成年人的百分比:男士女士大城市小城镇农村n(知道)72 72 57 56 31n(不知道)22 34 25 16 15在纽约的伊利县里200个成人被问及在美国国旗上有多少颗星。
上面的表现是属于每一类的成人的数目。
第5章假设检验课后习题解答第五章假设检验⼀、选择题1.单项选择题(1)将由显著性⽔平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性⽔平的1/2,这是( B )。
A.单侧检验B.双侧检验C.右单侧检验D.左单侧检验(2)检验功效定义为( B )。
A.原假设为真时将其接受的概率B.原假设不真时将其舍弃的概率C.原假设为真时将其舍弃的概率D.原假设不真时将其接受的概率(3)符号检验中,(+)号的个数与(-)号的个数相差较远时,意味着( C )。
A.存在试验误差(随机误差)B.存在条件误差C.不存在什么误差D.既有抽样误差,也有条件误差(4)得出两总体的样本数据如下:甲:8,6,10,7,8;⼄:5,11,6,9,7,10秩和检验中,秩和最⼤可能值是( C )。
A.15B.48C.45D.662.多项选择题(1)显著性⽔平与检验拒绝域的关系是( ABD )。
A.显著性⽔平提⾼(α变⼩),意味着拒绝域缩⼩B.显著性⽔平降低,意味着拒绝域扩⼤C.显著性⽔平提⾼,意味着拒绝域扩⼤D.显著性⽔平降低,意味着拒绝域扩⼤化E.显著性⽔平提⾼或降低,不影响拒绝域的变化(2)β错误( ACDE )。
A.是在原假设不真实的条件下发⽣的B.是在原假设真实的条件下发⽣的C.决定于原假设与实际值之间的差距D.原假设与实际值之间的差距越⼤,犯β错误的可能性就越⼩E.原假设与实际值之间的差距越⼩,犯β错误的可能性就越⼤⼆、计算题1.某牌号彩电规定⽆故障时间为10000⼩时,⼚家采取改进措施,现在从新批量彩电中抽取100台,测得平均⽆故障时间为10150⼩时,标准差为500⼩时,能否据此判断该彩电⽆故障时间有显著增加(α=0.01)?解:假设检验为H 0:µ0=10000,H 1:µ0<10000(使⽤寿命应该使⽤单侧检验)。
n =100可近似采⽤正态分布的检验统计量z α=0.01⽔平下的反查正态概率表得到临界值2.34到2.36之间(因为表中给出的是双侧检验的接受域临界值,因此本题的单侧检验显著性⽔平应先乘以2,再查到对应的临界值)。