第五章 t检验1
- 格式:ppt
- 大小:2.41 MB
- 文档页数:74
河南大学医学院授课教案首页预防医学教研室教研室主任签名注:教后记放在讲义最后一页。
基本内容第一节假设检验的基本步骤一、假设检验的基本思想在抽样研究中,由于样本所来自的总体其参数是未知的,只能根据样本统计量对其所来自总体的参数进行估计,如果要比较两个或几个总体的参数是否相同,也只能分别从这些总体中抽取样本,根据这些样本的统计量作出统计推断,籍此比较总体参数是否相同。
由于存在抽样误差,总体参数与样本统计量并不恰好相同,因此判断两个或多个总体参数是否相同是一件很困难的事情。
如医生在某山区随机测量了25名健康成年男子的脉搏,平均次数为74.2次/分钟,标准差为5.2次/分钟,但是根据医学常识,一般男子的平均脉搏次数为72次/分钟,问该山区男子脉搏数与一般男子是否不同?要回答这个看似简单的问题并非易事。
这个问题难以从正面直接回答,可以先假定该山区所有男子脉搏数数值组成一个总体,其总体均数和标准差均为未知数,不妨分别以μ、σ表示。
如果我们假设该山区男子的脉搏数与一般地区的男子相同,即属于同一总体,μ=72,所测量的25名男子的平均脉搏数(样本均数)之所以不恰好等于72次/分,是由于抽样误差所致。
如果上述假设成立,则理论上讲,样本均数很可能在总体均数(μ=72)的附近,样本均数远离总体均数的可能性很小。
如果将样本均数变换为t值,则t值很可能在0的附近,t值远离0的可能性很小。
如果t值很小上述假设可能不正确,可拒绝上述假设。
假设检验包括单侧检验和双侧检验两种情况,当根据专业知识已知两总体的参数中甲肯定不会小于乙,或甲肯定不会大于乙时,可考虑用单侧检验,否则,宜用双侧检验。
假设检验中的如何下检验结论(以t 检验为例): 1、单侧检验: 如计算统计量t 为正值αt t ≥ α≤P 拒绝0H ,接受1H αt t < α>P 不拒绝0H 如计算统计量t 为负值αt t -≤ α≤P 拒绝0H ,接受1H αt t -> α>P 不拒绝0H 2、双侧检验:2||αt t ≥ α≤P 拒绝0H ,接受1H 2||αt t < α>P 不拒绝0H 二、假设检验的一般步骤 假设检验一般分为三步:1、建立假设,确定检验水准。
第一章绪论一、名词解释总体个体样本样本含量随机样本参数统计量准确性精确性二、简答题1、什么是生物统计?它在畜牧、水产科学研究中有何作用?2、统计分析的两个特点是什么?3、如何提高试验的准确性与精确性?4、如何控制、降低随机误差,避免系统误差?第二章资料的整理一、名词解释数量性状资料质量性状资料半定量(等级)资料计数资料计量资料二、简答题1、资料可以分为哪几类?它们有何区别与联系?2、为什么要对资料进行整理?对于计量资料,整理的基本步骤怎样?3、在对计量资料进行整理时,为什么第一组的组中值以接近或等于资料中的最小值为好?4、统计表与统计图有何用途?常用统计图、统计表有哪些?第三章平均数、标准差与变异系数一、名词解释算术平均数几何平均数中位数众数调和平均数标准差方差离均差的平方和(平方和)变异系数二、简答题1、生物统计中常用的平均数有几种?各在什么情况下应用?2、算术平均数有哪些基本性质?3、标准差有哪些特性?4、为什么变异系数要与平均数、标准差配合使用?三、计算题1、10头母猪第一胎的产仔数分别为:9、8、7、10、12、10、11、14、8、9头。
试计算这10头母猪第一胎产仔数的平均数、标准差和变异系数。
2、随机测量了某品种120头6月龄母猪的体长,经整理得到如下次数分布表。
试利用加权法计算其平均数、标准差与变异系数。
组别组中值(x)次数(f)80—84 288—92 1096—100 29104—108 28112—116 20120—124 15128—132 13136—140 33、某年某猪场发生猪瘟病,测得10头猪的潜伏期分别为2、2、3、3、4、4、4、5、9、12(天)。
试求潜伏期的中位数。
4、某良种羊群1995—2000年六个年度分别为240、320、360、400、420、450只,试求该良种羊群的年平均增长率。
5、某保种牛场,由于各方面原因使得保种牛群世代规模发生波动,连续5个世代的规模分别为:120、130、140、120、110头。
第五章t-检验第五章 t 检验统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断; 包括假设检验和参数估计。
第⼀节显著性检验的基本原理⼀、显著性检验的意义随机抽测10头长⽩猪和10头⼤⽩猪经产母猪的产仔数,资料如下:长⽩:11,11,9,12,10,13,13,8,10,13 ⼤⽩:8, 11,12,10,9, 8 ,8, 9,10,7=11头, S 1=1.76头; =9.2头, S 2=1.549头。
仅凭 - =1.8头,得出长⽩与⼤⽩产仔数不同的结论是不可靠的。
因为如再随机抽样,⼜可得两样本。
由于抽样误差的随机性,两样本平均数就不⼀定是11头和9.2头,其差值也不⼀定是1.8头。
这种差异有两种原因:品种造成的差异;试验误差(或抽样误差)。
两个总体间的差异⽐较:⼀种⽅法是计算出总体参数进⾏⽐较。
准确,但常常是不可能进⾏的;另⼀种通过样本研究其所代表的总体。
为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:1、离均差的平⽅和∑( x - )2最⼩。
说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。
2、样本平均数是总体平均数的⽆偏估计值,即E ()=µ。
3、根据统计学中⼼极限定理,样本平均数服从或逼近正态分布。
由上所述,⼀⽅⾯有依据由样本平均数和的差异来推断总体平均数µ1 、µ2相同与否,另⼀⽅⾯⼜不能仅据样本平均数表⾯上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。
Xi= µ + εi1x 2x 1x 2x x x 1x 2x εµεµ+=+∑==∑n n x x i i /)(µ1-µ2 处理效应;试验误差( - )。
从试验的表⾯效应与试验误差的权衡⽐较中间接地推断处理效应是否存在,是显著性检验的基本思想。
⼆、显著性检验的基本步骤(⼀)⾸先对试验样本所在的总体作假设假设µ1 = µ2 或µ1 -µ2 =0,意义是试验的表⾯效应:- =1.8头是试验误差,处理⽆效,称为⽆效假设,记作 H 0µ1 = µ2 或µ1 -µ2 =0 , 是被检验的假设,通过检验可能被接受,也可能被否定。
第五章t检验第五章 t 检验前面讲了样本平均数抽样分布的问题。
抽样研究的目的是用样本信息来推断总体特征。
所谓统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检验(test of hypothesis )和参数估计(parametric estimation )二个内容。
由一个样本平均数可以对总体平均数作出估计,但样本平均数包含有抽样误差,用包含有抽样误差的样本平均数来推断总体,其结论并不是绝对正确的。
因而要对样本平均数进行统计假设检验。
假设检验又叫显著性检验(test of significance ),是统计学中一个很重要的内容。
显著性检验的方法很多,常用的有t 检验、F 检验和χ2检验等。
尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。
本章以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍几种t 检验的方法,然后介绍总体参数的区间估计(interval estimation )。
第一节显著性检验的基本原理一、显著性检验的意义为了便于理解,我们用一个具体的例子来说明显著性检验的意义。
随机抽取10头长白猪和10头大白猪的产仔数,数据如下:长白:11,11,9,12,10,13,13,8,10,13 大白:8,11,12,10,9,8,8,9,10,7经计算,得长白猪10头经产母猪产仔平均数1x =11头,标准差S 1=1.76头;大白猪10头经产母猪产仔平均数2x =9.2头,标准差S 2=1.549头。
能否仅凭这两个平均数的差值1x -2x =1.8头,立即得出长白与大白两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。
这是因为如果随机测试10头长白猪和10头长白猪的产仔数,可以多得到两个样本数据。
由于抽样误差的随机性,两个样本的平均值不一定是11和9.2,差值也不一定是1.8。
造成这种差异的原因可能有两个,一个是品种造成的差异,即长白猪和大白猪的本质不同,另一个可能是实验误差(或取样误差)。