医学统计学考试重点整理
- 格式:doc
- 大小:49.50 KB
- 文档页数:6
医学统计学重点一.选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为µ1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与ɑ的关系,ɑ是人为规定的,它们之间没有关系; P值↑,ɑ↑(×)4.方差分析自由度v的计算,v总=n-1;v组间=组数(k)-1;v组间=v总-v组间5.理论秩和(n(n+1)/2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(×);有95%的总体参数在该区间内(×);该区间包含95%的总体参数(x);该区间有95%的可能包含总体参数。
(x);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(×);回归系数↑,相关系数↑(×);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-α的可信区间,又称置信区间。
3.P值:拒绝H0时所冒的风险(或“作出拒绝H0 而接受H1 ”结论时冒了P风险)4.ɑ(第一类错误):H0真实时被拒绝(或H0真实时,拒绝H0,接受H1)5.β(第二类错误):H0不真实时不拒绝(或H0不真实时,不拒绝H0)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异; 引进回归方程后, Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。
一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ)推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误):H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。
(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。
安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。
(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。
安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。
标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7。
方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。
一、名解:1、定量资料:以定量值表达每个观察单位的某项观察指标2、定性资料:以定性方式表达每个观察单位的某项观察指标3、等级资料:以等级方式表达每个观察单位的某项观察指标4、总体:是指按研究目的所确定的研究对象中所有观察单位某项指标取值的集合。
5、样本:是指从研究总体中随机抽取具有代表性的部分观察单位某项指标取值的集合。
6、参数:描述某总体特征的指标称为总体参数。
7、统计量:描述某样本特征的指标称为样本统计量。
8、小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件9、小概率原理:其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
小概率原理是进行统计推断的依据。
(8&9常写在一起)10∙变异,是以具有同质性的观察单位为载体,某项观察指标在其单位之间显示的差别。
11标准化率:用统一的标准对内部构成不同的各组频率进行调整和对比,对比后的率为标准化率。
12参考值范围:又称正常值范围,大多数人正常人某观察指标所在的范围。
由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值。
13、抽样误差:由抽样引起的样本统计量与总体参数间的差别。
14、中心极限定理:①从均数为U,标准差为。
的总体中独立随机抽样,当样本含量?增加时,样本均数的分布将趋于正态分布,均数为标准差为。
X②从非正态分布的总体中随机抽样,只要样本含量足够大,样本均数趋于正态分布。
15、统计推断:就是根据样本所提供的信息,以一定的概率推断总体的性质。
16、区间估计/参数估计/可信区间:包括点估计和区间估计,由样本信息估计总体参数。
按一定的概率或可信度(La)用一个区间估计总体参数所在范围。
这个范围称作可信度为l-α的可信区间(ConfidenCeinterval,Cl),又称置信区间。
医学统计学重点说明:本重点仅供参考:不能包括所有选择题考题,名词和简答可信度高,计算题熟练运算过程;同时自己要清楚各种检验方法的基本思想,重点程度与星号数量相关)一、名词解释1、★★★医学统计学:用概率论和数理统计方法研究医学事件的群体特征的一门方法。
2、★总体:根据研究目的确定的同质的研究对象的全体(集合)。
3、样本:从总体中随机抽取的部分研究对象。
4、随机:总体中每个个体有同等的机会进入样本。
5、系统误差:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。
6、随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。
7、★★抽样误差:由于抽样原因造成的样本指标与总体指标之间的差,或者是样本指标与样本指标之间的差。
8、准确度(accuracy)或真实性(validity):观察值与真值的接近程度,受系统误差的影响(9、可靠度(reliabiliy)——也称精密度(precision)或重复性(repeatability):重复观察时观察值与其均值的接近程度,受随机误差的影响。
10、★★★小概率事件:一般常将p ≤ 0.05或p ≤ 0.01称为小概率事件,表示某事件发生的可能性很小。
通俗讲一次抽样是不可能发生的事件。
11、★★正态分布定:又称高斯分布,是一条中间高,两头低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。
12、★★医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。
最常用的是95%参考值范围。
13、★★标准误:用于反映均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。
14、★95%的可信区间:如果从同一总体中重复抽取100个独立样本,将可能有95个可信区间包括总体均数,有5个可信区间未包括总体均数。
二、填空题1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
绪论2选1总体:总体(population)指特定研究对象中所有观测单位旳测量值。
可分为有限总体和无限总体。
总体中旳所有单位都可以标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观测单位,其测量成果旳集合称为样本(sample)。
样本应具有代表性。
所谓有代表性旳样本,是指用随机抽样措施获得旳样本。
3选1小概率事件:我们把概率很靠近于0(即在大量反复试验中出现旳频率非常低)旳事件称为小概率事件P值:成果旳记录学意义是成果真实程度(可以代表总体)旳一种估计措施。
p值是将观测成果认为有效即具有总体代表性旳出错概率。
一般成果≤0.05被认为是有记录学意义小概率原理:一种事件假如发生旳概率很小旳话,那么可认为它在一次试验中是不会发生旳,数学上称之小概率原理。
记录学中,一般认为等于或不不小于0.05或0.01旳概率为小概率。
资料旳类型(3选1)(1)计量资料:对每个观测单位用定量旳措施测定某项指标量旳大小,所得旳资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量旳,表现为数值大小,一般有度量衡单位。
如某一患者旳身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观测单位按某种属性或类别分组,所得旳观测单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观测值是定性旳,体现为互不相容旳类别或属性。
如调查某地某时旳男、女性人口数;治疗一批患者,其治疗效果为有效、无效旳人数;调查一批少数民族居民旳A、B、AB、O 四种血型旳人数等。
(3)等级资料:将观测单位按测量成果旳某种属性旳不一样程度分组,所得各组旳观测单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者旳治疗成果可分为治愈、好转、有效、无效或死亡,多种成果既是分类成果,又有次序和等级差异,但这种差异却不能精确测量;一批肾病患者尿蛋白含量旳测定成果分为+、++、+++等。
医学统计学复习重点统计设计:调查设计、实验设计第一章绪论1.基本概念:总体——根据研究目的确定,所有同质观察单位某种观察值的全体。
样本——总体中抽取的一部分具有代表性的个体组成的集合。
参数-—刻画总体特征的统计指标。
一般用希腊字母表示μ、σ、π统计量—-刻画样本特征的统计指标.抽取的样本不同,统计量会变化;一般用拉丁字母或英文字母表示、S、p抽样误差:个体变异所致,抽样研究中样本信息与总体特征间的差异。
抽样误差是不可避免的。
属于随机误差,无方向性,重复抽样可以呈现一定的规律性。
小概率事件P≤0。
052.*统计工作的四个步骤:设计、收集资料、整理资料、分析资料。
(用工作实例解释)第二章调查研究设计第三章实验研究设计1.调查研究(观察性研究):特点:无人为施加处理因素调查研究的分类:按调查涉及的对象划分:全面调查(普查)、抽样调查、典型调查注意:收集的资料要有可比性*随机抽样方法(做统计推断有意义):单纯随机抽样、系统抽样、分层抽样、整群抽样非随机抽样方法(不能做统计推断,可能有偏差):偶遇抽样、判断抽样、滚雪球抽样等2.实验研究特点:与调查研究最本质的区别:根据研究目的主动施加干预措施实验设计的三个基本要素:受试对象、处理因素、实验效应实验设计的基本原则:对照原则、随机化原则、重复原则第四章定量资料的统计描述第五章定性资料的统计描述1.定量资料(1)定量资料——*频数分布表、直方图、箱式图—-判断分布类型——(2)描述离散趋势的统计指标:✓极差R=最大值—最小值、✓四分位数间距Q:常用于描述*偏态分布资料的离散趋势、一端或两端无确切值的资料、分布不明确资料✓方差(总体、样本S2)&标准差(、S):*正态或近似正态分布✓变异系数(3)(4)正态分布及其应用:**制定医学参考值范围步骤:判断分布类型-—正态分布-—*双侧95%参考值范围:±1.96S、单侧95%参考值范围:下限为—1。
64S、上限为+1。
(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。
②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。
③、等级资料,⼜称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。
2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。
③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发⽣率。
⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。
⽤⼤写的P表⽰。
3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。
第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。
医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。
样本:从总体中随机抽取部分个体的某个变量值的集合。
总体参数:刻画总体特征的指标,简称参数。
是固定不变的常数,一般未知。
统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。
抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。
频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。
称m/n为事件A在n次试验中出现的频率或相对频率。
概率:频率所稳定的常数称为概率。
统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。
统计推断:包括参数估计和假设检验。
用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。
用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。
2.样本特点:足够的样本含量、可靠性、代表性。
3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。
是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。
每个个体都能观察到一个观察指标的数值,有度量衡单位。
(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。
包括二分类资料和多分类资料。
二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。
多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。
4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。
第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。
3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。
1.简述总体和样本的定义,并且举例说明。
总体是研究目的确定的所有同质观察单位的全体。
样品是从研究总体中抽取部分有代表性的观察单位。
2.简述参数和统计量的定义,并且举例说明。
描述总体特征的指标称为参数,描述样本特征的指标称为统计量。
3.变量的类型有哪几种?举例说明各种类型变量有什么特点。
①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。
②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。
③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。
4.请举例说明一种类型的变量如何变换为另一种类型的变量。
定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。
≤6.举例说明什么是配对设计。
配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。
①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。
7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。
8.简述P 25 P 50 P 75的统计学意义。
(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。
9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。
10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。
第一章绪论一、名词解释1.设计(design):根据研究的问题与目的,从统计学的角度对各步提前做出的周密计划和安排。
2.收集资料(data collection):获得研究所需要的原始数据的过程。
3.整理资料(data storing):对收集到的原始资料进行归类整理汇总的过程。
4.分析资料(data analysis):对整理的资料进行统计分析,获取资料中有关信息的过程。
5.总体(population):根据研究目的确定的,所有同质研究对象某一(组)指标值的集合6.样本(sample):从总体中随机抽取的,数量足够的能代表总体特征的部分研究对象某一(组)指标值的集合。
7.参数(parameter):描述总体特征的指标称为参数。
8.变异(variation):对同质研究对象某指标值得波动性称为变异。
9.误差(error):观测值与真实值之差。
10.变量(variable):描述研究对象某种特征的指标。
11.资料(data):变量全部或部分测量值构成资料12.计量资料(measurement data):每个研究对象的变量值为一数值,表现出有量的大小,由这样一组研究对象定量观测值所构成的资料为计量资料。
13.计数资料(enumeration data):每个研究对象的变量值为互不相同的属性之一,由这样一组研究对象定性变量值组成的资料为技术资料。
14.等级资料(ranked data):每个研究对象变量值为互不相容的属性之一,且这些属性间有程度的递进或递减关系,有这样一组研究对象变量值组成的资料为等级资料。
15.过失误差:由科研工作者的失误或过错造成的误差。
16.系统误差(systematic error):在收集资料的过程中,由于研究者或被研究者、仪器设备、检测用材料、检测方法、环境条件等原因,造成观测结果偏大或偏小,称作系统误差。
17.随机误差(random error):在没有过失误差和系统误差的条件下仍存在大量偶然无法消除的不确定因素所引起的误差为随机误差。
1. 变异:同质事物之间的差别。
2. 频数分布的两个特征:集中位置,离散趋势3. 数据分布的类型:对称分布和非对称分布。
非对称分布又称偏态分布,包括正偏态和负偏态。
单峰分布,双峰分布,多峰分布。
4. 统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。
5. 集中位置的描述,集中位置指标又称平均数指标。
有哪些及适用条件?(1) 算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料 (2) 几何平均数:适用于 ①等比资料 ② 对数正态分布资料(3) 中位数和百分位数:适用于 ①偏态分布的资料 ②开口资料 ③资料分布不明等 6. 离散趋势的描述四分位数间距,适用于单峰小样本资料方差和标准差,适用于对称分布尤其是正态分布资料变异系数,常用于 ①比较度量衡单位不同的两组或多种资料的变异度 差悬殊的两组或多组资料的变异度7. 常用相对数(1 )率,是二分类指标(2)构成比(3)比 8. 正确应用相对数应注意几个问题:分析时不能以构成比代替率对观察单位数不等的几个率,不能直接相加求其总率计算率时要注意资料的同质性,对比分析时应注意资料的可比性 也有抽样误差,需要假设检验。
9. 率的标准法(1) 基本思想:采用统一的标准,以消除病情构成不同对治愈率比较的影响,使算得的标准化治愈率有可比性。
(2) 目的:控制混杂因素对研究结果的影响。
10.正态分布 (1)概念P16X(2)标准正态分布,U 变换:u=,u 是标准正态离差,卩是均数,b 是标准差。
(1) 全距亦称极差,适用于单峰小样本资料②比较均数相 (1) 计算相对数的分母不宜过小U 〜N (0, 1)(3) 正态分布的特征:① 是单峰分布,高峰位置在均数 X=u 处。
② 以均数为中心,左右完全对称。
③ 取决于两个参数,均数卩和标准差b 。
卩为位置参数,卩越大,则曲线沿横轴向右移动; 卩越小,则曲线沿横轴向左移动。
t1nν=-一、描述集中位置的指标应用适用范围【简】平均数:算数均数、几何均数、中位数、百分位数。
1、算数平均数:适用于单峰对称分布或近似于单峰对称分布的资料2、几何均数:适用于对数变换后单峰对称的资料。
eg.等比资料、滴度资料、对数正态分布资料3、中位数:理论上可用于任何分布资料,但当资料适合计算均数或几何均数时,不宜用中位数。
Eg:偏态分布、分布不明资料、有不确定值的资料.4、百分位数:适用于任何分布的资料。
二、描述离散趋势的指标【简】变异度:极差、四分位数间距、标准差、方差、变异系数。
1、极差:又称全距,是一组数据中最大值和最小值之差。
极差大说明资料的离散度大。
优点:简单明了缺点:不灵敏和不稳定。
样本例数相差悬殊时,不适宜比较其极差。
2、四分位数间距:即中间一半观察值的极差。
四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。
3、标准差:基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。
在同质的前提下,标准差大,表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;标准差小,表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。
4、方差:利用了所用的信息,与变异度和变量值的个数有关。
5、变异系数(CV):变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。
三、正态分布特征1、单峰分布;高峰在均数处;2、以均数为中心,均数两侧完全对称。
3、正态分布有两个参数(parameter),即位置参数 (均数)和变异度参数 (标准差)。
4、有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。
5、正态曲线下的面积分布有一定的规律。
四、参考值范围(含义+原则)【简】1、含义:(1)又称正常值范围,是绝大多数正常人的某观察指标所在的范围。
绝大多数:90%,95%,99%等等。
(2)确定参考值范围的意义:用于判断正常与异常。
医学统计学考试重点简答 4-5个讨论分析1-2题计算 1-2题考试题型:名词解释10个选择20个填空题 20个绪论2选1总体:总体(population)指特定研究对象中所有观察单位的测量值。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。
p值是将观察结果认为有效即具有总体结果?0.05被认为是有统计学意义代表性的犯错概率。
一般小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表 12现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(10/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
一、描述集中位置的指标应用适用范围【筒】平均数:算数均数、几何均数、中位数、百分位数。
1、算数平均数:适用于单峰对称分布或近似于单峰对称分布的资料2、几何均数:适用于对数变换后单峰对称的资料。
eg∙等比资料、滴度资料、对数正态分布资料3、中位数:理论上可用于任何分布资料•,但当资料适合计算均数或几何均数时,不宜用中位数。
Eg:偏态分布、分布不明资料、有不确定值的资料.4、百分位数:适用于任何分布的资料。
二、描述离散趋势的指标【简】变异度:极差、四分位数间距、标准差、方差、变异系数。
1、极差:又称全距,是一组数据中最大值和最小值之差。
极差大说明资料的离散度大。
优点:简单明了缺点:不灵敏和不稳定。
样本例数相差悬殊时,不适宜比较其极差。
2、四分位数间距:即中间一半观察值的极差。
四分位数间距较全距稳定,常与中位数一起,描述不对称分布资料的特征。
3、标准差:基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、总结地、平均地描述了变量值的离散程度。
在同质的前提下,标准差大,表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;标准差小,表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。
4、方差:利用了所用的信息,与变异度和变量值的个数有关。
5、变异系数(CV):变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。
三、正态分布特征1、单峰分布;高峰在均数处;2、以均数为中心,均数两侧完全对称。
3、正态分布有两个参数(Parameter),即位置参数_(均数)和变异度参数_(标准差)。
4、有些指标本身不服从正态分布,但经过变换之后可以服从正态分布。
5、正态曲线下的面积分布有一定的规律。
四、参考值范围(含义+原则)【简】1、含义:(1)又称正常值范围,是绝大多数正常人的某观察指标所在的范围。
绝大多数:90%,95%,99%等等。
(2)确定参考值范围的意义:用于判断正常与异常。
医学统计学考试重点难点整理实验设计的基本原则对照(control)对受试对象不施加处理因素的状态。
在确定接受处理因素的实验组时,要同时设立对照组重复(replication)相同实验条件下进行多次实验或多次观察。
整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。
作用是估计变异大小和降低变异随机化(randomization)采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。
I类错误 (假阳性错误) 真实情况为 H0 是成立的,但检验结果为 H0 不成立,这样的错误称为 I 类错误。
其发生的概率用表示。
在假设检验中作为检验水准。
一般取 0.05 或 0.01。
II类错误 (假阴性错误) 真实情况为 H1 是成立的,但检验结果为 H1 不成立,这样的错误称为 II 类错误。
其发生的概率用表示。
由于其取值取决于 H1 ,因此在假设检验中无法确定。
变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。
数值越大,说明数据越离散,反之越集中。
极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation) ;变异系数(coefficient of variation平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。
算术均数(arithmetic mean );几何均数(geometric mean);中位数(median);众数 (mode)单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。
每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。
按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。
最常用的方法是等距抽样分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。
1. 用样本均数推论总体均数95%可信区间的公式是(总体标准差未知且样本量较小) A x v s t x ,05.0±2. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时: E 接受备择假设3. 两个样本均数比较t 检验(α=0.05),当|t|>t 0.05,(ν)时,统计结论为 CC 两总体均数不同 4. 两个样本均数比较t 检验,分别取以下检验水准,其中第二类错误最小的是 BA α=0.05B α=0.2C α=0.1D α=0.035.两个样本均数比较t 检验,无效假设是 DD 两总体均数相等6. 两个样本均数比较t 检验(α=0.05),当“拒绝H0,接受H1”时,P 值越小 EE 越有理由认为两总体均数不同7. 两个样本均数比较t 检验时,每个变量同时加上一个不为“0”的常后,其t 值 AA 变大 8. 检验效能是指A αB 1- αC βD 1-βE 以上都不对9. 第一类错误是指 A 拒绝实际上成立的H010. 第二类错误是指 D 接受实际不成立的H111. 要使两类错误同时减少的方法是 AA 增加样本量 12. 以下何种情况进行单侧检验 AA 已知A 药肯定优于B 药 13. 以下何种情况进行单侧检验 AA 已知21χχ> 14. 在进行t 检验时,P 值和α值的关系 EE α值是研究者事先确定的15. 在配对t 检验中 EE 当不拒绝H0时,差值的总体均数可信区间一定包含016.统计中所说的总体是指: AA 根据研究目的确定的同质的研究对象的全体17.概率P=0,则表示 BB 某事件必然不发生 18.抽签的方法属于 DD 单纯随机抽样 19.测量身高、体重等指标的原始资料叫:BB 计量资料 20.某种新疗法治疗某病患者41人,治疗结果如下:治疗结果 治愈 显效 好转 恶化 死亡治疗人数 8 23 6 3 1该资料的类型是: D 有序分类资料21.样本是总体的 C 有代表性的部分 22.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤: C 整理资料23.统计工作的步骤正确的是 C 设计、收集资料、整理资料、分析资料24.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:BB 系统误差25.以下何者不是实验设计应遵循的原则 D 交叉的原则26.表示血清学滴度资料平均水平最常计算 B 几何均数27.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C M28.各观察值均加(或减)同一数后: B 均数改变,标准差不变29.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时),问该食物中毒的平均潜伏期为多少小时? C 630.比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是: D 变异系数31.下列哪个公式可用于估计医学95%正常值围 A X±1.96S32.标准差越大的意义,下列认识中错误的是B观察个体之间变异越小33.正态分布是以E均数为中心的频数分布34.确定正常人的某项指标的正常围时,调查对象是B排除影响研究指标的疾病和因素的人35.均数与标准差之间的关系是E标准差越小,均数代表性越大36.从一个总体中抽取样本,产生抽样误差的原因是A总体中个体之间存在变异37.两样本均数比较的t检验中,结果为P<0.05,有统计意义。
医学统计学重点一.选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为µ1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与ɑ的关系,ɑ是人为规定的,它们之间没有关系; P值↑,ɑ↑(×)4.方差分析自由度v的计算,v总=n-1;v组间=组数(k)-1;v组间=v总-v组间5.理论秩和(n(n+1)/2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(×);有95%的总体参数在该区间内(×);该区间包含95%的总体参数(x);该区间有95%的可能包含总体参数。
(x);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(×);回归系数↑,相关系数↑(×);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-α的可信区间,又称置信区间。
3.P值:拒绝H0时所冒的风险(或“作出拒绝H0 而接受H1 ”结论时冒了P风险)4.ɑ(第一类错误):H0真实时被拒绝(或H0真实时,拒绝H0,接受H1)5.β(第二类错误):H0不真实时不拒绝(或H0不真实时,不拒绝H0)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异; 引进回归方程后, Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围。
1、同质:是指观察单位或观察指标受共同因素制约的部分2、观察单位:亦称个体,是统计研究中最基本的单位3、变异:在同质的基础上个体间的差距4、总体:根据研究目的所确定的同质观察单位的全体,既是同质的所有观察单位某项观察值的集合5、有限总体:总体若受一定的时间和空间控制,其观察单位数是有限的,称为有限总体无限总体:理论上其观察单位数是无法穷尽的6、样本:是指从总体中随机抽取部分观察单位其某项指标实测值的集合7、抽样:从总体中抽取部分个体的过程称为抽样8、抽样必须遵循随机化原则,即总体中每一个体都有同等的机会被抽取到9、抽样研究的方法,利用样本的信息推论总体的特征来达到研究目的10、参数:描述总体特征的量11、统计量:根据样本个体值计算得到的描述样本特征的量12、总体参数是常数,而样本统计量可随样本不同而不同13、随机误差:指一类不恒定、随机变化的误差,有多种尚无法控制的因素所引起14、抽样误差:指抽样引起的样本统计量与总体参数之间的差异15、系统误差:在实际观测过程中,由于仪器未校正、观测者感官的某种倾向、研究者掌握的标准偏高或偏低等原因,使观察值不是随机分散在真值两侧,而是具有方向性、系统性或周期性的偏离真值,这类误差称为系统误差16、过失误差:指各种失误所导致的误差17、随机事件:在一定条件下某一现象可能发生也可能不发生的事件18、概率:反映某一随机事件发生可能性大小的量,用符号P表示19、小概率事件:统计学上一般把P≤0。
05的事件称为小概率事件,表示某事件发生的可能性很小20、变量:观察单位的某个特征21、变量值:变量的观察结果或测定值22、按变量值是定性的还是定量的,可将变量分为数值变量和分类变量23、数值变量又称定量变量,其变量值是用定量方法测得的,所的资料是计量资料24、分类变量又称定性变量,其变量值是用定性方法测得的25、分类变量根据类别是否有程度上的差别,可分为无序分类变量(构成的资料为计数资料)和有序分类变量(所得资料为等级资料)25、医学统计工作的基本步骤:一、设计;二、收集资料;三、整理资料;四、分析资料26、统计表和统计图是描述统计资料的重要工具27、统计表的结构:①标题位于统计表的上中方②标目用来说明表内各纵横数字的含义,注意标明指标的单位。
χ2分布的特点:χ2分布是一种连续型分布,其形状依赖于自由度ν的大小:①当自由度ν≤2时,曲线呈L型;②随着ν的增加,曲线逐渐趋于对称;③当自由度ν→∞时,χ2分布趋向正态分布。
假设检验的基本思想:先提出假设(例:参数相等),在假设成立的前提下考察实际抽到的样本是否属于小概率事件,由此对提出的假设进行验证。
若属于小概率事件,则拒绝该假设;否则不拒绝该假设。
方差分析的基本思想:按照研究目的和设计类型,将观察值总变异的离均差平方和(SS)和自由度(γ)分别分解成若干个部分,并用每一部分的均方(MS=SS/γ)作为反映变异的指标。
其中一部分变异主要反映个体变异造成的抽样误差,其余每一部分变异反映某个处理因素不同水平间的变异。
假定各观测值均独立地来自同方差的正态分布总体,当所研究的处理因素各水平间总体均数相等(H0成立)时,则相应部分变异与误差部分变异的比值服从F( 1,2)分布,因此可根据检验统计量F值做出假设检验的推断结论。
χ2检验的基本思想:首先根据检验假设H0计算各格子的理论频数,用22()A TTχ-=∑反映各格实际频数与理论频数的吻合程度。
若H0成立,理论上实际频数与理论频数应相等,但由于抽样误差的存在,样本中的A与T不会完全相等,但应相差不大,即在一次抽样中得到较大χ2值的概率很小。
若由现有样本得到了较大的χ2值(大于界值χ2(α,ν)),则按α检验水准拒绝H0,接受H1;否则不拒绝H0。
多个样本率比较的χ2分割法的基本思想:利用χ2值的可加性原理,把2×k表分割成多个独立的四格表,这些四格表的自由度之和等于原2×k表的自由度,其χ2值之和近似等于原2×k表的χ2值。
当进行多个样本率的两两比较时,为了保证假设检验中犯Ⅰ性错误的概率不变,须重新规定检验水准α,因分析目的不同,k 个样本率两两比较的次数不同,故重新规定检验水准的估计方法亦不同。
等级相关的基本思想:对于不符合正态分布的资料或等级资料,将两个变量的原始观察值分别由小到大编秩,然后利用量变量的秩次之差计算相关系数。
一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ) 推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。
(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。
安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。
(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。
安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。
标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7.方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。
(方差分析的基本思想:把全部观察值间的变异按设计类型的不同,分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义)二、问题1.集中趋势与离散趋势描述的常用指标、适用范围与优缺点㈠描述集中趋势的常用指标:①均数(资料呈正态或近似正态)优点:反映一组同质观察值的平均水平,并可作为样本的代表值与其他样本资料进行比较;在描述正态分布的特征方面有重要意义;缺点:因均数易受到极端值的影响,故不适用于描述偏态分布资料的集中位置。
②几何均数(呈倍数关系的等比资料或对数正态分布(正偏态)资料)优点:能正确描述观察值数值相差极大甚至达到不同数量级的集中位置(如:血清抗体滴度、细菌计数、体内某些微量元素含量);缺点:因为0不能取对数,所以数据中若有0则不宜直接使用几何均数。
③中位数(适合各种类型的资料尤其适用于:大样本偏态分布资料;资料有不确定数值;资料分布不明)优点:不受极端值影响,适用于各种类型资料;缺点:不能代表全体数据的水平。
㈡描述离散趋势的常用指标①极差(可用于各种分布的资料)优点:是最简单的变异指标,可用于各种分布的资料;缺点:只涉及两个极端值没有利用全部数据的信息,不能反映组内其他观察值的变异。
②四分位数间距(偏态分布、两端无确切值或分布不明资料)优点:能反映去除两端各四分之一数据后中间一半观察值的变动范围;缺点:不能完全反映全体数据观察值的变动范围。
③方差标准差(正态)优点:反映总变异程度;缺点:数值大小易受平均水平大小的影响。
④变异系数(观察指标单位不同;同单位资料,但均数相差悬殊)优点:消除了因统计量单位不同、均数相差很大、数据分布的集中位置相差很远造成的影响;缺点:变异系数只是一个相对离散指标。
2. Poisson分布的性质①总体均数μ与总体方差σ²相等时Poisson分布的重要特征;②当n很大,而π很小,且nπ=μ为常数时,Poisson分布可看做是二项分布的极限分布;③当μ增大时,Poisson分布渐进正态分布;④Poisson分布具备可加性;⑤μ的大小决定了Poisson分布的图形特征。
3.检验的注意事项①数据应该来自设计科学严密的实验或调查;②数据应该满足假设检验方法的前提条件;③正确理解假设检验中概率P值的含义;④结论不能绝对化;⑤统计学意义与实际意义。
4.直线回归与相关分析的区别与联系㈠区别:①资料要求:直线相关性分析要求x、y服从双变量正态分布;直线回归分析要求在给定某个x值时y值服从正态分布②应用:说明两变量间的相互关系(互依关系)用直线相关分析;说明两变量的数量依存关系用直线回归分析③意义:相关系数r说明具有直线关系的两变量间相互关系的方向与密切程度;回归系数b表示x每改变一个单位所引起的y的平均该变量④计算公式:r=lxy/√lxxlyy,b=lxy/lxx⑤取值范围:﹣1≤r≤1,﹣∞<b<∞⑥单位:r没有单位,b有单位。
㈡联系:①对于服从双变量正态分布的同一组数据,即可做直线相关分析又可做直线回归分析,计算出的b与r正负号一致;②相关系数与回归系数的假设检验等价,即对于同一样本,tb=tr;③对于服从双变量正态分布的同一组资料,其相关系数r与回归系数b可以相互换算:r=bSx/Sy;④用回归可以解释相关。
决定系数R²=SS回/SS总,为相关系数的平方。
5.应用相对数的注意事项①不能以构成比代替率;②计算相对数的分母不宜过小,小则直接描述;③相对数的比较应注意其可比性;④应分别将分子分母合计求平均率;⑤样本率或构成比的比较应作假设检验。
6.率的标准化的基本思想和应用率的标准化的注意事项率的标准化的基本思想:就是采用统一的标准构成,以消除年龄、性别病情轻重及病程长短等因素构成不同对病死率、死亡率、治愈率等的影响,使算得的标准化率具有可比性。
应用率的标准化的注意事项:①选择的标准不同,计算出的标准化率也不相同;②标准化率仅适用于相互间的比较,实际水平应采用未标准化率来反映;③样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否不同,需作假设检验;④各年龄组若出现明显交叉,则不适合采用标准化法,宜分层比较各年龄组率;⑤对于因其他条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。
对于符合参数统计设计分析条件者,采用非参数统计分析,其经检验较能较低8.标准误与标准差的区别与联系标准差均数的标准误区别统计符号总体标准差用Ϭ表示均数的标准误用Ϭx 表示样本标准差用S表示其估计值用S x 表示计算公式S=√∑(X-X )/(n-1) S x =S/√n统计学意义标准差越小个体观察值标准误越小,反映间变异程度越小抽样误差越小用途描述个体值的变异程度描述均数的抽样误差大小联系S x =S/√n三、填空题1.实验设计的三要素与四原则三要素:受试对象、处理因素、实验效应四原则:对照、随机化、盲法、重复2.方差分析与两小样本t检验的应用条件方差分析的应用条件:独立;正态;方差齐性(当组数为2时,方差分析与两均数比较的t检验是等价的,t=√F)两小样本t检验的应用条件:正态;方差齐性(若方差不齐,则用t’检验)3.调查研究设计的基本内容主要包括哪些①明确调查目的和指标;②确定调查对象和观察单位;③确定调查方法;④确定调查方式;⑤确定调查项目和调查表;⑥制定资料整理分析计划;⑦制定调查的组织计划。
4.变量变换的目的①使资料转换为正态分布;②使资料达到方差齐性;③使曲线直线化。
5.完全随机设计与随机区组设计方差分析变异分解完全随机设计:SS总=SS组间+SS组内,v总=v组间+v组内随机区组设计:SS总=SS处理+SS区组+SS误差,v总=v处理+v区组+v误差6.变异系数的适用条件①观察指标单位不同,如身高、体重;②同单位资料,但均数相差悬殊。
7.正态分布、标准正态分布、二项分布与Poisson分布的表示正态分布:N(μ,σ²)标准正态分布:N(0,1)二项分布:x ~B(n,p)Poisson分布:x ~p(μ)四、简答题㈠配对设计资料的x ²检验(不独立样本)①制四格表(书P142)②建立检验假设,确定检验水准Ho:B=C,即两种方法的检测结果相同H1:B≠C,即两种方法夫人检测结果不同α=③计算x ²值和自由度当b+c≥40, x ²=(b-c) ²/b+c , v=1当b+c﹤40, x ²=(|b-c|-1) ²/b+c , v=1④确定P值,作出统计推断查表得:界值x ²=,故P><,按α=水准,接受()拒绝(),差异有/无统计学意义,可以认为两种方法的检测结果相/不同。
㈡完全随机设计的x ²检验(独立样本)①制四格表(书P134)②建立检验假设,确定检验水准Ho:π1=π2,即两种药物的有效率相同H1:π1≠π2,即两种药物的有效率不同α=③计算x ²值和自由度(实际频数A,理论频数TRC=nRnC/n,v=(R-1)(C-1) )Ⅰ当n≧40且T≧5时,x ²=∑(A-T)²/T或x ²=(ad-bc) ²n/(a+b)(c+d)(a+c)(b+d),v=1;Ⅱ当n≧40且1≦T<5时,用校正的X²值:x ²=∑(|A-T|)²/T,v=1或x ²=(|ad-bc|-n/2) ²n/(a+b)(c+d)(a+c)(b+d)或用四格表的确切概率法;Ⅲ当n<40或T<1时,用四格表的确切概率法。
④确定P值,作出统计推断查表得:界值x ²=,故P><,按α=水准,接受()拒绝(),差异有/无统计学意义,可以认为两种药物的有效率相/不同。
五、选择题1.整群抽样与分层抽样的区别:书P152.抽样误差大小关系:书P16,整群抽样误差≥单纯随机抽样误差≥系统抽样误差≥分层抽样误差检验的应用条件:书P914.相关分析应用中应注意的问题:书P168最佳选择题1、2。