医学统计学-名词解释
- 格式:docx
- 大小:29.82 KB
- 文档页数:3
医学统计学名词解释总体:根据研究目的确定的同质的全部研究单位的观测值,即某个随机变量X可取值的全体。
样本:总体中随机抽取的有代表性的部分观察单位其实测量值的集合。
变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
统计量:由样本所算出的统计指标或特征值。
分层抽样:先按对主要研究指标影响较大的某种特征,将总体分为若干类别再从每一层随机抽取一定数量的观察单位,合起来组成样本。
随机抽样:总体中的每一个观察单位都有同等机会进入样本。
整群抽样:是以个体自然集结的或人为划分的群体作为抽样单元,总体中含有K个群,从中用随机化的方法抽取k个群,对抽中的k个群体内所有个体构成调查样本。
系统抽样:又称为等间隔抽样或机械抽样。
首先必须确定总体的范围和样本例数n,将总体等分为n份,每一份k个个体,再从第一份中随机抽取第r号个体,然后依次等间隔地从每份中均抽第r个观察单位组成样本。
抽样误差:由个体变异产生的,随机抽样引起的样本统计量之间以及样本统计量和总体参数之间的差异。
(由于样本的随机性引起的统计量与参数的差别,或同一总体相同统计量之间的差别成为抽样误差)标准差:是描述个体值变异程度的指标,为方差的算术平方根。
标准误(SE):统计学上通常把统计量的标准差称为标准误,是反映样本均数抽样误差大小的指标。
系统误差:是指在同一条件下,多次测量时,误差的大小和符号均保持不变,或当条件改变时,按某一确定的已知规律而变化的误差。
标准化法:采用统一的标准对内部构成不同的各组频率进行调整和对比的方法,称为标准化法。
调整后的率未标准化率,简称标化率,亦称调整率。
Ⅰ类错误:拒绝了实际上成立的HO,这类弃真的错误称为Ⅰ类错误。
Ⅱ类错误:指接受了实际上不成立的HO,这类存伪的错误称为Ⅱ类错误。
参数:反应总体统计学特征的数字。
计数资料:将研究对象按照某种属性的不同程度进行分组,然后计数每组里的观察系数。
医学统计学名词解释1、总体population:根据研究目的确定的所有观察单位的某种变量值的集合。
分为有限总体:是指个数确定,空间、时间范围限制的总体;无限总体:是指个数不确定,没有空间、时间限制的总体2、样本sample:从总体中随机抽取部分观察单位,其测量结果的集合称为样本3、变异:即同质的观察单位之间某项特征所存在的差异4、计量资料measurement data:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类5、计数资料count data:又称定性资料或者无序分类变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料6、等级资料ordinal data:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料7、圆形分布资料:具有周期性或循环性的资料8、抽样误差sampling error:是指由于抽样研究所造成样本统计量与总体参数的差别9、系统误差systematic error:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差10、统计量statistic:是指样本的统计指标11、概率probability:描述随机事件发生可能性大小的数值,用P 表示,0≤P≤112、统计描述:对数据包含的信息加以整理、概括和浓缩,用适当的统计图表和统计指标来表达资料的特征和规律13、平均数average:描述一组变量值的集中位置或平均水平。
常用的平均数有算术平均数、几何平均数和中位数14、算术均数:描述一组数据在数量上的平均水平15、中位数median:将一组观察值由小到大排列,位次居中的那个数16、变异指标:反应一组观察值的离散趋势。
医学统计学名词解释统计名词解释1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。
具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。
医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
---------------------------------------------------------------最新资料推荐------------------------------------------------------医学统计学-名词解释1.总体和样本总体:根据研究目的所确定的同质观察单位的全体。
只包括(确定的时间和空间范围内)有限个观察单位的总体,称为有限总体。
假想的,无时间和空间概念的,称为无限总体。
样本:从总体中随机抽取的部分个体。
2.随机抽样:总体中的每一个观察单位都有同等机会进入样本。
3. 同质:除了实验因素外影响被研究指标的非实验因素相同变异:同质事物间的差别。
由于观察单位通常即为观察个体,故变异亦称为个体变异。
4.抽样误差:由个体变异和抽样造成的统计量与参数之间的差别,称为抽样误差。
5.概率与频率频率:在 n 次随机试验中,事件 A 发生了 m 次,则比值试验的总次数发生的试验次数A==nmf称为事件A在n次试验中出现的频率。
m 称为出现的频数。
1 / 15概率:在重复试验中,事件 A 的频率,随着试验次数的不断增加将愈来愈接近一个常数 p,这个常数 p 就称为事件 A 出现的概率,记作 P(A)或P。
描述随机事件发生的可能性大小的数值,常用 P 来表示。
6.随机变量变量:观察对象个体的特征或测量的结果。
由于个体的特征或指标存在个体差异,观察结果在测量前不能准确预测,故称为随机变量,简称变量。
7.参数和统计量 (总体)参数:描述总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
统计量:由样本所算出的统计指标或特征值。
(统计量描述样本的统计指标) 8.百分位数:是一种位置指标,以 Px表示,一个百分位数 Px 将全部观察值分为两个部分,理论上有 x%的观察值小于 Px 小,有(1-x%)的观察值大于 Px。
10.变异系数:亦称离散系数,为标准差与均数之比,常用百分数表示。
医学统计学名词解释医学统计学:是运用运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。
1、观察单位(observed unit)亦称个体,是统计研究中的基本单位。
2、总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体。
3、有限总体(finite population)明确规定了空间、时间、人群范围内有限个观察单位。
4、无限总体(infinite population)没有时间和空间范围的限制,其观察单位的全体数只是理论上存在的,因而可视为“无限”。
5、抽样(sampling)从总体中抽取部分观察单位的过程。
6、样本从总体中随机抽的的部分观察单位,其实测值的集合。
7、样本含量(sample size)该样本所包含的观察单位数。
8、变量(variable)能表现观察单位的变异性的特性称为变量。
8、同质(Homogeneity):指被研究指标的有关影响因素相同。
8、变异(Variation):指同质基础上的各种观察单位间的异同。
9、变量值(value of variable)或观察值(observed value)变量的观测值称为10、计量资料(measurement data)又称定量资料(quantitative data)或数值变量(numerical variable)资料。
为观测每个观测单位某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般由度量单位。
根据其观测值取值是否连续,又可分为连续型和离散型两类。
11、计数资料(enumeration data)又称定性资料(qualitative data)或无序分类变量资料、名义变量资料。
为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
其变量值是定性的,表现为互不相容的属性或类别。
12、等级资料(ranked data)又称半定量资料或有序分类变量资料。
统计名词解释1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。
具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。
医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
统计学名词解释1.医学统计学(statistics of medicine):是一门用统计学原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
2.总体(population):根据研究目的而确定的同质观察单位的全体。
3.样本(sample):从总体中随机抽得的部分观察单位,其实测值的集合。
4.抽样(sampling):从总体中抽取部分个体的过程。
5.变量(variable):确定总体之后,研究者应对每个观察单位的某项特征进行观察和测量,这种特征能表现观察单位的变异性。
对变量的观测称为变量值(value of variable)或观察值。
6.计量资料(measurements data):又称定量资料或数值变量。
对每个观察单位的某项指标用定量方法测定其数值大小所得的资料。
7.计数资料(enumeration data):又称定性资料或无需分类变量资料。
将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。
8.等级资料(ranked data):又称半定量资料或有序分类变量资料。
将观察单位按照某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。
9.误差(error):泛指实测值于真实值之差,按其产生原因和性质可粗分为随机误差与非随机误差两大类,后者可分为系统误差与非系统误差两类。
10.抽样误差(sampling error):抽样过程中由于抽样的偶然性而出现的误差。
11.参数(parameter):表总体特征的指标。
12.均数(mean):可用于反映一组呈对称分布的变量值在数量上的平均水平。
13.几何均数(geometric mean):可用于反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
14.中位数(median)将n个变量值从小到大排列,位置居于中间的那个数。
15.极差(range):也称全距,即最大值和最小值之差。
16.方差(variance):又称均方差,反映一组数据的平均离散水平。
医学统计学-名词解释统计学1.医学统计学:是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科。
(医学研究的对象主要是人体以及与人体的健康和疾病相关的各种因素)2.同质:性质相同的事物成为同质的,否则成为异质的或间杂的。
(观察单位间的同质性的进行研究的前提,也是统计分析的必备条件,缺乏同质性的观察单位的不能笼统地混在一起进行分析的)3.变异:是指在同质的基础上各观察单位(或个体)之间的差异。
4.总体:总体是根据研究目的所确定的同质观察单位的全体。
5.样本:样本是从总体中随机抽取的部分个体。
(样本中包含的个体数称为样本含量)6.随机:即机会均等,是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施。
(包括抽样随机、分组随机、实验顺序随机)7.统计量:由样本所算出的统计指标或特征值称为统计量。
(反映样本特性的有关指标)8.参数:总体的统计指标或特征值称为参数。
(总体参数是事物本身固有的、不变的,为常数)9.抽样误差:从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。
这种在抽样研究中不可避免。
(抽样误差有两种表现形式:①样本统计量与总体参数间的差异②样本统计量间的差异)10.概率:描述事件发生可能性大小的一个度量,常用P表示,取值为0≤P≤1。
11.频率:用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例0≤f≤1为频率。
显然有 f = m / n12.小概率事件:当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生。
(为进行统计推断的依据)13.定量资料:以定量值表达每个观察单位的某项观察指标,如血脂,心率等。
医学统计学1、Medical Statistics(医学统计学):是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
2、Variable(变量):是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示。
3、Numerical/Quantitative/Measurement date/variable数值变量/定量变量/计量资料/定量资料:是以定量的方式来表示观察单位某项观察指标的大小,所得的资料称之为~,有度量单位。
4、Unordered categorical/Qualitative/Enumeration date/variable无序分类变量/定性变量/计数资料/定性资料:是以定性的方式来表示观察单位某项观察指标,所得的资料称之为~,无固有度量单位。
5、Ordinal categorical/Semi-quantitative/Ranked date/variable有序分类变量/半定量资料/等级资料:是以等级的方式来表示观察单位某项观察指标,所得的资料称之为~,为半定量的观察结果,有大小顺序。
6、Homogeneity(同质):是指事物的性质、影响条件或背景相同或相近。
7、Variation(变异):是指同质的个体之间的差异。
8、Population(总体):是根据研究目的所确定的同质观察单位的全体或集合,分为有限总体和无限总体。
9、Sample(样本):是从总体中随机抽取的一部分观察单位所组成的集合。
10、Random variable(随机变量):是指取值不能事先确定的观察结果。
11、Parameter(参数):是总体特征的统计指标,采用小写的希腊字母,为固定的常数。
12、Statistic(统计量):是样本特征的统计指标,采用拉丁字母表示,由样本信息推算而得,是参数附近波动的随机变量。
13、Random Sampling(随机抽样):为了保证样本的可靠性和代表性,需要采用随机的抽样方法,使总体中每个个体均有相同的机会被抽到。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
1、总体:指所有同质观察单位某种观察值的全体。
分为有限总体和无限总体。
2、样本:是从总体中抽取部分观察单位的观测值的集合。
误差:泛指实测值与真实值之差。
统计量:根据样本算得的某些数值特征。
3参数:是关于总体的某些数值特征。
4、抽样误差:即便采用概率抽样方法抽取样本,但样本只是总体的一部分,这就存在着误差,统计学上将其称为抽样误差。
小概率事件原理:当某事件发生概率小于等于0.05时,统计学习惯上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不能发生。
普查:就是全面调查即调查目标总体中全部调查对象。
抽样调查:是一种非全面调查即从总体中抽取一定数量的观察单位组成样本对样本进行调查。
5、常用的概率抽样方法:单纯随机抽样、系统抽样、整群抽样、分层抽样、具体抽样。
非概率抽样方法:偶遇抽样、立意抽样、定额抽样、雪球抽样等。
6、偶遇抽样:又称便利抽样,是指研究者根据实际现实情况,使用最便利的方法来选取样本,可以抽取偶然遇到的人或选择那些距离最近的、最容易找到的人作为调查对象。
7、根据受试对象的不同,实验可分为动物实验、临床试验和现场试验三类。
8、实验设计的基本原则:对照原则、随机化原则和重复原则。
9随机化原则:是指采用随机的方式,使每个受试对象均有同等机会被抽取或分配到实验组和对照组。
10、重复原则:指在相同实验条件下进行多次实验或观察,以提高实验结果的可靠性。
重复原则主要包括:(1)对多个受试对象进行实验。
(2)对同一受试对象进行重复观测。
准确度:指观察值与真值的接近程度,主要受系统误差的影响。
精密度:指在相同条件下对同一指标进行重复观察时,观察值与其均数的接近程度,其差值受随机误差的影响。
灵敏度:反映其检出真阳性的能力,灵敏度高的指标能将处理因素的效应比较敏感地显示出来。
特异度:反映鉴别真阴性的能力,特异度高的指标不易受混杂因素的干扰。
11、完全随机设计:是采用完全随机化的方法将同质的受试对象分配到各处理组,然后观察各组的实验效应,是一种考察单因素两水平或多水平效应的实验设计方法。
医学统计学名词解释1.总体与样本:总体是根据研究目的确定的同质研究对象的全体。
样本是总体中具有代表性的一部分个体。
2.交叉设计:一种特殊的自身对照设计。
克服了实验前后自身对照由于观察期间各种非实验因素造成的偏倚。
即将观察对象随机分为两组,并使一组对象先接受处理方式A,再接受处理方式B;另一组先接受B,再接受A,两种处理方式在研究过程中交叉进行。
3.方差:离均差平方和与观测例数之比,反映一组数据的平均变异。
4.检验效能:1-β,也称把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。
5.相对比:表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。
6.参数与统计量:总体的指标称为参数,用希腊字母表示;样本的指标称为统计量,用英文字母表示。
7.抽样研究与抽样误差:抽样研究是从总体中随机抽取样本,对样本信息进行研究,从而推断总体的研究方法。
抽样误差是由随机抽样造成的样本指标和总体指标之间、样本指标和样本指标之间的差异;其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本指标直接下结论。
8.概率:概率是某随机事件发生可能性大小(或机会大小)的数值度量。
小概率事件是指P ≤0.05的随机事件。
9.统计推断:根据已知的样本信息来推断总体特征的过程称为统计推断。
10.抽样误差:由个体差异和抽样所导致的样本均数和样本均数之间、样本均数和总体均数之间的差异称为均数的抽样误差。
11.第I类错误:指检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。
其发生的概率为α,为已知。
12.第II类错误:指假设检验H0本来不成立,经过检验后被接受了,即“取伪”。
其发生概率为β,为未知。
13.区间估计:区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。
14.随机化原则:随机化原则包括随机抽样和随机分组。
随机抽样是指保证总体中的每一个个体都有同等的机会被抽出来作为样本。
1.标准化法:为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成的影响。
2.总体与样本:总体是同质的个体所构成的全体。
样本是指从总体中抽取的一部分个体(或按随机化原则从总体中抽出的部分观察单位的某变量值的集合)。
3.负偏态分布:频数分布的高峰向右偏移,长尾向左侧延伸的偏态分布,称为负偏态分布。
4.计数资料与计量资料:计数资料是先将研究对象的观察指标按性质或类别进行分组,然后计数各组该观察指标的数目所得的资料;计量资料是对每个观察对象德观察指标用定量方法测定其数值大小所得的资料。
5.均数的标准误:由抽样而造成的样本均数与总体均数之差异称为均数的抽样误差。
6.齐同可比性:两组间除处理因素不同外,其他可能影响实验结果的因素要求基本齐同。
7.参数与统计量:总体的指标值称为参数。
样本的指标值称为统计量。
8.正偏态分布:频数分布的高峰向左偏移,长尾向右侧延伸的偏态分布,称为正偏态分布。
9.区间估计与点估计:按预先给定的的概率估计未知总体均数的可能范围称为区间估计,用样本统计量直接作为总体参数的估计值称为点估计。
10.standard error of rate:率的标准误。
由抽样而造成的样本率与总体率之差异或各样本率之差异称为率的抽样误差。
11.P值:P值是指在H0规定的总体随机抽得等于或大于(或等于或小于)现有样本统计量值的概率。
(或拒绝H0时可能犯错误的实际概率大小)12.均数抽样误差:由抽样造成的样本均数与总体均数的差异。
13.率和构成比:构成比表示一事物内部各组成部分所占整体的比重。
率为表示某事物发生频率或强度的指标。
14.非参数检验:不考虑总体的参数和总体的分布类型,而对总体的分布或分布位置进行检验的统计方法。
15.P值与检验水准:P值是指在H0规定的总体随机抽得等于或大于(或等于或小于)现有样本统计量值的概率(或拒绝H0时可能犯错误的实际概率大小);检验水准是指在检验前预先人为规定的拒绝H0时可能犯错误的最大概率。
医学统计学名词解释 Company number【1089WT-1898YT-1W8CB-9UUT-92108】1.统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学2.医学统计学:是以医学理论为指导,借助统计学的原理和方法研究医学现象中的数据搜集、整理、分析和推断的一门综合性学科。
3.变量:是指观察个体的某个指标或特征,统计上习惯用大写拉丁字母表示4.同质:是指事物的性质、影响条件或背景相同或相近。
5.变异:是指同质的个体之间的差异6.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
7.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
8.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。
总体参数是固定的常数。
多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。
9.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。
样本统计量可用来估计总体参数。
总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。
10.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
11.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
参数:描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值统计量:统计量是统计理论中用来对数据进行分析、检验的变量总体:是根据研究目的所确定的同质观察单位的全体。
样本:从总体中抽出供研究的观察单位就称为样本。
同质:是指观察单位(研究个体)间被研究指标的影响因素相同。
变量:如果一个变量的取值依赖于某随机现象的基本结果,则称该变量为随机变量,即取值随机会而定的变量,简称变量。
变量值;随机变量的取值称变量值。
变异;即使在同质基础上,个观察单位的特征数值也不尽相同。
计量资料;又称数值变量资料,是用定量方法测定每个观察单位的某项定量指标所得的数据资料。
定性资料;定性资料是以文字、图形、录音、录象等非数字形式表现出来的研究资料。
计数资料;又称分类变量资料,是先将观察对象按某种性质或类别分组,然后清点各组的观察单位数量所得的资料。
统计资料;也称统计信息,是统计部门或单位进行工作所搜集,整理,编制的各种统计数据资料的总称。
小概率事件;把概率很小的随机事件称为小概率事件,一般P小于等于0.05或p小于等于0.01的事件。
均数;是指在一组数据中所有数据之和再除以数据的个数。
平均数;是反映一组同质的数值变量资料的集中趋势或平均水平的指标。
中位数;将数据排序(从大到小或从小到大)后,位置在最中间的数值。
百分位数;如果将一组数据从大到小排序,并计算相应的累计百分位,则某一百分位所对应数据的值就称为这一百分位的百分位数。
四分位间距;是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.抽样误差;由于抽样所致的误差称为抽样误差。
标准差;标准差(Standa rd Deviat ion),也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。
Placebo control :(安慰剂对照)采用一种无药理作用的假药作对照,目的是观察新药治疗时是否痊愈。
Randomization:(随机化)采用随机化的统计方式,使各组受试对象在重要的非处理因素方面具有较好的均衡性,提高实验结果可比性。
包括随机抽样和随机分组。
指研究对象中,或总体中每一个观察单位都有同等机会被选入样本或实验研究的各处理组中。
Replication:(重复 ) 指研究样本要有一定的数量,即在保证研究结果具有一定可靠性的条件下,确定最少的样本例数。
有利于使随机变量的统计规律性充分地显露出来。
Balance :(均衡)指实验组和对照组或各实验组之间,除了处理因素以外,其他一切条件应尽可能相同或一致。
实验组和对照组的非处理因素不均衡,将导致错误的结果。
Completely random design :(完全随机设计)属于单因素研究设计,将受试对象按照随机分配的原则分配到实验组和对照组中,然后给予不同的处理因素,对各组的效应进行同期平行观察,最后比较各组的观察指标有无差别。
Paired design:(配对设计)将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组。
Randomized block design:(随机区组设计)即配伍设计,将几个条件相同的受试对象划成一个区组,区组中观察对象的数量取决于对比组的组数。
将区组中的受试对象采用随机的方法,分配到不同的对比组中,以增强各对比组的均衡性。
Sensitivity:(灵敏度)反映其检出真阳性的能力,指处理因素发生微小的变化,观察指标也能发生相应的变化。
灵敏度高的指标能将处理因素的效应更好地呈现。
Double blind trial:(双盲实验)实验者和参与者都不知道哪些参与者属于对照组、哪些属于实验组。
只有在所有数据被记录完毕之后(在有些情况下是分析完毕之后),实验者才能知道那些参与者是哪些组的。
采用双盲实验是为了要减少偏见和无意识地暗示对实验结果的影响。
1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。
随机抽样是样本具有代表性的保证。
3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。
变异是生物医学研究领域普遍存在的现象。
严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。
4.(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。
计数资料亦称定性资料或分类资料。
其观察值是定性的,表现为互不相容的类别或属性。
如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。
(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。
等级资料又称有序变量。
如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。
统计学
1.医学统计学:
是运用统计学原理和方法研究生物医学资料的搜集、整理、分析和推断的一门学科。
(医学研究的对象主要是人体以及与人体的健康和疾病相关的各种因素)
2.同质:
性质相同的事物成为同质的,否则成为异质的或间杂的。
(观察单位间的同质性的进行研究的前提,也是统计分析的必备条件,缺乏同质性的观察单位的不能笼统地混在一起进行分析的)
3.变异:
是指在同质的基础上各观察单位(或个体)之间的差异。
4.总体:
总体是根据研究目的所确定的同质观察单位的全体。
5.样本:
样本是从总体中随机抽取的部分个体。
(样本中包含的个体数称为样本含量)
6.随机:
即机会均等,是为了保证样本对总体的代表性、可靠性,使各对比组间在大量不可控制的非处理因素的分布方面尽量保持均衡一致,而采取的一种统计学措施。
(包括抽样随机、分组随机、实验顺序随机)
7.统计量:
由样本所算出的统计指标或特征值称为统计量。
(反映样本特性的有关指标)
8.参数:
总体的统计指标或特征值称为参数。
(总体参数是事物本身固有的、不变的,为常数)
9.抽样误差:
从某总体中随机抽取一个样本来进行研究,而所得样本统计量与总体参数常不一致,这种由抽样引起的样本统计量与总体参数间的差异称为抽样误差。
这种在抽样研究中不可避免。
(抽样误差有两种表现形式:①样本统计量与总体参数间的差异②样本统计量间的差异)10.概率:
描述事件发生可能性大小的一个度量,常用P表示,取值为0≤P≤1。
11.频率:
用随机事件A发生表示观察到某个可能的结果,则在n次观察中,其中有m次随机事件A发生了,则称A发生的比例0≤f≤1为频率。
显然有 f = m / n
12.小概率事件:
当某事件发生的概率小于或等于0.05时,统计学上称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生。
(为进行统计推断的依据)
13.定量资料:
以定量值表达每个观察单位的某项观察指标,如血脂,心率等。
14.定性资料:
以定性方式表达每个观察单位的某项观察指标,表现为互不相容的类别或属性,如血型、性别等。
15.等级资料:
以等级表达每个观察单位的某项观察指标,如疗效分级、血粘度、心功能分级等。
第二章、统计资料的整理与描述
1.中位数:
就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。
2.百分位数:
是一种位置指标,以Px表示,一个百分位数Px将全部观察值分为两个部分,理论上有X%的观察值比Px小,有(100-X)%观察值比Px大。
3.变异系数(CV):
也称离散系数,为标准差与均数之比,变异系数没有度量衡单位,常用于比较度量衡单位不同或均数相差悬殊的两组或多组资料的离散程度。
第三章、正态分布和二项分布
1.参考值范围(reference range):
也称正常值范围,即绝大多数正常人的某指标值范围称为该指标的正常值范围。
(这里的“绝大多数”可以是90%、95%、99%等等,最常见的是95%,所谓“正常人”不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群)
第四章、统计推断基础
1.抽样误差:
由抽样引起的样本统计量与总体参数间的差别。
(原因: 个体变异+ 抽样,表现为样本统计量与总体参数间的差别、不同样本统计量间的差别)
2.中心极限定理:
从均数为μ、标准差为σ的正态总体中,独立随机抽取例数为n的样本,样本均数x的分布服从正态分布。
3.标准误(SE):
样本统计量的标准差称为标准误。
4.区间估计:
是按照一定的概率或可信度用一个区间估计总体参数所在的范围,这个范围称作可信度为1—的可信区间(CI),又称为置信区间。
5.第一类错误:
拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误或第一类错误。
6.第二类错误:
不拒绝实际上不成立的H0,这类“存伪”的错误称为Ⅱ型错误或第二类错误。
7.水准(检验水准):
常用表示,在假设检验之前设定的,说明按不超越多大的误差为条件作结论,是犯第一类错误的最大风险。
8.假设检验中的P值:
指由H0所规定的总体作随机抽样,获得等于大于现有样本获得的检验统计量的概率。
P值的大小表明以多大的误差拒绝H0 。
P值越小,风险越小,所得结论的误差也小。
第八章、秩和检验
1.秩次:
是指全部观察值按某种顺序排列额为序。
反映等级的高低。
2.秩和:
是同组秩次之和。
(反映各组秩次的分布位置)3.秩变换:
将等级变成秩次的方法。