医学统计学基本概念[资料]
- 格式:doc
- 大小:648.02 KB
- 文档页数:7
一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ)推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误):H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。
(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。
安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。
(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。
安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。
标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7。
方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。
第一章医学统计中的基本概念一、医学统计工作的内容:实验设计(experiment design)、收集资料(collecting data)、整理资料(sorting data)和分析资料(analyzing data)二、变异:医学研究的对象是有机的生命体,其功能十分复杂,不同的个体在相同的条件下,对外界环境因素可以发生不同的反应,这种现象称为个体差异或称为变异三、总体(population)和样本(sample):总体是同质的个体所构成的全体。
从总体中抽取部分个体的过程称为抽样,所抽的部分称为样本,在一个样本里含有的个体数可以不同,样本包含的个体数目称为样本容量。
四、样本的特性:代表性(representation)——要求样本能够充分反应总体的特征;随机性(randomization)——需要保证总体中的每个个体都有相同的几率被抽做样本;可靠性(reliability)——实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度;可比性(comparability)——指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。
五、误差:①系统误差(system error)②③六、概率(probability):是描述某一件事发生的可能性大小的一个量度。
习惯将P≤0.05或P≤0.01的事件称为小概率事件第二章集中趋势的统计描述一、频数表(frequency table):①概念:一种格式的统计表,即同时列出观察指标的可能取值区间及其在各区间内出现的频数。
由于这种资料的表达方式较完整地体现了观察值的分布规律,所以也称为频数分布表。
②制作图标的步骤:确定组数、确定组距、确定组段、对各组段计数及手工编制划记表。
二、直方图(histogram):①概念:直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度;各组的组限由横轴标度,条段的宽度表示组距。
医学统计学基础医学统计学是一门研究医学中数据的收集、分析和解释的科学。
它在医学研究中扮演着至关重要的角色,并且对医学实践和决策具有深远影响。
本文将介绍医学统计学的基本概念、常用的统计方法以及其在医学领域的应用。
一、基本概念1.1 总体与样本在医学统计学中,我们常常需要研究某个感兴趣的群体,这个群体被称为总体。
总体可以是人群中的所有个体,也可以是其他单位,如医院、地区等。
由于总体往往很大,我们无法对其进行全面的研究,因此我们从总体中选取一部分个体进行研究,这部分个体称为样本。
1.2 数据类型医学研究中常见的数据类型包括定性数据和定量数据。
定性数据是描述性质或属性的数据,如性别、病情分类等;定量数据是可度量或计数的数据,如年龄、生命体征等。
了解数据类型对选择合适的统计方法至关重要。
1.3 描述统计学与推断统计学描述统计学用于总结和描述已有数据的特征,如均值、中位数、标准差等。
推断统计学则是通过对样本进行分析,推断总体的特征,并对结果进行估计和推断。
推断统计学可通过假设检验和置信区间来实现。
二、常用统计方法2.1 均值与标准差均值是用来描述一组数据集中趋势的指标,一般用于定量数据。
标准差则衡量了数据的离散程度,即数据的波动情况。
2.2 相关分析相关分析用于研究两个变量之间的关系。
通过计算相关系数,可以了解两个变量是正相关、负相关还是无关。
2.3 生存分析生存分析是用来研究事件发生和持续时间的统计方法。
在医学中,生存分析常用于研究患者的生存时间、复发时间等。
2.4 方差分析方差分析用于比较两个或多个组的均值是否存在显著差异。
它适用于一组分类变量和一个连续变量的比较。
三、医学统计学的应用3.1 临床试验设计与分析临床试验是评价药物疗效的重要手段。
医学统计学在临床试验的设计和分析中起到关键作用,如确定样本量、随机分组、双盲试验等。
3.2 流行病学研究流行病学研究可以揭示疾病的发病原因、预后以及控制策略。
医学统计学的方法可以帮助研究者分析大量数据,确定疾病的危险因素和相关性。
统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。
统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。
二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。
变异是同质基础上的观察单位(亦称为个体)之间的差异。
(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。
样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。
(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。
变量值:变量的测得值。
如身高150cm,体重50Kg等。
(四)参数与统计量参数是指总体特征的统计指标。
如某地健康成年男性的平均血红蛋白值。
统计量是指样本特征的统计指标。
如从某地健康成年男性中抽取一部分人的平均血红蛋白值。
(五)误差误差泛指测量值与真实值之差。
根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。
1.系统误差:测量结果有倾向性。
查明原因,可以避免。
特点:①测量结果有倾向性。
如仪器、试剂、判定标准等。
②查明原因,可以避免。
2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。
特点:①随机误差没有大小和方向。
②不可避免。
3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。
特点:变异是绝对的,抽样误差不可避免。
原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。
(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。
随机事件的概率在0~1之间,即0≤P≤1。
小概率事件:P≤0.05或P≤0.01的事件。
医学统计学基础医学统计学是研究医学和健康领域中数据收集、分析和解释的一门科学。
它通过运用概率和统计方法来帮助医学专业人员进行决策,并从数据中提取有用的信息。
本文将介绍医学统计学的基本概念和应用。
一、基本概念1.1 总体与样本在统计学中,总体是指我们想要了解的所有个体或事物的集合,而样本是从总体中抽取的一部分个体。
研究人员通常无法调查整个总体,而是通过对样本的研究来推断总体的一般情况。
1.2 数据类型医学统计学中常用的数据类型包括定类数据和定量数据。
定类数据是以类别或分类方式进行描述的,例如性别、病种等。
定量数据则是以数值方式进行描述的,例如身高、体重等。
这些数据类型的不同决定了在统计分析中所采用的方法和技术。
1.3 描述性统计描述性统计是用来对数据进行总结和描述的统计方法。
通过描述性统计,我们可以了解数据的集中趋势、离散程度和分布形状等。
常见的描述性统计指标包括均值、中位数、标准差和频率分布等。
二、统计推断2.1 抽样误差与抽样分布由于我们只能通过样本来推断总体的情况,样本与总体之间存在抽样误差。
而抽样分布则是指在相同抽样方式下,反复从总体中抽取样本,得到的样本统计量的分布。
抽样分布的特点有助于进行统计推断。
2.2 参数估计参数估计是利用样本统计量来估计总体参数的值。
常见的参数估计方法包括点估计和区间估计。
点估计是使用单个统计量来估计总体参数的值,例如用样本均值估计总体均值。
区间估计则是利用样本统计量来估计总体参数的范围,例如给出一个置信区间。
2.3 假设检验假设检验是用来对总体参数假设进行验证的统计方法。
假设检验可分为参数检验和非参数检验。
参数检验是在对总体参数分布假设的前提下,通过样本统计量计算出一个检验统计量,并根据该统计量判断总体参数的假设是否成立。
非参数检验则不依赖对总体参数分布的假设。
三、相关性和回归分析3.1 相关性分析相关性分析是用来研究两个或多个变量之间关系的统计方法。
通过计算相关系数来衡量变量之间的相关程度。
医学统计学基本概念1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。
2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。
3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。
它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo)上的一切值。
4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。
它是指变量的取值有限的,至多是可列多个。
附:无序分类:二项分类、多项分类5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。
特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值大小,故等级之间不可度量。
6.个体individual:即每个观察单位。
7.总体population:根据研究目的确定的同质观察单位的全体。
8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。
样本包含的观察单位数称为样本含量或样本大小。
9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。
如总体均数、总体标准差等。
特点:参数是未知的,固有的,不变的!10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。
特点:统计量是已知的,变化的,有误差的!11.概率probability:是描述随机事件发生的可能性大小的数值。
常用P表示。
它的大小界于0和1之间。
12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。
13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。
图文《医学统计学》PPT课件目录•医学统计学概述•医学统计学基本概念•描述性统计方法•推断性统计方法•实验设计与分析•临床医学中的统计学应用01医学统计学概述定义与特点定义医学统计学是应用数理统计学的原理和方法,在医学领域中研究数据的收集、整理、分析和解释的一门科学。
特点以医学为背景,以数据为基础,运用统计学方法揭示医学现象的数量特征和规律。
发展历程及现状发展历程医学统计学经历了从描述性统计到推断性统计,再到现代多元统计分析的发展历程。
现状随着计算机技术的发展和大数据时代的到来,医学统计学在医学研究和实践中发挥着越来越重要的作用。
研究对象与任务研究对象医学统计学的研究对象包括生物医学数据、临床医学数据、公共卫生数据等。
任务医学统计学的任务包括描述医学数据的分布特征、比较不同组别间的差异、分析影响医学现象的因素、预测医学现象的发展趋势等。
02医学统计学基本概念总体样本样本量从总体中随机抽取的一部分个体所构成的集合。
样本中所包含的个体数目。
0302 01总体与样本研究对象的全体个体所构成的集合。
随机抽样与非随机抽样随机抽样按照随机原则从总体中抽取样本的方法,保证每个个体被抽中的机会相等。
非随机抽样根据研究者的主观意愿或方便性选择样本的方法,可能导致选择偏倚。
变量与数据类型变量研究中观察或测量的特征或属性。
数据类型根据变量的性质可分为定量数据和定性数据。
定量数据包括连续型数据和离散型数据,定性数据包括分类数据和顺序数据。
统计量与参数统计量描述样本特征的量,如样本均数、样本标准差等。
参数描述总体特征的量,如总体均数、总体标准差等。
通常情况下参数是未知的,需要通过样本统计量进行估计。
03描述性统计方法频数分布表直方图应用场景频数分布表与直方图用于展示数据的分布情况,包括各组数据的频数、频率、累计频数和累计频率。
用矩形的面积表示各组频数,矩形的高度表示每一组的频数密度,宽度则表示组距。
适用于连续变量,可直观地展示数据的分布规律,如偏态、峰态等。
医学统计学知识点汇集总结一、医学统计学概述医学统计学是指运用统计学方法和技术研究医学数据,并分析、解释医学现象的学科。
对于医学研究和临床实践来说,统计学扮演了至关重要的角色,它可以帮助我们从数据中找出规律和关联,了解疾病的发病机制、评估治疗效果、预测疾病的发展趋势等。
医学统计学应用广泛,包括流行病学调查、临床试验、疾病筛查、医疗资源分配等方面。
二、基本统计概念1.总体与样本总体是指研究者希望了解的所有个体或事物的集合,而样本是从总体中抽出的一部分个体或事物。
在医学统计学中,我们往往针对总体的某些特征进行研究,但因为总体过于庞大或难以直接观察,所以需要通过样本来间接推断总体特征。
2.描述统计学与推断统计学描述统计学是通过对样本数据进行整理、汇总和展示,来描述总体的特征。
例如,用均值、标准差、百分比等指标来描述样本的中心趋势、离散程度和分布规律。
推断统计学则是通过对样本数据进行分析和推断,来进行总体参数估计、假设检验和区间估计等操作,从样本的情况推断总体的性质。
3.测量尺度在医学统计学中,常用的测量尺度有四种:名义尺度、序数尺度、区间尺度和比率尺度。
名义尺度用于对个体进行分类,如性别、种族等;序数尺度表达了个体之间的顺序关系,如疾病的分期、疼痛的程度等;区间尺度是指定了单位长度的测量尺度,其间隔是均匀的,但没有绝对的零点,如温度;比率尺度有绝对的零点,可以进行加减乘除运算,如年龄、身高、体重等。
4.受试者特征曲线(ROC曲线)受试者特征曲线(Receiver Operating Characteristic Curve,ROC曲线)常用于评价诊断试验的准确性。
横轴表示假阳性率(1-特异度),纵轴表示真阳性率(灵敏度),曲线下面积(AUC)为对角线以下的面积,用来评价诊断试验在不同判断标准下的表现。
三、数据的搜集与整理1.样本量计算样本量的大小直接关系到研究结果的可靠性和精度。
样本量计算需要根据预期效应大小、显著性水平、统计功效、数据分析方法等因素来确定。
医学统计学医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门科学。
基本概念之一:同质和异质具有相同性质的事物称为同质的(homogeneous)。
否则称为异质的或者间杂的(heterogeneous)。
不同质的个体不能笼统地混在一起分析。
同质和异质是相对的概念。
同质事物之间的差别称为变异(variation)亦称个体变异。
变异的两个方面:个体与个体间的差别;同一个体重复测量值间的差别基本概念之二:变异同质个体间的差异。
结果是随机的,不可预测的。
一种或多种不可控因素(已知的或未知的)作用下的综合表现。
个体变异是普遍存在的。
个体变异是有规律的。
没有个体变异,就没有统计学!基本概念之三:总体和个体总体(population):根据研究目的所确定的同质观察单位的全体;分为有限总体和无限总体。
个体(individual):是构成总体的最基本观察单位;样本(sample):是从总体中按照一定的目的随机抽取的一部分个体。
为什么要抽样?样本含量(sample size):样本中包含的个体个数。
基本概念之四:参数和统计量总体参数(parameter):刻画总体特征的指标;一般用希腊字母表示,如:、统计量(statistic):样本统计指标一般用拉丁字母表示,如:、s在总体被确定之后,总体参数就是一个常数,是不会变化的,不管你是否确切知其大小;而统计量是几乎总是随着样本而变的。
基本概念之五:随机随机(random):是指机会均等,目的是保证样本对总体的代表性、可靠性。
随机抽样有相同的机会被抽到随机分组有相同的机会被分到不同的组中顺序随机先后接受处理的机会相同基本概念之六:频率和概率频率( relative frequency ):在n次随机试验中,事件A发生了m次,则比值称为事件A在这n次试验中出现的频率。
概率的统计学定义:数理统计学中的大数定理表明:当观察次数n越来越大,频率f的随机波动幅度越来越小,并最终趋向于一个常数p:随机事件A发生的概率 (probability)。
第一章医学统计学的基本内容第一节医学统计学的含义1、医学统计学定义医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析的普遍原理和方法。
2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学规律。
3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。
第二节、统计学的几个重要概念一.资料的类型1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。
一般有度量衡单位,每个对象之间有量的区别。
2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。
每个对象之间没有量的差异,只有质的不同。
3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间又有程度的差别。
注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。
二、总体根据研究目的所确定的同质的所有观察对象某项变量值的集合1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。
2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的三、样本从总体中随机抽取部分观察对象,其某项变量值的集合。
从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。
四、随机事件可以发生也可以不发生,可以这样发生也可以那样发生的事件。
亦称偶然事件。
五、概率描述随机事件发生可能性大小的数值,记作P,其取值范围0≤P≤1,一般用小数表示。
P=0,事件不可能发生必然事件(随机事件的特例);P=1,事件必然发生;P→0,事件发生的可能性愈小;P→1,事件发生的可能性愈大六、小概率事件习惯上将P≤0.05或P≤0.01 的随机事件称小概率事件。
表示某事件发生的可能性很小。
七、参数和统计量参数:总体指标,如总体均数、总体率,一般用希腊字母表示统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示八、学习医学统计学的方法1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法;2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。
医学统计学基本概念1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。
2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。
3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。
它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo)上的一切值。
4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。
它是指变量的取值有限的,至多是可列多个。
附:无序分类:二项分类、多项分类5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。
特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值大小,故等级之间不可度量。
6.个体individual:即每个观察单位。
7.总体population:根据研究目的确定的同质观察单位的全体。
8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。
样本包含的观察单位数称为样本含量或样本大小。
9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。
如总体均数、总体标准差等。
特点:参数是未知的,固有的,不变的!10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。
特点:统计量是已知的,变化的,有误差的!11.概率probability:是描述随机事件发生的可能性大小的数值。
常用P表示。
它的大小界于0和1之间。
12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。
13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。
14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的。
这个常数p就称为事件A出现的概率(probability),记作P(A) 或P。
这一定义称为概率的统计定义。
它是事件A发生的可能性大小的一个度量。
容易看出,频率为一变量,是样本统计量,而概率为常数,是一总体参数。
实践中,当试验次数足够多时,可以近似地将频率作为概率的一个估计。
15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。
16.同质(homogeneity):性质相同的事物称为同质的。
17.变异(variation):同质的事物内个体之间或同一个体重复测量间的差别称为变异。
18.参考值范围(reference interval)又称正常值范围(normal range)。
由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值(normal value)。
19.正常值范围(normal ranges),是指绝大多数正常人的某指标范围。
20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。
21.标准误(standard error):样本统计量的标准差称为标准误。
样本均数的标准差称为均数的标准误。
22.参数估计:由样本信息估计总体参数称为参数估计,包括点估计和区间估计。
23.点估计(point estimation) :直接用样本统计量作为总体参数的估计值。
这种估计方法简单,但未考虑抽样误差的大小。
24.区间估计(interval estimation) :按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间(confidence interval, CI),又称置信区间。
这种估计方法称为区间估计。
25.可信度为1-α的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。
如取α=0.05,则每100个样本所算得的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。
26.可信区间的两个要素:第一个要素是可靠性,常用可信度1-α的大小表示;第二个要素是精确性,常用可信区间的长度CU-CL衡量。
27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。
28.可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。
这里的95%,指的是方法本身!而不是某个区间!29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”, 用α来表示。
30.第二类错误(II型错误):不拒绝实际上不成立的H0,称为“假阴性”,用β来表示。
31.检验效能(power of a test)或检验功效:1-β称检验效能(power of a test),过去称把握度。
为当两总体确有差异,按检验水准α所能发现该差异的能力。
1-β只取单尾。
32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,每个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为单因素多个样本均数,单个因素可以有多个水平,R>233.随机区组设计又称配伍组设计(Random Block Design):即两因素多个样本均数的比较(或称两因素方差分析,two way analysis of variance)。
34.绝对数:在计数资料中,各组的观察数称绝对数。
35.相对数:是两个有联系的指标的比,计数资料的统计描述主要是相对数(relative number)。
36.率(rate):说明某现象发生的频率或强度,常用%、‰、1/万、1/10万等作单位,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。
率的结果常以保留1-2位整数为宜。
37.构成比(constituent ratio):说明一事物内部各组成部分所占的比例,常以%来表示。
38.比:也称相对比(relative ratio),两个有关指标之比。
通常以某种现象的数量为1或100作基数,看另一种现象的数量是多少,说明一事物是另一事物的若干倍或百分之几。
两个相比的指标可以性质相同,如时间比、性别比;也可性质不同。
比=A/B39.秩次是指全部观察值按某种顺序排列的位序;秩和:是同组秩次之和。
40.秩变换:将等级变成秩次的方法称为秩变换。
41.秩和检验:就是通过秩次的排列求出秩和,从而对总体的分布进行假设检验的方法。
42.确定性关系:是指两变量间的关系是函数关系。
非确定性关系:是指两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。
相关关系:指既是必然的又是不确定的关系称为相关关系。
当两个变量之间出现如下关系,一个增大,另一个也同时增大,或缩小,我们称这种现象为共变,也就是说两个变量之间有相关关系。
相关关系不一定是因果关系。
相关关系可以是因果关系,也可以是伴随关系。
43.直线相关系数:简称为相关系数,用符号r表示,是用于说明具有直线关系两个变量之间,相关关系的密切程度和相关方向的指标。
44.等级相关的含义:等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系。
45.直线相关:这种直线关系,或分析这种直线关系的理论和方法,统称为直线相关。
46.直线回归: 直线回归是用于研究两个变量x与y之间的线性依存关系的一种统计分析方法。
47.试验研究设计:是指研究者根据研究目的、通过对受试对象施加干预,严格控制各种影响因素,获得干预研究结果。
48.双盲临床试验:是指观察者方和被观察者方在整个试验过程中不知道受试者接受的是何种处理;单盲临床试验是指仅被观察者方处于盲态。
观察者方指的是研究者、参与试验效应评价的研究人员、数据管理人员、统计分析人员;被观察者方指的是受试对象及其亲属或监护人。
双盲双模拟:试验组:试验药+阳性对照药的安慰剂;对照组:阳性对照药+试验药的安慰剂。
医学统计学相关知识1.频数分布表的用途:(1)看出频数分布的两个重要特征:集中趋势、离散趋势(2)揭示资料的分布类型2. 描述定量资料集中趋势的三个指标及其应用条件:(1)均数(也称算术均数):适用于单峰对称分布的资料;(2)几何均数:适用于等比资料、对数正态分布资料;(3)中位数:适用于偏态分布资料、分布不规则或未知分布资料、一端或两端有不确定数据(开口资料)的资料。
3. 描述定量资料离散程度的指标(极差、四分位数间距、标准差、变异系数)及其适用范围:这四个指标均反映定量资料的离散程度。
极差和四分位数间距可用于任何分布(极差常用于描述单峰对称分布小样本分布资料的变异程度,或用于初步了解资料的变异程度;四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度),后者比前者稳定,但均不能综合反映各观察值的变异程度;标准差最常用,要求资料近似服从正态分布;变异系数可用于比较度量单位不同的两组或多组资料的变异度或均数相差悬殊的两组或多组资料的变异度。
4. 正态分布的特征:(1)正态分布是一单峰分布,高峰位置在均数处;(2)正态分布以均数为中心,左右完全对称;(3)正态分布取决于两个参数,即均数μ和标准差σ。
μ是位置参数,μ越大,则曲线沿横轴向右移动;μ越小,曲线沿横轴向左移动。
σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。
(4)有些指标不服从正态分布,但通过适当的变换后服从正态分布;(5)正态分布曲线下的面积分布是有规律的。
5.正态曲线下的面积规律•正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;•对任意正态曲线,按标准差为单位,对应的面积相等;μ-1.64σ~μ+1.64σ内面积为90%;•μ-1.96σ~μ+1.96σ内面积为95%;μ-2.58σ~μ+2.58σ内面积为99%。
•小于μ-3σ的面积为0.13%; 小于μ-2σ的面积为 2.28%; 小于μ-σ的面积为15.87%。
6. 标准误与标准差的关系区别标准差s标准误s x意义个体变异统计量的抽样误差用途正常值范围(x±1.96s)总体均数的可信区间(x±t α, νs x)与n关系n↑s趋于稳定n↑s x趋于0联系 1.两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。