统计学总结
- 格式:docx
- 大小:102.45 KB
- 文档页数:12
统计学(Statistics):应用统计学的原理与方法,研究数据的搜集、整理与分析的科学,对不确定性数据作出科学的推断。
医学统计学(Medical Statistics):应用统计学的原理与方法,研究医学科研中有关数据的搜集、整理和分析的应用科学。
统计学方法的特点:
1. 用数量反映质量
2. 统计逻辑:用群体规律估算/推测个体
3. 手段:常通过部分个体估计总体
同质和变异(考试重点)
●同质(homogeneity):据研究目的所确定的所有研究对象的相同属性。例子:身
高、体重、年龄、容貌……
●变异(variation):同质研究单位中变量值间的差异,整个统计学甚至是整个科学研
究存在的基础。
总体、样本和研究单位(考试重点)
●总体(population):是根据研究目的确定的同质研究单位的全体。统计学人员习惯
将其叫做同质研究单位某种变量值的集合,包括有限总体和无限总体。
●样本(sample):是总体中抽取的一部分个体。包括随机抽样和非随机样本。
●样本含量(sample size):样本中包含的研究单位数。
●观察单位(observed unit):也叫个体或研究单位,它是研究中的个体(individual),
完全由研究目的确定。它可以是一个(群)人、一只动物和一个细胞。
变量、变量值和资料(考试重点)
●变量(variable):按特定目的确定的研究单位的某种特征或属性。
●变量值(value of variable):变量的观察或检测结果,也叫变量的观测值。
●资料(data):在特定目的指引下而确定的变量及其变量值。
●计量资料(measurement/quantitative/numerical data):其特征是能够用数量衡量,通
常具体计量单位。按照变量值是否连续又可分为连续型(continuous/interval)和离散型(discrete)两类按特定目的确定的研究单位的某种特征或属性(请举例)。要特别注意比值资料,如细胞凋亡率。
●计数资料(enumeration/qualitative/categorical/ nominal data):是将观察单位按某种属
性或类别分组计数,分组汇总各组观察单位数后而得到的资料。其变量值是定性的,表现为互不相容的属性或类别。按变量值类别的多少又分为二分类和多分类两种类型(举例)。
●等级资料(ordinal categorical/rank/semi-quantitative data):是将观察单位按某种属
性的不同程度分成等级后分组计数,分组汇总各组观察单位数后而得到的资料,其变量值具有半定量性质。(举例,如血清反应强度、疗效)
参数和统计量(考试重点)
●参数(parameter):根据总体中所有个体值计算出来的特征量/指标,一般用希腊字
母表示。
●统计量(statistic):根据样本个体值计算出来的描述的特征量/指标,一般用拉丁字
母表示。
●总体参数一般是不知道的,统计工作的目的是:通过样本统计量估计推测总体参数。
误差、随机误差、系统误差和非系统误差(考试重点)
●误差(error):泛指实际观测值与真值之差,也即样本指标/统计量与总体指标/参数
之差。
●按误差产生的原因分为:系统误差、非系统误差和随机误差。
●系统误差(systematic error):由于仪器未校正、测量者感官的某种障碍、医生掌握
疗效标准偏高或偏低等原因,使观察值不是分散在真值两侧,而是有方向性、系统性或周期性地偏离真值。
●非系统误差(nonsystematic error):由于研究者偶然失误而造成的误差。例如:仪
器失灵、抄错数据、点错小数点、写错单位等,亦称过失误差(gross error)
●测量值= 真值+ 随机误差+ 非随机误差
●随机误差:是一类不恒定的、随机变化的误差,由于多种目前尚无法控制的因素引
起。如:在同一条件下对某一实验进行多次重复,虽极力对其进行控制或消除系统误差后,但实验结果却不尽相同。
●抽样误差(sampling error):由于抽样所造成的样本统计量与总体参数的差别。随机
抽样误差不可避免,具有统计规律性,主要由个体差异(变异)
频率、概率和小概率事件(考试重点)
●频率(relative frequency): 一次随机试验有几种可能结果,在重复进行试验时,各
种结果看来是偶然发生的,但当重复试验次数相当多时,将显现某种规律性。例如,投掷一枚硬币,结果不外乎出现“正面”与“反面”两种
●概率(probability)概率是度量随机事件发生可能性大小的一个数值。设在相同条
件下,独立地重复n次试验,随机事件A出现f次,f/n 则称为随机事件A出现的频率。当n 逐渐增大时,频率f/n趋向于一个常数,则称该常数为随机事件A的概率,可记为P(A),简记为P。概率的取值范围:0≤ P(A)≤1。
●频率是就样本而言的,而概率从总体的意义上说的,频率是概率的估计值。试验次
数(样本含量)越多(越大),估计就越可靠。
●小概率事件: 统计分析中的很多结论都基于一定置信程度下的概率推断,小概率是
研究人员确定的统计判断或决策标准,习惯上将概率小于0.05或0.01定为小概率事件。研究人员认为小概率事件在一次试验中不可能发生,这即是统计决策必须付出的代价。
医学统计工作的基本步骤
1. 设计(design)
●设计阶段主要涉及实验的三要素(对象对象、研究因素、实验效应)、四原则(对照、
随机、重复和均衡)和设计方法。
●包括专业设计和统计设计。根据研究对象的不同可将医学科研设计分为:实验设计、
调查设计和临床实验设计。
2. 收集资料(collection of data)
(1)资料来源
第一手资料:统计报表(传染病报表、职业病报表、医院工作报表、死亡登记、疫