统计学总结

  • 格式:docx
  • 大小:102.45 KB
  • 文档页数:12

下载文档原格式

  / 12
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

统计学(Statistics):应用统计学的原理与方法,研究数据的搜集、整理与分析的科学,对不确定性数据作出科学的推断。

医学统计学(Medical Statistics):应用统计学的原理与方法,研究医学科研中有关数据的搜集、整理和分析的应用科学。

统计学方法的特点:

1. 用数量反映质量

2. 统计逻辑:用群体规律估算/推测个体

3. 手段:常通过部分个体估计总体

同质和变异(考试重点)

●同质(homogeneity):据研究目的所确定的所有研究对象的相同属性。例子:身

高、体重、年龄、容貌……

●变异(variation):同质研究单位中变量值间的差异,整个统计学甚至是整个科学研

究存在的基础。

总体、样本和研究单位(考试重点)

●总体(population):是根据研究目的确定的同质研究单位的全体。统计学人员习惯

将其叫做同质研究单位某种变量值的集合,包括有限总体和无限总体。

●样本(sample):是总体中抽取的一部分个体。包括随机抽样和非随机样本。

●样本含量(sample size):样本中包含的研究单位数。

●观察单位(observed unit):也叫个体或研究单位,它是研究中的个体(individual),

完全由研究目的确定。它可以是一个(群)人、一只动物和一个细胞。

变量、变量值和资料(考试重点)

●变量(variable):按特定目的确定的研究单位的某种特征或属性。

●变量值(value of variable):变量的观察或检测结果,也叫变量的观测值。

●资料(data):在特定目的指引下而确定的变量及其变量值。

●计量资料(measurement/quantitative/numerical data):其特征是能够用数量衡量,通

常具体计量单位。按照变量值是否连续又可分为连续型(continuous/interval)和离散型(discrete)两类按特定目的确定的研究单位的某种特征或属性(请举例)。要特别注意比值资料,如细胞凋亡率。

●计数资料(enumeration/qualitative/categorical/ nominal data):是将观察单位按某种属

性或类别分组计数,分组汇总各组观察单位数后而得到的资料。其变量值是定性的,表现为互不相容的属性或类别。按变量值类别的多少又分为二分类和多分类两种类型(举例)。

●等级资料(ordinal categorical/rank/semi-quantitative data):是将观察单位按某种属

性的不同程度分成等级后分组计数,分组汇总各组观察单位数后而得到的资料,其变量值具有半定量性质。(举例,如血清反应强度、疗效)

参数和统计量(考试重点)

●参数(parameter):根据总体中所有个体值计算出来的特征量/指标,一般用希腊字

母表示。

●统计量(statistic):根据样本个体值计算出来的描述的特征量/指标,一般用拉丁字

母表示。

●总体参数一般是不知道的,统计工作的目的是:通过样本统计量估计推测总体参数。

误差、随机误差、系统误差和非系统误差(考试重点)

●误差(error):泛指实际观测值与真值之差,也即样本指标/统计量与总体指标/参数

之差。

●按误差产生的原因分为:系统误差、非系统误差和随机误差。

●系统误差(systematic error):由于仪器未校正、测量者感官的某种障碍、医生掌握

疗效标准偏高或偏低等原因,使观察值不是分散在真值两侧,而是有方向性、系统性或周期性地偏离真值。

●非系统误差(nonsystematic error):由于研究者偶然失误而造成的误差。例如:仪

器失灵、抄错数据、点错小数点、写错单位等,亦称过失误差(gross error)

●测量值= 真值+ 随机误差+ 非随机误差

●随机误差:是一类不恒定的、随机变化的误差,由于多种目前尚无法控制的因素引

起。如:在同一条件下对某一实验进行多次重复,虽极力对其进行控制或消除系统误差后,但实验结果却不尽相同。

●抽样误差(sampling error):由于抽样所造成的样本统计量与总体参数的差别。随机

抽样误差不可避免,具有统计规律性,主要由个体差异(变异)

频率、概率和小概率事件(考试重点)

●频率(relative frequency): 一次随机试验有几种可能结果,在重复进行试验时,各

种结果看来是偶然发生的,但当重复试验次数相当多时,将显现某种规律性。例如,投掷一枚硬币,结果不外乎出现“正面”与“反面”两种

●概率(probability)概率是度量随机事件发生可能性大小的一个数值。设在相同条

件下,独立地重复n次试验,随机事件A出现f次,f/n 则称为随机事件A出现的频率。当n 逐渐增大时,频率f/n趋向于一个常数,则称该常数为随机事件A的概率,可记为P(A),简记为P。概率的取值范围:0≤ P(A)≤1。

●频率是就样本而言的,而概率从总体的意义上说的,频率是概率的估计值。试验次

数(样本含量)越多(越大),估计就越可靠。

●小概率事件: 统计分析中的很多结论都基于一定置信程度下的概率推断,小概率是

研究人员确定的统计判断或决策标准,习惯上将概率小于0.05或0.01定为小概率事件。研究人员认为小概率事件在一次试验中不可能发生,这即是统计决策必须付出的代价。

医学统计工作的基本步骤

1. 设计(design)

●设计阶段主要涉及实验的三要素(对象对象、研究因素、实验效应)、四原则(对照、

随机、重复和均衡)和设计方法。

●包括专业设计和统计设计。根据研究对象的不同可将医学科研设计分为:实验设计、

调查设计和临床实验设计。

2. 收集资料(collection of data)

(1)资料来源

第一手资料:统计报表(传染病报表、职业病报表、医院工作报表、死亡登记、疫