- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
• 方差
– 离均差:每一观察值与总体均数的差值 (Xμ)为离均差,由于Σ( X-μ )=0,故不能反映 数据的变异。
– 例如,2,6,7,10,36 均数=12.2
离均差的和=(2-12.2)+(6-12.2)+(7-12.2)+(10-12.2)+(36-12.2) =
24
资料仅供参考,不当之处,请联系改正。
0 1
2
3
4
5
系列 1
对数 ( 系列 1)
18
资料仅供参考,不当之处,请联系改正。
• 2、统计推断(inferential statistics)
如何抽样,以及如何由样本信息推断总体特征 问题
– 参数估计(parameter estimation) – 假设检验(hypothesis test)
• 先确定无效假设(H0),如果能拒绝,再接受 备择假设( H1 )
12
资料仅供参考,不当之处,请联系改正。
表1 疗效比较
• 组别
例数
•
有效 无效 合计 有效率 X2 P
• 甲试验
(%)
• 对照组 15 5 20 75
• 治疗组 19 1 20 95 1.765 0.05
• 乙试验
• 对照组 30 10 40 75
• 治疗组 38 2 40 95 6.275 0.05
14
资料仅供参考,不当之处,请联系改正。
– Ⅱ型错误:统计推断不拒绝实际上是 不成立的无效假设(H0),即假阴性。 II型错误的概率用β表示,故又称β错误。
15
资料仅供参考,不当之处,请联系改正。
• 概率(probability) – 事件发生的可能性大小。用p表示,取 值范围在0-1之间。0为不可能发生,1 为必然发生。 – 习惯将P≤0.05的事件称为小概率事件, 可以认为在一次抽样中不会发生
19
资料仅供参考,不当之处,请联系改正。
2.5%
0.5%
μ-2.58σ μ-1.96σ μ μ+1.96σ μ+2.58σ
20
资料仅供参考,不当之处,请联系改正。
• 三、计量资料的统计描述
– 集中趋势的统计描述
• 均数(average)
– 算术均数 – 几何均数 – 加权均数
• 中位数(median)和百分位数 (percentile)
资料仅供参考,不当之处,请联系改正。
卫生统计学基本概念及应用
中国中医研究院 胡镜清
2002/03/20
1
3.16,…..资料仅供参考,不当之处,请联系改正。 0.13,36.78…..., 36.8,0.32,0.28,….. …....
DD CC EE Y=HH36-D1DD.28CCe2x DO CAPI 22 45 6666 55 321 55 1200 HUJI 34 755 642 555 54 32 452 GGH 55 677 555 58 885 332 909
– 离均差平方和: Σ( X-μ )2 则能反映数据 变异的大小
16
资料仅供参考,不当之处,请联系改正。
• 三、统计分析的基本作用
1、统计描述(descriptive statistics)
– 对资料的数量特征及其分布规律进行测定和 描述。
• 统计学指标 • 统计表 • 统计图 • 数学模型
17
资料仅供参考,不当之处,请联系改正。
11% 9% 21%
59%
1000 800 600 400 200
• 有序分类
又称等级资料 如: -、+、++、+++; 无效、有效、显效、痊愈
10
资料仅供参考,不当之处,请联系改正。
• 参数(parameter)和统计量 (statistic)
– 总体——参数 希腊字母表示 – 样本——统计量 拉丁字母表示
11
资料仅供参考,不当之处,请联系改正。
• 抽样误差(sampling error) – 由于个体间的差异,随机抽样后,样 本所测得的指Hale Waihona Puke Baidu(统计量)往往与总 体指标(参数)之间存在差异,这种 由于随机抽样所造成的样本统计量和 总体参数的差异,即为抽样误差。
21
资料仅供参考,不当之处,请联系改正。
– 离散程度的统计描述
• 全距(range, 极差) • 四分位数间距(quartile)
22
资料仅供参考,不当之处,请联系改正。
• 例如: • 2,6,7,10,36 • Range = 34 • Q=QU-QL= 4
23
资料仅供参考,不当之处,请联系改正。
2
资料仅供参考,不当之处,请联系改正。
抽
样
样本
总体
统计描述和推断
3
资料仅供参考,不当之处,请联系改正。
• 一、卫生统计学基本模块
统计的步骤
• 设计(design) • 资料收集(collection of data) • 资料整理(sorting data) • 统计分析(analysis of data)
4
资料仅供参考,不当之处,请联系改正。
– 卫生统计学基本模块
• 统计研究研究设计 • 统计资料的收集、整理、表达与描述 • 定量和定性资料的统计分析 • 相关与回归分析 • 生存分析 • 其他多元统计分析
5
资料仅供参考,不当之处,请联系改正。
• 二、统计学基本概念
–样本与总体
• 总体(population)是指性质相同的研 究对象中所有观察单位某种变量值的集合
• 丙试验
• 对照组 45 15 60 75
• 治疗组 57 3 60 95 9.412 0.01
13
资料仅供参考,不当之处,请联系改正。
• Ⅰ型错误(type Ⅰerror)和Ⅱ型错误 (type Ⅱ error)的水平 – Ⅰ型错误:统计推断拒绝了实际上成 立的无效假设(H0),即假阳性。I型 错误的概率用α表示,故又称α错误。
7
资料仅供参考,不当之处,请联系改正。
– 分类变量:计数资料
• 无序分类
– 二项分类
• 阴性/阳性; • 存活/死亡
– 多项分类
8
资料仅供参考,不当之处,请联系改正。
年龄 <20岁 20-29岁 30-39岁 >39岁
治疗组
5
24
56 2
对照组
6
13
54 11
9
资料仅供参考,不当之处,请联系改正。
• 从总体中随机抽取部分观察单位,某变量 的实测值构成样本(sample)
6
资料仅供参考,不当之处,请联系改正。
–变量(variable)及其分类 – 数值性变量:又称连续性变量、计量
资料
• 如身高:158.2cm 165cm 178.0cm…... • 体重:54.0kg 62kg 75.2kg…...