统计学:总体均数的估计
- 格式:ppt
- 大小:1.30 MB
- 文档页数:10
第四章 总体均数的估计和假设检验一、教学大纲要求(一) 掌握内容1. 抽样误差、可信区间的概念及计算; 2. 总体均数估计的方法;3. 两组资料均数比较的方法,理解并记忆应用这些方法的前提条件; 4. 假设检验的基本原理、有关概念(如I 、II 类错误)及注意事项。
(二) 熟悉内容 两样本方差齐性检验。
(三) 了解内容1. t 分布的图形与特征;2. 总体方差不等时的两样本均数的比较; 3. 等效检验。
二、教学内容精要(一) 基本概念 1. 抽样误差抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error )。
统计上用标准误(standard error ,SE )来衡量抽样误差的大小。
不同的统计量,标准误的表示方法不同,如均数的标准误用X S 表示,率的标准误用S P 表示,回归系数的标准误用S b 表示等等。
均数的标准误与标准差的区别见表4-1。
表4-1 均数的标准误与标准差的区别均数的标准误标准差意义 反映的抽样误差大小 反映一组数据的离散情况 记法X σ(样本估计值X S )σ(样本估计值S )计算X σ=nσ X S =nSσ =nX 2)(∑-μS=1)(2--∑n X X控制方法增大样本含量可减小标准误。
个体差异或自然变异,不能通过统计方法来控制。
2.可信区间(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:CI 是随机的,总体参数是固定的,所以,CI 包含总体参数的可能性是1-α。
不能理解为CI 是固定随机的,总体参数是随机固定的,总体参数落在CI 范围内可能性为1-α。
当0.05α=时,称为95%可信区间,记作95%CI 。
当0.01α=时,称为99%可信区间,记作99%CI 。
(2)可信区间估计的优劣:一定要同时从可信度(即1-α的大小)与区间的宽度两方面来衡量。
医用统计学-总体均数的估计与假设检验练习题一、名词解释1.抽样误差2.标准误3.置信区间4.第一类错误5.第二类错误二、是非题1.即使变量偏离正态分布,只要样本含量相当大,样本均数也近似正态分布。
()2.同一批计量资料的标准差不会比标准误大。
()3.两次t检验都是对两样本均数的差别做统计检验,一次P<0.01,另一次0.01<P<0.05,就表明前者两样本均数差别大,后者两样本均数差别小。
()4.对两样本均数的差别做统计检验,两组数据具有方差齐性,但与正态分布相比略有偏离,样本含量都较大,因此仍可做t检验。
()5.t检验可用于同一批对象的身高与体重均数差别的统计检验。
()三、最佳选择题1、()小,表示用该样本均数估计总体均数的可靠性大。
D、RE、四分位间距A、CVB、SC、x2、两样本均数比较的t检验,差别有统计学意义时,P越小,说明()。
A、两样本均数差别越大B、两总体均数差别越大C、越有理由认为两总体均数不同D、越有理由认为两样本均数不同E、越有理由认为两总体均数不同3、甲乙两人分别随机数字表抽得30个(各取两位数字)随机数字作为两个样本,求得X1和S12,X2和S22,则理论上()。
A、X1=X 2B、S12= S22C、作两样本均数的t检验,必然得出无差别的结论D、作两方差齐性的F检验,必然方差齐E、由甲、乙两样本均数之差求出的总体均数的95%可信区间,很可能包括04、在参数未知的正态总体中随机抽样,∣X-μ∣≥()的概率为5%。
A、1.96σB、1.96C、2.58D、t0.05,v SE、t0.05,vsx5、某地1992年随机抽取100名健康女性,算得其血清总蛋白含量的均数为74g/L,标准差为4g/L,则其95%的参考值范围()。
A、74±4×4B、74±1.96×4C、74±2.58×4D、74±2.58×4÷10E、74±1.96×4÷106、关于以0为中心的t 分布,错误的是( )。
第六章 总体均数的估计【思考与练习】一、思考题1.什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些? 2.样本均数的抽样分布有何特点? 3.阐述标准差与标准误的区别与联系。
4.如何运用抽样分布规律估计总体均数?5.阐述总体均数的置信区间与医学参考值范围的区别。
二、案例辨析题2005年随机抽取某市400名7岁男孩作为研究对象, 计算得其平均身高为122.5 cm, 标准差为5.0 cm 。
请估计该市7岁男孩身高的总体均数。
某学生的回答如下:“该市2005年7岁男孩平均身高的点估计值为122.5 cm ,按公式),(2/2/S Z X S Z X αα+-计算得到其总体均数的95%置信区间为(112.7, 132.3) cm ”。
请指出学生回答中的不恰当之处。
三、最佳选择题1.表示均数抽样误差大小的统计指标是 A .R B .S C .X SD .CVE .四分位数间距2.关于t 分布,下列叙述错误的是A .t 分布是以0为中心,左右对称的一簇单峰曲线B .自由度越小,曲线越低平C .当自由度为∞时,t 分布就是标准正态分布D .自由度相同时,||t 越大,概率P 值越小E .自由度越大,相同概率的t 界值越大3.从同一总体中随机抽取多个样本,分别估计总体均数的95%置信区间,则精确度高的是 A .均数大的样本 B .均数小的样本 C .标准差小的样本 D .标准误大的样本 E .标准误小的样本4.关于置信区间,下列叙述中错误的是 A .99%置信区间优于95%置信区间 B .置信区间的精确度反映在区间的长度C .当样本含量确定时,准确度与精确度是矛盾的D .置信区间的准确度反映在置信度(1)α-的大小上E .当置信度(1)α-确定时,增加样本含量可提高精确度 5.总体均数的95%置信区间的含义是 A .总体95%的个体值在该区间内 B .样本95%的个体值在该区间内C .平均每100个总体均数,有95个在该区间内D .平均每100个样本(样本含量相同)均数,有95个在该区间内E .平均每100个样本(样本含量相同),有95个样本所得的区间包含总体均数 6.假设某地35岁以上正常成年男性的收缩压的总体均数120.2mmHg ,标准差为11.2 mmHg ,后者反映的是 A .个体变异的大小 B .抽样误差的大小 C .系统误差的大小 D .总体的平均水平 E .样本的平均水平7.上述第6题中,从该地随机抽取20名35岁以上正常成年男性,测得其平均收缩压为112.8 mmHg ,又从该地随机抽取10名7岁正常男孩,测得其平均收缩压为90.5mmHg ,标准差为10.4 mmHg ,则下列说法正确的是 A .112.8mmHg 与120.2mmHg 不同是由于系统误差B .112.8mmHg 与120.2mmHg 不同是由于两总体均数不同C .90.5mmHg 与112.8mmHg 不同是由于抽样误差D .90.5mmHg 与120.2mmHg 不同是由于抽样误差E .90.5mmHg 与112.8mmHg 不同是因为两总体均数不同8.上述第7题中,7岁正常男孩收缩压的总体均数的95%置信区间为 A .90.5 1.9610.4±⨯B .0.05/2,990.5t ±⨯C .120.2 1.9610.4±⨯D .0.05/2,9120.210.4t ±⨯E .0.05/2,9120.2t ±⨯四、综合分析题1.从某疾病患者中随机抽取25例,其红细胞沉降率(mm/h)的均数为9.15,标准差为 2.13。
统计学中的总体均值估计方法统计学是一门研究数据收集、分析和解释的学科。
在统计学中,总体均值是一个重要的概念,它代表了总体中所有个体的平均值。
然而,由于很难获得总体的全部数据,我们通常需要使用样本数据来估计总体均值。
本文将介绍统计学中常用的总体均值估计方法。
一、点估计方法点估计方法是一种通过样本数据来估计总体均值的方法。
最简单的点估计方法是样本均值,即将样本中所有观测值的平均值作为总体均值的估计值。
这种方法的优点是简单易懂,但它只能提供一个估计值,并不能告诉我们这个估计值的准确程度。
为了解决点估计方法的不足,统计学家发展了置信区间估计方法。
二、置信区间估计方法置信区间估计方法是一种通过样本数据来估计总体均值的方法,它提供了一个区间范围,该区间范围内有一定的概率包含真实的总体均值。
置信区间的计算依赖于样本的大小和样本的标准差。
当样本的大小较大时,可以使用正态分布的性质来计算置信区间。
当样本的大小较小时,可以使用t分布来计算置信区间。
置信区间的计算公式为:置信区间 = 样本均值 ±标准误差 ×临界值其中,标准误差是样本标准差除以样本大小的平方根,临界值是根据置信水平和自由度来确定的。
置信区间估计方法的优点是可以提供一个区间范围,告诉我们估计值的准确程度。
但它也有一定的局限性,因为置信区间只提供了一个范围,并不能告诉我们这个范围内的哪个值更接近真实的总体均值。
三、区间估计方法区间估计方法是一种通过样本数据来估计总体均值的方法,它提供了多个区间范围,每个区间范围内有一定的概率包含真实的总体均值。
区间估计方法的计算依赖于样本的大小和样本的标准差,类似于置信区间估计方法。
不同之处在于,区间估计方法使用一系列的置信区间来覆盖可能的总体均值。
区间估计方法的优点是可以提供多个区间范围,告诉我们估计值的不确定性。
但它的计算复杂度较高,需要考虑多个置信区间,并且对于样本较小的情况,可能会导致区间范围过宽。
●统计推断(statistical inference):通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。
●抽样误差(sampling error):由个体变异产生的,随机抽样造成的样本统计量与总体参数的差异,称为抽样误差。
●标准误(standard error of mean,SEM )及X s :通常将样本统计量的标准差称为标准误。
许多样本均数的标准差X s称为均数的标准误,它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
可通过增加样本含量,设计减少标准差来降低标准误。
●可信区间(confidence interval,CI):按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间。
它的确切含义是:可信区间包含总体参数的可能性是1- a ,而不是总体参数落在该范围的可能性为1-a 。
●参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
●假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
●I 型和II 型错误:I 型错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用a 表示;II 型错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用b 表示。
●检验效能:1- b 称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。
●检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(level ofa test),记为a 。
●抽样误差:由个体变异和抽样造成的样本统计量与总体参数的差异为★标准差与标准误的区别标准差与标准误的意义、作用和使用范围均不同。