总体均数的估计汇总
- 格式:ppt
- 大小:949.50 KB
- 文档页数:34
第二节 总体平均数的区间估计由于前提条件不同,例如,是否知道总体分布,是否知道总体方差,是大样本还是小样本,是重复抽样还是不重复抽样等,因此,对总体平均数估计的公式也是有所不同的,从而有必要对它们进行阐述。
一、样本取自总体方差已知的正态分布设总体服从正态分布,即:x ~()σ2μ,N ,那么x 的抽样分布仍是正态分布,分布的平均数μ=μx,标准差n x σ=σ。
经过变换,变量σΞ/)μ-(=x z 则服从标准正态分布。
若置信水平是1-α,由于:α-1=⎪⎭⎫⎝⎛<μ-σ2σξζξ∏因此α-1=⎪⎪⎭⎫⎝⎛σ+≤μ≤σ-2α2ανξνξ∏ζζ当抽样得到某一具体样本平均数的估计值ξ时,若规定置信水平为α-1,则总体平均数µ的估计区间为⎪⎪⎭⎫⎝⎛σ+σ-2α2ανξνξζζ,对于上面的区间作如下解释:如从服从正态分布的总体中取出一个容量为n 的简单随机样本,并构造区间⎪⎪⎭⎫ ⎝⎛σ+σ-2α2ανξνξζζ,,那么有)%(α-1100100的把握说这个区间包含总体平均数μ,其中ζ2α值为概率度,它与给定的置信水平有关,可以通过查正态分布表得到。
注:不论μ取什么值,在ξ的全部数值中,μ落入估计区间()σσ+-ξξξξ,,()σσ2+2-ξξξξ,和()σ3σ+3-ξξξξ,的可能性分别是68.27%,95.5%和99.73%。
二、总体平均数区间估计的步骤归纳如下(1)确定置信水平。
即可靠性或把握程度,一般来说对于估计要求比较精确的话,置信程度也要求高一些;(2)根据置信度并利用标准正态分布表确定ζ2α值;(3)抽取一个容量为n 的样本;(4)计算出样本平均数ξ和标准差σξ。
在重复抽样时,样本平均数的标准差为νξσ=σ;有限总体不重复抽样时,1--σ=σννN νξ。
(5)构造置信区间⎪⎪⎭⎫ ⎝⎛σ+σ-2α2ανξνξζζ,例3 某单位希望估计1546包原材料的平均重量,从中抽取的100包原材料组成的随机样本所给出的平均值4567=.ξ千克,总体的标准差932=σ.千克。
统计学中的总体均值估计方法统计学是一门研究数据收集、分析和解释的学科。
在统计学中,总体均值是一个重要的概念,它代表了总体中所有个体的平均值。
然而,由于很难获得总体的全部数据,我们通常需要使用样本数据来估计总体均值。
本文将介绍统计学中常用的总体均值估计方法。
一、点估计方法点估计方法是一种通过样本数据来估计总体均值的方法。
最简单的点估计方法是样本均值,即将样本中所有观测值的平均值作为总体均值的估计值。
这种方法的优点是简单易懂,但它只能提供一个估计值,并不能告诉我们这个估计值的准确程度。
为了解决点估计方法的不足,统计学家发展了置信区间估计方法。
二、置信区间估计方法置信区间估计方法是一种通过样本数据来估计总体均值的方法,它提供了一个区间范围,该区间范围内有一定的概率包含真实的总体均值。
置信区间的计算依赖于样本的大小和样本的标准差。
当样本的大小较大时,可以使用正态分布的性质来计算置信区间。
当样本的大小较小时,可以使用t分布来计算置信区间。
置信区间的计算公式为:置信区间 = 样本均值 ±标准误差 ×临界值其中,标准误差是样本标准差除以样本大小的平方根,临界值是根据置信水平和自由度来确定的。
置信区间估计方法的优点是可以提供一个区间范围,告诉我们估计值的准确程度。
但它也有一定的局限性,因为置信区间只提供了一个范围,并不能告诉我们这个范围内的哪个值更接近真实的总体均值。
三、区间估计方法区间估计方法是一种通过样本数据来估计总体均值的方法,它提供了多个区间范围,每个区间范围内有一定的概率包含真实的总体均值。
区间估计方法的计算依赖于样本的大小和样本的标准差,类似于置信区间估计方法。
不同之处在于,区间估计方法使用一系列的置信区间来覆盖可能的总体均值。
区间估计方法的优点是可以提供多个区间范围,告诉我们估计值的不确定性。
但它的计算复杂度较高,需要考虑多个置信区间,并且对于样本较小的情况,可能会导致区间范围过宽。
●统计推断(statistical inference):通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断。
●抽样误差(sampling error):由个体变异产生的,随机抽样造成的样本统计量与总体参数的差异,称为抽样误差。
●标准误(standard error of mean,SEM )及X s :通常将样本统计量的标准差称为标准误。
许多样本均数的标准差X s称为均数的标准误,它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
可通过增加样本含量,设计减少标准差来降低标准误。
●可信区间(confidence interval,CI):按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间。
它的确切含义是:可信区间包含总体参数的可能性是1- a ,而不是总体参数落在该范围的可能性为1-a 。
●参数估计:指用样本指标值(统计量)估计总体指标值(参数)。
参数估计有两种方法:点估计和区间估计。
●假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
●I 型和II 型错误:I 型错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用a 表示;II 型错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用b 表示。
●检验效能:1- b 称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。
●检验水准:是预先规定的,当假设检验结果拒绝H0,接受H1,下“有差别”的结论时犯错误的概率称为检验水准(level ofa test),记为a 。
●抽样误差:由个体变异和抽样造成的样本统计量与总体参数的差异为★标准差与标准误的区别标准差与标准误的意义、作用和使用范围均不同。