第六章 抽样理论与参数估计 作业
- 格式:ppt
- 大小:1004.00 KB
- 文档页数:79
第6章抽样与参数估计第6章抽样与参数估计6.1抽样与抽样分布6.2参数估计的基本方法6.3总体均值的区间估计6.4总体比例的区间估计6.5样本容量的确定学习目标理解抽样方法与抽样分布估计量与估计值的概念点估计与区间估计的区别评价估计量优良性的标准总体均值的区间估计方法总体比例的区间估计方法样本容量的确定方法参数估计在统计方法中的地位统计推断的过程6.1抽样与抽样分布什么是抽样推断概率捕样方法抽样分布抽样方法抽样方法概率抽样(probabilitysampling)也称随机抽样特点按一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会被抽中每个单位被抽中的概率是已知的,或是可以计算出来的当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率简单随机抽样(simplerandomsampling)从总体N个单位中随机地抽取n个单位作为样本,每个单位入抽样本的概率是相等的最基本的抽样方法,是其它抽样方法的基础特点简单、直观,在抽样框完整时,可直接从中抽取样本用样本统计量对目标量进行估计比较方便局限性当N很大时,不易构造抽样框抽出的单位很分散,给实施调查增加了困难没有利用其它辅助信息以提高估计的效率分层抽样(stratifiedsampling)将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本优点保证样本的结构与总体的结构比较相近,从而提高估计的精度组织实施调查方便既可以对总体参数进行估计,也可以对各层的目标量进行估计系统抽样(systematicsainplmg)将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范闱内随机地抽取一个单位作为初始单位,然后按爭先规定好的规则确定其它样本单位先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k,r+2k…等单位优点:操作简便,可提高估计的精度缺点:对估计量方差的估计比较困难整群抽样(clustersampling)将总体中若干个单位合并为组(群),抽样时直接抽取群,然后对中选群中的所有单位全部实施调查特点抽样时只需群的抽样框,可简化工作量调查的地点相对集中,节省调查费用,方便调查的实施缺点是估计的精度较差抽样分布总体中各元素的观察值所形成的分布分布通常是未知的可以假定它服从某种分布总体分布(populationdistribution)一个样本中各观察值的分布也称经验分布当样本容屋n逐渐增大时,样本分布逐渐接近总体的分布样本分布(sampledistribution)抽样分布的概念(samplingdistribution)抽样分布是指样本统计屋的分布,即把某种样本统计量看作一个随机变量,这个随机变屋的全部可能值构成的新的总体所形成的分布即为某种统计量的抽样分布.统计量:样本均值,样本比例,样本方差等样本统计量的概率分布是一种理论概率分布随机变量是样本统计量样本均值,样本比例,样本方差等结果来自容量相同的所有可能样本提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据对抽样分布的理解抽样分布:即不是总体分布,也不是样本分布,是根据所有可能样本计算的统计量的全部可能取值形成的分布样本均值的抽样分布容量相同的所有町能样本的样本均值的概率分布一种理论概率分布进行推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布(例题分析)【例】设一个总体,含有4个元素(个体),即总体单位数N=4。
参数估计习题及答案参数估计在统计学中是一个重要的概念,它涉及到根据样本数据来估计总体参数的过程。
下面,我将提供一些参数估计的习题以及相应的答案,以帮助学生更好地理解这一概念。
习题一:假设有一个班级的学生数学成绩,我们从这个班级中随机抽取了10名学生的成绩,得到样本均值 \(\bar{x} = 85\),样本标准差 \(s = 10\)。
请估计总体均值 \(\mu\)。
答案:根据样本均值 \(\bar{x}\) 来估计总体均值 \(\mu\),我们可以使用以下公式:\[ \hat{\mu} = \bar{x} \]因此,\(\hat{\mu} = 85\)。
习题二:在习题一中,如果我们想要估计总体方差 \(\sigma^2\),我们应该如何操作?答案:总体方差 \(\sigma^2\) 通常使用样本方差 \(s^2\) 来估计,样本方差的计算公式为:\[ s^2 = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \bar{x})^2 \]其中 \(n\) 是样本大小,\(x_i\) 是第 \(i\) 个观测值。
在这个例子中,\(n = 10\),\(\bar{x} = 85\),\(s = 10\)。
因此,我们可以使用以下公式来估计总体方差:\[ \hat{\sigma}^2 = s^2 = \frac{1}{10-1} \times 10^2 = 100 \]习题三:一个工厂生产的产品长度服从正态分布,样本均值为 \(\bar{x} =50\) 厘米,样本标准差为 \(s = 2\) 厘米。
如果我们知道总体均值\(\mu\) 为 \(50\) 厘米,我们如何估计总体标准差 \(\sigma\)?答案:根据已知的样本均值 \(\bar{x}\) 和样本标准差 \(s\),我们可以使用以下公式来估计总体标准差 \(\sigma\):\[ \hat{\sigma} = s \]因此,\(\hat{\sigma} = 2\) 厘米。
统计学第六章抽样与参数估计《统计学》第六章抽样与参数估计1、某市劳动和社会保障局想调查下岗职工中女性所占的比重,随机抽取300个下岗职工,发现其中195个为女性职工。
试以95.45%的概率保证程度,估计该市下岗职工中女性比重的区间范围。
解:已知n=300,概率保证程度95.45%,Z 0.0455/2 =2P=300195=65% 区间范围P n )1(2p p -Z ±α=0.65300)65.01(65.02-±=0.65±0.055 该市下岗职工中女性比重的区间范围为59.5%~70.5之间2、某灯管厂生产10万只日光灯管,现采用简单随机重复抽样方式抽取1‰灯管进行质量检验,测试结果如下表所示:耐用时间(小时)灯管数(只)800以下 10 800-900 15 900-1000 35 1000-1100 25 1100以上 15 合计100根据上述资料:(1)试计算抽样总体灯管的平均耐用时间(2)在99.73%的概率保证程度下,估计10万只灯管平均耐用时间的区间范围。
(3)按质量规定,凡耐用时间不及800小时的灯管为不合格品,试计算抽样总体灯管的合格率,并按95%的概率保证程度下,估计10万只灯管的合格率区间范围。
(4)若上述条件不变,只是抽样极限误差可放宽到40小时,在99.73%的概率保证程度下,作下一次抽样调查,需抽多少只灯管检验?解:耐用时间(小时)灯管数(只)f组中值x xf f x x 2)(-800以下 10 750 7500 484000 800-900 15 850 12750 216000 900-1000 35 950 33250 14000 1000-1100 25 1050 26250 160000 1100以上15115017250486000合计 100 - 97000 1360000(1)平均耐热时间x =∑∑f xf =10097000=970(小时)(2)S2=∑∑-ffx x 2)( =1001360000=13600 x σ=n s 2=10013600=11.66 x ?=3×11.66=34.98 x x ?±=970±34.98在99.73%的概率保证程度下,该灯管平均耐用时间在935.02~1004.98小时之间(3)p=10015253515+++=0.9p σ=03.0100)9.01(9.0)1(≡-≡-n p pp ?=1.96×0.03=0.0588 p ±p ?=0.9±0.0588在95%的概率保证程度下,该灯管的合格率在84.12%~95.88%之间(4)n=x2222Z s α=2240136003?=76.5≈77(只)。
第六章抽样与参数估计1、某地区粮食播种面积共5000亩,按不重复抽样方法随机抽取了100亩进行实测。
调查结果,平均亩产为450公斤,亩产量的标准差为52公斤。
试以95%的置信度估计该地区粮食平均亩产量的区间。
2、某地对上年栽种一批树苗共3000株进行了抽样调查,随机抽查的200株树苗中有170株成活。
试以95.45%的概率估计该批树苗的成活率的置信区间和成活总数的置信区间。
3、某公司有职工3000人,现从中随机抽取60人调查其工资收入情况,得到有关资料如下:(2)试以0.9545的置信度估计月收入在1000元及以上工人所占比重。
4、对一批产品按不重复抽样方法抽选200件,其中废品8件。
又知道抽样总体是成品总量的1/20,当概率为95.45%时,可否认为这一批成品的废品率低于5%?5、某企业从长期实践得知,其产品直径X是一随机变量,服从方差为0.05的正态分布。
从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。
在0.95的置信度下,试求该产品直径的均值的置信区间。
6、某厂对一批产品的质量进行抽样检验,采用重复抽样抽取样品200只,样本优质品率为85%,试计算当把握程度为95%时优质品率的区间范围。
7、检验某食品厂本月生产的10000袋产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。
要求在95.45%的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?8、某企业对一批产品进行质量检验,这批产品的总数为5000件,过去几次同类调查所得的产品合格率为93%、95%和96%,为了使合格率的允许误差不超过3%,在99.73%的概率下应抽查多少件产品?9、某广告公司为了估计某地区收看某个新电视节目的居民人数所占比重,设计了一个抽样方案。
如果该公司希望有95%的信心使所估计的比重只有2个百分点的误差,问样本量定为多少人较为合适?10、某地区对居民用于某类消费品的年支出数额进行了一次抽样调查。
第6章 抽样与参数估计练习题参考答案一、单项选择题1.B2.C3.D4.D5.A6.B7.D8.C9.C 10.B 11.C 12.B 13.A 14.C 15.D 16.A 二、多项选择题1.ACDE2.ABD3.ACE4.ABCE5.ACDE6.AB7.ADE8.ABD9.(将题中的“可靠性”改为“精确性”)BC 10.ABC 11.BD 12.ABCDE 13.AC 14.ACD 15.BDE 三、判断题1.×2.√3.×4.×5.√6.√7.×8.√9.× 10.√ 11.√ 12.√ 四、计算分析题 1.解:重复抽样: 1414.0002222(克)===nXσσ不重复抽样: 199.0110000100100001002122(克)===--⨯--⋅N n N nXσσ2.解:①已假定总体标准差为σ=15元,则样本均值的抽样标准误差为1429.24915===n X σσ②已知置信水平1-α=95%, Z α/2=1.96, 允许误差2.41429.296.12/2/≈⨯=⋅=⋅=∆XXZ nZ σσαα③已知样本均值为()元120=X,置信水平1-α=95%,Z α/2=1.96,总体均值的置信区间为2.41202/±=⋅±nZ Xσα如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。
3.解:①该校学生考试的平均成绩:6.76100766015151==⋅=∑∑==k k k k kf X f X()43.1199129441151251≈=⋅--=∑∑==k k kk k f XXf S143.110043.11=≈=nXσσ由 α-1=95.45% 查表 Z α/2=2, 2754.21377.122/=⨯==∆XXZ σαXX X X∆+≤≤∆-μ2754.26.762754.26.76+≤≤-μ在95.45%的置信水平下,该校学生考试的平均成绩区间范围是:88.7832.74≤≤X②该校学生成绩在80分以上的学生所占比重: %481004821===n n p04996.0100)48.01(48.0)1(=-⨯=-=np p pσ09992.004996.022/=⨯==∆ppZ σα全校80分以上的学生所占的比重范围为:下限=pp ∆-=0.48-0.09992=0.3801上限=pp ∆+=0.48+0.9992=0.5799所以在95.45%概率保证程度下,该校学生成绩在80分以上的比重范围在38.01%—57.99%之间。
第六章《抽样估计》作业解答一、解:(1)x =f xf ∑∑=10015030=150.3(克) =2δff x x ∑∑2)(-=0.76 u x =)1(2N n n -σ = 99.010076.0⨯ = 0.087; 由于F(t)=0.9973, t=3 ∴ △x =t ×u x =3×0.087=0.26 平均每包重量的置信区间为:x ±△x即:150.3±0.26 → (74.44,78.76)所以该批产品以99.73%的概率,达到了重量规格的要求。
(2)p =10070=70%; u p =)1()1(N n n p p -- = )01.01(1003.07.0-⨯=4.6% △p =t ×u p =3×4.6%=13. 8% ∴该批产品包装合格率的置信区间为:p ±△p即:70%±13.8% → (56. 2%,83. 8%)该批产品以99.73%的概率保证合格率在56. 2%~83. 8%之间。
二、解:(1)x =f xf ∑∑=76.6(分) =2δff x x ∑∑2)(-=129.44; u x =)1(2N n n -σ = 9.010044.129⨯ = 1.079; △x =t ×u x =2×1.079=2.16 置信区间为:(74.44,78.76)(2)p =10048=48%; u p =)1()1(Nn n p p -- = 4.7% △p =t ×u p =2×4.7%=9.48% 置信区间为:(38.52%,57.48%)三、解:已知 n=500,p =500175=35%; F(t)=0.9500, t=1.96 u p =n p p )1(- = 500)35.01(35.0-=2.13% △p =t ×u p =1.96×2.13%=4.1748% ∴ 置信区间为:p ±△p即:35%±4.1748% → (30.83%,39.17%)我们有95%的把握程度说,喜欢该节目的观众在30.83%~39.17%之间。
统计学第六章参数估计和假设检验习题第六章参数估计和假设检验一、填空题1、总体参数估计是指2、称为置信水平,表示为3、落在总体均值两个抽样标准差范围内的概率为4、影响样本的单位数目的因素有5、是研究者想收集证据予以反对的假设。
答案:1、就是以样本统计量来估计总体参数,总体参数是常数,而统计量是随机变量。
2、将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例,(1 -3、0.95454、总体变量的变异程度σ、允许的误差范围△、抽样的可靠程度1-α5、纯随机抽样、等距抽样(机械抽样)、类型抽样(分层抽样)和整群抽样二、单项选择题1、估计量的含义是指(A)A.用来估计总体参数的统计量的名称B.用来估计总体参数的统计量的具体数值C.总体参数的名称D.总体参数的具体数值2、一个95%的置信区间是指( C )A.总体参数有95%的概率落在这一区间内B.总体参数有5%的概率未落在这一区间内C.在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数D.在用同样方法构造的总体参数的多个区间中,有95%的区间不包含该总体参数3、抽取一个容量为100的随机样本,其均值为x =81,标准着s=12。
总体均值μ的99%的置信区间为( C )81±1.9781±2.3581±3.1081±3.524.成数与成数方差的关系是(C )A.成数的数值越接近0,成数的方差越大B.成数的数值越接近0.3,成数的方差越大C.成数的数值越接近0.5,成数的方差越大D.成数的数值越接近l ,成数的方差越大5.纯随机重复抽样的条件下,若其他条件不变,要使抽样平均误差缩小为原来的1/3,则样本单位数必须( B )A.增大到原来的3倍B.增大到原来的9倍C.增大到原来的6倍D.也是原来的1/36、对于非正态总体,使用统计量x z =估计总体均值的条件是(D ) A .小样本B .总体方差已知C .总体方差未知D .大样本7、在假设检验中,原假设和备选假设( C )A. 都有可能成立B. 都有可能不成立C. 只有一个成立而且必有一个成立D. 原假设一定成立,备选假设不一定成立8.一种零件的标准长度5cm ,要检验某天生产的零件是否符合标准要求,建立的原假设和备选假设就为( A )A .0:5H μ=,1:5H μ≠B .0:5H μ≠,1:5H μ>C .0:5H μ≤,1:5H μ>D .0:5H μ≥,1:5H μ<9、若检验的假设为00:H μμ≥,10:H μμ<,则拒绝域为( B )A .z z α>B .z z α<-C ./2z z α<-或/2z z α<-D .z z α>或z z α<-10。
习题15(参数估计)一.填空题1. 设1~()X e λ,n X X X ,,,21 为来自X 的样本,则λ的矩估计为 . 2. 设),(~2σμN X ,n X X X ,,,21 为来自X 的样本,则2σ的无偏估计量为 . 3. 设123,,X X X 是总体X 的样本,11231ˆ()4X aX X μ=++,21231ˆ()6bX X X μ=++是总体均值的两个无偏估计,则a = ,b = ,这两个无偏估计量中较有效的是 .二.判断题1. 参数矩估计是唯一的。
( )2. 用距估计和最大似然估计对某参数估计所得的估计一定不一样。
( )3. 一个未知参数的无偏估计一定唯一。
( )4. 设总体X 的数学期望为12,,,,n X X X μ 为来自X 的样本,则1X 是μ的无偏估计量。
() 三.解答题1. 设总体的密度为(1),01,(;)0,.x x f x ααα⎧+<<⎪=⎨⎪⎩其他试用样本12,,,n X X X 求参数α的距估计量和最大似然估计量.2. 设总体X 的概率密度为2,0()20,0xa xe x f x x λ-⎧⎪>=⎨⎪≤⎩,其中0λ>,且λ为未知参数,n X X X ,,,21 是来自总体X 的随机样本,(1)试求常数a ; (2)求λ的最大似然估计量ˆλ.3. 设总体()θe X ~,其中0θ>,抽取样本n X X X ,,,21 ,证明X 是θ的无偏估计量,但2X 却不是2θ的无偏估计量.习题16(置信区间1)一.填空题1. 设12100,,,x x x 为正态总体(,4)N μ的一个样本,x 表示样本均值,则μ的置信度为1α-的置信区间为 .2. 已知12,,,n X X X 为来自总体),(2σμN 的一组样本,其中2σ未知,则μ的置信水平为α-1的置信区间为 .3. 正态总体X 的均值未知,取25个样本,测得样本方差220.9S =,则方差2σ的0.95的置信区间的区间长度为 .二.判断题1. 正态总体均值μ的置信区间一定包含μ。
抽样和参数估计习题及答案抽样和参数估计习题及答案在统计学中,抽样和参数估计是非常重要的概念和技巧。
通过抽样,我们可以从总体中选择一部分样本,并通过对这些样本的观察和分析来推断总体的特征。
参数估计则是根据样本数据来估计总体的参数值。
下面,我们将介绍一些与抽样和参数估计相关的习题,并提供相应的答案。
习题一:某公司有1000名员工,你想估计他们的平均工资。
你随机选择了50名员工,并得到了他们的工资数据。
计算这些员工的平均工资,并给出对总体平均工资的估计。
答案:根据题目所给的信息,我们可以计算这50名员工的平均工资。
然后,我们可以将这个平均工资作为总体平均工资的估计。
例如,假设这50名员工的平均工资为5000元,那么我们就可以估计总体平均工资为5000元。
习题二:一家电商公司想估计他们网站上每天的访问量。
他们在连续的7天中记录了每天的访问量,并得到了以下数据:1000, 1200, 800, 1500, 900, 1100, 1300。
计算这7天的平均访问量,并给出对总体平均访问量的估计。
答案:根据题目所给的数据,我们可以计算这7天的平均访问量。
然后,我们可以将这个平均访问量作为总体平均访问量的估计。
例如,将这7天的访问量相加得到8000,再除以7得到平均访问量约为1143。
因此,我们可以估计总体平均访问量为1143。
习题三:某城市有100个小区,你想估计这些小区的平均房价。
你随机选择了10个小区,并得到了每个小区的房价数据。
计算这10个小区的平均房价,并给出对总体平均房价的估计。
答案:根据题目所给的信息,我们可以计算这10个小区的平均房价。
然后,我们可以将这个平均房价作为总体平均房价的估计。
例如,假设这10个小区的平均房价为200万元,那么我们就可以估计总体平均房价为200万元。
习题四:一家公司想估计他们产品的市场份额。
他们随机选择了100个消费者,并调查了他们对该产品的购买意向。
其中有80个消费者表示愿意购买该产品。