2019年高考数学统计图表数据的数字特征用样本估计总体文北师大版
- 格式:doc
- 大小:242.62 KB
- 文档页数:7
《用样本估计总体分布》课标解读教材分析本节是本章教材的第三节,前面研究了获取数据的途径及简单的抽样方法,本节课主要研究对收集上来的样本如何进行处理,突出对数据描述、处理的方法,特别是频率分布直方图的画法,后面接着研究频率分布折线图、用样本的数字特征估计总体的数字特征等,可以说本节课内容承上启下,地位非常重要.从教材编写的角度来看,也正是体现了这一特点.教材通过对样本分析和总体估计的过程,突出了统计的实用性,从实际出发,收集数据,进行分析整理,再回到实际问题,感受数学对实际生活的需要,体现了统计的思想及其在实际问题中的应用价值,真正体会数学知识与现实生活的联系.教材通过生活中的大量事例,引出总体分布的估计问题,通过对问题的探究,使学生学会列频率分布表、画频率分布直方图、频率分布折线图.教材在这里主要介绍有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下较大的发挥空间,教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于样本频率分布直方图可以估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估评总体的分布特征.高考中主要考查用样本频率分布估计总体分布.本节内容涉及的数学核心素养有数学抽象、直观想象、数据分析等.学情分析1.学生已有知识基础.学生在初中已经学习了分布的初步概念,会绘制频数分布直方图,对样本估计总体有一定的认识.进入高一后,前面也刚学习过抽样的相关知识,对用图、表来反映样本的规律有较强的意识,较好地掌握了列表、绘图等基本方法,同时也具有一定的分析问题和解决问题的能力.2.学生已有生活经验和学习该内容的经验.高一的学生已经具备了相当的生活经验,对本节课所提供的生活实例也有所体会,为新知识的学习与新方法的掌握打下了基础.再加上学生初中对学习该内容已有的经验,可以说在生活、知识、技能、方法等方面都为学生学习本节课内容打下了基础.3.学生学习本节内容可能的困难.(1)学生生活经验的不足会影响对实际问题的理解与思考.如:对频率分布直方图的数据分析结果再用来决策实际问题,对学生会有一定难度.(2)学生虽然在初中对这部分内容有所学习,但因遗忘等原因,对频数分布直方图的绘制会有一定困难,再加上频率分布直方图学生并没有接触过,对数据分析缺乏目的性,会引起学生认识上的困惑.如:已经学习了频数分布直方图,为什么还要绘制频率分布直方图?为什么纵坐标要选用频数组距?等.(3)因缺乏统计思维的训练,学生对统计思想、方法的理解会有一定的困难.如:为什么能用样本的频率分布估计总体?为什么通过样本得出的规律具有随机性?等.4.学生学习的兴趣、学习方式和学法分析.学生对数学学习具有较高的兴趣,对新知有较强的探索欲望,能进行自主学习,学生与教师、学生与学生之间能够进行很好的合作、交流沟通,有较好的思维能力,具有一定的生活经验与学习经验,对实际问题的解决充满好奇,喜欢从具体的生活实际出发,通过观察、操作、思考等方式获得知识与经验,能积极投入到教学中.当然,学生有时学习上不是很主动,需要教师进行启发、诱导,激发学生的积极性.教学建议统计思想方法是数学的一个重要的思想方法,中学学习统计,除了掌握必要的统计知识之处,关键是让学生体会统计在现实生活中具有重要的作用,形成统计意识,同时体会到统计结果的随机性、科学性,能作为总体的分布的合理性,是生活中某些问题决策必不可少的依据.统计教学的核心目标正是让学生体会统计思维的特点和作用,因此在教学设计中,应从实际问题出发,再回到实际问题的决策,前后呼应,使学生真正体会数据处理的全过程、统计应用于现实生活的全过程,突出统计的思想、方法.这也是本节课要重点突出的核心思想,当然也是重点要落实的内容.另外,通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.通过对样本分析和总体估计的过程,感受数学对生活的需要,通过实例体会频率分布直方图、频率分布折线图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.教学中注意动手与观察,思考与交流,归纳与总结,加强新旧知识之间的联系,培养学生分析问题、解决问题的能力,从而获得学习数学的方法.本节课与实际结合比较紧密,同时学生在初中已经具备了学习本节的基本知识,因此在设计上,可以学生的主动参与为主,让学生积极讨论,注重问题的提出、解决的过程.从实际情境出发,引出课题,展开研究,体会统计的思维过程,最终回到对实际问题的决策上,激发学生探索欲望,以利于教学难点的解决.同时,教师可设计问题串,引导学生对知识进行理解,提出与现实生活联系紧密的问题,促进学生进行思考,帮助学生突破难点,让学生认识统计的作用,体会统计思维与确定性思维的差异.学科核心素养目标与素养1.能够对数据进行分析列频率分布表、画频率分布直方图,达到数学运算、直观想象、数据分析核心素养水平的要求.2.结合频率分布直方图分析数据有关问题,结合频率折线图估计总体分布情况,达到直观想象、数据分析核心素养水平二的要求.情境与问题案例一通过比较两种问题情境“情境1:某工厂生产一批产品,经调査只有10个不合格品.情境2:某工厂生产一批产品,经调査产品不合格率为1%”.哪一种情境能更好地反映工厂的生产情况,引发学生思考,激发学生的学习兴趣,引出课题.案例二设置“通过某赛季NBA两名球员的得分情况分析两名运动员的水平,如何运用数学知识作出正确的判断”的情境提出这节课要研究、学习的主要内容,从而引出课题.内容与节点用样本估计总体分布是在前面已经学习了收集数据的一些方法的基础上,对数据进一步的分析和处理,希望从中找出需要的信息,是前面内容的自然发展,也是后续进一步进行数据分析的基础.过程与方法通过对数据的分析画频率分布直方图,利用频率分布直方图估计总体分布情况的过程,培养学生的探索精神,提升数学运算、直观想象、数据分析等核心素养.教学重点难点重点会列频率分布表,画频率分布直方图、频率折线图.难点能通过样本的频率分布估计总体分布.。
§10.2 统计图表、用样本估计总体1.统计图表统计图表是表达和分析数据的重要工具,常用的统计图表有条形统计图、扇形统计图、折线统计图、茎叶图等. 2.数据的数字特征 (1)众数、中位数、平均数众数:在一组数据中,出现次数最多的数据叫作这组数据的众数.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).在频率分布直方图中,中位数左边和右边的直方图的面积应该相等. (2)样本方差、标准差 标准差s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x n 是样本数据的第n 项,n 是样本容量,x 是平均数.标准差是刻画数据的离散程度的特征数,样本方差是标准差的平方.通常用样本方差估计总体方差,当样本容量接近总体容量时,样本方差很接近总体方差. 3.用样本估计总体(1)通常我们对总体作出的估计一般分成两种,一种是用样本的频率分布估计总体的频率分布,另一种是用样本的数字特征估计总体的数字特征. (2)在频率分布直方图中,纵轴表示f iΔx i,数据落在各小组内的频率用各小长方形的面积表示,各小长方形的面积总和等于1.(3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图.(4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且可以随时记录,方便表示与比较. 知识拓展1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示f i Δx i ,频率=组距×f iΔx i .(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.题组一 思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 教材改编2.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( ) A .4 B .8 C .12 D .16 答案 B解析 设频数为n ,则n32=0.25,∴n =32×14=8.3.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92答案 A解析 ∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数x =87+89+90+91+92+93+94+968=91.5.4.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有________人.答案 25解析 0.5×0.5×100=25. 题组三 易错自纠5.若数据x 1,x 2,x 3,…,x n 的平均数x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为( ) A .5,2 B .16,2 C .16,18 D .16,9答案 C解析 ∵x 1,x 2,x 3,…,x n 的平均数为5, ∴x 1+x 2+x 3+…+x nn=5,∴3x 1+3x 2+3x 3+…+3x n n+1=3×5+1=16, ∵x 1,x 2,x 3,…,x n 的方差为2,∴3x 1+1,3x 2+1,3x 3+1,…,3x n +1的方差是32×2=18.6.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m ,众数为n ,平均数为x ,则m ,n ,x 的大小关系为________.(用“<”连接)答案 n <m <x解析 由图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m =5.5;又5出现次数最多,故n =5;x =2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×1030≈5.97. 故n <m <x .题型一 茎叶图的应用1.(2017·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7 答案 A解析 甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x )=15×(59+61+67+65+78),∴x =3.故选A. 2.(2018·郑州质检)为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为( )A .100B .160C .200D .280 答案 B解析 观察茎叶图,抽取的20名教师中使用多媒体教学次数在[16,30)内的有8人,所以该区间段的频率为820=0.4,因此全校400名教师使用多媒体教学次数在[16,30)内的有400×0.4=160(人). 思维升华 茎叶图的优缺点由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.题型二 频率分布直方图的绘制与应用命题点1 用频率分布直方图求频率、频数典例 (2016·山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A.56 B.60 C.120 D.140答案 D解析设所求人数为N,则N=2.5×(0.16+0.08+0.04)×200=140,故选D.命题点2 用频率分布直方图估计总体典例(2016·四川)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.解(1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)估计全市居民中月均用水量不低于3吨的人数为3.6万.理由如下:由(1)知,100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5. 所以2≤x <2.5.由0.50×(x -2)=0.5-0.48,解得x =2.04. 故可估计居民月均用水量的中位数为2.04吨.思维升华 (1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率,不要和条形图混淆. (2)在很多题目中,频率分布直方图中各小长方形的面积之和为1,是解题的关键,常利用频率分布直方图估计总体分布.跟踪训练 (2017·北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90),并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解 (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4,所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9, 分数在区间[40,50)内的人数为100-100×0.9-5=5, 所以总体中分数在区间[40,50)内的人数估计为400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30,所以样本中的男生人数为30×2=60, 女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2.题型三 用样本的数字特征估计总体的数字特征典例 (1)某市有210名初中生参加数学竞赛预赛,随机调阅了60名学生的答卷,成绩如表:①求样本的平均成绩和标准差(精确到0.01分);②若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进入复赛. 解 ①x =160×(4×6+5×15+6×21+7×12+8×3+9×3)=6,s 2=160×[6×(4-6)2+15×(5-6)2+21×(6-6)2+12×(7-6)2+3×(8-6)2+3×(9-6)2]=1.5.∴s ≈1.22,故样本的平均成绩为6分,标准差约为1.22分.②在60名选手中,有12+3+3=18(名)学生预赛成绩在7分或7分以上,∴210人中有1860×210=63(名)学生的预赛成绩在7分或7分以上,故大约有63名学生可以参加复赛. (2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:①分别求出两人得分的平均数与方差;②根据图和上面算得的结果,对两人的训练成绩作出评价. 解 ①由图像可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13;x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4;s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.②由s 2甲>s 2乙,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.跟踪训练 (2018·福建漳平质检)某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率. 解 (1)甲组研发新产品的成绩为1,1,1,0,0,1,1,1,0,1,0,1,1,0,1,其平均数x 甲=1015=23;方差为s 2甲=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-232×10+⎝ ⎛⎭⎪⎫0-232×5=29.乙组研发新产品的成绩为1,0,1,1,0,1,1,0,1,0,0,1,0,1,1,其平均数x 乙=915=35;方差为s 2乙=115⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫1-352×9+⎝ ⎛⎭⎪⎫0-352×6=625.因为x 甲>x 乙,s 2甲<s 2乙,所以甲组的研发水平优于乙组.(2)记恰有一组研发成功为事件E ,在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.高考中频率分布直方图的应用考点分析 频率分布直方图是高考考查的热点,考查频率很高,题型有选择题,填空题,也有解答题,难度为中低档.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.典例 (12分)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1,得x =0.007 5,所以直方图中x 的值是0.007 5.[2分](2)月平均用电量的众数是220+2402=230.[4分]因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5,得a =224,所以月平均用电量的中位数是224.[8分](3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300)的用户有0.002 5×20×100=5(户), 抽取比例为1125+15+10+5=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5(户).[12分]1.(2017·全国Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳答案 A解析对于选项A,由图易知,月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知,年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.2.某市2017年各月的平均气温(°C)数据的茎叶图如下:089125820033831 2则这组数据的中位数是( )A.19 B.20 C.21.5 D.23答案 B解析从茎叶图知所有数据为8,9,12,15,18,20,20,23,23,28,31,32,中间两个数为20,20,故中位数为20,故选B.3.(2016·全国Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15℃,B点表示四月的平均最低气温约为5℃.下面叙述不正确的是( )A .各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20℃的月份有5个 答案 D解析 由题意知,平均最高气温高于20℃的有七月,八月,故选D.4.(2018·青岛即墨模拟)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17),将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18 答案 C解析 志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.5.(2017·长沙适应性考试)某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84,a 2=80+4+4+6+4+75=85,故选B.6.在“南安一中校园歌手大赛”比赛现场上,七位评委为某选手打出的分数的茎叶图如图,则去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .85和6.8B .85和1.6C .86和6.8D .86和1.6答案 A解析 剩余的数据为83,83,84,85,90, 平均分x =83+83+84+85+905=85,所以方差为s 2=15[(83-85)2+(83-85)2+(84-85)2+(85-85)2+(90-85)2]=6.8.7.已知样本数据x 1,x 2,…,x n 的平均数x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的平均数为________. 答案 11解析 由x 1,x 2,…,x n 的平均数x =5,得2x 1+1,2x 2+1,…,2x n +1的平均数为2x +1=2×5+1=11.8.从甲、乙、丙三个厂家生产的同一种产品中抽取8件产品,对其使用寿命(单位:年)进行追踪调查的结果如下: 甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家广告中都称该产品的使用寿命是8年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数. 甲:________;乙:________;丙:________. 答案 众数 平均数 中位数解析 甲的众数为8,乙的平均数为8,丙的中位数为8.9.(2018·郑州模拟)某电子商务公司对10 000名网络购物者2016年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9)内,其频率分布直方图如图所示:(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________. 答案 (1)3 (2)6 000解析 由频率分布直方图及频率和等于1,可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a ×0.1=1,解得a =3.于是消费金额在区间[0.5,0.9)内的频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.10.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm ,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x ,那么x 的值为________.答案 2解析 170+17×(1+2+x +4+5+10+11)=175,17×(33+x )=5,即33+x =35,解得x =2. 11.某学校随机抽取部分新生调查其上学所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80),[80,100),则(1)图中的x =________;(2)若上学所需时间不少于1小时的学生可申请在学校住宿,则该校600名新生中估计有________名学生可以申请住宿.答案(1)0.012 5 (2)72解析(1)由频率分布直方图知20x=1-20×(0.025+0.006 5+0.003+0.003),解得x=0.012 5.(2)上学时间不少于1小时的学生的频率为0.12,因此估计有0.12×600=72(人)可以申请住宿.12.(2016·北京)某市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即当w=3时该市居民该月的人均水费估计为10.5元.13.(2017·全国Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数答案 B解析因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.14.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.A地区用户满意度评分的频率分布直方图图①B地区用户满意度评分的频数分布表(1)在图②中作出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图②(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解(1)作出频率分布直方图如图:通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而A 地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记C A 表示事件:“A 地区用户的满意度等级为不满意”;C B 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得P (C A )的估计值为(0.01+0.02+0.03)×10=0.6,P (C B )的估计值为(0.005+0.02)×10=0.25.所以A 地区用户的满意度等级为不满意的概率大.15.为了普及环保知识,增强环保意识,某大学有300名员工参加环保知识测试,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50),得到的频率分布直方图如图所示.现在要从第1,3,4组中用分层抽样的方法抽取16人,则在第4组中抽取的人数为________.答案 6解析 根据频率分布直方图得,第1,3,4组的频率之比为1∶4∶3,所以用分层抽样的方法抽取16人时,在第4组中应抽取的人数为16×31+4+3=6.16.(2018·洛阳质检)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得到如下频数分布表:(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)样本数据的分布直方图如图所示:(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.。
核心素养测评六十二统计图表、数据的数字特征、用样本估计总体(30分钟60分)一、选择题(每小题5分,共25分)1.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试成绩的极差与中位数之和为( )A.117B.118【解析】选B.22次考试成绩最高为98分,最低为56分,所以极差为98-56=42,从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试成绩的极差与中位数之和为42+76=118.2.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的X围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是 ( )A.56B.60C.120D.140【解析】选D.由频率分布直方图可知,每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.3.(2020·某某模拟)由小到大排列的一组数据x1,x2,x3,x4,x5,其中每个数据都小于-1,那么对于样本1,x1,-x2,x3,-x4,x5的中位数可以表示为( )A. B.C. D.【解析】选C.因为x1<x2<x3<x4<x5<-1,所以x1<x3<x5<1<-x4<-x2,则该组样本的中位数为中间两数的平均数,即.4.(2019·全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差【解析】选A.9个数据去掉最高分与最低分2个,最中间的数据没变,所以不变的数字特征是中位数.5.某户居民根据以往的月用电量情况,绘制了月用电量的频率分布直方图(月用电量都在25度到325度之间)如图所示.估计该用户的月用电量的平均数、中位数、众数分别为世纪金榜导学号( )A.161,158,150B.150,150,150C.175,125,150D.161,175,150【解析】选A.估计该用户的月用电量的平均数:=50×0.12+100×0.18+150×0.3+200×0.22+250×0.12+300×0.06=161.估计该用户的月用电量的中位数约为:158.估计该用户的月用电量的众数约为:150.二、填空题(每小题5分,共15分)6.(2019·某某高考)已知一组数据6,7,8,8,9,10,则该组数据的方差是.【解析】由题意,该组数据的平均数为=8,所以该组数据的方差是[(6-8)2+(7-8)2+(8-8)2+(8-8)2+(9-8)2+(10-8)2]=.答案:7.(2020·某某模拟)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是.①众数是9;②平均数是10;③中位数是9;④标准差是3.4.【解析】由题意可知,该组数据分别为:7,8,9,9,9,10,11,12,12,13,该组数据的众数为9,平均数为=10,中位数为=9.5,标准差为=,因此,①②正确.答案:①②8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)频率分布直方图中x的值为.(2)在这些用户中,用电量落在区间[100,250)内的户数为.【解析】(1)由频率分布直方图中各小矩形的总面积为1,得(0.0012+0.0024×2+0.0036+x+0.0060)×50=1,解得x=0.0044.(2)用电量在[100,250)内的频率为(0.0036+0.0044+0.0060)×50=0.7,故用电量落在区间[100,250)内的户数为100×0.7=70.答案:(1)0.0044 (2)70三、解答题(每小题10分,共20分)9.为庆祝国庆节,某中学团委组织了“歌颂祖国,爱我中华”知识竞赛,从参加考试的学生中抽出60名,将其成绩(成绩均为整数)分成[40,50),[50,60),…,[90,100]六组,并画出如图所示的部分频率分布直方图,观察图形,回答下列问题:(1)求第四组的频率,并补全这个频率分布直方图.(2)估计这次考试的及格率(60分及以上为及格)和平均分.【解析】(1)因为各组的频率和等于1,所以第四组的频率为1-(0.025+0.015×2+0.010+0.005)×10=0.3.补全的频率分布直方图如图所示.(2)依题意可得第三、四、五、六组的频率之和为(0.015+0.030+0.025+0.005)×10=0.75,则可估计这次考试的及格率是75%.因为抽取学生的平均分约为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分),所以可估计这次考试的平均分为71分.10.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机选取18位患者服用A药,18位患者服用B药,这36位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的18位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.22.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3服用B药的18位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.31.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7(1)分别计算两组数据的平均数(小数点后保留两位小数),从计算结果看哪种药疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?并说明理由. 世纪金榜导学号【解析】(1)服用A药的18位患者日平均增加的睡眠时间的平均数为=(0.6+1.2+2.7+…+3.0+3.1+2.3)≈2.23(h)服用B药的18位患者日平均增加的睡眠时间的平均数为=(3.2+1.7+1.9+…+2.5+1.2+2.7)≈1.67(h),因为2.23>1.67,所以A种药的疗效更好.(2)由观测结果可绘制如图茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有的叶集中在茎2,3上,而B药疗效的试验结果有的叶集中在茎0,1上,由此可看出A药的疗效更好.(15分钟35分)1.(5分)(2020·某某模拟)某工厂对一批新产品的长度(单位:mm)进行检测,如图是检测结果的频率分布直方图,据此估计这批产品的中位数与平均数分别为( )A.20,22.5B.22.5,25C.22.5,22.75D.22.75,22.75【解析】选C.根据频率分布直方图,得平均数为5×(12.5×0.02+17.5×0.04+22.5×0.08+27.5×0.03+32.5×0.03)=22.75,因为0.02×5+0.04×5=0.3<0.5,0.3+0.08×5=0.7>0.5,所以中位数应在20~25内,设中位数为x,则0.3+(x-20)×0.08=0.5,解得x=22.5,所以这批产品的中位数是22.5.【变式备选】某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )岁岁岁岁【解析】选C.在频率分布直方图中,所有矩形面积之和为1,所以,数据位于的频率为1-×5=0.2,前两个矩形的面积之和为0.01×5+0.2=0.25,前三个矩形的面积之和为0.25+0.07×5=0.6,所以,中位数位于区间,设中位数为a,则有0.25+×0.07=0.5,解得a≈33.6(岁).2.(5分)(2020·某某模拟)气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有.(填序号) 世纪金榜导学号【解析】①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22,22,24,25,26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19,20,27,27,27时,可知其连续5天的日平均温度有低于22℃的,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22.则肯定进入夏季的地区有甲、丙两地.答案:①③【变式备选】已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为,方差为s2,则( )A.=70,s2<75B.=70,s2>75C.>70,s2<75D.<70,s2>75【解析】选A.由题意,可得==70,设收集的48个准确数据分别记为x1,x2,…,x48,则75=[++…++(60-70)2+(90-70)2]=[++…++500],s2=[++…++(80-70)2+(70-70)2]=[++…++100]<75,所以s2<75.3.(5分)(2020·某某模拟)某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则4x+2y的值是( )A.12B.14C.16D.18【解析】选A.因为中位数为12,所以x+y=4,数据的平均数为×(2+2+3+4+x+y+20+19+19+20+21)=11.4,要使该总体的标准差最小,即方差最小,所以(10+x-11.4)2+(10+y-11.4)2=(x-1.4)2+(y-1.4)2≥2=0.72,当且仅当x-1.4=y-1.4,即x=y=2时取等号,此时总体标准差最小,4x+2y=12.【变式备选】(2020·某某模拟)已知样本9,10,11,x,y的平均数是10,方差是2,则xy的值为( ) A.88 B.96 C.108 D.110【解析】选B.由于样本的平均数为10,则有=10,得x+y=20,由于样本的方差为2,则有=2,得+=8,即x2+y2-20+200=8,所以x2+y2=208,因此xy==96.4.(10分)(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.y的分组[-0.20,0) [0,0.20) [0.20,0.40) [0.40,0.60) [0.60,0.80)企业数 2 24 53 14 7(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例.(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01) 世纪金榜导学号附:≈8.602.【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)=(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=n i=[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,所以s==0.02×≈0.17,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.5.(10分)(2020·某某模拟)栀子原产于中国,喜温暖湿润、阳光充足的环境,较耐寒.叶,四季常绿;花,芳香素雅.绿叶白花,格外清丽.某地区引种了一批栀子作为绿化景观植物,一段时间后,从该批栀子中随机抽取100棵测量植株高度,并以此测量数据作为样本,得到该样本的频率分布直方图,其中不高于1.50m的植株高度茎叶图如图所示. 世纪金榜导学号(1)求植株高度频率分布直方图中a,b,c的值.(2)在植株高度频率分布直方图中,同一组中的数据用该区间的中点值代表,植株高度落入该区间的频率作为植株高度取该区间中点值的频率,估计这批栀子植株高度的平均值.【解析】(1)由茎叶图知,a==0.5,b==1.由频率分布直方图知(0.5+1+c+3+4)×0.1=1,所以c=1.5.(2)这批栀子植株高度的平均值的估计值为×0.1=1.60(m).(2020·某某模拟)某高中非毕业班学生人数分布情况如表,为了了解这2000个学生的体重情况,从中随机抽取160个学生并测量其体重数据,根据测量数据制作了如图所示的频率分布直方图.性别年级男生女生合计高一年级550 650 1200高二年级425 375 800合计975 1025 2000(1)为了使抽取的160个样品更具代表性,宜采取分层抽样,请你给出一个你认为合适的分层抽样方案,并确定每层应抽取的样品个数.(2)根据频率分布直方图,求x的值,并估计全体非毕业班学生中体重在[45,75)内的人数.(3)已知高一全体学生的平均体重为58.50kg,高二全体学生的平均体重为61.25kg,试估计全体非毕业班学生的平均体重. 世纪金榜导学号【解析】(1)方案一:考虑到体重应与年级及性别均有关,最合理的分层应分为以下四层:高一男生、高一女生、高二男生、高二女生高一男生:×160=44(人),高一女生:×160=52(人),高二男生:×160=34(人),高二女生:×160=30(人),方案二:按性别分为两层,男生与女生:男生人数:×160=78(人),女生人数:×160=82(人).方案三:按年级分为两层,高一学生与高二学生:高一人数:×160=96(人),高二人数:×160=64(人).(2)体重在[70,80)内的学生人数的频率:1-(0.075+0.2+0.275+0.225+0.05+0.025)=0.15,x==0.015,体重在[45,75)内人数的频率为:0.1+0.275+0.225+0.075=0.675,所以估计全体非毕业班学生体重在[45,75)内的人数为:2000×0.675=1350(人).(3)设高一全体学生的平均体重为=58.5kg,频率为P1=×100%=60%.高二全体学生的平均体重为=61.25kg,频率为P2=×100%=40%,则估计全体非毕业班学生的平均体重为·P1+·P2=58.50×60%+61.25×40%=59.6(kg).答:估计全校非毕业班学生的平均体重为59.6kg.。
第三节统计图表、数据的数字特征、用样本估计总体[考纲传真] 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.1.统计图表(1)条形统计图的特点:数据量很大时,能直观地反映数据分布的大致情况,且能清晰地表示出各个区间的具体数.(2)茎叶图表示数据有两个突出的优点:①统计图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到;②茎叶图可以随时记录,方便表示与比较.2.频率分布直方图(1)频率分布直方图:每个小矩形的宽度为Δx i(分组的宽度),高为f iΔx i,小矩形的面积恰为相应的频率f i,我们称这样的图形为频率分布直方图.(2)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(3)频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加上一个区间,从所加的左边区间的中点开始,用线段依次连接频率分布直方图中各个矩形的顶端中点,直至右边所加区间的中点就得到频率分布折线图.3.数据的数字特征(1)众数、中位数、平均数 ①在一组数据中,出现次数较多的数据叫作这组数据的众数. ②将一组数据按大小依次排列,把处在中间位置的一个数据(或中间两个数据的平均数)叫作这组数据的中位数.③如果有n 个数x 1,x 2,…,x n ,那么x =x 1+x 2+…+x n n 叫作这n 个数的平均数.(2)标准差和方差①标准差是样本数据到平均数的一种平均距离.②s = ③方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( )(2)一组数据的方差越大,说明这组数据越集中. ( )(3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.( )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( )[解析] (1)正确.平均数、众数与中位数都在一定程度上反映了数据的集中趋势.(2)错误.方差越大,这组数据越离散.(3)正确.小矩形的面积=组距×频率组距=频率.。
课时分层训练(五十)统计图表、数据的数字特征、用样本估计总体A组基础达标(建议用时:30分钟)一、选择题1.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( )A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数B[因为可以用极差、方差或标准差来描述数据的离散程序,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.]2.某班的全体学生参加英语测试,成绩的频率分布直方图如图9311,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( ) 【导学号:00090330】图9311A.45 B.50C.55 D.60B[由频率分布直方图,知低于60分的频率为(0.010+0.005)×20=0.3.∴该班学生人数n=150.3=50.]3.(2017·南昌模拟)某市重点中学奥数培训班共有14人,分为两个小组,在一次阶段考试中两个小组成绩的茎叶图如图9312所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则m+n的值是( )图9312A.10 B.11C.12 D.13C[∵甲组学生成绩的平均数是88,∴由茎叶图可知78+86+84+88+95+90+m+92=88×7,∴m=3,∵乙组学生成绩的中位数是89,∴n=9.∴m+n=12.故选C.]4.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图9313中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )图9313A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个D[对于选项A,由题图易知各月的平均最低气温都在0 ℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10 ℃,所以C正确;对于选项D,平均最高气温高于20 ℃的月份有七月、八月,共2个月份,故D错误.]5.(2018·黄冈模拟)已知数据x1,x2,x3,…,x n是某市n(n≥3,n∈N*)个普通职工的年收入,设这n个数据的中位数为x,平均数为y,方差为z,如果再加上世界首富的年收入x n+1,则这(n+1)个数据中,下列说法正确的是( )A.年收入平均数可能不变,中位数可能不变,方差可能不变B.年收入平均数大大增大,中位数可能不变,方差变大C.年收入平均数大大增大,中位数可能不变,方差也不变D.年收入平均数大大增大,中位数一定变大,方差可能不变B[∵数据x1,x2,x3,…,x n是某市n(n≥3,n∈N*)个普通职工的年收入,x n+1为世界首富的年收入,则x n +1远大于x 1,x 2,x 3,…,x n ,故这n +1个数据中,年收入平均数大大增大;中位数可能不变,也可能稍微变大;由于数据的集中程度受到x n +1的影响比较大,更加离散,则方差变大.] 二、填空题6.(2018·长沙模拟)空气质量指数(Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如图9314.根据该统计数据,估计此地该年AQI 大于100的天数约为________.(该年为365天)图9314146 [该样本中AQI 大于100的频数是4,频率为25,由此估计该地全年AQI 大于100的频率为25,估计此地该年AQI 大于100的天数约为365×25=146.]7.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.16 [已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16.]8.(2017·郑州调研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:【导学号:00090331】2 [易知x 甲=90,x 乙=90.则s 2甲=15[(87-90)2+(91-90)2+(90-90)2+(89-90)2+(93-90)2]=4.s 2乙=15[(89-90)2+(90-90)2+(91-90)2+(88-90)2+(92-90)2]=2.]三、解答题9.(2017·郑州调研)某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件数的统计数据的茎叶图如图9315所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.图9315(1)求出m ,n 的值;(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2乙,并由此分析两组技工的加工水平.[解] (1)根据题意可知:x 甲=15(7+8+10+12+10+m )=10,x 乙=15(9+n +10+11+12)=10, 3分 ∴m =3,n =8.5分(2)s 2甲=15[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,8分s 2乙=15[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2,10分∵x 甲=x 乙,s 2甲>s 2乙,∴甲、乙两组的整体水平相当,乙组更稳定一些.12分10.(2016·北京高考)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:图9316(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替.当w=3时,估计该市居民该月的人均水费.[解](1)由用水量的频率分布直方图,知该市居民该月用水量在区间[0.5,1],(1,1.5],(1.5,2],(2,2.5],(2.5,3]内的频率依次为0.1,0.15,0.2,0.25,0.15.3分所以该月用水量不超过3立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w至少定为3. 5分(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表如下:根据题意,该市居民该月的人均水费估计为4×0.1+6×0.15+8×0.2+10×0.25+12×0.15+17×0.05+22×0.05+27×0.05=10.5(元). 12分B组能力提升(建议用时:15分钟)1.(2018·淮北模拟)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图9317所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为( )图9317A.2 B. 2C.10 D.10B[甲地该月11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1,则甲地该月11时的平均气温的标准差为1-2+-2+-2+-2+-2] 5=2,故选B.]2.(2015·湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图9318所示.图9318(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.(1)3(2)6 000[(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.] 3.(2018·武汉模拟)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理制度,即确定一个合理的居民月用水量标准x(吨),用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了某年100位居民的月均用水量(单位:吨),将数据按照[0,0.5],(0.5,1],…,(4,4.5]分成9组,制成了如图9319所示的频率分布直方图.【导学号:00090332】图9319(1)求a的值;(2)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值; (3)已知平价收费标准为4元/吨,议价收费标准为8元/吨.当x =3时,估计该市居民的月平均水费.(同一组中的数据用该组区间的中点值代替)[解] (1)由(0.08+0.16+a +0.40+0.52+a +0.12+0.08+0.04)×0.5=1,解得a =0.30.(2)∵前6组的频率之和是(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.4+0.52)×0.5=0.73<0.85, ∴2.5≤x <3,由0.3×(x -2.5)=0.85-0.73,解得x =2.9. (3)设该市居民月均用水量为t 吨,相应的水费为y 元,则y =⎩⎪⎨⎪⎧4t ,0≤t ≤3,3×4+t -,3<t ≤4.5,即y =⎩⎪⎨⎪⎧4t ,0≤t ≤3,8t -12,3<t ≤4.5.由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:1×0.04+3×0.08+5×0.15+7×0.20+9×0.26+11×0.15+14×0.06+18×0.04+22×0.02=8.42(元).。