2017学年人教A版必修三 2.2.1 用样本的频率分布估计总体分布课件(34张)
- 格式:ppt
- 大小:1.07 MB
- 文档页数:34
2.2 用样本估计总体2.2.1 用样本的频率分布估计总体分布[读教材·填要点]1.用样本估计总体的两种情况 (1)用样本的频率分布估计总体的分布. (2)用样本的数字特征估计总体的数字特征. 2.绘制频率分布直方图的步骤3.频率分布折线图和总体密度曲线频率分布直方图――――――――→连接各小长方形上端的中点频率分布折线图 ――――――――――――→样本容量不断增大,频率折线图接近于一条光滑曲线总体密度曲线 4.茎叶图的制作步骤 (1)将数据分为茎和叶两部分;(2)将最大茎和最小茎之间数据按大小次序排成一列; (3)将各个数据的“叶”按大小次序写在茎右(左)侧.[小问题·大思维]1.频率分布直方图直观形象地表示了频率分布表,在频率分布直方图中是用哪些量来表示各组频率的?提示:在频率分布直方图中用每个矩形的面积表示相应组的频率,即频率组距×组距=频率,各组频率的和等于1,因此各小矩形的面积的和等于1.2.从甲、乙两个班级中各随机选出15名同学进行测试,成绩的茎叶图如图,你能说出甲、乙两班的最高成绩,以及哪个班的平均成绩较高吗?甲 乙6 4 8 57 9 4 16 2 5 9 87 5 4 2 17 2 5 7 8 9 7 4 48 1 4 4 7 9 692提示:甲、乙两班的最高成绩各是96,92,从图中看,乙班的平均成绩较高.列频率分布表、画频率分布直方图、折线图[例42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图. (2)用自己的语言描述一下历届美国总统就任时年龄的分布情况. [自主解答] (1)以4为组距,列表如下:分组 频数 频率 [41.5,45.5) 2 0.045 5 [45.5,49.5) 7 0.159 1 [49.5,53.5) 8 0.181 8 [53.5,57.5) 16 0.363 6 [57.5,61.5) 5 0.113 6 [61.5,65.5) 4 0.090 9 [65.5,69.5]20.045 5合计44 1.00(2)从频率分布表中可以看出60%左右的美国总统就任时的年龄在50岁至60岁之间,45岁以下以及65岁以上就任的总统所占的比例相对较小.根据频率分布表,求美国总统就任时年龄落在区间[61.5,69.5)人数占总人数的比例.解:区间[61.5,69.5)包含了[61.5,65.5),[65.5,69.5),两个组,两小组的频率和为0.090 9+0.045 5=0.136 4,故而所占比例为13.64%.——————————————————1.在列频率分布表时,极差、组距、组数有如下关系:(1)若极差组距为整数,则极差组距=组数.(2)若极差组距不为整数,则极差组距的整数部分+1=组数.2.组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本容量越大,所分组数越多.——————————————————————————————————————1.一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.05.4 4.6 5.8 5.5 6.0 6.5 5.1 6.55.3 5.9 5.5 5.8 6.2 5.4 5.0 5.06.8 6.0 5.0 5.7 6.0 5.5 6.8 6.06.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.45.77.4 6.0 5.4 6.5 6.0 6.8 5.86.3 6.0 6.3 5.6 5.3 6.4 5.7 6.76.2 5.6 6.0 6.7 6.7 6.0 5.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.7 5.8 5.3 7.0 6.0 6.0 5.9 5.4 6.0 5.2 6.0 6.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在5.75~6.05 cm 之间的麦穗在这批麦穗中所占的百分比.解:步骤是:(1)计算极差:7.4-4.0=3.4(cm). (2)决定组距与组数若取组距为0.3 cm ,由于3.40.3=1113,需分成12组,组数合适.于是取定组距为0.3 cm ,组数为12.(3)将数据分组使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是:3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表对各个小组作频数累计,然后数频数,算频率,列频率分布表,如下表所示:分组 频数累计频数 频率 3.95~4.25 1 0.01 4.25~4.55 1 0.01 4.55~4.85 2 0.02 4.85~5.15 正 5 0.05 5.15~5.45 正正 11 0.11 5.45~5.75 正正正 15 0.15 5.75~6.05 正正正正正28 0.28 6.05~6.35 正正 13 0.13 6.35~6.65正正110.116.65~6.95正正100.106.95~7.2520.027.25~7.5510.01合计100 1.00(5)画频率分布直方图.如图所示.从表中看到,样本数据落在5.75~6.05之间的频率是0.28,于是可以估计,在这块地里,长度在5.75 ~6.05 cm之间的麦穗约占28%.茎叶图及应用[例2]某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其质量,分别记下抽查记录如下(单位:千克):甲:52514948534849乙:60654035256560画出茎叶图,并说明哪个车间的产品质量比较稳定.[自主解答]茎叶图如图所示(茎为十位上的数字):甲乙2 53 599884032156005 5所以甲车间的产品质量比较稳定.——————————————————画茎叶图时,用中间的数表示数据的十位和百位数,两边的数分别表示两组数据的个位数.要先确定中间的数取数据的哪几位,填写数据时边读边填.比较数据时从数据分布的对称性、中位数、稳定性等几方面来比较.绘制茎叶图的关键是分清茎和叶,一般地说数据是两位数时,十位数字为“茎”,个位数字为“叶”;如果是小数的,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.——————————————————————————————————————2.在某电脑杂志的一篇文章中,每个句子中所含字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,21,24,27,17,29.在某报纸的一篇文章中,每个句子中所含字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22,18,32.(1)分别用茎叶图表示上述两组数据;(2)将这两组数据进行比较分析,你能得到什么结论?解:(1)茎叶图如图所示:电脑杂志报纸9 8 7 7 5 5 4 1 01 2 3 8 8 99 8 7 7 7 6 5 4 4 3 2 1 02 2 2 3 4 7 7 7 86 13 2 2 2 3 3 5 6 94 1 1 6(2)从茎叶图可看出:电脑杂志的文章中每个句子所含字数集中在10~30之间;报纸的文章中每个句子所含字数集中在20~40之间,且电脑杂志的文章中每个句子所含字的平均个数比报纸的文章中每个句子所含字的平均个数要少,因此电脑杂志的文章较简明.频率分布直方图的应用[例3]5月1日至31日,评委会把同学们上交作品的件数按5天一组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12.(1)本次活动中一共有多少件作品参评?(2)上交作品数量最多的一组有多少件?(3)经过评比,第四组和第六组分别有10件,2件作品获奖,这两组获奖率较高的是第几组?[自主解答] 在频率分布直方图中各小长方形的面积=组距×频率组距=频率,即各小长方形的面积等于相应各组的频率,且它们的面积和等于1.(1)依题意知第三组的频率为42+3+4+6+4+1=15.又因为第三组的频数为12,所以本次活动的参评作品数为12÷15=60(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有:60×62+3+4+6+4+1=18(件).(3)第四组的获奖率是1018=59;第六组上交的作品数量为60×12+3+4+6+4+1=3(件),所以第六组的获奖率是23=69>59,故第六组的获奖率较高. ——————————————————频率分布直方图的性质 (1)因为小矩形的面积=组距×频率组距=频率,所以各小矩形面积表示相应各组的频率,这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.(2)在频率分布直方图中,各小矩形的面积之和等于1. (3)频数/相应的频率=样本容量.——————————————————————————————————————3.(2012·济宁高一检测)为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.故第二小组的频率是0.08,样本容量是150. (2)由图可估计该校高一学生的达标率约为 17+15+9+32+4+17+15+9+3×100%=88%.故高一学生达标率是88%.某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg 的人数是( )A .10B .2C .5D .15[错解] 0.02×100=2人.选B. [错因] 误认为纵轴表示频率. [正解] 由图可知频率=频率组距×组距,知频率=0.02×5=0.1. ∴0.1×100=10人. [答案] A1.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2A.0.35B.0.45C.0.55 D.0.65解析:求出样本数据落在区间[10,40)中的频数,再除以样本容量得频率.求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.答案:B2.100辆汽车通过某一段公路时的时速的频率分布直方图如图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C.60辆D.80辆解析:0.04×10×100=40.答案:B3.从甲、乙两种玉米苗中各抽6株,分别测得它们的株高如图所示(单位:cm),根据数据估计()A.甲种玉米比乙种玉米不仅长得高而且长得整齐B.乙种玉米比甲种玉米不仅长得高而且长得整齐C.甲种玉米比乙种玉米长得高但长势没有乙整齐D.乙种玉米比甲种玉米长得高但长势没有甲整齐解析:乙的平均株高为14+27+36+38+44+456=2046=34 cm.甲乙61 45 2 1277 53 6 84 4 5甲的平均株高为16+21+22+25+35+376=1566=26 cm.答案:D4.为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们捐款数如下:(单位:元)19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是________,若取组距为2,则应分成________组;若第一组的起点定为18.5,则在[26.5,28.5]范围内的频数为________.解析:30-19=11 112=5.5,∴分6组. 在[26.5,28.5]之间的数有5个. 答案:11 6 55.将一个容量为n 的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n =________.解析:30n =0.25,∴n =30×4=120.答案:1206.为了了解学校高一年级男生的身高情况,选取一个容量为60的样本(60名男生的身高),分组情况如下(单位:cm):(1)求出表中a ,m 的值; (2)画出频率分布直方图.解:(1)由题意得:6+21+27+m =60 ∴m =6. a =2760=0.45 ∴a =0.45. (2)如图所示:一、选择题1.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60]元的同学有30人,则n 的值为( )A .90B .100C .900D .1 000解析:n ×0.030×10=30. n =100. 答案:B2.在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a ,b )是其中一组,抽查出的个体数在该组内的频率为m ,该组直方图的高为h ,则|a -b |的值等于( )A .h ·m B.m hC.h mD .与m ,h 无关 解析:小长方形的高=频率组距,∴|a -b |=频率小长方形的高=mh.答案:B3.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53解析:从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.答案:A4.为了解电视对生活的影响,一个社会调查机构就平均每天看电视的时间调查了某地10 000位居民,并根据所得数据画出样本的频率分布直方图(如图),为了分析该地居民平均每天看电视的时间与年龄、学历、职业等方面的关系,要从这10 000位居民中再用分层抽样抽出100位居民做进一步调查,则在[2.5,3)(小时)时间段内应抽出的人数是()A.25 B.30C.50 D.75解析:0.5×0.5×100=25人答案:A二、填空题5.青年歌手大奖赛共有10名选手参赛,并请了7名评委,如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________.解析:甲=78+84+85+86+885=84.2乙=84+84+84+86+875=85.答案:84.2856.(2011·浙江高考)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽甲乙8 5798 6 5 48 4 4 4 6 729 3取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.解析:由题意知,在该次数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,故这3 000名学生在该次数学考试中成绩小于60分的学生数是3 000×0.2=600.答案:6007.10个小球分别编号1,2,3,4,其中1号球4个,2号球2个,3号球3个,4号球1个,则0.4是指1号球占总体分布的________.解析:0.4=410为1号球占总体分布的频率.答案:频率8.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是______.作品A88 9 99 2 3 x 2 1 4解析:当x≤4时,89+89+92+93+(90+x)+92+917=91,解之得x=1.当x>4时,易证不合题意.答案:1三、解答题9.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107,;乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.解:甲、乙两人数学成绩的茎叶图如图所示.甲乙5 6615798896183684159398871036 1011 4从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况;也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.10.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50,60)40.08[60,70)0.16[70,80)10[80,90)160.32[90,100]合计50(1)填充频率分布表的空格(将答案直接填在表格内);(2)补全频率分布直方图;(3)若成绩在[70,90)分的学生为二等奖,问获得二等奖的学生约为多少人?解:(1)分组频数频率[50,60)40.08[60,70)80.16[70,80)100.20[80,90)160.32[90,100]120.24合计50 1.00 (2)频率分布直方图如图所示:(3)∵成绩在[70,80)间的学生频率为0.20;成绩在[80,90)间的学生频率为0.32.∴在[70,90)之间的频率为0.20+0.32=0.52.又∵900名学生参加竟赛,∴该校获二等奖的学生为900×0.52=468(人).。