高中数学必修三北师大版 1.5.1-5.2 估计总体的分布 估计总体的数字特征 学案(Word版含答案)
- 格式:doc
- 大小:697.00 KB
- 文档页数:14
5.1 估计总体的分布填一填 1.在频率分布直方图中,每个小矩形的宽度为________,高为________,小矩形的面积恰为相应的________,图中所有小矩形的面积之和等于________.2.作频率分布直方图的步骤(1)求极差.即一组数中最大值和最小值的差.(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.(3)将数据分组.(4)列频率分布表,各小组的频率=小组频数样本容量. (5)画频率分布直方图.3.频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的________开始,用线段依次连接各个矩形的________,直至右边所加区间的________,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之________,而每个区间的长度则会相应随之________,相应的频率折线图就会越接近于一条光滑曲线.判一判1.( )2.频率分布直方图的面积为样本的频数.( )3.频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.( )4.从频率分布直方图中可以清楚地看出数据的内容.( ) 5.极差组距=组数( )6.一般样本容量越大,所分组数越多;样本容量越小,所分组数越小.( )7.频率分布直方图的横轴表示样本数据,纵轴表示频率.( )8.用样本频率分布估计总体频率分布中,样本容量越大,估计越精确.( )想一想1.提示:分组,频数累计,计算频数和频率.2.绘制频率分布直方图的注意点有哪些?提示:(1)各组频率的和等于1,因此,各小矩形的面积的和也等于1;(2)频率分布直方图比频率分布表更直观、形象地反映了样本的分布规律;(3)在xOy 坐标平面内画频率分布直方图时,x =样本数据,y =频率组距,这样每一组的频率可以用该组的组距为底、频率组距为高的小矩形的面积来表示.其中,矩形的高=频率组距=1组距×样本容量×频数; (4)同样一组数据,如果组距不同,横轴、纵轴单位不同,得到的频率分布直方图的形状也会不同;(5)同一个总体,由于抽样的随机性,如果随机抽取另外一个容量相同的样本所形成的样本频率分布一般会与前一个样本频率分布有所不同. 3.解决与频率分布直方图有关问题的关系式是什么?提示:由频率分布直方图进行相关计算时,需掌握下列关系式: (1)频率组距×组距=频率. (2)频数样本容量=频率,此关系式的变形为样本容量×频率=频数. 4.在列频率分布表时,极差、组距、组数有什么关系?提示:①若极差组距为整数,则极差组距=组数. ②若极差组距不为整数,则极差组距的整数部分+1=组数. 思考感悟练一练1.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为()A.10组B.9组C.8组D.7组2.一个容量为20的样本数据,分组及各组的频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2.则样本在区间[20,60)上的频率是()A.0.5 B.0.6 C.0.7 D.0.83.从一堆苹果中任取10个,称得它们的质量如下(单位:克):12512012210513011411695120134则样本数据落在[114.5,124.5)内的频率为()A.0.2 B.0.3 C.0.4 D.0.54.在频率分布直方图中,小矩形的面积等于()A.组距B.频率C.组数D.频数知识点一频率分布概念的理解组别[0,10)[10,20)[20,30)[30,40)[40,50)[50,60)[60,70] 频数1213241516137A.0.13B.0.39C.0.52D.0.642.容量为100的某个样本,数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率依次相差0.05,则剩下的三组中频率最大的一组频率为________.知识点二频率分布直方图的绘制3.各组的频数如下:起始月薪(百[13,14)[14,15)[15,16)[16,17) 元)频数7112623(2)画出频率分布直方图和频率分布折线图;(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.4.一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5 6.4 6.7 5.8 5.9 5.9 5.2 4.0 5.4 4.65.8 5.5 6.0 6.5 5.1 6.5 5.3 5.9 5.5 5.86.2 5.4 5.0 5.0 6.8 6.0 5.0 5.7 6.0 5.56.8 6.0 6.3 5.5 5.0 6.3 5.2 6.07.0 6.46.4 5.8 5.9 5.7 6.8 6.6 6.0 6.4 5.77.46.0 5.4 6.5 6.0 6.8 5.8 6.3 6.0 6.3 5.65.3 6.4 5.7 6.7 6.2 5.6 6.0 6.7 6.7 6.05.6 6.2 6.1 5.3 6.2 6.8 6.6 4.7 5.7 5.75.8 5.37.0 6.0 6.0 5.9 5.4 6.0 5.2 6.06.3 5.7 6.8 6.1 4.5 5.6 6.3 6.0 5.8 6.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35 cm之间的麦穗所占的百分比.5.某班50名学生在一次百米跑测试中,成绩全部介于13 s与19 s之间,将测试结果按如下方式分成六组:第一组,成绩大于等于13 s 且小于14 s;第二组,成绩大于等于14 s且小于15 s;…;第六组,成绩大于等于18 s且小于等于19 s,如图所示是按上述分组方法得到的频率分布直方图.设成绩小于17 s的学生人数占全班总人数的百分比为x,成绩大于等于15 s且小于17 s的学生人数为y,则从频率分布直方图(如图所示)中分析出x和y分别为()A.0.9,35 B.0.9,45 C.0.1,35 D.0.1,456.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为24171593,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率约是多少?综合知识估计总体的分布7.某电子商务公司对10 000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.8.为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:组别频数频率145.5~10.02149.5149.5~40.08153.5153.5~200.40157.5157.5~150.30161.5161.5~80.16165.5165.5~m n169.5合计M N(1)求出表中m,(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm以上的频率.基础达标1.对于用样本频率分布估计总体分布的过程,下列说法正确的是()A.总体容量越大,估计越精确B.总体容量越小,估计越精确C.样本容量越大,估计越精确D.样本容量越小,估计越精确2.将容量为100的样本数据,由小到大排列,分成8个小组,如下表所示:组号12345678频数101314141513129第3A.0.14,0.37 B.114,127C.0.03,0.06 D.314,6373.如图是某班50位学生期中考试数学成绩(单位:分)的频率分布直方图,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值为()A.0.014B.0.048 C.0.018D.0.0124.如图是某中学高一学生体重的频率分布直方图,已知图中从左到右的前三组的频率之比为1:2:3,则第三小组的频率为()A.0.125B.0.250 C.0.375D.0.5005.某班全体学生英语测试成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45B.50 C.55D.606.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480 C.450D.1207.在中秋的促销活动中,某商场对9月14日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知12时到14时的销售额为7万元,则10时到11时的销售额为()A.1万元B.2万元C.3万元D.4万元8.下面是某中学期末考试各分数段的考生人数分布表:分数频数频率[300,400) 5[400,500)900.075[500,600) 499[600,700) 0.425[700,800) ?[800,900] 8则分数在[700,800)的人数为________.9.中小学生的视力状况受到社会的广泛关注,某市有关部门从全市6万名高一学生中随机抽取了400名,对他们的视力状况进行一次调查统计,将所得到的有关数据绘制成频率分布直方图,如图所示.从左至右五个小组的频率之比依次是5:7:12:10:6,则全市高一学生视力在[3.95,4.25)范围内的学生约有________.10.在样本的频率分布直方图中共有n 个小矩形,若中间一个小矩形的面积等于其余(n -1)个小矩形面积的17,且样本容量为3 200,则中间一组的频数为________.11.将容量为n 的样本中的数据分成六组,绘制成频率分布直方图,若第一组至第六组数据的频率之比为2:3:4:6:4:1,且前三组数据的频数之和等于27,则n =________.12.对某市“四城同创”活动中800名志愿者的年龄抽样调查,统计后得到频率分布直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)年龄组[25,30)对应小矩形的高度为________;(2)据此估计该市“四城同创”活动中志愿者年龄在[25,35)内的人数为________.13.如表所示给出了在某校500名12岁男孩中,用随机抽样得出的120人的身高(单位:cm).区间 [122, [126, [130, [134, [138,界限126)130)134)138)142) 人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数20116 5(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.14.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:分组频数频率[50,60)40.08[60,70)0.16[70,80)10[80,90)160.32[90,100]合计50(1)填充频率分布表的空格(将答案直接填在表格内).(2)补全频率分布直方图.(3)若成绩在[70,90)分的学生为二等奖,问获得二等奖的学生约为多少人?能力提升15.(单位:分)及各组的频数如下:[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例.16.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图.组号分组频数1[0,2) 62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14) 68[14,16) 29[16,18]2合计100(1)试估计该校学生该周课外阅读时间少于12小时的频率; (2)求频率分布直方图中的a ,b 的值.5.1 估计总体的分布 一测 基础过关填一填1.Δx i f iΔx i频率f i 13.中点 顶端中点 中点 增多 减少 判一判1.× 2.× 3.√ 4.× 5.× 6.√ 7.× 8.√ 练一练1.B 2.D 3.C 4.B 二测 考点落实1.解析:由题意知,频数在[10,40)的有13+24+15=52.∴频率=频数总数=52100=0.52.答案:C2.解析:设剩下的三组中频率最大的一组的频率为x .则另两组的频率分别为x -0.05,x -0.1.因为频率总和为1,所以0.79+(x -0.05)+(x -0.1)+x =1.解得x =0.12.答案:0.123.解析:(1)样本的频率分布表为起始月薪(百元) 频数 频率[13,14) 7 0.07 [14,15) 11 0.11 [15,16) 26 0.26 [16,17) 23 0.23 [17,18) 15 0.15 [18,19) 8 0.08 [19,20) 4 0.04 [20,21] 6 0.06 合计 100 1.00(2)(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,故起始月薪低于2 000元的频率的估计值是0.94.4.解析:(1)计算极差:7.4-4.0=3.4. (2)决定组距与组数:若取组距为0.3,因为3.40.3≈11.3,需分为12组,组数合适, 所以取组距为0.3,组数为12. (3)决定分点:使分点比数据多一位小数,并且把第1小组的起点稍微减小一点,那么所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.(4)列频率分布表:分组 频数 频率 [3.95,4.25) 1 0.01 [4.25,4.55) 1 0.01[4.55,4.85) 2 0.02 [4.85,5.15) 5 0.05 [5.15,5.45) 11 0.11 [5.45,5.75) 15 0.15 [5.75,6.05) 28 0.28 [6.05,6.35) 13 0.13 [6.35,6.65) 11 0.11 [6.65,6.95) 10 0.10 [6.95,7.25) 2 0.02 [7.25,7.55] 1 0.01 合计100 1.00(5)从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35 cm 之间的麦穗约占41%.5.解析:(1)由频率分布直方图知x =0.34+0.36+0.18+0.02=0.9, ∵y50=0.36+0.34=0.7,∴y =35. 故选A. 答案:A6.解析:(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校全体高一年级学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.7.解析:由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a ×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.答案:(1)3(2)6 0008.解析:(1)法一:N=1,n=1-(0.02+0.08+0.40+0.30+0.16)=0.04,8m=0.160.04,∴m=2,M=1+4+20+15+8+2=50.法二:M=10.02=50,m=50-(1+4+20+15+8)=2,N=1,n=mM=250=0.04.(2)作出直角坐标系,组距为4,纵轴表示f iΔx i,横轴表示身高,画出频率分布直方图如图所示.(3)由频率分布直方图可知:样本中在153.5~157.5范围内的人数最多,且身高在161.5 cm以上的频率为0.16+0.04=0.2,由此可估计全体女生中身高在153.5~157.5范围内的人数最多,九年级学生中女生的身高在161.5 cm以上的频率估计为0.2.三测学业达标1.解析:样本为所研究的具体对象,样本容量越大,越能反映总体情况.答案:C2.解析:由表可知,第3组的频率为14100=0.14,累计频率为10+13+14100=0.37.答案:A3.解析:成绩在[80,90)内的频率为1-0.006×10×3-0.010×10-0.054×10=0.18,所以10x =0.18,解得x =0.018.答案:C4.解析:由频率分布直方图,知前三组的频率之和为1-(0.012 5+0.037 5)×5=0.750,所以第三小组的频率为0.750×31+2+3=0.375,故选C.答案:C5.解析:根据频率分布直方图,可知低于60分的人数的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是150.3=50.答案:B6.解析:不少于60分的频率为(0.030+0.025+0.015+0.010)×10=0.8,所以所求学生人数为0.8×600=480(人). 答案:B7.解析:由题中频率分布直方图得:12时到14时的销售额所占频率为0.25+0.1=0.35,10时到11时的销售额所占频率为1-0.1-0.4-0.25-0.1=0.15. ∵12时到14时的销售额为7万元,∴10时到11时的销售额为7×0.150.35=3万元.故选C. 答案:C8.解析:由于在分数段[400,500)内的频数是90,频率是0.075,则该中学共有考生900.075=1 200,则在分数段[600,700)内的频数是 1 200×0.425=510,则分数在[700,800)内的频数,即人数为1 200-(5+90+499+510+8)=88.答案:889.解析:由题图知,第五小组的频率为0.5×0.3=0.15,所以第一小组的频率为0.15×56=0.125,所以全市6万名高一学生中视力在[3.95,4.25)范围内的学生约有60 000×0.125=7 500(人).答案:7 50010.解析:因为中间一个小矩形的面积等于其余(n -1)个小矩形面积的17,所以中间一个小矩形的面积为所有矩形面积和的18,因此中间一组的频数为3 200×18=400.答案:40011.解析:因为前三组数据的频数之和等于27,所以前三组数据的频数分别为6,9,12,则后三组的频数分别为18,12,3,所以样本容量n =6+9+12+18+12+3=60.答案:6012.解析:(1)设年龄组[25,30)对应小矩形的高度为h,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由(1)得志愿者年龄在[25,35)内的频率为5×(0.04+0.07)=0.55,故志愿者年龄在[25,35)内的人数约为0.55×800=440.答案:(1)0.04(2)44013.解析:(1)样本频率分布表如下:分组频数频率[122,126)50.04[126,130)80.07[130,134)100.08[134,138)220.18[138,142)330.28[142,146)200.17[146,150)110.09[150,154)60.05[154,158]50.04合计120 1.00(2)(3)由样本频率分布表可知,身高小于134 cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm的人数占总人数的19%.14.解析:(1)分组频数频率[50,60)40.08[60,70)80.16[70,80)100.20[80,90)160.32[90,100]120.24合计50 1.00(2)频率分布直方图如图所示:(3)因为成绩在[70,80)间的学生频率为0.20;成绩在[80,90)间的学生频率为0.32.所以在[70,90)之间的频率为0.20+0.32=0.52.又因为900名学生参加竞赛,所以该校获二等奖的学生为900×0.52=468(人).15.解析:(1)频率分布表如下:成绩分组频数频率累积频率[40,50)20.040.04[50,60)30.060.1[60,70)100.20.3[70,80)150.30.6[80,90)120.240.84[90,100)80.16 1.00合计50 1.00(2)(3)成绩在[60,90)分的学生比例,即学生成绩在[60,90)分的频率0.2+0.3+0.24=0.74=74%.所以估计成绩在[60,90)分的学生比例为74%.16.解析:(1)由频数分布表,得100名学生中课外阅读时间不少于12小时的共有6+2+2=10名,所以样本中学生该周课外阅读时间少于12小时的频率为1-10100=0.9.由样本估计总体,得该校学生该周课外阅读时间少于12小时的频率是0.9.(2)由频数分布表,得课外阅读时间落在[4,6)的频数为17,则频率是17100=0.17,所以由频率分布直方图得a=0.172=0.085. 同理可得b=0.252=0.125.由Ruize收集整理。
《估计总体的分布》本节课在高中统计部分承上启下,地位非常重要。
一方面,通过学习抽样方法,学生已经会收集样本数据,但样本数据依旧杂乱无章,无法提取有效信息,如何处理样本数据成为燃眉之急;另一方面,本节课的学习也为后面研究总体密度曲线、用样本的数字特征估计总体的数字特征等知识奠定了基础。
【知识与能力目标】(1)通过实例体会分布的意义和作用;(2)在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图、茎叶图;(3)通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计。
【过程与方法目标】 通过对生活实例的探究,感知应用统计学知识解决问题的方法,理解数形结合的数学思想。
【情感与态度目标】通过实例对样本分析和总体的估计,感受用数学方法解决生活中的问题的过程,认识到数学对实际生活的指导价值。
【教学重点】:◆ 教材分析◆ 教学目标◆ 教学重难点◆会列频率分布表,画频率分布直方图、频率折线图和茎叶图。
【教学难点】:能通过样本的频率分布估计总佒的分布。
◆课前准备◆多媒体课件◆教学过程一、回顾旧知问题:我们学习了那些统计图?这些统计图的特点是什么?各适合描述什么样的数据?从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看做是总体),我们就可以直接从中分析总体的各种信息。
但是在实际问题中,总体的信息往往不能全部得到,因此我们需要抽样调查,从总体中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征。
这节课我们一起来学习用样本来估计总体的分布。
二、频率分布直方图及其作用1895年,在英国伦敦有106块男性头盖骨被挖掘出土。
经考证,头盖骨的主人死于1665—1666年之间的大瘟疫。
人类学家分别测量了这些头盖骨的宽度,数据如下所示:(单位mm)146 141 139 140 145 141 142 131 142 140 144 140 138 139 147 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 145 145 121 129 143 148 138 149 146 141 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141请大家思考:用什么统计图可以直观表示上述数据的分布状况?你能根据上述数据估计在。
«估计总体的数字特征》♦教材分析教科书中介绍了简单随机抽样、分层抽样和系统抽样三种抽样方法,通过学习要弄清各自的特点和适用范围,然后在实践中酌情选用.对收集到的数据如何分析、估计,才能从中提取合理、有用的信息,帮助我们作出决策,要注意不应把统计处理成数字运算和画图表,重在掌握统计的思想方法.用样本估计总体是最基本的统计方法,通过学习要弄清样本平均数、方差、标准差、频率分布表、频率分布直方图、折线图等基本概念是怎样来反映统计数据的,通过解决具体问题的实践,领会如何运用这些方法去解决实际问题,要通过系统的数据处理过程,体会统计思维与确定性思维的差异.♦教学目标【知识与能力目标】(1)理解样本数据标准差的意义和作用,学会计算数据的标准差(2)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释•(3 )会用样本的基本数字特征估计总体的基本数字特征.(4)形成对数据处理过程进行初步评价的意识【过程与方法目标】在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法•【情感与态度目标】会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,培养对生活中的问题进行用数学方法进行理性分析的意识♦教学重难点【♦学重点】:用样本平均数和标准差估计总体的平均数与标准差【教学难点】:能应用相关知识解决简单的实际问题•♦课前准备多媒体课件♦教学过程一、新课引入:问题:什么是平均数,众数,中位数?它反映一组数据的什么特征?什么是标准差?它反映一组数据的什么特征?日常生活中,我们往往不需要了解总体的分布形态,而是更关心总体的某一数字特征。
例如:买节能灯时,我们希望知道节能灯的平均使用寿命,但是怎样了解节能灯的使用寿命呢?当然不可能把所有的灯进行一一测试,因为测试后灯也报废了,而且灯的数目太多。
于是需要通过随机抽样,把这批节能灯的寿命看做总体,从中随机抽出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征。
1.5.2估计总体的数字特征本节教材分析一、三维目标1、知识与技能(1)能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.(2)会用样本的基本数字特征估计总体的基本数字特征.(3)形成对数据处理过程进行初步评价的意识.2、过程与方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.3、情感态度与价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辨证地理解数学知识与现实世界的联系.二、教学重点:用样本平均数和标准差估计总体的平均数与标准差.三、教学难点:能应用相关知识解决简单的实际问题.四、教学建议教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计.教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题, 通过小资料栏目“估计二战期间德国坦克的总数”,让学生进一步体会分布的数字特征在实际中的应用.新课导入设计导入一在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.导入二用随机抽样的方法获得样本,我们就会得到一组数据,统计思想的本质就是用样本估计总体.用样本估计总体,一般有两种方法:一是用样本的频率分布估计总体分布;二是用样本的数字特征估计总体的数字特征.第一种方法我们已经学习了啦,本节我们继续学习第二种方法.教学流程:↓1.创设情景,揭示课题上一节我们学习了用图、表组织样本数据,并且学习了如何通过图、表提供的信息,用样本的频率分布估计总体的分布. 在日常生活中,我们往往并不需要了解总体的分布形态,而是关心总体的某一数字特征,例如:居民月均用水量问题,我们关心的是数字,而不是总体的分布形态.因此我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计总体的数字特征(板出课题).2.探究:(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?我们初中时学习众数、中位数、平均数等数字特征.我们共同回忆一下?什么是众数、中位数、平均数?众数—一一组数中出现次数最多的数.中位数——将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.平均数——将所有数相加再除以这组数的个数,所得到得数.热身训练:求下列各组数据的众数、中位数、平均数 (1)1 ,2,3,3,3,4,6,7,7,8,8,8 (2)1 ,2,3,3,3,4,6,7,8,9,9 答案:(1) 众数是:3和8 中位数是:5 平均数是:5(2) 众数是:3 中位数是:4 平均数是:5 例如,在上一节抽样调查的100位居民的月均用水量的数据中,我们如何得知这一组样本数据的众数、中位数和平均数 ? 众 数=2.3(t )、中位数=2.0(t )、平均数=1.973(t )那么从频率分布直方图你能得到这些数据的众数,中位数,平均数吗? 3. 如何在频率直方图中估计众数、中位数、平均数呢?1) 如何从频率分布直方图中估计众数?学生交流讨论,回答从频率分布直方图可以看出:月均用水量的众数是 2.25t (最高的矩形的中点),它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少. 思考1:请大家看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?0.10.20.30.4月均用水量/t表2-1 100为居民的月均用水量(单位:t)请学生思考交流,回答这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.显然通过频率分布直方图的估计精度较低,其估计结果与数据分组有关,在不能得到样本数据,只能得到频率分布直方图的情况下,也可以估计总体的特征.归纳总结:因为在频率分布直方图中,各小长方形的面积表示相应各组的频率,也显示出样本数据落在各小组的比例的大小,所以从图中可以看到,在区间[2,2.5)的小长方形的面积最大,即这组的频率是最大的,也就是说月均用水量在区间[2,2.5)内的居民最多,即众数就是在区间[2,2.5)内. 众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标.2) 如何从频率分布直方图估计中位数?学生交流讨论,回答分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等. 由此可以估计中位数的值. 设中位数为x ,则5.05.0)2(22.015.008.004.0=⨯-++++x求出02.2=x在上图中,红色虚线代表居民月平均用水量的中位数的估计值.其左边的直方图的面积是2.20.61.81.21.01.52.02.22.52.82.4 0.8 1.7 1.0 1.0 1.6 2.1 2.3 2.6 2.5 2.4 0.5 1.5 1.2 1.4 1.7 2.1 2.4 2.7 2.6 2.3 0.9 1.6 1.3 1.3 1.8 2.3 2.3 2.8 2.5 2.0 0.7 1.8 1.4 1.3 1.9 2.4 2.4 2.93.04.3 0.8 1.9 3.5 1.4 1.8 2.3 2.4 2.9 3.2 4.1 0.6 1.7 3.6 1.3 1.7 2.2 2.3 2.8 3.3 3.8 0.5 1.5 3.7 1.2 1.6 2.1 2.3 2.7 3.2 0.4 0.3 0.4 0.2 1.2 1.5 2.2 2.2 2.6 3.4 1.6 1.9 1.8 1.6 1.0 1.5 2.0 2.0 2.5 3.1 观察频率分布直方图估计中位数频率 00.10.20.30.40.50.6月均用水量/t50个单位.右边的直方图的面积也是50个单位.由此可以估计出中位数的值为2.02. 思考2:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(样本数据的频率分布直方图把原始的一些数据给遗失了)3) 如何从频率分布直方图中估计平均数?学生交流讨论,回答平均数等于是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.以上图为例来讲解求解过程;02.202.025.404.075.306.025.314.075.225 .025.222.075.115.025.108.075.004.025.0=⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯平均数为2.02由此居民的月用水量的平均数是2.02t.大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考3:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?让学生讨论,并举例优点:对极端数据不敏感的方法能够有效地预防错误数据的影响.对极端值不敏感有利的例子:如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,如:考察表中2-1中的数据如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能过有效地预防错误数据的影响.用抗极端数据强的中位数表示数据的中心值更准确.缺点:(1)出现错误的数据也不知道;(2)对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作.这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.4)对众数,中位数,平均数估计总体数字特征的认识(1)样本众数通常用来表示分类变量的中心值,比较容易计算,但是它只能表示样本数据中的很少一部分信息.(2) 中位数不受少数几个极端值的影响, 容易计算,它仅利用了数据排在中间的数据的信息.(3)样本平均数与每个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数,众数都不具有的性质,也正因为这个原因,与众数,中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.探究:“用数据说话”这是我们经常可以听到的一句话.但是数据有时也会被利用,从而产生误导.例如一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多,尽管这时中位数比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数回答有关工资待遇方面的提问.你认为“我们单位的收入水平比别的单位高”这句话应当怎么解释?以员工平均工资收入水平去描述他们单位的收入情况.这是不合理的,因为这些员工当中,少数经理层次的收入与大多数一般员工收入的差别比较大,平均数受数据中的极端值的影响大,所以平均数不能反映该单位员工的收入水平.这个老板的话有误导与蒙骗行 例题例:某公司的33名职工的月工资(单位:元)如下表:(1) 求该公司职工月工资的平均数、中位数、众数.(2) 若董事长、副董事长的工资分别从5500元、5000元提升到30000元、20000元,那么公司职工新的平均数、中位数和众数又是什么?(3) 你认为哪个统计量更能反映这个公司员工的工资水平? 解析:(1)公司职工月工资的平均数为:2091336900033201500320005250030002350050005500≈=⨯+⨯+⨯++⨯++=x(元) 若把所有数据从大到小排序,则得到:中位数是1500元,众数是1500元.(2)若董事长、副董事长的工资提升后,职工月工资的平均数为:3288331085003320150032000525003000235002000030000≈=⨯+⨯+⨯++⨯++=x (元)中位数是1500元,众位是1500元.(3)在这个问题中,中位数和众数都能反映出这个公司员工的工资水平,因为公司少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司员工的工资水平. 巩固练习假设你是一名交通部门的工作人员,你打算向市长报告国家对本市26个公路项目投资的平均资金数额,其中一条新公路的建设投资为2000万元人民币,另外25个项目的投资是20~100万元。
5.1 估计总体的分布整体设计教学分析教科书通过问题的探究,使学生学会列频率分布表、画频率分布直方图和频率分布折线图.教科书在本节主要介绍了有关频率分布的列表和画图的方法,而关于频率分布的随机性和规律性方面则给教师留下了较大的发挥空间.教师可以通过初中有关随机事件的知识,也可以利用计算机多媒体技术,引导学生进一步体会由样本确定的频率分布表和频率分布直方图的随机性;通过初中有关频率与概率之间的关系,了解频率分布直方图的规律性,即频率分布与总体分布之间的关系,进一步体会用样本估计总体的思想.由于可以用样本频率分布直方图估计总体分布,因此可以用样本频率分布特征来估计相应的总体分布特征,这就提供了估计总体特征的另一种途径,其意义在于:在没有原始数据而仅有频率分布的情况下,此方法可以估计总体的分布特征.三维目标1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图,理解数形结合的数学思想和逻辑推理的数学方法.3.通过对样本分析和总体估计的过程,感受数学对实际生活的需要,通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地作出总体估计,认识到数学知识源于生活并指导生活的事实,体会数学知识与现实世界的联系.重点难点教学重点:会列频率分布表、画频率分布直方图和频率折线图.教学难点:能通过样本的频率分布估计总体的分布.课时安排1课时教学过程导入新课思路1.在美国男子篮球职业联赛的2011~2012赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下:甲运动员得分:12,15,20,25,31,31,36,36,37,39,44,49,50;乙运动员得分:8,13,14,16,23,26,28,38,39,51,31,29,33.请问从上面的数据中你能否看出甲、乙两名运动员在2011~2012赛季中,哪一位发挥比较稳定吗?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布(板书课题).课要研究、学习的主要内容——用样本的频率分布估计总体分布.思路3.讨论:我们要了解我校学生每月零花钱的情况,应该怎样进行抽样?提问:我们学习了哪些抽样方法?一般在什么时候选取什么样的抽样方法呢?讨论:通过抽样方法收集数据的目的是什么?(从中寻找所包含的信息,用样本去估计总体)指出两种估计手段:一是用样本的频率分布估计总体的分布,二是用样本的数字特征(平均数、标准差等)估计总体的数字特征.这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.推进新课新知探究提出问题1.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)2.什么是频率分布?3.频率分布直方图的特征是什么?4.什么是频率分布折线图?讨论结果:1.为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格来改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布直方图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚地看到整个样本数据的频率分布情况.2.频率分布是指一个样本数据在各个小范围内所占比例的大小;一般用频率分布直方图来反映样本的频率分布.3.频率分布直方图的特征:(1)通过频率分布直方图可以清楚地看出数据分布的总体趋势.(2)通过频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断.4.连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.应用示例思路1例1895年,在英国伦敦有106块男性头盖骨被挖掘出土.经考证,头盖骨的主人死于1665~1666年之间的大瘟疫.人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm):146 138 134 141 142 148 158 149 138141139146143146152135146145139147134143140143132141145140139142141148140148142142145141133138140141142144143141137149136140145145137143142141140138139148145153148131132140144139139121148141142140143136144136129144145140140143145138141143138141144141149143146140148150140143136137153139138148请你估计在1665~1666年之间,英国男性头盖骨宽度的分布情况.解:这里,如果把总体看作是1665~1666年之间的英国男性头盖骨的宽度,那么我们就是要通过上面挖掘出土得到的样本信息,来估计总体的分布情况.但从上面的数据很难直接估计出总体的分布情况,为此,我们可以先将以上数据按每个数据出现的频数和频率汇成下表:性头盖骨宽度主要在140~150 mm 之间,130 mm 以下以及150 mm 以上所占的比率相对较小等.但是,这些关于分布情况的描述仍不够形象,为了得到更为直观的信息,我们可以再将1中纵坐标的频数换成f iΔx i ,便可以得到图2.图1图2点评:当样本量较大时,样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率.因此,我们就可以用样本的频率分布直方图来估计总体在任意区间内取值的频率,也即总体的分布情况.变式训练1.有100名学生,每人只能参加一个运动队,其中参加足球队的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人.(1)列出学生参加运动队的频率分布表.(2)画出频率分布条形图.解:(1)参加足球队记为1,参加篮球队记为2,参加排球队记为3,参加乒乓球队记为4图32.为了了解中学生的身体发育情况,对某中学17岁的60名女生的身高进行了测量,结果如下(单位cm):154 159 166 169 159 156 166 162 158156 166 160 164 160 157 151 157 161158 153 158 164 158 163 158 153 157162 159 154 165 166 157 151 146 151160 165 158 163 163 162 161 154 165162 159 157 159 149 164 168 159 153列出样本的频率分布表,并绘出频率分布直方图.图4点评:以上两种情况的不同之处在于,前者的频率分布表列出的是几个不同数值的频率,相应的条形图是用其高度表示取各个值的频率;后者的频率分布表列出的是在不同区间内取值的频率,相应的直方图是用图表面积的大小来表示在各个区间内取值的频率.我们在处理一个数理问题时可以采用样本的频率分布估计总体分布的方法,这是因为,频率分布随着样本容量的增大更加接近于总体分布,当样本容量无限增大且分组的组距无限缩小时,频率分布的直方图就演变成一条光滑的曲线——总体密度曲线.这条曲线是客观存在的,但是我们却很难将它准确地画出,我们只能用样本的频率分布去对它进行估计.基于频率分布与相应的总体分布有这种关系,再加上我们通常并不知道一个总体的分布,我们往往是从一个总体中抽取一个样本,用样本的频率去估计相应的总体分布.一般说来,样本的容量越大,这种估计就越精确.思路2(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)(2)图5(3)由样本频率分布表可知身高小于134 cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm 的人数占总人数的19%.变式训练从某校高一年级的1 002名新生中用系统抽样的方法抽取一个容量为100的身高样本,作出该样本的频率分布表,并估计身高不小于170 cm 的同学所占的百分率.⎝ ⎛⎭⎪⎫0.14×171.5-170171.5-168.5+0.07+0.04+0.03×100%=21%.例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图6),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.图6分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08; 又因为频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150. (2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114.故跳绳次数的中位数落在第四小组.知能训练1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( ).A .91%B .92%C .95%D .30%答案:A2.有一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(-∞,50)上的频率为( ).A .0.5B .0.7C .0.25D .0.05 答案:B3.一个高中研究性学习小组对本地区2010年至2012年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如图7),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭______万盒.快餐公司个数情况图快餐公司盒饭年销售量的平均数情况图图7答案:85拓展提升为了了解一大片经济林的生长情况,随机测量了其中的100株的底部周长,得到如下数cm的树木约占多少?周长不小于120 cm的树木约占多少?解:(1)这组数据的最大值为135,最小值为80, 极差为55,可将其分为11组,组距为5.图8(3)从频率分布表可知,样本中小于100的频率为0.01+0.02+0.04+0.14=0.21,样本中不小于120的频率为0.11+0.06+0.02=0.19,据此可估计该片经济林中底部周长小于100 cm的树木约占21%,周长不小于120 cm的树木约占19%.课堂小结总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.作业习题1—5 1,2.设计感想本节课是高一新课程必修3第一章《统计》中的第五节《用样本估计总体》的第一节课,尽管用样本估计总体是一种实用性很强,操作烦琐、麻烦的工作,但却是统计学中常用的方法,在生产、生活中应用非常广泛.用样本估计总体,其实就是一种“以偏概全”“以部分代替全部”的思想.虽然有贬义的成分,但我们还是要认真去教好学好,而且,这也是平时考试和高考中的重点内容之一.本节要解决的问题就是:为何要用样本估计总体——社会生产、生活的实际需要(必要性),如比赛、竞技中预测结果,评判质量谁好谁差,水平谁高谁低经常要用到.如何去用样本估计总体——用样本的频率分布去估计总体的频率分布;怎样用样本估计总体——作出样本频率分布表或频率分布直方图,懂得用“数据”语言说话.另外,本节课通过选取一些学生特别关心的身边事例,对学生进行思想情操教育、意志教育并增强学生的自信心,使学生养成良好的学习态度.备课资料备用习题下表是1 002名学生身高的频率分布表,根据数据画出:(1)频率分布直方图;①根据频率分布表,作直角坐标系,以横轴表示身高,纵轴表示f iΔx i(如图9).图9②在横轴上标上表示的点.③在上面各点中,分别以连接相邻两点的线段为底作矩形,高等于该组的频率组距. 一般地,作频率分布直方图的方法为:把横轴分成若干段,每一段对应一个组的组距,以此线段为底作矩形,高等于该组的频率组距,这样得到一系列矩形,每一个矩形的面积恰好是该组上的频率.这些矩形构成了频率分布直方图.(2)频率分布折线图在频率分布直方图中,取相邻矩形上底边的中点顺次连接起来,就得到频率分布折线图(简称频率折线图)如图10.图10。
北师大版高二数学必修3目录目录第一章 统计1.从普查到抽样从普查到抽样习题1—1 阅读材料阅读材料 选举的预测选举的预测2.抽样方法抽样方法2.1简单随机抽样简单随机抽样2.2分层抽样与系统抽样分层抽样与系统抽样习题1—2 3.统计图表统计图表习题1—3 4.数据的数字特征数据的数字特征4.1平均数、中位数、众数、极差、方差平均数、中位数、众数、极差、方差4.2标准差标准差习题1—4 5.用样本估计总体用样本估计总体5.1估计总体的分布估计总体的分布5.2估计总体的数字特征估计总体的数字特征习题1—5 阅读材料阅读材料 标准差的用途标准差的用途6.统计活动:结婚年龄的变化统计活动:结婚年龄的变化习题1—6 7.相关性相关性习题1—7 8.最小二乘估计最小二乘估计习题1—8 阅读材料阅读材料 统计小史统计小史 课题学习课题学习 调查通俗歌曲的流行趋势调查通俗歌曲的流行趋势 本章小结本章小结复习题一复习题一第二章 算法初步1.算法的基本思想算法的基本思想1.1算法案例分析算法案例分析1.2排序问题与算法的多样性排序问题与算法的多样性 习题2—1 阅读材料阅读材料 物不知数物不知数2.算法框图的基本结构及设计算法框图的基本结构及设计 2.1顺序结构与选择结构顺序结构与选择结构 2.2变量与赋值变量与赋值2.3循环结构循环结构习题2—2 阅读材料阅读材料 美索不达米亚人的开方算法美索不达米亚人的开方算法 3.几种基本语句几种基本语句3.1条件语句条件语句3.2循环语句循环语句习题2—3 阅读材料阅读材料 算法的复杂性算法的复杂性 课题学习课题学习 确定线段n 等分点的算法等分点的算法 本章小结本章小结复习题二复习题二第三章 概率1.随机事件的概率随机事件的概率1.1频率与概率频率与概率1.2生活中的概率生活中的概率习题3—1 2.古典概型古典概型2.1古典概型的特征和概率计算公式古典概型的特征和概率计算公式2.2建立概率模型建立概率模型2.3互斥事件互斥事件 习题3—2 3.模拟方法——概率的应用概率的应用 习题3—3 本章小结本章小结复习题三复习题三探究活动探究活动 用模拟方法估计圆周率π的值的值 附录1 4000以下的素数表以下的素数表附录2上机实现参考程序上机实现参考程序附录3 部分数学专业词汇中英文对照表部分数学专业词汇中英文对照表 附录4 信息检索网址导引信息检索网址导引。
用样本估计总体5.1 & 5.2 估计总体的分布 估计总体的数字特征预习课本P32~39,思考并完成以下问题 (1)频率分布直方图纵轴的含义是什么?(2)频率分布直方图的制作步骤是什么?(3)如何画频率分布折线图?[新知初探]1.频率分布直方图在频率分布直方图中,每个小矩形的宽度为Δx i (分组的宽度),高为f iΔx i,小矩形的面积恰为相应的频率f i ,图中所有小矩形的面积之和等于1.2.作频率分布直方图的步骤(1)求极差.即一组数中最大值和最小值的差.(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.(3)将数据分组.(4)列频率分布表,各小组的频率=小组频数样本容量.(5)画频率分布直方图.[点睛] (1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组.(2)画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意.3.频率分布折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越接近于一条光滑曲线.[小试身手]1.判断正误.(正确的打“√”,错误的打“×”)(1)频率分布直方图中每个小矩形的面积等于相应组的频数.( ) (2)频率分布直方图的面积为样本的频数.( )(3)频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.( ) (4)从频率分布直方图中可以清楚地看出数据的内容.( ) 答案:(1)× (2)× (3)√ (4)×2.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成( ) A .10组 B .9组 C .8组D .7组解析:选B 组数=极差/组距,本题中的极差=140-51=89,所以组数为8.9≈9. 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |=( )A .hm B.m h C.h mD .h +m解析:选B 频率组距=h ,故|a -b |=组距=频率h =mh .4.一个容量为n 的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n =________.解析:由题意得50n =0.25,所以n =200.答案:200[典例] 得到如下数据(单位:cm):135 98 102 110 99 121 110 96 100 103 125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)列出频率分布表;(2)画出频率分布直方图及频率折线图;(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.[解](1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.频率分布表如下:(2)频率分布直方图和频率折线图如下图所示.(3)从频率分布表得,样本中底部周长小于100 cm 的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm 的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm 的树占21%,底部周长不小于120 cm 的树占19%.(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.(2)画频率分布直方图中小矩形的高的方法:①小矩形的高=频率组距;②假设频数为1的小矩形的高为h ,则频数为k 的小矩形的高为kh .[活学活用]为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:组别 频数 频率 145.5~149.5 1 0.02 149.5~153.5 4 0.08 153.5~157.5 20 0.40 157.5~161.5 15 0.30 161.5~165.5 8 0.16 165.5~169.5m n 合计MN(1)(2)画出频率分布直方图;(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm 以上的频率.解:(1)法一:N =1,n =1-(0.02+0.08+0.40+0.30+0.16)=0.04,8m =0.160.04,∴m =2,M =1+4+20+15+8+2=50.法二:M =10.02=50,m =50-(1+4+20+15+8)=2,N =1,n =m M =250=0.04.(2)作出直角坐标系,组距为4,纵轴表示f iΔx i,横轴表示身高,画出频率分布直方图如图所示.(3)由频率分布直方图可知:样本中在153.5~157.5范围内的人数最多,且身高在161.5 cm 以上的频率为0.16+0.04=0.2,由此可估计全体女生中身高在153.5~157.5范围内的人数最多,九年级学生中女生的身高在161.5 cm 以上的频率估计为0.2.[典例] 将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组频率=第二小组频数样本容量,所以样本容量=第二小组频数第二小组频率=120.08=150.(2)由图可估计该校高一学生的达标率约为 17+15+9+32+4+17+15+9+3×100%=88%.频率分布直方图中的性质(1)图中每个小矩形的面积表示相应各组的频率,即小矩形的面积=组距×频率组距=频率.(2)在频率分布直方图中,各小矩形的面积的总和等于1.(3)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数. (4)频率分布直方图中,各小矩形的面积之比等于频率之比,各小矩形的高度之比也等于频率之比.[活学活用]1.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图,估计样本数据落在区间[10,12)内的频数为( )A .18B .36C .54D .72解析:选B 样本数据落在区间[10,12)内的频率为1-(0.02×2+0.05×2+0.15×2+0.19×2)=0.18,所以样本数据落在区间[10,12)内的频数为0.18×200=36.2.为提高全省高中教师的新课程实施能力,全面推进素质教育,山东省对全省高中教师进行了全员网络远程培训.培训结束后,某市为了解参训教师的成绩情况,从本市参加培训的5 000名教师中随机抽取了100名,对他们的成绩(单位:分)进行统计分析,并画出了成绩的频率分布直方图如下.根据频率分布直方图,完成下面问题:(1)这100名教师培训成绩的中位数应在哪个小组?请说明理由;(2)如果成绩在300分以上(含300分)者为优秀学员,估计该市优秀学员的人数. 解:(1)100个数据的中位数是第50和第51两个数据的平均数,前两个小组的频率和为0.002×100×2=0.4,其频数为0.4×100=40<50,故中位数不在前两个小组;前三个小组的频率之和为(0.002+0.002+0.004)×100=0.8,频数之和为0.8×100=80>50,故中位数应在第三小组.(2)由频率分布直方图可知,优秀学员的频率为(0.001+0.001)×100=0.2,所以估计该市优秀学员的人数为5 000×0.2=1 000(人).[典例] 质量检验员从两台机床的产品中各抽出4件进行测量,结果如下:如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求?[解] (1)先计算平均直径: x 甲=14×(10+9.8+10+10.2)=10, x乙=14×(10.1+10+9.9+10)=10. 由于x 甲=x 乙,因此仅由平均直径不能反映两台机床生产的零件的质量优劣.(2)再计算方差:s 2甲=14×[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02, s 2乙=14×[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005.s2甲>s2乙,这说明乙机床生产出的零件直径波动小,因此从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求.样本的平均数和方差是两个重要的数字特征.在应用平均数和方差解决实际问题时,若平均数不同,则直接应用平均数比较优劣,若平均数相同,则要由方差研究其与平均数的偏离程度.[活学活用]为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换,已知某校使用的100支日光灯在必须换掉前的使用天数如下表:天数151~180 181~210211~240241~270271~300301~330331~360361~390日光灯数111182025167 2(2)若定期更换,可选择多长时间统一更换合适?解:(1)各组的平均值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此可估计这种日光灯的平均使用寿命为165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4(天).(2)s2=1100[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.59,故标准差s= 2 128.59≈46(天).由上可知这种日光灯的平均使用寿命为268.4天,标准差约为46天,故可在222天到314天内统一更换较合适.[层级一学业水平达标]1.从一堆苹果中任取10个,称得它们的质量如下(单位:克):12512012210513011411695120134则样本数据落在[114.5,124.5)内的频率为()A.0.2B.0.3C.0.4 D.0.5解析:选C依题意,样本数据落在[114.5,124.5)内的频数为4,故对应频率为4÷10=0.4.2.下列说法中错误的是()①用样本的频率分布估计总体频率分布时,样本容量越大,所分的组数越多,估计越精确;②一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n 的值为240;③频率分布直方图中,小矩形的高等于该组的频率;④将频率分布直方图中小矩形上面一边的一个端点顺次连接起来,就可以得到频率折线图.A.①③B.②③④C.②③④D.①②③④解析:选C大样本往往更接近于总体,所以①正确;②中n=40÷0.125=320;③中频率分布直方图中,小矩形的高等于该小组的频率/组距;④中应将频率分布直方图中各小矩形上端的中点顺次连接起来得到频率折线图.3.在样本频率分布直方图中,某个小矩形的面积是其他小矩形面积之和的14,已知样本容量是80,则该组的频数为()A.20 B.16C.30 D.35解析:选B设该组的频数为x,则其他组的频数之和为4x,由样本容量是80,得x +4x=80,解得x=16,即该组的频数为16.4.某校为了解高一学生寒假期间的阅读情况,抽查并统计了100名同学的某一周阅读时间,绘制了频率分布直方图(如图所示),那么这100名学生中阅读时间在[4,8)小时内的人数为________.解析:根据频率分布直方图,可得阅读时间在[4,8)小时内的频率为(0.12+0.15)×2=0.54,所以这100名学生中阅读时间在[4,8)小时内的人数为100×0.54=54.答案:54[层级二 应试能力达标]1.已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11,那么频率为0.4的范围是( )A .5.5~7.5B .7.5~9.5C .9.5~11.5D .11.5~13.5解析:选C 只要列出频率分布表,依次对照就可以找出答案.频率分布表如下:2.对某种电子元件使用寿命跟踪调查得如图所示的样本频率分布直方图,由图可知一批电子元件中寿命在100~300小时的电子元件的数量与寿命在300~600小时的电子元件的数量比是( )A.12B.13C.14D.16解析:选C 因为“频率之比=数量之比”,所以所求为⎝⎛⎭⎫12 000+32 000∶⎝⎛⎭⎫1400+1250+32 000=1∶4,故选C.3.样本容量为100的频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为a,样本数据落在[2,10)内的频率为b,则a,b分别是()A.32,0.4 B.8,0.1C.32,0.1 D.8,0.4解析:选A样本数据落在[6,10)内的频率为0.08×4=0.32,则a=100×0.32=32;由于样本数据落在[2,6)内的频率为0.02×4=0.08,则样本数据落在[2,10)内的频率b=0.08+0.32=0.4.4.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588 B.480C.450 D.120解析:选B成绩在[40,60)的频率p1=(0.005+0.015)×10=0.2,成绩不少于60分的频率p2=1-0.2=0.8,所以成绩不少于60分的学生人数约为600×0.8=480.5.《中华人民共和国道路交通安全法》规定;车辆驾驶员血液酒精浓度在20~80 mg/100 mL(不含80)之间,属于酒后驾车;血液酒精浓度在80 mg/100 mL(含80)以上时,属醉酒驾车.据《法制晚报》报道,某年2月15日至2月28日,全国查处酒后驾车和醉酒驾车共28 800人,如图是对这28 800人酒后驾车血液中酒精含量进行检测所得结果的频率分布直方图,则属于醉酒驾车的人数约为________.解析:(0.01×10+0.005×10)×28 800=4 320.答案:4 3206.下图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.解析:最左边两个小矩形的面积之和为0.10×1+0.12×1=0.22,城市总数为11÷0.22=50,最右边小矩形的面积为0.18×1=0.18,故样本中平均气温不低于25.5 ℃的城市个数为50×0.18=9.答案:97.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析:因为频率分布直方图中的各个小矩形的面积之和为1,所以有10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由频率分布直方图可知在[120,130),[130,140),[140,150]三组内的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为100×10×0.010=10,所以从身高在[140,150]内抽取的学生人数为1860×10=3.答案:38.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高? 解:(1)依题意知第三组的频率为 42+3+4+6+4+1=15.又∵第三组频数为12, ∴本次活动的参评作品数为1215=60件. (2)由频率分布直方图,可以看出第四组上交的作品数量最多,共有60×62+3+4+6+4+1=18件.(3)第四组获奖率是1018=59.第六组上交的作品数为60×12+3+4+6+4+1=3件.∴第六组的获奖率为23,显然第六组的获奖率较高.9.为增强市民节能环保意识,某市向全市征召义务宣传志愿者,现从符合条件的500名志愿者中随机抽取100名志愿者,他们的年龄情况如下表所示:(1)(2)补全频率分布直方图,再根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数.解:(1)设年龄在[25,30)内的频数为x ,年龄在[30,35)的频率为y , 法一:根据题意可得x 100=0.20,35100=y ,解得x =20,y =0.35.法二:由题意得5+x +35+30+10=100, 0.05+0.20+y +0.30+0.10=1, 得x =20,y =0.35.故①②位置应分别填20,0.35.(2)由频率分布表知年龄在[25,30)内的频率是0.20,组距是5,所以频率组距=0.205=0.04.补全频率分布直方图,如下图所示:根据频率分布直方图估计这500名志愿者中年龄在[30,35)的人数为500×0.35=175.。
高中数学第一章统计 1.5.1 估计总体的分布备课资料北师大版
必修3
下表是1 002名学生身高的频率分布表,根据数据画出:
(1)频率分布直方图;
解:(1)频率分布直方图
①根据频率分布表,作直角坐标系,以横轴表示身高,纵轴表示(如图9).
图9
②在横轴上标上表示的点.
③在上面各点中,分别以连接相邻两点的线段为底作矩形,高等于该组的.
一般地,作频率分布直方图的方法为:
把横轴分成若干段,每一段对应一个组的组距,以此线段为底作矩形,高等于该组的,
这样得到一系列矩形,每一个矩形的面积恰好是该组上的频率.这些矩形构成了频率分布直方图.
(2)频率分布折线图
在频率分布直方图中,取相邻矩形上底边的中点顺次连接起来,就得到频率分布折线图(简称
频率折线图)如图10:
图10。
用样本估计总体
5.1 & 5.2 估计总体的分布 估计总体的数字特征
预习课本P32~39,思考并完成以下问题 (1)频率分布直方图纵轴的含义是什么?
(2)频率分布直方图的制作步骤是什么?
(3)如何画频率分布折线图?
[新知初探]
1.频率分布直方图
在频率分布直方图中,每个小矩形的宽度为Δx i (分组的宽度),高为f i
Δx i
,小矩形的面积
恰为相应的频率f i ,图中所有小矩形的面积之和等于1.
2.作频率分布直方图的步骤
(1)求极差.即一组数中最大值和最小值的差.
(2)决定组距与组数.将数据分组时,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.
(3)将数据分组.
(4)列频率分布表,各小组的频率=小组频数
样本容量.
(5)画频率分布直方图.
[点睛] (1)一般地,样本容量越大,所分组数越多,为方便起见,组距的选择力求“取整”,当样本容量不超过120时,按照数据的多少,通常分成5~12组.
(2)画频率分布直方图时,同一组数据,分组时组距要相等,每个矩形的高与频率成正比,这点应特别注意.
3.频率分布折线图
在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越接近于一条光滑曲线.
[小试身手]
1.判断正误.(正确的打“√”,错误的打“×”)
(1)频率分布直方图中每个小矩形的面积等于相应组的频数.( ) (2)频率分布直方图的面积为样本的频数.( )
(3)频率分布直方图中各小矩形的高(平行于纵轴的边)表示频率与组距的比.( ) (4)从频率分布直方图中可以清楚地看出数据的内容.( ) 答案:(1)× (2)× (3)√ (4)×
2.一个容量为80的样本最大值是140,最小值是51,组距为10,则可以分成( ) A .10组 B .9组 C .8组
D .7组
解析:选B 组数=极差/组距,本题中的极差=140-51=89,所以组数为8.9≈9. 3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |=( )
A .hm B.m h C.h m D .h +m
解析:选B
频率组距
=h ,故|a -b |=组距=频率h =m
h . 4.一个容量为n 的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n =________.
解析:由题意得50
n =0.25,所以n =200.
答案:200
[典例] 得到如下数据(单位:cm):
135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 109 124 87 131 97 102 123 104 104 128 105 123 111 103 105 92 114 108 104 102 129
126
97
100
115
111
106
117
104
109
1118911012180120121104108118
12999909912112310711191100
991011169710210810195107101
1021081179911810611997126108
12311998121101113102103104108
(1)列出频率分布表;
(2)画出频率分布直方图及频率折线图;
(3)估计该片经济林中底部周长小于100 cm的树占多少,底部周长不小于120 cm的树占多少.
[解](1)这组数据的最大的数为135,最小的数为80,最大的数与最小的数的差为55,可将该组数据分为11组,组距为5.
频率分布表如下:
(2)频率分布直方图和频率折线图如下图所示.
(3)从频率分布表得,样本中底部周长小于100 cm的频率为0.01+0.02+0.04+0.14=0.21,样本中底部周长不小于120 cm的频率为0.11+0.06+0.02=0.19.所以估计该片经济林中底部周长小于100 cm的树占21%,底部周长不小于120 cm的树占19%.
(1)分点的决定方法:若数据为整数,则减去0.5作为分点数;若数据是小数点后一位的数,则减去0.05作为分点数;依次类推.
(2)画频率分布直方图中小矩形的高的方法:①小矩形的高=频率
组距;②假设频数为1的
小矩形的高为h ,则频数为k 的小矩形的高为kh .
[活学活用]
为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:
组别 频数 频率 145.5~149.5 1 0.02 149.5~153.5 4 0.08 153.5~157.5 20 0.40 157.5~161.5 15 0.30 161.5~165.5 8 0.16 165.5~169.5
m n 合计
M
N
(1)(2)画出频率分布直方图;
(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5 cm 以上的频率.
解:(1)法一:N =1,n =1-(0.02+0.08+0.40+0.30+0.16)=0.04,8m =0.16
0.04,∴m =2,
M =1+4+20+15+8+2=50.
法二:M =
1
0.02=50,m =50-(1+4+20+15+8)=2,N =1,n =m M =250
=0.04. (2)作出直角坐标系,组距为4,纵轴表示f i
Δx i
,横轴表示身高,画出频率分布直方图如图所示.
(3)由频率分布直方图可知:样本中在153.5~157.5范围内的人数最多,且身高在161.5 cm 以上的频率为0.16+0.04=0.2,由此可估计全体女生中身高在153.5~157.5范围内的人数最多,九年级学生中女生的身高在161.5 cm 以上的频率估计为0.2.
频率分布直方图的应用
[典例] 将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.
(1)第二小组的频率是多少?样本容量是多少?
(2)若次数在110以上(含110次)为达标,试估计该校全体高一学生的达标率是多少? [解] (1)由于频率分布直方图以面积的形式反映了数据落在各个小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3
=0.08.
又因为第二小组频率=第二小组频数
样本容量,
所以样本容量=第二小组频数第二小组频率=12
0.08=150.
(2)由图可估计该校高一学生的达标率约为 17+15+9+3
2+4+17+15+9+3
×100%=88%.
频率分布直方图中的性质。