高考数学一轮复习 第十章 统计 10.2 用样本估计总体
- 格式:doc
- 大小:782.51 KB
- 文档页数:25
【步步高】(江苏专用)2017版高考数学一轮复习第十章统计 10.2
用样本估计总体文
1.作频率分布直方图的步骤
(1)求极差(即一组数据中最大值与最小值的差).
(2)决定组距与组数.
(3)将数据分组.
(4)列频率分布表.
(5)画频率分布直方图.
2.频率分布折线图和总体分布的密度曲线
(1)频率分布折线图:将频率分布直方图中各个相邻的矩形的上底边的中点顺次连结起来,就得到频率分布折线图.
(2)总体分布的密度曲线:将样本容量取得足够大,分组的组距取得足够小,那么相应的频率折线图趋于一条光滑曲线,称这条光滑曲线为总体分布的密度曲线. 3.茎叶图
统计中还有一种被用来表示数据的图叫做茎叶图,茎是指中间的一列数,叶是从茎的旁边生长出来的数. 4.标准差和方差
(1)标准差是样本数据到平均数的一种平均距离. (2)标准差:
s =
1n
[
x 1-x
2
+x 2-x
2
+…+x n -x
2
].
(3)方差:s 2=1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2
](x n 是样本数据,n 是样本容量,x
是样本平均数). 【知识拓展】
1.频率分布直方图的特点
(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示频率组距,频率=组距×频率
组距.
(2)频率分布直方图中各小长方形的面积之和为1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.
(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观. 2.平均数、方差的公式推广
(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .
(2)数据x 1,x 2,…,x n 的方差为s 2
.
①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2
; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2
. 【思考辨析】
判断下面结论是否正确(请在括号中打“√”或“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × ) (3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )
(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √)
(6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( ×)
1.(2015·陕西改编)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为________.
答案137
解析由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137.
2.若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据
的中位数和平均数分别是__________.
答案91.5和91.5
解析∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数为1
2
×(91+92)=
91.5.
平均数为1
8
×(87+89+90+91+92+93+94+96)=91.5.
3.在“世界读书日”前夕,为了了解某地 5 000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是________. 答案 总体
解析 调查的目的是“了解某地5 000名居民某天的阅读时间”,所以“5 000名居民的阅读时间的全体”是调查的总体.
4.(教材改编)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为________.
答案 19,13
5.(教材改编)甲、乙两人在相同条件下各射靶10次,每次命中环数如下: 甲 4 7 10 9 5 6 8 6 8 8 乙 7 8 6 8 6 7 8 7 5 9 试问10次射靶的情况较稳定的是________. 答案 乙
解析 x 甲=4+7+10+9+5+6+8+6+8+810
=7.1,
x 乙=
7+8+6+8+6+7+8+7+5+9
10
=7.1.
s 2甲=
1
10[(4-7.1)2+(7-7.1)2+…+(8-7.1)2
]=3.09, s 2乙=
110
[(7-7.1)2+(8-7.1)2+…+(9-7.1)2
]=1.29. s 2甲>s 2乙,
∴乙较稳定.
题型一频率分布直方图的绘制与应用
例1 (2015·课标全国Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表.
A地区用户满意度评分的频率分布直方图
图①
B地区用户满意度评分的频数分布表
(1)
评分的平均值及分散程度(不要求计算出具体值,给出结论即可).
B地区用户满意度评分的频率分布直方图
图②
(2)根据用户满意度评分,将用户的满意度分为三个等级:
解(1)如图所示.
通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.
(2)A地区用户的满意度等级为不满意的概率大.
记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意
度等级为不满意”.
由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,P(C B)的估计值为(0.005+0.02)×10=0.25.
所以A地区用户的满意度等级为不满意的概率大.
思维升华(1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的面积和为1.
(2)对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据.
(1)(2014·山东改编)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.
答案12
解析志愿者的总人数为
20
0.16+0.24×1
=50,
所以第三组人数为50×0.36=18,
有疗效的人数为18-6=12.
(2)某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:
①求分数在[70,80)内的频率,并补全这个频率分布直方图;
②统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.解①设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.
②平均分:45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).
题型二 茎叶图的应用
例2 (1)(2015·山东)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:
①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差; ④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为________.
(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).
已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为__________. 答案 (1)①④ (2)5,8
解析 (1)甲地5天的气温为:26,28,29,31,31, 其平均数为x 甲=26+28+29+31+31
5
=29;
方差为s 2甲=15[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2
]=3.6;
标准差为s 甲= 3.6.
乙地5天的气温为:28,29,30,31,32, 其平均数为x 乙=28+29+30+31+32
5
=30;
方差为s 2乙=15[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2
]=2;
标准差为s 乙= 2. ∴x 甲<x 乙,s 甲>s 乙.
(2)由茎叶图及已知得x =5,又乙组数据的平均数为16.8,即9+15+10+y +18+24
5=16.8,
解得y =8. 引申探究
1.本例(2)中条件不变,试比较甲、乙两组哪组成绩较好. 解 由原题可知x =5,
则甲组平均分为9+12+15+24+27
5=17.4.
而乙组平均分为16.8,所以甲组成绩较好.
2.在本例(2)条件下:①求乙组数据的中位数、众数;②求乙组数据的方差. 解 ①由茎叶图知,乙组中五名学生的成绩为9,15,18,18,24. 故中位数为18,众数为18.
②s 2=15[(9-16.8)2+(15-16.8)2+(18-16.8)2×2+(24-16.8)2
]=23.76.
思维升华 茎叶图的优缺点
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较烦琐.
(2014·课标全国Ⅱ)某市为了考核甲,乙
两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:
(1)分别估计该市的市民对甲,乙两部门评分的中位数; (2)分别估计该市的市民对甲,乙两部门的评分高于90的概率; (3)根据茎叶图分析该市的市民对甲,乙两部门的评价.
解 (1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75. 50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为
66+68
2=67,所以该市的市民对乙部门评分的中位数的估计值是67.
(2)由所给茎叶图知,50位市民对甲,乙部门的评分高于90的比率分别为550=0.1,8
50=0.16,
故该市的市民对甲,乙部门的评分高于90的概率的估计值分别为0.1,0.16.
(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分.) 题型三 用样本的数字特征估计总体的数字特征
例3 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.
(1)分别求出两人得分的平均数与方差;
(2)根据图和上面算得的结果,对两人的训练成绩作出评价. 解 (1)由题图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.
x 甲=10+13+12+14+16
5=13;
x 乙=
13+14+12+12+14
5
=13,
s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2
]=4;
s 2乙=15
[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.
(2)由s 2甲>s 2
乙可知乙的成绩较稳定.
从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.
思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.
(2015·广东)某工厂36名工人的年龄数据
如下表.
(1)年龄数据为44,列出样本的年龄数据; (2)计算(1)中样本的均值x 和方差s 2
;
(3)36名工人中年龄在x -s 与x +s 之间的有多少人?所占的百分比是多少(精确到0.01%)?
解 (1)44,40,36,43,36,37,44,43,37.
(2)x =44+40+36+43+36+37+44+43+37
9
=40.
s 2=19
[(44-40)2+(40-40)2+(36-40)2+(43-40)2+(36-40)2+(37-40)2+(44-40)2+
(43-40)2+(37-40)2
]=1009
.
(3)40-103=1103,40+103=1303在⎝ ⎛⎭⎪⎫
1103,1303的有23个,占63.89%.
9.高考中频率分布直方图的应用
典例 (14分)(2015·广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.
(1)求直方图中x 的值;
(2)求月平均用电量的众数和中位数;
(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户? 规范解答
解 (1)由(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)×20=1得:x =0.007 5, 所以直方图中x 的值是0.007 5.[3分]
(2)月平均用电量的众数是220+240
2
=230.[4分]
因为(0.002+0.009 5+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a ,由(0.002+0.009 5+0.011)×20+0.012 5×(a -220)=0.5得:a =224,所以月平均用电量的中位数是224.[8分]
(3)月平均用电量为[220,240)的用户有0.012 5×20×100=25(户),月平均用电量为[240,260)的用户有0.007 5×20×100=15(户),月平均用电量为[260,280)的用户有0.005×20×100=10(户),月平均用电量为[280,300]的用户有0.002 5×20×100=5(户),
抽取比例=
11
25+15+10+5
=
1
5
,所以月平均用电量在[220,240)的用户中应抽取25×
1
5
=
5(户).[14分]
温馨提醒本题的难点是对频率分布直方图意义的理解以及利用这个图提供的数据对所提问题的计算,频率分布直方图中纵轴上的数据是频率除以组距,组距越大该数据越小,在解答这类问题时要特别注意.
[方法与技巧]
1.用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布;难点是频率分布表和频率分布直方图的理解及应用.在计数和计算时一定要准确,在绘制小矩形时,宽窄要一致.通过频率分布表和频率分布直方图可以对总体作出估计.
2.茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.
3.若取值x1,x2,…,x n的频率分别为p1,p2,…,p n,则其平均值为x1p1+x2p2+…+x n p n;若x1,x2,…,x n的平均数为x,方差为s2,则ax1+b,ax2+b,…,ax n+b的平均数为a x +b,方差为a2s2.
[失误与防范]
频率分布直方图的纵坐标为频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把直方图视为条形图是常见的错误.
A组专项基础训练
(时间:40分钟)
1.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为____________.
答案0.4
解析10个数据落在区间[22,30)内的数据有22,22,27,29,共4个,因此,所求的频率为4
10=0.4.
2.(2014·陕西改编)某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其均值和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为____________.
答案x+100,s2
解析x1+x2+…+x10
10
=x,y i=x i+100,所以y1,y2,…,y10的均值为x+100,方差不
变.
3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是________.
答案50
解析由频率分布直方图,知低于60分的频率为(0.01+0.005)×20=0.3.
∴该班学生人数n=15
0.3
=50.
4.在某次测量中得到的A样本数据如下:42,43,46,52,42,50,若B样本数据恰好是A样本数据每个都减5后所得数据,则A,B两样本的数字特征对应相同的是__________.
答案标准差
解析利用平均数、标准差、众数、中位数等统计特征数的概念求解.由B样本数据恰好是A样本数据每个都减5后所得数据,可得平均数、众数、中位数分别是原来结果减去5,即与A样本不相同,标准差不变.
5.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有________.
①a 1>a 2 ②a 2>a 1 ③a 1=a 2
④a 1,a 2的大小与m 的值有关 答案 ②
解析 去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a 2>a 1.
6.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为________________. 答案 2
解析 由题意可知样本的平均值为1,所以
a +0+1+2+3
5
=1,解得a =-1,所以样本的方
差为15
[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2
]=2.
7.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:
则7个剩余分数的方差为________. 答案
367
解析 由题意知87+94+90+91+90+90+x +917=91,解得x =4.所以s 2=17
[(87-91)2
+
(94-91)2+(90-91)2+(91-91)2+(90-91)2+(94-91)2+(91-91)2
] =17(16+9+1+0+1+9+0)=367
. 8.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =____________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.
答案 0.030 3
解析 ∵小矩形的面积等于频率,∴除[120,130)外的频率和为0.700,∴a =
1-0.700
10
=0.030.由题意知,身高在[120,130),[130,140),[140,150]内的学生分别为30人,20人,10人,∴由分层抽样可知抽样比为1860=3
10,
∴在[140,150]中选取的学生应为3人.
9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高.解(1)分数在[50,60]的频率为0.008×10=0.08.
由茎叶图知,分数在[50,60]之间的频数为2,
所以全班人数为2
0.08
=25.
(2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩形
的高为4
25
÷10=0.016.
10.某工厂对一批产品进行了抽样检测.如图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36.
(1)求样本容量及样本中净重大于或等于98克并且小于104克的产品的个数;
(2)已知这批产品中每个产品的利润y (单位:元)与产品净重x (单位:克)的关系式为y =⎩⎪⎨⎪
⎧
3,96≤x <98,5,98≤x <104,4,104≤x ≤106,
求这批产品平均每个的利润.
解 (1)产品净重小于100克的频率为(0.050+0.100)×2=0.300.设样本容量为n . ∵样本中产品净重小于100克的个数是36, ∴36
n
=0.300,∴n =120.∵样本中净重大于或等于98克并且小于104克的产品的频率为
(0.100+0.150+0.125)×2=0.750,
∴样本中净重大于或等于98克并且小于104克的产品的个数是120×0.750=90.
(2)产品净重在[96,98),[98,104),[104,106]内的频率分别为0.050×2=0.100,(0.100+0.150+0.125)×2=0.750,0.075×2=0.150,∴其相应的频数分别为120×0.100=12,120×0.750=90,120×0.150=18, ∴这批产品平均每个的利润为
1
120
×(3×12+5×90+4×18)=4.65(元). B 组 专项能力提升 (时间:30分钟)
11.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是________.
答案①
解析由于频率分布直方图的组距为5,排除③、④,又[0,5),[5,10)两组各一人,排除②,①符合条件,故①正确.
12.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.
答案24
解析底部周长在[80,90)的频率为0.015×10=0.15,
底部周长在[90,100)的频率为0.025×10=0.25,
样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 13.(2015·湖北)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=________;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.
答案(1)3 (2)6 000
解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2×0.1+2.5×0.1+a×0.1=1,解得a=3.于是消费金额在区间[0.5,0.9]内频率为0.2×0.1+0.8×0.1+2×0.1+3×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为:
0.6×10 000=6 000,故应填3,6 000.
14.若某产品的直径长与标准值的差的绝对值不超过1 mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5 000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm),将所得数据分组,得到如下频率分布表:
(1)(2)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率; (3)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数.
解 (1)如下表所示频率分布表.
(2)由频率分布表知,(1,3]内的概率约为 0.50+0.20=0.70.
(3)设这批产品中的合格品数为x 件, 依题意505 000=20x +20
,
解得x =5 000×20
50-20=1 980.
所以该批产品的合格品件数是1 980.
15.(2014·广东)某车间20名工人年龄数据如下表:
年龄(岁)19282930313240
工人数(人)133543 1
(1)求这20
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;
(3)求这20名工人年龄的方差.
解(1)这20名工人年龄的众数为:30;这20名工人年龄的极差为:40-19=21.
(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图如下:
(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;
所以这20名工人年龄的方差为:
1 20(30-19)2+
3
20
(30-28)2+
3
20
(30-29)2+
5
20
(30-30)2+
4
20
(30-31)2+
3
20
(30-32)2+
1
20
(30-40)2=12.6.。