2016年高中数学 第二章 统计 章末综合检测学案 新人教A版必修3
- 格式:doc
- 大小:455.50 KB
- 文档页数:8
第二章统计§2.1随机抽样§2.1.1简单随机抽样【学习目标】1.理解简单随机抽样的概念.2.掌握常见的两种简单随机抽样的方法.3.能合理地从实际问题的个体中抽取样本.【学习重点】真确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤【学习难点】能灵活应用相关知识从总体中抽取样本.【学习过程】一、自主学习(阅读课本第54—58页,完成下列问题)1.阅读课本第55页《一个著名的案例》,你认为预测结果出错的原因是什么?由此可以总结出什么教训?2.假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢?3.一般地,我们把所考察的对象的全体叫___________,组成总体的每一个研究对象叫________,从总体中抽取的一部分个体叫________,样本中个体的数目叫__________.3.简单随机抽样的定义:设一个总体含有N个个体,从中______________地抽取n个个体作为样本(__________),如果每次抽取时总体内的______________________________,这种抽样方法叫简单随机抽样.说明:简单随机抽样的特点:(1)被抽取样本的总体中的个体数N是______的;(“有限”或“无限”)(2)抽取的样本个体数n______________总体的个体数N;(3)抽取的样本是从总体中逐个抽取的;(4)简单随机抽样是一种________抽样;(“放回”或“不放回”)(5) 总体中每个个体被抽到的可能性_______;(6)每个个体被抽到的可能性均为nN.4.最常用的简单随机抽样的方法有___________法、____________法.二、合作探究例1:某车间工人加工一种零件共100件,为了了解这种零件的质量,要从中抽取10件零件在同一条件下测量,如何采用抽签法获取样本?例2:我们要考察某公司生产的一批牛奶的质量是否达标,现从1000袋牛奶中抽取100袋进行检验,如何利用随机数表法获取样本?例3:下列抽样的方式属于简单随机抽样的有____________(填写序号).(1)从无限多个个体中抽取50个个体作为样本.(2)从1000个个体中一次性抽取50个个体作为样本.(3)将1000个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取50个个体作为样本.(4)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.(5)福利彩票用摇奖机摇奖.三、达标检测1.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量2.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为﹙﹚A.150 B.200 C.100 D.1203.对于简单随机抽样,有以下几种说法,其中不正确的是()A.要求总体的个数有限B.从总体中逐个抽取C.这是一种不放回抽样D.每个个体被抽到的机会不一样,与抽取先后有关4.用随机数表法进行抽样有以下几个步骤:①将总体中的个体编号②获取样本号码③选定开始的数字,这些步骤的先后顺序应为( )A.①②③B.①③②C.③②①D.③①②5.关于简单随机抽样,下列说法不正确的是( )A.当总体中个体数不多时,可以采用简单随机抽样B.采用简单随机抽样不会产生任何代表性差的样本C.用随机数表法抽取样本时,读数的方向可以向右,也可以向左、向下、向上等等D.抽鉴法抽取样本对每个个体说都是公平的6.一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是____________.四、学习小结1.简单随机抽样的定义.2.简单随机抽样的特点.3.最常用的两种简单随机抽样的方法步骤及各自的优点和缺点.§2.1.2系统抽样【学习目标】1.理解和掌握系统抽样.2.会用系统抽样从总体中抽取样本.3.正确理解系统抽样与简单随机抽样的区别及使用范围.【学习重点】实施系统抽样的步骤.【学习难点】当Nn不是整数,如何实施系统抽样.【学习过程】一、自主学习(阅读课本第58页,回答下列问题)1.结合课本58页的探究归纳系统抽样的步骤:(1)__________________________________________________________________;(2)__________________________________________________________________;(3)__________________________________________________________________;(4)__________________________________________________________________.2.系统抽样的定义:在抽样中,当总体中个体数目________时,可将总体分成均衡的几个部分,然后按照预先制订的规则,从每一个部分中抽取____个个体,得到所需要的样本,这样的抽样方法叫系统抽样.说明:系统抽样的特点:(1)当总体总量________时,常采用系统抽样;(2)将总体分成的各个部分必须是_______的,间隔是______的;(3)规则是________制订的;(4)第一部分的抽样采用__________抽样;(5)总体中每个个体被抽到的可能性_______.二、合作探究例1:从已编号为1—50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是()A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32例2:为了了解参加某种知识竞赛的1003名学生的成绩,请用系统抽样抽取一个容量为50的样本.三、达标检测1.从学号为0—50的高一某班50名学生中随机选取5名同学参加数学竞赛,采用系统抽样的方法,则所选5名学生的学号不可能是()A.1,2,3,4,5 B.5,15,25,35,45C.2, 12, 22, 32, 42 D.9,19,29,39,492.采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体入样的可能性为()A.1083B.18C.183D.不相等3.一个年级有12个班,每个班有50名学生,随机编号为1~50,为了了解他们在课外的兴趣,要求每班第40号同学留下来进行问卷调查,这里运用的抽样方法是( ).A.分层抽样B.抽签法C.随机数表法D.系统抽样法4.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( )A.简单随机抽样法B.系统抽样法C.分层抽样法D.抽签法5.为了解1200名学生对学校教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为( )A.40 B.30 C.20 D.126.某工厂生产的产品用传送带将其送入包装车间之前,质检员每隔5分钟从传送带某一位置取一件产品检测,则这种抽样方法是_____________.7.若总体中含有1650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除__________个个体,编号后应均分为________段,每段有________个个体.8.某单位的在岗工人为624人,为了调查工作上班时从家到单位的路上平均所用的时间,决定抽取10%的工人调查这一情况,如何采用系统抽样的方法完成这一抽样?四、学习小结1.系统抽样的定义.2.系统抽样的特点.3.简单随机抽样与系统抽样的区别与联系.§2.1.3分层抽样【学习目标】1.正确理解分层抽样的概念.2.会用分层抽样法从总体中抽取样本.3.理解分层抽样与简单随机抽样和系统抽样的区别与联系.【学习重点】分层抽样的概念及其步骤.【学习难点】确定各层的入样个体数目,以及根据实际情况选择正确的抽样方法.【学习过程】一、自主学习(阅读课本第60—61页,完成下列问题)1.假设某地区有高中生2400人,初中生10900人,小学生11000人,此地教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的中小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本,能使样本更具有代表性?2.分层抽样的定义:在抽样时,若总体由存在________的几部分组成,则按这种差异将总体分成互不交叉的_____,然后按照_______________,从各层中______地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样.说明:分层抽样的特点:(1)适用于有____________的总体;(2)在各层中____________抽样;(3)各层中抽样采用_______________法或______________法;(4)是等可能抽样,每个个体被抽到的可能性都是________.二、合作探究例1:某商场有四类食品,其中粮食类、植物油类、动物性食品类及果蔬类分别有40种、10种、30种、20种,现从中抽取一个容量为20的样本进行食品安全检测.若采用分层抽样的方法抽取样本,则抽取的植物油类与果蔬类食品种数之和是()A.4 B.5 C.6 D.7例2:一个单位有职工500人,其中不到35岁的有125人,35岁至49岁的有280人,50岁以上的有95人,为了了解这个单位职工与身体状况有关的某项指标,要从中抽取100名职工作为样本,职工年龄与这项指标有关,应该怎样抽取?三、达标检测1.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法()①简单随机抽样②系统抽样③分层抽样A.②③B.①③C.③D.①②③2.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为( ) A.45,75,15 B.45,45,45 C.30,90,15 D.45,60,303.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别各抽取的人数是( )A.6,12,18 B.7,11,19 C.6,13,17 D.7,12,174.一单位有职工80人,其中业务人员56人,管理人员8人,服务人员16人,为了解职工的某种情况,决定采用分层抽样的方法抽取一个容量为10的样本,每个管理人员被抽到的频率为( )A.180B.124C.110D.185.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家.为了掌握各商店的营业情况,要从中抽取一个容量为20的样本.若采用分层抽样的方法,抽取的中型商店数是______________.6.某校高一、高二、高三,三个年级的学生人数分别为1500人,1200人和1000人,现采用按年级分层抽样法了解学生的视力状况,已知在高一年级抽查了75人,则这次调查高三年级共抽查了__________人.7.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2 :3 :5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量n________.8.某公司生产三种型号的轿车,产量分别是1200辆、6000辆和2000辆,为检验公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取_______、__________、__________.9.某高级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2, (270)使用系统抽样时,将学生统一随机编号1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270.关于上述样本的下列结论中,正确的是()A.②③都不能为系统抽样B.②④都不能为分层抽样C.①④都可能为系统抽样D.①③都可能为分层抽样四、学习小结三种抽样方法的区别与联系§2.2用样本估计总体§2.2.1用样本的频率分布估计总体分布【学习目标】1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表、画频率分布直方图、频率分布折线图、茎叶图.3.能利用图形解决实际问题.【学习重点】会列频率分布表,画频率分布直方图、频率折线图和茎叶图.【学习难点】对总体分布概念的理解,能通过样本的频率分布估计总体的分布.【学习过程】一、自主学习(阅读课本第65—70页,完成下列问题)1.通常我们对总体作出估计分成两种,一种是_____________,另一种是____________.2.频率分布:指一个样本数据在各个小范围内所占比例的____.一般用_________反映样本的频率分布.3.画频率分布直方图步骤:(1)_____________________(2)_____________________(3)_____________________(4)_____________________(5)_____________________4.频率分布直方图的特征:(1) 在频率分布直方图中纵轴表示________,每个小长方形面积=______________,各个小长方形面积之和=_________.(2)原始数据_______在频率分布直方图中表示出来.(“能”或“不能”)(3) 从频率分布直方图可清楚地看出数据分布的________.(4)频率分布直方图有“好”与“坏”之分5.频率分布折线图:连接频率分布直方图中各个小长方形上端的______,就得到频率分布折线图.6.总体密度曲线:在样本频率分布直方图中,当样本容量逐渐增加,相应的_________会越来越接近一条光滑曲线,统计中称这条光滑曲线为总体密度曲线,它能够更加精细地反映出总体在各个范围内取值的_________.用样本的频率分布折线图_____(“能”或“不能”) 得到准确的总体密度曲线.7.茎叶图:茎叶图也是用来表示数据的一种图,茎是指_______的一列数,叶是从茎的旁边生长出来的数.二、合作探究例1:为了了解某中学300名17岁女生的身体发育情况,从中随机抽取了30名女生,对其身高进行了测量,结果如下:(单位:cm)154 159 166 169 159 156 166 162 158 156 157 151 157 161 163 158 153 158 164 158 162 159 154 165 166 157 151 146 151 158(1)列出样本的频率分布表;绘出频率分布直方图.(2)估计该校17岁女生身高在160cm(包括160cm)以上的约有多少人?甲 乙1 29 4 48 7 5 4 2 1 3 93 2 1 9 95 0 2 4 7012345例2:下面一组数据是某工厂甲乙两车间各15名工人某日加工零件的个数,设计茎叶图表示这组数据,并由图说明两个车间此日生产情况.甲:134 112 117 126 128 124 122 116 113 107 116 132 127 128 126乙:121 120 118 108 110 133 130 124 116 117 123 122 120 112 112三、达标检测1.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据下图可知( )A .甲运动员的成绩好于乙运动员B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分2.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5], 8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的( )A .91%B .92%C .95%D .30%3.一个容量为20的样本数据,数据的分组及各组的频数如下:(10,20),2;(20,30),3;(30,40),4;(40,50),5;(50,60),4;(60,70),2.则样本在区间(10,50)上的频率为( )A .0.5B .0.7C .0.25D .0.054.一个高中研究性学习小组对本地区2000年至2002年快餐公司发展情况进行了调查,制成了该地区快餐公司个数情况的条形图和快餐公司盒饭年销售量的平均数情况条形图(如下图),根据图中提供的信息可以得出这三年中该地区每年平均销售盒饭____________万盒.快餐公司个数情况图 快餐公司盒饭年销售量的平均数情况图四、学习小结1.频率分布直方图步骤.2.茎叶图画法.3.用样本估计总体.§2.2.2用样本的数字特征估计总体的数字特征【学习目标】1.会求样本众数、中位数、平均数、标准差、方差.2.理解用样本的样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.【学习重点】众数、中位数、平均数、标准差、方差的意义及计算方法.【学习难点】能应用相关知识解决简单的实际问题.【学习过程】一、自主学习(阅读课本第71—78页,完成下列问题)1.众数:一组数据中出现________最多的数称为这组数据的众数,一组数据中的众数可能不止______个,也可能没有.众数反映了该组数据的________趋势.在频率分布直方图中,最高矩形的_______就是数据的众数.2.中位数:一组数据按由小到大(或由大到小)的顺序排成一列,处于_______位置的数,称为这组数据的中位数.一组数据中的中位数是唯一的,反映了该组数据的_________趋势.在频率分布直方图中,中位数左边和右边的直方图面积_________.说明:按顺序排列后,若样本容量为奇数,则中位数为最中间的______数;若样本容量为偶数,则中位数为最中间两个数的__________.3.平均数:12= n x x x x 数据,,, 的平均数_________________________,平均数代表该组数据的____________.4.标准差:12n x x x s =数据,,, 的标准差_____________________________,标准差反映了该组数据的____________,标准差越大,数据的离散程度______,标准差越小,数据的离散程度__________.5.方差:212n x x x s =数据,,, 的方差_______________________________.同标准差一样,方差也是用来测量一组数据的___________的特征数.二、合作探究例1:某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.甲班:112,86,106,84,100,105,98,102,94,107,87,112,94,94,99,90,120,98,95,119,108,100,96,115,111,104,95,108,111,105,104,107,119,107,93,102,98,112,112,99,92,102,93,84,94,94,100,90,84,114乙班:116,95,109,96,106,98,108,99,110,103,94,98,105,101,115,104,112,101,113,96,108,100,110,98,107,87,108,106,103,97,107,106,111,121,97,107,114,122,101,107107,111,114,106,104,104,95,111,111,110例2:下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均例3:在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员:7,8,7,9,5,4,9,10,7,4;乙运动员:9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?三、达标检测1.若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是___________;2.如果两组数x1,x2,…,x n和y1,y2,…,y n的样本平均数分别是x和y,那么一组数x1+y1,x2+y2,…,x n+y n的平均数是___________.3.在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为____________.4.在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:试判断选谁参加某项重大比赛更合适?四、学习小结众数、中位数、平均数、标准差、方差的意义.§2.3变量间的相关关系§2.3.1变量之间的相关关系 §2.3.2两个变量的线性相关【学习目标】1.理解两个变量间的相关关系的概念..2.会作散点图,并利用散点图判断两个变量之间是否具有相关关系. 3.会求回归直线方程.【学习重点】直观认识两个变量之间的相关关系,求回归直线方程. 【学习难点】两个变量之间的相关关系的认识,对线性回归的认识. 【学习过程】一、自主学习(阅读课本第84—91页,完成下列问题)1. 相关关系的概念:两个变量之间的关系分两类:①确定性的函数关系,例如如匀速直线运动中时间与路程之间的关系. ②带有不确定性的变量间的相关关系,例如课本第84页问题1、2、3.(自变量取值一定时,因变量的取值带有一定的_________的两个变量之间的关系)2.散点图:将样本中n 个数据点1,2,,i i x y i n =(,) ()描在平面直角坐标系中得到的图形叫做散点图.3.正相关与负相关:散点图中的点散布在从________到__________的区域,对于这种相关关系叫做正相关;散点图中的点散布在从________到__________的区域,对于这种相关关系叫做负相关.4.回归直线:如果散点图中点的分布从整体上看大致在_________附近,我们就称这两个变量之间具有____________关系,这条直线叫做回归直线.5.回归方程:ˆˆˆy bx a =+,其中ˆ___________________ˆ___________________b a ⎧=⎪⎨⎪=⎩11,11n ni i i i x x y y n n ====∑∑.二、合作探究例1:下列关系中,带有随机性相关关系的是_____________. ①正方形的边长与面积之间的关系 ②水稻产量与施肥量之间的关系 ③人的身高与年龄之间的关系④降雪量与交通事故的发生率之间的关系例2:有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,(1)画出散点图;(2)从散点图中发现气温与热饮销售杯数之间关系的一般规律; (3)求回归方程;(4)如果某天的气温是2 ℃,预测这天卖出的热饮杯数.三、达标检测1.三点(3,10),(7,20),(11,24)的线性回归方程是()A.^y=5.75-1.75x B.^y=1.75+5.75xC.^y=1.75-5.75x D.^y=5.75+1.75x2.车间为了规定工时定额,需要确定加工零件所花费的时间,进行了10次试验,收集数据3(1)系,说明理由;(2)如果具有线性相关关系,求出线性回归方程.四、学习小结1.散点图的画法.2.如何判断两个变量是否线性相关?3.回归直线方程及作用.第二章统计测试题一、选择题(每小题4分,共48分)1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法正确的是﹙﹚A.1000名学生是总体B.每个学生是个体C.100名学生的成绩是一个个体D.样本的容量是1002.对总数为N的一批零件抽取一个容量为30的样本,若每个零件被抽取的可能性为25%,则N为﹙﹚A.150 B.200 C.100 D.1203.某工厂生产的产品,用速度恒定的传送带将产品送入包装车间之前,质检员每隔3分钟从传送带上是特定位置取一件产品进行检测,这种抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.其它抽样方法4.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点.公司为了调查产品销售情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为①;在丙地区有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务等情况,记这项调查为②,则完成①、②这两项调查宜采用的抽样方法依次是( )A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法5.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为A.45,75,15 B.45,45,45 C.30,90,15 D.45,60,30 ( ) 6.频率分布直方图中,小长方形的面积等于( ) A.相应各组的频数B.相应各组的频率C.组数D.组距7.从一群学生中抽取一个一定容量的样本对他们的学习成绩进行分析,已知不超过70分的人数为8人,其累计频率为0.4,则这样的样本容量是( ) A.20人B.40人C.70人D.80人8.某农科所种植的甲、乙两种水稻,连续六年在面积相等的两块稻田中作对比试验,试验得出=x乙=415㎏,方差是2s甲=794,2s乙=958,那么这两个水稻品种中产量比较稳定的平均产量是x甲是( )A .甲B .乙C .甲、乙一样稳定D .无法确定9.一个容量为35的样本数据,分组后,组距与频数如下[)5,10:5个;[)10,15:12个;[)15,20:7个;[)20,25:5个;[)25,30:4个;[)30,35:2个.则样本在[)20,+∞区间上的频率为 ( ) A .20% B .69% C .31% D .27%10.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在[)2700,3000的频率为 ( ) A . 0.001 B . 0.1 C . 0.2 D . 0.311.下列说法中,正确的是( ) A .数据5,4,4,3,5,2的众数是4B .一组数据的标准差是这组数据的方差的平方C .数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D .频率分布直方图中各小长方形的面积等于相应各组的频数 12.对于给定的两个变量的统计数据,下列说法正确的是( )A .都可以分析出两个变量的关系B .都可以用一条直线近似地表示两者的关系C .都可以作出散点图D .都可以用确定的表达式表示两者的关系二、填空题 (每小题5分,共30分)11.从含有500个个体的总体中一次性地抽取25个个体,假定其中每个个体被抽到的概率相等,那么总体中的每个个体被抽取的概率等于_________.12. 某工厂生产A 、B 、C 三种不同型号的产品,产品数量这比依次为1600,1600,4800.现用分层抽样的方法抽出一个容量为N 的样本,样本中A 种型号的产品共有16件,那么此样本的容量N=__________件.13. 若总体中含有1650个个体,现在要采用系统抽样,从中抽取一个容量为35的样本,分段时应从总体中随机剔除__________个个体,编号后应均分为________段,每段有________个个体.14.某工厂生产的产品用传送带将其送入包装车间之前,质检员每隔5分钟从传送带某一位置取一件产品检测,则这种抽样方法是_____________.15.管理人员从一池塘内捞出30条鱼,做上标记后放回池塘.10天后,又从池塘内捞出50条鱼,其中有标记的有2条.根据以上数据可以估计该池塘内共有______________条鱼. 16.200辆汽车通过某一段公路时的时速频率分布直方图如图所示,则时速在[)50,60的汽车大约有_______辆.三、解答题 (每小题10分,共42分)17.(10分)一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人.为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?18.(10分)若1x ,2x ,…n x ,和1y ,2y ,…n y 的平均数分别是x 和y ,那么下各组的平均数各为多少。
章末复习检测卷(二) 统计(本栏目内容,在学生用书中以独立形式分册装订)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.从某年级500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是() A.500名学生是总体B.每个被抽查的学生是样本C.抽取的60名学生的体重是一个样本D.抽取的60名学生是样本容量解析:答案:2.某考察团对全国10大城市进行职工人均工资水平x(元)与居民人均消费水平y(元)统计调查,y与x具有相关关系,线性回来方程为y=0.66x+1562,若某城市居民人均消费水平为7675元,估计该城市人均消费额占人均工资收入的百分比约为()A.83% B.72%C.67% D.66%解析:将y=7675代入回来方程,可计算得x≈9262,所以该城市人均消费额占人均工资收入的百分比约为7675÷9262≈0.83,即约为83%.答案: A3.对于数据3,3,2,3,6,3,10,3,6,3,2,有以下结论:①这组数据的众数是3.②这组数据的众数与中位数的数值不等.③这组数据的中位数与平均数的数值相等.④这组数据的平均数与众数的数值相等.其中正确的结论有()A.1个B.2个C.3个D.4个解析: 由题意知,众数与中位数都是3,平均数为4.只有①正确,故选A. 答案: A4.某商品销售量y (件)与销售价格x (元/件)负相关,则其回来方程可能是( ) A .y =-10x +200 B .y =10x +200 C .y =-10x -200D .y =10x -200解析: ∵商品销售量y (件)与销售价格x (元/件)负相关, ∴b <0,解除B ,D.又∵x =0时,y >0,∴故选A. 答案: A5.“互联网+”时代,全民阅读的内涵已然多元化,提倡读书成为一种生活方式.某校为了解中学学生的阅读状况,从该校1 600名高一学生中,采纳分层抽样方法抽取一个容量为200的样本进行调查.若抽到的男生比女生多10人,则该校高一男生共有( )A .760人B .840人C .860人D .940人解析: 本题考查分层抽样.设所抽取的男生、女生分别有x 人、y 人,则⎩⎪⎨⎪⎧x +y =200,x -y =10解得⎩⎪⎨⎪⎧x =105,y =95所以该校高一男生共有105200×1 600=840(人),故选B.答案: B6.(2024·山东日照一中期中考试)对某商店四月内每天的顾客人数进行统计,所得数据的茎叶图如图所示,则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析: 由茎叶图,可知中位数为45+472=46,众数为45,极差为68-12=56.答案: A7.为探讨某药品的疗效,选取若干名志愿者进行临床试验,全部志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的依次分别编号为第一组,其次组,…,第五组.如图是依据试验数据制成的频率分布直方图.已知第一组与其次组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .1B .8C .12D .18解析: 由图知,样本总数为N =200.16+0.24=50.设第三组中有疗效的人数为x ,则6+x50=0.36,解得x =12.答案: C8.假如在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回来直线方程是( )A .y =x +1.9B .y =1.04x +1.9C .y =0.95x +1.04D .y =1.05x -0.9解析: x =14(1+2+3+4)=2.5,y =14(3+3.8+5.2+6)=4.5.因为回来方程过点(x ,y ),代入验证知,应选B.答案: B9.若样本数据x 1,x 2,…,x 2 018的标准差为3,则数据4x 1-1,4x 2-1,…,4x 2 018-1的方差为( )A .11B .12C .143D .144解析: 本题考查数据方差的求解.因为样本数据x 1,x 2,…,x 2 018的标准差为3,所以方差为9,所以数据4x 1-1,4x 2-1,…,4x 2 018-1的方差为42×9=144,故选D.答案: D10.某学校随机抽取20个班,调查各班中有网上购物经验的人数,所得数据的茎叶图如下图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析: 借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.法一:由题意知样本容量为20,组距为5. 列表如下:分组频数频率 频率组距 [0,5) 1 120 0.01 [5,10) 1 120 0.01 [10,15) 4 15 0.04 [15,20) 2 110 0.02 [20,25) 4 15 0.04 [25,30) 3 320 0.03 [30,35)33200.03[35,40] 2 110 0.02 合计201视察各选择项的频率分布直方图知选A.法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率组距也分别相等.比较四个选项知A 正确,故选A.答案: A二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中横线上) 11.有A ,B ,C 三种零件,分别为a 个、300个、200个,采纳分层抽样法抽取一个容量为45的样本,A 种零件被抽取20个,则a =________.解析: 依据题意得45a +300+200=20a ,解得a =400.答案: 40012.如图是依据某中学为地震灾区捐款的状况而制作的统计图,已知该校共有学生3 000人,由统计图可得该校共捐款________元.解析: 由扇形统计图可知,该中学高一、高二、高三分别有学生960人、990人、1 050人,由条形统计图知,该中学高一、高二、高三人均捐款分别为15元、13元、 10元,所以共捐款15×960+13×990+10×1 050=37 770(元).答案: 37 77013.某校开展“爱我母校,爱我家乡”摄影竞赛,9位评委为某参赛作品给出的分数的茎叶图如图,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发觉有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应当是________.解析: 平均分为91分,∴总分应为637分.由于须要去掉一个最高分和一个最低分,故须要分类探讨:①若x ≤4,则89+89+92+93+92+91+90+x =637,∴x =1;②若x >4,则89+89+92+93+92+91+94=640≠637,不符合题意.故填1. 答案: 114.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x (单位:小时)与当天投篮命中率y 之间的关系:小李这56号打6小时篮球的投篮命中率为________.解析: 平均命中率y =15×(0.4+0.5+0.6+0.6+0.4)=0.5,而x =3,∑i =15x i y i =7.6,∑i =15x2i =55,由公式得b ∧=0.01,a ∧=y -b ∧x =0.5-0.01×3=0.47,∴y ∧=0.01x +0.47.令x =6,得y∧=0.53.答案: 0.5 0.53三、解答题(本大题共4小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)15.(本小题满分12分)已知一组数据按从小到大的依次排列为-1,0,4,x,7,14,中位数为5,求这组数据的平均数与方差.解析: 由于数据-1,0,4,x,7,14的中位数为5,所以4+x2=5,x =6.设这组数据的平均数为x ,方差为s 2,由题意得 x =16×(-1+0+4+6+7+14)=5,s 2=16×[(-1-5)2+(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2]=743. 16.(本小题满分12分)为了让学生了解更多有关“一带一路”的信息,某中学实行了一次“丝绸之路学问竞赛”,共有800名学生参与了这次竞赛.为了解本次竞赛成果状况,从中抽取了部分学生的成果(得分均为整数,满分为100分)进行统计.请你依据尚未完成的频率分布表,解答下列问题:分组频数频率60.5~70.50.1670.5~80.51080.5~90.5180.3690.5~100.5合计(1)若用系统抽样的方法抽取50个样本,现将全部学生的成果随机地编号为000,001,002,…,799,试写出其次组第一名学生成果的编号;(2)填充频率分布表中的空格(将答案干脆填在表格内),并作出频率分布直方图;(3)若成果在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约有多少名?解析:(1)依据系统抽样法则,要从总体中抽取50个样本,需将总体分为50组,则每组的学生数为800÷50=16,故其次组第一名学生成果的编号为016.(2)频率分布表如下表所示,频率分布直方图如图所示.分组频数频率60.5~70.580.1670.5~80.5100.2080.5~90.5180.3690.5~100.5140.28合计50 1(3)在被抽到的学生成果中在85.5~95.5分的个数是9+7=16,占样本的比例是1650=0.32,即获得二等奖的概率约为32%,所以获得二等奖的学生约有800×32%=256(名).17.(本小题满分12分)为了让学生了解环保学问,增加环保意识,某中学实行了一次环保学问竞赛,共有900名学生参与了这次竞赛.为了了解本次竞赛的成果状况,从中抽取了部分学生的成果(得分为正整数,满分为100分)进行统计.请你依据下面尚未完成的频率分布表和频率分布直方图(下图),解答下列问题:组号 分组 频数 频率 1 [50,60) 4 0.08 2 [60,70) 8 0.16 3 [70,80) 10 0.20 4 [80,90) 16 0.32 5 [90,100]合计(1)填充频率分布表中的空格;(2)不详细计算频率组距,补全频率分布直方图;(3)估计这900名学生竞赛的平均成果(同一组中的数据用该组区间的中点值作代表). 解析: (1)40.08=50,即样本容量为50.第5组的频数为50-4-8-10-16=12, 从而第5组的频率为1250=0.24.又各小组频率之和为1,所以频率分布表中的四个空格应分别填12,0.24,50,1.(2)依据小长方形的高与频数成正比,设第一个小长方形的高为h 1,其次个小长方形的高为h 2,第五个小长方形的高为h 5.由等量关系得h 1h 2=12,h 1h 5=13,补全的频率分布直方图如图所示.(3)50名学生竞赛的平均成果为x =4×55+8×65+10×75+16×85+12×9550=79.8≈80(分).利用样本估计总体的思想可得这900名学生竞赛的平均成果约为80分.18.(本小题满分14分)某部门为了了解用电量y (单位:千瓦时)与气温x (单位:℃)之间的关系,随机统计了某4天的用电量与当天气温,因某天统计的用电量数据丢失,用t 表示,如下表:(1)(2)若用电量与气温之间具有较好的线性相关关系,回来直线方程为y ∧=-2x +b ∧,且预料气温为-4 ℃时,用电量为2t 千瓦时.求t ,b 的值.解析: (1)x =14(18+13+10-1)=10,s =14[(18-10)2+(13-10)2+(10-10)2+(-1-10)2]=1942. (2)y =14(24+t +38+64)=t +1264,∴t +1264=-2×10+b ,即4b -t =206.①又2t =-2×(-4)+b ,即2t -b =8.② 由①②得,t =34,b =60.。
人教版高一数学必修三第二章统计目录简单随机抽样(新讲课)系统抽样(新讲课)分层抽样(新讲课)2用样本的频次散布预计整体散布(2 课时 ) (新讲课)用样本的数字特色预计整体的数字特色(2 课时 ) (新讲课)变量之间的有关关系(新讲课)两个变量的线性有关(第一课时)(新讲课)两个变量的线性有关(第二课时)(新讲课)生活中线性有关实例(第三课时)(新讲课)第二章统计单元检测题(一)第二章统计单元检测题(一)参照答案第二章统计单元检测题(二)第二章统计单元检测题(二)参照答案第二章统计单元检测题(三)第二章统计单元检测题(三)参照答案第二章统计一、课程目标:本章主要介绍最基本的获得样本数据的方法,以及集中从样本数据中提守信息的统计方法,此中包含用样本预计整体散布、数字特色和线性回归等内容。
本章经过实质问题,进一步介绍随机抽样、样本预计整体、线性回归的基本方法。
二、学习目标:1、随机抽样(1)能从现实生活或其余学科中提出拥有一订价值的统计问题。
(2)联合详细的实质问题情境,理解随机抽样的必需性和重要性。
(3)在参加解决统计问题的过程中,学会用简单随机抽样从整体中抽取样本;经过对实例的剖析,认识分层抽样和系统抽样方法。
(4)经过试验、查阅资料、设计检盘问卷等方法采集数据。
2、用样本预计整体(1)经过实例领会散布的意义和作用,在表示样本数据的过程中,学会列频次散布彪、花频次散布直方图、频次折线图、茎叶土,领会它们各自的特色。
(2)经过实例理解样本数据标准差的意义和作用,学会计算数据样本差。
(3)能依据实质问题的需求合理地选用样本,从样本数据中提取基本的数字特色,并做出合理的解说。
(4)进一步领会用样本预计整体的思想。
(5)会用随机抽样的基本方法和样本预计整体的思想,解决一些简单的实质问题。
(6)形成对数据办理过程进行初步评论的意识。
3、变量的有关性(1)经过采集现实问题中两个有关系变量的数据作出散点图,并利用散点图直观认识变量间的有关关系。
人教版高一数学必修三第二章统计目录2.1.1 简单随机抽样(新授课)2.1.2 系统抽样(新授课)2.1.3 分层抽样(新授课)2.2.1用样本的频率分布估计总体分布(2课时)(新授课)2.2.2用样本的数字特征估计总体的数字特征(2课时)(新授课)2.3.1 变量之间的相关关系(新授课)2.3.2 两个变量的线性相关(第一课时)(新授课)2.3.2 两个变量的线性相关(第二课时)(新授课)2.3.2 生活中线性相关实例(第三课时)(新授课)第二章统计单元检测题(一)第二章统计单元检测题(一)参考答案第二章统计单元检测题(二)第二章统计单元检测题(二)参考答案第二章统计单元检测题(三)第二章统计单元检测题(三)参考答案第二章统计一、课程目标:本章主要介绍最基本的获取样本数据的方法,以及集中从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容。
本章通过实际问题,进一步介绍随机抽样、样本估计总体、线性回归的基本方法。
二、学习目标:1、随机抽样(1)能从现实生活或其他学科中提出具有一定价值的统计问题。
(2)结合具体的实际问题情境,理解随机抽样的必要性和重要性。
(3)在参与解决统计问题的过程中,学会用简单随机抽样从总体中抽取样本;通过对实例的分析,了解分层抽样和系统抽样方法。
(4)通过试验、查阅资料、设计调查问卷等方法收集数据。
2、用样本估计总体(1)通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布彪、花频率分布直方图、频率折线图、茎叶土,体会它们各自的特点。
(2)通过实例理解样本数据标准差的意义和作用,学会计算数据样本差。
(3)能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征,并做出合理的解释。
(4)进一步体会用样本估计总体的思想。
(5)会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题。
(6)形成对数据处理过程进行初步评价的意识。
1.关于抽样方法(1)用随机数法抽样时,对个体所编号码位数要相同,当问题所给位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =Nn ;如果总体容量N 不能被样本容量n 整除,先用简单随机抽样剔除多余个体,抽样间隔为k =Kn (其中K =N-多余个体数). (3)三种抽样方法的异同点(1)用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,作频率分布表与频率分布直方图时要注意其方法步骤.(2)茎叶图刻画数据有两个优点:一是所有信息都可以从图中得到;二是茎叶图中的数据可以随时记录,随时添加,便于记录和表示.(3)平均数反映了样本数据的平均水平,而标准差反映了样本数据的波动程度. 3.变量间的相关关系(1)除了函数关系这种确定性的关系外,还大量存在因变量的取值带有一定随机性的两个变量之间的关系——相关关系,对于一元线性相关关系,通过建立回归方程就可以根据其部分观测值,获得对这两个变量之间的整体关系的了解,主要是作出散点图,写出回归方程. (2)求回归方程的步骤:①先把数据制成表,从表中计算出x ,y,∑i =1nx 2i ,∑i =1n x i y i ; ②计算回归系数a ^,b ^.公式为⎩⎪⎨⎪⎧b ^=∑i =1n x i y i-n x y∑i =1n x 2i-n x2,a ^=y -b ^x ;③写出回归方程y ^=b ^x +a ^.题型一 抽样方法的运用1.抽样方法有:简单随机抽样、系统抽样、分层抽样. 2.三种抽样方法比较例1 (1)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为( ) A .6 B .8 C .10 D .12(2)问题:①某小区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了了解有关家用轿车购买力的某个指标,要从中抽取一个容量为100的样本;②从10名学生中抽取3人参加座谈会.方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样.则问题与方法配对正确的是( ) A .①(1),②(2) B .①(3),②(2) C .①(2),②(3) D .①(3),②(1)答案 (1)B (2)D解析 (1)分层抽样的原理是按照各部分所占的比例抽取样本.设从高二年级抽取的学生数为n ,则3040=6n,得n =8. (2)问题①中的总体是由差异明显的几部分组成的,故可采用分层抽样方法;问题②中总体的个数较少,故可采用简单随机抽样.故匹配正确的是D.跟踪训练1 某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 答案 B解析 抽样间隔为84042=20.设在1,2,…,20中抽取号码x 0(x 0∈[1,20]).在[481,720]之间抽取的号码记为20k +x 0,则481≤20k +x 0≤720,k ∈N *.所以24120≤k +x 020≤36.因为x 020∈⎣⎡⎦⎤120,1,所以k =24,25,26,…,35, 所以k 的值共有35-24+1=12(个),即所求人数为12. 题型二 用样本的频率分布估计总体分布此类问题通常要对样本数据进行列表、作图处理.这类问题采取的图表主要有:条形图、直方图、茎叶图、频率折线图、扇形图等.它们的主要优点是直观,能够清楚表示总体的分布走势.除茎叶图外,其他几种图表法的缺点是原始数据信息有丢失.例2 如图所示的是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为( )A .20B .30C .40D .50 答案 C解析 前3组的频率之和等于1-(0.012 5+0.037 5)×5=0.75,第2小组的频率是0.75×21+2+3=0.25,设样本容量为n ,则10n =0.25,则n =40.故选C.跟踪训练2 有1个容量为100的样本,数据的分组及各组的频数如下: [12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18; [21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10; [30.5,33.5],8.(1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图;(3)估计小于30的数据约占多大百分比. 解 (1)样本的频率分布表如下:(2)(3)小于30的数据约占90%.题型三 用样本的数字特征估计总体的数字特征为了从整体上更好地把握总体的规律,我们还可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体相应的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,处于中间位置的数,如果数据的个数是偶数,中间两个的数据的平均数;平均数就是所有样本数据的平均值,用x 表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式是 s = 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].有时也用标准差的平方(s 2-方差)来代表标准差.例3 (1)若某校高一年级8个班参加合唱比赛的得分茎叶图如图所示,则这组数据的中位数和平均数分别是(单位:分)( )A .91.5和91.5B .91.5和92C .91和91.5D .92和92(2)从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )A.3B.2105 C .3 D.85答案 (1)A (2)B解析 (1)将这组数据从小到大排列,得87,89,90,91,92,93,94,96(单位:分).故平均数x =18×(87+89+90+91+92+93+94+96)=91.5(分),中位数为91+922=91.5(分).故选A.(2)∵x =100+40+90+60+10100=3,∴s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]=1100(20×22+10×12+30×12+10×22) =160100=85⇒s =2105. 跟踪训练3 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如图.(1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格);(2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x 1,x 2,估计x 1-x 2的值. 解 (1)设甲校高三年级学生总人数为n . 由题意,知30n=0.05,解得n =600.样本中甲校高三年级学生数学成绩不及格的人数为5,据此估计甲校高三年级这次联考数学成绩的及格率为1-530=56.(2)设甲、乙两校样本平均数分别为x ′1,x ′2.根据样本茎叶图知,30(x ′1-x ′2)=30x ′1-30x ′2 =(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92 =2+49-53-77+2+92=15.因此x ′1-x ′2=0.5,所以x 1-x 2的估计值为0.5分. 题型四 变量间的相关关系1.分析两个变量间的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归方程.把样本数据表示的点在直角坐标系中作出,构成的图叫做散点图.从散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线方程叫做回归方程. 2.回归方程的应用利用回归方程可以对总体进行预测,虽然得到的结果不是准确值,但我们是根据统计规律得到的,因而所得结果的正确率是最大的,所以可以大胆地利用回归方程进行预测. 例4 某地连续十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归方程y =b x +a ;(2)利用(1)中所求出的直线方程预测该地2016年的粮食需求量.解 (1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来求回归方程.为此对数据预处理如下:对预处理后的数据,容易算得x =0,y =3.2, b ^=(-4)×(-21)+(-2)×(-11)+2×19+4×29(-4)2+(-2)2+22+42=26040=6.5,a ^=y -b ^x =3.2. 由上述计算结果,知所求回归方程为y ^-257=b ^(x -2 010)+a ^=6.5(x -2 010)+3.2.即y ^=6.5(x -2 010)+260.2.①(2)利用直线方程①,可预测2016年的粮食需求量为6.5×(2 016-2 010)+260.2=6.5×6+260.2=299.2(万吨)≈299(万吨).跟踪训练4 理论预测某城市2020到2024年人口总数与年份的关系如下表所示:(1)(2)指出x 与y 是否线性相关;(3)若x 与y 线性相关,请根据上表提供的数据,用最小二乘法求出y 关于x 的回归方程y ^=bx^+a ^;(4)据此估计2025年该城市人口总数.(参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+42=30) 解 (1)数据的散点图如图:(2)由散点图可知,样本点基本上分布在一条直线附近,故x 与y 呈线性相关.(3)由表知x =15×(0+1+2+3+4)=2,y =15×(5+7+8+11+19)=10.∴b ^=∑i =15x i y i -5x y∑i =15x 2i -5x 2=3.2,a ^=y -b ^x =3.6,∴回归方程为y ^=3.2x +3.6.(4)当x =5时,y ^=19.6(十万)=196万. 故2025年该城市人口总数约为196万. 题型五 数形结合思想例5 甲、乙两人在相同的条件下各射靶10次, 每次射靶成绩(单位:环)如下图所示.(1)填写下表:(2)①从平均数和方差结合分析偏离程度; ②从平均数和中位数结合分析谁的成绩好些;③从平均数和命中9环以上的次数相结合看谁的成绩好些; ④从折线图上两人射击命中环数及走势分析谁更有潜力.解 (1)乙的射靶环数依次为2,4,6,8,7,7,8,9,9,10.所以x 乙=110(2+4+6+8+7+7+8+9+9+10)=7;乙的射靶环数从小到大排列为2,4,6,7,7,8,8,9,9,10,所以中位数是7+82=7.5;甲的射靶环数从小到大排列为5,6,6,7,7,7,7,8,8,9,所以中位数为7.于是填充后的表格如下表所示:(2)①甲乙数的程度大.②甲、乙的平均水平相同,而乙的中位数比甲大,说明乙射靶环数的优秀次数比甲多. ③甲、乙的平均水平相同,而乙命中9环以上(包含9环)的次数比甲多2次,可知乙的射靶成绩比甲好.④从折线图上看,乙的成绩呈上升趋势,而甲的成绩在平均线上波动不大,说明乙的状态在提升,更有潜力.跟踪训练5 甲、乙两名同学在五次数学测试中的成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别用X 甲,X 乙表示,则下列结论正确的是( )A .X 甲>X 乙,甲比乙成绩稳定B .X 甲>X 乙,乙比甲成绩稳定C .X 甲<X 乙,甲比乙成绩稳定D .X 甲<X 乙,乙比甲成绩稳定 答案 A解析 由茎叶图知,X 甲=15×(68+69+70+71+72)=70,X 乙=15×(63+68+69+69+71)=68,∴X 甲>X 乙,且甲比乙成绩稳定.1.对于频率分布直方图,要记住以下几点:(1)每个小矩形面积=这组的频率;(2)所有小矩形面积的和为1;(3)纵轴表示的数为频率组距.2.在研究两个变量是否存在某种关系时,必须从散点图入手,通过散点图,可以做出判断.。
应用抽样方法抽取样本时,应注意以下几点:()用随机数法抽样时,对个体所编的号码位数要相等.当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“”,凑齐位数.()用系统抽样抽样时,如果总体容量能被样本容量整除,抽样间隔为=,如果总体容量不能被样本容量整除,先用简单随机抽样剔除多余个体,抽样间隔为=()几种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数法;当总体容量较大,样本容量也较大时,可采用系统抽样;当总体中个体差异较显著时,可采用分层抽样.[典例] 选择合适的抽样方法抽样,写出抽样过程.()有个篮球,其中甲厂生产的有个,乙厂生产的有个,抽取个入样;()有甲厂生产的个篮球,其中一箱个,另一箱个,抽取个入样;()有甲厂生产的个篮球,抽取个入样;()有甲厂生产的个篮球,抽取个入样.解:()总体由差异明显的两个层次组成,需选用分层抽样法.第一步:确定抽取个数.因为=,所以甲厂生产的篮球应抽取×=(个),乙厂生产的篮球应抽取×=(个);第二步:用抽签法分别抽取甲厂生产的篮球个,乙厂生产的篮球个,这些篮球便组成了我们要抽取的样本.()总体容量较小,用抽签法.第一步:将个篮球用随机方式分段,分段为,…,;第二步:将以上个分段分别写在大小、形状相同的小纸条上,揉成小球,制成号签;第三步:把号签放入一个不透明的袋子中,充分搅匀;第四步:从袋子中逐个不放回抽取个号签,并记录上面的号码;第五步:找出和所得号码对应的篮球,这些篮球便组成了我们要抽取的样本.()总体容量较大,样本容量较小,宜用随机数表法.第一步:将个篮球用随机方式分段,分段为,…,;第二步:在随机数表中随机的确定一个数作为开始,如第行第列的数“”开始,任选一个方向作为读数方向,比如向右读;第三步:从数“”开始向右读,每次读三位,凡不在~中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到这个号码,这就是所要抽取的个样本个体的号码,找出和所得号码对应的篮球便组成我们要抽取的样本.()总体容量较大,样本容量也较大宜用系统抽样法.第一步:将个篮球用随机方式分段,分段为,…,,并分成段.第二步:在第一段,…,这十个分段中用简单随机抽样抽出一个(如)作为始号码;第三步:将分段为,…,的个体抽出,组成样本.[对点训练].某高级中学有学生人,其中一年级人,二、三年级各人.现要利用抽样方法抽取人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一分段为,…,;使用系统抽样时,将学生统一随机分段为,…,,并将整个分段依次分为段.如果抽得的号码有下列四种情况:①;②;③;④.关于上述样本的下列结论中,正确的是( ).②③都不能为系统抽样.②④都不能为分层抽样。
章末综合测评(三) 概率(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列事件中,随机事件的个数为( )①在学校明年召开的田径运动会上,学生张涛获得100米短跑冠军;②在体育课上,体育老师随机抽取一名学生去拿体育器材,抽到李凯;③从标有1,2,3,4的4张号签中任取一张,恰为1号签; ④在标准大气压下,水在4℃时结冰. A .1 B .2 C .3D .4【解析】 ①在明年运动会上,可能获冠军,也可能不获冠军.②李凯不一定被抽到.③任取一张不一定为1号签.④在标准大气压下水在4℃时不可能结冰,故①②③是随机事件,④是不可能事件.【答案】 C2.下列说法正确的是( )A .甲、乙二人比赛,甲胜的概率为35,则比赛5场,甲胜3场 B .某医院治疗一种疾病的治愈率为10%,前9个病人没有治愈,则第10个病人一定治愈C .随机试验的频率与概率相等D .天气预报中,预报明天降水概率为90%,是指降水的可能性是90%【解析】 概率只是说明事件发生的可能性大小,其发生具有随机性.故选D.【答案】 D3.(2016·开封高一检测)给甲、乙、丙三人打电话,若打电话的顺序是任意的,则第一个打电话给甲的概率是( )A.16 B .13 C.12D .23【解析】 给三人打电话的不同顺序有6种可能,其中第一个给甲打电话的可能有2种,故所求概率为P =26=13.故选B.【答案】 B4.在区间[-2,1]上随机取一个数x ,则x ∈[0,1]的概率为( ) A.13 B .14 C.12D .23【解析】 由几何概型的概率计算公式可知x ∈[0,1]的概率P =1-01-(-2)=13.故选A. 【答案】 A5.1升水中有1只微生物,任取0.1升化验,则有微生物的概率为()A.0.1 B.0.2C.0.3 D.0.4【解析】本题考查的是体积型几何概型.【答案】 A6.(2016·天水高一检测)从一批产品中取出三件产品,设A=“三件产品全不是次品”,B=“三件产品全是次品”,C=“三件产品不全是次品”,则下列结论正确的是()A.A与C互斥B.B与C互斥C.任何两个均互斥D.任何两个均不互斥【解析】互斥事件是不可能同时发生的事件,所以B与C互斥.【答案】 B7.某人从甲地去乙地共走了500 m,途中要过一条宽为x m的河流,他不小心把一件物品丢在途中,若物品掉在河里就找不到,若物品不掉在河里,则能找到,已知该物品能找到的概率为45,则河宽为()A.100 m B.80 m C.50 m D.40 m【解析】设河宽为x m,则1-x500=45,所以x=100.【答案】 A8.从一批羽毛球中任取一个,如果其质量小于4.8 g 的概率是0.3,质量不小于4.85 g 的概率是0.32,那么质量在[4.8,4.85)范围内的概率是( )A .0.62B .0.38C .0.70D .0.68【解析】 记“取到质量小于4.8 g ”为事件A ,“取到质量不小于4.85 g ”为事件B ,“取到质量在[4.8,4.85)范围内”为事件C .易知事件A ,B ,C 互斥,且A ∪B ∪C 为必然事件.所以P (A ∪B ∪C )=P (A )+P (B )+P (C )=0.3+0.32+P (C )=1,即P (C )=1-0.3-0.32=0.38.【答案】 B9.如图1,矩形ABCD 中,点E 为边CD 的中点,若在矩形ABCD 内部随机取一个点Q ,则点Q 取自△ABE 内部的概率等于( ) 【导学号:28750071】图1A.14 B .13 C.12D .23【解析】 点E 为边CD 的中点,故所求的概率P =△ABE 的面积矩形ABCD 的面积=12.【答案】 C10.将区间[0,1]内的均匀随机数x 1转化为区间[-2,2]内的均匀随机数x ,需要实施的变换为( )A .x =x 1*2B .x =x 1*4C .x =x 1*2-2D .x =x 1*4-2【解析】 由题意可知x =x 1*(2+2)-2=4x 1-2. 【答案】 D11.先后抛掷两颗骰子,设出现的点数之和是12,11,10的概率依次是P 1,P 2,P 3,则( )A .P 1=P 2<P 3B .P 1<P 2<P 3C .P 1<P 2=P 3D .P 3=P 2<P 1【解析】 先后抛掷两颗骰子的点数共有36个基本事件:(1,1),(1,2),(1,3),…,(6,6),并且每个基本事件都是等可能发生的.而点数之和为12的只有1个:(6,6);点数之和为11的有2个:(5,6),(6,5);点数之和为10的有3个:(4,6),(5,5),(6,4),故P 1<P 2<P 3.【答案】 B12.在5件产品中,有3件一等品和2件二等品,从中任取2件,则下列选项中以710为概率的事件是( )A .恰有1件一等品B .至少有一件一等品C .至多有一件一等品D .都不是一等品【解析】 将3件一等品编号为1,2,3,2件二等品编号为4,5,从中任取2件有10种取法:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5).其中恰含有1件一等品的取法有:(1,4),(1,5),(2,4),(2,5),(3,4),(3,5),恰有1件一等品的概率为P 1=610,恰有2件一等品的取法有:(1,2),(1,3),(2,3).故恰有2件一等品的概率为P 2=310,其对立事件是“至多有一件一等品”,概率为P 3=1-P 2=1-310=710.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上).13.一个袋子中有5个红球,3个白球,4个绿球,8个黑球,如果随机地摸出一个球,记A ={摸出黑球},B ={摸出白球},C ={摸出绿球},D ={摸出红球},则P (A )=________;P (B )=________;P (C ∪D )=________.【解析】 由古典概型的算法可得P (A )=820=25,P (B )=320,P (C ∪D )=P (C )+P (D )=420+520=920.【答案】 25 320 92014.在区间(0,1)内任取一个数a ,能使方程x 2+2ax +12=0有两个相异实根的概率为________.【解析】 方程有两个相异实根的条件是Δ=(2a )2-4×1×12=4a 2-2>0,解得|a |>22,又a ∈(0,1),所以22<a <1,区间⎝ ⎛⎭⎪⎫22,1的长度为1-22,而区间(0,1)的长度为1,所以方程有两个相异实根的概率为1-221=2-22.【答案】 2-2215.甲、乙两组各有三名同学,他们在一次测验中的成绩的茎叶图如图2所示,如果分别从甲、乙两组中各随机选取一名同学,则这两名同学的成绩相同的概率是________.图2【解析】 由题意可知从甲、乙两组中各随机选取一名同学,共有9种选法,其中这两名同学的成绩相同的选法只有1种,故所求概率P =19.【答案】 1916.(2016·合肥高一检测)甲乙两人玩猜数字游戏,先由甲心中任想一个数字记为a ,再由乙猜甲刚才想的数字,把乙猜的数字记为b ,且a、b∈{0,1,2,…,9}.若|a-b|≤1,则称甲乙“心有灵犀”.现任意找两人玩这个游戏,则二人“心有灵犀”的概率为________.【解析】此题可化为任意从0~9中取两数(可重复)共有10×10=100种取法.若|a-b|≤1分两类,当甲取0或9时,乙只能猜0、1或8、9共4种,当甲取2~8中的任一数字时,分别有3种选择,共3×8=24种,所以P=24+410×10=725.【答案】7 25三、解答题(本大题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)(2015·陕西高考)随机抽取一个年份,对西安市该年4月份的天气情况进行统计,结果如下:(1)在4月份任取一天,估计西安市在该天不下雨...的概率;(2)西安市某学校拟从4月份的一个晴天..开始举行连续2天的运动会,估计运动会期间不下雨...的概率. 【解】 (1)在容量为30的样本中,不下雨的天数是26,以频率估计概率,4月份任选一天,西安市不下雨的概率为2630=1315.(2)称相邻的两个日期为“互邻日期对”(如,1日与2日,2日与3日等).这样,在4月份中,前一天为晴天的互邻日期对有16个,其中后一天不下雨的有14个,所以晴天的次日不下雨的频率为78.以频率估计概率,运动会期间不下雨的概率为78.18.(本小题满分12分)对某班一次测验成绩进行统计,如下表所示:(1)求该班成绩在[80,100]内的概率; (2)求该班成绩在[60,100]内的概率.【解】 记该班的测试成绩在[60,70),[70,80),[80,90),[90,100]内依次为事件A ,B ,C ,D ,由题意知事件A ,B ,C ,D 是彼此互斥的.(1)该班成绩在[80,100]内的概率是P (C ∪D )=P (C )+P (D )=0.25+0.15=0.4.(2)该班成绩在[60,100]内的概率是P (A ∪B ∪C ∪D )=P (A )+P (B )+P (C )+P (D )=0.17+0.36+0.25+0.15=0.93.19.(本小题满分12分)小王、小李两位同学玩掷骰子(骰子质地均匀)游戏,规则:小王先掷一枚骰子,向上的点数记为x;小李后掷一枚骰子,向上的点数记为y.(1)在直角坐标系xOy中,以(x,y)为坐标的点共有几个?(2)规定:若x+y≥10,则小王赢;若x+y≤4,则小李赢,其他情况不分输赢.试问这个游戏规则公平吗?请说明理由. 【导学号:28750072】【解】(1)由于x,y取值为1,2,3,4,5,6,则以(x,y)为坐标的点有:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),共有36个,即以(x,y)为坐标的点共有36个.(2)满足x+y≥10的点有:(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6个,所以小王赢的概率是636=1 6,满足x+y≤4的点有:(1,1),(1,2),(1,3),(2,1),(2,2),(3,1),共6个,所以小李赢的概率是636=1 6,则小王赢的概率等于小李赢的概率,所以这个游戏规则公平.20.(本小题满分12分)(2014·天津高考)某校夏令营有3名男同学A,B,C和3名女同学X,Y,Z,其年级情况如下表:现从这6名同学中随机选出2人参加知识竞赛(每人被选到的可能性相同).(1)用表中字母列举出所有可能的结果;(2)设M为事件“选出的2人来自不同年级且恰有1名男同学和1名女同学”,求事件M发生的概率.【解】(1)从6名同学中随机选出2人参加知识竞赛的所有可能结果为{A,B},{A,C},{A,X},{A,Y},{A,Z},{B,C},{B,X},{B,Y},{B,Z},{C,X},{C,Y},{C,Z},{X,Y},{X,Z},{Y,Z},共15种.(2)选出的2人来自不同年级且恰有1名男同学和1名女同学的所有可能结果为{A,Y},{A,Z},{B,X},{B,Z},{C,X},{C,Y},共6种.因此,事件M发生的概率P(M)=615=25.21.(本小题满分12分)(2014·四川高考)一个盒子里装有三张卡片,分别标记有数字1,2,3,这三张卡片除标记的数字外完全相同.随机有放回地抽取3次,每次抽取1张,将抽取的卡片上的数字依次记为a,b,c.(1)求“抽取的卡片上的数字满足a +b =c ”的概率;(2)求“抽取的卡片上的数字a ,b ,c 不完全相同”的概率.【解】 (1)由题意知,(a ,b ,c )所有的可能为(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(2,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.设“抽取的卡片上的数字满足a +b =c ”为事件A ,则事件A 包括(1,1,2),(1,2,3),(2,1,3),共3种.所以P (A )=327=19.因此,“抽取的卡片上的数字满足a +b =c ”的概率为19.(2)设“抽取的卡片上的数字a ,b ,c 不完全相同”为事件B ,则事件B 包括(1,1,1),(2,2,2),(3,3,3),共3种.所以P (B )=1-P (B )=1-327=89.因此,“抽取的卡片上的数字a ,b ,c 不完全相同”的概率为89.22.(本小题满分12分)把参加某次铅球投掷的同学的成绩(单位:米)进行整理,分成以下6个小组:[5.25,6.15),[6.15,7.05),[7.05,7.95),[7.95,8.85),[8.85,9.75),[9.75,10.65],并绘制出频率分布直方图,如图3所示是这个频率分布直方图的一部分.已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30,第6小组的频数是7.规定:投掷成绩不小于7.95米的为合格.图3(1)求这次铅球投掷成绩合格的人数;(2)你认为这次铅球投掷的同学的成绩的中位数在第几组?请说明理由;(3)若参加这次铅球投掷的学生中,有5人的成绩为优秀,现在要从成绩优秀的学生中,随机选出2人参加相关部门组织的经验交流会,已知a、b两位同学的成绩均为优秀,求a、b两位同学中至少有1人被选到的概率.【解】(1)∵第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)=0.14.∴参加这次铅球投掷的总人数为70.14=50.根据规定,第4、5、6组的成绩均为合格,人数为(0.28+0.30+0.14)×50=36.(2)∵成绩在第1、2、3组的人数为(0.04+0.10+0.14)×50=14,成绩在第5、6组的人数为(0.30+0.14)×50=22,参加这次铅球投掷的总人数为50,∴这次铅球投掷的同学的成绩的中位数在[7.95,8.85)内,即第4组.(3)设这次铅球投掷成绩优秀的5人分别为a、b、c、d、e,则选出2人的所有可能的情况为:ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10种,其中a、b至少有1人的情况为:ab,ac,ad,ae,bc,bd,be,共有7种,∴a、b两位同学中至少有1人被选到的概率为P=7 10.。
第二章统计教学目标重点:会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的问题.难点:能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.能力点:如何利用样本对总体的分布规律、整体水平、稳定程度及相关关系等特性进行估计和预测.教育点:提高学生的认知水平,为学生塑造良好的数学认识结构.自主探究点:例题及变式的解题思路的探寻.易错点:由于学生运算能力差,因此求回归直线方程涉及的运算学生容易出错.学法与教具1.学法:讲授法、讨论法.2.教具:学案导学.(1)作样本频率分布直方图的步骤:注意:频率分布直方图纵坐标表示:____________.(2)茎叶图作图步骤:(3)直方图与茎叶图的优缺点:3.用样本的数据特征估计总体的数据特征(1)利用频率直方图中估计众数、平均数、中位数的值:估计众数______________________________________.估计平均数____________________________________.估计中位数____________________________________.(2)标准差与方差的公式:标准差____________________s=.方差2_____________________s=.(3)标准差与方差的作用:4.变量间的相关关系(1)两变量间的关系有:________________和________________.(2)两变量相关关系的确定方法:____________________________________.(3)用最小二乘法求回归直线方程的步骤:(二)基础检测1.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12名女排运动员,要从中选出3个调查学习负担情况,记做②.那么完成上述2项调查应采用的抽样方法分别是________________.答案:分层抽样,简单随机抽样.2.一个总体的60个个体的编号为0,1,2,…,59,现要从中抽取一个容量为10的样本,请根据编号按被6样本,则抽取的样本号码是_______________.答案:3,9,15,21,27,33,39,45,51,3.(12山东文高考) 右图是根据部分城市某年6气温(单位:℃)数据得到的样本频率分布直方图气温的范围是[20.5,26.5],样本数据的分组为[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为_________.答案:9./第3题图4.(10山东理)样本中共有五个个体,其值分别为a ,0,1,2,3, 若该样本的平均值为1,则样本方差为_______________. 答案:2.5.(11辽宁)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 和年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:0.2540.321y x =+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______________万元.答案:0.254. 三、【范例导航】例1.一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标A 类轿车10辆.(1)求z 的值; (2)B 类,C 类轿车各应抽取多少? (3)在C 类轿车中,按型号分层抽样,应各抽取多少?【分析】按类分层或者是按型号分层,抽样比是相同的.【解答】(1)设该厂这个月共生产轿车n 辆,则由题意得5010,100300n =+所以2000n =, 则2000(100300)150450600400z =-+---=.(2)B 类轿车共有150+450=600(辆).按抽样比10400抽取,则应抽取1060015400⨯=(辆). 同理,C 类应抽取10(400600)25400+⨯=(辆).(3)在C 类轿车中,按型号抽样时抽样比仍为140.则舒适型应抽取14001040⨯=(辆);标准型应抽取16001540⨯=(辆).【点评】通过本题的具体计算可看出,无论是按类抽取还是按型号抽取,每个个体入样的概率都是140. 变式训练:为了了解参加某种知识竞赛的1000名学生的成绩,要从中抽取50名学生的成绩,采用什么抽样方法比较恰当?简述抽样过程. 答案:适宜选用系统抽样,抽样过程如下:(1)随机地将这1000名学生编号为1,2,3,,1000;(2)将总体按编号顺序均分成50部分,每部分包括20个个体; (3)在第一部分的个体编号1,2,3,,20中,利用简单随机抽样抽取一个号码,比如是18;(4) 以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,, 998. 小结:1.三种抽样方法的共同特点是在抽样过程中每个个体被抽取的机会相同,体现了这些抽样方法的客观性和公平性.2.当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,常采用系统抽样;当总体中的个体有明显的层次差异,层次分明时,常采用分层抽样.3.系统抽样时要注意所得样本号码的特点,而分层抽样要正确确定抽样的比例.例2.为了了解高二学生的体能情况,我校抽取部分高二学生进行一分钟跳绳次数测试,将所得数据整理后,图所示,图中左到右各小长方型的面积之比为小组频数为12.问:(1)(2)(3)求一分钟跳绳的众数,中位数和平均数.(4)若一分钟跳绳次数在110次以上(含110试估计该校全体高一学生的达标率是多少?【分析】(1)考查频率分布折线图与频率分布直方图的关系; (2)根据从左到右各小长方形的面积之比为 2:4:17:15:9:3,第二小组频数为12,用比值做出样本容量.做出的样本容量和第二小组的频率.(3)在频率分布直方图中最高的小长方形的底边的中点就是这组数据的众数的估计值,处在把频率分布直方图所有的小长方形的面积分成两部分的一条垂直与横轴的线对应的横标就是中位数的估计值,平均数的估计值是频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(4)根据上面做出的样本容量和前两个小长方形所占的比例,用所0.034 0.0180.03有的符合条件的样本个数之和,除以样本容量得到概率. 【解答】(1)如图所示(2)∵从左到右各小长方形的面积之比为 2:4:17:15:9:3,第二小组频数为12.∴样本容量是(24171593)121504+++++⨯=∴第二小组的频率是 120.08150=.(3)由图可知众数为1101201152+=,又∵前三个小矩形的面积之和为0.46.∴设中位数为120+x ,则0.460.030.5x +⨯=,得x =43,∴中位数为3643,而平均数为0.04950.081050.341150.31250.181350.06145121.8⨯+⨯+⨯+⨯+⨯+⨯=.(4)∵次数在110次以上(含110次)为达标,∴在这组数据中达标的个体数一共有17+15+9+3, ∴全体学生的达标率估计是1715930.8850+++=.【点评】本题考查频率分步直方图的应用,是一个基础题,这种题目解题的关键是看清图中所给的条件,知道小长方形的面积就是这组数据的频率. 变式训练:1.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图为如图(1)根据茎叶图判断哪个班的平均身高较高;用茎叶图分析数据的好处?(2)分别计算甲班、乙班的样本平均数及方差;(3)根据计算结果对两班的身高用其稳定性进行比较,写出统计结论. 答案:(1)由茎叶图不难看出乙班的平均身高较高;用茎叶图处理现有的数据不但可以看出数据的分布情况, 而且可以看出每组中的具体数据.(2)由茎叶图,得甲班的10名同学的身高分别为182 179 179 171 170 168 168 163 162 158甲班 乙班 18171615 3 73 6 8 9 2 5 8 99 9 1 0 2 8 8 3 2 8183 187 173 176 178 179 162 165 168 159, 得他们的平均身高为2173x cm =,22277.2s cm =.(3)由(2)的计算结果可以发现甲班的平均身高为170cm ,乙班的平均身高为173cm .由此可知乙班的平均身高比甲班的平均身高高,但乙班的身高不够稳定,而甲班的身高比较集中在平均身高附近. 2.某次数学考试中,高一(20)班有20人成绩记录如下:(单位:分)125 121 123 125 127 129 125 128 130 129 126 124 125 127 126 122 124 125 126 128王老师想做出以上数据的频率分布直方图,他把这些数据分成5组,分组情况为[120.5,122.5),[122.5,124.5),[124.5,126.5),[126.5,128.5),[128.5,130.5].(1)请你帮他完成频率分布直方图;(2)根据画出的直方图,求这组数据的众数、中位数、平均数. 答案:(1)略. (2) 众数为125.5,中位数为125.75,平均数为125.8. 小结:1.用样本频率分布估计总体频率分布时,通常要对给定的一组数据进行列表、作图处理,列表与作图时要注意其方法步骤;对于茎叶图要正确画图,能够根据图中所给的数据进行分析.2.在频率分布直方图中能够正确估计样本数据的众数、中位数、平均数,并且知道它们给分析数据带来的不同影响,不同的数字特征代表着不同的信息.由于需要不同信息而选择不同的数字特征,对同一组数据的评价可能会相差很大.3.会计算样本数据的方差、标准差,知道它们的作用;在实际应用中当所得数据平均数不同时,须先分析平均水平,再计算标准差(方差)分析稳定情况.例3.假设关于某设备的使用年限x 和所支出的维修费用y (万元)(1)性回归方程y bx a =+的回归系数 b ,a ;(2)估计使用年限为10年时的维修费用.【分析】(1)利用散点图可直接判断两变量是否线性相关;再利用公式1122211()(),()n niii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑a y bx =-来计算回归系数.有时为了计算方便常制表对应求出2,,i i i x y x ,以利于求和.(2)获得线性回归方程后,取x =10即得所求. 【解答】(1)散点图如图所示: 由散点图可知两变量线性相关.于是有2112.3 1.23905410b -===-⨯,5 1.2340.08a y bx =-=-⨯=.(2)回归直线方程是 1.230.08y x =+,当x =10(年)时,1.23100.0812.38y =⨯+=(万元),即估计使用10年时维修费用是12.38万元. 【点评】判断两变量是否线性相关一种简便可行的方法就是绘制散点图.根据散点图可以很容易看出两个变量是否具有相关关系.只有当两个变量之间存在线性相关关系时,才能用回归直线方程对总体进行估计和预测. 变式训练:1.小王记录了产量x (吨)和能耗y (吨标准煤)对应的四组数据,用最小二乘法求出了0.70.35y x =+,不慎将一滴墨水滴于表内,表中第二行第四列的数据已无法看清,据您判断这个数据应该是多少?答案:2.某数学老师身高176cm ,他爷爷、父亲和儿子的身高分别是173cm 、170cm 和182cm .因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是多少cm ?答案:185cm . 小结:求线性回归直线方程应注意:先画散点图判断两变量是否线性相关;若线性相关,再利用公式计算,a b 的值,进而求出回归直线方程,但要注意运算顺序;然后就可以利用回归方程进行估计和预测. 四、【解法小结】1.对于随机抽样问题:掌握三种抽样方法的区别与联系,系统抽样的样本号码的特点以及分层抽样的比例的确定.2.应用频率分布直方图时,需明确纵轴表示的是频率/组距,进而进行相关计算.3.对于标准差、方差记准公式,知道其作用.4.掌握用最小二乘法求回归直线方程的步骤,注意运算顺序. 五、【布置作业】 必做题:1.(2012山东理高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为 1,2,,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间 [1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为_______________.2. (2012湖北文高考)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有_______________人.3.(2013山东文高考)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91分.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则7个剩余分数的方差是_______________.4.(2011广东高考)为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x法,预测小李该月6号打6小时篮球的投篮命中率为___________. 5.(2012广东文高考)某校100位学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是8 9 7 74 0 1 0 x 9 10.04 0.03 0.02[70,80),[80,90),[90,100]. (1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生的语文成绩某些分数段的人数x 与数学成绩 相应分数段的人数y 之比如下表所示,求数学成绩在[50,90) 之外的人数.6.某学校高一(3)班甲、乙两名同学的最近5次(1)(2)分别用平均数和中位数分析甲、乙两位同学中,哪位同学成绩较好;(3)(单位:分)如下:并说明理由.必做题答案:1.10 2. 6 3.3674. 0.5, 0.535. (1) a =0.005 (2)73 (3)106.(1)甲的平均分、中位数分别为90、95,乙的平均分、中位数分别为86、98;(2)从平均分看,甲的平均分高,甲的成绩较好;从中位数看,乙的中位数大,乙的成绩较好.(3)丙的平均数、中位数、方差分别为90、90、44.4,甲的方差为158.8.由于两人的平均分相同,所以从平均分看,甲、丙成绩同样好;从中位数看,甲的中位数高,甲的成绩高;从方差看,丙的方差小,丙的成绩较稳定,所以丙的成绩好. 选做题:(2012山西模拟)如下图,图甲是某市有关部门根据对当地干部的月收入情况调查后画出的样本频率分布直方图,已知图甲中从左向右第一组的频数为4000.在样本中记月收入在[1000,1500),[1500,2000),[2000,2500),[2500,3000),[3000,3500),[3500,4000)的人数依次为A1,A2,…,A6.图乙是统计图中月工资收入在一定范围内的人数的程序框图,图乙输出的S=______________.(用数字作答).0.00080.00040.00030.000250.000150.0001。
2. 1.1简单随机抽样一、三维目标:1、知识与技能:正确理解随机抽样的概念,掌握抽签法、随机数表法的一般步骤;2、过程与方法:(1)能够从现实生活或其他学科中提出具有一定价值的统计问题;(2)在解决统计问题的过程中,学会用简单随机抽样的方法从总体中抽取样本。
3、情感态度与价值观:通过对现实生活和其他学科中统计问题的提出,体会数学知识与现实世界及各学科知识之间的联系,认识数学的重要性。
二、重点与难点:正确理解简单随机抽样的概念,掌握抽签法及随机数法的步骤,并能灵活应用相关知识从总体中抽取样本。
三、教学设想:假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本。
(为什么?)那么,应当怎样获取样本呢?【探究新知】一、简单随机抽样的概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。
【说明】简单随机抽样必须具备下列特点:(1)简单随机抽样要求被抽取的样本的总体个数N是有限的。
(2)简单随机样本数n小于等于样本总体的个数N。
(3)简单随机样本是从总体中逐个抽取的。
(4)简单随机抽样是一种不放回的抽样。
(5)简单随机抽样的每个个体入样的可能性均为n/N。
思考?下列抽样的方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取50个个体作为样本。
(2)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子。
二、抽签法和随机数法1、抽签法的定义。
一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本。
【说明】抽签法的一般步骤:(1)将总体的个体编号。
章末复习课课时目标 1.巩固本章主干知识点.2.提高知识的综合应用能力.1.某质检人员从编号为1~100这100件产品中,依次抽出号码为3,13,23, (93)产品进行检验,则这样的抽样方法是( )A.简单随机抽样B.系统抽样C.分层抽样D.以上都不对2.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为( )A.7 B.15C.25 D.353.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A.91.5和91.5 B.91.5和92C.91和91.5 D.92和924.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为( )A.1 B.2C.3 D.45.如果数据x1,x2,…,x n的平均数为x,方差为s2,则2x1+3,2x2+3,…,2x n+3的平均数和方差分别为( )A.x和s B.2x+3和4s2C.2x+3和s2D.2x+3和4s2+12s+96.某棉纺厂为了了解一批棉花的质量,从中随机抽测了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据均在区间[5,40]中,其频率分布直方图如图所示,则在抽测的100根中,有______根棉花纤维的长度小于20 mm.一、选择题1.为了调查参加运动会的500名运动员的身高情况,从中抽查了50名运动员的身高,就这个问题来说,下列说法正确的是( )A.50名运动员是总体B.每个运动员是个体C.抽取的50名运动员是样本D.样本容量是502.某高级中学高一年级有十六个班,812人,高二年级有十二个班,605人,高三年级有十个班,497人,学校为加强民主化管理,现欲成立由76人组成的学生代表会,你认为下列代表产生的办法中,最符合统计抽样原则的是( )A.指定各班团支部书记、班长为代表B.全校选举出76人C.高三选举出20人,高二选举出24人,高一选举出32人D.高三20人,高二24人,高一32人均在各年级随机抽取3.一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40和0.125,则n 的值是( )A.640 B.320C.240 D.1604.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿的体重在[2 700,3 000]的频率为( )A.0.001 B.0.01C.0.003 D.0.35.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )A.92,2 B.92,2.8C.93,2 D.93,2.86.下列图形中具有相关关系的两个变量是( )题号123456答案7.一个总体中有100个个体,随机编号0,1,2,…,99,依从小到大的编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k组中抽取的号码个位数字与m+k的个位数字相同,若m=8,则在第8组中抽取的号码是________.8.一个样本容量是100的频率分布如图:(1)样本落在[60,70)内的频率为________;(2)样本落在[70,80)内的频数为________;(3)样本落在[90,100)内的频率是0.16,该小矩形的高是________.9.某商店统计了最近6个月某商品的进价x与售价y(单位:元)的对应数据如下表:x3528912y46391214假设得到的关于x和y之间的回归直线方程是y=b x+a,那么该直线必过的定点是________.三、解答题10甲6080709070乙8060708075分别计算两个样本的平均数x和方差s2,并根据计算结果估计甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?11.下表数据是退水温度x(℃)对黄酮延长性y(%)效应的试验结果,y是以延长度计算x(℃)300400500600700800y(%)405055606770(1)(2)指出x,y是否线性相关;(3)若线性相关,求y关于x的回归方程;(4)估计退水温度是1 000℃时,黄酮延长性的情况.12.在育民中学举行的电脑知识竞赛中,将九年级两个班参赛的学生成绩(得分均为整数)进行整理后分成五组,绘制如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)能力提升13.在一次中学生田径运动会上,参加跳高的17名运动员成绩如下:成绩(单位m ) 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90人数 2 3 2 3 4 1 1 1 (2)分析这些数据的含义.14.今年西南一地区遭遇严重干旱,某乡计划向上级申请支援,为上报需水量,乡长事先抽样调查了100户村民的月均用水量,得到这100户村民月均用水量的频率分布表如下表:(用水量分组 频数 频率 [0.5,2.5) 12 [2.5,4.5) [4.5,6.5) 40 [6.5,8.5) 0.18 [8.5,10.5] 6 合计 100 1(1) (2)估计样本的中位数是多少?(3)已知上级将按每户月均用水量向该乡调水,若该乡共有1 200户,请估计上级支援该乡的月调水量是多少吨?1.三种常用的抽样方法:简单随机抽样、系统抽样和分层抽样.在使用它们的过程中,每一个个体被抽到的可能性是一样的.应用抽样方法抽取样本时,应注意以下几点: (1)用随机数法抽样时,对个体所编的号码位数是相等的,当问题所给位数不相等时,以位数较多的为准,在位数较少的数前面添“0”,凑齐位数.(2)用系统抽样法抽样时,如果总体容量N 能被样本容量n 整除,抽样间隔为k =Nn,如果总体容量N 不能被样本容量n 整除,先用简单抽样法剔除多余个数、抽样间隔为k =[N n ],([N n ]表示取Nn的整数部分.) (3)三种抽样方法的适用范围:当总体容量较小,样本容量也较小时,可采用抽签法;当总体容量较大,样本容量较小时,可采用随机数表法;当总体容量较大,样本容量也较大时,可采用系统抽样法;当总体由差异明显的几部分组成时,可采用分层抽样法. 2.为了从整体上更好地把握总体的规律,可以通过样本数据的众数、中位数、平均数和标准差等数字特征对总体的数字特征作出估计.众数就是样本数据中出现次数最多的那个值;中位数就是把样本数据分成相同数目的两部分,其中一部分比这个数小,另一部分比这个数大的那个数;平均数就是所有样本数据的平均值,用x 表示;标准差是反映样本数据分散程度大小的最常用统计量,其计算公式如下:s =1n[x 1-x 2+x 2-x 2+…+x n -x 2].有时也用标准差的平方s 2——方差来代替标准差,实质一样. 3.求回归直线方程的步骤:(1)先把数据制成表,从表中计算出x ,y ,∑ni =1x 2i,∑ni =1y 2i,∑ni =1x i y i ; (2)计算回归系数a ^,b ^.公式为⎩⎨⎧b ^=∑ni =1x i y i -n x y∑n i =1x2i -n x 2,a ^=y -b ^x(3)写出回归直线方程y ^=b ^x +a ^.答案:章末复习课双基演练 1.B2.B [设样本容量为n ,则350750=7n,∴n=15.] 3.A4.D [∵x +y +10+11+95=10,15[(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2]=2,化简得x +y =20,(x -10)2+(y -10)2=8,解得x =12,y =8或x =8,y =12,∴|x-y|=4.]5.B [因x 1+x 2+…+x n =n x , 所以2x 1+3+2x 2+3+…+2x n +3n=2x 1+x 2+…+x n +3n n =2n xn+3=2x +3.又(x 1-x )2+(x 2-x )2+…+(x n -x )2=ns 2,所以[2x 1+3-(2x +3)]2+[2x 2+3-(2x +3)]2+…+[2x n +3-(2x +3)]2=4[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=4ns 2.所以方差为4s 2.] 6.30解析 纤维长度小于20 mm 的频率约为 p =5×0.01+5×0.01+5×0.04=0.3, ∴100×0.30=30. 作业设计1.D [在这个问题中所要考察的对象是身高,另一方面,样本容量是指样本中的个体数目.]2.D [以年级为层,按各年级所占的比例进行抽样,为了使抽取的学生具有代表性,应在各年级进行随机抽样.]3.B [由40n=0.125,得n =320.]4.D [频率=频率组距×组距,由图易知:频率组距=0.001,组距=3 000-2 700=300,∴频率=0.001×300=0.3]5.B [去掉95和89后,剩下5个数据的平均值x =90+90+93+94+935=92,方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(94-92)2+(93-92)2]=2.8.]6.D [A 和B 符合函数关系,即对x 的每一个值,y 都有唯一确定的值与之对应;从C 、D 散点图来看,D 的散点都在某一条直线附近波动,因此两变量具有相关关系.] 7.76解析 由题意知:m =8,k =8,则m +k =16,也就是第8组的个位数字为6, 十位数字为8-1=7,故抽取的号码为76. 8.(1)0.2 (2)30 (3)0.016解析 (1)由频率组距×组距=频率,得频率为0.2;(2)频率为0.3,又由频数=频率×样本容量,得频数为30;(3)由频率组距=高,得小矩形的高是0.016.9.(6.5,8)解析 x =16(3+5+2+8+9+12)=6.5,y =16(4+6+3+9+12+14)=8.由a ^=y -b ^x 得y =b ^x +a ^,所以y =b ^x +a ^恒过(x ,y ),即过定点(6.5,8).10.解 x 甲=15(60+80+70+90+70)=74,x 乙=15(80+60+70+80+75)=73,s 2甲=15(142+62+42+162+42)=104,s 2乙=15(72+132+32+72+22)=56,∵x 甲>x 乙,s 2甲>s 2乙;∴甲的平均成绩较好,乙的各门功课发展较平衡. 11.解 (1)散点图如下.(2)由散点图可以看出样本点分布在一条直线的附近,可见y 与x 线性相关. i 1 2 3 4 5 6 x i 300 400 500 600 700 800 y i 40 50 55 60 67 70 x i y i 12 000 20 000 27 500 36 000 46 900 56 0002i x90 000 160 000 250 000 360 000 490 000 640 000x =550,y =57∑6i =1x2i =1 990 000,∑6i =1x i y i =198 400 b ^=∑6i =1x i y i -6x y∑6i =1x 2i -6x 2=198 400-6×550×571 990 000-6×5502≈0.058 86,a ^=y -b ^x =57-0.058 86×550=24.627. 因此所求的回归直线方程为y ^=0.058 86x +24.627.(4)将x =1 000代入回归方程得y =0.058 86×1 000+24.627=83.487, 即退水温度是1 000℃时, 黄酮延长性大约是83.487%.12.解 (1)各小组的频率之和为 1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05. ∴第二小组的频率为:1.00-(0.30+0.15+0.10+0.05)=0.40.∴落在59.5~69.5的第二小组的小长方形的高=频率组距=0.4010=0.04.则补全的直方图如图所示.(2)设九年级两个班参赛的学生人数为x 人. ∵第二小组的频数为40人,频率为0.40, ∴40x=0.40,解得x =100(人).所以九年级两个班参赛的学生人数为100人.(3)∵0.3×100=30,0.4×100=40,0.15×100=15,0.10×100=10,0.05×100=5, 即第一、第二、第三、第四、第五小组的频数分别为30,40,15,10,5,所以九年级两个班参赛学生的成绩的中位数应落在第二小组内.13.解 (1)在17个数据中,1.75出现了4次,次数最多,即众数是1.75;把成绩从小到大排列,中间一个数即第9个数据是1.70中的一个,即中位数是1.70;平均数x =117(1.50×2+1.60×3+…+1.90×1)≈1.69(m )因此,17名运动员成绩的众数、中位数、平均数依次为1.75 m ,1.70 m,1.69 m .(2)众数是1.75说明了跳1.75 m 的人数最多;中位数是1.70 m 说明了1.70 m 以下和1.70 m 以上的成绩个数相等;平均数是1.69 m 说明了所有参赛运动员平均成绩是1.69 m . 14.解 (1)用水量分组 频数 频率 [0.5,2.5) 12 0.12 [2.5,4.5) 24 0.24 [4.5,6.5) 40 0.40 [6.5,8.5) 18 0.18 [8.5,10.5] 6 0.06 合计 100 1(2)前两个矩形面积和为0.12+0.24,第三个矩形一半的面积为0.5-(0.12+0.24),则所求的中位数为:4.5+0.5-0.12+0.240.2=4.5+0.7=5.2.(3)该乡每户平均月均用水量估计为(1.5×12+3.5×24+5.5×40+7.5×18+9.5×6)/100=5.14. 上级支援该乡的月调水量应为5.14×1 200=6 168. 答 上级支援该乡的月调水量是6 168吨.。
第二章统计[自我校对]①随机数法②系统抽样③分层抽样④频率分布直方图⑤茎叶图⑥方差与标准差⑦散点图⑧回归方程体被抽到的机会相等,当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,多采用系统抽样;当已知总体由差异明显的几部分组成时,常采用分层抽样.其中简单随机抽样是最简单、最基本的抽样方法.在进行系统抽样和分层抽样时都要用到简单随机抽样.应用各种抽样方法抽样时要注意以下问题:(1)利用抽签法时要注意把号签放在不透明的容器中且搅拌均匀; (2)利用随机数法时注意编号位数要一致;(3)利用系统抽样时,若抽样间隔k =N n不是整数,应剔除部分个体;(4)在分层抽样中,若在某一层抽到的个体数不是整数,应在该层剔除部分个体,使抽取个体数为整数.某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250; ②5,9,100,107,111,121,180,195,200,265; ③11,38,65,92,119,146,173,200,227,254; ④30,57,84,111,138,165,192,219,246,270. 关于上述样本的下列结论中,正确的是( ) A .②③都不能为系统抽样 B .②④都不能为分层抽样 C .①④都可能为系统抽样 D .①③都可能为分层抽样【精彩点拨】 分层抽样时,在各层所抽取的样本个数与该层个体数的比值等于抽样比;系统抽样抽取的号码按从小到大排列后,每一个号码与前一个号码的差都等于分段间隔.【规范解答】 按分层抽样时,在一年级抽取108×10270=4(人),在二年级、三年级各抽取81×10270=3(人),则在号码段1,2,…,108中抽取4个号码,在号码段109,110,…,189中抽取3个号码,在号码段190,191,…,270中抽取3个号码,①②③符合,所以①②③可能是分层抽样,④不符合,所以④不可能是分层抽样;如果按系统抽样时,抽取出的号码应该是“等距”的,①③符合,②④不符合,所以①③都可能为系统抽样,②④都不能为系统抽样.【答案】 D [再练一题]1.①教育局督学组到校检查工作,临时需在每班各抽调两人参加座谈;②某班数学期中考试有15人在120分以上,40人在90~119分,1人不及格,现从中抽出8人研讨进一步改进教与学;③某班春节聚会,要产生两位“幸运者”.就这三件事,合适的抽样方法分别为( )A.分层抽样,分层抽样,简单随机抽样B.系统抽样,系统抽样,简单随机抽样C.分层抽样,简单随机抽样,简单随机抽样D.系统抽样,分层抽样,简单随机抽样【尝试解答】①每班各抽两人需用系统抽样.②由于学生分成了差异比较大的几层,应用分层抽样.③由于总体与样本容量较小,应用简单随机抽样.故选D.【答案】 D线图和茎叶图对总体情况作出估计.直方图能够很容易地表示大量数据,非常直观地表明分布的形状,使我们能够看到在分布表中看不清楚的数据模式,这样根据样本的频率分布,我们可以大致估计出总体的分布.但是,当总体的个体数较多时,所需抽样的样本容量也不能太小,随着样本容量的增加,频率分布折线图会越来越接近于一条光滑曲线,统计中称这条曲线为总体密度曲线,它能给我们提供更加精细的信息.在样本数据较少时,用茎叶图表示数据的效果较好,它不但可以保留原始信息,而且可以随时记录,这给数据的记录和表示都能带来方便.如下表所示给出了某校500名12岁男孩中用随机抽样得出的120人的身高资料.(单位:cm)(2)画出频率分布直方图;(3)估计身高低于134 cm的人数占总人数的百分比.【精彩点拨】(1)根据频数计算出频率.分“分组”、“频数”、“频率”三列,列出频率分布表.(2)根据频率分布表画出频率分布直方图.(3)根据频率分布表计算出身高低于134 cm的频率.【规范解答】(1)样本的频率分布表:(3)因为样本中身高低于134 cm 的人数的频率为5+8+10120=23120≈0.19,所以估计身高低于134 cm 的人数约占总人数的19%.[再练一题]2.为了了解某校高一学生的视力情况,随机地抽查了该校100名高一学生的视力情况,得到频率分布直方图如图21,由于不慎将部分数据丢失,但知道后5组频数和为62,视力在4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )图21A .64B .54C .48D .27【解析】 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11=1-0.78=0.22.∴a=(0.22+0.32)×100=54.【答案】 B中位数;另一类是反映样本数据的波动大小,包括样本方差及标准差.通常,在实际问题中,仅靠平均数不能完全反映问题还要研究方差,方差描述了数据相对平均数的离散程度,在平均数相同的情况下,方差越大,离散程度越大,数据波动性越大,稳定性越差;方差越小,数据越集中,质量越稳定.甲、乙两人数学成绩的茎叶图如图22所示:图22(1)求出这两名同学的数学成绩的平均数、标准差;(2)比较两名同学的成绩,谈谈你的看法.【精彩点拨】(1)利用茎叶图中的数据计算平均数、标准差.(2)从平均数和方差两方面比较两人的成绩.【解】x甲=110(65+70+80+86+89+95+91+94+107+113)=89.s2甲=110[(65-89)2+(70-89)2+(80-89)2+(86-89)2+(89-89)2+(95-89)2+(91-89)2+(94-89)2+(107-89)2+(113-89)2]=199.2,∴s甲≈14.1.x乙=110(79+86+83+88+93+99+98+98+102+114)=94.s2乙=110[(79-94)2+(86-94)2+(83-94)2+(88-94)2+(93-94)2+(99-94)2+(98-94)2+(98-94)2+(102-94)2+(114-94)2]=96.8.∴s乙≈9.8.∴x甲<x乙且s甲>s乙.∴乙同学的平均成绩较高且标准差较小;说明乙同学比甲同学的成绩扎实,稳定.[再练一题]3.对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:【解】 甲的平均成绩为x 甲=74,乙的平均成绩为x 乙=73.所以甲的平均成绩好. 甲的方差是s 2甲=15(142+62+42+162+42)=104,乙的方差是s 2乙=15×(72+132+32+72+22)=56.因为s 2甲>s 2乙,所以乙的各门功课发展较平衡.系,还可利用最小二乘法求出回归方程.从散点图上,我们可以分析出两个变量是否存在相关关系.如果这些点大致分布在通过散点图中心的一条直线附近,那么就说这两个变量之间具有线性相关关系,这条直线叫做回归直线,直线的方程叫做回归方程.求回归方程的步骤:(1)先把数据制成表,从表中计算出∑i =1nx i ,∑i =1ny i ,∑i =1nx 2i ,∑i =1nx i y i ;(2)计算回归系数a ^,b ^; (3)写出回归方程y ^=b ^x +a ^.下表数据是退水温度x (℃)对黄酮延长性y (%)效应的试验结果,y 是以延长性计算的,且对于给定的x ,y 为正态变量,其方差与x 无关.(1)(2)指出x ,y 是否线性相关;(3)若线性相关,求y 关于x 的回归方程;(4)估计退水温度是1 000 ℃时,黄酮延长性的情况.【精彩点拨】 先画出散点图,确定y 与x 之间是否线性相关,再根据求回归直线方程的步骤求出回归直线方程,最后根据回归方程确定黄酮延长性的情况.【规范解答】 (1)散点图如图:(2)由散点图可以看出样本点分布在一条直线的附近,可见y 与x 线性相关. (3)列出下表并用科学计算器进行有关计算.b ^=∑6i =1x i y i -6x -y -∑6i =1x 2i -6x 2=198 400-6×550×571 990 000-6×5502≈0.058 86, a ^=y -b ^x =57-0.058 86×550=24.627.因此所求的回归直线的方程为: y ^=0.058 86x +24.627.(4)将x =1 000代入回归方程得 y ^=0.058 86×1 000+24.627=83.487,即退水温度是1 000 ℃时, 黄酮延长性大约是83.487%. [再练一题]4.有人收集了春节期间平均气温x 与某取暖商品销售额y 的有关数据如下表:根据以上数据,用线性回归的方法,求得销售额y 与平均气温x 之间的线性回归方程y ^=b ^x +a ^的系数b ^=-2.4,则预测平均气温为-8℃时该商品的销售额为( )A .34.6万元B .35.6万元C .36.6万元D .37.6万元 【解析】 x =-+-+-+-4=-4,y =20+23+27+304=25,所以25=(-2.4)×(-4)+a . 所以a ^=15.4.所以回归直线方程为y ^=-2.4x +15.4.当x =-8时,y =34.6,即预测平均气温为-8℃时,该商品的销售额为34.6万元.故选A.【答案】 A图确定两个变量是否具有相关关系,并做出判断.统计图表(频率分布直方图、茎叶图)与数字特征(平均数、中位数、方差)是高考的重点和热点内容,几乎每年必考,通常以茎叶图和频率分布直方图为载体,考查平均数、中位数、方差等的计算,高考对变量间的相关性的考查呈逐年上升的趋势,主要考查借助散点图直观地分析两个变量间的相关关系,知道回归直线经过样本中心,会求回归方程,并能利用方程对有关变量作出估计.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00~10:00间各自的点击量,得如图23所示的茎叶图,根据茎叶图求:(1)甲、乙两个网站点击量的极差分别是多少? (2)甲网站点击量在[10,40]间的频率是多少?(3)观察茎叶图,估计甲、乙两个网站哪个更受欢迎,并说明理由.图23【精彩点拨】 茎叶图的比较可以观察茎叶图中反映的信息,通过极差可以粗略判断分散集中程度.【规范解答】 (1)根据茎叶图,得甲网站的点击量的最大值是73,最小值是8,乙网站的点击量的最大值是71,最小值是5,则甲网站的极差为73-8=65,乙网站的极差为71-5=66.(2)观察茎叶图,得甲网站点击量在[10,40]间的有20,24,25,38,共4个,所以甲网站点击量在[10,40]间的频率为414=27. (3)观察茎叶图,得甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.[再练一题]5.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图24所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则下列关系中正确的是________(填序号).①x 甲<x 乙,m 甲>m 乙; ②x 甲<x 乙,m 甲<m 乙; ③x 甲>x 乙,m 甲>m 乙; ④x 甲>x 乙,m 甲<m 乙.图24【解析】 由茎叶图m 甲=22+182=20,m 乙=27+312=29.∴m 甲<m 乙.x 甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516, x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=457.16∴x甲<x乙.【答案】②1.某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中25A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )图25A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个【解析】对于选项A,由图易知各月的平均最低气温都在0 ℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10 ℃,所以C正确;对于选项D,平均最高气温高于20 ℃的月份有七月、八月,共2个月份,故D错误.【答案】 D2.根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )图26A .逐年比较,2008年减少二氧化硫排放量的效果最显著B .2007年我国治理二氧化硫排放显现成效C .2006年以来我国二氧化硫年排放量呈减少趋势D .2006年以来我国二氧化硫年排放量与年份正相关 【解析】 依据给出的柱形图,逐项验证.对于A 选项,由图知从2007年到2008年二氧化硫排放量下降得最多,故A 正确.对于B 选项,由图知,由2006年到2007年矩形高度明显下降,因此B 正确.对于C 选项,由图知从2006年以后除2011年稍有上升外,其余年份都是逐年下降的,所以C 正确.由图知2006年以来我国二氧化硫年排放量与年份负相关,故选D.【答案】 D3.如图27是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.图27注:年份代码1~7分别对应年份2008~2014(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.附注:参考数据:∑7i =1y i =9.32,∑7i =1t i y i =40.17,∑7i =1y i -y2=0.55,7≈2.646.参考公式:相关系数r=∑ni =1 t i -ty i -y∑ni =1t i -t 2∑n i =1y i -y2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1t i -ty i -y∑ni =1t i -t2,a ^=y -b ^t .【解】 (1)由折线图中数据和附注中参考数据得t =4,∑7i =1(t i -t )2=28,∑7i =1y i -y2=0.55,∑7i =1(t i -t )(y i -y )=∑7i =1t i y i -t ∑7i =1y i =40.17-4×9.32=2.89,r ≈2.892×2.646×0.55≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当大,从而可以用线性回归模型拟合y 与t 的关系.(2)由y =9.327≈1.331及(1)得b ^=∑7i =1t i -ty i -y∑7i =1t i -t2=2.8928≈0.103, a ^=y -b ^t ≈1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t . 将2016年对应的t =9代入回归方程得y ^=0.92+0.10×9=1.82.所以预测2016年我国生活垃圾无害化处理量约为1.82亿吨.4.某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:图28记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数.(1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?【解】 (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700, 所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ).(2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000.若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.5.某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图图29①B 地区用户满意度评分的频数分布表满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图图29②【解】如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.6.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:t)和年利润z(单位:千元)的影响.对近8年的年宣传费x i和年销售量y i(i=1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.图210w i.∑表中w i=x i,w]=8i=1(1)根据散点图判断,y=a+bx与y=c+d x哪一个适宜作为年销售量y关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为β^=∑ni =1u i -uv i -v∑ni =1u i -u2,α^=v -β^u .【解】 (1)由散点图可以判断,y =c +d x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑i =18w i -wy i -y∑i =18w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w , 因此y 关于x 的回归方程为y ^=100.6+68x . (3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6, 年利润z 的预报值z ^=576.6×0.2-49=66.32. ②根据(2)的结果知,年利润z 的预报值 z ^=0.2(100.6+68x )-x =-x +13.6x +20.12.所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
第二章统计本章教材分析现代社会是信息化的社会,数字信息随处可见,因此专门研究如何收集、整理、分析数据的科学——统计学就备受重视.统计学是研究如何收集、整理、分析数据的科学,它可以为人们制定决策提供依据.在客观世界中,需要认识的现象无穷无尽.要认识某现象的第一步就是通过观察或试验取得观测资料,然后通过分析这些资料来认识此现象.如何取得有代表性的观测资料并能够正确地加以分析,是正确地认识未知现象的基础,也是统计所研究的基本问题.本章主要介绍最基本的获取样本数据的方法,以及几种从样本数据中提取信息的统计方法,其中包括用样本估计总体分布、数字特征和线性回归等内容.从义务教育阶段来看,统计知识的教学从小学到初中分为三个阶段,在每个阶段都要学习收集、整理、描述和分析数据等处理数据的基本方法,教学目标随着学段的升高逐渐提高.在义务教育阶段的统计与概率知识的基础上,《课程标准》要求通过实际问题及情境,进一步介绍随机抽样、样本估计总体、线性回归的基本方法,了解用样本估计总体及其特征的思想,体会统计思维与确定性思维的差异;通过实习作业,较为系统地经历数据收集与处理的全过程,进一步体会统计思维与确定性思维的差异.2.1.1 简单随机抽样整体设计教学分析教材是以探究一批小包装饼干的卫生是否达标为问题导向,逐步引入简单随机抽样概念.并通过实例介绍了两种简单随机抽样方法:抽签法和随机数法.值得注意的是为了使学生获得简单随机抽样的经验,教学中要注意增加学生实践的机会.例如,用抽签法决定班里参加某项活动的代表人选,用随机数法从全年级同学中抽取样本计算平均身高等等.三维目标1.能从现实生活或其他学科中推出具有一定价值的统计问题,提高学生分析问题的能力.2.理解随机抽样的必要性和重要性,提高学生学习数学的兴趣.3.学会用抽签法和随机数法抽取样本,培养学生的应用能力.重点难点教学重点:理解随机抽样的必要性和重要性,用抽签法和随机数法抽取样本.教学难点:抽签法和随机数法的实施步骤.课时安排1课时教学过程导入新课抽样的方法很多,某个抽样方法都有各自的优越性与局限性,针对不同的问题应当选择适当的抽样方法.教师点出课题:简单随机抽样.推进新课新知探究提出问题(1)在1936年美国总统选举前,一份颇有名气的杂志(Literary Digest)的工作人员做了一次民意测验.调查兰顿(ndon)(当时任堪萨斯州州长)和罗斯福(F.D.Roosevelt)(当时的总统)中谁将当选下一届总统.为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有).通过分析收回的调查表,显示兰顿非常受欢迎,于是此杂志预测兰顿将在选举中获胜.(2)假设你作为一名食品卫生工作人员,要对某食品店内的一批小包装饼干进行卫生达标检验,你准备怎样做?显然,你只能从中抽取一定数量的饼干作为检验的样本.那么,应当怎样获取样本呢?(3)请总结简单随机抽样的定义.讨论结果:(1)预测结果出错的原因是:在民意测验的过程中,即抽取样本时,抽取的样本不具有代表性.1936年拥有电话和汽车的美国人只是一小部分,那时大部分人还很穷.其调查的结果只是富人的意见,不能代表穷人的意见.由此可以看出,抽取样本时,要使抽取出的样本具有代表性,否则调查的结果与实际相差较大.(2)要对这批小包装饼干进行卫生达标检查,只能从中抽取一定数量的饼干作为检验的样本,用样本的卫生情况来估计这批饼干的卫生情况.如果对这批饼干全部检验,那么费时费力,等检查完了,这批饼干可能就超过保质期了,再就是会破坏这批饼干的质量,导致无法出售.获取样本的方法是:将这批小包装饼干,放入一个不透明的袋子中,搅拌均匀,然后不放回地摸取(这样可以保证每一袋饼干被抽到的可能性相等),这样就可以得到一个样本.通过检验样本来估计这批饼干的卫生情况.这种抽样方法称为简单随机抽样.(3)一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种:抽签法和随机数法.提出问题(1)抽签法是大家最熟悉的,也许同学们在做某种游戏,或者选派一部分人参加某项活动时就用过抽签法.例如,高一(2)班有45名学生,现要从中抽出8名学生去参加一个座谈会,每名学生的机会均等.我们可以把45名学生的学号写在小纸片上,揉成小球,放到一个不透明袋子中,充分搅拌后,再从中逐个抽出8个号签,从而抽出8名参加座谈会的学生.请归纳抽签法的定义.总结抽签法的步骤.(2)你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗?(3)随机数法是利用随机数表或随机骰子或计算机产生的随机数进行抽样.我们仅学习随机数表法即利用随机数表产生的随机数进行简单随机抽样的方法.怎样利用随机数表产生样本呢?下面通过例子来说明.假设我们要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验.利用随机数表抽取样本时,可以按照下面的步骤进行.第一步,先将800袋牛奶编号,可以编为000,001, (799)第二步,在随机数表中任选一个数.例如选出第8行第7列的数7(为了便于说明,下面摘取了附表1的第6行至第10行.)16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉.按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出.这样我们就得到一个容量为60的样本. 请归纳随机数表法的步骤.(4)当N=100时,分别以0,3,6为起点对总体编号,再利用随机数表抽取10个号码.你能说出从0开始对总体编号的好处吗?(5)请归纳随机数表法的优点和缺点.讨论结果:(1)一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.抽签法的步骤是:1°将总体中个体从1—N编号;2°将所有编号1—N写在形状、大小相同的号签上;3°将号签放在一个不透明的容器中,搅拌均匀;4°从容器中每次抽取一个号签,并记录其编号,连续抽取n次;5°从总体中将与抽取到的签的编号相一致的个体取出.(2)抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,如果标号的签搅拌得不均匀,会导致抽样不公平.因此说当总体中的个体数很多时,用抽签法不方便.这时用随机数法.(3)随机数表法的步骤:1°将总体中个体编号;2°在随机数表中任选一个数作为开始;3°规定从选定的数读取数字的方向;4°开始读取数字,若不在编号中,则跳过,若在编号中则取出,依次取下去,直到取满为止;5°根据选定的号码抽取样本.(4)从0开始编号时,号码是00,01,02,…,99;从3开始编号时,号码是003,004,…,102;从6开始编号时,号码是006,007,…,105.所以以3,6为起点对总体编号时,所编的号码是三位,而从0开始编号时,所编的号码是两位,在随机数表中读数时,读取两位比读取三位要省时,所以从0开始对总体编号较好.(5)综上所述可知,简单随机抽样有操作简便易行的优点,在总体个数不多的情况下是行之有效的.但是,如果总体中的个体数很多时,对个体编号的工作量太大,即使用随机数表法操作也并不方便快捷.另外,要想“搅拌均匀”也非常困难,这就容易导致样本的代表性差.应用示例例1 某车间工人加工一种轴共100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何采用简单随机抽样的方法抽取样本?分析:简单随机抽样有两种方法:抽签法和随机数表法,所以有两种思路.解法一(抽签法):①将100件轴编号为1,2, (100)②做好大小、形状相同的号签,分别写上这100个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④逐个抽取10个号签;⑤然后测量这10个号签对应的轴的直径的样本.解法二(随机数表法):①将100件轴编号为00,01,…99;②在随机数表中选定一个起始位置,如取第22行第1个数开始(见教材附录1:随机数表);③规定读数的方向,如向右读;④依次选取10个为68,34,30,13,70,55,74,77,40,44,则这10个号签相应的个体即为所要抽取的样本.点评:本题主要考查简单随机抽样的步骤.抽签法的关键是为了保证每个个体被抽到的可能性相等而必须搅拌均匀,当总体中的个体无差异,并且总体容量较小时,用抽签法;用随机数表法读数时,所编的号码是几位,读数时相应地取连续的几个数字,当总体中的个体无差异,并且总体容量较多时,用抽签法.变式训练1.下列抽样的方式属于简单随机抽样的有____________.(1)从无限多个个体中抽取50个个体作为样本.(2)从1 000个个体中一次性抽取50个个体作为样本.(3)将1 000个个体编号,把号签放在一个足够大的不透明的容器内搅拌均匀,从中逐个抽取50个个体作为样本.(4)箱子里共有100个零件,从中选出10个零件进行质量检验,在抽样操作中,从中任意取出一个零件进行质量检验后,再把它放回箱子.(5)福利彩票用摇奖机摇奖.解析:(1)中,很明显简单随机抽样是从有限多个个体中抽取,所以(1)不属于;(2)中,简单随机抽样是逐个抽取,不能是一次性抽取,所以(2)不属于;很明显(3)属于简单随机抽样;(4)中,抽样是放回抽样,但是简单随机抽样是不放回抽样,所以(4)不属于;很明显(5)属于简单随机抽样.答案:(3)(5)2.要从某厂生产的30台机器中随机抽取3台进行测试,写出用抽签法抽样样本的过程.分析:由于总体容量和样本容量都较小,所以用抽签法.解:抽签法,步骤:第一步,将30台机器编号,号码是01,02, (30)第二步,将号码分别写在一张纸条上,揉成团,制成号签.第三步,将得到的号签放入不透明的袋子中,并充分搅匀.第四步,从袋子中依次抽取3个号签,并记录上面的编号.第五步,所得号码对应的3台机器就是要抽取的样本.例 2 人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?解:简单随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始张,其他各张牌虽然是逐张起牌,但是各张在谁手里已被确定,所以不是简单随机抽样.点评:判断简单随机抽样时,要紧扣简单随机抽样的特征:逐个、不放回抽取且保证每个个体被抽到的可能性相等.变式训练现在有一种“够级”游戏,其用具为四副扑克,包括大小鬼(又称为花)在内共216张牌,参与人数为6人并坐成一圈.“够级”开始时,从这6人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌(这叫开牌),然后按逆时针方向,根据这张牌上的数字来确定谁先抓牌,这6人依次从216张牌中抓取36张牌,问这种抓牌方法是否是简单随机抽样?解:在这里只有抽取的第一张扑克牌是随机抽取的,其他215张牌已经确定,即这215张扑克牌被抽取的可能性与第一张扑克牌可能性不相同,所以不是简单随机抽样.知能训练1.为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是( )A.总体是240B.个体C.样本是40名学生D.样本容量是40答案:D2.为了了解所加工一批零件的长度,抽测了其中200个零件的长度,在这个问题中,200个零件的长度是( )A.总体B.个体C.总体的一个样本D.样本容量答案:C3.一个总体中共有200个个体,用简单随机抽样的方法从中抽取一个容量为20的样本,则某一特定个体被抽到的可能性是____________. 答案:101 4.为了检验某种产品的质量,决定从40件产品中抽取10件进行检查,如何用简单随机抽样抽取样本? 解:方法一(抽签法):①将这40件产品编号为1,2, (40)②做好大小、形状相同的号签,分别写上这40个号码;③将这些号签放在一个不透明的容器内,搅拌均匀;④连续抽取10个号签;⑤然后对这10个号签对应的产品检验.方法二(随机数表法):①将40件产品编号,可以编为00,01,02,…,38,39;②在随机数表中任选一个数作为开始,例如从第8行第9列的数5开始,;③从选定的数5开始向右读下去,得到一个两位数字号码59,由于59>39,将它去掉;继续向右读,得到16,将它取出;继续下去,又得到19,10,12,07,39,38,33,21,随后的两位数字号码是12,由于它在前面已经取出,将它去掉,再继续下去,得到34.至此,10个样本号码已经取满,于是,所要抽取的样本号码是16,19,10,12,07,39,38,33,21,34.拓展提升现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数法设计抽样方案?分析:重新编号,使每个号码的位数相同.解:方法一:第一步,将元件的编号调整为010,011,012,...,099,100, (600)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7个数“9”,向右读. 第三步,从数“9”开始,向右读,每次读取三位,凡不在010—600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263.第四步,以上这6个号码所对应的6个元件就是所要抽取的对象.方法二:第一步,将每个元件的编号加100,重新编号为110,111,112,...,199,200, (700)第二步,在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第8行第1个数“6”,向右读. 第三步,从数“6”开始,向右读,每次读取三位,凡不在110—700中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到630,163,567,199,507,175.第四步,这6个号码分别对应原来的530,63,467,99,407,75.这些号码对应的6个元件就是要抽取的对象.课堂小结1.简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法.2.抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点是当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较小的抽样类型.3.简单随机抽样每个个体入样的可能性都相等,均为Nn ,但是这里一定要将每个个体入样的可能性、第n 次每个个体入样的可能性、特定的个体在第n 次被抽到的可能性这三种情况区分开来,避免在解题中出现错误.作业课本本节练习2、3.设计感想本节教学设计以课程标准的要求为指导,重视引导学生参与到教学中,体现了学生的主体地位.同时,根据高考的要求,适当拓展了教材,做到了用教材,而不是教教材.整体设计教学分析教材通过探究“学生对教师教学的意见”过程,介绍了一种最简单的系统抽样——等距抽样,并给出实施等距抽样的步骤.值得注意的是在教学过程中,适当介绍当n N 不是整数时,应如何实施系统抽样. 三维目标1.理解系统抽样,会用系统抽样从总体中抽取样本,了解系统抽样在实际生活中的应用,提高学生学习数学的兴趣.2.通过自学课后“阅读与思考”,让学生进一步了解虚假广告是淡化总体和抽样方法、强化统计结果来夸大产品的有效性,以提高学生理论联系实际的能力.重点难点教学重点:实施系统抽样的步骤.教学难点:当nN 不是整数,如何实施系统抽样. 课时安排1课时教学过程导入新课思路1上一节我们学习了简单随机抽样,那么简单随机抽样的特点是什么?简单随机抽样是最简单和最基本的抽样方法,当总体中的个体较少时,常采用简单随机抽样.但是如果总体中的个体较多时,怎样抽取样本呢?教师点出课题:系统抽样.思路2某中学有5 000名学生,打算抽取200名学生,调查他们对奥运会的看法,采用简单随机抽样时,无论是抽签法还是随机数法,实施过程很复杂,需要大量的人力和物力,那么有没有更为方便可行的抽样方法呢?这就是今天我们学习的内容:系统抽样.推进新课新知探究提出问题(1)某学校为了了解高一年级学生对教师教学的意见,打算从高一年级500名学生中抽取50名进行调查,除了用简单随机抽样获取样本外,你能否设计其他抽取样本的方法?(2)请归纳系统抽样的定义和步骤.(3)系统抽样有什么特点?讨论结果:(1)可以将这500名学生随机编号1—500,分成50组,每组10人,第1组是1—10,第二组11—20,依次分下去,然后用简单随机抽样在第1组抽取1人,比如号码是2,然后每隔10个号抽取一个,得到2,12,22, (492)这样就得到一个容量为50的样本.这种抽样方法称为系统抽样.(2)一般地,要从容量为N 的总体中抽取容量为n 的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.其步骤是:1°采用随机抽样的方法将总体中的N 个个体编号;2°将整体按编号进行分段,确定分段间隔k(k ∈N ,l ≤k);3°在第1段用简单随机抽样确定起始个体的编号l (l ∈N ,l ≤k );4°按照一定的规则抽取样本.通常是将起始编号l 加上间隔k 得到第2个个体编号(l+k),再加上k 得到第3个个体编号(l+2k),这样继续下去,直到获取整个样本.说明:从系统抽样的步骤可以看出,系统抽样是把一个问题划分成若干部分分块解决,从而把复杂问题简单化,体现了数学转化思想.(3)系统抽样的特点是:1°当总体容量N 较大时,采用系统抽样;2°将总体分成均衡的若干部分指的是将总体分段,分段的间隔要求相等,因此,系统抽样又称等距抽样,这时间隔一般为k =[n N ]. 3°预先制定的规则指的是:在第1段内采用简单随机抽样确定一个起始编号,在此编号的基础上加上分段间隔的整倍数即为抽样编号.应用示例例1 为了了解参加某种知识竞赛的1 000名学生的成绩,应采用什么抽样方法较恰当?简述抽样过程. 解:适宜选用系统抽样,抽样过程如下:(1)随机地将这1 000名学生编号为1,2 ,3, (1000)(2)将总体按编号顺序均分成50部分,每部分包括20个个体.(3)在第一部分的个体编号1,2,3,…,20中,利用简单随机抽样抽取一个号码,比如18.(4)以18为起始号码,每间隔20抽取一个号码,这样得到一个容量为50的样本:18,38,58,…,978,998.点评:系统抽样与简单随机抽样一样,每个个体被抽到的概率都相等,从而说明系统抽样是等概率抽样,它是公平的.系统抽样是建立在简单随机抽样的基础之上的,当将总体均分后对每一部分进行抽样时,采用的是简单随机抽样.变式训练1.下列抽样不是系统抽样的是( )A.从标有1—15号的15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样B.工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验C.搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定的调查人数为止D.电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈分析:C 中,因为事先不知道总体,抽样方法不能保证每个个体按事先规定的概率入样,所以不是系统抽样. 答案:C2.某校高中三年级的295名学生已经编号为1,2,…,295,为了了解学生的学习情况,要按1∶5的比例抽取一个样本,用系统抽样的方法进行抽取,并写出过程.分析:按1∶5分段,每段5人,共分59段,每段抽取一人,关键是确定第1段的编号.解:抽样过程是:(1)按照1∶5的比例,应该抽取的样本容量为295÷5=59,我们把259名同学分成59组,每组5人,第一组是编号为1—5的5名学生,第2组是编号为6—10的5名学生,依次下去,59组是编号为291—295的5名学生;(2)采用简单随机抽样的方法,从第一组5名学生中抽出一名学生,不妨设编号为l(l ≤5);(3)按照一定的规则抽取样本.抽取的学生编号为l+5k(k=0,1,2,…,58),得到59个个体作为样本,如当k=3时的样本编号为3,8,13,…,288,293.例2 为了了解参加某种知识竞赛的1 003名学生的成绩,请用系统抽样抽取一个容量为50的样本. 分析:由于501003不是整数,所以先从总体中随机剔除3个个体. 步骤:(1)随机地将这1003个个体编号为1,2,3, (1003)(2)利用简单随机抽样,先从总体中剔除3个个体(可利用随机数表),剩下的个体数 1 000能被样本容量50整除,然后再重新编号为1,2,3, (1000)(3)确定分段间隔.501000=20,则将这1 000名学生分成50组,每组20人,第1组是1,2,3,...,20;第2组是21,22,23,...,40;依次下去,第50组是981,982, (1000)(4)在第1组用简单随机抽样确定第一个个体编号l(l ≤20).(5)按照一定的规则抽取样本.抽取的学生编号为l+20k (k=0,1,2,...,19),得到50个个体作为样本,如当k=2时的样本编号为2,22,42, (982)点评:如果遇到nN 不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.变式训练1.某校高中三年级有1 242名学生,为了了解他们的身体状况,准备按1∶40的比例抽取一个样本,那么( )A.剔除指定的4名学生B.剔除指定的2名学生C.随机剔除4名学生D.随机剔除2名学生分析:为了保证每名学生被抽到的可能性相等,必须是随机剔除学生,由于401242的余数是2,所以要剔除2名学生.答案:D2.从2 005个编号中抽取20个号码,采用系统抽样的方法,则抽样的分段间隔为( )A.99B.99.5C.100D.100.5答案:C例3 从已编号为1—50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( )A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32分析:用系统抽样的方法抽取到的导弹编号应该为k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k 是1到10中用简单随机抽样方法得到的数,因此只有选项B 满足要求.答案:B点评:利用系统抽样抽取的样本的个体编号按从小到大的顺序排起来,从第2个号码开始,每一个号码与前一个号码的差都等于同一个常数,这个常数就是分段间隔.变式训练某小礼堂有25排座位,每排20个座位,一次心理学讲座,礼堂中坐满了学生,会后为了了解有关情况,留下座位号是15的所有25名学生进行测试,这里运用的是_________抽样方法.答案:系统知能训练1.从学号为0—50的高一某班50名学生中随机选取5名同学参加数学竞赛,采用系统抽样的方法,则所选5名学生的学号不可能是( )A.1,2,3,4,5B.5,15,25,35,45C.2, 12, 22, 32, 42D.9,19,29,39,49答案:A2.采用系统抽样从个体数为83的总体中抽取一个样本容量为10的样本,那么每个个体入样的可能性为( ) A.831 B.801 C.101 D.不相等 答案:A3.某单位的在岗工人为624人,为了调查工作上班时从家到单位的路上平均所用的时间,决定抽取10%的工人调查这一情况,如何采用系统抽样的方法完成这一抽样?答案:先随机剔除4人,再按系统抽样抽取样本.4.某学校有学生3 000人,现在要抽取100人组成夏令营,怎样抽取样本?分析:由于总体人数较多,且无差异,所以按系统抽样的步骤来进行抽样.解:按系统抽样抽取样本,其步骤是:①将3 000名学生随机编号1,2, (3000)②确定分段间隔k =1003000=30,将整体按编号进行分100组,第1组1—30,第2组31—60,依次分下去,第100组2971—3000;③在第1段用简单随机抽样确定起始个体的编号l (l ∈N ,0≤l ≤30);④按照一定的规则抽取样本,通常是将起始编号l 加上间隔30得到第2个个体编号l+30,再加上30,得到第3个个体编号l+60,这样继续下去,直到获取整个样本.比如l =15,则抽取的编号为:15,45,75, (2985)这些号码对应的学生组成样本.拓展提升将参加数学竞赛的1 000名学生编号如下000,001,002,…,999,打算从中抽取一个容量为50的样本,按系统抽样方法分成50个部分,第一组编号为000,002,…,019,如果在第一组随机抽取的一个号码为015,则抽取的第40个号码为_____________.分析:利用系统抽样抽取样本,在第一组抽取号码为l =015,分段间隔为k =501000=20,则在第i 组中抽取的号码为015+20(i -1).则抽取的第40个号码为015+(40-1)×20=795.。
数学知识点人教A版高中数学必修三第二章《统计》word复习课学案 ----bb47f3ee-6eb3-11ec-9ee6-7cb59b590d7d数学知识点人教a版高中数学必修三第二章《统计》word复习课学案-初中数学、数学课件、数学综合习题、数学教案、数学试卷四川省岳池县第一中学高中数学必修三学案:第二章:统计复习课学习目标1能够运用随机抽样的基本方法和样本估计的思想来解决一些简单的问题;2.能通过对数据的分析,为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异.学习过程一.本章的知识结构二、知识梳理本章知识共分为三部分:1.随机抽样:三种方法——简单随机抽样、系统抽样和分层抽样2.用样本估计总体:两种方法------用样本的频率a:分布估计总体分布、用样本的数字特征估计总体的数字特征.① 用样本的频率分布估计总体分布:频率分布直方图的特征.画茎叶图的步骤.②用样本的数字特征估计总体的数字特征:频率分布直方图用于估计模式、中值和平均值b:标准偏差3.变量间的相关关系:①变量之间的相关关系:a、确定性的函数关系.b、随机变量之间的相关性② 两个变量的线性相关:a.散点图的概念b、正相关与负相关的概念.c、线性相关关系.d、线性回归方程.※典型例题1.在一张获奖明信片的10万个中奖号码(编号00000-99999)中,邮政部门应随机抽取抽取的方式确定后两位是23的作为中奖号码,这是运用了________抽样方法.2.一个单位有500名员工,其中35岁以下125人,35至49岁之间280人,50岁以上95人。
为了了解与本单位员工身体状况有关的某一指标,应采取100人的抽样方法3.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取1个容量为100户的样本,记做①;某学校高一年级有12初中数学、数学课件、数学综合习题、数学教案、试卷、初中数学、数学课件、数学综合习题、数学教案、试卷。
【优化方案】2016年高中数学 第二章 统计 章末综合检测学案 新人教A 版必修3(时间:100分钟,满分:120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法错误的是( )A .在统计里,最常用的简单随机抽样方法有抽签法和随机数法B .一组数据的平均数一定大于这组数据中的每个数据C .平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D .一组数据的方差越大,说明这组数据的波动越大 解析:选B.平均数不大于最大值,不小于最小值.2.已知某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩.现抽取农田480亩估计全乡农田粮食平均亩产量,则采用________抽样比较合适.( )A .抽签法B .随机数表法C .系统抽样法D .分层抽样法解析:选D.该乡农田由差异明显的四种类型组成,应采用分层抽样法.故选D.3.有一个容量为80的样本,数据的最大值是140,最小值是51,组距为10,则可以分为( )A .10组B .9组C .8组D .7组解析:选B.据题意:最大值与最小值的差为89,8910=8.9,故应分9组较合适.4.某学校有老师200人,男学生1 200人,女学生1 000人,现用分层抽样的方法从全体师生中抽取一个容量为n 的样本,已知女学生一共抽取了80人,则n 的值是( )A .193B .192C .191D .190解析:选B. 1 000×n 200+1 200+1 000=80,解得n =192.5.某班学生父母年龄的茎叶图如图,左边是父亲年龄,右边是母亲年龄,则该班同学父亲的平均年龄比母亲的平均年龄大( )A .2.7岁B .3.1岁C .3.2岁D .4岁解析:选C.分别求出父亲年龄和母亲年龄的平均值,可得父亲的平均年龄比母亲的平均年龄大3.2岁,故选C.6.在某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ) A .92,2 B .92,2.8 C .93,2 D .93,2.8解析:选B.去掉最高分95,最低分89,所剩数据的平均值为15(90×2+93×2+94)=92,方差s 2=15[(90-92)2×2+(93-92)2×2+(94-92)2]=2.8.7得到的回归方程为y ^=bx +a ,则( ) A .a >0,b >0 B .a >0,b <0 C .a <0,b >0D .a <0,b <0解析:选B.作出散点图如下:观察图象可知,回归直线y ^=bx +a 的斜率b <0,当x =0时,y ^=a >0.故a >0,b <0. 8.小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2 A .1%B .2%C .3%D .5%解析:选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%,故选C.9.某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是( )A .高一的中位数大,高二的平均数大B .高一的平均数大,高二的中位数大C .高一的平均数、中位数都大D .高二的平均数、中位数都大解析:选A.由茎叶图可以看出,高一的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为6477,所以高二的平均数大.故选A.10.(2014·高考山东卷)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析:选C.志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.二、填空题(本大题共5小题,每小题4分,共20分.把答案填在题中的横线上)11.(2014·高考天津卷)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4∶5∶5∶6,则应从一年级本科生中抽取________名学生.解析:根据题意,应从一年级本科生中抽取的人数为44+5+5+6×300=60.答案:6012.(2015·广州调研)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的数字特征(众数、中位数、平均数、方差)对应相同的是________.解析:由s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],可知B 样本数据每个变量增加2,平均数也增加了,但s 2不变,故方差不变.答案:方差13.某校开展“爱我济宁,爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示,记分员去掉一个最高分和一个最低分后,算得平均分为91分,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是________.解析:最低分为88,最高分若为90+x ,则计算平均分x -=6407≠91,所以最高分应为94,则有91×7-(89×2+92×2+93+91)=91,∴x =1.答案:114.已知回归方程y =4.4x +838.19,则可估计x 与y 的增长速度之比约为________.解析:x 与y 的增长速度之比应是回归方程斜率的倒数,即522.答案:52215.某校从参加高一年级期中考试的学生中随机抽取60名学生,将其数学成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的部分频率分布直方图.在统计方法中,同一组数据常用该组区间的中点值作为代表,观察图形的信息,据此估计本次考试的平均分为________.解析:在频率分布直方图中,所有小长方形的面积和为1,设[70,80)的小长方形面积为x ,则(0.01+0.015×2+0.025+0.005)×10+x =1, 解得x =0.3,即该组频率为0.3,所以本次考试的平均分为45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71.答案:71三、解答题(本大题共5小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)16.(本小题满分8分)有以下三个案例: 案例一:从同一批次同类型号的10袋牛奶中抽取3袋检测其三聚氰胺含量;案例二:某公司有员工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.从中抽取容量为40的样本,了解该公司职工收入情况;案例三:从某校1 000名高一学生中抽取10人参加一项主题为“学雷锋,树新风”的志愿者活动.(1)你认为这些案例应采用怎样的抽样方式较为合适? (2)在你使用的分层抽样案例中写出抽样过程;(3)在你使用的系统抽样案例中按以下规定取得样本编号:如果在起始组中随机抽取的号码为L(编号从0开始),那么第K 组(组号K 从0开始,K =0,1,2,…,9)抽取的号码的百位数为组号,后两位数为L +31K 的后两位数.若L =18,试求出K =3及K =8时所抽取的样本编号.解:(1)案例一用简单随机抽样,案例二用分层抽样,案例三用系统抽样. (2)①分层,将总体分为高级职称、中级职称、初级职称及其余人员四层;②确定抽样比例k =40800=120;③按上述比例确定各层样本数分别为8人、16人、10人、6人; ④按简单随机抽样方式在各层确定相应的样本; ⑤汇总构成一个容量为40的样本.(3)K =3时,L +31K =18+31×3=111,故第三组样本编号为311.K =8时,L +31K =18+31×8=266,故第8组样本编号为866.17.(本小题满分8分)某制造商为运动会生产一批直径为40 mm 的乒乓球,现随机抽样检查20只,测得每只球的直径(单位:mm ,保留两位小数)如下:40.02 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96(1)(2)假定乒乓球的直径误差不超过0.02 mm 为合格品,若这批乒乓球的总数为10 000只,试根据抽样检查结果估计这批产品的合格只数.解:(1)(2)∵抽样的20只产品中在[39.98,40.02]范围内有18只, ∴合格率为1820×100%=90%,∴10 000×90%=9 000(只).即根据抽样检查结果,可以估计这批产品的合格只数为9 000.18.(本小题满分10分)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:82 81 79 78 95 88 93 84 乙:92 95 80 75 83 80 90 85 (1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.解:(1)作出茎叶图如下:(2)x -甲=18(78+79+81+82+84+88+93+95)=85,x -乙=18(75+80+80+83+85+90+92+95)=85.s 2甲=18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85)2+(95-85)2]=35.5,s 2乙=18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41.∵x -甲=x -乙,s 2甲<s 2乙,∴甲的成绩较稳定,派甲参赛比较合适.19.(本小题满分12分)有5名学生的数学和化学成绩如下表所示:(1)如果y 与x (2)预测如果某学生数学成绩为79分,他的化学成绩为多少(结果保留整数)?20.(本小题满分12分)(2015·河南三市调研)PM 2.5是指环境空气中直径小于等于25微米的颗粒物,对人体健康及环境影响很大.某市2014年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表; (2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价. 解:(1)频率分布表:(2)频率分布直方图:(3)答对下述两条中的一条即可:(ⅰ)该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.(ⅱ)轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.。