2018年高考文科数学分类之统计与概率
- 格式:doc
- 大小:793.00 KB
- 文档页数:7
专题11 概率与统计(六)统计1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(七)概率1.事件与概率(1)了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.(2)了解两个互斥事件的概率加法公式.2.古典概型(1)理解古典概型及其概率计算公式.(2)会用列举法计算一些随机事件所含的基本事件数及事件发生的概率.3.随机数与几何概型(1)了解随机数的意义,能运用模拟方法估计概率.(2)了解几何概型的意义.(十七)统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.1.独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.2.回归分析了解回归分析的基本思想、方法及其简单应用.对于统计的考查:1.从考查题型来看,选择题、填空题与解答题并重,并各有侧重,选择题、填空题中以考查抽样方法和用样本估计总体为主,兼顾两个变量的线性相关;解答题中则重点考查求回归直线方程及独立性检验. 2.从考查内容来看,主要考查抽样方法的选择,利用频率分布直方图、茎叶图等图表分析众数、中位数、平均数等数字特征,两个变量之间的线性相关等.3.从考查热点来看,用样本估计总体是高考命题的热点,频率分布直方图、茎叶图、众数、中位数、平均数等是考查的重点,要能够对数据进行分析,然后对总体作简单、准确的评价.对于概率的考查:1.从考查题型来看,涉及本专题的题目若在选择题、填空题中出现,则主要考查古典概型和几何概型概率的计算;若在解答题中出现,则主要考查古典概型概率的计算.2.从考查内容来看,主要考查在古典概型或几何概型下求随机事件的概率,通过互斥事件、对立事件考查等可能性事件的概率取值问题,体现了概率问题的实际应用状况.3.从考查热点来看,概率求值是高考命题的热点,以古典概型或几何概型为主线,考查随机事件的概率.解答题中常与统计知识相结合考查概率的求解,需注意知识的灵活运用.考向一三种抽样方法样题1 《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出 钱(所得结果四舍五入,保留整数). 【答案】17【解析】本题主要考查分层抽样法.设丙应出x 钱,由题意可得100560350180180x=++,求解可得100180171090x ⨯=≈钱.考向二 样本的数字特征样题2 (2017新课标全国Ⅰ文科)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值 D .x 1,x 2,…,x n 的中位数【答案】B考向三 频率分布直方图的应用样题3 (2017新课标全国Ⅱ文科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ), 其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:(22()()()()()n ad bc K a b c d a c b d -=++++.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1. (2)频率分布直方图中均值等于组中值与对应概率乘积的和. (3)均值大小代表水平高低,方差大小代表稳定性.考向四 线性回归方程及其应用样题4 为了解某公司员工的年收入和年支出的关系,随机调查了5名员工,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆ0.65b =入为15万元时支出为 A .9.05万元 B .9.25万元 C .9.75万元 D .10.25万元【答案】B考向五 概率的求解样题5 (2017新课标全国Ⅰ文科)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14 B .π8C .12D .π 4【答案】B样题6 如图,茎叶图表示的是甲,乙两人在5次综合测评中的成绩,其中一个数字被污染,则甲的平均成绩超过乙的平均成绩的概率为A .12 B .35 C .45D .710【答案】C【解析】由茎叶图可知,甲的平均成绩8889909192905++++=,乙的平均成绩为即352+450,x <得到98x <,又因为90x ≥,且x 是整数,故基本事件为从90到99,共10个, 而满足条件的为90到97,共8个,C . 考向六 独立性检验样题7 某校为了让高一学生更有效率地利用周六的时间,在高一新生第一次摸底考试后采取周六到校自主学习,同时由班主任老师值班,家长轮流值班.一个月后进行了第一次月考,高一数学教研组通过系统抽样抽取了名学生,并统计了他们这两次数学考试的优良人数和非优良人数,其中部分统计数据如下:(1)请画出这次调查得到的列联表,并判定能否在犯错误的概率不超过的前提下认为周六到校自习对提高学生成绩有效?(2)从这组学生摸底考试数学优良成绩中和第一次月考数学非优良成绩中,按分层抽样随机抽取个成绩,再从这个成绩中随机抽取个,求这个成绩来自同一次考试的概率.下面是临界值表供参考:(参考公式:()()()()()22n ad bcΚa b c d a c b d-=++++,其中【解析】(1列联表如下:计算得的观测值为80010.8287k=>,因此能在犯错误的概率不超过的前提下,认为周六到校自习对提高学生成绩有效.。
《2018年高考数学分类汇编》第十篇:计数原理、统计、概率一、选择题1.【2018全国一卷3】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例 建设后经济收入构成比例则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.【2018全国一卷10】下图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I ,II ,III 的概率分别记为p 1,p 2,p 3,则 A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 33.【2018全国二卷8】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .B .C .D .4.【2018全国三卷5】的展开式中的系数为30723=+112114115118522x x ⎛⎫+ ⎪⎝⎭4xA .10B .20C .40D .805.【2018全国三卷8】某群体中的每位成员使用移动支付的概率都为,各成员的支付方式相互独立,设为该群体的10位成员中使用移动支付的人数,,,则A .0.7B .0.6C .0.4D .0.36.【2018浙江卷7】设0<p <1,随机变量ξ的分布列是则当p 在(0,1)内增大时, A .D (ξ)减小B .D (ξ)增大C .D (ξ)先减小后增大D .D (ξ)先增大后减小二、填空题1.【2018全国一卷15】从2位女生,4位男生中选3人参加科技比赛,且至少有1位女生入选,则不同的选法共有_____________种.(用数字填写答案)2.【2018天津卷10】在5(x -的展开式中,2x 的系数为 .3.【2018江苏卷3.】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .4.【2018江苏卷6】某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为 .5.【2018浙江卷14】二项式81)2x的展开式的常数项是___________. p X 2.4DX =()()46P X P X =<=p =6.【2018浙江卷16】16.从1,3,5,7,9中任取2个数字,从0,2,4,6中任取2个数字,一共可以组成___________个没有重复数字的四位数.(用数字作答)7.【2018上海卷3】在7)1(x +的二项展开式中,2x 项的系数为 .(结果用数值表示) 8.【2018上海卷9】9.有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是______(结果用最简分数表示) 三、解答题1.【2018全国一卷20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为)10(<<p p ,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p .(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?2.【2018全国二卷18】下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:. y y t t 1217,,…,ˆ30.413.5y t =-+t 127,,…,ˆ9917.5yt =+(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.3.【2018全国三卷18】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人。
第十三章概率与统计本章知识结构图第一节 概率及其计算考纲解读1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3.掌握古典概型及其概率计算公式。
4.了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义。
命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。
知识点精讲一、必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件。
二、概率在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。
对于必然事件A ,;对于不可能事件A ,=0.三、基本事件和基本事件空间在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。
四、两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为Aμ.()P A =AμμΩ。
五、互斥事件的概率1、互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A 与事件B 互斥,则()()()P A B P A P B =+ 。
2、对立事件事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。
()()1P A p A =- 。
3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。
第二节 统计与概率综合及统计案例题型138 抽样方式2013年1.(2013江西文5)总体有编号为01,02,,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ).A .08B .07C .02D .012.(2013湖南文3) 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件, 60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为的样本进行调查,其中从丙车间的产品中抽取了件,则n =( ).A. B.10 C.12 D.132014年 1.(2014四川文2)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是( ).A.总体B.个体C.样本的容量D.从总体中抽取的一个样本2.(2014重庆文3)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为的样本,已知从高中生中抽取70人,则n =( ). A.100B.150C.200D.2503.(2014广东文6)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ).A.50B.40C.25D.20 4.(2014湖南文3)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( ).A.123p p p =<B. 231p p p =<C.132p p p =<D.123p p p == 5.(2014湖北文11)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测. 若样本中有50件产品由甲设备生产,则乙设备生产的产品总 数为件.6.(2014天津文9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取名学生.2015年1.(2015四川文3)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是().A. 抽签法B. 系统抽样法C. 分层抽样法D. 随机数法1.解析按照各种抽样方法的适用范围可知,应使用分层抽样.故选C.2.(2015福建文13)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______.2.解析由题意得抽样比例为45190020=,故应抽取的男生人数为15002520⨯=(人).3.(2015北京文4)某校老年,中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体情况,在抽取的样本中,青年教师有320人,则该样本的老年人数为().A.90B. 100C. 180D.3003.解析依题意,老年教师人数为900320180160043004300⨯=(人).故选C.2017年1.(2017江苏卷3)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.1.解析按照分层抽样的概念应从丙种型号的产品中抽取60300181000⨯=(件).20330443454365577783210题型139 样本分析——用样本估计总体2013年1. (2013四川文7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据茎 叶图如图所示.以组距为将数据分组成[)[)[)[)0551030353540,,,,,,,,时,所作的频率分布直方图是( ).A.B.C . D.2. (2013山东文10)将某选手的个得分去掉个最高分,去掉一个最低分,个剩余分数的平均分为91.现场作的个分数的茎叶图后来有个数据模糊,无法辨认,在图中以表示:则个剩余分数的方差为( )A.11616 B.367 C.36D. 3.(2013辽宁文5) 某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[)[)[)[)20404060608080100,,,,,,,.若低于60分的人数是15人,则该班的学生人数是( ).A. 45B. 508779401091x/分C. 55D. 604.(2013江苏则成绩较为稳定(方差较小)的那位运动员成绩的方差为5.(2013湖北文12)某学员在一次射击测试中射靶10次,命中环数如下:7879,,,,5491074,,,,,,则(1)平均命中环数为; (2)命中环数的标准差为.6. (2013辽宁文16)为了考察某校各班参加课外书法小组的人数,在全校随机抽取个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为,样本方差为,且样本数据互不 相同,则样本数据中的最大值为.2014年1.(2014陕西文9)某公司10位员工的月工资(单位:元)为1210,,x x x ,其均值和方差分别为和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ).A.,22100s +B.100x +,22100s +C.,2sD. +100,2s2.(2014山东文8)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[)[)[)[)[]12,13,13,14,14,15,15,16,16,17,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有人,则第三组中有疗效的人数为( ).A. B. C. 12 3.(2014江苏6位:cm ),所得数据均在区间[]80130,上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm .kPa(加上原点处数字0)4.(2014新课标Ⅰ文18)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如图所示频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? 5.(2014北京文18)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:100 90 80 110 /cmO75 85 95 105(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).6. (2014新课标Ⅱ文19)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.7.(2014(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.2015年1.(2015重庆文4)重庆市2013年各月的平均气温(C)数据的茎叶图如下:0 8 91 2 5 82 0 03 3 8 3 1 2则这组数据的中位数是( ).A. 19B.20C. 21.5D. 23 1. 解析 将茎叶图各数据从小到大排列,中位数为2020202+=.故选B . 2.(2015湖南文2) 在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.13 0 0 3 4 5 6 6 8 8 8 914 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15 0 1 2 2 3 3 3若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间[]139,151上的运动员人数是( ).A. 3B. 4C. 5D. 62. 解析 由茎叶图可知,在区间]151,139[的人数为20,再由系统抽样的性质可知人数为435720=⨯人.故选B. 3.(2015湖北文2) 我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( ).A .134石B .169石C .338石D .1365石 3.解析 设一石米中有粒谷,这批米内夹谷石,则281534254x n n ⋅=⋅,得153428169254x ⨯=≈.故选B.4.(2015山东文6)为比较甲、乙两地某月14时的气温状况,随机选取该月中的天,将这天中14时的气温数据(单位:℃)制成如图所示的茎叶图. 考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ). A. ①③B. ①④C. ②③D. ②④4.解析 由茎叶图可知,甲的数据为26,28,29,31,31;乙的数据为28,29,30,31,32. 所以()12628293131295x =⨯++++=甲,()12829+303132305x =⨯+++=乙. 所以x x <甲乙,①正确; 又()()()()()2222221182629282929293129312955s ⎡⎤=-+-+-+-+-=⎣⎦甲; ()()()()()22222212830293030303130323025s ⎡⎤=-+-+-+-+-=⎣⎦乙. 可得22s s >甲乙,所以s s >甲乙.④正确.故选B.5.(2015广东文12) 已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为.5.解析 因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,又样本数据121x +,221x +,⋅⋅⋅,21n x +的和为()122n x x x n ++++,所以样本数据的均值为21x +=11.评注本题考查均值的性质.6.(2015湖北文14)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.30.9],内,其频率分布直方图如图所示. (1)直方图中的=.(2)在这些购物者中,消费金额在区间[0.50.9],内的购物者的人数为./万元a6. 解析 由频率分布直方图及频率和等于,可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=,解之得3a =.于是消费金额在区间[]0.50.9,内频率为0.20.10.80.120.130.10.6⨯+⨯+⨯+⨯=, 所以消费金额在区间[]0.50.9,内的购物者的人数为0.6100006000⨯=.7.(2015广东文17)某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示./度(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[)220,240的用户中应抽取多少户? 7.解析()1由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 得0.0075x =.(2)由图可知,月平均用电量的众数是2202402302+=. 因为()0.0020.00950.011200.450.5++⨯=<, 又()0.0020.00950.0110.0125200.70.5+++⨯=>,所以月平均用电量的中位数在[)220,240内.设中位数为,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=, 得224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=(户); 月平均用电量为[)240,260的用户有0.00752010015⨯⨯=(户); 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=(户); 月平均用电量为[]280,300的用户有0.0025201005⨯⨯=(户). 抽取比例为11125151055=+++,所以从月平均用电量在[)220,240的用户中应抽取12555⨯=(户).2016年1.(2016山东文3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.,样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30] .根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ). A.56 B.60 C.120 D.1401. D 解析 由图可知组距为2.5,每周的自习时间少于22.5小时的频率为0.30=2.5×)0.1+0.02(,所以,每周自习时间不少于22.5小时的人数是140=0.301×200)(-人.故选D.2.(2016上海文4)某次体检,位同学的身高(单位:m )分别为1.72,1.78,1.80,1.69,1.76,则这组数据的中位数是(m ).2.1.76解析 将数据从小到大排序1.69,1.72,1.76,1.78,1.80,故中位数为1.76.3.(2016江苏4)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.3. 0.1解析由题意得 5.1x =,故()22222210.40.300.30.40.15s=++++=./小时17.54.(2016四川文16)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[)00.50.5,1⋅⋅⋅,,,[]4,4.5分成组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于吨的人数.请说明理由;(3)估计居民月均用水量的中位数.4.解析 ()由频率分布直方图,可知:月用水量在[]0,05.的频率为0.080.5=0.04.⨯ 同理,在[)(][)[)[)[)0.5,1 1.5,222.53,3.5 3.5,44,4.5,,,,,,等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由()10.04+0.08+0.21+0.25+0.06+0.04+0.020=0.5+0.5a a -⨯⨯,解得0.30.a =(2)由(1)得,100位居民月均水量不低于吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于吨的人数为3000000.13=36000.⨯(3)设中位数为x 吨.因为前组的频率之和为0.040.080.15+0.21+0.250.730.5++=>, 而前4组的频率之和为0.040.080.150.210.480.5+++=<,所以2 2.5.x <… 由()0.5020.50.48x ⨯-=-,解得 2.04.x =故可估计居民月均用水量的中位数为2.04吨.5.(2016北京文17)某市民用水拟实行阶梯水价,每人用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图: (1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w =时,估计该市居民该月的人均水费.5. 解析 (1)由用水量的频率分布直方图知,该市居民该月用水量在区间[](](](](]0.5,1,1,1.5,1.5,2,2,2.5,2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15. 所以该月用水量不超过立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w 至少定为.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表40.160.1580.2100.25120.15170.05220.05270.05⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=10.5用水量(立方米)(元).2017年1.(2017全国1文2)为评估一种农作物的种植效果,选了块地作试验田.这块地的亩产量(单位:kg )分别为12n x x x ⋯,,,,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ).A .12n x x x ⋯,,,的平均数 B .12n x x x ⋯,,,的标准差 C .12n x x x ⋯,,,的最大值 D .12n x x x ⋯,,,的中位数 1. 解析 刻画评估这种农作物亩产量稳定程度的指标是标准差.故选B. 2.(2017山东卷文8)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件). 若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( ).A. 3,5B. 5,5C. 3,7D. 5,72. 解析 由于甲组中位数为65,故5y =,计算得乙组平均数为66,故3x =.故选A.题型140 统计图表与概率的综合2013年1. (2013陕西文5)对一批产品的长度(单位: 毫米)进行抽样检测,下图为检测结果的频率分布直方图. 根据标准,产品长度在区间[)2025,上为一等品, 在区间[)1520,和区间[)2530,上为二等品, 在区间[)1015,和[]3035,上为三等品. 用频率估计概率, 现从该批产品中随机抽取一件, 则其为二等品的概率为( ).毫米O0.060.040.02A. 0.09B. 0.20C. 0.25D. 0.452. (2013重庆文6) 下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[)2230, 内的概率为( ).A. 0.2B. 0.4C. 0.5D. 0.6开始结束3. (2013安徽文17)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30 名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:甲 乙 (1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格); (2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为12x x ,,估计12x x -的值. 4.(2013广东文17)从一批苹果中,随机抽取50个,其重量(单位:克)的频数分布表如下:(1) 根据频数分布表计算苹果的重量在[90,95)的频率;(2) 用分层抽样的方法从重量在[)80,85和[)95,100的苹果中共抽取4个,其中重量在[)80,85的有几个?(3)在(2)中抽出的个苹果中,任取个,求重量在[)80,85和[)95,100中各有的概率.5. (2013四川文1812324,,,,这24个整数中都可能随机产生.(1)分别求出按程序框图正确编程运行时输出y 的值为的 概率()123i P i =,,; (2)甲、乙两同学依据自己对程序框图的理解,各自编写程序 重复运行次后,统计记录了输出y 的值为()123i i =,,的频数 以下是甲、乙所作频数统计表的部分数据.甲的频数统计表(部分) 乙的频数统计表(部分)当2100n =时,根据表中的数据,分别写出甲、乙所编程序各自输出y 的值为(123)i i =,,的频率(用分数表示),并判断两位同学中哪一位所编写程序符合算法要求的可能性较大.6. (2013湖南文18)某人在如图所示的直角边长为米的三角形地块的每个格点(指纵、横直线的交叉点以及三角形的顶点)处都种了一株相同品种的作物.根据历年的种植经验,一株该种作物的年收获量Y (单位:kg )与它的“相近”作物株数X 之间的关系如下表所示:这里,两株作物“相近”是指它们之间的直线距离不超过米.(1(2)在所种作物中随机选取一株,求它的年收获量至少为48kg 的概率.2014年1.(2014重庆文17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示:7632(I )求频率分布直方图中的值;(II )分别求出成绩落在[)6050,与[)7060,中的学生人数; (III )从成绩在[)7050,的学生中任选2人,求此2人的成绩都在[)7060,中的概率.2015年1.(2015全国Ⅱ文3)根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ).A. 逐年比较,2008年减少二氧化碳排放量的效果显著B. 2007年我国治理二氧化碳排放显现成效C. 2006年以来我国二氧化碳年排放量呈逐渐减少趋势D. 2006年以来我国二氧化碳年排放量与年份正相关2010年2012年2009年2013年2004年2006年2007年2008年2011年2005年190020001.解析由柱形图可以看出,我国二氧化硫排放量呈下降趋势,故年排放量与年份是负相关关系,依题意,需选不正确的.故选D.命题意图 本题考查统计的基本知识,要注意读懂题意和图表,理解相关性有正相关和负相关. 2.(2015安徽文17)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[)40,50,[)50,60,,[)80,90,[]90,100.(1)求频率分布图中的值;(2)估计该企业的职工对该部门评分不低于80分的概率;(3)从评分在[)40,60的受访职工中,随机抽取2人,求此2人评分都在[)40,50的概率.2. 解析 (1)由频率分布直方图可知,()0.0040.0180.02220.028101a +++⨯+⨯=, 解得0.006a =.(2)由频率估计概率,评分不低于80分的概率为()0.0220.018100.4+⨯=. (3)由频率分布直方图可知:在[)40,50内的人数为0.00410502⨯⨯=(人), 在[)50,60内的人数为0.00610503⨯⨯=(人).设[)40,50内的2人评分分别为12,a a ,[)50,60内的3人评分分别为123,,A A A ,则从[)40,60的受访职工中随机抽取2人,2人评分的基本事件有()12,a a ,()11,a A ,()12,a A ,()13,a A ,()21,a A ,()22,a A ,()23,a A ,()12,A A ,()13,A A ,()23,A A ,共10种.其中2人评分都在[)40,50的概率为110. 3.(2015全国Ⅱ文18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得出A 地区用户满意评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表(1)在答题卡上作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B 地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.3. 分析 (1) 根据题意通过两地区用户满意度评分的频率分布直方图可以看出B 地区用户满意评分的平均值高于A 地区用户满意度评分的平均值,B 地区用户满意度评分比较集中,A 地区用户的评分满意度比较分散;(2)由直方图得()A P C 的估计值为0.6.()B P C 的估计值为0.25,所以A 地区的用户满意度等级为不满意的概率大.解析 (1)通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而A 地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”;B C 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得()A P C 的估计值为()0.010.020.03100.6++⨯=,()B P C 的估计值为()0.0050.02100.25+⨯=.所以A 地区用户的满意度等级为不满意的概率大.评注 高考中对统计与概率的考查,主要建立在实际问题中,特别要能读懂题意,分析题目中的数据,并对数据进行处理,在解答中要注意概率的计算方法.2016年1.(2016全国甲文18)某险种的基本保费为a (单元:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:(1)记A 为事件:“一续保人本年度的保费不高于基本保费”,求()P A 的估计值;(2)记B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求()P B 的估计值;(3)求续保人本年度平均保费的估计值.1.解析 (1)由所给数据知,事件A 发生当且仅当一年内出险次数小于,所以()60500.55200P A +==. (2)由所给数据知,事件B 发生当且仅当一年内出险次数大于等于且小于等于,所以3030()0.3200P B +==. (3)由题所求分布列为调查名续保人的平均保费为0.850.300.25 1.250.15 1.50.15 1.750.1020.05 1.1925a a a a a a a ⨯+⨯+⨯+⨯+⨯+⨯=.2.(2016山东文16)某儿童乐园在“六一”儿童节推出了一项趣味活动.参加活动的儿童需转动如图所示的转盘两次,每次转动后,待转盘停止转动时,记录指针所指区域中的数.设两次记录的数分别为x ,y .奖励规则如下:①若3xy …,则奖励玩具一个; ②若8xy …,则奖励水杯一个;③其余情况奖励饮料一瓶.假设转盘质地均匀,四个区域划分均匀.小亮准备参加此项活动. (1)求小亮获得玩具的概率;(2)请比较小亮获得水杯与获得饮料的概率的大小,并说明理由.2.解析 用数对(),x y 表示儿童参加活动先后记录的数,则基本事件空间Ω与点集(){},|,,14,14S x y x y x y=∈∈N N 剟剟一一对应.因为S 中元素个数是4416,⨯=所以基本事件总数为16.n =(1)记“3xy …”为事件A .则事件A 包含的基本事件共有个,即()()()()()1,1,1,2,1,3,2,1,3,1, 所以()5,16P A =即小亮获得玩具的概率为516. (2)记“8xy …”为事件B ,“38xy <<”为事件C .3421则事件B 包含的基本事件共有6个,即()()()()()()2,4,3,3,3,44,2,4,3,4,4,所以()63.168P B == 则事件C 包含的基本事件共有个,即()()()()()1,4,2,2,2,3,3,2,4,1,所以()5.16P C = 因为35,816> 所以小亮获得水杯的概率大于获得饮料的概率. 3.(2016全国乙文19)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x 表示台机器在三年使用期内需更换的易损零件数,y 表示台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若19n =,求y 与x 的函数解析式;(2)若要求 “需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值; (3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买台机器的同时应购买19个还是20个易损零件?3.解析(1)当19x …时,192003800y =⨯=(元);当19x >时,()19200195005005700y x x =⨯+-⨯=-(元),所以3800,,195005700,,19x x y x x x ∈⎧=⎨-∈>⎩N N ….(2)由柱状图可知更换易损零件数的频率如表所示.所以更换易损零件数不大于18的频率为:,更换易损零件数不大于19的频率为:0.060.160.240.240.700.5+++=>,故n 最小值为19.(3)若每台都购买19个易损零件,则这100台机器在购买易损零件上所需费用的平均数为:10019200205002105004000100⨯⨯+⨯+⨯⨯=(元);若每台都够买20个易损零件,则这100台机器在购买易损零件上所需费用的平均数为 10020200105004050100⨯⨯+⨯=(元).因为40004050<,所以购买台机器的同时应购买19个易损零件.2017年1.(2017全国3卷文3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线图,下列结论错误的是().A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳1.解析由图易知月接待游客量是随月份的变化而波动的,有上升也有下降,所以选项A错误.故选A.评注与2016年的雷达图考法类似,近年来,对各类图形与图表的理解与表示成为高考的一个热点,总体来说,此类题型属于基础类题型,用排除法解此类问题会比较快,但要注意题目要求选择错误的一项,如果审题不仔细可能会造成失分!2.(2017全国2卷文19)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品产量(单位:kg)的某频率直方图如图所示. (1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg”,估计A的概率;(修图:下面表中原点处加数字0)箱产量/kg箱产量/kg。
2018年高考统计与概率专题(全国卷1文)2.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B(全国卷1理)2.如图,正方形ABCD 内的图形来自中国古代的太极图。
正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8C .12D .π4【考点】:几何概型【思路】:几何概型的面积问题,=P 基本事件所包含的面积总面积.【解析】:()21212=82r S P S r ππ==,故而选B 。
(全国卷2理)6.安排3名志愿者完成4项工作,每人至少完成1项,每项工作由1人完成,则不同的安排方式共有( )A .12种B .18种C .24种D .36种(全国卷2文)6。
如图,网格纸上小正方形的边长为1,粗实线画出的是某几何体的三视图,该几何体由一平面将一圆柱截去一部分后所得,则该几何体的体积为 A.90πB 。
63πC 。
42π D.36π【答案】B【解析】由题意,该几何体是由高为6的圆柱截取一半后的图形加上高为4的圆柱,故其体积为2213634632V πππ=⋅⋅⋅+⋅⋅=,故选B 。
(天津卷)文(3)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫。
从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为(A)45(B)35(C)25(D)15(全国卷2文)11.从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C。
第十三章概率与统计本章知识结构图统计概率第一节概率及其计算考纲解读1. 了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2. 了解两个互斥事件的概率的加法公式。
3. 掌握古典概型及其概率计算公式。
4. 了解随机数的意义,能运用模拟方法估计概率。
5. 了解几何概型的意义。
命题趋势探究1. 本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2. 命题设置以两种概型的概率计算及运用互斥、 对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。
知识点精讲一、 必然事件、不可能事件、随机事件在一定条件下:① 必然要发生的事件叫必然事件; ② 一定不发生的事件叫不可能事件; ③ 可能发生也可能不发生的事件叫随机事件。
二、 概率在相同条件下,做次重复实验,事件 A 发生次,测得 A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动, 随着的增加,摆动幅度越来越小,这时就把这个常数叫 做A 的概率,记作。
对于必然事件A,;对于不可能事件 A, =0.三、 基本事件和基本事件空间在一次实验中,不可能再分的事件称为基本事件, 所有基本事件组成的集合称为基本事件空间。
四、 两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件2、每个基本事件发生的可能性相同P AA 包含基本事件数 =card (A) 基本事件总数=card ()2、几何概型条件:每个事件都可以看作某几何区域的子集A ,A 的几何度量(长度、面积、体积或时间)记为五、互斥事件的概率1互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A与事件B互斥,则P AUB P A P B2、对立事件事件A,B互斥,且其中必有一个发生,称事件A,B对立,记作B A或A B。
P A 1 p A。
3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A, B对立”是”事件 A B互斥“的充分不必要条件。
2018年普通高等学校招生全国统一考试数学分类解析—概率统计一.选择题:1. (安徽理)(10).设两个正态分布2111()(0)N μσσ>,和2222()(0)N μσσ>,的密度函数图像如图所示。
则有( A ) A .1212,μμσσ<<B .1212,μμσσ<>C .1212,μμσσ><D .1212,μμσσ>>2.(福建理)(5)某一批花生种子,如果每1粒发牙的概率为45,那么播下4粒种子恰有2粒发芽的概率是 (B )A.16625 B.96625 C.192625D.2566253. (福建文)(5)某一批花生种子,如果每1粒发芽的概率为45,那么播下3粒种子恰有2粒发芽的概率是 (C )A.12125 B.16125 C.48125 D.961254. (广东理)(3).某校共有学生2000名,各年级男、女生人数如表1.已知在全校 学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( C ) A .24 B .18 C .16 D .125.(湖南理) 4.设随机变量ζ服从正态分布N (2,9) ,若P (ζ>c+1)=P (ζ<c -)1,则c =(B)A.1B.2C.3D.46. (江西文)(11).电子钟一天显示的时间是从00:00到23:59,每一时刻都由四个数字组成,则一天中任一时刻显示的四个数字之和为23的概率为 (C )A .1180 B .1288 C .1360D .14807. (辽宁理文)(7).4张卡片上分别写有数字1,2,3,4,从这4张卡片中随机抽取2张,则取出的2张卡片上的数字之和为奇数的概率为( C ) A.13 B.12 C.23 D.348.(山东理)(7)在某地的奥运火炬传递活动中,有编号为1,2,3,…,18的18名火炬手.若从中任选3人,则选出的火炬手的编号能组成3为公差的等差数列的概率为(B ) (A )511(B )681 (C )3061(D )40819.(山东理) (8)右图是根据《山东统计年整2018》中的资料作成的1997年至2018年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2018年我省城镇居民百户家庭人口数的平均数为(B )(A )318.6 (B )318.6 (C)318.6 (D)301.6 10.(山东文)9.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( B )AB C .3D .8510.(陕西文)(3).某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( C ) A .30 B .25 C .20 D .15 11.(重庆理)(5)已知随机变量ζ服从正态分布N (3,a 2),则P (3)ζ<=(D )(A)15(B)14(C)13(D)1212. (重庆文)(5)某交高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是(D )(A)简单随机抽样法(B)抽签法7420136203851192(C)随机数表法 (D)分层抽样法13.(重庆文)(9)从编号为1,2,…,10的10个大小相同的球中任取4个,则所取4个球的最大号码是6的概率为 (B )(A)184(B)121(C)25(D)35二.填空题:1.(广东文) (11).为了调查某厂工人生产某种产品的能力,随机抽查 了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85, [)85,95由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[)55,75的人数是 13 .2.(海南宁夏理文)(16).从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm ),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 318 318 318 318 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 318 318 318 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ① ;3 127 7 5 5 0 28 4 5 4 2 29 2 5 8 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 8 8 5 5 3 32 0 2 2 4 7 9 7 4 1 33 1 3 6 734 3 2 35 6甲乙② .以下任填两个:(1).乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度). (2).甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大). (3).甲品种棉花的纤维长度的中位数为318mm ,乙品种棉花的纤维长度的中位数为318mm . (4).乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.3. (湖北文)11.一个公司共有1 000名员工,下设一些部门,要采用分层抽样方法从全体员工中抽取一个容量为50的样本,已知某部门有200名员工,那么从该部门抽取的工人数是 10 . 4.(湖北文)14.明天上午李明要参加奥运志愿者活动,为了准时起床,他用甲、乙两个闹钟叫醒自己,假设甲闹钟准时响的概率是0.80,乙闹钟准时响的概率是0.90,则两个闹钟至少有一准时响的概率是 0.98 .5. (湖南理)15.对有n (n ≥4)个元素的总体{1,2,3,…,n }进行抽样,先将总体分成两个子总体{1,2,…,m }和{m +1、m +2,…,n }(m 是给定的正整数,且2≤m ≤n -2),再从每个子总体中各随机抽取2个元素组成样本,用P i j 表示元素i 和f 同时出现在样本中的概率,则P 1m =4()m n m -;所有P if (1≤i <j ≤)n 的和等于 6 .6. (湖南文)(12)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示:则该地区生活不能自理的老人中男性比女性约多____60____人。
概率与统计热点一统计与统计案例以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计,判断.常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生数据处理能力.【例1】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元。
在机器使用期间,如果备件不足再购买,则每个500元。
现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数。
(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?解(1)当x≤19时,y=3 800;当x〉19时,y=3 800+500(x-19)=500x-5 700。
所以y与x的函数解析式为y=错误!(x∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0。
46,不大于19的频率为0.7,故n的最小值为19。
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1(3 800×70+4 300×20+4 800×10)=4 000,100若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1(4 000×90+4 500×10)=4 050.100比较两个平均数可知,购买1台机器的同时应购买19个易损零件。
概率与统计1.(2018全国卷1文)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2018全国卷1文)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量 [)00.1, [)0.10.2, [)0.20.3, [)0.30.4, [)0.40.5, [)0.50.6, [)0.60.7,频数13249265使用了节水龙头50天的日用水量频数分布表日用水量 [)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)3.(2018全国卷2文)从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为A.0.6B.0.5C.0.4D.0.34.(2018全国卷2文)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5=-+;根据2010y t 年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.5.(2018全国卷3文)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为A.0.3 B.0.4 C.0.6 D.0.76.(2018全国卷3文)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.7.(2018全国卷3文)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()0.0500.0100.0013.8416.63510.828P K kk≥.10.(2018北京卷文)电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数140 50 300 200 800 510好评率0.4 0.2 0.15 0.25 0.2 0.1 好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;学科%网(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)11.(2018天津卷文)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.12.(2018江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.13.(2018江苏卷)某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为.14.(2018浙江卷)设0<p<1,随机变量ξ的分布列是ξ0 1 2P 12p122p则当p在(0,1)内增大时,A.D(ξ)减小B.D(ξ)增大C.D(ξ)先减小后增大D.D(ξ)先增大后减小15.(2018上海卷)有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是______(结果用最简分数表示)。
(全国1卷3)答案:(全国1卷19)答案:(全国2卷5)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6B.0.5C.0.4 D.0.3答案:D(全国2卷18)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5根据2010年至y t=-+;2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由. 答案:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y $=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y $=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y$=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.(全国3卷5)答案:B(全国3卷14)答案:分层抽样(全国3卷18)答案:(北京卷17)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)答案:(天津卷15)(15)(本小题满分13分)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(I)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(II)设抽出的7名同学分别用A ,B ,C ,D ,E ,F ,G 表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M 为事件“抽取的2名同学来自同一年级”,求事件M 发生的概率.答案:(I)解:由已知,甲、乙、丙三个年级的学生志愿者人数之比分别为3:2:2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的志愿者中分别抽取3人,2人,2人. (II)(i)解:从抽取的7名同学中随机抽取2名同学的所有可能结果为{},A B ,{},A C ,{},A D ,{},A E ,{},A F ,{},A G ,{},B C ,{},B D ,{},B E ,{},B F ,{},B G ,{},C D ,{},C E ,{},C F ,{},C G ,{},D E ,{},D F ,{},D G ,{},E F ,{},E G ,{},F G ,共21种.(ii)解:由(I),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{},A B ,{},A C ,{},B C ,{},D E ,{},F G ,共5种.所以,事件M 发生的概率5()21P M =.。
2018年高考数学试题汇编概率与统计重庆理(7)从5张100元,3张200元,2张300元的奥运预赛门票中任取3张,则所取3张中至少有2张价格相同的概率为(A )41 (B )12079 (C )43 (D )242318.(本小题满分13分,其中(Ⅰ)小问4分,(Ⅱ)小问9分)某单位有三辆汽车参加某种事故保险,单位年初向保险公司缴纳每辆900元的保险金,对在一年内发生此种事故的每辆汽车,单位可获9000元的赔偿(假设每辆车最多只赔偿一次),设这三辆车在一年内发生此种事故的概率分别为19,110,111,且各车是否发生事故相互独立,求一年内该单位在此保险中: (Ⅰ)获赔的概率;(Ⅱ)获赔金额ξ的分布列与期望. (18)(本小题13分)解:设k A 表示第k 辆车在一年内发生此种事故,123k =,,.由题意知1A ,2A ,3A 独立, 且11()9P A =,21()10P A =,31()11P A =. (Ⅰ)该单位一年内获赔的概率为123123891031()1()()()19101111P A A A P A P A P A -=-=-⨯⨯=.(Ⅱ)ξ的所有可能值为0,9000,18000,27000.12312389108(0)()()()()9101111P P A A A P A P A P A ξ====⨯⨯=,123123123(9000)()()()P P A A A P A A A P A A A ξ==++ 123123123()()()()()()()()()P A P A P A P A P A P A P A P A P A =++19108110891910119101191011=⨯⨯+⨯⨯+⨯⨯ 2421199045==, 123123123(18000)()()()P P A A A P A A A P A A A ξ==++ 123123123()()()()()()()()()P A P A P A P A P A P A P A P A P A =++1110191811910119101191011=⨯⨯+⨯⨯+⨯⨯ 273990110==, 123123(27000)()()()()P P A A A P A P A P A ξ===111191011990=⨯⨯=. 综上知,ξ的分布列为ξ0 9000 18000 27000P811 1145 3110 1990求ξ的期望有两种解法: 解法一:由ξ的分布列得811310900018000270001145110990E ξ=⨯+⨯+⨯+⨯ 299002718.1811=≈(元).解法二:设k ξ表示第k 辆车一年内的获赔金额,123k =,,, 则1ξ有分布列1ξ0 9000P89 19故11900010009E ξ=⨯=. 同理得21900090010E ξ=⨯=,319000818.1811E ξ=⨯≈. 综上有1231000900818.182718.18E E E E ξξξξ=++≈++=(元). 四川理(12)已知一组抛物线1212++=bx ax y ,其中a 为2,4,6,8中任取的一个数,b 为1,3,5,7中任取的一个数,从这些抛物线中任意抽取两条,它们在与直线x =1交点处的切线相互平行的概率是(A )121 (B )607 (C )256 (D )255(18)(本小题满分12分)厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机抽取一定数量的产品做检验,以决定是否接收这批产品.(Ⅰ)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验.求至少有1件是合格品的概率;(Ⅱ)若厂家发给商家20件产品,其中有3件不合格,按合同规定该商家从中任取2件,都进行检验,只有2件都合格时才接收这批产品,否则拒收.求该商家可能检验出不合格产品数ξ的分布列及期望ξE ,并求该商家拒收这批产品的概率.(18)本题考察相互独立事件、互斥事件等的概率计算,考察随机事件的分布列,数学期望等,考察运用所学知识与方法解决实际问题的能力。
2018届高三文科数学概率与统计解题方法规律技巧详细总结版【简介】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类古典概型概率的计算方法,另外近几年对于变量间的相关关系与统计案例的考察也时常出现,这部分也要做复习的重点.【3年高考试题比较】从近几年的高考命题来看,高考对概率的考查,一般以实际生活题材为背景,以应用题的形式出现.主要考查图表信息的整理及分析,古典概型和统计的相关知识,以回归直线方程和独立性检验为主.概率应用题侧重于古典概型,主要考查随机事件、等可能事件、互斥事件、对立事件的概率.解决简单的古典概型试题可用直接法(定义法),对于较为复杂的事件的概率,可以利用所求事件的性质将其转化为互斥事件或其对立事件的概率求解.解决古典概型问题的关键在于确定基本事件.回归直线方程以线性为主,对于非线性的往往通过换元得到线性关系,并会利用应用回归方程作出估计,独立性检验以利用2列联表计算K 2为主. 概率统计的试题在高考中文字较大,信息量较大,需要认真阅读,理解题意.【必备基础知识融合】1.概率问题(1)求某些较复杂的概率问题时,通常有两种方法:一是将其分解为若干个彼此互斥的事件的和,然后利用概率加法公式求其值;二是求此事件A 的对立事件A 的概率,然后利用P (A )=1-P (A )可得解;(2)用列举法把古典概型试验的基本事件一一列出来,然后再求出事件A 中的基本事件,利用公式P (A )=m n求出事件A 的概率,这是一个形象、直观的好办法,但列举时必须按照某一顺序做到不重复,不遗漏;(3)求几何概型的概率,最关键的一步是求事件A 所包含的基本事件所占据区域的测度,这里需要解析几何的知识,而最困难的地方是找出基本事件的约束条件. 2.统计问题(1)统计主要是对数据的处理,为了保证统计的客观和公正,抽样是统计的必要和重要环节,抽样的方法有三:简单随机抽样、系统抽样和分层抽样;(2)用样本频率分布来估计总体分布一节的重点是:频率分布表和频率分布直方图的绘制及用样本频率分布估计总体分布,考点是:频率分布表和频率分布直方图的理解及应用;(3)用茎叶图优点是原有信息不会抹掉,能够展开数据发布情况,但当样本数据较多或数据位数较多时,茎叶图就显得不太方便了;(4)回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数.①在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. ②在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. ③如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. (5)线性回归方程①最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.②回归方程:两个具有线性相关关系的变量的一组数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b ^x+a ^,则b ^=1122211()()()n niii ii i nniii i x x y y x y nx yx x xnx ====---=--∑∑∑∑,a ^=y ^-b ^x .其中,b ^是回归方程的斜率,a ^是在y 轴上的截距. 回归直线一定过样本点的中心(x ,y ).③.残差分析:残差:对于样本点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),它们的随机误差为e i =y i -bx i -a ,i =1,2,…,n ,其估计值为e ^i =y i -y ^i =y i -b ^x i -a ^,i =1,2,…,n .e ^i 称为相应于点(x i ,y i )的残差.⑤相关指数:R 2=1-2121()()niii nii y y y y ==--∑∑.其中21()niii y y =-∑是残差平方和,其值越小,则R 2越大(接近1),模型的拟合效果越好. (6).独立性检验①利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验.②列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为计则随机变量K 2=n (ad -bc )(a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样本容量.【解题方法规律技巧】典例1:我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),……,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5.又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5.所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.【规律方法】(1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频率和条形图混淆.(2)“命题角度二”的例题中抓住频率分布直方图中各小长方形的面积之和为1,这是解题的关键,并利用频率分布直方图可以估计总体分布.(3)利用频率分布直方图求众数、中位数与平均数时,应注意这三者的区分:(1)最高的矩形的中点横坐标即众数;(2)中位数左边和右边的直方图的面积是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.典例2:某企业有甲、乙两个研发小组.为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b -),(a ,b ),(a -,b ),(a -,b -),(a ,b ),(a ,b ),(a ,b -),(a -,b ),(a -,b -),(a ,b -)(a ,b ),(a ,b -),(a -,b ),(a ,b ).其中a ,a -分别表示甲组研发成功和失败;b ,b -分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.(2)记E ={恰有一组研发成功}.在所抽得的15个结果中,恰有一组研发成功的结果是(a ,b -),(a -,b ),(a ,b -),(a -,b ),(a ,b -),(a ,b -),(a -,b ),共7个.因此事件E 发生的频率为715.用频率估计概率,即得所求概率为P (E )=715.【规律方法】(1)平均数反映了数据的中心,是平均水平,而方差和标准差反映的是数据围绕平均数的波动大小.进行平均数与方差的计算,关键是正确运用公式.(2)平均数与方差所反映的情况有着重要的实际意义,一般可以通过比较甲、乙两组样本数据的平均数和方差的差异,对甲、乙两品种可以做出评价或选择.典例3:随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:(1)求y 关于t 的回归方程y ^=b ^t +a ^;(2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.附:回归方程y ^=b ^t +a ^中,b ^=∑ni =1t i y i -nt -y -∑n i =1t 2i -nt -2,a ^=y --b ^t -.(2)将t =6代入回归方程可预测该地区2015年的人民币储蓄存款为y ^=1.2×6+3.6=10.8(千亿元). 【规律方法】(1)在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,也可计算相关系数r 进行判断.若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. (2)正确运用计算b ^,a ^的公式和准确的计算,是求线性回归方程的关键,并充分利用回归直线y ^=b ^x +a ^必过样本点的中心(x -,y -)进行求值.典例4:微信是现代生活进行信息交流的重要工具,据统计,某公司200名员工中90%的人使用微信,其中每天使用微信时间在一小时以内的有60人,其余的员工每天使用微信的时间在一小时以上,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中75%是青年人.若规定:每天使用微信时间在一小时以上为经常使用微信,那么经常使用微信的员工中23是青年人.(1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,列出2×2列联表;(2)由列联表中所得数据判断,是否有99.9%的把握认为“经常使用微信与年龄有关”?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)【规律方法】(1)在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.(2)解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:①根据样本数据制成2×2列联表:②根据公式K2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )计算K2的观测值k0;③比较k0与临界值的大小关系,作统计推断.典例5: 某超市随机选取1 000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(1)估计顾客同时购买乙和丙的概率;(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)如果顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?(3)与(1)同理,可得:顾客同时购买甲和乙的概率可以估计为2001 000=0.2,顾客同时购买甲和丙的概率可以估计为100+200+3001 000=0.6,顾客同时购买甲和丁的概率可以估计为1001 000=0.1.所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大.【规律方法】1)解题的关键是根据统计图表分析满足条件的事件发生的频数,计算频率,用频率估计概率.(2)频率反映了一个随机事件出现的频繁程度,频率是随机的,而概率是一个确定的值,通常用概率来反映随机事件发生的可能性的大小,通过大量的重复试验,事件发生的频率会逐渐趋近于某一个常数(概率),因此有时也用频率来作为随机事件概率的估计值.典例6:某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.已知这100位顾客中一次购物量超过8件的顾客占55%.(1)确定x,y的值,并估计顾客一次购物的结算时间的平均值;(2)求一位顾客一次购物的结算时间不超过2分钟的概率(将频率视为概率).解(1)由已知得25+y+10=55,x+30=45,所以x=15,y=20.【规律方法】(1)①求解本题的关键是正确判断各事件的关系,以及把所求事件用已知概率的事件表示出来.②结算时间不超过2分钟的事件,包括结算时间为2分钟的情形,否则会计算错误.(2)求复杂的互斥事件的概率一般有两种方法:一是直接求解法,将所求事件的概率分解为一些彼此互斥的事件的概率再求和;二是间接法,先求该事件的对立事件的概率,再由P(A)=1-P(A -)求解.当题目涉及“至多”、“至少”型问题,多考虑间接法.典例7:某商场举行有奖促销活动,顾客购买一定金额的商品后即可抽奖.抽奖方法是:从装有2个红球A 1,A 2和1个白球B 的甲箱与装有2个红球a 1,a 2和2个白球b 1,b 2的乙箱中,各随机摸出1个球.若摸出的2个球都是红球则中奖,否则不中奖.(1)用球的标号列出所有可能的摸出结果;(2)有人认为:两个箱子中的红球比白球多,所以中奖的概率大于不中奖的概率,你认为正确吗?请说明理由. 解 (1)依题意,所有可能的摸出的结果是{A 1,a 1},{A 1,a 2},{A 1,b 1},{A 1,b 2},{A 2,a 1},{A 2,a 2},{A 2,b 1},{A 2,b 2},{B ,a 1},{B ,a 2},{B ,b 1},{B ,b 2}.(2)不正确.理由如下:由(1)知,所有可能的摸出结果共12种,其中摸出的2个球都是红球的结果为{A 1,a 1},{A 1,a 2},{A 2,a 1},{A 2,a 2},共4种,所以中奖的概率为P 1=412=13,不中奖的概率为P 2=1-P 1=23.由于P 1=13<P 2=23.故这种说法不正确.【规律方法】(1)求较复杂事件的概率问题,解题关键是理解题目的实际含义,把实际问题转化为概率模型,必要时将所求事件转化成彼此互斥事件的和,或者先求其对立事件的概率,进而再用互斥事件的概率加法公式或对立事件的概率公式求解.(2)本题常见的错误:①理解不清题意,不能把基本事件列举出来;②不能恰当分类,列举基本事件有遗漏,再者本题中基本事件(x ,y)看成有序的,(1,2)与(2,1)等表示不同的基本事件.典例8:空气质量指数(Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;>300为严重污染.一环保人士记录了某地2016年某月10天的AQI 的茎叶图如图所示. (1)利用该样本估计该地本月空气质量优良(AQI≤100)的天数(按这个月总共30天计算);(2)若从样本中的空气质量不佳(AQI >100)的这些天中,随机地抽取两天深入分析各种污染指标,求该两天的空气质量等级恰好不同的概率.【规律方法】有关古典概型与统计结合的题型是高考考查概率的一个重要题型,已成为高考考查的热点,概率与统计结合题,无论是直接描述还是利用概率分布表、分布直方图、茎叶图等给出信息,准确从题中提炼信息是解题的关键.典例9:菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但蔬菜上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x (单位:千克)清洗蔬菜1千克后,蔬菜上残留的农药y (单位:微克)的统计表:(1)在下面的坐标系中,描出散点图,并判断变量x 与y 是正相关还是负相关;(2)若用解析式2y cx d ∧=+作为蔬菜农药残量y ∧与用水量x 的回归方程,令2w x =,计算平均值w 与y ,完成以下表格(填在答题卡中),求出y ∧与x 的回归方程.(,c d 保留两位有效数字);(3)对于某种残留在蔬菜上的农药,当它的残留量低于20微克时对人体无害,为了放心食用该蔬菜,请评估需要用多少千克的清水清洗一千克蔬菜?(精确到0.1,参考数据2.236≈)(附:对于一组数据()()()1122,,,,......,,n n u v u v u v ,其回归直线v u αβ=+的斜率和截距的最小二乘法估计分别为:()()()121,niii nii u u v v v u u u βαβ∧∧∧==--==--∑∑)【答案】(1)负相关(2)22.060y x ∧=-+(3)需要4.5千克的清水解析:(1)负相关.(含散点图) (2)11,38w y ==()()()()()()()222221020716215914287512.03741072514c -⨯+-⨯+-⨯+⨯-+⨯-==-≈-+-+-++ 2751381160, 2.060 2.060374d y cw y w x ∧⎛⎫=-=--⨯≈=-+=-+ ⎪⎝⎭. (3)当20y ∧<时, 22.06020, 4.5x x -+≈∴为了放心食用该蔬菜,估计需要4.5千克的清水清洗一千克蔬菜.【规律总结】(1)回归直线y =bx +a 必过样本点的中心(x ,y ).(2)正确运用计算b ,a 的公式和准确的计算,是求线性回归方程的关键.(3)分析两变量的相关关系,可由散点图作出判断,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(4)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱. 典例10:已知向量a =(-2,1),b =(x ,y ).(1)若x ,y 分别表示将一枚质地均匀的正方体骰子(六个面的点数分别为1,2,3,4,5,6)先后抛掷两次时第一次、第二次出现的点数,求满足a ·b =-1的概率; (2)若x ,y 在连续区间[1,6]上取值,求满足a ·b <0的概率.解 (1)将一枚质地均匀的正方体骰子先后抛掷两次,所包含的基本事件总数为6×6=36(个);由a ·b =-1, 得-2x +y =-1,∴a ·b =-1包含的基本事件为(1,1),(2,3),(3,5),共3种情形.故P (a ·b = -1)=336=112.(2)若x ,y 在连续区间[1,6]上取值,则全部基本事件的结果为Ω={(x ,y )|1≤x ≤6,1≤y ≤6};满足a ·b <0的基本事件的结果为A ={(x ,y )|1≤x ≤6,1≤y ≤6且-2x +y <0};画出图形如图,正方形的面积为S 正方形=25,阴影部分的面积为S 阴影=25-12×2×4=21,故满足a ·b <0的概率为2125.【规律总结】古典概型中基本事件数的探求方法 (1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化. (4)排列组合法:适用于限制条件较多且元素数目较多的题目.几何概型:(1)当试验的结果构成的区域为长度、面积、体积等时,应考虑使用几何概型求解.(2)利用几何概型求概率时,关键是试验的全部结果构成的区域和事件发生的区域的寻找,有时需要设出变量,在坐标系中表示所需要的区域.(3)几何概型有两个特点:一是无限性,二是等可能性.基本事件可以抽象为点,尽管这些点是无限的,但它们所占据的区域都是有限的,因此可用“比例解法”求解几何概型的概率.【归纳常用万能模板】1.海关对同时从A,B,C三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.(1)求这6件样品中来自A,B,C各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.审题路线图利用分层抽样的特征确定各层的抽样比→求出样品中各层的数量→列举基本事件空间→利用古典概型公式求解评分细则(1)各层抽样数量每个算对给1分;(2)没有列举基本事件只求对基本事件个数给1分;(3)求对样本事件个数而没有列出的给1分;(4)最后没下结论的扣1分.2.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人的评分都在[40,50)的概率.满分解答(1)解因为(0.004+a+0.018+0.022×2+0.028)×10=1,所以a=0.006.3分(2)解由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4. 所以该企业职工对该部门评分不低于80的概率的估计值为0.4.5分(3)解受访职工中评分在[50,60)的有:50×0.006×10=3(人),记为A1,A2,A3;受访职工中评分在[40,50)的有:50×0.004×10=2(人),记为B1,B2,8分从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A1,A2},{A1,A3},{A1,B1},{A1,B2},{A2,A3},{A2,B1},{A2,B2},{A3,B1},{A3,B2},{B1,B2}.11分又因为所抽取2人的评分都在[40,50)的结果有1种,即{B1,B2},故所求的概率为P=110.12分❶抓住关键,准确计算(1)得关键分:如第(1)问中,正确求得a=0.006;第(3)问中列出10个基本事件,错写或多写,少写均不得分.(2)得转化计算分:如第(1)问,第(2)问中的计算要正确,否则不得分;第(3)问中利用“频数、样本容量、频率之间的关系”求得各区间的人数,转化为古典概型的概率.❷步骤规范,防止失误抓住得分点的步骤,“步步为赢”求得满分,本题的易失分点:(1)不能利用频率分布直方图的频率求出a值;(2)求错评分落在[50,60),[40,50)间的人数;(3)没有指出“基本事件总数”与“事件M”包含的基本事件个数,或者只指出事件个数,没有一一列举10个基本事件及事件M包含的基本事件,导致扣3分或2分.第一步:由各矩形的面积之和等于1,求a的值.第二步:由样本频率分布估计概率.第三步:设出字母,列出基本事件总数及所求事件M所包含的基本事件.第四步:利用古典概型概率公式计算.第五步:反思回顾,查看关键点,易错点和答题规范.【易错易混温馨提醒】一、样本的数字特征的计算1.随着雾霾的日益严重,中国部分省份已经实施了“煤改气”的计划来改善空气质量指数.2017年支撑我国天然气市场消费增长的主要资源是国产常规气和进口天然气,资源每年的增量不足以支撑天然气市场连续300亿立方米的年增量.进口LNG和进口管道气受到接收站、管道能力和进口气价资源的制约.未来,国产常规气产能释放的红利将会逐步减弱,产量增量将维持在80亿方以内.为了测定某市是否符合实施煤改气计划的标准,某监测站点于2016年8月某日起连续200天监测空气质量指数(AQI),数据统计如下:(1)根据上图完成下列表格(2)计算这200天中,该市空气质量指数的平均数;(3)若按照分层抽样的方法,从空气质量指数在101~150以及151~200的等级中抽取7天进行调研,再从这7天中任取2天进行空气颗粒物分析,求恰有1天空气质量指数在101~150上的概率.【答案】(1)见解析(2)95(3)1021 P=【解析】试题分析:(1)根据题意给出的数列,即可求得所求表格数据,进而完成图表;(2)依题意,利用平均数的计算公式,即可求解数列的平均数.(3)依题意,从空气质量指数在101~150以及151~200的天数为5,记为,,,,a b c d e,空气质量指数在151~200的天数为2,记为1,2,列出基本事件的个数,根据古典概型,即可求解相应的概率值.试题解析:解:(1)所求表格数据如下:(2)依题意,故所求平均数为250.2750.41250.251750.12250.0595⨯+⨯+⨯+⨯+⨯=2.为了了解甲、乙两个工厂生产的轮胎的宽度是否达标,分别从两厂随机各选取了10个轮胎,将每个轮胎的宽度(单位:mm)记录下来并绘制出如下的折线图:(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均值;(2)轮胎的宽度在[]194,196内,则称这个轮胎是标准轮胎.(i)若从甲乙提供的10个轮胎中随机选取1个,求所选的轮胎是标准轮胎的概率P;(ii)试比较甲、乙两厂分别提供的10个轮胎中所有标准轮胎宽度的方差大小,根据两厂的标准轮胎宽度的平均水平及其波动情况,判断这两个工厂哪个厂的轮胎相对更好?【答案】(1)x=甲()195mm.x乙()194mm=.(2)(i)35P=.(ii)见解析.【解析】试题分析:(1)利用折线图能求出甲厂这批轮胎宽度的平均值和乙厂这批轮胎宽度的平均值.(2))①从甲厂提供的10个轮胎中有6个轮胎是标准轮胎,从中随机选取1个,能求出所选的轮胎是标准轮胎的概率.②甲厂这批轮胎宽度都在[194,196]内的数据为195,194,196,194,196,195,乙厂这批轮胎宽度都在[194,196]内的数据为195,196,195,194,195,195,求出两厂标准轮胎宽度的平均数相等,但乙厂的方差更小,从而乙厂的轮胎相对更好.3.为了调查观众对某热播电视剧的喜爱程度,某电视台在甲、乙两地各随机抽取了8名观众作问卷调查,得分统计结果如图所示:(1)计算甲、乙两地被抽取的观众问卷的平均得分;(2)计算甲、乙两地被抽取的观众问卷得分的方差;(3)若从甲地被抽取的8名观众中再邀请2名进行深入调研,求这2名观众中恰有1人的问卷调查成绩在90分以上的概率.【答案】(1)85,85 (2)35.5,41(3)123287 P==(3)依题意,所有的事件的可能性为()()()78,79,78,81,78,82, ()()()78,84,78,88,78,93,()()()78,95,79,81,79,82,()()()79,84,79,88,79,93,()()()79,95,81,82,81,84,()()()81,88,81,93,81,95,()()()82,84,82,88,82,93,()()()82,95,84,88,84,93,()84,95,()()()88,93,88,95,93,95,共28种,其中满足条件的为()()()78,93,78,95,79,93, ()()()79,95,81,93,81,95, ()()()82,93,82,95,84,93, ()()()84,95,88,93,88,95,共12种,故所求概率123287P ==. 二、图表数据的处理4.“砥砺奋进的五年”,首都经济社会发展取得新成就.自2012年以来,北京城乡居民收入稳步增长.随着扩大内需,促进消费等政策的出台,居民消费支出全面增长,消费结构持续优化升级,城乡居民人均可支配收入快速增长,人民生活品质不断提升.下图是北京市2012-2016年城乡居民人均可支配收入实际增速趋势图(例如2012年,北京城镇居民收入实际增速为7.3%,农村居民收入实际增速为8.2%).(Ⅰ)从2012-2016五年中任选一年,求城镇居民收入实际增速大于7%的概率;(Ⅱ)从2012-2016五年中任选一年,求至少有一年农村和城镇居民收入实际增速均超过7%的概率; (Ⅲ)由图判断,从哪年开始连续三年农村居民收入实际增速方差最大?(结论不要求证明) 【答案】(Ⅰ)35;(Ⅱ) 910;(Ⅲ)2014年.试题解析:(Ⅰ)设城镇居民收入实际增速大于7%为事件A ,由图可知,这五年中有2012,2013,2014这三年城镇居民收入实际增速大于7%,所以P (A )=35. (Ⅱ)设至少有一年农村和城镇居民实际收入增速均超7%为事件B ,这五年中任选两年,有(2012,2013),(2012,2014),(2012,2015),(2012,2016),(2013,2014),(2013,2015),(2013,2016),(2014,2015),(2014,2016),(2015,2016)共10种情况,其中至少有一年农村和城镇居民实际收入增速均超过7%的为前9种情况,所以P (B )=910. (Ⅲ)从2014开始连续三年农村居民收入实际增速方差最大. 三、非线性回归方程转化为线性回归方程5.已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x (单位:℃),对某种鸡的时段产蛋量y (单位: t )和时段投入成本z (单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度i x 和产蛋量()1,2,,7i y i =⋅⋅⋅的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.。
2018全国高考真题数学统计与概率专题(附答案解析)1.(全国卷I,文数、理数第3题.5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A2.(全国卷I,文数19题.12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数 1 3 2 4 9 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案解析】解:(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=. 3.(全国卷I ,理数20题12分)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品,检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为()01p p <<,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为()f p ,求()f p 的最大值点0p ; (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【答案解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-.因此 2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =.当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数,依题意知(180,0.1)YB ,=+.X Y=⨯+,即402520225X Y所以(4025)4025490=+=+=.EX E Y EY(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于400EX>,故应该对余下的产品作检验.4.(全国卷Ⅱ,文数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5C.0.4D.0.3【答案】D5.(全国卷Ⅱ,文数、理数18题.12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5y t=-+;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案解析】解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为。
专题7排列组合二项式定理概率统计与分布列(2018全国1卷)3. 某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A. 新农村建设后,种植收入减少B. 新农村建设后,其他收入增加了一倍以上C. 新农村建设后,养殖收入增加了一倍D. 新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】分析:首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.详解:设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.(2018全国2卷)5. 从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为 A.B.C.D.【答案】D【解析】分析:分别求出事件“2名男同学和3名女同学中任选2人参加社区服务”的总可能及事件“选中的2人都是女同学”的总可能,代入概率公式可求得概率. 详解:设2名男同学为,3名女同学为,从以上5名同学中任选2人总共有共10种可能,选中的2人都是女同学的情况共有共三种可能 则选中的2人都是女同学的概率为,故选D.点睛:应用古典概型求某事件的步骤:第一步,判断本试验的结果是否为等可能事件,设出事件;第二步,分别求出基本事件的总数与所求事件中所包含的基本事件个数;第三步,利用公式求出事件的概率.(2018全国3卷)5.若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为( )A .0.3B .0.4C .0.6D .0.75.答案:B解答:由题意.故选B. (2018浙江卷)7.设0<p <1,随机变量ξ的分布列是则当p 在(0,1)内增大时( ) A . D (ξ)减小B . D (ξ)增大C .D (ξ)先减小后增大D . D (ξ)先增大后减小7.答案:D 解答:111()0122222p p E p x -=???+, 22211113()()()()222222p p D p p p x -=?+?+?22111()422p p p =-++=--+,10.450.150.4P =--=D x先增大后减小,故选D.所以当p在(0,1)内增大时,()(2018全国3卷)14.某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.14.答案:分层抽样解答:由题意,不同龄段客户对其服务的评价有较大差异,故采取分层抽样法.(2018江苏卷)3. 已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.点睛:的平均数为.(2018江苏卷)6. 某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为________.【答案】【解析】分析:先确定总基本事件数,再从中确定满足条件的基本事件数,最后根据古典概型概率公式求概率.详解:从5名学生中抽取2名学生,共有10种方法,其中恰好选中2名女生的方法有3种,因此所求概率为点睛:古典概型中基本事件数的探求方法(1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.(4)排列组合法(理科):适用于限制条件较多且元素数目较多的题目. (2018浙江卷)14.二项式(+)8的展开式的常数项是_________________________14.答案:7解答:通项1813181()()2rrr r T C x x --+=843381()2r r r C x -=. 84033r -=,∴2r =.∴常数项为2281187()7242C ⨯⋅=⨯=. (2018浙江卷)16从1,3,5,7,9中任取2个数字,从0,2,4,6中任取2个数字,一共可以组成________________个没有重复数字的四位数(用数字作答) 16.答案:1260解答:224121353435337205401260C C A C C C A +=+=(2018全国1卷)19. 某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案】(1)直方图见解析.(2) 0.48.(3).【解析】分析:(1)根据题中所给的使用了节水龙头50天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图;(2)结合直方图,算出日用水量小于0.35的矩形的面积总和,即为所求的频率;(3)根据组中值乘以相应的频率作和求得50天日用水量的平均值,作差乘以365天得到一年能节约用水多少,从而求得结果.详解:(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为.该家庭使用了节水龙头后50天日用水量的平均数为.估计使用节水龙头后,一年可节省水.点睛:该题考查的是有关统计的问题,涉及到的知识点有频率分布直方图的绘制、利用频率分布直方图计算变量落在相应区间上的概率、利用频率分布直方图求平均数,在解题的过程中,需要认真审题,细心运算,仔细求解,就可以得出正确结果.(2018全国2卷)18. 下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.【解析】分析:(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果,(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.详解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.(2018全国3卷)18.(12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:⑴根据茎叶图判断哪种生产方式的效率更高?并说明理由;⑵求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:⑶根据⑵中的列表,能否有99%的把握认为两种生产方式的效率有差异?附:,.18.解答:(1)第一种生产方式的平均数为,第二种生产方式平均数为,∴,所以第一种生产方式完成任务的平均时间大于第二种,∴第二种生产方式的效率更高.(2)由茎叶图数据得到,∴列联表为m m m ()()()()()22n ad bc K a b c d a c b d -=++++()20.0500.0100.0013.8416.63510.828P K k k ≥184x =274.7x =12x x >80m =(3),∴有的把握认为两种生产方式的效率有差异.(2018北京卷)17. 电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论) 【答案】(Ⅰ)(Ⅱ)(Ⅲ)增加第五类电影的好评率, 减少第二类电影的好评率.【解析】分析:(1)分别计算样本中电影总部数及第四类电影中获得好评的电影部数,代入公式可得概率;(2)利用古典概型公式,计算没有获得好评的电影部数,代入公式可得概率;(3)根据每部电影获得好评的部数做出合理建议..详解:(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000. 第四类电影中获得好评的电影部数是200×0.25=50, 故所求概率为.(Ⅱ)设“随机选取1部电影,这部电影没有获得好评”为事件B .没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部. 由古典概型概率公式得.(Ⅲ)增加第五类电影的好评率, 减少第二类电影的好评率.222()40(151555)10 6.635()()()()20202020n ad bc K a b c d a c b d -⨯-⨯===>++++⨯⨯⨯99%点睛:本题主要考查概率与统计知识,属于易得分题,应用古典概型求某事件的步骤:第一步,判断本试验的结果是否为等可能事件,设出事件;第二步,分别求出基本事件的总数与所求事件中所包含的基本事件个数;第三步,利用公式求出事件的概率.(2018天津卷)15. 已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.【答案】(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人;(Ⅱ)(i)答案见解析;(ii).【解析】分析:(Ⅰ)结合人数的比值可知应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(Ⅱ)(i)由题意列出所有可能的结果即可,共有21种.(ii)由题意结合(i)中的结果和古典概型计算公式可得事件M发生的概率为P(M)=.详解:(Ⅰ)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(Ⅱ)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种.(ii)由(Ⅰ),不妨设抽出的7名同学中,来自甲年级的是A,B,C,来自乙年级的是D,E,来自丙年级的是F,G,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A,B},{A,C},{B,C},{D,E},{F,G},共5种.所以,事件M发生的概率为P(M)=.点睛:本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识.考查运用概率知识解决简单实际问题的能力.。
统计与概率
一、选择题:
1.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是()
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
2.某群体中的成员只用现金支付的概率为0.45,既用现金也用非现金支付的概率为0.15,则不用现金支付的概率为()
A.0.3B.0.4C.0.6D.0.7
3.从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为()
A.0.6B.0.5C.0.4D.0.3
二、填空题:
4.某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方式有简单随机抽样,分层抽样和系统抽样,则最适合的抽样方法是______.
5.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为___________.
6.某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为___________.
7.有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是___________(结果用最简分数表示).三、解答题:
8.某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图;
0.35m的概率;
(2)估计该家庭使用节水龙头后,日用水量小于3
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).
9.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17 )建立模型①:
ˆ30.413.5y
t =-+;根据2000年至2016的数据(时间变量t 的值依次为1,2,,7 )建立模型②:ˆ9917.5y
t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
10.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式. 为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人. 第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:
()
()()()()
2
2
n ad bc
K
a b c d a c b d
-
=
++++
,
11.电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.
(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;
(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)
12.已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.
(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?
(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.
答案:ABD ;分层抽样;90;310;1
5
8.答:(1)
(2)0.48;(3)3
47.45m
9.答:
10.答:(1)第二组生产方式效率更高;从茎叶图观察可知,第二组数据集中在70min~80min
之间,而第一组数据集中在80min~90min 之间,故可估计第二组的数据平均值要小于第一组数据平均值,事实上:
16872767779828383848586878788899090919192
84
20
E +++++++++++++++++++=
=同理274.7E =,21E E < ,故第二组生产方式效率更高;
(2)由茎叶图可知,中位数
7981
80
2
m
+
==,且列联表为:
(3)由(2)可知
()2
22
2
40155
10 6.635
20202020
K
-
==>
⨯⨯⨯
,故有99%的把握认为两种生产方式
的效率有差异.
11.答:(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.
12.答:(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人;
(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为:
{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},
{E,G},{F,G},共21种;(ii)5 21。