高考理科概率与统计专题
- 格式:docx
- 大小:153.67 KB
- 文档页数:8
统计与概率专题(理科)【总知识脉络】概率概念随机事件必然事件不可能事件随机事件的概率等可能性事件的概率互斥事件互斥事件有一个发生的概率相互独立事件相互独立事件同时发生的概率计算频率与概率数理统计随机变量离散型随即变量随即变量的概率分布列数学期望方差连续型随即变量抽样方法系统抽样分层抽样简单随机抽样【知识梳理】一、离散型随机变量及其分布列、均值与方差1、随机变量、离散型随机变量的定义(1)随机变量:如果随机试验可能出现的结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化,那么这样的变量叫做随机变量. 随机变量常用大写字母X 、Y 等或希腊字母ξ、η等表示。
(2)离散型随机变量:在上面的射击、产品检验等例子中,对于随机变量X 可能取的值,我们可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.2、离散型随机变量的分布列:(1)定义:一般的,设离散型随机变量X 可能取的值为12,,,,,i n x x x xX 取每一个值(1,2,)i x i =的概率()i i P x p ξ==,则称表为离散型随机变量X 的概率分布,简称分布列:(2)分布列性质:①0,1,2,i p i ≥= ;②12... 1.n p p p +++=3、两点分布与超几何分布(1)二点分布:如果随机变量X 的分布列为:其中01,1p q p <<=-,则称离散型随机变量X 服从参数p 的二点分布(2)超几何分布:一般地, 设总数为N 件的两类物品,其中一类有M 件,从所有物品中任取()n n N ≤件,这n 件中所含这类物品件数X 是一个离散型随机变量,则它取值为k 时的概率为),2,1,0()(m k C C C k X P nNk n MN k M ===--, 其中{}min,m M n =,且*,,,,n N M N n M N N∈≤≤4、※均值与方差※则称1122()n n E X x p x p x p =+++为X 的数学期望或平均数、均值,数学期望又简称为期望.是离散型随机变量。
概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
概率与统计(理科)一、高考考试内容离散型随机变量的分布列,离散型随机变量的期望和方差。
抽样方法、总体分布的估计、正态分布、线性回归。
二、考试要求:(1)了解离散型随机变量的意义,会求某些简单的离散型随机变量的分布列。
(2)了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。
(3)会用随机抽样,系统抽样,分层抽样等常用的抽样方法从总体中抽取样本。
(4)会用样本频率分布去估计总体分布。
(5)了解正态分布的意义及主要性质。
(6)了解线性回归的方法和简单应用。
三、应试策略1、正确理解有关概念。
(1)随机试验与随机事件:在一定条件下可能发生也可能不发生的事件叫随机事件;条件每实现一次,叫做一次试验;如果试验结果预先无法确定,这种试验叫做随机试验。
(2)频率与概率:对于一个事件来说概率是一个常数;频率则随着试验次数的变化而变化,试验次数越多,频率就越接近于事件的概率。
(3)互斥事件与对立事件:对立事件一定是互斥事件,但互斥事件不一定是对立事件。
(4)互斥事件与相互独立事件:不可能同时发生的事件叫互斥事件,而相互独立事件则是指两个事件是否发生与否相互之间没有影响。
2、公式的应用(1)常用公式 ①等可能事件的概率:基本事件总数中所含基本事件数A n m A P ==)( ②互斥事件的概率:)()()(B P A P B A P +=+③对立事件的概率:1)()()(____=+=+A P A P A A P④相互独立事件的概率:)()()(B P A P B A P ⋅=⋅⑤n 次独立重复试验中事件A 恰好发生k 次的概率:k n k k n n P P C k P --=)1()((2)注意事项:①每个公式都有成立的条件,若不满足条件,则这些公式将不再成立。
②对于一个概率问题,应首先弄清它的类型,不同的类型采用不同的计算方法,一般题中总有关键语说明其类型,对于复杂问题要善于进行分解,或者运用逆向思考的方法。
高考数学概率统计解答题专题一、归类解析题型一:离散型随机变量的期望与方差【解题指导】离散型随机变量的期望和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如两点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的期望和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率的对应.【例】某品牌汽车4S店,对最近100位采用分期付款的购车者进行统计,统计结果如下表所示.已知分9期付款的频率为0.2.4S店经销一辆该品牌的汽车,顾客分3期付款,其利润为1万元;分6期或9期付款,其利润为1.5万元;分12期或15期付款,其利润为2万元.用η表示经销一辆汽车的利润.(1)求上表中的a,b值;(2)若以频率作为概率,求事件A“购买该品牌汽车的3位顾客中,至多有1位采用分9期付款”的概率P(A);(3)求η的分布列及期望E(η).【变式训练】某项大型赛事,需要从高校选拔青年志愿者,某大学生实践中心积极参与,从8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X,求X的分布列及期望.题型二:概率与统计的综合应用【解题指导】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.【例】某公司计划购买2台机器,该种机器使用三年后即被淘汰,机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数.(1)求X的分布列;(2)若要求P (X ≤n )≥0.5,确定n 的最小值;(3)以购买易损零件所需费用的期望值为决策依据,在n =19与n =20之中选其一,应选用哪个? 【变式训练】经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获得利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X (单位:t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X ∈[100,110),则取X =105,且X =105的概率等于需求量落入[100,110)的频率),求T 的期望. 题型三:概率与统计案例的综合应用【解题指导】 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.【例】高铁、网购、移动支付和共享单车被誉为中国的“新四大发明”,彰显出中国式创新的强劲活力.某移动支付公司从我市移动支付用户中随机抽取100名进行调查,得到如下数据:每周移动支付次数1次 2次 3次 4次 5次 6次及以上总计 男 10 8 7 3 2 15 45 女 5 4 6 4 6 30 55 总计1512137845100(1)把每周使用移动支付超过3次的用户称为“移动支付活跃用户”,能否在犯错误概率不超过0.005的前提下,认为是否为“移动支付活跃用户”与性别有关?(2)把每周使用移动支付6次及6次以上的用户称为“移动支付达人”,视频率为概率,在我市所有“移动支付达人”中,随机抽取4名用户.①求抽取的4名用户中,既有男“移动支付达人”又有女“移动支付达人”的概率;②为了鼓励男性用户使用移动支付,对抽出的男“移动支付达人”每人奖励300元,记奖励总金额为X ,求X 的分布列及期望. 附公式及表如下:χ2=nn 11n 22-n 12n 212n 1+n 2+n +1n +2.P (χ2≥k 0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828【变式训练】电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料是否可以认为“体育迷”与性别有关?非体育迷体育迷合计 男 女 10 55 合计(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X .若每次抽取的结果是相互独立的,求X 的分布列、期望E (X )和方差D (X ). 附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2.P (χ2≥k 0) 0.10 0.05 0.01 k 02.7063.8416.635二、专题突破训练1.为了增强消防安全意识,某中学对全体学生做了一次消防知识讲座,从男生中随机抽取50人,从女生中随机抽取70人参加消防知识测试,统计数据得到如下列联表:优秀 非优秀 合计 男生 15 35 50 女生 30 40 70 合计4575120(1)试判断能否有90%的把握认为消防知识的测试成绩优秀与否与性别有关?(2)为了宣传消防知识,从该校测试成绩获得优秀的同学中采用分层抽样的方法,随机选出6人组成宣传小组.现从这6人中随机抽取2人到校外宣传,求到校外宣传的同学中男生人数X 的分布列和期望. 附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2.2(1)求出y关于x的回归直线方程y=b x+a,并在坐标系中画出回归直线;(2)试预测加工10个零件需要的时间.3.为了评估天气对某市运动会的影响,制定相应预案,该市气象局通过对最近50多年气象数据资料的统计分析,发现8月份是该市雷电天气高峰期,在31天中平均发生雷电14.57天(如图所示).如果用频率作为概率的估计值,并假定每一天发生雷电的概率均相等,且相互独立.(1)求在该市运动会开幕(8月12日)后的前3天比赛中,恰好有2天发生雷电天气的概率(精确到0.01);(2)设运动会期间(8月12日至23日,共12天),发生雷电天气的天数为X,求X的期望和方差(精确到0.01).4.某婴幼儿游泳馆为了吸引顾客,推出优惠活动,即对首次消费的顾客按80元收费,并注册成为会员,对会员消费的不同次数给予相应的优惠,标准如下:假设每位顾客游泳1(1)估计该游泳馆1位会员至少消费2次的概率;(2)某会员消费4次,求这4次消费中,游泳馆获得的平均利润;(3)假设每个会员最多消费4次,以事件发生的频率作为相应事件发生的概率,从该游泳馆的会员中随机抽取2位,记游泳馆从这2位会员的消费中获得的平均利润之差的绝对值为X,求X的分布列和期望E(X).。
专题15概率与统计(选择题、填空题)(理科专用)1.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为1,2,3,且3>2>1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率;该棋手在第二盘与乙比赛且连胜两盘的概率乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为甲则甲=2(1−2)13+221(1−3)=21(2+3)−4123记该棋手在第二盘与乙比赛,且连胜两盘的概率为乙则乙=2(1−1)23+212(1−3)=22(1+3)−4123记该棋手在第二盘与丙比赛,且连胜两盘的概率为丙则丙=2(1−1)32+213(1−2)=23(1+2)−4123则甲−乙=21(2+3)−4123−22(1+3)−4123=21−23<0乙−丙=22(1+3)−4123−23(1+2)−4123=22−31<0即甲<乙,乙<丙,则该棋手在第二盘与丙比赛,最大.选项D判断正确;选项BC判断错误;与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D2.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C 72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率=21−721=23.故选:D.3.【2021年甲卷理科】已知12,F F 是双曲线C 的两个焦点,P 为C 上一点,且121260,3F PF PF PF ∠=︒=,则C 的离心率为()A 72B .132C D 【答案】A 【解析】【分析】根据双曲线的定义及条件,表示出12,PF PF ,结合余弦定理可得答案.【详解】因为213PF PF =,由双曲线的定义可得12222PF PF PF a -==,所以2PF a =,13PF a =;因为1260F PF ∠=︒,由余弦定理可得2224923cos60c a a a a =+-⨯⋅⋅︒,整理可得2247c a =,所以22274a c e ==,即2e =.故选:A 【点睛】关键点睛:双曲线的定义是入手点,利用余弦定理建立,a c 间的等量关系是求解的关键.4.【2021年甲卷理科】将4个1和2个0随机排成一行,则2个0不相邻的概率为()A .13B .25C .23D .45【答案】C 【解析】【分析】采用插空法,4个1产生5个空,分2个0相邻和2个0不相邻进行求解.【详解】将4个1和2个0随机排成一行,可利用插空法,4个1产生5个空,若2个0相邻,则有155C =种排法,若2个0不相邻,则有2510C =种排法,所以2个0不相邻的概率为1025103=+.故选:C.5.【2021年乙卷理科】在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于74的概率为()A .79B .2332C .932D .29【答案】B 【解析】【分析】设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,分别求出,A Ω对应的区域面积,根据几何概型的的概率公式即可解出.【详解】如图所示:设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,其面积为111SΩ=⨯=.设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,即图中的阴影部分,其面积为13323124432A S =-⨯⨯=,所以()2332A S P A S Ω==.故选:B.【点睛】本题主要考查利用线性规划解决几何概型中的面积问题,解题关键是准确求出事件,A Ω对应的区域面积,即可顺利解出.6.【2021年新高考1卷】有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则()A .甲与丙相互独立B .甲与丁相互独立C .乙与丙相互独立D .丙与丁相互独立【答案】B 【解析】【分析】根据独立事件概率关系逐一判断【详解】11561()()()()6636366P P P P =====甲,乙,丙丁,1()0()()()()()36P P P P P P =≠==甲丙甲丙,甲丁甲丁,1()()()()0()()36P P P P P P =≠=≠乙丙乙丙,丙丁丁丙,故选:B 【点睛】判断事件,A B 是否独立,先计算对应概率,再判断()()()P A P B P AB =是否成立7.【2021年新高考2卷】某物理量的测量结果服从正态分布()210,N σ,下列结论中不正确的是()A .σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大B .该物理量在一次测量中大于10的概率为0.5C .该物理量在一次测量中小于9.99与大于10.01的概率相等D .该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等【答案】D 【解析】【分析】由正态分布密度曲线的特征逐项判断即可得解.【详解】对于A ,2σ为数据的方差,所以σ越小,数据在10μ=附近越集中,所以测量结果落在()9.9,10.1内的概率越大,故A 正确;对于B ,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C ,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C 正确;对于D ,因为该物理量一次测量结果落在()9.9,10.0的概率与落在()10.2,10.3的概率不同,所以一次测量结果落在()9.9,10.2的概率与落在()10,10.3的概率不同,故D 错误.故选:D.8.【2020年新课标1卷理科】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是()A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x=+【答案】D 【解析】【分析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.9.【2020年新课标2卷理科】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A .10名B .18名C .24名D .32名【答案】B 【解析】【分析】算出第二天订单数,除以志愿者每天能完成的订单配货数即可.【详解】由题意,第二天新增订单数为50016001200900+-=,9001850=,故至少需要志愿者18名.故选:B 【点晴】本题主要考查函数模型的简单应用,属于基础题.10.【2020年新课标3卷理科】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是()A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B 【解析】【分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65As =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85Bs =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05Cs =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45Ds =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组的标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.11.【2020年新高考1卷(山东卷)】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A .62%B .56%C .46%D .42%【答案】C 【解析】【分析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,然后根据积事件的概率公式()P A B ⋅=()()()P A P B P A B +-+可得结果.【详解】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-=所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.12.【2019年新课标1卷理科】我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“——”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是A .516B .1132C .2132D .1116【答案】A【分析】本题主要考查利用两个计数原理与排列组合计算古典概型问题,渗透了传统文化、数学计算等数学素养,“重卦”中每一爻有两种情况,基本事件计算是住店问题,该重卦恰有3个阳爻是相同元素的排列问题,利用直接法即可计算.【详解】由题知,每一爻有2种情况,一重卦的6爻有62情况,其中6爻中恰有3个阳爻情况有36C ,所以该重卦恰有3个阳爻的概率为3662C =516,故选A .【点睛】对利用排列组合计算古典概型问题,首先要分析元素是否可重复,其次要分析是排列问题还是组合问题.本题是重复元素的排列问题,所以基本事件的计算是“住店”问题,满足条件事件的计算是相同元素的排列问题即为组合问题.13.【2019年新课标2卷理科】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差【答案】A 【解析】【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤ .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤ ,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++ ,后来平均数234817x x x x x '=+++ ()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦ 由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.本题旨在考查学生对中位数、平均数、方差、极差本质的理解.14.【2019年新课标3卷理科】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为A.0.5B.0.6C.0.7D.0.8【答案】C【解析】根据题先求出阅读过西游记的人数,进而得解.【详解】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.【点睛】本题考查容斥原理,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.15.【2018年新课标1卷理科】某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】【分析】首先设出新农村建设前的经济收入为M ,根据题意,得到新农村建设后的经济收入为2M ,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【详解】设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入我0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确;新农村建设前,养殖收入为0.3M ,新农村建设后为0.6M ,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的30%28%58%50%+=>,所以超过了经济收入的一半,所以D 正确;故选A.点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.16.【2018年新课标1卷理科】如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I ,II ,III 的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3【答案】A 【解析】【分析】首先设出直角三角形三条边的长度,根据其为直角三角形,从而得到三边的关系,然后应用相应的面积公式求得各个区域的面积,根据其数值大小,确定其关系,再利用面积型几何概型的概率公式确定出p 1,p 2,p 3的关系,从而求得结果.【详解】设,,AC b AB c BC a ===,则有222b c a +=,从而可以求得ABC ∆的面积为112=S bc ,黑色部分的面积为22221()()[()]2222c b a S bc πππ=⋅+⋅-⋅-2221(4442c b a bc π=+-+22211422c b a bc bc π+-=⋅+=,其余部分的面积为22311122282a a S bc bc ππ⎛⎫=⋅-=- ⎪⎝⎭,所以有12S S =,根据面积型几何概型的概率公式,可以得到12p p =,故选A.点睛:该题考查的是面积型几何概型的有关问题,题中需要解决的是概率的大小,根据面积型几何概型的概率公式,将比较概率的大小问题转化为比较区域的面积的大小,利用相关图形的面积公式求得结果.17.【2018年新课标2卷理科】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .112B .114C .115D .118【答案】C【解析】【详解】分析:先确定不超过30的素数,再确定两个不同的数的和等于30的取法,最后根据古典概型概率公式求概率.详解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有21045C =种方法,因为7+23=11+19=13+17=30,所以随机选取两个不同的数,其和等于30的有3种方法,故概率为31=4515,选C.点睛:古典概型中基本事件数的探求方法:(1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.(4)排列组合法:适用于限制条件较多且元素数目较多的题目.18.【2018年新课标3卷理科】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,()()46P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.3【答案】B【解析】【详解】分析:判断出为二项分布,利用公式()()D X np 1p =-进行计算即可.()()D X np 1p =- p 0.4∴=或p 0.6=()()()()6444661010P X 41P X 61C p p C p p ==-<==-,()221p p ∴-<,可知p 0.5>故答案选B.点睛:本题主要考查二项分布相关知识,属于中档题.19.【2021年新高考1卷】有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则()A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同【答案】CD【解析】【分析】A 、C 利用两组数据的线性关系有()()E y E x c =+、()()D y D x =,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B 、D 的正误.【详解】A :()()()E y E x c E x c =+=+且0c ≠,故平均数不相同,错误;B :若第一组中位数为i x ,则第二组的中位数为i i y x c =+,显然不相同,错误;C :()()()()D y D x D c D x =+=,故方差相同,正确;D :由极差的定义知:若第一组的极差为max min x x -,则第二组的极差为max min max min max min ()()y y x c x c x x -=+-+=-,故极差相同,正确;故选:CD20.【2021年新高考2卷】下列统计量中,能度量样本12,,,n x x x 的离散程度的是()A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【解析】【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.21.【2020年新高考1卷(山东卷)】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑ ,定义X 的信息熵21()log n i i i H X p p ==-∑.()A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n == ,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+= ,则H (X )≤H (Y )【答案】AC【解析】【分析】对于A 选项,求得()H X ,由此判断出A 选项;对于B 选项,利用特殊值法进行排除;对于C 选项,计算出()H X ,利用对数函数的性质可判断出C 选项;对于D 选项,计算出()(),H X H Y ,利用基本不等式和对数函数的性质判断出D 选项.【详解】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-,所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦,当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误.对于C 选项,若()11,2,,i p i n n== ,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m j P Y j p p +-==+(1,2,,j m = ).()2222111log log m m i i i i i iH X p p p p ===-⋅=⋅∑∑122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅ .()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅+⋅+++⋅+++ 12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++ 由于()01,2,,2i p i m >= ,所以2111i i m i p p p +->+,所以222111log log i i m i p p p +->+,所以222111log log i i i i m ip p p p p +-⋅>⋅+,所以()()H X H Y >,所以D 选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.22.【2020年新高考2卷(海南卷)】我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【解析】【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.23.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有=C84=70个结果,这4个点在同一个平面的有= 6+6=12个,故所求概率==1270=635.故答案为:635.24.【2022年新高考2卷】已知随机变量X服从正态分布2,2,且o2<≤2.5)=0.36,则o>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为∼2,2,所以<2=>2=0.5,因此>2.5=>2−2<≤2.5=0.5−0.36=0.14.故答案为:0.14.25.【2019年新课标1卷理科】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是____________.【答案】0.18【解析】【分析】本题应注意分情况讨论,即前五场甲队获胜的两种情况,应用独立事件的概率的计算公式求解.题目有一定的难度,注重了基础知识、基本计算能力及分类讨论思想的考查.【详解】前四场中有一场客场输,第五场赢时,甲队以4:1获胜的概率是30.60.50.520.108,⨯⨯⨯=前四场中有一场主场输,第五场赢时,甲队以4:1获胜的概率是220.40.60.520.072,⨯⨯⨯=综上所述,甲队以4:1获胜的概率是0.1080.0720.18.q =+=【点睛】由于本题题干较长,所以,易错点之一就是能否静心读题,正确理解题意;易错点之二是思维的全面性是否具备,要考虑甲队以4:1获胜的两种情况;易错点之三是是否能够准确计算.26.【2019年新课标2卷理科】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【解析】【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【详解】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.20.9840=.【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.。
高考数学2024概率与统计历年题目全集概率与统计是高中数学中一门重要的学科,也是高考数学考试的一部分。
在概率与统计中,我们需要通过概率的计算和统计的方法来分析和解决实际问题。
为了帮助同学们复习和准备高考数学考试,本文整理了高考数学2024概率与统计历年题目全集,希望能对同学们有所帮助。
1. 单项选择题1) 已知概率为P(A) = 0.2,P(B) = 0.4,事件A、B相互独立,求P(A并B)的值。
2) 一次抛掷一硬币,设正面向上的概率为p,反面向上的概率为q。
连续抛掷3次硬币,求正面朝上的次数不超过2次的概率。
3) 某音乐社有男生40人,女生60人。
从中随机抽取一人,求抽到女生的概率。
2. 典型案例题1) 某超市中购买了100个某品牌产品,其中有5个是次品。
现从中不放回地连续抽取3个产品,求至少有一个次品的概率。
2) 某餐厅的饭菜有4个主食和6个副食。
现从中选择2个饭菜,求至少有一个主食的概率。
3. 解答题1) 设事件A与事件B相互独立,且P(A) = 0.3,P(B) = 0.5。
求下列事件的概率:a) P(A并B)b) P(A或B)c) P(A的对立事件)2) 设P(A) = 0.4,P(B) = 0.3,P(A并B) = 0.1,求下列事件的概率:a) P(A的对立事件)b) P(B的对立事件)c) P(A或B)3) 有一批产品,其中20%是次品。
现从中不放回地连续抽取3个产品,求以下事件的概率:a) 已抽出的3个产品都是次品;b) 至少有一个次品。
(提示:利用组合数学中的排列、组合知识进行计算)本文仅列举了一部分高考数学2024概率与统计历年题目,希望能给同学们提供一些复习和备考的参考。
在备考过程中,同学们还需结合教材和课堂上的知识,多进行习题训练和模拟考试,提高解题能力和应试技巧。
祝同学们取得优异的高考成绩!。
专题四 概率与统计第1讲 概率、随机变量及其分布列(限时45分钟,满分96分)一、选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2019·株洲二模)如图,在边长为1的正方形内有不规则图形Ω,由电脑随机从正方形中抽取10 000个点,若落在图形Ω内和图形Ω外的豆子分别为3 335,6 665,则图形Ω面积的估计值为A.13B.12C.14D.16解析 设图形Ω 的面积为S ,∵由电脑随机从正方形中抽取10 000个点,落在图形Ω内和图形Ω外的豆子分别为3 335,6 665,∴S 1=3 33510 000≈13,∴S ≈13.故选A. 答案 A2.(2019·潍坊模拟)四色猜想是世界三大数学猜想之一,1976年数学家阿佩尔与哈肯证明,称为四色定理.其内容是:“任意一张平面地图只用四种颜色就能使具有共同边界的国家涂上不同的颜色.”用数学语言表示为“将平面任意地细分为不相重叠的区域,每一个区域总可以用1,2,3,4四个数字之一标记,而不会使相邻的两个区域得到相同的数字.”如图,网格纸上小正方形的边长为1,粗实线围成的各区域上分别标有数字1,2,3,4的四色地图符合四色定理,区域A 和区域B 标记的数字丢失.若在该四色地图上随机取一点,则恰好取在标记为1的区域的概率所有可能值中,最大的是A.115B.110C.13D.1130解析 A ,B 只能有一个可能为1,题目求最大,令B 为1,则总数有30个,1号有10个,则概率为13.故选C.答案 C3.(2019·浙江衢州五校联考)随机变量的分布列如下:若E (X )=13,则D (X )的值是A.19B.29C.49D.59解析 由题设可得a +b =23,b -a =13⇒a =16,b =12,所以由数学期望的计算公式可得 E (X 2)=0×13+1×23=23,(E (X ))2=19,所以由随机变量的方差公式可得 D (X )=E (X 2)-(E (X ))2=59.故选D.答案 D4.(2019·河北省级示范校联合体联考)袋子中有四个小球,分别写有“和、平、世、界”四个字,有放回地从中任取一个小球,直到“和”“平”两个字都取到就停止,用随机模拟的方法估计恰好在第三次停止的概率.利用电脑随机产生0到3之间取整数值的随机数,分别用0,1,2,3代表“和、平、世、界”这四个字,以每三个随机数为一组,表示取球三次的结果,经随机模拟产生了以下24个随机数组:232 321 230 023 123 021 132 220 011 203 331 100 231 130 133 231 031 320 122 103 233 221 020 132 由此可以估计,恰好第三次就停止的概率为 A.18B.14C.16D.524解析 由题意可知,满足条件的随机数组中,前两次抽取的数中必须包含0或1,且0与1不能同时出现,出现0就不能出现1,反之亦然,第三次必须出现前面两个数字中没有出现的1或0,可得符合条件的数组只有3组:021,130,031,故所求概率为P =324=18.故选A.答案 A5.(2019·郑州一模)魔法箱中装有6张卡片,上面分别写着如下六个定义域为R 的函数:f 1(x )=2x ,f 2(x )=2x,f 3(x )=x 2,f 4(x )=sin x ,f 5(x )=cos x ,f 6(x )=1-2x1+2x,现从魔法箱中任取2张卡片,将卡片上的函数相乘得到一个新函数,所得新函数为奇函数的概率是A.25B.35C.12D.13解析 首先结合f (-x )+f (x )与0的关系,判断该六个函数的奇偶性,结合题意可知1,4,6为奇函数,3,5为偶函数,2为非奇非偶函数,从6张卡片抽取2张,有C 26=15种,而任取2张卡片得到的新函数为奇函数,说明该两个函数为一奇一偶函数,故有3×2=6种,结合古典概型计算公式,相除得25.故选A.答案 A6.(2019·辽阳期末)一批排球中正品有m 个,次品有n 个,m +n =10(m ≥n ),从这批排球中每次随机取一个,有放回地抽取10次,X 表示抽到的次品个数.若D (X )=21,从这批排球中随机抽取两个,则至少有一个正品的概率p =A.4445B.1415C.79D.1315解析 依题意可得X ~B ⎝⎛⎭⎫10,n10, 则DX =10×n10×⎝⎛⎭⎫1-n 10=21, 又m ≥n ,则n ≤5,从而n =3, 则p =1-C 23C 210=1415.故选B.答案 B7.(2019·济南期末)如图,在△ABC 中,∠C =90°,BC =2,AC =3,三角形内的空白部分由三个半径均为1的扇形构成,向△ABC 内随机投掷一点,则该点落在阴影部分的概率为A.π6B .1-π6C.π4D .1-π4解析 由题意,题目符合几何概型,在△ABC 中,∠C =90°,BC =2,AC =3,面积为12×BC ×AC =3,阴影部分的面积为:三角形面积-12圆面积=3-π2,所以点落在阴影部分的概率为3-π23=1-π6.故选B.答案 B8.(2019·贵州重点中学联考)有一种“三角形”能够像圆一样,当作轮子用.这种神奇的三角形,就是以19世纪德国工程师勒洛的名字命名的勒洛三角形.这种三角形常出现在制造业中(例如图1中的扫地机器人).三个等半径的圆两两互相经过圆心,三个圆相交的部分就是勒洛三角形,如图2所示.现从图2中的勒洛三角形内部随机取一点,则此点取自阴影部分的概率为A.2π-334π-23 B.23π3-3C.32π-23D.2π-332π-23解析 设圆半径为R ,如图,易得△ABC 的面积为12·32R 2=34R 2,阴影部分面积为3·60πR 2360-3·34R 2=2π-334R 2,勒洛三角形的面积为2π-334R 2+34R 2=π-32R 2,若从勒洛三角形内部随机取一点, 则此点取自阴影部分的概率为P =阴影部分面积勒洛三角形面积=2π-334R 2π-32R 2=2π-332π-23.故选D.答案 D二、填空题(本大题共4小题,每小题5分,共20分)9.一个盒子装有3个红球和2个蓝球(小球除颜色外其他均相同),从盒子中一次性随机取出3个小球后,再将小球放回.重复50次这样的实验.记“取出的3个小球中有2个红球,1个蓝球”发生的次数为ξ,则ξ的方差是________.解析 由题意知ξ~B (n ,p ),其中n =50,p =C 23C 12C 35=610=35,∴D (ξ)=50×35×25=12.答案 1210.(2019·淮南二模)关于圆周率π的近似值,数学发展史上出现过很多有创意的求法,其中可以通过随机数实验来估计π的近似值.为此,李老师组织100名同学进行数学实验教学,要求每位同学随机写下一个实数对(x ,y ),其中0<x <1,0<y <1,经统计数字x 、y 与1可以构成钝角三角形三边的实数对(x ,y )为28个,由此估计π的近似值是________(用分数表示).解析 实数对(x ,y )落在区域⎩⎨⎧0<x <10<y <1的频率为0.28,又设A 表示“实数对(x ,y )满足⎩⎨⎧0<x <10<y <1且能与1构成钝角三角形”,则A 中对应的基本事件如图阴影部分所示:其面积为π4-12,故P (A )=π4-12≈0.28,所以π≈7825.答案782511.(2019·长春外国语学校月考)已知直线l 过点(-1,0),l 与圆C :(x -1)2+y 2=3相交于A 、B 两点,则弦长|AB |≥2的概率为________.解析 显然直线l 的斜率存在, 设直线方程为y =k (x +1), 代入(x -1)2+y 2=3中得, (k 2+1)x 2+2(k 2-1)x +k 2-2=0, ∵l 与⊙C 相交于A 、B 两点, ∴Δ=4(k 2-1)2-4(k 2+1)(k 2-2)>0, ∴k 2<3,∴-3<k <3,又当弦长|AB |≥2时,∵圆半径r =3, ∴圆心到直线的距离d ≤2,即|2k |1+k2≤2, ∴k 2≤1,∴-1≤k ≤1.由几何概型知,事件M :“直线l 与圆C 相交弦长|AB |≥2”的概率 P (M )=1-(-1)3-(-3)=33.答案3312.有一批种子的发芽率为0.9,出芽后的幼苗成活率为0.8,在这批种子中,随机抽取一粒,则这粒种子能成长为幼苗的概率为________.解析 设种子发芽为事件A ,种子成长为幼苗为事件B (发芽又成活为幼苗). 依题意P (B |A )=0.8,P (A )=0.9. 根据条件概率公式P (AB )=P (B |A )·P (A )=0.8×0.9=0.72, 即这粒种子能成长为幼苗的概率为0.72. 答案 0.72三、解答题(本大题共3小题,每小题12分,共36分)13.(2019·湖南三湘名校二联)某种产品的质量以其质量指标值来衡量,质量指标值越大表明质量越好,记其质量指标值为k ,当k ≥85时,产品为一等品;当75≤k <85时,产品为二等品;当70≤k <75时,产品为三等品.现有甲、乙两条生产线,各生产了100件该产品,测量每件产品的质量指标值,得到下面的试验结果.(以下均视频率为概率)甲生产线生产的产品的质量指标值的频数分布表:乙生产线生产的产品的质量指标值的频数分布表:(1)若从乙生产线生产的产品中有放回地随机抽取3件,求至少抽到2件三等品的概率; (2)若该产品的利润率y 与质量指标值k 满足关系y =⎩⎪⎨⎪⎧t ,k ≥855t 2,75≤k <85t 2,70≤k <75,其中0<t <15,从长期来看,哪条生产线生产的产品的平均利润率更高?请说明理由.解析 (1)由题意知,从乙生产线生产的产品中随机抽取一次抽中三等品的概率为110,所以至少抽到2件三等品的概率P =C 23×⎝⎛⎭⎫1102×910+⎝⎛⎭⎫1103=7250.(2)甲生产线生产的产品的利润分布列为所以E (y 甲)=0.6t +2t 2,乙生产线生产的产品的利润分布列为所以 E (y 乙)=0.5t +2.1t 2, 因为0<t <15,所以E (y 乙)-E (y 甲)=0.1t 2-0.1t =0.1t (t -1)<0,所以从长期来看,甲生产线生产的产品平均利润率较大.14.(2019·佛山禅城区二调)研究机构培育一种新型水稻品种,首批培育幼苗2 000株,株长均介于185 mm ~235 mm ,从中随机抽取100株对株长进行统计分析,得到如下频率分布直方图(1)求样本平均株长x -和样本方差s 2(同一组数据用该区间的中点值代替);(2)假设幼苗的株长X 服从正态分布N (μ,σ2),其中μ近似为样本平均数x -,σ2近似为样本方差s 2,试估计2 000株幼苗的株长位于区间(201,219)的株数;(3)在第(2)问的条件下,选取株长在区间(201,219)内的幼苗进入育种试验阶段,若每株幼苗开花的概率为34,开花后结穗的概率为23,设最终结穗的幼苗株数为ξ,求ξ的数学期望.附:83≈9;若X ~N (μ,σ2),则P (μ-σ<X <μ+σ)=0.683; P (μ-2σ<X <μ+2σ)=0.954;P (μ-3σ<X <μ+3σ)=0.997解析 (1)x -=190×0.02+200×0.315+210×0.35+220×0.275+230×0.04=210, s 2=202×0.02+102×0.315+102×0.275+202×0.04=83.(2)由(1)知, μ=x -=210,σ=83≈9, ∴P (201<X <219)=P (210-9<X <210+9)=0.683, 2 000×0.683=1 366∴2 000株幼苗的株长位于区间(201,219)的株数大约是1 366.(3)由题意,进入育种试验阶段的幼苗数1 366,每株幼苗最终结穗的概率P =12,则ξ-B ⎝⎛⎭⎫1 366,12, 所以E (ξ)=1 366×12=683.15.(2019·河北示范高中联合体联考)某工厂共有男女员工500人,现从中抽取100位员工对他们每月完成合格产品的件数统计如下:(1)其中每月完成合格产品的件数不少于3 200件的员工被评为“生产能手”.由以上统计数据填写下面的2×2列联表,并判断是否有95%的把握认为“生产能手”与性别有关?(2)为提高员工劳动的积极性,工厂实行累进计件工资制:规定每月完成合格产品的件数在定额2 600件以内的,计件单价为1元;超出(0,200]件的部分,累进计件单价为1.2元;超出(200,400]件的部分,累进计件单价为1.3元;超出400件以上的部分,累进计件单价为1.4元.将这4段的频率视为相应的概率,在该厂男员工中随机选取1人,女员工中随机选取2人进行工资调查,设实得计件工资(实得计件工资=定额计件工资+超定额计件工资)不少于3 100元的人数为Z ,求Z 的分布列和数学期望.附:K 2=(ad -bc )2(a +b )(c +d )(a +c )(b +d ),解析 (1)因为K 2的观测值k =100×(48×8-42×2)250×50×90×10=4>3.841,所以有95%的把握认为“生产能手”与性别有关. (2)当员工每月完成合格产品的件数为3 000件时, 得计件工资为2 600×1+200×1.2+200×1.3 =3 100元,由统计数据可知,男员工实得计件工资不少于3 100元的概率为p 1=25,女员工实得计件工资不少于3 100元的概率为p 2=12,设2名女员工中实得计件工资不少于3 100元的人数为X ,1名男员工中实得计件工资在3 100元以及以上的人数为Y ,则X ~B ⎝⎛⎭⎫2,12,Y ~B ⎝⎛⎭⎫1,25, Z 的所有可能取值为0,1,2,3,P (Z =0)=P (X =0,Y =0)=⎝⎛⎭⎫1-122⎝⎛⎭⎫1-25=320, P (Z =1)=P (X =1,Y =0)+P (X =0,Y =1) =C 12·12·⎝⎛⎭⎫1-12⎝⎛⎭⎫1-25+⎝⎛⎭⎫1-12225=25, P (Z =2)=P (X =2,Y =0)+P (X =1,Y =1) =C 22⎝⎛⎭⎫122⎝⎛⎭⎫1-25+C 1212⎝⎛⎭⎫1-1225=720, P (Z =3)=P (X =2,Y =1)=⎝⎛⎭⎫122×25=110, 所以Z 的分布列为故E (Z )=0×320+1×25+2×720+3×110=75.。
专题10 概率与统计【2020年】1.(2020·新课标Ⅲ)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( ) A. 14230.1,0.4p p p p ==== B. 14230.4,0.1p p p p ==== C. 14230.2,0.3p p p p ====D. 14230.3,0.2p p p p ====2.(2020·山东卷)6名同学到甲、乙、丙三个场馆做志愿者,每名同学只去1个场馆,甲场馆安排1名,乙场馆安排2名,丙场馆安排3名,则不同的安排方法共有( ) A. 120种 B. 90种 C. 60种D. 30种3.(2020·山东卷)某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是( ) A. 62% B. 56% C. 46%D. 42%4.(2020·天津卷)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A. 10B. 18C. 20D. 365.(2020·天津卷)已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________.6.(2020·浙江卷)一个盒子里有1个红1个绿2个黄四个相同的球,每次拿一个,不放回,拿出红球即停,设拿出黄球的个数为ξ,则(0)P ξ==_______;()E ξ=______.7.(2020·江苏卷)已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是_____.8.(2020·江苏卷)将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____.9.(2020·新课标Ⅱ)4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学,则不同的安排方法共有__________种. 【2019年】1.【2019年高考全国Ⅲ卷理数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( ) A .0.5 B .0.6 C .0.7D .0.82.【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( ) A .中位数 B .平均数 C .方差D .极差3.【2019年高考浙江卷】设0<a <1,则随机变量X 的分布列是( )则当a 在(0,1)内增大时, A .()D X 增大B .()D X 减小C .()D X 先增大后减小D .()D X 先减小后增大4.【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是______________. 5.【2019年高考全国Ⅱ卷理数】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为______________.6.【2019年高考全国Ⅰ卷理数】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是______________. 【2018年】1.【2018·全国Ⅱ卷】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是 A .112 B .114 C .115D .1182.【2018·全国Ⅰ卷】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例 建设后经济收入构成比例 则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半3.【2018·全国Ⅲ卷】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,(4)(6)P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.34.【2018·浙江卷】设01p <<,随机变量ξ的分布列是ξ 0 1 2 P12p- 122p 则当p 在(0,1)内增大时, A .D (ξ)减小 B .D (ξ)增大C .D (ξ)先减小后增大D .D (ξ)先增大后减小5.【2018·全国Ⅰ卷】下图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .ABC △的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 36.【2018·江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为______________.7.【2018·江苏卷】某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为______________. 【2017年】1.【2017·全国Ⅲ卷】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳2.【2017·全国Ⅰ卷】如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14 B .π8 C .12D .π43.【2017·山东卷】从分别标有1,2,⋅⋅⋅,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是A .518 B .49 C .59D .7912.【2017·浙江卷】已知随机变量i ξ满足P (i ξ=1)=p i ,P (i ξ=0)=1–p i ,i =1,2.若0<p 1<p 2<12,则A .1()E ξ<2()E ξ,1()D ξ<2()D ξB .1()E ξ<2()E ξ,1()D ξ>2()D ξC .1()E ξ>2()E ξ,1()D ξ<2()D ξD .1()E ξ>2()E ξ,1()D ξ>2()D ξ4.【2017·山东卷】为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为 A .160 B .163 C .166D .1705.【2017·全国Ⅱ卷】一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X 表示抽到的二等品件数,则DX =______________.6.【2017·江苏卷】记函数2()6f x x x =+-的定义域为D .在区间[4,5]-上随机取一个数x ,则x D ∈的概率是______________.7.【2017·江苏卷】某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取______________件. 【2016年】1. 【2016高考新课标1卷】某公司的班车在7:00,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( ) (A )13 (B )12 (C )23 (D )342.【2016高考新课标3理数】某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15C ︒,B 点表示四月的平均最低气温约为5C ︒.下面叙述不正确的是( )(A)各月的平均最低气温都在0C ︒以上 (B)七月的平均温差比一月的平均温差大 (C)三月和十一月的平均最高气温基本相同 (D)平均气温高于20C ︒的月份有5个3.【2016高考山东理数】某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20), [20,22.5), [22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ) (A )56(B )60(C )120(D )1404.【2016高考新课标2理数】从区间[]0,1随机抽取2n 个数1x ,2x ,…,n x ,1y ,2y ,…,n y ,构成n 个数对()11,x y ,()22,x y ,…,(),n n x y ,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为 (A )4n m (B )2n m (C )4m n (D )2m n5.【2016年高考北京理数】袋中装有偶数个球,其中红球、黑球各占一半.甲、乙、丙是三个空盒.每次从袋中任意取出两个球,将其中一个球放入甲盒,如果这个球是红球,就将另一个球放入乙盒,否则就放入丙盒.重复上述过程,直到袋中所有球都被放入盒中,则()A.乙盒中黑球不多于丙盒中黑球B.乙盒中红球与丙盒中黑球一样多C.乙盒中红球不多于丙盒中红球D.乙盒中黑球与丙盒中红球一样多6.【2016高考江苏卷】将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是 ▲ .7.【2016年高考四川理数】同时抛掷两枚质地均匀的硬币,当至少有一枚硬币正面向上时,就说这次试验成功,则在2次试验中成功次数X 的均值是 .328.【2016高考新课标2理数】有三张卡片,分别写有1和2,1和3,2和3.甲,乙,丙三人各取走一张卡片,甲看了乙的卡片后说:“我与乙的卡片上相同的数字不是2”,乙看了丙的卡片后说:“我与丙的卡片上相同的数字不是1”,丙说:“我的卡片上的数字之和不是5”,则甲的卡片上的数字是 .9.【2016高考江苏卷】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________▲________.10.【2016高考山东理数】在[1,1]上随机地取一个数k,则事件“直线y=kx与圆22x y相交”发生(5)9的概率为.。
高考理科统计概率知识点在高中数学课程中,统计概率是一个重要的知识点。
它涉及到我们日常生活中各种事件和现象的概率计算。
掌握统计概率知识不仅对于高考和考试有帮助,更重要的是它能够让我们在生活中做出更合理的决策,并更好地理解和分析数据。
本文将介绍高考理科统计概率的相关知识点。
1. 随机事件与样本空间统计概率的基础是随机事件和样本空间的概念。
随机事件是指在一次试验中可能发生的一个结果,而样本空间则是这个试验中所有可能结果的集合。
例如,掷一枚硬币的随机事件为正面和反面,样本空间为{正,反}。
另外,补事件、事件的并、交、差、互斥等概念也是理解统计概率的基础。
2. 古典概型在某些试验中,样本空间中各个结果的概率相等,这种情况下可以采用古典概型进行概率计算。
例如,掷一枚均匀骰子的概率计算,每个点数出现的概率为1/6。
这种情况下,样本空间中的每个结果出现的概率相等。
3. 条件概率条件概率是指在一个已知事件发生的条件下,另一个事件发生的概率。
例如,在一副扑克牌中,从中任意抽出一张牌,求其为红心的条件概率。
条件概率的计算需要用到样本空间中的事件和已知信息。
4. 独立事件独立事件是指两个事件之间互不影响的情况。
例如,从一堆扑克牌中抽一张,再把它放回,重新抽一张,两次抽到红心的概率不会相互影响。
对于独立事件,可以用乘法原理进行概率计算。
5. 全概率公式和贝叶斯公式全概率公式和贝叶斯公式是概率论中的重要定理,它们在实际问题中的应用非常广泛。
全概率公式用于计算一个事件的概率,利用该事件与可能发生的几个互斥事件的概率之间的关系。
贝叶斯公式则用于根据已知的条件概率来计算另一个事件的概率,应用于研究事件之间的因果关系。
6. 期望与方差期望和方差是统计概率中常用的指标,用于描述随机事件的平均情况和变异程度。
期望是指随机事件在多次试验中的平均结果,方差是指随机事件结果与其均值之间的差异程度。
在概率分布和数据分析中,期望和方差是对数据进行分析和比较的重要依据。
概率统计大题综合知识点总结1.数字样本特征(1)众数:在一组数据中出现次数最多的数(2)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数(3)平均数:x =x 1+x 2+⋯⋯+x nn ,反映样本的平均水平(4)方差:s 2=(x 1−x )2+(x 2−x )2+⋯⋯(x n −x )2n反映样本的波动程度,稳定程度和离散程度;s 2越大,样本波动越大,越不稳定;s 2越小,样本波动越小,越稳定;(5)标准差:σ=s 2,标准差等于方差的算术平方根,数学意义和方差一样(6)极差:等于样本的最大值−最小值2.求随机变量X 的分布列的步骤:(1)理解X 的意义,写出X 可能取得全部值;(2)求X 取每个值的概率;(3)写出X 的分布列;(4)根据分布列的性质对结果进行检验.还可判断随机变量满足常见分布列:两点分布,二项分布,超几何分布,正态分布.3.求随机变量的期望和方差的基本方法:(1)已知随机变量的分布列,直接利用期望和方差公式直接求解;(2)已知随机变量X 的期望、方差,求aX +b a ,b ∈R 的期望与方差,利用期望和方差的性质E aX +b =aE X +b ,D aX +b =a 2D X 进行计算;(3)若能分析出所给的随机变量服从常用的分布(如:两点分布、二项分布等),可直接利用常用分布列的期望和方差公式进行计算,若ξ~B (n ,p ),则Eξ=np ,Dξ=np (1-p ).4.求解概率最大问题的关键是能够通过P ξ=k ≥P ξ=k +1P ξ=k ≥Pξ=k -1构造出不等关系,结合组合数公式求解结果5.线性回归分析解题方法:(1)计算x ,y,ni =1x i 2 ,ni =1x i y i 的值;(2)计算回归系数a ,b ;(3)写出回归直线方程y =b x +a.线性回归直线方程为:y =b x +a ,b=ni =1x i −x y i −yni =1x i −x2=ni =1x i y i −nx yni =1x i 2−nx2,a =y −b x其中x ,y为样本中心,回归直线必过该点(4)线性相关系数(衡量两个变量之间线性相关关系的强弱)r=ni=1x i−xy i−yni=1x i−x2ni=1y i−y2=ni=1x i y i−nx yni=1x i2−nx 2ni=1y i2−ny 2r>0,正相关;r<0,负相关r ≤1,且r 越接近于1,线性相关性越强;r 越接近于0,线性相关性越弱,几乎不存在线性相关性6.独立性检验解题方法:(1)依题意完成列联表;(2)用公式求解;(3)对比观测值即可得到所求结论的可能性独立性检验计算公式:K2=n ad-bc2a+bc+da+cb+d模拟训练一、解答题1.(2023·福建三明·统考三模)在二十大报告中,体育、健康等关键词被多次提及,促进群众体育和竞技体育全面发展,加快建设体育强国是全面建设社会主义现代化国家的一个重要目标.某校为丰富学生的课外活动,加强学生体质健康,拟举行羽毛球团体赛,赛制采取3局2胜制,每局都是单打模式,每队有5名队员,比赛中每个队员至多上场一次且是否上场是随机的,每局比赛结果互不影响.经过小组赛后,最终甲、乙两队进入最后的决赛,根据前期比赛的数据统计,甲队种子选手M对乙队每名队员的胜率均为34,甲队其余4名队员对乙队每名队员的胜率均为12.(注:比赛结果没有平局)(1)求甲队最终2:1获胜且种子选手M上场的概率;(2)已知甲队2:1获得最终胜利,求种子选手M上场的概率.2.(2023·湖北武汉·统考模拟预测)“英才计划”最早开始于2013年,由中国科协、教育部共同组织实施,到2022年已经培养了6000多名具有创新潜质的优秀中学生,为选拔培养对象,某高校在暑假期间从武汉市的中学里挑选优秀学生参加数学、物理、化学、信息技术学科夏令营活动.(1)若化学组的12名学员中恰有5人来自同一中学,从这12名学员中选取3人,ξ表示选取的人中来自该中学的人数,求ξ的分布列和数学期望;(2)在夏令营开幕式的晚会上,物理组举行了一次学科知识竞答活动.规则如下:两人一组,每一轮竞答中,每人分别答两题,若小组答对题数不小于3,则取得本轮胜利,假设每轮答题结果互不影响.已知甲、乙两位同学组成一组,甲、乙答对每道题的概率分别为p1,p2,且p1+p2=43,如果甲、乙两位同学想在此次答题活动中取得6轮胜利,那么理论上至少要参加多少轮竞赛?3.(2023·福建宁德·校考二模)某科研团以为了考察某种药物预防疾病的效果,进行动物实验,得到如下列联表.患病未患病总计服用药物1045末服用药物50总计30(1)请将上面的列联表补充完整.(2)认为“药物对预防疾病有效”犯错误的概率是多少?(3)为了进一步研究,现按分层抽样的方法从未患病动物中抽取10只,设其中未服用药物的动物数为ξ,求ξ的分布列与期望.下面的临界值表供参考:P(K2≥k)0.150.100.050.0250.0100.0050.001k 2.0722706 3.841 5.024 6.6357.87910.828(参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)4.(2023·江苏常州·校考一模)设X,Y是一个二维离散型随机变量,它们的一切可能取的值为a i,b j,其中i,j∈N*,令p ij=P X=a i,Y=b j,称p ij i,j∈N*是二维离散型随机变量X,Y的联合分布列,与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式;X,Yb1b2b3⋅⋅⋅a1p11p12p13⋅⋅⋅a2p21p22p23⋅⋅⋅a3p31p32p33⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅现有n n∈N*个球等可能的放入编号为1,2,3的三个盒子中,记落入第1号盒子中的球的个数为X,落入第2号盒子中的球的个数为Y.(1)当n=2时,求X,Y的联合分布列,并写成分布表的形式;(2)设p k=nm=0P X=k,Y=m,k∈N且k≤n,求nk=0kp k的值.(参考公式:若X~B n,p,则nk=0kC k np k1-pn-k=np)5.(2023·江苏南京·南京市第九中学校考模拟预测)某种疾病可分为A,B两种类型,为了解该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者人数是男性患者的2倍,男性患A型疾病的人数占男性患者的56,女性患A型疾病的人数占女性患者的13.A型病B型病合计男女合计(1)填写2×2列联表,若本次调查得出“在犯错误的概率不超过0.005的前提下认为‘所患疾病的类型'与‘性别'有关”的结论,求被调查的男性患者至少有多少人?(2)某团队进行预防A型疾病的疫苗的研发试验,试验期间至多安排2个周期接种疫苗,每人每个周期接种3次,每次接种费用为m m>0元.该团队研发的疫苗每次接种后产生抗体的概率为p0<p<1,如果一个周期内至少2次出现抗体,则该周期结束后终止试验,否则进入第二个周期.若p=23,试验人数为1000人,试估计该试验用于接种疫苗的总费用.K2=n ad-bc2a+bc+da+cb+d,P K2≥k00.100.050.010.0050.001k0 2.706 3.841 6.6357.87910.8286.(2023·安徽蚌埠·统考三模)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生40女生30合计(1)根据所给数据完成上表,依据α=0.001的独立性检验,能否认为该校学生喜欢足球与性别有关?(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人射门相互独立,求3人进球总次数X的分布列和数学期望.附:χ2=n ad-bc2a+bc+da+cb+dα0.10.050.010.0050.001 xα 2.706 3.841 6.6357.87910.8287.(2023·海南海口·海南华侨中学校考模拟预测)在以视觉为主导的社交媒体时代,人们常借助具有美颜功能的产品对自我形象进行美化.移动端的美颜拍摄类APP 主要有两类:A 类是以自拍人像、美颜美妆为核心功能的APP ;B 类是图片编辑、精修等图片美化类APP .某机构为调查市民对上述A ,B 两类APP 的使用情况,随机调查了部分市民.已知被调查的市民中使用过A 类APP 的占60%,使用过B 类APP 的占50%,设个人对美颜拍摄类APP 类型的选择及各人的选择之间相互独立.(1)从样本人群中任选1人,求该人使用过美颜拍摄类APP 的概率;(2)从样本人群中任选5人,记X 为5人中使用过美颜拍摄类APP 的人数,设X 的数学期望为E X ,求P X =E X ;(3)在单独使用过A ,B 两类APP 的样本人群中,按类型分甲、乙两组,并在各组中随机抽取8人,甲组对A 类APP ,乙组对B 类APP 分别评分如下:甲组评分9486929687939082乙组评分8583859175908380记甲、乙两组评分的平均数分别为x 1 ,x 2 ,标准差分别为s 1,s 2,试判断哪组评价更合理.(设V i=s ix i (i =1,2),V i 越小,则认为对应组评价更合理.)参考数据:0.1925≈0.439,0.2325≈0.482.8.(2023·广东·统考模拟预测)某工厂车间有6台相同型号的机器,各台机器相互独立工作,工作时发生故障的概率都是14,且一台机器的故障由一个维修工处理.已知此厂共有甲、乙、丙3名维修工,现有两种配备方案,方案一:由甲、乙、丙三人维护,每人负责2台机器;方案二:由甲乙两人共同维护6台机器,丙负责其他工作.(1)对于方案一,设X 为甲维护的机器某一时刻发生故障的台数,求X 的分布列与数学期望E (X );(2)在两种方案下,分别计算某一时刻机器发生故障时不能得到及时维修的概率,并以此为依据来判断,哪种方案能使工厂的生产效率更高?9.(2023·福建福州·福建省福州第一中学校考模拟预测)相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.某健身连锁机构对其会员的年龄等级和一个月内到健身房健身次数进行了统计,制作成如下两个统计图.图1为会员年龄分布图(年龄为整数),其中将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类;图2为会员一个月内到健身房次数分布扇形图,其中将一个月内到健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56是“年轻人”.(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图表数据,补全2×2列联表,并依据小概率值α=0.05的独立性检验,是否可以认为“健身达人”与年龄有关?年轻人非年轻人合计健身达人健身爱好者合计(2)该健身机构在今年年底将针对全部的150名会员举办消费返利活动,预设有如下两种方案.方案1:按分层抽样从健身爱好者和健身达人中总共抽取20位“幸运之星”给予奖励.其中,健身爱好者和健身达人中的“幸运之星”每人分别奖励500元和800元.方案2:每位会员均可参加摸奖游戏,游戏规则如下:从一个装有3个白球、2个红球(球只有颜色不同)的箱子中,有放回地摸三次球,每次只能摸一个球.若摸到红球的总数为2,则可获得100元奖励金;若摸到红球的总数为3,则可获得300元奖励金;其他情况不给予奖励.如果每位健身爱好者均可参加1次摸奖游戏;每位健身达人均可参加3次摸奖游戏(每次摸奖的结果相互独立).以方案的奖励金的数学期望为依据,请你预测哪一种方案投资较少?并说明理由.附:χ2=n(ad-bc)2a+bc+da+cb+d.α0.100.050.0250.0100.0050.001χα 2.706 3.841 5.024 6.6357.87910.82810.(2023·云南昭通·校联考模拟预测)为了检测某种抗病毒疫苗的免疫效果,需要进行临床人体试验.研究人员将疫苗注射到200名志愿者体内,一段时间后测量志愿者的某项指标值,按0,20 ,20,40 ,40,60 ,60,80 ,80,100 分组,绘制频率分布直方图如图所示.试验发现志愿者体内产生抗体的共有160人,其中该项指标值不小于60的有110人.假设志愿者注射疫苗后是否产生抗体相互独立.(1)填写下面的2×2列联表,并根据列联表及小概率值α=0.05的独立性检验,判断能否认为注射疫苗后志愿者产生抗体与指标值不小于60有关.抗体指标值合计小于60不小于60有抗体没有抗体合计(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40名志愿者进行第二次注射疫苗,结果又有m 名志愿者产生抗体.(i )用频率估计概率,已知一名志愿者注射2次疫苗后产生抗体的概率p =0.9,求m 的值;(ⅱ)以(i )中的概率p 作为人体注射2次疫苗后产生抗体的概率,再进行另一组人体接种试验,记110名志愿者注射2次疫苗后产生抗体的数量为随机变量X ,求P X =k 最大时的k 的值.参考公式:χ2=n ad -bc 2a +b c +d a +c b +d(其中n =a +b +c +d 为样本容量).α0.500.400.250.150.1000.0500.025x α0.4550.7081.3232.0722.7063.8415.02411.(2023·湖南长沙·长沙市实验中学校考二模)首批全国文明典范城市将于2023年评选,每三年评选一次,2021年长沙市入选为全国文明典范城市试点城市,目前我市正全力争创首批全国文明典范城市,某学校号召师生利用周末从事创建志愿活动.高一(1)班一组有男生4人,女生2人,现随机选取2人作为志愿者参加活动,志愿活动共有交通协管员、创建宣传员、文明监督员三项可供选择,每名女生至多从中选择参加2项活动,且选择参加1项或2项的可能性均为12;每名男生至少从中选择参加2项活动,且选择参加2项或3项的可能性也均为12,每人每参加1项活动可获得综合评价10分,选择参加几项活动彼此互不影响,求:(1)在有女生参加活动的条件下,恰有一名女生的概率;(2)记随机选取的两人得分之和为X,求X的期望.12.(2023·江苏南京·南京市第一中学校考模拟预测)为了宣传航空科普知识,某校组织了航空知识竞赛活动.活动规定初赛需要从8道备选题中随机抽取4道题目进行作答.假设在8道备选题中,小明正确完成每道题的概率都是34且每道题正确完成与否互不影响,小宇能正确完成其中6道题且另外2道题不能完成.(1)求小明至少正确完成其中3道题的概率;(2)设随机变量X表示小宇正确完成题目的个数,求X的分布列及数学期望;(3)现规定至少完成其中3道题才能进入决赛,请你根据所学概率知识,判断小明和小宇两人中选择谁去参加市级比赛(活动规则不变)会更好,并说明理由.13.(2023·广东·校联考模拟预测)某商场在五一假期间开展了一项有奖闯关活动,并对每一关根据难度进行赋分,竞猜活动共五关,规定:上一关不通过则不进入下一关,本关第一次未通过有再挑战一次的机会,两次均未通过,则闯关失败,且各关能否通过相互独立,已知甲、乙、丙三人都参加了该项闯关活动.(1)若甲第一关通过的概率为23,第二关通过的概率为56,求甲可以进入第三关的概率;(2)已知该闯关活动累计得分服从正态分布,且满分为450分,现要根据得分给共2500名参加者中得分前400名发放奖励.①假设该闯关活动平均分数为171分,351分以上共有57人,已知甲的得分为270分,问甲能否获得奖励,请说明理由;②丙得知他的分数为430分,而乙告诉丙:“这次闯关活动平均分数为201分,351分以上共有57人”,请结合统计学知识帮助丙辨别乙所说信息的真伪.附:若随机变量Z∼Nμ,σ2,则Pμ-σ≤X≤μ+σ≈0.6827;Pμ-2σ≤X≤μ+2σ≈0.9545;Pμ-3σ≤X≤μ+3σ≈0.9973.14.(2023·广东韶关·统考模拟预测)研究表明,如果温差本大,人们不注意保暖,可能会导致自身受到风寒刺激,增加感冒患病概率,特别是对于几童以及年老体弱的人群,要多加防范某中学数学建模社团成员研究了昼夜温差大小与某小学学生患感冒就诊人数多少之间的关系,他们记录了某六天的温差,并到校医室查阅了这六天中每天学生新增感冒就诊的人数,得到数据如下:日期第一天第二天第三天第四天第五天第六天昼夜温差x (°C )47891412新增感就诊人数y (位)y 1y 2y 3y 4y 5y 6参考数据:6iy 2i=3463,6iy i -y 2=289(1)已知第一天新增感冒就的学生中有4位男生,从第一天多增的感冒就诊的学生中随机取2位,其中男生人数记为X ,若抽取的2人中至少有一位女生的概率为56,求随机变量X 的分布列和数学期望;(2)已知两个变量x 与y 之间的样本相关系数r =1617,请用最小二乘法求出y 关于x 的经验回归方程y =b x +a ,据此估计昼夜温差为15°C 时,该校新增感冒就诊的学生人数. 参考数据:r =n ix i -x y i -y n i =1x i -x 2 ⋅ni =1y i -y2,b =ni x i -x y i -yni =1x i -x 2 15.(2023·重庆·统考模拟预测)某地区由于农产品出现了滞销的情况,从而农民的收入减少,很多人开始在某直播平台销售农产品并取得了不错的销售量.有统计数据显示2022年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,且“经常使用直播销售用户”中有34是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,依据小概率值α=0.05的χ2独立性检验,能否认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2023年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售、根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不是不赚,且这三种情况发生的概率分别为35,15,15;方案二:线上直播销售,根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为12,310,15.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表α0.150.100.050.0250.0100.0050.001xα 2.072 2.706 3.841 5.024 6.6357.87910.828其中χ2=n ad-bc2a+bc+da+cb+d,n=a+b+c+d.16.(2023·河北衡水·衡水市第二中学校考三模)某医疗科研小组为研究某市市民患有疾病A 与是否具有生活习惯B 的关系,从该市市民中随机抽查了100人,得到如下数据:疾病A 生活习惯B 具有不具有患病2515未患病2040(1)依据α=0.01的独立性检验,能否认为该市市民患有疾病A 与是否具有生活习惯B 有关?(2)从该市市民中任选一人,M 表示事件“选到的人不具有生活习惯B ”,N 表示事件“选到的人患有疾病A ”,试利用该调查数据,给出P N M的估计值;(3)从该市市民中任选3人,记这3人中具有生活习惯B ,且末患有疾病A 的人数为X ,试利用该调查数据,给出X 的数学期望的估计值.附:χ2=n (ad -bc )2a +b c +d a +c b +d,其中n =a +b +c +d .α0.100.050.0100.001 x α2.7063.8416.63510.82817.(2023·江苏扬州·统考模拟预测)随着网络技术的迅速发展,各种购物群成为网络销售的新渠道.在凤梨销售旺季,某凤梨基地随机抽查了100个购物群的销售情况,各购物群销售凤梨的数量情况如下:凤梨数量(盒)100,200 200,300 300,400 400,500 500,600购物群数量(个)12m2032m(1)求实数m的值,并用组中值估计这100个购物群销售风梨总量的平均数(盒);(2)假设所有购物群销售凤梨的数量X服从正态分布Nμ,σ2,其中μ为(1)中的平均数,σ2=12100.若该凤梨基地参与销售的购物群约有1000个,销售风梨的数量在266,596(单位:盒)内的群为“一级群”,销售数量小于266盒的购物群为“二级群”,销售数量大于等于596盒的购物群为“优质群”.该凤梨基地对每个“优质群”奖励1000元,每个“一级群”奖励200元,“二级群”不奖励,则该风梨基地大约需要准备多少资金?(群的个数按四舍五入取整数)附:若X服从正态分布X~Nμ,σ2,则P(μ-σ<X<μ+σ)≈0.683,P(μ-2σ<X<μ+2σ)≈0.954,P(μ-3σ<X<μ+3σ)≈0.997.18.(2023·浙江·校联考模拟预测)某校有一个露天的篮球场和一个室内乒乓球馆为学生提供锻炼场所,甲、乙两位学生每天上下午都各花半小时进行体育锻炼,近50天天气不下雨的情况下,选择体育锻炼情况统计如下:上下午体育锻炼项目的情况(上午,下午)(篮球,篮球)(篮球,乒乓球)(乒乓球,篮球)(乒乓球,乒乓球)甲20天15天5天10天乙10天10天5天25天假设甲、乙选择上下午锻炼的项目相互独立,用频率估计概率.(1)分别估计一天中甲上午和下午都选择篮球的概率,以及甲上午选择篮球的条件下,下午仍旧选择篮球的概率;(2)记X 为甲、乙在一天中选择体育锻炼项目的个数,求X 的分布列和数学期望E (X );(3)假设A 表示事件“室外温度低于10度”,B 表示事件“某学生去打乒乓球”,P (A )>0,一般来说在室外温度低于10度的情况下学生去打乒乓球的概率会比室外温度不低于10度的情况下去打乒乓球的概率要大,证明:P (A |B )>P (A |B).19.(2023·广东深圳·统考二模)某校体育节组织定点投篮比赛,每位参赛选手共有3次投篮机会.统计数据显示,每位选手投篮投进与否满足:若第k 次投进的概率为p (0<p <1),当第k 次投进时,第k +1次也投进的概率保持p 不变;当第k 次没能投进时,第k +1次能投进的概率降为p2.(1)若选手甲第1次投进的概率为p (0<p <1),求选手甲至少投进一次的概率;(2)设选手乙第1次投进的概率为23,每投进1球得1分,投不进得0分,求选手乙得分X 的分布列与数学期望.20.(2023·湖北武汉·华中师大一附中校考模拟预测)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A 区B 区C 区D 区外来务工人数x /万3456就地过年人数y /万2.5344.5(1)请用相关系数说明y 与x 之间的关系可用线性回归模型拟合,并求y 关于x 的线性回归方程y =a +bx 和A 区的残差(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E 区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E 区就地过年的人员发放的补贴总金额;②若A 区的外来务工人员中甲、乙选择就地过年的概率分别为p ,2p -1,其中12<p <1,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p 的取值范围.参考公式:相关系数r =ni =1x i y i -nx yn i =1x 2i -nx 2ni =1y 2i -ny2,回归方程y =a +bx 中斜率和截距的最小二乘估计公式分别为b =ni =1x i y i -nx yni =1x 2i -nx2,a =y -b x .21.(2023·山西运城·山西省运城中学校校考二模)甲、乙两人进行象棋比赛,赛前每人发3枚筹码.一局后负的一方,需将自己的一枚筹码给对方;若平局,双方的筹码不动,当一方无筹码时,比赛结束,另一方最终获胜.由以往两人的比赛结果可知,在一局中甲胜的概率为0.3、乙胜的概率为0.2.(1)第一局比赛后,甲的筹码个数记为X,求X的分布列和期望;(2)求四局比赛后,比赛结束的概率;(3)若P i i=0,1,⋯,6表示“在甲所得筹码为i枚时,最终甲获胜的概率”,则P0=0,P6=1.证明:P i+1-P ii=0,1,2,⋯,5为等比数列.22.(2023·湖北襄阳·襄阳四中校考三模)为倡导公益环保理念,培养学生社会实践能力,某中学开展了旧物义卖活动,所得善款将用于捐赠“圆梦困境学生”计划.活动共计50多个班级参与,1000余件物品待出售.摄影社从中选取了20件物品,用于拍照宣传,这些物品中,最引人注目的当属优秀毕业生们的笔记本,已知高三1,2,3班分别有12,13,14的同学有购买意向.假设三个班的人数比例为6:7:8.(1)现从三个班中随机抽取一位同学:(i)求该同学有购买意向的概率;(ii)如果该同学有购买意向,求此人来自2班的概率;(2)对于优秀毕业生的笔记本,设计了一种有趣的“掷骰子叫价确定购买资格”的竞买方式:统一以0元为初始叫价,通过掷骰子确定新叫价,若点数大于2,则在已叫价格基础上增加1元更新叫价,若点数小于3,则在已叫价格基础上增加2元更新叫价;重复上述过程,能叫到10元,即获得以10元为价格的购买资格,未出现叫价为10元的情况则失去购买资格,并结束叫价.若甲同学已抢先选中了其中一本笔记本,试估计其获得该笔记本购买资格的概率(精确到0.01).23.(2023·广东茂名·统考二模)春节过后,文化和旅游业逐渐复苏,有意跨省游、出境游的旅客逐渐增多.某旅游景区为吸引更多游客,计划在社交媒体平台和短视频平台同时投放宣传广告并进行线上售票,通过近。
高考数学-概率与统计(含22年真题讲解)1.【2022年全国甲卷】某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差【答案】B【解析】【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.【详解】>70%,所以A错;讲座前中位数为70%+75%2讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%−80%=20%,讲座前问卷答题的正确率的极差为95%−60%=35%>20%,所以D错.故选:B.2.【2022年全国甲卷】从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为()A.15B.13C.25D.23【答案】C【解析】【分析】先列举出所有情况,再从中挑出数字之积是4的倍数的情况,由古典概型求概率即可.【详解】从6张卡片中无放回抽取2张,共有(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3 ,4),(3,5),(3,6),(4,5),(4,6),(5,6)15种情况,其中数字之积为4的倍数的有(1,4),(2,4),(2,6),(3,4),(4,5),(4,6)6种情况,故概率为615=25.故选:C.3.【2022年全国乙卷】分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是()A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6【答案】C【解析】【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.【详解】=7.4,A选项结论正确.对于A选项,甲同学周课外体育运动时长的样本中位数为7.3+7.52对于B选项,乙同学课外体育运动时长的样本平均数为:6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1=8.50625>8,16B选项结论正确.=0.375<0.4,对于C选项,甲同学周课外体育运动时长大于8的概率的估计值616C选项结论错误.=0.8125>0.6,对于D选项,乙同学周课外体育运动时长大于8的概率的估计值1316D选项结论正确.故选:C4.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为p1,p2,p3,且p3>p2>p1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率p;该棋手在第二盘与乙比赛且连胜两盘的概率p乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率p丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为p甲则p甲=2(1−p2)p1p3+2p2p1(1−p3)=2p1(p2+p3)−4p1p2p3记该棋手在第二盘与乙比赛,且连胜两盘的概率为p乙则p乙=2(1−p1)p2p3+2p1p2(1−p3)=2p2(p1+p3)−4p1p2p3记该棋手在第二盘与丙比赛,且连胜两盘的概率为p丙则p丙=2(1−p1)p3p2+2p1p3(1−p2)=2p3(p1+p2)−4p1p2p3则p甲−p乙=2p1(p2+p3)−4p1p2p3−[2p2(p1+p3)−4p1p2p3]=2(p1−p2)p3<0p 乙−p丙=2p2(p1+p3)−4p1p2p3−[2p3(p1+p2)−4p1p2p3]=2(p2−p3)p1<0即p甲<p乙,p乙<p丙,则该棋手在第二盘与丙比赛,p最大.选项D判断正确;选项BC判断错误;p与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D5.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率P=21−721=23.故选:D.6.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有n=C84=70个结果,这4个点在同一个平面的有m=6+6=12个,故所求概率P=mn =1270=635.故答案为:635.7.【2022年全国乙卷】从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为____________.【答案】310##0.3【解析】【分析】根据古典概型计算即可【详解】从5名同学中随机选3名的方法数为C53=10甲、乙都入选的方法数为C31=3,所以甲、乙都入选的概率P=310故答案为:3108.【2022年新高考2卷】已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为X∼N(2,σ2),所以P(X<2)=P(X>2)=0.5,因此P(X>2.5)=P(X>2)−P(2<X ≤2.5)=0.5−0.36=0.14.故答案为:0.14.9.【2022年浙江】现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为ξ,则P(ξ=2)=__________,E(ξ)=_________.【答案】 1635, 127##157 【解析】 【分析】利用古典概型概率公式求P(ξ=2),由条件求ξ分布列,再由期望公式求其期望. 【详解】从写有数字1,2,2,3,4,5,6的7张卡片中任取3张共有C 73种取法,其中所抽取的卡片上的数字的最小值为2的取法有C 41+C 21C 42种,所以P(ξ=2)=C 41+C 21C 42C 73=1635,由已知可得ξ的取值有1,2,3,4, P(ξ=1)=C 62C 73=1535,P(ξ=2)=1635,,P(ξ=3)=C 32C 73=335,P(ξ=4)=1C 73=135所以E(ξ)=1×1535+2×1635+3×335+4×135=127,故答案为:1635,127.10.【2022年全国甲卷】甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率; (2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d), P (K 2⩾k )0.100 0.050 0.010 k2.7063.8416.635【答案】(1)A ,B 两家公司长途客车准点的概率分别为1213,78(2)有 【解析】 【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算K 2,再利用临界值表比较即可得结论. (1)根据表中数据,A 共有班次260次,准点班次有240次, 设A 家公司长途客车准点事件为M , 则P(M)=240260=1213;B 共有班次240次,准点班次有210次, 设B 家公司长途客车准点事件为N , 则P(N)=210240=78.A 家公司长途客车准点的概率为1213; B 家公司长途客车准点的概率为78. (2)列联表K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=500×(240×30−210×20)2260×240×450×50≈3.205>2.706,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.11.【2022年全国甲卷】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立. (1)求甲学校获得冠军的概率;(2)用X 表示乙学校的总得分,求X 的分布列与期望.【答案】(1)0.6;(2)分布列见解析,E(X)=13.【解析】【分析】(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即可求出期望.(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为P=P(ABC)+P(A BC)+P(AB̅C)+P(ABC)=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.16+0.16+0.24+0.04=0.6.(2)依题可知,X的可能取值为0,10,20,30,所以,P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,P(X=30)=0.5×0.6×0.2=0.06.即X的分布列为期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.12.【2022年全国乙卷】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2)和材积量(单位:3),得到如下数据:并计算得∑x i 210i=1=0.038,∑y i 210i=1=1.6158,∑x i y i10i=1=0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数r =∑(x i−x̅)n i=1(y i −y̅)√∑(x i −x̅)2ni=1∑(y i−y ̅)2ni=1√1.896≈1.377.【答案】(1)0.06m 2;0.39m 3 (2)0.97 (3)1209m 3 【解析】 【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值. (1)样本中10棵这种树木的根部横截面积的平均值x̅=0.610=0.06样本中10棵这种树木的材积量的平均值y̅=3.910=0.39据此可估计该林区这种树木平均一棵的根部横截面积为0.06m 2, 平均一棵的材积量为0.39m 3 (2)r =∑(x i −x)10i=1(y i −y)√∑10i=1(x i −x)2∑10i=1(y i −y)2=∑10i=1i i 10xy√(∑10i=1x i 2−10x2)(∑10i=1y i 2−10y 2)=0.2474−10×0.06×0.39√(0.038−10×0.062)(1.6158−10×0.392)=0.0134√0.0001896≈0.01340.01377≈0.97则r ≈0.97 (3)设该林区这种树木的总材积量的估计值为Y m 3, 又已知树木的材积量与其根部横截面积近似成正比, 可得0.060.39=186Y,解之得Y =1209m 3. 则该林区这种树木的总材积量估计为1209m 313.【2022年新高考1卷】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.P(B|A)P(B ̅|A)与P(B|A )P(B ̅|A )的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R .(ⅰ)证明:R =P(A|B)P(A |B)⋅P(A |B ̅)P(A|B ̅);(ⅱ)利用该调查数据,给出P(A|B),P(A|B ̅)的估计值,并利用(ⅰ)的结果给出R 的估计值.附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),【答案】(1)答案见解析 (2)(i )证明见解析;(ii)R =6; 【解析】【分析】(1)由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求R.(1)由已知K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,又P(K2≥6.635)=0.01,24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为R=P(B|A)P(B̅|A)⋅P(B̅|A)P(B|A)=P(AB)P(A)⋅P(A)P(AB̅)⋅P(A B̅)P(A)⋅P(A)P(A B),所以R=P(AB)P(B)⋅P(B)P(A B)⋅P(A B̅)P(B̅)⋅P(B̅)P(AB̅)所以R=P(A|B)P(A|B)⋅P(A|B̅) P(A|B̅),(ii)由已知P(A|B)=40100,P(A|B̅)=10100,又P(A|B)=60100,P(A|B̅)=90100,所以R=P(A|B)P(A|B)⋅P(A|B̅)P(A|B̅)=614.【2022年新高考2卷】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)44.65岁;(2)0.89;(3)0.0014.【解析】【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1−P (A)即可解出;(3)根据条件概率公式即可求出.(1)平均年龄x̅=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023 +55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).(2)设A={一人患这种疾病的年龄在区间[20,70)},所以P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式可得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.15.【2022年北京】在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到9.50m以上(含9.50m)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,935,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)【答案】(1)0.4(2)75(3)丙【解析】【分析】(1)由频率估计概率即可(2)求解得X的分布列,即可计算出X的数学期望.(3)计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.(1)由频率估计概率可得甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3P(X=0)=P(A1̅̅̅A2̅̅̅A3̅̅̅)=0.6×0.5×0.5=3,20P(X=1)=P(A1A2̅̅̅A3̅̅̅)+P(A1̅̅̅A2A3̅̅̅)+P(A1̅̅̅A2̅̅̅A3)=0.4×0.5×0.5+0.6×0.5×0.5+0.6×0.5×0.5=8,20P(X=2)=P(A1A2A3̅̅̅)+P(A1A2̅̅̅A3)+P(A1̅̅̅A2A3)=0.4×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=7,20P(X=3)=P(A1A2A3)=0.4×0.5×0.5=2.20∴X的分布列为∴E(X)=0×320+1×820+2×720+3×220=75 (3)丙夺冠概率估计值最大.因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为14,甲获得9.80的概率为110,乙获得9.78的概率为16.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.1.(2022·河南省杞县高中模拟预测(理))某市有11名选手参加了田径男子100米赛的选拔比赛,前5名可以参加省举办的田径赛,如果各个选手的选拔赛成绩均不相同,选手小强已经知道了自己的成绩,为了判断自己能否参加省举办的田径赛,他还需要知道这11名选手成绩的( ) A .平均数 B .中位数 C .众数 D .方差【答案】B 【解析】 【分析】中位数恰好是第6名,比中位数成绩高即可确认自己能否进入省田径赛. 【详解】因为11名选手成绩的中位数恰好是第6名,知道了第6名的成绩,小强就可以判断自己是否能参加省举办的田径赛了,其余数字特征不能反映名次. 故选:B .2.(2022·黑龙江·大庆实验中学模拟预测(理))2021年5月30日清晨5时01分,天舟二号货运飞船在成功发射约8小时后,与中国空间站天和核心舱完成自主快速交接.如果下次执行空间站的任务由3名航天员承担,需要在3名女性航天员和3名男性航天员中选择,则选出的3名航天员中既有男性航天员又有女性航天员的概率为( ) A .67B .910 C .25D .415【答案】B 【解析】 【分析】利用对立事件和古典概型的概率公式求解即可. 【详解】设“选出的3名航天员中既有男性航天员又有女性航天员”为事件M ,则()333336C C 91C 10P M ==+-.故选:B.3.(2022·全国·模拟预测(文))如图是一组实验数据的散点图,拟合方程()0by c x x=+>,令1t x=,则y 关于t 的回归直线过点()2,5,()12,25,则当()1.01,1.02y ∈时,x 的取值范围是( )A .()0.01,0.02B .()50,100C .()0.02,0.04D .()100,200【答案】D 【解析】 【分析】 先令1t x =可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得522512b c b c=+⎧⎨=+⎩从而求得21y t =+,再由y 的范围求得t 的范围,进而求得x 的范围. 【详解】根据题意可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得:522512b cb c =+⎧⎨=+⎩,所以2,1b c ==, 所以21y t =+,由()1.01,1.02y ∈可得1.0121 1.02t <+<, 所以0.0050.01t <<, 所以10.0050.01x<<,所以100200x <<, 故选:D4.(2022·辽宁实验中学模拟预测)某国计划采购疫苗,现在成熟的疫苗中,三种来自中国,一种来自美国,一种来自英国,一种由美国和德国共同研发,从这6种疫苗中随机采购三种,若采购每种疫苗都是等可能的,则买到中国疫苗的概率为( ) A .16B .12C .910D .1920【答案】D 【解析】 【分析】由对立事件的概率公式计算. 【详解】没有买到中国疫苗的概率为13611C 20P ==, 所以买到中国疫苗的概率为119120P P =-=. 故选:D .5.(2022·四川省泸县第二中学模拟预测(理))食物链亦称“营养链”,是指生态系统中各种生物为维持其本身的生命活动,必须以其他生物为食物的这种由食物联结起来的链锁关系.如图为某个生态环境中的食物链,若从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,则这两种生物不能构成摄食关系的概率( )A .35B .25C .23D .13【解析】 【分析】用列举法写出构成的摄食关系,计数后可求得概率. 【详解】从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,共有10种选法:鹰麻雀,鹰兔,鹰田鼠,鹰蝗虫,麻雀兔,麻雀田鼠,麻雀蝗虫,兔田鼠,兔蝗虫,田鼠蝗虫.其中田鼠鹰,兔鹰,麻雀鹰,蝗虫麻雀共四种可构成摄食关系,不能构成摄食关系的有6种,所以概率为63105P ==. 故选:A .6.(2022·山东潍坊·模拟预测)Poisson 分布是统计学里常见的离散型概率分布,由法国数学家西莫恩·德尼·泊松首次提出,Poisson 分布的概率分布列为()()e 0,1,2,!kP X K k k λλ-===⋅⋅⋅,其中e 为自然对数的底数,λ是Poisson 分布的均值.当二项分布的n 很大()20n ≥而p 很小()0.05p ≤时,Poisson 分布可作为二项分布的近似.假设每个大肠杆菌基因组含有10000个核苷酸对,采用20.05/J m 紫外线照射大肠杆菌时,每个核苷酸对产生嘧啶二体的概率均为0.0003,已知该菌株基因组有一个嘧啶二体就致死,则致死率是( ) A .31e -- B .3e - C .313e -- D .314e --【答案】A 【解析】 【分析】结合题意1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似条件,再计算二项分布的均值为Poisson 分布的均值λ,再代入公式先求不致死的概率,再用对立事件的概率和为1计算即可 【详解】由题, 1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似的条件,此时100000.00033λ=⨯=,故不致死的概率为()03330e e 0!P X --===,故致死的概率为()3101e P X --==-7.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】 【分析】根据正态分布的性质求出()22P X ≥,从而估计出人数; 【详解】 解:因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人); 故选:B8.(2022·河南·模拟预测)某公司生产的一种产品按照质量由高到低分为A ,B ,C ,D 四级,为了增加产量、提高质量,该公司改进了一次生产工艺,使得生产总量增加了一倍.为了解新生产工艺的效果,对改进生产工艺前、后的四级产品的占比情况进行了统计,绘制了如下扇形图:根据以上信息:下列推断合理的是( ) A .改进生产工艺后,A 级产品的数量没有变化B.改进生产工艺后,D级产品的数量减少C.改进生产工艺后,C级产品的数量减少D.改进生产工艺后,B级产品的数量增加了不到一倍【答案】C【解析】【分析】由题可得改进生产工艺前后四个等级的生产量,逐项分析即得.【详解】设原生产总量为1,则改进生产工艺后生产总量为2,所以原A,B,C,D等级的生产量为0.3,0.37,0.28,0.05,改进生产工艺后四个等级的生产量为0.6,1.2,0.12,0.08,故改进生产工艺后,A级产品的数量增加,故A错误;改进生产工艺后,D级产品的数量增加,故B错误;改进生产工艺后,C级产品的数量减少,故C正确;改进生产工艺后,B级产品的数量增加超过2倍,故D错误.故选:C.9.(2022·河南安阳·模拟预测(文))为推动就业与培养有机联动、人才供需有效对接,促进高校毕业生更加充分更高质量就业,教育部今年首次实施供需对接就业育人项目.现安排甲、乙两所高校与3家用人单位开展项目对接,若每所高校至少对接两家用人单位,则两所高校的选择涉及到全部3家用人单位的概率为()A.12B.23C.34D.1316【答案】D【解析】【分析】由古典概型与对立事件的概率公式求解即可【详解】因为每所高校至少对接两家用人单位,所以每所高校共有2333314C C+=+=种选择,所以甲、乙两所高校共有4416⨯=种选择,其中甲、乙两所高校的选择涉及两家用人单位的情况有233C =种,所以甲、乙两所高校的选择涉及到全部3家用人单位的概率为31311616P =-=, 故选:D10.(2022·江苏·南京师大附中模拟预测)某同学在课外阅读时了解到概率统计中的马尔可夫不等式,该不等式描述的是对非负的随机变量X 和任意的正数a ,都有()()(),P X a f E X a ≥≤,其中()(),f E X a 是关于数学期望()E X 和a 的表达式.由于记忆模糊,该同学只能确定()(),f E X a 的具体形式是下列四个选项中的某一种.请你根据自己的理解,确定该形式为( ) A .()aE X B .()1aE XC .()a E XD .()E X a【答案】D 【解析】 【分析】根据期望的计算公式,以及m x a ≥即可求解. 【详解】设非负随机变量X 的所有可能取值按从小到大依次为0,i x i N *>∈,对应的概率分别为,0i i p p >设满足i x a ≥的有,,,m a a x k m n m N k N **≤≤∈∈,()ani i k P X a p =≥=∑,()111a ai nk i iii n i ii k i ax pE ax p x pX a -===+==∑∑∑,因为m x a ≥,所以1mx a≥()()()1111a a aaannniiiiiik k i k i k i k ii i i i x px px px p p P X a P X a E aa aaaX --=====⎛⎫+≥+=+≥≥≥ ⎪⎝⎭=∑∑∑∑∑故选:D11.(2022·吉林·三模(理))为了切实维护居民合法权益,提高居民识骗防骗能力,守好居民的“钱袋子”,某社区开展“全民反诈在行动——反诈骗知识竞赛”活动,现从参加该活动的居民中随机抽取了100名,统计出他们竞赛成绩分布如下:(1)求抽取的100名居民竞赛成绩的平均分x 和方差2s (同一组中数据用该组区间的中点值为代表);(2)以频率估计概率,发现该社区参赛居民竞赛成绩X 近似地服从正态分布()2,N μσ,其中μ近似为样本成绩平均分x ,2σ近似为样本成缋方差2s ,若2μσμσ-<≤+X ,参赛居民可获得“参赛纪念证书”;若2μσ>+X ,参赛居民可获得“反诈先锋证书”,①若该社区有3000名居民参加本次竞赛活动,试估计获得“参赛纪念证书”的居民人数(结果保留整数);②试判断竞赛成绩为96分的居民能否获得“反诈先锋证书”. 附:若()2,XN μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.【答案】(1)75x =,2100s = (2)①2456 ;②能 【解析】 【分析】(1)利用公式直接求出均值、方差即可;(2)①结合给的概率和正态分布的性质,确定获得“参赛纪念证书”,进而计算可得人数; ②利用正态分布的知识求出2μσ>+X ,即95>X ,进而可得结果. (1)100名居民本次竞赛成绩平均分24224028445556575859575100100100100100100=⨯+⨯+⨯+⨯+⨯+⨯=x , 100名居民本次竞赛成绩方差22222422(4575)(5575)(6575)100100100=-⨯+-⨯+-⨯s 22240284(7575)(8575)(9575)100100100100+-⨯+-⨯+-⨯=, (2)①由于μ近似为样本成绩平均分x ,2σ近似为样本成绩方差2s , 所以,275,100μσ==,可知,10σ=,由于竞赛成绩X 近似地服从正态分布()2,N μσ,因此竞赛居民可获得“参赛纪念证书”的概率 (2)P X μσμσ-<≤+11()(22)22μσμσμσμσ=-<≤++-<≤+P X P X 110.68270.95450.818622≈⨯+⨯= 30000.81862455.82456⨯=≈估计获得“参赛纪念证书”的居民人数为2456;②当2μσ>+X 时,即95>X 时,参赛居民可获得“反诈先锋证书”, 所以竞赛成绩为96分的居民能获得“反诈先峰证书”.12.(2022·贵州·贵阳一中模拟预测(文))“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物占全国的39.7%,淡水鱼类占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区某种水生动物的数量,将其分成面积相近的100个水域,从这些水域中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据()(),1,2,,20,i i x y i =其中i x 和i y 分别表示第i 个样区的水草覆盖面积(单位:公顷)和这种水生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,2021-)120,i i x x ==∑(2021-)9000,i i y ==∑(y 201-)-)1000.i iix x y ==∑((y (1)求该地区这种水生动物数量的估计值(这种水生动物数量的估计值等于样区这种水生动物数量的平均数乘以地块数); (2)求样本()(),1,2,,20i i x y i =的相关系数(精确到0.01);(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区这种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数-)-) 1.732.niix y x r =≈∑((y【答案】(1)6000 (2)0.96(3)采用分层抽样的方法,理由见解析 【解析】 【分析】(1)根据该地区这种水生动物数量的估计值的计算方法求解即可; (2)根据相关系数的公式求解即可;(3)根据(2)中的结论各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性考虑即可 (1)样区水生动物平均数为201111200602020i i y ==⨯=∑, 地块数为100,该地区这种水生动物的估计值为100606000⨯=. (2)样本()(),1,2,,20i i x y i =⋯的相关系数为()()20,0.96.iix x y y r -===≈∑ (3)由(2)知各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性,由于各地块间水草覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种水生动物数量更准确的估计.13.(2022·河南开封·模拟预测(理))大豆是我国重要的农作物,种植历史悠久.某种子实验基地培育出某大豆新品种,为检验其最佳播种日期,在A ,B 两块试验田上进行实验(两地块的土质等情况一致).6月25日在A 试验田播种该品种大豆,7月10日在B 试验田播种该品种大豆.收获大豆时,从中各随机抽取20份(每份1千粒),并测量出每份的质量(单位:克),按照[)100,150,[)150,200,[]200,250进行分组,得到如下表格:。
5概率与一、数原理1.分加法数原理和分步乘法数原理的区是什么?分加法数原理“分” ,此中各样方法互相独立 ,用此中任何一种方法都能够做完件事 ;分步乘法数原理“分步” ,各个步互相依存 ,只有各个步都达成了才算达成件事 .2.摆列数、合数的公式及性是什么?(1)=n(n-1)(n-2) ⋯(n-m+1)=公(2)= =式=(n,m∈N+ ,且 m≤n)特地 , =1性(1)0!= 1; =n!(2) =;=+3.二式系数的性是什么?性性描绘称与首末两头“等距离”的两个二式系数相等 ,即 =性增减二式系当 k<(n∈N+ ) ,二式系数是增的性数(n∈N+ ) ,二式系数是减的当 k>二式当 n 偶数 ,中的一获得最大系数的最大当 n 奇数 ,中的两与获得最大而且相等4.各二式系数的和是什么?(1)(a+b )n睁开式的各二式系数的和+ + + ⋯+= 2n.(2)偶数的二式系数的和等于奇数的二式系数的和,即+ + + ⋯= + ++ ⋯= 2n- 1.二、概率1.互斥事件与立事件有什么区与系?互斥与立都是两个事件的关系,互斥事件是不行能同生的两个事件,而立事件除要求两个事件不一样生外 ,要求两者之一必有一个生 .所以 ,立事件是互斥事件的特别状况 ,而互斥事件不必定是立事件 .2.基本领件的三个特色是什么?(1)每一个基本领件生的可能性都是相等的;(2)任何两个基本领件都是互斥的;(3)任何事件 (除不行能事件 )都能够表示成基本领件的和.3.古典概型、几何概型的概率公式分是什么?古典概型的概率公式 :P(A)=.几何概型的概率公式 :P(A)=.三、统计初步与统计事例1.分层抽样的合用范围是什么?当整体是由差别明显的几个部分构成时,常常采纳分层抽样的方法.2.怎样作频次分布直方图?(1)求极差 (即一组数据中最大值与最小值的差).(2)决定组距与组数 .(3)将数据分组 .(4)列频次分布表 .(5)画频次分布直方图 .3.频次分布直方图的特色是什么?(1)频次分布直方图中相邻两横坐标之差表示组距,纵坐标表示,频率=组距×.(2)在频次分布直方图中 ,各小长方形的面积总和等于 1.由于在频次分布直方图中组距是一个固定值 ,所以各小长方形高的比也就是频次比 .(3)频次分布表和频次分布直方图是一组数据频次分布的两种形式,前者正确 ,后者直观 .4.怎样进行回归剖析 ?(1)定义 :对拥有有关关系的两个变量进行统计剖析的一种常用方法.(2)本点的中心于一拥有性有关关系的数据 (x1,y1),(x2,y2), ⋯ ,(x n,y n),此中 ( , )称本点的中心 .(3)有关系数当r> 0 ,表示两个量正有关; 当r< 0 ,表示两个量有关 .r 的越靠近于 1,表示两个量的性有关性越 .r 的越靠近于 0,表示两个量之的性有关性越弱 .往常当 |r|大于 0.75 ,两个量有很的性有关性.5.独立性的一般步是什么?解决独立性的用,必定要依照独立性的步得出.独立性的一般步 :(1)依据本数据制成2×2 列表 ;(2)依据公式 K2=算K2的k;(3)比 k 与界的大小关系 ,做出推测 .四、随机量及其用1.失散型随机量的分布列及性是什么?(1)失散型随机量的分布列:若失散型随机量X 全部可能的取x1,x2, ⋯,x i⋯,x n,X 取每一个 x i(i= 1,2, ⋯,n)的概率 p1,p2, ⋯,p n,表X x1x2⋯x i⋯x nP p1p2⋯p i⋯p n称失散型随机量X 的概率分布列或称失散型随机量X 的分布列.(2)失散型随机量的分布列的性:①0≤p≤1(i= 1,2,3,⋯,i n);②p1+p2+ ⋯+p n= 1;③P(x i≤X≤x j)=p i+p i+ 1+ ⋯+p j .2.事件的互相独立性的观点及公式是什么?(1)互相独立的定 :事件 A 能否生事件 B 能否生的概率没有影响,即 P(B|A)=P (B). ,称事件 A 与事件 B 互相独立 ,并把两个事件叫作互相独立事件 .(2)概率公式条件事件 A,B 互相独立事件 A⋯,1,A2, A n互相独立公式P(A∩B)=P (A) ·P(B) P(A1∩A2∩⋯∩A n) =P (A1) ·P(A2) ·⋯·P(A n)3.独立重复与二分布的观点和公式是什么?(1)独立重复①定 :在同样条件下 ,重复地做n 次 ,各次互相独立 ,那么一般就称它 n 次独立重复 .②概率公式 :在一次中事件 A 生的概率p, n 次独立重复中,事件 A 恰巧生 k 次的概率 P k n-k⋯,n(k)=p (1-p)(k=0,1,2,n).(2)二分布 :在 n 次独立重复中 ,事件 A 生的次数 X,事件 A 不生的概率 q= 1-p, n 次独立重复中事件 A 恰巧生 k 次的概率是P(X=k)= p k q n-k,此中 k=0,1,2,⋯,n于是 X 的分布列 :X 0 1 ⋯k ⋯np0pq p k q n p n qP⋯⋯q n n-1-k0此称失散型随机量X 听从参数 n,p 的二分布 ,作 X~B(n,p).4.正分布的观点及性是什么?(1)正曲 :正量的概率密度函数的象叫作正曲,其函数表达式 f(x)=·,x∈R,此中μ,σ 参数 ,且σ>0,-∞<μ<+∞.(2)正曲的性①曲位于 x 上方 ,与 x 不订交 ,与 x 之的面1;②曲是峰的 ,它对于直 x=μ 称 ;③曲在 x=μ 达到峰;④当μ必定 ,曲的形状由σ确立 ,σ越小 ,曲越“瘦高”,表示体的分布越集中 ;σ越大 ,曲越“矮胖”,表示体的分布越分别 .(3)正体在三个特别区内取的概率①P(μ-σ<X≤μ+σ)= 0.6826;②P(μ-2σ<X≤μ+2σ)= 0.9544;③P(μ-3σ<X≤μ+3σ)= 0.9974.5.失散型随机量的数学希望(或均 )与方差的观点是什么 ?一个失散型随机量X 全部可能取的是x1,x2, ⋯,x n些的概率分是 p1,p2, ⋯,p n.(1)数学希望 :称 E(X)=x 1p1+x2p2+ ⋯+x n p n失散型随机量 X 的均或数学希望 (称希望 ),它刻画了个失散型随机量取的均匀水平 .(2)方差 :称 D(X)= (x1-E(X))2p1+ (x2-E(X))2p2+ ⋯+ (x n-E(X))2p n失散型随机量 X 的方差 ,它反应了失散型随机量取相于希望的均匀波大小(或失散程度 ),D(X)的算平方根叫作失散型随机量X 的准差 .6.均与方差的性有哪些?(1)E(aX+b)=aE (X)+b(a,b 常数 ).(2)D(aX+b )=a2D(X)(a,b 常数 ).(3)两点分布与二分布的均、方差的公式①若 X 听从两点分布 ,E(X)=p ,D(X)=p (1-p).②若 X~B(n,p), E(X)=np,D(X)=np(1-p).几何概型、古典概型、互相独立事件与互斥事件的概率、条件概率是高考的点 ,几何概型主要以客形式考,求解的关在于找准度(度或面 );互相独立事件、互斥事件常作解答的一部分考,也是一步求分布列、希望与方差的基础,求解该类问题要正确理解题意,正确判断概率模型,恰当选择概率公式 .近几年的高考数学试题对统计事例的考察一般不独自命题 ,而是与概率、随机变量的数学希望交汇命题 ,高考对此类题目的要求是能依据给出的或经过统计图表给出的有关数据求线性回归方程,认识独立性查验的思想方法 ,会判断两个分类变量能否有关.从近几年高考情况来看,该类专题在高考取占的比率大概为15%,以简单题、中档题为主,考察题型分选择题、填空题和解答题 .一、选择题、填空题的命题特色(一)考察摆列、组合的应用 ,以考察两个计数原理和摆列、组合的应用为主,难度中等 ,常常以选择题、填空题的形式出现.1.(2018 ·全国Ⅰ卷·理 T15 改编 )从 2 名女生 ,4 名男生中选 3 人参加科技竞赛 ,恰有 1 名女生当选 ,则不一样的选法共有种.(用数字填写答案)分析 ?由题意可得有1名女生,2名男生,则有 C = 12 种不一样的选法 .答案?122.(2018 ·浙江卷·T16 改编 )从 1,3,5,7,9 中任取 2 个数字 ,从 2,4,6 中任取 2 个数字,一共能够构成个没有重复数字的四位数.(用数字作答 )分析 ?一共能够构成 A = 720 个没有重复数字的四位数.答案 ?7203.(2017 ·全国Ⅱ卷·理 T6 改编 )安排 5 名志愿者达成 4 项工作 ,每项工作只需由1 人达成 ,则不一样的安排方式共有 ().A.120 种B.180 种C.240 种D.360 种分析 ?由题意可得 ,5 人中选出 4 人达成工作 ,剩下 1 人没有工作 ,故不同的安排方式有 A = 120(种).答案 ?A(二)考察二项式定理的应用,以考察运用二项式定理求特定项、求项数和二项式定理性质的应用为主,难度中等 ,常常以选择题、填空题的形式出现.4.(2018 ·全国Ⅲ卷·理 T5 改编 )的睁开式中x的系数为().A.10B.20C.40D.80分析 ?由题可得 Tr+ 1C25-rC·r ·10-3r, (x ) 2 x令 10-3r= 1,得 r= 3.所以·2r=·32 =80.答案 ?D5.(2017 ·全国Ⅰ卷·理 T6 改编 )(1+x )6的睁开式中 x4的系数为 ().A.15B.16C.30D.35分析 ?由于 (1+x)6睁开式的通项为 T r 所以(1+x)6的展r+ 1C x ,开式中含 x4的项为 1C x4和C x6.由于+= 16,所以(1+x)6的睁开式中x4的系数为16.答案 ?B(三)考察随机事件的概率 ,以考察随机事件、互斥事件与对峙事件的概率为主 ,难度中等 ,常与事件的频次交汇考察.本节内容在高考取三种题型都有可能出现 ,随机事件的频次与概率题目常常以解答题的形式出现,互斥事件、对峙事件的观点及概率题目常常以选择、填空题的形式出现.6.(2018 ·全国Ⅲ卷·文 T5 改编 )若某集体中的成员只用现金支付的概率为0.25,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为().分析 ? 设事件 A 为“不用现金支付”,事件 B 为“既用现金支付也用非现金支付”,事件 C 为“只用现金支付”,则 P(A)= 1-P(B)-P(C)= 1-0.15-0.25= 0.6,故选 C.答案?C(四)考察古典概型 ,全国卷对古典概型每年都会考察 ,难度中等 ,主要考察实质背景的可能事件 ,往常与互斥事件、对峙事件一同考察 .在高考取独自命题时 ,往常以选择题、填空题形式出现 ,属于中低档题 .7.(2018 ·全国Ⅱ卷·理 T8 改编 )我国数学家陈景润在哥德巴赫猜想的研究中获得了世界当先的成就 .哥德巴赫猜想是“每个大于 2 的偶数能够表示为两个素数的和”,如30= 7+ 23.在不超出 30 的素数中 ,随机选用 2 个不一样的数 ,其和等于26 的概率是 ().A. B. C. D.分析 ?不超出30的素数有2,3,5,7,11,13,17,19,23,29,共10个,从中随机选用 2 个不一样的数 ,共有 C= 45 种取法 .由于 3+ 23= 7+ 19= 26,所以随机选用2 个不一样的数 ,其和等于 26 的有 2 种取法 ,故所求概率为.答案?D8.(2018 ·江苏卷·T6 改编 )某兴趣小组有 2 名男生和 3 名女生 ,现从中任选 2 名学生去参加活动 ,则恰巧选中 1 名男生和 1 名女生的概率为.分析 ?从5名学生中任选2 名学生 ,共有 C = 10 种选法 ,此中恰巧选中1 名男生和 1 名女生的选法有 C C= 6 种,所以所求概率为= .答案 ?(五)考察几何概型 ,难度较大 ,以理解几何概型的观点、概率公式为主,会求一些简单的几何概型的概率 ,常与平面几何、线性规划、不等式的解集等知识交汇考察 ,在高考取多以选择题、填空题的形式考察 ,难度中等 .9.(2018 ·全国Ⅰ卷·理 T10 改编 )折纸艺术是我国古代留下来可贵的民间艺术,拥有很高的审美价值和应用价值.以下图的是一个折纸图案,由一个正方形内切一个圆形 ,而后在四个极点处罚别嵌入半径为正方形边长一半的扇形 .向图中随机投入一个质点 ,则质点落在暗影部分的概率 P1与质点落在正方形内圆形地区外面的概率P2的大小关系是 ().A.P1>P 2B.P1<P 2C.P1=P 2D.不可以确立分析 ?将正方形内圆形地区外面的四个角进行沿直角边重合组合,恰好获得的图形就是暗影部分图形,所以暗影部分地区的面积等于正方形内圆形地区外面的面积 ,故 P1=P 2.答案?C10.(2016 ·全国Ⅱ卷·文 T8 改编 )某路口人行横道的信号灯为红灯和绿灯交替出现 ,红灯连续时间为40 秒.若一名行人到达该路口碰到红灯,则起码需要等待 10 秒才出现绿灯的概率为().A. B. C. D.分析 ?起码需要等候10秒才出现绿灯的概率为= ,应选 A .答案?A(六)考察随机抽样 ,在抽样方法的考察中,系统抽样、分层抽样是考察的要点 ,题型主要以选择题和填空题为主,属于中低档题 .11.(2017 ·江苏卷·T3 改编 )某工厂生产甲、乙、丙、丁四种不一样型号的产品,产量分别为 200、400、300、100 件,为查验产品的质量 ,现用分层抽样的方法从以上全部的产品中抽取60 件进行查验 ,则应从甲种型号的产品中抽取件.分析 ?∵==,∴应从甲种型号的产品中抽取×200= 12(件 ).答案?12(七)用样本预计整体 ,主要考察均匀数、方差等的计算以及茎叶图、频次分布直方图的简单应用 .题型以选择题和填空题为主 ,出现解答题时常常与概率相联合 ,属于中档题 .12.(2018 ·全国Ⅰ卷·理 T3 改编 )某地域经过一年的新乡村建设,乡村的经济收入增添了一倍 ,实现翻番 .为更好地认识该地域乡村的经济收入变化状况,统计了该地域新乡村建设前后乡村的经济收入构成比率,获得以下饼图 :则以下选项中不正确的选项是().A.新乡村建设后 ,栽种收入增添B.新乡村建设后 ,其余收入增添了一倍以上C.新乡村建设后 ,养殖收入没有增添D.新乡村建设后 ,养殖收入与第三家产收入的总和超出了经济收入的一半分析 ? 由题干可知 ,乡村的经济收入增添了一倍 ,实现翻番 .为方即可设建设前后的经济收入分别为 100,200(单位省去 ).A 中,栽种收入前后分别为60,74,收入增添了 ,A 正确 ;B 中,其余收入前后分别为 4,10,增添了一倍以上 ,B 正确 ;C 中,养殖收入前后分别为 30,60,收入增添了一倍 ,C 错误 ;D 中,建设后 ,养殖收入与第三家产收入的总和为(30+ 28)×2= 116> 100,D 正确 .应选 C.答案?C13.(2017 ·全国Ⅲ卷·理 T3)某城市为认识旅客人数的变化规律 ,提升旅行服务质量 ,采集并整理了 2014 年 1 月至 2016 年 12 月时期月招待旅客量 (单位 :万人)的数据 ,绘制了下边的折线图 .依据该折线图 ,以下结论错误的选项是 ().A.月招待旅客量逐月增添B.年招待旅客量逐年增添C.各年的月招待旅客量顶峰期大概在7,8 月D.各年 1 月至 6 月的月招待旅客量相对于7 月至 12 月,颠簸性更小 ,变化比较安稳分析 ? 对于选项 A, 由图易知 ,月招待旅客量每年 7,8 月份明显高于 12 月份 ,故 A 错误 ;对于选项 B,察看折线图的变化趋向可知 ,年招待旅客量逐年增添 ,故 B 正确 ;对于选项 C,D,由图可知明显正确 .答案?A(八)考察失散型随机变量分布列、超几何分布、条件概率、正态分布、数学希望与方差 ,求失散型随机变量的数学希望是全国卷高考要点考察的内容,在选择题、填空题中有时会出现.主要考察失散型随机变量的分布列、数学希望、正态分布等 .14.(2018 ·全国Ⅲ卷·理 T8 改编 )某集体中的每位成员使用挪动支付的概率都为 p,各成员的支付方式互相独立,设 X 为该集体的 10 位成员中使用挪动支付的人数 ,D(X)= 2.1,P(X= 4)<P (X= 6),则 p= ().分析 ? 由于 X~B(n,p),所以 D(X)=np(1-p)= 2.1,所以 p= 0.3 或 p=0.7.由于 P(X= 4)=p4(1-p)6<P (X= 6)=p6(1-p)4,所以 (1-p)2 2可得p> 0.5.故p=0.7.<p ,答案?A15.(2017 ·全国Ⅱ卷·理 T13 改编 )一批产品的二等品率为 0.08,从这批产品中每次随机取一件,有放回地抽取 100 次,X 表示抽到的二等品件数,则D(X)=.分析 ?有放回地抽取,是一个二项分布模型, 此中p=0.08,n=100,则D(X)=np(1-p)= 100×0.08×0.92= 7.36.答案 ?7.36二、解答题的命题特色概率与统计综合试题的题干阅读量大,简单造成考生在数学模型转变过程中失误,得分率不高 .这些试题主要考察古典概型,用样本预计整体,利用回归方程进行展望 ,独立性查验的应用 ,失散型随机变量的分布列和数学希望 ,正分布等 .概率、随机量的数学希望交命,高考此目的要求是能依据出的或通表出的有关数据求性回方程.1.(2018 ·全国Ⅱ卷·理 T18)下是某地域 2000 年至 2016 年境基施投y(位 :元)的折.了地域 2018 年的境基施投 ,成立了 y 与量 t 的两个性回模型 .依据2000 年至 2016 年的数据 (量 t 的挨次1,2, ⋯ ,17)成立模型①: =- 30.4+ 13.5t;依据 2010年至 2016 年的数据 (量t 的挨次 1,2, ⋯,7)成立模型②: = 99+ 17.5t.(1)分利用两个模型 ,求地域 2018 年的境基施投的.(2)你用哪个模型获得的更靠谱?并明原因 .分析 ? (1)利用模型①,从 2000 年开始算起 ,2018 年即 t= 19,所以地域2018 年的境基施投的=- 30.4+ 13.5×19= 226.1(元).利用模型②,从 2010 年开始算起 ,2018 年即 t= 9,所以地域 2018 年的境基施投的= 99+ 17.5×9= 256.5(元).(2)利用模型②获得的更靠谱 .原因以下 :(i) 从折能够看出 ,2000年至 2016 年的数据的点没有随机分布在直线 y=- 30.4+ 13.5t 上下 ,这说明利用 2000 年至 2016 年的数据成立的线性模型①不可以很好地描绘环境基础设备投资额的变化趋向.2010 年相对 2009 年的环境基础设备投资额有明显增添,2010 年至 2016 年的数据对应的点位于一条直线的邻近 ,这说明从 2010 年开始环境基础设备投资额的变化规律呈线性增添趋向,利用2010年至2016年的数据成立的线性模型= 99+ 17.5t能够,所以利用模型②较好地描绘2010年此后的环境基础设备投资额的变化趋向获得的展望值更靠谱.(ii)从计算结果看 ,相对于 2016 年的环境基础设备投资额 220 亿元 ,由模型①获得的展望值 226.1 亿元的增幅明显偏低 ,而利用模型②获得的展望值的增幅比较合理 ,说明利用模型②获得的展望值更靠谱 .2.(2018 ·全国Ⅰ卷,理 T20)某工厂的某种产品成箱包装 ,每箱 200 件,每一箱产品在交托用户以前要对产品作查验,如查验出不合格品,则改换为合格品 .查验时 ,先从这箱产品中任取 20 件作查验 ,再依据查验结果断定能否对余下的全部产品作查验 .设每件产品为不合格品的概率都为p(0<p< 1),且各件产品能否为不合格品互相独立.(1)记 20 件产品中恰有 2 件不合格品的概率为f(p),求 f(p)的最大值点 p0.(2)现对一箱产品查验了20 件,结果恰有 2 件不合格品 ,以(1)中确立的 p0作为p 的值 .已知每件产品的查验花费为 2 元,如有不合格品进入用户手中,则工厂要对每件不合格品支付25 元的补偿花费 .(i)若不对该箱余下的产品作查验 ,这一箱产品的查验花费与补偿花费的和记为 X,求 E(X).(ii)以查验花费与补偿花费和的希望值为决议依照 ,能否该对这箱余下的全部产品作查验 ?分析 ? (1)由题意可知 ,独立重复试验切合二项分布 ,20 件产品中恰有 2 件不合格品的概率为f(p)C p2(1-p)18= 190p2(1-p)18,对上式求导得 f'(p)= [190p2(1-p)18]'=190[2p(1-p)18-18p2(1-p)17]=190p(1-p)17[2(1-p)-18p]=380p(1-p)17(1-10p).当 f'(p)= 0 时,有 p(1-p)17由适当∈时(1-10p)= 0,0<p< 1,p,f'(p)> 0,f(p)单一递加 ;当 p∈时,f'(p)< 0,f(p)单一递减.故 f(p)max=f (p0)=f,即 p0= .(2)(i) 由题意 ,节余未作查验的产品有180件,此中 Y表示不合格品的件数 ,其听从二项分布Y~B.故 E(Y)= 180× = 18.又 X= 40+ 25Y,故 E(X)=E (40+ 25Y)= 40+ 25×18= 490(元).(ii)若对这箱余下的全部产品作查验 ,则需要的查验费为 200×2= 400(元).由于 E(X)= 490> 400,所以需要对这箱余下的全部产品作查验.3.(2018 ·全国Ⅲ卷·理 T18)某工厂为提升生产效率 ,睁开技术创新活动 ,提出了达成某项生产任务的两种新的生产方式 .为比较两种生产方式的效率,选用40 名工人 ,将他们随机分红两组 ,每组 20 人,第一组工人用第一种生产方式 , 第二组工人用第二种生产方式 .依据工人达成生产任务的工作时间 (单位 :min) 绘制了以下茎叶图 :(1)依据茎叶图判断哪一种生产方式的效率更高?并说明原因 .(2)求 40 名工人达成生产任务所需时间的中位数 m,并将达成生产任务所需时间超出 m 和不超出 m 的工人数填入下边的列联表 :不超出超出 mm第一种生产方式第二种生产方式(3)依据 (2)中的列联表 ,可否有 99%的掌握以为两种生产方式的效率有差别?附:K2=,P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828分析 ? (1)第二种生产方式的效率更高.原因以下 :(i)由茎叶图可知 ,用第一种生产方式的工人中 ,有 75%的工人达成生产任务所需时间起码 80 分钟 ,用第二种生产方式的工人中 ,有 75%的工人达成生产任务所需时间至多 79 分钟 ,所以第二种生产方式的效率更高 .(ii)由茎叶图可知,用第一种生产方式的工人达成生产任务所需时间的中位数为 85.5 分钟 ,用第二种生产方式的工人达成生产任务所需时间的中位数为 73.5 分钟 ,所以第二种生产方式的效率更高 .(iii)由茎叶图可知,用第一种生产方式的工人达成生产任务均匀所需时间高于 80 分钟 ,用第二种生产方式的工人达成生产任务均匀所需时间低于80 分钟 ,所以第二种生产方式的效率更高.(iv)由茎叶图可知 ,用第一种生产方式的工人达成生产任务所需时间分布在茎 8 上的最多 ,对于茎 8 大概呈对称分布 ;用第二种生产方式的工人达成生产任务所需时间分布在茎 7 上的最多 ,对于茎 7 大概呈对称分布 .又用两种生产方式的工人达成生产任务所需时间分布的区间同样 ,故能够以为用第二种生产方式达成生产任务所需的时间比用第一种生产方式达成生产任务所需的时间更少 ,所以第二种生产方式的效率更高 .(2)由茎叶图知 m== 80.列联表以下 :超出 m不超出第一种生产方m 155式第二种生产方515式(3)因 K2的 k== 10> 6.635,所以有 99%的掌握两种生方式的效率有差别.4.(2017 ·全国Ⅰ卷·理 T19)了控某种部件的一条生的生程,每日从生上随机抽取16 个部件 ,并量其尺寸 (位 :cm).依据期生 ,能够条生正常状下生的部件的尺寸听从正分布2N(μ,σ).(1) 假生状正常,X 表示一天内抽取的16 个部件中其尺寸在(μ-3σ,μ+3σ)以外的部件数,求P(X≥1)及X 的数学希望.(2)一天内抽部件中 ,假如出了尺寸在 (μ-3σ,μ+3σ)以外的部件 ,就条生在一天的生程可能出了异样状况 ,需当日的生程行 .(i)明上述控生程方法的合理性 .(ii)下边是在一天内抽取的 16 个部件的尺寸 :9.9510.129.969.9610.019.929.9810.0410.269.9110.1310.029.2210.0410.059.95算得 =xi= 9.97,s==≈0 .212,此中 x i抽取的第 i 个部件的尺寸 ,i= 1,2,⋯,16.用本均匀数作μ的估 ,用本准差 s 作σ的估 ,利用估判断能否需当日的生程行?剔除 ( -3, + 3 )以外的数据 ,用剩下的数据估μ和σ(精准到 0.01).2附:若随机量Z服从正分布N(μ,σ),P(μ-3σ<Z<μ+3σ)= 0.9974,0.997416≈0.9592,≈0.09.分析 ? (1)由题可知抽取的一个部件的尺寸落在(μ-3σ,μ+3σ)以内的概率为 0.9974,进而部件的尺寸落在 (μ-3σ,μ+3σ)以外的概率为0.0026,故 X~B(16,0.0026).所以 P(X≥1)= 1-P(X= 0)= 1-0.997416≈1-0.9592=0.0408, X 的数学希望 E(X)= 16×0.0026= 0.0416.(2)(i) 假如生产状态正常 ,一个部件尺寸在 (μ-3σ,μ+3σ)以外的概率只有0.0026,一天内抽取的16 个部件中,出现尺寸在(μ-3σ,μ+3σ)以外的部件的概率只有0.0408,发生的概率很小,所以一旦发生这种状况,就有原因以为这条生产线在这天的生产过程可能出现了异样状况,需对当日的生产过程进行检查,可见上述监控生产过程的方法是合理的 .(ii) 由 = 9.97,s≈0.212,得μ的预计值为 = 9.97,σ的预计值为 = 0.212,由样本数据能够看出有一个部件的尺寸在 ( -3 , + 3 )以外 ,所以需对当日的生产过程进行检查 .剔除( -3 , +3 )以外的数据9.22,剩下数据的均匀数为×(16×9.97-9.22)= 10.02,所以μ的预计值为 10.02.= 16×0.2122+ 16×9.972≈ 1591.134,剔除( -3 , +3 )以外的数据9.22,剩下数据的样本方差为×2-15×10.022) ≈0.008,所以σ的预计值为≈0.09.1.样本数据(1)众数、中位数及均匀数都是描绘一组数据集中趋向的量 ,均匀数是最重要的量 ,与每个样本数占有关 ,这是中位数、众数所不拥有的性质 .(2)标准差、方差描绘了一组数据环绕均匀数颠簸的大小.标准差、方差越大 ,数据的失散程度就越大.(3)茎叶图、频次分布表和频次分布直方图都是用图表直观描绘样本数据的分布规律的 .2.频次分布直方图(1)用样本预计整体是统计的基本思想,而利用频次分布表和频次分布直方图来预计整体则是用样本的频次分布去预计整体分布的两种主要方法 .频次分布表在数目表示上比较正确 ,频次分布直方图比较直观 .(2)频次分布表中的频数之和等于样本容量,各组中的频次之和等于1;在频次分布直方图中,各小长方形的面积表示相应各组的频次,所以全部小长方形的面积的和等于 1;均匀数是频次分布直方图各个小矩形的面积×底边中点的横坐标之和 .3.摆列与组合(1)①解决“在”与“不在”的有限制条件的摆列问题 ,既能够从元素下手 ,也能够从地点下手 ,原则是谁“特别”谁优先 .不论是从元素考虑仍是从地点考虑 , 都要贯彻究竟 ,不可以既考虑元素又考虑地点 .②解决相邻问题的方法是“捆绑法”,即把相邻元素看作一个整体和其余元素一同摆列,同时要注意捆绑元素的内部摆列 .③解决不相邻问题的方法是“插空法”,即先考虑不受限制的元素的摆列,再将不相邻的元素插在前方元素摆列的空中间.④对于定序问题,可先不考虑次序限制,摆列后 ,再除以定序元素的全摆列.⑤若某些问题从正面考虑比较复杂 ,可从其反面下手 ,即采纳“间接法”.(2)组合问题的限制条件主要表此刻拿出元素中“含”或“不含”某些元素,或许“起码”或“最多”含有几个元素 :①“含有”或“不含有”某些元素的组合题型.“含”,则先将这些元素拿出 ,再由此外元素补足 ; “不含”,则先将这些元素剔除,再从剩下的元素中去选用 .②“起码”或“最多”含有几个元素的题型 .考虑逆向思想 ,用间接法办理 .(3)分组分派问题是摆列、组合问题的综合运用,解决这种问题的一个基本指导思想就是先分组后分派 .对于分组问题,有整体均分、部分均分和不平分三种 ,不论分红几组 ,都应注意只需有一些组中元素的个数相等 ,就存在均分现象 .4.随机变量的均值与方差一般计算步骤 :(1)理解 X 的意义 ,写出 X 的全部可能取的值 .(2)求 X 取各个值的概率 ,写出分布列 .(3)依据分布列,由均值的定义求出均值 E(X),进一步由公式D(X)=(x i -E(X))2p i=E(X2)-(E(X))2求出 D(X).(4)以特别分布 (两点分布、二项分布、超几何分布 )为背景的均值与方差。
第18题概率与统计高考考点命题分析三年高考探源考查频率概率、随机变量分布列及正态分布高考全国卷每年必有一道概率与统计解答题,该题通常以实际问题为背景,考查考生的数学建模及数据分析等核心素养,可以是较容易的题,也可以是难度较大的题,考查热点是概率的计算、随机变量的分布列、期望与方差的应用、正态分布、用样本估计总体、统计案例.2020课标全国Ⅰ19 2020课标全国Ⅲ18 2019课标全国Ⅱ18 2019课标全国I 21★★★统计与统计案例2021课标全国Ⅰ17 2021课标全国Ⅱ17 2020课标全国Ⅱ18 2020课标全国Ⅲ18 2019课标全国Ⅲ17★★★例题(2021高考全国I )某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备 9.8 10.3 10.0 10.2 9.99.8 10.0 10.1 10.29.7新设备 10.1 10.4 10.1 10.0 10.1 10.3 10.6 10.5 10.4 10.5y 21S 和22S .(1)求x ,y ,21S ,22S ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果2212210S S y x +-≥则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).【答案】(1)221210,10.3,0.036,0.04x y S S ====;(2)新设备生产产品的该项指标的均值较旧设备有 解:(1)9.810.31010.29.99.81010.110.29.71010x +++++++++==,(2分)10.110.410.11010.110.310.610.510.410.510.310y +++++++++==,(4分)22222222210.20.300.20.10.200.10.20.30.03610S +++++++++==,(8分) 222222222220.20.10.20.30.200.30.20.10.20.0410S +++++++++==.(8分)(2)依题意,20.320.1520.1520.025y x -==⨯==,0.0360.040.007610+=(10分)2212210s s y x +-≥,所以新设备生产产品的该项指标的均值较旧设备有显著提高. (12分)1.(2022届江苏省泰州市兴化市高三4月模拟)设(),X Y 是一个二维离散型随机变量,它们的一切可能取的值为(),i j a b ,其中,i j N *∈,令(,)ij i j p P X a Y b ===,称(,)ij p i j N *∈是二维离散型随机变量(),X Y 的联合分布列.与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式:(),X Y1b 2b 3b ... 1a 1,1p 1,2p 1,3p (2)a 2,1p 2,2p 2,3p (3)a3,1p3,2p3,3p ·…… … … … …现有()n n N ∈个相同的球等可能的放入编号为1,2,3的三个盒子中,记落下第1号盒子中的球的个数为X ,落入第2号盒子中的球的个数为Y . (1)当n =2时,求(),X Y 的联合分布列;(2)设0(,),nk m p P X k Y m k N ====∈∑且k n ≤计算0nk k kp =∑.2.(陕西省西安市高三下学期二模)某中学对学生进行体质测试(简称体测),随机抽取了100名学生的体测结果等级(“良好以下”或“良好及以上”)进行统计,并制成列联表如下: 良好以下 良好及以上 合计 男 25 女 10 合计70100(2)事先在本次体测等级为“良好及以上”的学生中按照性别采用分层抽样的方式随机抽取了9人.若从这9人中随机抽取3人对其体测指标进行进一步研究,求抽到的3人全是男生的概率.附:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.()20P K k ≥0.10 0.05 0.025 0.010 0.001 0k2.7063.8415.0246.63510.828会上参与全民健身活动的人越来越多,小明也有大量好友参与了“健步团”,他随机选取了其中的40人,记录了他们某一天的走路步数,并将数据整理如下:步量性别5001~60006001~70007001~80008001~9000>9000男 1 2 3 6 8 女21062(2)如果每人一天的走路步数超过8000步就会被系统评定为“健步型”,否则为“良好型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关健步型良好型总计男女总计附:参考公式()()()()() 2n ad bcKa b c d a c b d-=++++.临界值表:()2P K k≥0.10 0.05 0.025 0.010 0k 2.706 3.841 5.024 6.635专业队,与两名高山滑雪爱好者乙、丙组成的业余队进行友谊比赛.约定赛制如下:业余队中的两名队员轮流与甲进行比赛............,若甲连续豪两场.....则专业队获胜;若甲连续输两场.....则业余队获胜:若比赛三场还没有决出胜负,则视为平局,比赛结束.已知各场比赛相互独立,每场比赛都分出胜负,且甲与乙比赛,乙赢概率为13;甲与丙比赛,丙赢的橱率为p,其中1132p<<.(1)若第一场比赛,业余队可以安接乙与甲进行比赛,也可以安排丙与甲进行比赛.请分别计算两种安排下业余队获胜的概率;若以获胜概率大为最优决策,问:业余队第一场应该安排乙还是丙与甲进行比赛?(2)为了激励专业队和业余队,赛事组织规定:比赛结束时,胜队获奖金3万元,负队获奖金1.5万元;若平局,两队各获奖金1.8万元.在比赛前,已知业余队采用了(1)中的最优决策与甲进行比赛,设赛事组织预备支付的奖金金额共计X万元,求X的数学期望()E X的取值范围.5.(2022届广东省广州市高三二模)某校为全面加强和改进学校体育工作,推进学校体育评价改革,建立了日常参与,体质监测和专项运动技能测试相结合的考查机制,在一次专项运动技能测试中,该校班机抽取60名学生作为样本进行耐力跑测试,这60名学生的测试成绩等级及频数如下表成绩等级优良合格不合格频数7 11 41 1(1)从这60名学生中随机抽取2名学生,这2名学生中耐力跑测试成绩等级为优或良的人数记为X ,求()1P X =;(2)将样本频率视为概率,从该校的学生中随机抽取3名学生参加野外拉练活动,耐力跑测试成绩等级为优或良的学生能完成该活动,合格或不合格的学生不能完成该活动,能完成活动的每名学生得100分,不能完成活动的每名学生得0分.这3名学生所得总分记为Y ,求Y 的数学期望.6.(2022届重庆市高三质量检测)冰壶被喻为冰上的“国际象棋”,是以团队为单位在冰上进行的投掷性竞赛项目,每场比赛共10局,在每局比赛中,每个团队由多名运动员组成,轮流掷壶、刷冰、指挥.两边队员交替掷壶,可击打本方和对手冰壶,以最终离得分区圆心最近的一方冰壶数量多少计算得分,另外一方计零分,以十局总得分最高的一方获胜.冰壶运动考验参与者的体能与脑力,展现动静之美,取舍之智慧.同时由于冰壶的击打规则,后投掷一方有优势,因此前一局的得分方将作为后一局的先手掷壶.已知甲、乙两队参加冰壶比赛,在某局中若甲方先手掷壶,则该局甲方得分概率为25;若甲方后手掷壶,则该局甲方得分概率为23,每局比赛不考虑平局.在该场比赛中,前面已经比赛了六局,双方各有三局得分,其中第六局乙方得分.(1)求第七局、第八局均为甲方得分的概率; (2)求当十局比完,甲方的得分局多于乙方的概率.7.(2022届内蒙古赤峰市高三模拟)为评估设备M 生产某种零件的性能,从设备M 生产零件的流水线上随机抽取100个零件作为样本,测量其直径后,整理得到下表: 直径/mm 58596061626364 65 66 67686970717273合计个数2 1 13 5 6 1931164 4 2 1 2 2 1 10065μ=σ(1)为评判一台设备的性能,从该设备加工的零件中任意抽取一件,记其直径为X ,并根据以下不等式进行评判(P 表示相应事件的概率),()0.6826P X μσμσ-<≤+≥;()220.9545P X μσμσ-<≤+≥;()330.9973P X μσμσ-<≤+≥.评判规则为:若同时满足上述三个不等式,则设备等级为甲;若仅满足其中两个,则等级为乙;若仅满足其中一个,则等级为丙;若全部都不满足,则等级为丁,试判断设备M 的性能等级.(2)将直径小于等于2μσ-或直径大于2μσ+的零件认为是次品.(i )从设备M 的生产流水线上随机抽取3件零件,计算其中次品件数Y 的数学期望()E Y ; (ii )从样本中随机抽取2件零件,计算其中次品件数Z 的概率分布列和数学期望()E Z . 8.(2022届四川省绵阳市高三第三次诊断性考试)随着科技进步,近来年,我国新能源汽车产业迅速发展.以下是中国汽车工业协会2022年2月公布的近六年我国新能源乘用车的年销售量数据:年份 2016 2017 2018 2019 2020 2021 年份代码x1 2 3 4 5 6 新能源乘用车年销售y (万辆)5078126121137352(2)若用e nx y m =模型拟合y 与x 的关系,可得回归方程为0.3337.71e x y =,经计算该模型和第(1)问中模型的2R (2R 为相关指数)分别为0.87和0.71,请分别利用这两个模型,求2022年我国新能源乘用车的年销售量的预测值;(3)你认为(2)中用哪个模型得到的预测值更可靠?请说明理由. 参考数据:设ln u y =,其中ln i i u y =. yu()()61iii x x y y =--∑()()61i ii x x u u =--∑3.63e 5.94e 6.27e144 4.78 841 5.70 37.71 380 528参考公式:对于一组具有线性相关关系的数据()()123i i x y i n =⋅⋅⋅,,,,,,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为()()()121ˆnii i nii xx y ybxx==--=-∑∑,ˆˆay bx =-. 9.(2022届四川省攀枝花市高三第三次统一考试)2022年2月4日,北京冬奥会盛大开幕,这是让全国人民普遍关注的体育盛事,因此每天有很多民众通过手机、电视等方式观看相关比赛.某机构将每天收看相关比赛的时间在2小时以上的人称为“冰雪运动爱好者”,否则称为“非冰雪运动爱好者”,该机构通过调查,并从参与调查的人群中随机抽取了100人进行分析,得到下表(单位:人):冰雪运动爱好者非冰雪运动爱好者合计 女性 20 50 男性15合计 100的前提下认为性别与是否为“冰雪运动爱好者”有关?(2)将频率视为概率,现从参与调查的女性人群中用随机抽样的方法每次抽取1人,共抽取3次,记被抽取的3人中“冰雪运动爱好者”的人数为X ,若每次抽取的结果是相互独立的,求X 的分布列、数学期望()E X 和方差()D X . 附:()()()()()22n ad bc K a b c d a c b c -=++++,其中n a b c d =+++. ()20P K k ≥0.05 0.025 0.010 0.005 0.001 0k3.8415.0246.6357.87910.828北京冬奥会男子冰球主要比赛场馆是位于北京奥林匹克公园的“冰之帆”国家体育馆.本届冬奥会男子冰球有12支队伍进入正赛,中国首次组队参赛,比赛规则12支男子冰球参赛队先按照往届冬奥会赛制分成三个小组(每组4个队).正赛分小组赛阶段与决赛阶段;小组赛阶段各组采用单循环赛制(小组内任两队需且仅需比赛一次);决赛阶段均采用淘汰制(每场比赛胜者才晋级),先将12支球队按照小组赛成绩进行种子排名,排名前四的球队晋级四分之一决赛(且不在四分之一决赛中遭遇),其余8支球队按规则进行附加赛(每队比赛一次,胜者晋级),争夺另外4个四分之一决赛席位,随后依次是四分之一决赛、半决赛、铜牌赛、金牌赛(1)本届冬奥会男子冰球项目从正赛开始到产生金牌,组委会共要安排多少场比赛? (2)某机构根据赛前技术统计,率先晋级四分之一决赛的四支球队(甲乙丙丁队)实力相当,假设他们在接下来四分之一决赛、半决赛、铜牌赛、金牌赛中取胜率都依次为34、12、12、12,且每支球队晋级后每场比赛相互独立,试求甲、乙、丙、丁队都没获得冠军的概率.11.(2022届山东省枣庄市高三下学期一模)已知有一道有四个选项的单项选择题和一道有四个选项的多项选择题,小明知道每道多项选择题均有两个或三个正确选项.但根据得分规则:全部选对的得5分,部分选对的得2分,有选错的得0分.这样,小明在做多项选择题时,可能选择一个选项,也可能选择两个或三个选项,但不会选择四个选项.(1)如果小明不知道单项选择题的正确答案,就作随机猜测.已知小明知道单项选择题的正确答案和随机猜测的概率都是12,在他做完单项选择题后,从卷面上看,在题答对的情况下,求他知道单项选择题正确答案的概率.(2)假设小明在做该道多项选择题时,基于已有的解题经验,他选择一个选项的概率为12,选择两个选项的概率为13,选择三个选项的概率为16.已知该道多项选择题只有两个正确选项,小明完全不知道四个选项的正误,只好根据自己的经验随机选择.记X 表示小明做完该道多项选择题后所得的分数.求: (i )()0P X =;(ii )X 的分布列及数学期望.12.(2022届湖北省高三下学期4月二模)某企业使用新技术对某款芯片进行试生产,在试产初期,该款芯片的生产有四道工序,前三道工序的生产互不影响,第四道是检测评估工序,包括智能自动检测与人工抽检.已知该款芯片在生产中,前三道工序的次品率分别为123111,,1098P P P ===. (1)求该款芯片生产在进人第四道工序前的次品率;(2)如果第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片进入流水线并由工人进行人工抽查检验.在芯片智能自动检测显示合格率为90%的条件下,求工人在流水线进行人工抽检时,抽检一个芯片恰为合格品的概率.13.(2022届广西四市高三4月教学质量检测)近期新冠病毒奥密克戎毒株全球蔓延,传染性更强、潜伏期更短、防控难度更大.为落实动态清零政策下的常态化防疫,某高中学校开展了每周的核酸抽检工作:周一至周五,每天中午13:00开始,当天安排450位师生核酸检测,五天时间全员覆盖.(1)该校教职工有410人,高二学生有620人,高三学生有610人, ①用分层抽样的方法,求高一学生每天抽检人数;②高一年级共15个班,该年级每天抽检的学生有两种安排方案,方案一:集中来自部分班级;方案二:分散来自所有班级.你认为哪种方案更合理,并给出理由. (2)学校开展核酸抽检的第一周,周一至周五核酸抽检用时记录如下: 第x 天12 3 4 5 用时y (小时) 1.21.21.11.01.0x y ②根据①中的计算结果,判定变量x 和y 是正相关,还是负相关,并给出可能的原因.10 3.16,相关系数()()()()12211niii nniii i x x y y r x x y y ===--=--∑∑∑14.(2022届北京市通州区高三一模)某单位有A ,B 两个餐厅为员工提供午餐与晚餐服务,甲、乙两位员工每个工作日午餐和晚餐都在单位就餐,近100个工作日选择餐厅就餐情况统计如下:,A A(),A B(),B A(),B B 选择餐厅情况(午餐,晚餐)()甲员工30天20天40天10天乙员工20天25天15天40天(1)分别估计一天中甲员工午餐和晚餐都选择A餐厅就餐的概率,乙员工午餐和晚餐都选择B餐厅就餐的概率;E X;(2)记X为甲、乙两员工在一天中就餐餐厅的个数,求X的分布列和数学期望()(3)试判断甲、乙员工在晚餐选择B餐厅就餐的条件下,哪位员工更有可能午餐选择A餐厅就餐,并说明理由.。
2023全国高考数学统计与概率专题
引言
本文档旨在提供2023全国高考数学统计与概率专题的概述和重点内容。
通过对该专题的了解,学生可以更好地准备和应对高考数学考试。
一、概率计算
1. 确定事件的概率:介绍如何计算事件的概率,包括基本事件和复合事件。
2. 概率分布函数:讲解离散型随机变量和连续型随机变量的概率分布函数。
3. 期望值的计算:介绍如何计算离散型和连续型随机变量的期望值,包括线性期望值的性质。
二、统计推断
1. 抽样方法:介绍简单随机抽样、整群抽样和分层抽样等常用的抽样方法。
2. 参数估计:讨论点估计和区间估计的概念和计算方法,包括样本均值和样本方差的估计。
3. 假设检验:介绍如何进行假设检验,包括设立假设、选择显著性水平和计算检验统计量。
三、相关性和回归分析
1. 相关系数:介绍相关系数的概念和计算方法,包括皮尔逊相关系数和斯皮尔曼相关系数。
2. 线性回归分析:讲解线性回归的原理和应用,包括最小二乘法的计算和回归方程的确定。
结论
本文档简要介绍了2023全国高考数学统计与概率专题的主要内容,包括概率计算、统计推断和相关性回归分析。
学生们可以结合此文档进行针对性的复习和备考,以提高数学成绩。
祝各位同学取得优异的成绩!。
高考理科概率统计知识点在高考理科考试中,概率统计是一个非常重要的考点。
它涵盖了概率、统计和相关的数学概念。
理解和熟练掌握这些知识点是取得好成绩的关键。
本文将探讨高考理科概率统计知识点,并带您深入了解。
一、概率基础概率是指某个事件在可能的所有结果中发生的可能性。
在概率基础这一部分中,我们需要了解一些基本概念,比如事件、样本空间、随机事件等。
样本空间是指所有可能结果的集合。
例如,掷一枚硬币的结果可能是正面或反面,因此样本空间为{正面,反面}。
随机事件是在试验中可能发生或不发生的事件。
例如,抛一枚硬币的结果正面朝上,可以称为一个随机事件。
二、概率的计算方法1. 古典概率古典概率是根据已经知道的概率和样本空间中的元素个数来计算概率。
例如,掷一枚均匀的骰子,每个面的概率为1/6。
2. 频率概率频率概率是根据大量重复试验中某个事件发生的频率来估计概率。
例如,抛硬币,正面朝上的频率在长期大量的试验中会趋近于1/2。
3. 条件概率条件概率是指在已知其他事件发生的前提下,某个事件发生的概率。
例如,在已知某人患有某种疾病的前提下,他的检测结果呈阳性的概率。
三、统计学基础统计学是描述和解释现实世界中数据的科学。
在考试中,我们需要熟悉统计学的基本概念和方法。
1. 数据的描述性统计描述性统计是用统计数字和图形图表来总结和分析数据的方法。
例如,我们可以使用均值、中值和众数等数值来描述数据的集中趋势,使用标准差和方差来描述数据的离散程度。
2. 抽样调查抽样调查是指从总体中选择一部分样本进行调查的方法。
在抽样调查中,我们需要了解一些常见的抽样方法,比如简单随机抽样、系统抽样和分层抽样等。
3. 参数估计参数估计是指根据样本数据来估计总体参数值的方法。
在参数估计中,我们需要了解一些常见的参数估计方法,比如点估计和区间估计。
四、概率与统计的关系概率和统计密切相关,两者相互补充。
概率理论提供了统计学中推断和预测的基础,而统计学则通过实际观测数据来验证和应用概率理论。
高中数学概率与统计(理科)常考题型归纳题型一:常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率;(3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列. 解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23. 设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i . (1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝ ⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥,∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪⎫133×23+C 44⎝ ⎛⎭⎪⎫134=19.(3)依题设,ξ的所有可能取值为0,2,4. 且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=827,P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3)=C 14⎝ ⎛⎭⎪⎫131·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭⎪⎫133×23=4081, P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4)=C 04⎝ ⎛⎭⎪⎫234+C 44⎝ ⎛⎭⎪⎫134=1781.所以ξ的分布列是【类题通法】(1)本题4个人中参加甲游戏的人数服从二项分布,由独立重复试验,4人中恰有i 人参加甲游戏的概率P =C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i ,这是本题求解的关键. (2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件A i 的概率和.【变式训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为34,23,12,乙队每人答对的概率都是23,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分. (1)求ξ=2的概率;(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率. 解 (1)ξ=2,则甲队有两人答对,一人答错,故P (ξ=2)=34×23×⎝ ⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124;(2)设甲队和乙队得分之和为4为事件A ,甲队比乙队得分高为事件B .设乙队得分为η,则η~B ⎝ ⎛⎭⎪⎫3,23.P (ξ=1)=34×⎝ ⎛⎭⎪⎫1-23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-23×12=14,P (ξ=3)=34×23×12=14, P (η=1)=C 13·23·⎝ ⎛⎭⎪⎫132=29,P (η=2)=C 23·⎝ ⎛⎭⎪⎫232·13=49,P (η=3)=C 33⎝ ⎛⎭⎪⎫233=827, ∴P (A )=P (ξ=1)P (η=3)+P (ξ=2)P (η=2)+P (ξ=3)·P (η=1) =14×827+1124×49+14×29=13, P (AB )=P (ξ=3)·P (η=1)=14×29=118,∴所求概率为P (B|A )=P (AB )P (A )=11813=16.题型二:离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立. (1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和均值(数学期望).解 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5. (1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4) =P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)· P (A 3)P (A 4)=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681. (2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59, P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29, P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081, P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881. 故X 的分布列为E(X)=2×59+3×29+4×1081+5×881=22481.【类题通法】求离散型随机变量的均值和方差问题的一般步骤第一步:确定随机变量的所有可能值;第二步:求每一个可能值所对应的概率;第三步:列出离散型随机变量的分布列;第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【变式训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求:①顾客所获的奖励额为60元的概率;②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解(1)设顾客所获的奖励额为X.①依题意,得P(X=60)=C11C13C24=12,即顾客所获的奖励额为60元的概率为1 2.②依题意,得X的所有可能取值为20,60.P(X=60)=12,P(X=20)=C23C24=12,即X的分布列为所以顾客所获的奖励额的数学期望为E(X)=20×12+60×12=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为X1的数学期望为E(X1)=20×16+60×23+100×16=60(元),X1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X2的数学期望为E(X2)=40×16+60×23+80×16=60(元),X2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.题型三:概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组75,80),第2组80,85),第3组85,90),第4组90,95),第5组95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.解(1)由频率分布直方图知:第3组的人数为5×0.06×40=12.第4组的人数为5×0.04×40=8.第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.①设“甲或乙进入第二轮面试”为事件A,则P(A)=1-C310C312=511,所以甲或乙进入第二轮面试的概率为5 11.②X的所有可能取值为0,1,2,P(X=0)=C24C26=25,P(X=1)=C12C14C26=815,P(X=2)=C22C26=115.所以X的分布列为E(X)=0×25+1×815+2×115=1015=23.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X服从超几何分布.【变式训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:6273819295857464537678869566977888827689B地区:7383625191465373648293486581745654766579(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:记事件C:“A相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;C A2表示事件:“A地区用户的满意度等级为非常满意”;C B1表示事件:“B地区用户的满意度等级为不满意”;C B2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=C B1C A1∪C B2C A2.P (C )=P (C B 1C A 1∪C B 2C A 2) =P (C B 1C A 1)+P (C B 2C A 2) =P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给数据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,即P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,故P (C )=1020×1620+820×420=0.48.题型四:统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i=720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^x ,其中x ,y 为样本平均值.解 (1)由题意知n =10,x =1n ∑n i =1x i =8010=8, y =1n ∑n i =1y i=2010=2,又l xx =∑ni =1x 2i -n x 2=720-10×82=80,l xy =∑ni =1x i y i -n x y =184-10×8×2=24, 由此得b^=l xy l xx=2480=0.3, a^=y -b ^x =2-0.3×8=-0.4,故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元).【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱. (2)求线性回归方程的关键是正确运用b^,a ^的公式进行准确的计算.【变式训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?(2)将频率视为概率.人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X .若每次抽取的结果是相互独立的,求X 的分布列、期望E (X )和方差D (X ).解 (1)完成2×2列联表如下:K 2=100×(40×25-15×60×40×55×45≈8.249>6.635,故有99%的把握认为“读书迷”与性别有关.(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25. 由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i(i =0,1,2,3).X 的分布列为均值E (X )=np =3×25=65,方差D (X )=np (1-p )=3×25×⎝ ⎛⎭⎪⎫1-25=1825.。
高考数学2024概率与统计历年题目全解概率与统计作为高考数学中的重要部分,一直是考生们难以逾越的“坎”。
为了帮助广大考生更好地应对高考概率与统计部分的考题,本文将对高考数学2024年概率与统计题目进行全面解析,希望能够为考生们提供帮助和指导。
1. 选择题部分选择题是高考中概率与统计部分的常见题型,也是考生们容易出错的地方。
以下是2024年高考概率与统计选择题的解答:题目一:已知事件A发生的概率为P(A)=0.6,事件B发生的概率为P(B)=0.3,且事件A与事件B相互独立。
求事件A发生且事件B不发生的概率。
解答一:事件A发生且事件B不发生,表示为A发生的概率P(A)乘以B不发生的概率P(B'),即P(A且B')=P(A)×P(B')=0.6×(1-0.3)=0.6×0.7=0.42。
因此,事件A发生且事件B不发生的概率为0.42。
题目二:已知事件C发生的概率为P(C)=0.4,事件D发生的概率为P(D)=0.5,且事件C与事件D相互独立。
求事件C或事件D发生的概率。
解答二:事件C或事件D发生,表示为C发生的概率P(C)加上D发生的概率P(D),即P(C或D)=P(C)+P(D)=0.4+0.5=0.9。
因此,事件C或事件D发生的概率为0.9。
2. 计算题部分计算题是概率与统计部分的重要考察内容,需要考生们掌握一定的计算方法和技巧。
以下是2024年高考概率与统计计算题的解答:题目一:某班有40名学生,其中20名男生、20名女生。
现从该班级随机选取3名学生,求选出的3名学生全为男生的概率。
解答一:选出的3名学生全为男生的概率等于从20名男生中选取3名学生的概率除以从40名学生中选取3名学生的概率。
即P(全为男生)=C(20,3)/C(40,3)=[20×19×18]/[40×39×38]=0.0283。
因此,选出的3名学生全为男生的概率为0.0283。
专题15概率与统计(解答题)1.【2021·全国高考真题(理)】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x 和y ,样本方差分别记为21s 和22s .(1)求x ,y ,21s ,22s ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x -≥不认为有显著提高).【答案】(1)221210,10.3,0.036,0.04x y s s ====;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.(2)根据题目所给判断依据,结合(1)的结论进行判断.【详解】(1)9.810.31010.29.99.81010.110.29.71010x +++++++++==,10.110.410.11010.110.310.610.510.410.510.310y +++++++++==,22222222210.20.300.20.10.200.10.20.30.03610s +++++++++==,222222222220.20.10.20.30.200.30.20.10.20.0410s +++++++++==.(2)依题意,0.320.15y x -==⨯=,=,y x -≥,所以新设备生产产品的该项指标的均值较旧设备有显著提高.2.【2021·北京高考真题】为加快新冠肺炎检测效率,某检测机构采取“k 合1检测法”,即将k 个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为111,定义随机变量X 为总检测次数,求检测次数X 的分布列和数学期望E (X );(2)若采用“5合1检测法”,检测次数Y 的期望为E (Y ),试比较E (X )和E (Y )的大小(直接写出结果).【答案】(1)①20次;②分布列见解析;期望为32011;(2)()()E Y E X >.【分析】(1)①由题设条件还原情境,即可得解;②求出X 的取值情况,求出各情况下的概率,进而可得分布列,再由期望的公式即可得解;(2)求出两名感染者在一组的概率,进而求出()E Y ,即可得解.【详解】(1)①对每组进行检测,需要10次;再对结果为阳性的组每个人进行检测,需要10次;所以总检测次数为20次;②由题意,X 可以取20,30,()12011P X ==,()1103011111P X ==-=,则X 的分布列:X2030P1111011所以()1103202030111111E X =⨯+⨯=;(2)由题意,Y 可以取25,30,两名感染者在同一组的概率为232981510020499C C P C ==,不在同一组的概率为19599P =,则()()49529502530=999999E Y E X =⨯+⨯>.3.【2021·全国高考真题】某学校组织“一带一路”知识竞赛,有A ,B 两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A 类问题中的每个问题回答正确得20分,否则得0分;B 类问题中的每个问题回答正确得80分,否则得0分,己知小明能正确回答A 类问题的概率为0.8,能正确回答B 类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A 类问题,记X 为小明的累计得分,求X 的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.【答案】(1)见解析;(2)B 类.【分析】(1)通过题意分析出小明累计得分X 的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答B 类问题的数学期望,比较两个期望的大小即可.【详解】(1)由题可知,X 的所有可能取值为0,20,100.()010.80.2P X ==-=;()()200.810.60.32P X ==-=;()1000.80.60.48P X ==⨯=.所以X 的分布列为X020100P0.20.320.48(2)由(1)知,()00.2200.321000.4854.4E X =⨯+⨯+⨯=.若小明先回答B 问题,记Y 为小明的累计得分,则Y 的所有可能取值为0,80,100.()010.60.4P Y ==-=;()()800.610.80.12P Y ==-=;()1000.80.60.48P X ==⨯=.所以()00.4800.121000.4857.6E Y =⨯+⨯+⨯=.因为54.457.6<,所以小明应选择先回答B 类问题.4.【2021·全国高考真题】一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X 表示1个微生物个体繁殖下一代的个数,()(0,1,2,3)i P X i p i ===.(1)已知01230.4,0.3,0.2,0.1p p p p ====,求()E X ;(2)设p 表示该种微生物经过多代繁殖后临近灭绝的概率,p 是关于x 的方程:230123p p x p x p x x +++=的一个最小正实根,求证:当()1E X ≤时,1p =,当()1E X >时,1p <;(3)根据你的理解说明(2)问结论的实际含义.【答案】(1)1;(2)见解析;(3)见解析.【分析】(1)利用公式计算可得()E X .(2)利用导数讨论函数的单调性,结合()10f =及极值点的范围可得()f x 的最小正零点.(3)利用期望的意义及根的范围可得相应的理解说明.【详解】(1)()00.410.320.230.11E X =⨯+⨯+⨯+⨯=.(2)设()()3232101f x p x p x p x p =++-+,因为32101p p p p +++=,故()()32322030f x p x p x p p p x p =+-+++,若()1E X ≤,则123231p p p ++≤,故2302p p p +≤.()()23220332f x p x p x p p p '=+-++,因为()()20300f p p p '=-++<,()230120f p p p '=+-≤,故()f x '有两个不同零点12,x x ,且1201x x <<≤,且()()12,,x x x ∈-∞⋃+∞时,()0f x '>;()12,x x x ∈时,()0f x '<;故()f x 在()1,x -∞,()2,x +∞上为增函数,在()12,x x 上为减函数,若21x =,因为()f x 在()2,x +∞为增函数且()10f =,而当()20,x x ∈时,因为()f x 在()12,x x 上为减函数,故()()()210f x f x f >==,故1为230123p p x p x p x x +++=的一个最小正实根,若21>x ,因为()10f =且在()20,x 上为减函数,故1为230123p p x p x p x x +++=的一个最小正实根,综上,若()1E X ≤,则1p =.若()1E X >,则123231p p p ++>,故2302p p p +>.此时()()20300f p p p '=-++<,()230120f p p p '=+->,故()f x '有两个不同零点34,x x ,且3401x x <<<,且()()34,,x x x ∈-∞+∞ 时,()0f x '>;()34,x x x ∈时,()0f x '<;故()f x 在()3,x -∞,()4,x +∞上为增函数,在()34,x x 上为减函数,而()10f =,故()40f x <,又()000f p =>,故()f x 在()40,x 存在一个零点p ,且1p <.所以p 为230123p p x p x p x x +++=的一个最小正实根,此时1p <,故当()1E X >时,1p <.(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.5.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116.(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684---=.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为111178168816+++=.6.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)8(0ii x x =-=∑,2021)9000(i iy y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)((iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(,)i i x y (1,2,,20)i =的相关系数20220.943(iix y y x r --=∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.7.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)72(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:K 2=()()()()2) n ad bc a b c d a c b d -++++,P (K 2≥k )0.0500.0100.001k 3.841 6.63510.828.【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=.(3)根据所给数据,可得22⨯列联表:人次≤400人次>400空气质量好3337空气质量不好228根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.8.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:2SO [0,50](50,150](150,475]PM 2.5[0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:2SO PM 2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()P K k ≥0.0500.0100.001k3.8416.63510.828【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=.(2)根据抽查数据,可得22⨯列联表:2SO PM 2.5[0,150](150,475][0,75]6416(75,115]1010(3)根据(2)的列联表得22100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯.由于7.484 6.635>,故有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关.9.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:男生女生支持不支持支持不支持方案一200人400人300人100人方案二350人250人150人250人假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明)【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313((1)()3433436C -+-=;(Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.10.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)a=0.35,b=0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.11.【2019年高考全国Ⅱ卷理数】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【答案】(1)0.5;(2)0.1.【解析】(1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1–0.5)×(1–0.4)=0.5.(2)X =4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1–0.4)+(1–0.5)×0.4]×0.5×0.4=0.1.12.【2019年高考天津卷理数】设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望;(2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率.【答案】(1)分布列见解析,()2E X =;(2)20243.【分析】本小题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.【解析】(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故2~(3,)3X B ,从而3321()C ()(),0,1,2,333k k k P X k k -===.所以,随机变量X 的分布列为X0123P 1272949827随机变量X 的数学期望2()323E X =⨯=.(2)设乙同学上学期间的三天中7:30之前到校的天数为Y ,则2~(3,)3Y B ,且{3,1}{2,0}M X Y X Y ===== .由题意知事件{3,1}X Y ==与{2,0}X Y ==互斥,且事件{3}X =与{1}Y =,事件{2}X =与{0}Y =均相互独立,从而由(1)知()({3,1}{2,0})P M P X Y X Y ===== (3,1)(2,0)P X Y P X Y ===+==(3)(1)(2)(0)P X P Y P X P Y ===+==824120279927243=⨯+⨯=.13.【2019年高考北京卷理数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(1)0.4;(2)分布列见解析,E (X )=1;(3)见解析.【解析】(1)由题意知,样本中仅使用A 的学生有18+9+3=30人,仅使用B 的学生有10+14+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100−30−25−5=40人.所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率估计为400.4100=.(2)X 的所有可能值为0,1,2.记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”.由题设知,事件C ,D 相互独立,且93141()0.4,()0.63025P C P D ++====.所以(2)()()()0.24P X P CD P C P D ====,(1)()P X P CD CD ==()()()()P C P D P C P D =+0.4(10.6)(10.4)0.6=⨯-+-⨯0.52=,(0)()()()0.24P X P CD P C P D ====.所以X 的分布列为X012P 0.240.520.24故X 的数学期望()00.2410.5220.241E X =⨯+⨯+⨯=.(3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额都大于2000元”.假设样本仅使用A 的学生中,本月支付金额大于2000元的人数没有变化,则由上个月的样本数据得33011()C 4060P E ==.答案示例1:可以认为有变化.理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2000元的人数发生了变化,所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.14.【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X .(1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i = 表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i = ,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i = 为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.【答案】(1)分布列见解析;(2)(i)证明见解析,(ii)45 127p =,解释见解析.【解析】X 的所有可能取值为1,0,1-.(1)(1)P X αβ=-=-,(0)(1)(1)P X αβαβ==+--,(1)(1)P X αβ==-,所以X 的分布列为X1-01P (1)αβ-(1)(1)αβαβ+--(1)αβ-(2)(i )由(1)得0.4,0.5,0.1a b c ===.因此110.40.5 0.1i i i i p p p p -+=++,故110.1()0.4()i i i i p p p p +--=-,即114()i i i i p p p p +--=-.又因为1010p p p -=≠,所以1{}(0,1,2,,7)i i p p i +-= 为公比为4,首项为1p 的等比数列.(ii )由(i )可得88776100p p p p p p p p =-+-++-+ 877610()()()p p p p p p =-+-++-81413p -=.由于8=1p ,故18341p =-,所以44433221101( 411()327)(5())p p p p p p p p p p -=-+-+-+=-=.4p 表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为410.0039257p =≈,此时得出错误结论的概率非常小,说明这种试验方案合理.。
2017高考理科专题概率与统计(解析)一、选择题1.5个车位分别停放了,,,,,5A B C D E辆不同的车,现将所有车开出后再按,,,,A B C D E的次序停入这5个车位,则在A车停入了B车原来的位置的条件下,停放结束后恰有1辆车停在原来位置上的概率是()A. 38 B. 340C. 16D. 1122.如图是八位同学400米测试成绩的茎叶图(单位:秒),则()A. 平均数为64B. 众数为7C. 极差为17D. 中位数为64.5 3.五个人围坐在一张圆桌旁,每个人面前放着完全相同的硬币,所有人同时翻转自己的硬币.若硬币正面朝上, 则这个人站起来; 若硬币正面朝下, 则这个人继续坐着. 那么, 没有相邻的两个人站起来的概率为()A.516B.1132C.1532D.124. 5名学生进行知识竞赛.笔试结束后,甲、乙两名参赛者去询问成绩,回答者对甲说:“你们5人的成绩互不相同,很遗憾,你的成绩不是最好的”;对乙说:“你不是最后一名”.根据以上信息,这5人的笔试名次的所有可能的种数是()A. 54B. 72C. 78D. 965.已知5件产品中有2件次品,现逐一检测,直至能确定...所有次品为止,记检测的次数为ξ,则Eξ=()A. 3B. 72C.185D. 46.将编号为1,2,3,4,5,6的六个小球放入编号为1,2,3,4,5,6的六个盒子,每个盒子放一个小球,若有且只有三个盒子的编号与放入的小球编号相同,则不同的放法总数是A. 40B. 60C. 80D. 1007.某厂家为了解广告宣传费与销售轿车台数之间的关系,得到如下统计数据表:根据数据表可得回归直线方程ˆˆˆybx a =+,其中ˆ 2.4b =, ˆˆa y bx =-,据此模型预测广告费用为9万元时,销售轿车台数为 A. 17 B. 18 C. 19 D. 20二、填空题8.有3女2男共5名志愿者要全部分到3个社区去参加志愿服务,每个社区1到2人,甲、乙两名女志愿者需到同一社区,男志愿者到不同社区,则不同的分法种数为__________.10.从1,2,3,4,5,6,7这七个数中,随机抽取3个不同的数,则这3个数的和为偶数的概率是________.三、解答题11.一企业从某生产线上随机抽取100件产品,测量这些产品的某项技术指标值x ,得到的频率分布直方图如图.(1)估计该技术指标值x 平均数x ;(2)在直方图的技术指标值分组中,以x 落入各区间的频率作为x 取该区间值的频率,若4x x ->,则产品不合格,现该企业每天从该生产线上随机抽取5件产品检测,记不合格产品的个数为ξ,求ξ的数学期望E ξ.12.某保险公司针对企业职工推出一款意外险产品,每年每人只要交少量保费,发生意外后可一次性获赔50万元.保险公司把职工从事的所有岗位共分为A 、B、C三类工种,根据历史数据统计出三类工种的每赔付频率如下表(并以此估计赔付概率).(Ⅰ)根据规定,该产品各工种保单的期望利润都不得超过保费的20%,试分别确定各类工种每张保单保费的上限;(Ⅱ)某企业共有职工20000人,从事三类工种的人数分布比例如图,老板准备为全体职工每人购买一份此种保险,并以(Ⅰ)中计算的各类保险上限购买,试估计保险公司在这宗交易中的期望利润.13.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等极如下表:从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(1)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品90%”的规定?(2)在样本中,按产品等极用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X近似满足()X N,则“质量提升月”活动后的质量指~218,140标值的均值比活动前大约提升了多少?14.“微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(1)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?附:()()()()()22n ad bcka b c d a c b d-=++++,(2)若小王以这40位好友该日走路步数的频率分布来估计其所有微信好友每日走路步数的概率分布,现从小王的所有微信好友中任选2人,其中每日走路不超过5000步的有X人,超过10000步的有Y人,设X Yξ=-,求ξ的分布列及数学期望.15.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表:从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(Ⅰ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?(Ⅱ)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(Ⅲ)该企业为提高产品质量,开展了“质量提升月”活动,活动后在抽样检测,产品质量指标值X近似满足()218,140X N~,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?16.仪器经过检验合格才能出厂,初检合格率为3:若初检不合格,则需要进行4调试,经调试后再次对其进行检验;若仍不合格,作为废品处理,再检合格率.每台仪器各项费用如表:为45项目生产成本检验费/次调试费出厂价金额(元)1000 100 200 3000(Ⅰ)求每台仪器能出厂的概率;(Ⅱ)求生产一台仪器所获得的利润为1600元的概率(注:利润=出厂价-生产成本-检验费-调试费);(Ⅲ)假设每台仪器是否合格相互独立,记X为生产两台仪器所获得的利润,求X的分布列和数学期望.17.随着社会发展,淮北市在一天的上下班时段也出现了堵车严重的现象。
交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念.记交通指数为T,其范围为[0,10],分别有5个级别:T∈[0,2)畅通;T∈[2,4)基本畅通;T∈[4,6)轻度拥堵;T∈[6,8)中度拥堵;T∈[8,10]严重拥堵.早高峰时段(T≥3 ),从淮北市交通指挥中心随机选取了一至四马路之间50个交通路段,依据交通指数数据绘制的直方图如图所示:(I)据此直方图估算交通指数T∈[4,8)时的中位数和平均数;(II)据此直方图求出早高峰一至四马路之间的3个路段至少有2个严重拥堵的概率是多少?(III)某人上班路上所用时间若畅通时为20分钟,基本畅通为30分钟,轻度拥堵为35分钟,中度拥堵为45分钟,严重拥堵为60分钟,求此人用时间的数学期望.18.为研究男女同学空间想象能力的差异,孙老师从高一年级随机选取了20名男生、20名女生,进行空间图形识别测试,得到成绩茎叶图如下,假定成绩大于等于80分的同学为“空间想象能力突出”,低于80分的同学为“空间想象能力正常”.(1)完成下面22⨯列联表,并判断是否有90%的把握认为“空间想象能力突出”与性别有关;(2)从“空间想象能力突出”的同学中随机选取男生2名、女生2名,记其中成绩超过90分的人数为ξ,求随机变量ξ的分布列和数学期望.下面公式及临界值表仅供参考:()()()()()22n ad bcXa b c d a c b d-=++++19.校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类,自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(Ⅰ)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类学生数;(Ⅱ)根据抽取的180名学生的调查结果,完成下列列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?选择自然科学类选择社会科学类合计男生女生合计附:()()()()()22n ab bcKa b c d a c b d-=++++,其中n a b c d=+++.20.共享单车是指由企业在校园、公交站点、商业区、公共服务区等场所提供的自行车单车共享服务,由于其依托“互联网+”,符合“低碳出行”的理念,已越来越多地引起了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100] 分成5组,制成如图所示频率分直方图.(Ⅰ) 求图中x的值;(Ⅱ) 已知满意度评分值在[90,100]内的男生数与女生数的比为2:1,若在满意度评分值为[90,100]的人中随机抽取4人进行座谈,设其中的女生人数为随机变量X ,求X 的分布列和数学期望.21.在某单位的职工食堂中,食堂每天以3元/个的价格从面包店购进面包,然后以5元/个的价格出售.如果当天卖不完,剩下的面包以1元/个的价格卖给饲料加工厂.根据以往统计资料,得到食堂每天面包需求量的频率分布直方图如下图所示.食堂某天购进了90个面包,以x (单位:个, 60110x ≤≤)表示面包的需求量, T (单位:元)表示利润.(Ⅰ)求T 关于x 的函数解析式;(Ⅱ)根据直方图估计利润T 不少于100元的概率;(III )在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中间值的概率(例如:若需求量[)60,70x ∈,则取65x =,且65x =的概率等于需求量落入[)60,70的频率),求T 的分布列和数学期望.。