高考《概率与统计初步》知识点和高考题、配套练习题(很全面)
- 格式:doc
- 大小:1.82 MB
- 文档页数:22
概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
高考复习专题之:概率与统计一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值.1.随机事件A 的概率0()1P A ≤≤,其中当()1P A =时称为必然事件;当()0P A =时称为不可能事件P(A)=0; 注:求随机概率的三种方法: (一)枚举法例1如图1所示,有一电路AB 是由图示的开关控制,闭合a ,b ,c ,d ,e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通路的概率是 .分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。
解:闭合五个开关中的两个,可能出现的结果数有10种,分别是a b 、a c 、a d 、a e 、bc 、bd 、be 、cd 、ce 、de ,其中能形成通路的有6种,所以p(通路)=106=53评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现的结果比较少的事件的概率计算. (二)树形图法例2小刚和小明两位同学玩一种游戏.游戏规则为:两人各执“象、虎、鼠”三张牌,同时各出一张牌定胜负,其中象胜虎、虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚出象牌,小明出虎牌,则小刚胜;又如,两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用A 1、B 1、C 1分别表示小明的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少?分析:为了清楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结果,并从中找出小刚胜小明可能出现的结果数。
解:画树状图如图树状图。
由树状图(树形图)或列表可知,可能出现的结果有9种,而且每种结果出现的可能性相同,其中小刚胜小明的结果有3种.所以P (一次出牌小刚胜小明)=31点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结果,通过画树形图的方法来计算概率 (三)列表法例3将图中的三张扑克牌背面朝上放在桌面上,从中随机摸出两张,并用这两张扑克牌上的数字组成一个两位数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数的概率.分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找出组成的两位数是偶数的可能情况和组成两位数 是6的倍数的可能情况。
概率与统计高考知识点在高考数学中,概率与统计是一个重要的考点。
概率与统计不仅涉及到数学方面的知识,也与现实生活密切相关。
本文将通过几个具体的例子,深入探讨概率与统计相关的知识点,帮助考生更好地理解这一部分内容。
一、概率与事件概率与事件是概率与统计中的基础概念。
概率是描述事件发生可能性大小的数值,通常用P(A)表示。
事件是指随机试验中的一种结果,可以是一个单一结果或若干个结果的组合。
例如,投掷一枚骰子,出现点数小于等于3的事件记为A,则P(A)为1/2。
二、基本事件与对立事件基本事件是指随机试验中的最简单、最基础的事件,它不可再分解成其他事件。
对立事件是指两个事件发生的可能性互相排斥,即当一个事件发生时,另一个事件不发生。
例如,投掷一枚硬币,出现正面和出现反面就是对立事件。
三、概率的性质概率具有以下几个性质:1.非负性:对于任何事件A,有P(A)≥0;2.必然性:对于必然事件S(整个样本空间),有P(S)=1;3.可加性:对于任意两个互不相容的事件A和B,有P(A∪B)=P(A)+P(B)。
四、条件概率条件概率是指在已经发生一个事件的条件下,另一个事件发生的概率。
条件概率表示为P(A|B),其中A是已知发生的事件,B是条件事件。
例如,某班级男生占总人数的1/4,女生占总人数的3/4,已知某学生是女生,求其也是该班级的概率。
我们可以使用条件概率计算得出P(女生|学生) = P(女生∩学生) / P(学生) = 3/4。
五、独立事件独立事件是指两个事件的发生与否互相不影响。
如果事件A和事件B是独立事件,则有P(A∩B) = P(A) × P(B)。
例如,抛掷一枚硬币和掷一枚骰子,两个事件是独立的。
六、随机变量与概率分布随机变量是表示随机试验结果的变量。
离散型随机变量只能取有限个或可列个数值,连续型随机变量可以取任意实数值。
概率分布是随机变量取各个值的概率。
例如,抛掷一枚骰子,骰子的点数就是一个随机变量,其概率分布为离散型。
数学高考必备概率与统计知识点总结数学高考中,概率与统计是一个重要的考点,占据大约10%的考试比重。
掌握好概率与统计的知识点,对于考试取得好成绩至关重要。
本文将对数学高考中必备的概率与统计知识点进行总结,并提供实用的解题方法和技巧。
一、基本概念和概率计算1.1 随机事件和样本空间在概率理论中,随机事件是指实验过程的一个结果,而样本空间则是实验中可能出现的所有结果的集合。
在解题时,我们需要明确随机事件和样本空间的概念,将题目中的问题抽象成适合计算的形式。
1.2 概率的定义和性质了解概率的定义和性质对于解题至关重要。
掌握概率的加法原理、乘法原理、全概率公式和贝叶斯定理能够帮助我们解决复杂的概率计算问题。
1.3 随机变量和概率分布随机变量是指与随机事件相对应的可数的数值,概率分布则定义了随机变量的取值范围和其对应的概率。
掌握随机变量和概率分布的概念和计算方法,能够在解题过程中更好地理解和分析问题。
1.4 用排列组合解决概率问题排列组合是概率计算中常用的方法之一。
理解排列和组合的概念,掌握计算排列和组合的方法,可以帮助我们解决一定范围内的概率计算问题。
二、离散分布2.1 二项分布二项分布是一种重要的离散分布,在高考中经常出现。
掌握二项分布的概念、性质和计算方法,能够解决二项分布相关的问题。
2.2 泊松分布泊松分布是一种常见的离散分布,用于描述单位时间或单位空间内随机事件发生的次数。
了解泊松分布的特点和计算方法,能够解决与泊松分布相关的问题。
三、连续分布3.1 均匀分布均匀分布是一种常见的连续分布,描述了在一定范围内任意取值的概率相等的情况。
掌握均匀分布的概念和计算方法,能够解决与均匀分布相关的问题。
3.2 正态分布正态分布是一种重要的连续分布,具有对称性和钟形曲线的特点。
在高考中,许多问题都可以近似看作正态分布,因此掌握正态分布的概念和计算方法非常重要。
四、统计分析4.1 数据的收集和整理在统计分析中,数据的收集和整理是第一步。
高中数学必修一概率与统计概念知识点总结及练习题概率的基本概念- 事件:指某个特定的结果或情况。
- 样本空间:所有可能结果的集合。
- 随机试验:具有确定结果但无法预知的试验。
- 事件发生的概率:一个事件发生的可能性大小。
概率的计算方法频率定义法- 通过大量重复试验来估计某个事件发生的概率。
古典定义法- 对于具有确定结果的试验,通过分析样本空间和事件的个数来计算概率。
几何定义法- 通过几何形状的面积或长度来计算概率。
组合计数法- 通过组合的方法计算某个事件发生的概率。
概率的性质- 概率的取值范围:[0,1]- 必然事件的概率:1- 不可能事件的概率:0- 互斥事件的概率:两个事件不可能同时发生,概率为两个事件概率之和。
统计的基本概念- 总体:研究对象的全体。
- 样本:从总体中选取的一部分。
- 参数:总体的某个数值特征。
- 统计量:样本的某个数值特征。
抽样方法- 随机抽样:每个样本都有相同的机会被选中。
- 系统抽样:按照一定的规则抽取样本。
- 分层抽样:将总体划分成几个层次,然后从每个层次中随机抽取样本。
- 整群抽样:将总体划分成若干个互相独立的群组,然后随机选择某些群组作为样本。
统计的应用- 描述统计:通过图表和指标等方式描述数据特征。
- 推断统计:通过样本的统计量推断总体参数。
练题1. 一个骰子掷一次,计算以下事件的概率:- 出现奇数的概率- 出现大于4的概率2. 甲、乙、丙三个班级参加校运动会,根据每个班级报名人数的统计数据,计算以下事件的概率:- 一个学生随机选中是甲班的概率- 一个学生随机选中是丙班的概率3. 一名学生参加数学竞赛,根据往年的统计数据,该学生获奖的概率为0.4。
如果该学生连续参加了5次数学竞赛,计算以下事件的概率:- 至少获奖一次的概率- 恰好获奖3次的概率4. 某商品以正态分布的价格出售,平均价格为100元,标准差为10元。
计算以下事件的概率:- 价格大于90元的概率- 价格在90元到110元之间的概率5. 一组学生的考试成绩服从正态分布,平均分为80分,标准差为5分。
概率知识要点3.1.随机事件的概率3.1.1 随机事件的概率1、必然事件:一般地,把在条件S 下,一定会发生的事件叫做相对于条件S 的必然事件。
2、不可能事件:把在条件S 下,一定不会发生的事件叫做相对于条件S 的不可能事件。
3、确定事件:必然事件和不可能事件统称相对于条件S 的确定事件。
4、随机事件:在条件S 下可能发生也可能不发生的事件,叫相对于条件S 的随机事件。
5、频数:在相同条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数。
6、频率:事件A 出现的比例()=A n n A nf 。
7、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值.3.1.2 概率的意义1、概率的正确解释:随机事件在一次试验中发生与否是随机的,但随机性中含有规律性。
认识了这种随机中的规律性,可以比较准确地预测随机事件发生的可能性。
2、游戏的公平性:抽签的公平性。
3、决策中的概率思想:从多个可选答案中挑选出正确答案的决策任务,那么“使得样本出现的可能性最大”可以作为决策的准则。
——极大似然法、小概率事件4、天气预报的概率解释:明天本地降水概率为70%解释是“明天本地下雨的机会是70%”。
5、试验与发现:孟德尔的豌豆试验。
6、遗传机理中的统计规律。
3.1.3 概率的基本性质1、事件的关系与运算(1)包含。
对于事件A与事件B,如果事件A发生,则事件B一定发生,称事件B包含事件A(或事件A包含于事件B),记作(或A B)。
B A⊇⊆不可能事件记作∅。
(2)相等。
若B A A B且,则称事件A与事件B相等,记作A=B。
⊇⊇(3)事件A与事件B的并事件(和事件):某事件发生当且仅当事件A发生或事件B发生。
(4)事件A与事件B的交事件(积事件):某事件发生当且仅当事件A发生且事件B发生。
(5)事件A与事件B互斥:A BI,即事件A与A B∅I为不可能事件,即=事件B在任何一次试验中并不会同时发生。
s 概率与统计知识点全归纳1.随机抽样(1)简单随机抽样:一般地,设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)分层抽样:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.样本的频率分布估计总体分布(1)在频率分布直方图中,纵轴表示频率/组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.(3)茎叶图茎是指中间的一列数,叶是从茎的旁边生长出来的数.3.用样本的数字特征估计总体的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:xx1+x2+…+x n=,反映了一组数据的平均水平.n(4)标准差:是样本数据到平均数的一种平均距离,(5)方差:s2=1[(x1-x )2+(x2-x )2+…+(x n-x )2](x n是样本数据,n 是样本容量,x 是样本平均数).n4.概率和频率(1)在相同的条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A为事件A 出现的频数,称事件A 出现的比例f n(A)=n A为事件A 出现的频率.n(2)对于给定的随机事件A,由于事件A 发生的频率f n(A)随着试验次数的增加稳定于概率P(A),因此可以用频率f n(A)来估计概率P(A).5.事件的关系与运算6. 概率的几个基本性质(1)概率的取值范围:0≤P (A )≤1. (2)必然事件的概率 P (E )=1.(3)不可能事件的概率 P (F )=0. (4)概率的加法公式:如果事件 A 与事件 B 互斥,则 P (A ∪B )=P (A )+P (B ). (5)对立事件的概率:若事件 A 与事件 B 互为对立事件,则 P (A )=1-P (B ).7. 古典概型具有以下两个特点的概率模型称为古典概率模型,简称古典概型:高中数学资料共享群(734924357)(1) 试验中所有可能出现的基本事件只有有限个;(2)每个基本事件出现的可能性相等. 8.古典概型的概率公式 P (A )=A 包含的基本事件的个数.基本事件的总数9. 相关关系与回归方程(1)相关关系的分类①正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. ②负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(2) 线性相关关系:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.(3) 回归方程①最小二乘法:求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.^ ^ ^②回归方程:方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其n n⎧⎪ ^^中a ,b 是待定参数.⎪ ∑(x i - x )( y i - y ) ∑x i y i - nx y ⎪b ˆ = i =1 = i =1 , ⎨ (x - x )2 n x 2 - nx 2 ∑ i ⎪i =1 ∑ ii =1 ⎪⎩aˆ = y - b ˆx . (4) 回归分析①定义:对具有相关关系的两个变量进行统计分析的一种常用方法. ②样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中( x , y )称为样本点的中心. ③相关系数当 r >0 时,表明两个变量正相关;当 r <0 时,表明两个变量负相关.高中数学资料共享群(734924357)r 的绝对值越接近于 1,表明两个变量的线性相关性越强.r 的绝对值越接近于 0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于 0.75 时,认为两个变量有很强的线性相关性.10. 独立性检验(1) 分类变量:变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2) 列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量 X 和 Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称为 2×2 列联表)为2×2 列联表构造一个随机变量 K 2= n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 为样本容量.(3) 独立性检验利用随机变量 K 2 来判断“两个分类变量有关系”的方法称为独立性检验.11. 分类加法计数原理与分步乘法计数原理nn n n +1 n nn n12. 排列、组合的定义13. 排列数、组合数的定义、公式、性质14. 二项式定理15. 二项式系数的性质(1)C 0=1,C n =1,C m=C m -1+C m . C m =C n -m(0≤m ≤n ).(2)二项式系数先增后减中间项最大.高中数学资料共享群(734924357)i=1 n nn +1 n +3当 n 为偶数时,第 +1 项的二项式系数最大,最大值为C 2 ,当 n 为奇数时,第 项和第 项的二项式系数最大,n -1最大值为Cn 22 n +1或C n2 .n 2 2(3)各二项式系数和:C 0+C 1+C 2+…+C n =2n ,C 0+C 2+C 4+…=C 1+C 3+C 5+…=2n -1.nnnnnnnnnn16. 离散型随机变量的分布列(1) 随着试验结果变化而变化的变量称为随机变量.所有取值可以一一列出的随机变量称为离散型随机变量. (2) 一般地,若离散型随机变量 X 可能取的不同值为 x 1,x 2,…,x i ,…,x n ,X 取每一个值 x i (i =1,2,…,n )的概率 P (X=x i )=p i ,则称表为离散型随机变量 X 的概率分布列,简称为 X 的分布列,具有如下性质: ①p i ≥0,i =1,2,…,n ;②p 1+p 2+…+p n =1.离散型随机变量在某一范围内取值的概率等于它取这个范围内各个值的概率之和.17. 两点分布如果随机变量 X 的分布列为其中 0<p <1,则称离散型随机变量 X 服从两点分布.其中 p =P (X =1)称为成功概率.高中数学资料共享群(734924357)18. 离散型随机变量的均值与方差一般地,若离散型随机变量 X 的分布列为(1) 均值称 E (X )=x 1p 1+x 2p 2+…+x i p i +…+x n p n 为随机变量 X 的均值或数学期望.它反映了离散型随机变量取值的平均水平.(2) 方差称 D (X )=Σn [xi -E (X )]2pi 为随机变量 X 的方差,它刻画了随机变量 X 与其均值 E (X )的平均偏离程度,并称其算术平方根 D (X )为随机变量 X 的标准差.19. 均值与方差的性质 (1) E (aX +b )=aE (X )+b .(2) D (aX +b )=a 2D (X ).(a ,b 为常数)n μ σ 20. 超几何分布C k C n -k一般地,在含有 M 件次品的 N 件产品中,任取 n 件,其中恰有 x 件次品,则 P (X =k)= M N -M (k =0,1,2,…,m ),即 n N其中 m =min{M ,n },且 n ≤N ,M ≤N ,n ,M ,N ∈N *.如果一个随机变量 X 的分布列具有上表的形式,则称随机变量 X 服从超几何分布.21. 条件概率及其性质(1) 对于任何两个事件 A 和 B ,在已知事件 A 发生的条件下,事件 B 发生的概率叫做条件概率,用符号 P (B |A )来表示,其公式为 P (B |A )=P (AB )(P (A )>0).P (A )在古典概型中,若用 n (A )表示事件 A 中基本事件的个数,则 P (B |A )=n (AB ).n (A )(2) 条件概率具有的性质①0≤P (B |A )≤1;②如果 B 和 C 是两个互斥事件, 则 P (B ∪C |A )=P (B |A )+P (C |A ). 22.相互独立事件(1) 对于事件 A ,B ,若事件 A 的发生与事件 B 的发生互不影响,则称事件 A ,B 是相互独立事件. (2) 若 A 与 B 相互独立,则 P (B |A )=P (B ).(3) 若 A 与 B 相互独立,则 A 与 B , A 与 B , A 与 B 也都相互独立. (4) P (AB )=P (A )P (B )⇔A 与 B 相互独立. 23. 独立重复试验与二项分布(1) 独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的.(2) 在 n 次独立重复试验中,用 X 表示事件 A 发生的次数,设每次试验中事件 A 发生的概率为 p ,则 P (X =k )=C k p k(1-p )n -k (k =0,1,2,…,n ),此时称随机变量 X 服从二项分布,记为 X ~B (n ,p ),并称 p 为成功概率.24. 两点分布与二项分布的均值、方差(1)若随机变量 X 服从两点分布,则 E (X )=p ,D (X )=p (1-p ). (2)若 X ~B (n ,p ),则 E (X )=np ,D (X )=np (1-p ).25. 正态分布(1) 正态曲线:函数φ(x )-( x -μ)22σ2,x ∈(-∞,+∞),其中实数μ和σ为参数(σ>0,μ∈R ).我们称函数φ , (x )C μ,σ的图象为正态分布密度曲线,简称正态曲线.(2) 正态曲线的特点①曲线位于 x 轴上方,与 x 轴不相交; ②曲线是单峰的,它关于直线 x =μ对称; ③曲线在 x =μ④曲线与 x 轴之间的面积为 1;⑤当σ一定时,曲线的位置由μ确定,曲线随着μ的变化而沿 x 轴平移,如图甲所示;⑥当μ一定时,曲线的形状由σ确定,σ越小,曲线越“瘦高”,表示总体的分布越集中;σ越大,曲线越“矮胖”,表示总体的分布越分散,如图乙所示.(3) 正态总体在三个特殊区间内取值的概率值①P (μ-σ<X ≤μ+σ)≈0.682 7; ②P(μ-2σ<X ≤μ+2σ)≈0.954 5; ③P (μ-3σ<X ≤μ+3σ)≈0.997 3.。
文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率()()1,0∈AP(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_______ .4.已知一组数据5.5,4.5,1.5,8.4,7.4,则该组数据的方差是_____.5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____.6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图:则这组数据的中位数是________.7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(Ⅲ)估计居民月均用水量的中位数.类别人数老年教师900中年教师1800青年教师1600合计43009.(2015全国Ⅱ文)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表. A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表 满意度评分分组[50,60) [60,70) [70,80) [80,90) [90,100]频 数2814106(Ⅰ)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时). (Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:()()()()()d b c a d c b a bc d a n K ++++-=22满意度评分 低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意()02k K P ≥ 0.10 0.05 0.01 0.005 0k 2.706 3.841 6.635 7.87911.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数 6 26 38 22 8(Ⅰ)在下表中作出这些数据的频率分布直方图:(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014广东文)某车间20名工人年龄数据如下表:(Ⅰ)求这20名工人年龄的众数与极差;(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(Ⅲ)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为21,甲获胜的概率是31,则甲不输的概率为_________ .18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .19.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分区间 [25,30) [30,35) [35,40) [40,45) [45,50]人数 25 a b(Ⅰ)求正整数a ,b ,N 的值;(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A.31B.21C.32D.4321.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( ) A.107 B.85 C.83 D.103 22.在区间[-2,3]上随机选取一个数x ,则1≤x 的概率为_____ .23.若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是_______ .24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( )A .1ˆ-=x yB .1ˆ+=x yC .x y 2188ˆ+= D .176ˆ=y26.某产品的广告费用x 与销售额y 的统计数据如下:根据上表可得回归方程a x b yˆˆˆ+=中的b ˆ为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年 份 2011 2012 2013 2014 2015 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(Ⅰ)求y 关于t 的回归方程a t b yˆˆˆ+=; (Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情父亲身高x (cm ) 174 176 176 176 178 儿子身高y (cm )175175176177177广告费用x (万元) 4 2 3 5 销售额y (万元)49263954况,并预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程a t b yˆˆˆ+=中,t b y atn tyt n y t b ni ini ii ˆˆ,ˆ1221-=--=∑∑==.28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下: 甲校:乙校:(1)计算y x ,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.参考数据与公式:由列联表中数据计算()()()()()d b c a d c b a bc ad n K ++++-=22;临界值表:29.一次考试中,5名学生的数学、物理成绩如下表所示:(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;(2)根据上表数据作散点图,求y 与x 的线性回归方程(系数精确到0.01).附:回归直线的方程是:a x b y ˆˆˆ+=,其中()()()x b y ax x y y x x b ni ini iiˆˆ,ˆ121-=---=∑∑==; 90,93==y x ,()()()30,4051251=--=-∑∑==y y x x x x ii ii i .30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.(1)求频率分布表中a 、b 的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 ≥5保费0.85aa1.25a1.5a1.75a2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 ≥5概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机分组(岁) 频数 频数[20,25) 5 0.050 [25,30) 200.200 [30,35) a0.350[35,40) 30 b[40,45] 10 0.100 合计1001.000摸出2只球,则这2只球颜色不同的概率为____________ .33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.A,两地区分别随机调查了20个用户,得到用34.某公司为了解用户对其产品的满意度,从B户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);。
2023高考数学概率与统计基础知识清单概率与统计作为高中数学的重要组成部分,是2023年高考数学考试的核心内容之一。
掌握概率与统计的基础知识对于考生来说至关重要。
下面将为大家列出2023高考数学概率与统计的基础知识清单,帮助大家做好备考。
一、概率基础知识1. 事件与样本空间:事件是指一个或一组可能发生的结果,而样本空间是指所有可能结果的集合。
2. 概率的定义:概率是指某一事件发生的可能性大小,通常用P(A)表示,其中A是事件。
3. 概率的性质:概率的取值范围在0到1之间,且对于必然事件,其概率为1;对于不可能事件,其概率为0。
4. 概率的计算:计算概率可以通过频率方法、古典概型和几何概率等方法进行。
5. 条件概率:条件概率是指在已知事件B发生的条件下,事件A发生的概率,通常表示为P(A|B)。
6. 乘法定理:乘法定理用于计算联合事件的概率,即P(A∩B) = P(A) × P(B|A)。
7. 加法定理:加法定理用于计算两个事件的和事件的概率,即P(A∪B) = P(A) + P(B) - P(A∩B)。
二、统计基础知识1. 统计数据的分类:统计数据根据数量级的不同可以分为定性数据和定量数据。
2. 统计图形:统计图形常用于展示数据的分布情况,包括直方图、折线图、饼图等。
3. 中心趋势度量:中心趋势度量用于描述数据集中的一个典型值,包括平均数、中位数和众数。
4. 离散程度度量:离散程度度量用于描述数据的离散程度,包括极差、方差和标准差。
5. 点估计与区间估计:点估计是根据样本数据估算总体参数的一种方法,区间估计是给出一个可能范围的估计结果。
6. 抽样与抽样分布:抽样是指从总体中选取一部分样本进行统计分析,抽样分布是指样本统计量的概率分布。
7. 假设检验:假设检验是用于判断总体参数是否符合某种设定的方法,包括单样本假设检验和两样本假设检验等。
三、综合应用1. 概率与统计的应用:概率与统计在现实生活中有广泛的应用,例如随机事件的模拟、统计调查和贝叶斯定理等。
数学高考历年真题概率与统计专项20242024年数学高考将重点考察概率与统计专项内容,本文将通过总结历年真题,从不同角度介绍该专项的重点知识点和解题技巧,帮助考生们更好地备考。
一、基础概念回顾1.1 概率的基本概念及性质概率是研究随机现象的定量指标,常用的统计方法有频数法、频率法、极限法、随机抽样法等。
1.2 随机变量与概率分布随机变量是在随机试验中可能取到的数值,概率分布描述了随机变量的取值与其对应的概率之间的关系,常见的概率分布有二项分布、正态分布、泊松分布等。
二、经典概型及计数原理2.1 排列与组合排列是从n个元素中取出m个元素并按照一定次序排列,组合是从n个元素中取出m个元素,不考虑次序。
掌握排列与组合的计算方法可以帮助解决复杂的计数问题。
2.2 事件与样本空间事件是随机现象的一种具体结果,样本空间是随机试验所有可能结果的集合。
事件的概率可以通过样本空间中有利结果与样本空间元素个数的比值计算得出。
三、条件概率与独立事件3.1 条件概率的概念与计算已知事件B发生的条件下,关于事件A发生的概率称为条件概率,可以通过全概率公式和贝叶斯公式进行计算。
3.2 相互独立事件若两个事件A和B满足P(A∩B) = P(A)P(B),则称事件A和B相互独立。
熟练掌握独立事件的判定方法和计算公式对解题至关重要。
四、随机变量及其概率分布4.1 二项分布二项分布描述了n个相互独立的重复试验中成功次数的概率分布,其中每次试验只有两种可能的结果。
4.2 正态分布正态分布是概率论和统计学中最重要的概率分布之一,具有对称性、钟形曲线等特点,在实际问题中具有广泛应用。
4.3 泊松分布泊松分布常用于描述单位时间或单位空间内事件发生的概率,如电话呼叫次数、车到达次数等。
五、统计与抽样调查5.1 抽样调查的方法和步骤抽样调查是通过对部分个体或单位进行观察和测量,推断总体特征或总体之间关系的一种方法。
常见的抽样调查方法有随机抽样、分层抽样、整群抽样等。
高三概率与统计大题知识点概率与统计是高中数学中的一门重要课程,也是高考中的一大重点内容。
在高三学习概率与统计时,我们需重点掌握与大题相关的知识点,以下将详细介绍这些知识点。
一、基础概念1. 概率:指某个事件在试验中发生的可能性大小。
2. 随机试验:具有多种可能结果,每次试验结果不确定的试验。
3. 样本空间:随机试验的所有可能结果的集合。
4. 事件:样本空间的一个子集,表示我们所关心的某一结果或几个结果的集合。
5. 频率和概率的关系:频率越接近概率,随着试验次数的增加,频率会趋于概率。
二、计算概率1. 等可能概型:指随机试验的所有可能结果发生的概率是相等的。
2. 排列与组合:排列是指从不同元素中取出若干元素进行排列,组合是指从不同元素中取出若干元素进行组合。
3. 互斥事件与对立事件:互斥事件是指两个事件不能同时发生的事件,对立事件是指两个事件中一个发生另一个不发生的事件。
三、离散型随机变量与概率分布1. 随机变量:指试验结果的某个确定性的函数。
2. 离散型随机变量:指取值有限或可数的随机变量。
3. 概率分布:指离散型随机变量的所有可能取值及其对应的概率。
4. 期望:指离散型随机变量的所有可能取值与其对应概率的乘积的总和。
5. 方差:指随机变量的离散程度。
6. 二项分布:指n次独立试验中某一事件发生k次的概率分布。
四、连续型随机变量与概率密度函数1. 连续型随机变量:指取值为连续数值的随机变量。
2. 概率密度函数:指连续型随机变量某区间上的概率。
3. 期望与方差:连续型随机变量的期望和方差的计算方法。
五、统计1. 统计指标:平均数(算术平均数、加权平均数、几何平均数)、中位数、众数、方差、标准差等。
2. 抽样调查与总体:抽样调查是从总体中抽取一部分作为样本,通过样本来推断总体。
3. 假设检验:通过对样本进行统计推断,判断总体参数的假设是否成立。
4. 相关与回归分析:用于研究两个变量之间的相关性及其拟合程度。
数学高三概率与统计章节重点知识梳理与习题攻略概率与统计是高中数学中的重要章节,也是高考中的热点内容。
精通概率与统计对于学生提高数学成绩、应对高考至关重要。
为此,本文将对高三概率与统计章节的重点知识进行梳理,并提供习题攻略,帮助学生更好地掌握这一知识点。
一、基本概念1.事件与样本空间在概率与统计中,我们需要了解事件和样本空间的概念。
事件是指一个我们感兴趣的结果或者结果的集合,而样本空间是所有可能结果的集合。
2.概率概率是指某个事件发生的可能性大小。
常见的概率有经典概率、几何概率和统计概率等。
3.条件概率条件概率是指在某个事件已经发生的条件下,另一个事件发生的概率。
它可以用公式表示为:P(B|A) = P(A∩B)/P(A)。
4.互斥事件与独立事件互斥事件是指两个事件不能同时发生的情况,独立事件是指两个事件的发生不会相互影响。
二、概率计算方法1.加法原理与乘法原理加法原理是指计算两个事件至少发生一个的概率。
乘法原理是指计算两个事件同时发生的概率。
2.全概率公式和贝叶斯定理全概率公式是指在一组互斥事件的基础上计算某个事件的概率。
贝叶斯定理是指在已知某个事件发生的条件下计算另一个事件发生的概率。
三、随机变量与概率分布1.随机变量随机变量是指随机试验结果的某个函数,它可以是离散型随机变量或连续型随机变量。
2.离散型随机变量的概率分布离散型随机变量的概率分布可以用概率函数、分布列和累积分布函数来表示。
3.连续型随机变量的概率密度函数和分布函数连续型随机变量的概率密度函数和分布函数可以用来描述其取值的概率。
四、常见的概率分布1.二项分布与泊松分布二项分布是指在一系列独立的、相同概率的伯努利试验中,成功次数的概率分布。
泊松分布是指在一个固定时间或空间内,随机事件发生的概率分布。
2.正态分布正态分布是指在自然界种种现象中,满足特定条件的随机变量的概率分布。
它是统计学中最重要的分布之一。
五、统计推断1.抽样与抽样分布抽样是指从总体中选取个体(样本),通过对样本的统计量进行分析推断出总体特征。
专题十:《概率与统计初步》I、考纲1.统计与统计案例(1)随机抽样① 理解随机抽样的必要性和重要性。
② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。
(2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,了解它们各自的特点。
② 理解样本数据标准差的意义和作用,会计算数据标准差。
③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。
④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。
⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
(3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。
② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆线性回归方程系数公式)。
(4)统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题。
①独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。
②假设检验了解假设检验的基本思想、方法及其简单应用。
③回归分析了解回归的基本思想、方法及其简单应用。
2.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别。
② 了解两个互斥事件的概率加法公式。
(2)古典概型① 理解古典概型及其概率计算公式。
② 会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。
(3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率。
②了解几何概型的意义。
II、高考考情解读本章知识的高考命题热点有以下两个方面:1.概率统计是历年高考的热点内容之一,考查方式多样,选择题、填空题、解答题中都可能出现,数量各1道,难度中等,主要考查古典概型、几何概型、分层抽样、频率分布直方图、茎叶图的求解.2.预计在2014年高考中,概率统计部分的试题仍会以实际问题为背景,概率与统计相结合命题.II 、基础知识和题型 一、随机抽样1、简单随机抽样:(1).简单随机抽样的概念:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2).最常用的简单随机抽样方法有两种——抽签法和随机数法. 2、系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本: (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =Nn;(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本. 通常是将l 加上间隔k 得到第2个个体编号l +k , 再加k 得到第3个个体编号l +2k ,依次进行下去,直到获取整个样本. 【提醒】系统抽样的最大特点是“等距”,利用此特点可以很方便地判断一种抽样方法是否是系统抽样. 3、分层抽样(1).分层抽样的概念:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.(2).当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. (3).分层抽样时,每个个体被抽到的机会是均等的. 4(一)简单随机抽样 1. (2012·宁波月考)在简单随机抽样中,某一个个体被抽到的可能性( )A .与第几次抽样有关,第一次抽到的可能性最大B .与第几次抽样有关,第一次抽到的可能性最小C .与第几次抽样无关,每一次抽到的可能性相等D .与第几次抽样无关,与样本容量无关 2. 下面的抽样方法是简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D .用抽签法从10件产品中选取3件进行质量检验 3.(2013年高考江西卷(文5))(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08【总结】采用随机数法时,若重复出现或超出范围的要去掉。
高中数学之概率与统计求等可能性事件、互斥事件和相互独立事件的概率解此类题目常应用以下知识:card (A) m(1) 等可能性事件(古典概型)的概率:P(A)= card。
)=~n ;等可能事件概率的计算步骤:计算一次试验的基本事件总数n;设所求事件A,并计算事件A包含的基本事件的个数m;P(A) m依公式n求值;答,即给问题一个明确的答复•(2) 互斥事件有一个发生的概率:P(A + B) = P(A) + P(B);特例:对立事件的概率:P(A) + P( A) = P(A+ A) = 1.(3) 相互独立事件同时发生的概率:P(A • B) = P(A) • P(B);k k n k特例:独立重复试验的概率:Pn(k) = C nP (1 p).其中P为事件A在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.(4) 解决概率问题要注意“四个步骤,一个结合”:求概率的步骤是:等可能事件互斥事件独立事件第一步,确定事件性质n次独立重复试验即所给的问题归结为四类事件中的某一种■和事件第二步,判断事件的运算积事件即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.等可能事件:P(A)巴n互斥事件:P(A B) P(A) P(B)独立事件:P(A B ) P(A) P (B )第三步,运用公式n次独立重复试验:UK C n k p k d P)nk求解第四步,答,即给提出的问题有一个明确的答复例1. 在五个数字12 345中,。
例2. 若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示).p CL 丄 2C3 5 4 10 ■[解答过程]0.3提示:2例2•—个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为热反应的概率为 ___________ .(精确到0.01) [考查目的]本题主要考查运用组合、概率的基本知识和分类计数原理解决问题的能力,以 及推理和运算能力. [解答提示]至少有3人出现发热反应的概率为C 0.803 0.202 Cs 0.804 0.20 C f 0.805 0.94故填0.94.离散型随机变量的分布列 1. 随机变量及相关概念① 随机试验的结果可以用一个变量来表示, 这样的变量叫做随机变量, 常用希腊字母E 、 n等表示.② 随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量 .③ 随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量 2. 离散型随机变量的分布列①离散型随机变量的分布列的概念和性质般地,设离散型随机变量 可能取的值为X1, x 2 ,……,X i ,……,取每一个值X i ( i 1, 2,……)的概率P (Xi)=R ,则称下表为随机变量 的概率分布,简称的分布列. 由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1) P 0, i 1 , 2,…;(2) P P 2 …=1. ②常见的离散型随机变量的分布列: (1 )二项分布n 次独立重复试验中,事件A 发生的次数 是一个随机变量,其所有可能的取值为 0, 1,2,…k k n kn ,并且Pk P ( k) C n p q ,其中o k n , q 1 P ,随机变量的分布列如下:称这样随机变量 服从二项分布,记作 ~B(n,P ),其中n 、p 为参数,并记:[解答过程]100 120 例3.接种某疫苗后,出现发热反应的概率为0.80.现有5人接种该疫苗,至少有3人出现发k k n kC n P q b(k; n , p)(2)几何分布在独立重复试验中,某事件第一次发生时所作的试验的次数 是一个取值为正整数的离散型 随机变量,“ k ”表示在第k 次独立重复试验时事件第一次发生 随机变量的概率分布为:12 3kPpqp2q pk 1q p例1.厂家在产品出厂前,需对产品做检验,厂家将一批产品发给商家时,商家按合同规定也需随机 抽取一定数量的产品做检验,以决定是否接收这批产品•(I)若厂家库房中的每件产品合格的概率为0.8,从中任意取出4件进行检验,求至少有1件是合格的概率;(□)若厂家发给商家 20件产品中,其中有3件不合格,按合同规定该商家从中任取 2件.都进行检验,只有2件都合格时才接收这批产品.否则拒收,求出该商家检验出不合格产品数 的分布列及期望E ,并求出该商家拒收这批产品的概率[解答过程](I)记“厂家任取 4件产品检验,其中至少有 1件是合格品”为事件 A(n) 可能的取值为0,1,2 .2C 17136C 20190目_2_C ;0 19012P136 51 3 190190190136 27 1 -190 95 .27所以商家拒收这批产品的概率为95.13533 0 - 1 -2 -1919191E用对立事件A 来算,有41 0.251 190记“商家任取2件产品检验,都合格”为事件B,则商家拒收这批产品的概率2 C20例12.否则即被某项选拔共有三轮考核,每轮设有一个问题,能正确回答问题者进入下一轮考核,4 3 2淘汰•已知某选手能正确回答第一、二、三轮的问题的概率分别为5、5、5 ,且各轮问题能否正确回答互不影响•(I)求该选手被淘汰的概率;(n)该选手在选拔中回答问题的个数记为,求随机变量的分布列与数学期望•(注:本小题结果可用分数表示)[解答过程]解法一:(I)记“该选手能正确回答第i轮的问题”的事件为A(i 123),则4 3 2P(A)匚P(A2):P(A3)-5, 5, 5,该选手被淘汰的概率P P(A A A2 A2A2A3)P(瓦)P(A)P(A2)P(A)P(A2)P(A3)1 42 43 3 1015 5 5 5 5 5 125 .1P( 1) P(A)-(n) 的可能值为123, 5,4 2 8P( 2) P(AA2) P(A)P(A2)5 5 25 ,4 3 12P( 3) P(AA2) P(A)P(A2)----5 5 25的分布列为1 8 12 57E 1 2 3 -5 25 25 25 .4A (i 12 3) P(A1)—解法二:(I)记“该选手能正确回答第i轮的问题”的事件为A(i也3),贝y 5,3 2P(AJ — P(A3)-5, 5.,4 3 2 101该选手被淘汰的概率P 1 P(AA2A3) 1 P(A)P(A2)P(A3) 5 5 5 125 .(n)同解法一.(3 )离散型随机变量的期望与方差随机变量的数学期望和方差(1)离散型随机变量的数学期望:E x1p1 X2p2…;期望反映随机变量取值的平均水2 2 2⑵离散型随机变量的方差:D (X 1 E ) P l (X 2 E ) P 2…(X n E ) P n ...; 方差反映随机变量取值的稳定与波动,集中与离散的程度2⑶基本性质:E (a b) aEb ; D(ab) a D.⑷ 若 〜B(n , p),贝UEnp; D =npq (这里 q=1-p );E1 _q_E— 2如果随机变量 服从几何分布,P( k) g(k,p),贝y p, D = p 其中q=1-p.例1.甲、乙两名工人加工同一种零件,两人每天加工的零件数相等, 所得次品数分别为£、n,£和n 的分布列如下:例2.某商场经销某商品,根据以往资料统计,顾客采用的付款期数的分布列为1 2 3 4 5 P0.40.20.20.10.1商场经销一件该商品,采用 1期付款,其利润为200元;分2期或3期付款,其利润为250元;分4期或5期付款,其利润为 300元.表示经销一件该商品的利润.(I)求事件 A :“购买该商品的3位顾客中,至少有1位采用1期付款”的概率P (A );思路:一是要比较两名工人在加工零件数相等的条件下出次品数的平均值, 看出次品数的波动情况,即方差值的大小 . 解答过程:工人甲生产出次品数s 的期望和方差分别为: E 0 — 1 10 即期望;二是要11030.7102 1 20.7)2 (2 0.7)2106 10工人乙生产出次品数n 的期望和方差分别为:D (0 0.7)2(1 —0.891100.7)2 5 10(10.7)2 130 (20.7)22 0.664 10技术水平相当,但D s >Dq ,可见乙的技术比较方差反映随机变量取值的稳定与波动, 集中与离(n)求的分布列及期望E.[解答过程](I)由A表示事件“购买该商品的3位顾客中至少有1位采用1期付款”.知A表示事件“购买该商品的3位顾客中无人采用1期付款”P(A )(10.4)20.216P(A)1 P(A) 1 0.2160.784(n)的可能取值为200元, 250 元,300 元.P(200)P(1) 0.4P(250)P(2) P(3)0.2 0.2 0.4P(300)1P( 200)P(250) 1 0.4 0.40.2的分布列为200250300P0.40.40.2E 200 0.4 250 0.4 300 0.2240 (元).抽样方法与总体分布的估计抽样方法1. 简单随机抽样:设一个总体的个数为N,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样•常用抽签法和随机数表法•2•系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)•3•分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样总体分布的估计由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确•总体分布:总体取值的概率分布规律通常称为总体分布当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图•当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线•典型例题例1.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2: 3: 5.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号产品有16件•那么此样本的容量n= •2 1016 80解答过程:A种型号的总体是10,则样本容量n= 2 •例2.—个总体中有100个个体,随机编号0, 1, 2,…,99,依编号顺序平均分成10个小组,组号依次为1, 2, 3,…,10・现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为 m ,那么在第k 组中抽取的号码个位数字与 mk 的个位数字相同,若m 6,则在第7组中抽取的号码是解答过程:第K 组的号码为(k 1)10 , (k 1)10 1 ,•••,% 1)10 9,当m=6时,第k 组抽取 的号的个位数字为 m+k 的个位数字,所以第 7组中抽取的号码的个位数字为 3,所以抽取号码为63.正态分布与线性回归1.正态分布的概念及主要性质(1 )正态分布的概念常数,并且> 0,则称 服从正态分布,记为 ~N ( ,2).2(2)期望E = □,方差D . (3 )正态分布的性质 正态曲线具有下列性质:① 曲线在x 轴上方,并且关于直线 x =y 对称.② 曲线在x= 时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低 ③ 曲线的对称轴位置由卩确定; 曲线的形状由 确定, 越大,曲线越"矮胖”;反之越"高瘦”. 三d 原则即为数值分布在(卩一d ,卩+ d )中的概率为0.6526数值分布在(卩一2d ,卩+2d )中的概率为 0.9544 数值分布在(卩一3d ,卩+3d )中的概率为 0.9974 (4)标准正态分布当=0, =1时 服从标准的正态分布,记作 ~N (0, 1)(5 )两个重要的公式 ①(x) 1(x),② P(a b) (b) (a).2(6) N(-)与 N©1)二者联系.〜N(0,1)2.线性回归简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法如果连续型随机变量 的概率密度函数为f(x)1 eJ 2其中、2、 P(a②若〜N(,),则b)(b —)(—)完美WORD 格式专业知识分享变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确 定性的两个变量之间往往仍有规律可循 .回归分析就是处理变量之间的相关关系的一种数量 统计方法.它可以提供变量之间相关关系的经验公式具体说来,对n 个样本数据(Xl ,yi ), (),…,(X n ,y n ),其回归直线方程,或经验公式 n b 片 y i nxyi 1 a y b x, n ,a y 为:? bx a .其中 X in (x)2 i 1 ,其中x ,y 分别为| x*、| y|的平均数. 例1.如果随机变量E 〜 N 2),且 E E =3, D E =1,贝U P (— 1<E< 1=等于()A.2 0( 1)— 1B. Q( 4)—Q( 2)C. Q( 2)—Q( 4)D.①(一4)—①(一2) 解答过程:对正态分布,=E E =3,c 2=DE =1,故 P (— 1 <EW 1) =Q (1 — 3)—① 1 — 3) =Q( — 2)—① (—4) =Q( 4)- -①(2). 答案:B例2•将温度调节器放置在贮存着某种液体的容器内,调节器设定在d C,液体的温度E (单 位:C)是一个随机变量,且E 〜 N(d , 0.52 ).(1 )若d=90°,则E <89的概率为; (2)若要保持液体的温度至少为 80 C 的概率不低于0.99 ,则d 至少是 ?(其中若n 〜 N (0, 1),则①(2) =P (n <2) =0.9772,①(一2.327 ) =P (n <-2.327 ) =0.01 ).89 90解答过程:(1) P(E <89) =F (89)二①(0.5 )二①(-2) =1 —①(2) =1 — 0.9772=0.0228.(2)由已知 d 满足 0.99 < P (E> 80),即 1 — P (E <80)> 1 — 0.01 ,••• P (E <80)< 0.01.80 d.•©(0.5 )< 0.01=①(—2.327 ).80 d • 0.5 <— 2.327.• d w 81.1635.故d 至少为81.1635.N( 0, 1) . (2)标准正态分布的密度函数 f ( x ) 是偶函数,x<0时,f (x )为增函数,x>0时,f ( x )为减函数小结:(1 )若三〜N ( 0, 1),贝打。
2020年高考理科数学《概率与统计》题型归纳与训练【题型归纳】题型一 古典概型与几何概型例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为. 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示:(1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同;(2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2)2011. 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为7564, ∵527564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高.(2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有5840155408-=),(),,(),,(),,(),,(),,(),,(),,(),,(),,(),,(1514433323423222413121b a b a b a b a b a b a b a b a b a b a b a 共11个,∴抽取的两个人恰好对该措施一个赞成一个不赞成的概率2011=P . 【易错点】求解古典概型问题的关键:先求出基本事件的总数,再确定所求目标事件包含基本事件的个数,结合古典概型概率公式求解.一般涉及“至多”“至少”等事件的概率计算问题时,可以考虑其对立事件的概率,从而简化运算. 【思维点拨】1. 求复杂互斥事件概率的方法一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是间接法,先求此事件的对立事件的概率,再用公式()()1P A P A =-,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.2.求古典概型的概率的基本步骤:算出所有基本事件的个数;求出事件A 包含的基本事件个数;代入公式,求出()P A ;几何概型的概率是几何度量之比,主要使用面积、体积之比与长度之比. 题型二 统计与统计案例例1、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:],90,80[,),40,30[),30,20[Λ并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间)50,40[内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(Ⅰ)4.0;(Ⅱ)20;(Ⅲ)2:3.【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为6.010)04.002.0(=⨯+,所以样本中分数小于70的频率为4.06.01=-.(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.所以总体中分数在区间内的人数估计为. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为6010010)04.002.0(=⨯⨯+,所以样本中分数不小于70的男生人数为302160=⨯.所以样本中的男生人数为60230=⨯,女生人数为4060100=-,男生和女生人数的比例为2:340:60=,所以根据分层抽样的原理,总体中男生和女生人数的比例估计为2:3. 【易错点】求解统计图表问题,重要的是认真观察图表,发现有用信息和数据.对于频率分布直方图,应注意图中的每一个小矩形的面积是落在该区间上的频率,所有小矩形的面积和为1,当小矩形等高时,说明频率相等,计算时不要漏掉其中一个. 【思维点拨】1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 4.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.求回归直线方程的关键①正确理解计算^^,a b 的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关(0.010.020.040.02)100.9+++⨯=[40,50)1001000.955-⨯-=[40,50)540020100⨯=系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 6.独立性检验的关键①根据22⨯列联表准确计算2K ,若22⨯列联表没有列出来,要先列出此表. ②2K 的观测值k 越大,对应假设事件0H 成立的概率越小,0H 不成立的概率越大. 题型三 概率、随机变量及其分布例1、“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕, 市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求落在内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为; ②若,则, .【答案】(1) (2) (3)的分布列为;.【解析】(1)所抽取的100包速冻水饺该项质量指标值的样本平均数为A x Z ()2,N μσZ ()14.55,38.45()10,30X X 11.95σ=≈()2~,Z N μσ()0.6826P Z μσμσ-<≤+=(22)0.9544P Z μσμσ-<≤+=26.5x =0.6826X ()2E X =x.(2)①∵服从正态分布,且, ,∴, ∴落在内的概率是. ②根据题意得, ; ; ; ; . ∴的分布列为∴. 50.1150.2250.3350.25450.1526.5x =⨯+⨯+⨯+⨯+⨯=Z ()2,N μσ26.5μ=11.95σ≈(14.5538.45)(26.511.9526.511.95)0.6826P Z P Z <<=-<<+=Z ()14.55,38.450.68261~4,2X B ⎛⎫ ⎪⎝⎭()404110216P X C ⎛⎫=== ⎪⎝⎭()41411124P X C ⎛⎫=== ⎪⎝⎭()42413228P X C ⎛⎫=== ⎪⎝⎭()43411324P X C ⎛⎫=== ⎪⎝⎭()444114216P X C ⎛⎫=== ⎪⎝⎭X ()1422E X =⨯=【思维点拨】1.条件概率的两种求解方法: (2)基本事件法,借助古典概型概率公式,先求事件A 包含的基本事件数)(A n ,再求事件AB 所包含的基本事件数()AB n ,得)()()|(A n AB n A B P =. 2.判断相互独立事件的三种常用方法:(1)利用定义,事件B A ,相互独立⇔)()()(B P A P AB P ⋅=.(2)利用性质,A 与B 相互独立,则A 与A B ,与B ,B A 与也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.3. 求离散型随机变量的分布列,首先要根据具体情况确定X 的取值情况,然后利用排列、组合与概率知识求出X 取各个值的概率.4. 利用独立重复试验概率公式可以简化求概率的过程,但需要注意检验该概率模型是否满足公式k n k k n p p C k X P --==)1()(的三个条件:(1)在一次试验中某事件A 发生的概率是一个常数p ;(2)n 次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n 次试验中事件A 恰好发生了k 次的概率.5. 求离散型随机变量的均值与方差的基本方法有:(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;(2)已知随机变量X 的均值、方差,求X 的线性函数b aX Y +=的均值、方差,可直接用均值、方差的性质求解,即b X aE b aX E +=+)()(,)()(2X D a b aX D =+(b a ,为常数).(3)如能分析所给随机变量服从常用的分布,可直接利用它们的均值、方差公式求解,即若X 服从两点分布,则p X E =)(,)1()(p p X D -=;若),(~p n B X ,则np X E =)(,)1()(p np X D -=.【巩固训练】题型一 古典概型与几何概型1.已知,,则函数在区间上为增函数的概率是( )A .B .C .D . {}0 1 2a ∈,,{}1 1 3 5b ∈-,,,()22f x ax bx =-()1 +∞,512131416【答案】A【解析】①当时,,情况为符合要求的只有一种; ②当时,则讨论二次函数的对称轴要满足题意则产生的情况表示: ,8种情况满足的只有4种; 综上所述得:使得函数在区间为增函数的概率为:1251214=+=P .2.在区间上任取一数,则的概率是( )A .B .C .D . 【答案】C【解析】由题设可得,即;所以,则由几何概型的概率公式.故应选C .(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.【答案】(1) 0.4;(2) 45;(3)74. 【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为0a =()2f x bx =- 1 1 3 5b =-,,,1b =-0a ≠22b b x a a -=-=1ba≤() a b ,()()()1 1 1 1 1 3-,,,,,()()()()()1 5 2 1 2 1 2 3 2 5-,,,,,,,,,()22f x ax bx =-()1 +∞,()0,4x 1224x -<<12131434211<-<x 32<<x 4,1==D d 41=P考向二 统计与统计案例1.为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只, (Ⅰ)求列联表中的数据,,,的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效?22⨯x y A B【答案】(Ⅰ),,,;(Ⅱ)详见解析;(Ⅲ)至少有%9.99的把握认为疫苗有效.【解析】(Ⅰ)设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件A, 由已知得,所以,,,.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.10y =40B =40x =60A =302()1005y P A +==10y =40B =40x =60A =未注射 注射. 所以至少有%9.99的把握认为疫苗有效.2.在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在市的区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记表示在各区开设分店的个数, 表示这个分店的年收入之和.(Ⅰ)该公司已经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程; (Ⅱ)假设该公司在区获得的总年利润(单位:百万元)与之间的关系为,请结合(Ⅰ)中的线性回归方程,估算该公司应在区开设多少个分店,才能使区平均每个分店的年利润最大? 参考公式:, , .【答案】(1);(2)公司应在区开设4个分店,才能使区平均每个分店的年利润最大.【解析】(1)10085)())(()(,4,42112121^=---=--===∑∑∑∑====x x y yx x x n xyx n yx b y x ni ini iini ini iiΘ,6.0^^=-=x b y a , ∴y 关于x 的线性回归方程6.085.0+=x y .(2) ,区平均每个分店的年利润 ,∴时, 取得最大值,故该公司应在区开设4个分店,才能使区平均每个分店的年利润最大.10000005016.6710.8285020603=≈>⨯⨯S A x y x y x y x A z ,x y 20.05 1.4z y x =--A A y b x a ∧∧∧=+1221ni i i nii x y nxyb x nx ∧==-==-∑∑()()()121niii n ii x x y y x x ==---∑∑a y b x ∧∧=-0.850.6y x =+A A 20.05 1.4z y x =--=20.050.850.8x x -+-A 0.80.050.85z t x x x ==--+800.0150.85x x ⎛⎫=-++ ⎪⎝⎭4x =t A A3. 某商场对商品30天的日销售量y (件)与时间t (天)的销售情况进行整理,得到如下数据,经统计分析,日销售量y (件)与时间t (天)之间具有线性相关关系.(1)请根据表中提供的数据,用最小二乘法求出y 关于t 的线性回归方程a t b y +=. (2)已知商品30天内的销售价格z (元)与时间t(天)的关系为,),200(,20),3020(,100⎩⎨⎧∈<<+∈≤≤+-=N t t t N t t t z 根据(1)中求出的线性回归方程,预测t 为何值时,商品的日销售额最大.参考公式:2121^)(t n tyt n yt b ni ini ii--=∑∑==,t b y a ^^-=.【答案】(1)40^+-=t y ;(2)预测当20=t 时,商品的日销售额最大,最大值为1600元. 【解析】(1)根据题意,6)108642(51=++++⨯=t ,34)3033323738(51=++++⨯=y , 980301033832637438251=⨯+⨯+⨯+⨯+⨯=∑=i i i y t ,22010864222222512=++++=∑=i i t ,所以回归系数为1652203465980)(22121^-=⨯-⨯⨯-=--=∑∑==t n tyt n yt b ni ini ii,406)1(34^^=⨯--=-=t b y a ,故所求的线性回归方程为40^+-=t y . (2)由题意得日销售额为,,3020),40)(100(,200),40)(20(⎩⎨⎧∈≤≤+-+-∈<<+-+=Nt t t t Nt t t t L当N t t ∈<<,200时,900)10(80020)40)(20(22+--=++-=+-+=t t t t t L , 所以当;90010max ==L t 时,当N t t ∈≤≤,3020时,900)70(4000140)40)(100(22--=+-=+-+-=t t t t t L , 所以当.160020max ==L t 时,综上所述,预测当20=t 时,A 商品的日销售额最大,最大值为1600元. 题型三 概率、随机变量及其分布A A A A1.在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者654321,,,,,A A A A A A 和4名女志愿者4321,,,B B B B ,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(I )求接受甲种心理暗示的志愿者中包含1A 但不包含的频率。
《概率统计》知识点归纳总结1.加法公式结合独立性)()()()()(B P A P B P A P B A P -+=+例如:7.0)(,6.0)(==B P A P88.07.0*6.07.06.0)()()()()(=-+=-+=+B P A P B P A P B A P2. 分布函数的性质P39(其中分布函数)(x F 不是连续函数,非严格意义的单调递增性)3.方差的性质,二项分布)(p n B X ,~,泊松分布)(λπ~Y 的方差2,3.0,4===λp n44.312*97.0*3.0*4*16916)3()4()34(D =+=+=+=-DY DX Y D X D Y X4. ),(~2nN X σμ),N(~X 2σμ正态总体,b]U[a,~X 均匀总体),N(~X 2σμ正态总体,n X D X E 2)(,)(σμ==b]U[a,~X 均匀总体,n a b X D b a X E 12)()(,2)(2-=+=5总体均值()E X 的无偏估计量(系数相加等于1);P178:12(1)2121X 21X + ;5432151515151X 51X X X X ++++ 6加法公式结合独立性)()()()()(B P A P B P A P B A P -+=⋃减法公式结合独立性)()()()()()(B P A P A P AB P A P B A P -=-=-7.已知随机变量X 的分布律为记X 的分布函数为,则3F = 1 .8.平均值就是数学期望,P59:24; P117:11 9.置信区间10.假设检验中,犯第一类错误的概率就是显著性水平α犯第一类错误的概率,显著性水平α为 0.03,则在原假设 H 0成立的条件下,拒绝H 0的概率为___0.03________接受H 0的概率为______0.97_________ 11.A 和B 互斥(互不相容),A 和B 对立事件,P9,性质v12.概率等于0的事件,不一定是不可能的事件13.离散型随机变量,联合分布能唯一确定边缘分布,反之不成立14随机变量P143:(3.8),),1(~t 2n F15.显著性水平α是犯第I 类错误(弃真错误的概率)计算题: 16. 已知概率密度函数,利用概率密度函数求待定系数,分布函数,计算概率概率密度函数为⎩⎨⎧<≥=-0)(3x x Ae x f x 求{}01P X <<17.联合分布求边缘分布,判断独立性,判断是否相关,P7518.已知概率密度求方差(用方差的性质先化简),概率密度用P58:21(2),计算)13(XD19已知离散型随机变量的分布律求参数的最大似然估计值;P176:4(1),答案P6620全概率公式,贝叶斯公式的应用3. 已知一批产品中有95%是合格品,检查产品质量时,一个合格品被误判为次品的概率为0.02,一个次品被误判为合格品的概率是0.03.求(1)任意抽查一个产品,它被判为合格品的概率(2)一个经检查被判为合格的产品确实是合格品的概率.2、设A 表示合格品,A 表示次品,B 表示被检合格,则()0.95,()0.05,()1()0.98,()0.03P A P A P B A P B A P B A ===-== (1) 由全概率公式,得()=()()()()=0.950.98+0.050.03=0.9325P B P A P B A P A P B A +⨯⨯(2)由贝叶斯公式,得()()()()()()()P A P B A P A B P A P B A P A P B A =+=0.950.980.99840.950.980.050.03⨯=⨯+⨯3、某公司有甲、乙、丙三位秘书,让他们把公司文件的45%,40%,15% 进行归档,根据以往的经验,他们工作中出现错误的概率分别为0.01,0.02,0.05.现发现有一份文件归错档,试问该错误最有可能是谁犯的?解:设事件i A 表示“文件由第i 位秘书归档”()1,2,3i =,B 表示“文件归错档”. 依题意,()10.45P A =, ()20.4P A =, ()30.15P A =,()10.01P B A =, ()20.02P B A =,()30.05P B A =由全概率公式可知()()()()()()()112233P B P B A P A P B A P A P B A P A =++0.010.450.020.40.050.15=⨯+⨯+⨯0.02=()()()()1110.010.450.2250.02P B A P A P A B P B ⨯===()()()()2220.020.40.40.02P B A P A P A B P B ⨯===()()()()3330.050.150.3750.02P B A P A P A B P B ⨯===由此可见,这份文件由乙归错档的可能性最大.21. 正态分布计算概率;P59:28 答案P27。
高考数学《概率统计》复习知识结构1.注意:互斥事件不一定是对立事件,但对立事件一定是互斥事件。
2.(1)试验的所有可能结果为有限个,每次试验只出现其中的一个结果;(2)每一个试验结果出现的可能性相等。
(3)古典概型的概率公式:P(A)=事件A包含的可能结果数试验的所有可能结果数=mn.3.几何概型:如果每个事件发生的概率只与构成该事件区域的长度(或面积或体积)成比例,则称这样的概率模型为几何概型。
几何概型的概率公式:设某一事件(也是S中的某一区域),S包含A,它的量度大小(长度、面积或体积)为()Aμ,考虑到均匀分布性,事件A发生的概率() ()()A P ASμμ=.4.统计学中的几个基本概念:(1)样本平均数:样本中所有个体的平均数叫做样本平均数。
(2)平均数计算公式:一般地,如果有n 个数n x x x ,,,21⋅⋅⋅,则n21n x x x x +⋅⋅⋅++=. (3)加权平均数:如果n 个数中,出现次,出现次,…,出现次(这里n f f f k =+⋅⋅⋅++21),那么,根据平均数的定义,这n 个数的平均数可以表示为n2211n n f x f x f x x +⋅⋅⋅++=,这样求得的平均数叫做加权平均数,其中k f f f ,,,21⋅⋅⋅叫做权。
(4)众数:在一组数据中,出现次数最多的数据叫做这组数据的众数。
(5)中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数。
(6)方差:在一组数据n x x x ,,,21⋅⋅⋅中,各数据与它们的平均数的差的平方的平均数,叫做这组数据的方差,通常用“s 2”表示。
方差是用来衡量一组数据波动大小的量,方差越大,表明这组数据偏离平均数越大,即波动越大,数据越不稳定;反之,方差越小,表明这组数据分布比较集中,各数据偏离平均数越小,即波动越小,数据越稳定。
(7)方差计算公式:])()()[(1222212x x x x x x ns n -+⋅⋅⋅+-+-=. 简化计算公式,有:])[(122222212x n x x x ns n -+⋅⋅⋅++= 也可写成22222212])[(1x x x x n s n -+⋅⋅⋅++=. 此公式的记忆方法是:方差等于原数据平方的平均数减去平均数的平方。
专题十:《概率与统计初步》I、考纲1.统计与统计案例(1)随机抽样① 理解随机抽样的必要性和重要性。
② 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。
(2)总体估计① 了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,了解它们各自的特点。
② 理解样本数据标准差的意义和作用,会计算数据标准差。
③ 能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释。
④ 会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想。
⑤ 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。
(3)变量的相关性① 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。
② 了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(不要求记忆线性回归方程系数公式)。
(4)统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题。
①独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用。
②假设检验了解假设检验的基本思想、方法及其简单应用。
③回归分析了解回归的基本思想、方法及其简单应用。
2.概率(1)事件与概率① 了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别。
② 了解两个互斥事件的概率加法公式。
(2)古典概型① 理解古典概型及其概率计算公式。
② 会用列举法计算一些随机事件所含的基本事件数及事件发生的概率。
(3)随机数与几何概型①了解随机数的意义,能运用模拟方法估计概率。
②了解几何概型的意义。
II、高考考情解读本章知识的高考命题热点有以下两个方面:1.概率统计是历年高考的热点内容之一,考查方式多样,选择题、填空题、解答题中都可能出现,数量各1道,难度中等,主要考查古典概型、几何概型、分层抽样、频率分布直方图、茎叶图的求解.2.预计在2014年高考中,概率统计部分的试题仍会以实际问题为背景,概率与统计相结合命题.II 、基础知识和题型 一、随机抽样1、简单随机抽样:(1).简单随机抽样的概念:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2).最常用的简单随机抽样方法有两种——抽签法和随机数法. 2、系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本: (1)先将总体的N 个个体编号;(2)确定分段间隔k ,对编号进行分段,当N n 是整数时,取k =Nn;(3)在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)按照一定的规则抽取样本. 通常是将l 加上间隔k 得到第2个个体编号l +k , 再加k 得到第3个个体编号l +2k ,依次进行下去,直到获取整个样本. 【提醒】系统抽样的最大特点是“等距”,利用此特点可以很方便地判断一种抽样方法是否是系统抽样. 3、分层抽样(1).分层抽样的概念:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是分层抽样.(2).当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法. (3).分层抽样时,每个个体被抽到的机会是均等的. 4(一)简单随机抽样 1. (2012·宁波月考)在简单随机抽样中,某一个个体被抽到的可能性( )A .与第几次抽样有关,第一次抽到的可能性最大B .与第几次抽样有关,第一次抽到的可能性最小C .与第几次抽样无关,每一次抽到的可能性相等D .与第几次抽样无关,与样本容量无关 2. 下面的抽样方法是简单随机抽样的是( )A .在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式确定号码的后四位为2 709的为三等奖B .某车间包装一种产品,在自动包装的传送带上,每隔30分钟抽一包产品,称其重量是否合格C .某学校分别从行政人员、教师、后勤人员中抽取2人、14人、4人了解学校机构改革的意见D .用抽签法从10件产品中选取3件进行质量检验 3.(2013年高考江西卷(文5))(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()A.08【总结】采用随机数法时,若重复出现或超出范围的要去掉。
(二)系统抽样1.(教材习题改编)在某班的51名学生中,依次抽取学号为5、10、15、20、25、30、35、40、45、50的10名学生进行作业检查,这种抽样方法是()A.随机抽样 B.分层抽样C.系统抽样D.以上都不是2.为规范学校办学,省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是()A.13 B.19 C.20 D.513.【变式】(2012·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A.7B.9 C.10 D.15(三)分层抽样1.(2012·福建高考)一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.【变式】(2013年高考湖南)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=___()A.9 B.10 C.12 D.13【总结】1、分层抽样就是“按比例抽样”,确定出每一层的个体占总体的比例,也就确定了样本中该层所占的比例.即:抽样比=样本容量总体容量=各层样本数量各层个体数量利用这两个比例相等,可以列出方程求解总体容量、样本容量或各层的个体数2.某工厂生产A、B、C三种不同型号的产品,产品数量之比为3∶4∶7,现在用分层抽样的方法抽出容量为n的样本,样本中A型号产品有15件,那么样本容量n为()A.50 B.60 C.70 D.80【作业】1.要完成下列两项调查:①从某肉联厂的火腿肠生产线上抽取1 000根火腿肠进行“瘦肉精”检测;②从某中学的15名艺术特长生中选出3人调查学习负担情况.适合采用的抽样方法依次为()A.①用分层抽样,②用简单随机抽样B.①用系统抽样,②用简单随机抽样C.①②都用系统抽样D.①②都用简单随机抽样2.某单位200名职工的年龄分布情况如图所示,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.3..(2012·西安模拟)某初级中学领导采用系统抽样方法,从该校某年级全体800名学生中抽50名学生做牙齿健康检查,现将800名学生从1到800进行编号,求得间隔数为16.在1~16中随机抽取一个数,如果抽到的是7,则从49~64这16个数中应取的是( )(A)54 (B)55 (C)56 (D)574.(2010年高考四川卷文科4)一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是( )(A)12,24,15,9 (B)9,12,12,7 (C)8,15,12,5 (D)8,16,10,65.某学校三个社团的人员分布如下表(每名同学只参加一个社团):学校要对这三个社团的活动效果进行抽样调查,按分层抽样的方法从社团成员中抽取30人,结果合唱社被抽出12人,则这三个社团人数共有_______________.二、用样本估计总体1、作频率分布直方图的步骤(1).求极差(即一组数据中最大值与最小值的差). (2).确定组距与组数. (3).将数据分组. (4).列频率分布表. (5).画频率分布直方图.2、频率分布折线图和总体密度曲线(1).频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图. (2).总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线. 3、样本的数字特征(1)众数、中位数、平均数(2) 方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差:s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4、茎叶图茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示. (一)用样本的频率分布估计总体分布1.(2013四川,文7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( ).2.学校为了调查学生在课外读物方面的支出情况,抽出了一个容量为n且支出在[20,60)元的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为________.4. (2012·广东高考改编)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3) 求样本数据的众数、中位数(二)茎叶图的应用与样本的数字特征1. (2012·淮北模考)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________.07899910122 3①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.2.(2013年高考山东卷(文10))将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x表示:则7个剩余分数的方差为()A.1169B.367C.36 D67【变式】(2013·江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892【注意】:由样本数据估计总体时,样本方差越小,数据越稳定,波动越小【作业】1 .(2013年高考陕西卷(文5))对一批产品的长度(单位: mm)进行抽样检测, 下图是检测结果的频率分布直方图. 根据标准, 产品长度在区间[20,25)上的为一等品, 在区间[15,20)和区间[25,30)上的为二等品, 在区间[10,15)和[30,35)上的为三等品. 用频率估计概率, 现从该批产品中随机抽取一件, 则其为二等品的概率为()A.0.09 B.0.20 C.0.25 D.0.45【变式】(2013·湖北)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x的值为__________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.2.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()A.46,45,56B.46,45,53C.47,45,56D.45,47,533.(2013年上海6)某学校高一年级男生人数占该年级学生人数的40%.在一次考试中,男、女生平均分数分别为75、80,则这次考试该年级学生平均分数为________.4.某样本数据的茎叶图如图所示,若该组数据的中位数为85,平均数为85.5,则x +y = ( )789⎪⎪⎪⎪3 94 4 4 x 7 83 yA .12B .13C .14D .155. (2012·湖南高考)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.三、变量间的相互关系、统计案例1、变量间的相关关系(1).常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系;与函数关系不同,相关关系是一种非确定性关系.(2).从散点图上看,点分布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关,点分布在左上角到右下角的区域内,两个变量的相关关系为负相关. 2、两个变量的线性相关(1).从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有线性相关关系,这条直线叫回归直线.(2).回归方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .(3).通过求Q =∑i =1n(y i -bx i -a )2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法.(4).相关系数=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x)2∑i =1n(y i -y )2,当r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. 3、独立性检验(1).2×2列联表:假设有两个分类变量X 和Y ,它们的值域分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(称2×2列联表) y 1 y 2 合计 x 1 a b a +bx 2 c d c +d 总计a +cb +d a +b +c +dK 2=n (ad -bc )2(a +b )(a +c )(b +d )(c +d )(其中n =a +b +c +d 为样本容量).(2).用K 2的大小可以决定是否拒绝原来的统计假设H 0,若K 2值较大,就拒绝H 0,即拒绝事件A 与B 无关.(3).当K 2>3.841时,则有95%的把握说事件A 与B 有关; 当K 2>6.635时,则有99%的把握说事件A 与B 有关; 当K 2>2.706时,则有90%的把握说事件A 与B 有关. (一)相关关系的判断1.(教材习题改编)观察下列各图形其中两个变量x 、y 具有相关关系的图是( ) A .①② B .①④ C .③④ D .②③ 【小结】: (1).相关关系的判断方法一是利用散点图直观判断,二是利用相关系数作出判断. (2).对于由散点图作出相关性判断时,若散点图呈带状且区域较窄,说明两个变量有一定的线性相关性,若呈曲线型也是有相关性. (3).由相关系数r 判断时|r |越趋近于1相关性越强. 【变式1】 (2012·新课标全国卷)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( )A .-1B .0 C.12 D .1【变式2】(2013年高考湖北卷(文))四名同学根据各自的样本数据研究变量,x y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论:① y 与x 负相关且$2.347 6.423y x =-; ② y 与x 负相关且$3.476 5.648y x =-+; ③ y 与x 正相关且$5.4378.493y x =+; ④ y 与x 正相关且$ 4.326 4.578y x =--. 其中一定不正确...的结论的序号是 A .①②B .②③C .③④D . ①④(二)回归方程的求法及回归分析1. 已知x 与y 之间的一组数据:已求得关于y 与x 的线性回归方程y ^=2.1x +0.85,则m 的值为( )A .1B .0.85C .0.7D .0.52.(2013·重庆)从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y =bx +a ; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.3.(2013年高考福建卷(文11))已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程为a x b yˆˆˆ+=.若某同学根据上表中前两组数据)0,1(和)2,2(求得的直线方程为a x b y '+'=,则以下结论正确的是( )A .a a b b'>'>ˆ,ˆ B .a a b b '<'>ˆ,ˆ C .a a b b '>'<ˆ,ˆ D .a a b b '<'<ˆ,ˆ4.(2012·湖南高考)设某大学的女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的回归方程为y ^=0.85x -85.71,则下列结论中不.正确的是( )A .y 与x 具有正的线性相关关系B .回归直线过样本点的中心(x ,y )C .若该大学某女生身高增加1 cm ,则其体重约增加0.85 kgD .若该大学某女生身高为170 cm ,则可断定其体重必为58.79 kg(三)独立性检验 1.(2011年高考湖南卷文科5)通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联由2222()110(40302030)7.8()()()()60506050n ad bc K K a b c d a c b d -⨯⨯-⨯==≈++++⨯⨯⨯算得, 附表:参照附表,得到的正确结论是( )A . 有99%以上的把握认为“爱好该项运动与性别有关”B . 有99%以上的把握认为“爱好该项运动与性别无关”C . 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D . 在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”2.某市第一次联考后,某校对甲、乙两个文科班的数学考试成绩进行分析,规定:大于或等于120分为优秀,120分以下为非优秀.统计成绩后,得到如下的2×2列联表,且已知在甲、乙两个文科班全部110人中随机抽取1人为优秀的概率为3.(1)请完成上面的列联表;(2)根据列表中的数据,若按99.9%的可靠性要求,能否认为“成绩与班级有关系”.参考公式与临界值表:K 2=n (ad -bc )2【作业】1. (教材习题改编)已知变量x ,y 之间具有线性相关关系,其回归方程为y ^=-3+bx , 若∑i =110x i =17,∑i =110y i =4,则b 的值为( )(1)请画出上表数据的散点图.(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程=bx+a.(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤? (参考数值:3×2.5+4×3+5×4+6×4.5=66.5)3. (2012·辽宁)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:P(K2≥k)0.050.01k 3.841 6.635四、随机事件的概率1、事件(1).在条件S下,一定会发生的事件,叫做相对于条件S的必然事件.(2).在条件S下,一定不会发生的事件,叫做相对于条件S的不可能事件.(3).在条件S下,可能发生也可能不发生的事件,叫做相对于条件S的随机事件.2、概率和频率(1).用概率度量随机事件发生的可能性大小能为我们决策提供关键性依据.(2).在相同条件S 下重复n 次试验,观察某一事件A 是否出现,称n 次试验中事件A 出现的次数n A 为事件A 出现的频数,称事件A 出现的比例f n (A )=n An为事件A 出现的频率.(3).对于给定的随机事件A ,由于事件A 发生的频率f n (A )随着试验次数的增加稳定于概率P (A ),因此可以用频率f n (A )来估计概率P (A ). 34(1).概率的取值范围:0≤P (A )≤1. (2).必然事件的概率P (E )=1. (3).不可能事件的概率P (F )=0.(4).概率的加法公式:如果事件A 与事件B 互斥,则P (A ∪B )=P (A )+P (B ). (5).对立事件的概率:若事件A 与事件B 互为对立事件,则A ∪B 为必然事件.P (A ∪B )=1,P (A )=1-P (B ). (一)随机事件的频率与概率1(1)求次品出现的频率.(2)记“任取一件衬衣是次品”为事件A ,求P (A ).(3)为了保证买到次品的顾客能够及时更换,销售1 000件衬衣,至少需进货多少件?2.(2013四川)某算法的程序框图如图所示,其中输入的变量x 在24,,3,2,1Λ这24个整数中等可能随机产生.(Ⅰ)分别..求出按程序框图正确编程运行时输出y 的值为i 的概率(1,2,3)i P i =;(Ⅱ)甲、乙两同学依据自己对程序框图的理解,各自编写程序重复运行n 次后,统计记录了输出y 的值为(1,2,3)i i =的频数.以下是甲、乙所作频数统计表的部分数据.当2100n =时,根据表中的数据,分别写出甲、乙所编程序各自输出y 的值为(1,2,3)i i =的频率(用分数表示),并判断两位同学中哪一位所编写程序符合算法要求的可能性较大.(二)互斥事件与对立事件的概率 1.(2012·兰州月考)从装有5个红球和3个白球的口袋内任取3个球,那么互斥而不对立的事件是( )A .至少有一个红球与都是红球B .至少有一个红球与都是白球C .至少有一个红球与至少有一个白球D .恰有一个红球与恰有二个红球【总结】:要判断两事件是互斥而不对立的事件:只需判断交事件为不可能事件,和事件为必然事件。