广西2020版高考数学一轮复习单元质检十算法初步、统计与统计案例文
- 格式:docx
- 大小:185.85 KB
- 文档页数:9
第十章统计与统计案例第一节随机抽样一、基础知识1.简单随机抽样(1)定义:一般地,设一个总体含有 N 个个体,从中逐个不放回地抽取 n 个个体作为样本 (n≤ N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)常用方法:抽签法和随机数法.2.分层抽样 (1)在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.3.系统抽样 (1)定义:当总体中的个体数较多时,可以将总体分成均衡的几部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样的方法叫做系统抽样.(2)系统抽样的步骤假设要从容量为 N 的总体中抽取容量为 n的样本.①先将总体的 N 个个体编号;②确定分段间隔 k,对编号进行分段.当N(n 是样本容量 )是整数时,取 k=N; nn当总体中的个体数不能被样本容量整除时,可先用简单随机抽样的方法从总体中剔除几个个体,使剩下的个体数能被样本容量整除,然后再按系统抽样进行.这时在整个抽样过程中每个个体被抽取的可能性仍然相等.③在第 1 段用简单随机抽样确定第一个个体编号l(l≤k);④按照一定的规则抽取样本.通常是将 l 加上间隔 k 得到第 2 个个体编号 l + k,再加 k 得到第 3 个个体编号 l + 2k,依次进行下去,直到获取整个样本.、常用结论(1)不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.(2)系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k 的整数倍.(3)分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.(4)三种抽样方法的特点、联系及适用范围考点一简单随机抽样[典例 ] 下列抽取样本的方式属于简单随机抽样的个数有 ( )①从无限多个个体中抽取 100 个个体作为样本;②盒子里共有 80个零件,从中选出 5 个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里;③用抽签方法从 10件产品中选取 3 件进行质量检验;④某班有 56 名同学,指定个子最高的 5 名同学参加学校组织的篮球赛.A.0 个B.1个C.2个D.3 个[解析 ] ①不是简单随机抽样,因为被抽取样本的总体的个数是无限的,而不是有限的;②不是简单随机抽样,因为它是有放回抽样;③明显为简单随机抽样;④不是简单随机抽样,因为不是等可能抽样.[答案 ] B[ 解题技法 ] 应用简单随机抽样应注意的问题 (1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.[ 题组训练 ]1.总体由编号为 01,02,⋯, 19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是 从随机数表第 1 行的第 5 列和第 6 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为 ()7816 6572 0802 6314 0702 4369 9728 0198 3204 9234 4935 8200 3623 4869 6938 7481B .07C .02考点二 系统抽样[典例] (1)某校为了解 1 000 名高一新生的身体生长状况,用系统抽样法 (按等距的规则 )抽取 40名同学进行检查, 将学生从 1~1 000进行编号, 现已知第 18组抽取的号码为 443,则第一组用简单随机抽样抽取的 号码为 ( )A .16B . 17C .18D .19(2) 中央电视台为了解观众对某综艺节目的意见,准备从 502 名现场观众中抽取 10%进行座谈,现用系统 抽样的方法完成这一抽样,则在进行分组时,需剔除 __________________ 个个体,抽样间隔为 ___________________________________________ .[解析 ] (1)因为从 1 000 名学生中抽取一个容量为 40的样本,所以系统抽样的分段间隔为 140000=25,设第一组随机抽取的号码为 x ,则抽取的第 18 组编号为 x +17×25=443,所以 x = 18.(2)把 502 名观众平均分成 50组,由于 502除以 50的商是 10,余数是 2,所以每组有 10 名A.08 D .01解析: 选 D 由随机数法的随机抽样的过程可知选出的 5个个体是 08,02,14,07,01,所以第 5 个个体的编 号是 01.2.利用简单随机抽样,从 n 个个体中抽取一个容量为 10 的样本.若第二次抽取时,余下的每个个体被 抽到的概率为 13,则在整个抽样过程中,每个个体被抽到的概率为()1 A.4 1 B.13 5 C.14 10 D.27解析:选C 根据题意, n -91=31,解得 n = 28.故在整个抽样过程中每个个体被抽到的概率为10= 5. 28=14.观众,还剩 2 名观众,采用系统抽样的方法抽样时,应先用简单随机抽样的方法从 502 名观众中抽取 2名观众,这 2 名观众不参加座谈;再将剩下的 500名观众编号为 1,2,3,⋯,500,并均匀分成 50段,每段含500=10个个体.所50 以需剔除 2 个个体,抽样间隔为 10.[答案 ] (1)C (2)2 10[ 变透练清 ]1. 变结论若本例 (1) 的条件不变,则编号落入区间 [501,750] 的人数为.解析:从 1 000名学生中抽取一个容量为 40的样本,系统抽样分 40组,每组140000=25 个号码,每组抽取一个,从 501 到 750 恰好是第 21 组到第 30 组,共抽取 10 人.答案: 102.(2018 ·南昌摸底调研 )某校高三 (2)班现有 64 名学生,随机编号为 0,1,2,⋯, 63,依编号顺序平均分成 8 组,组号依次为 1,2,3 ,⋯, 8.现用系统抽样方法抽取一个容量为 8 的样本,若在第 1 组中随机抽取的号码为 5,则在第 6 组中抽取的号码为.解析:由题知分组间隔为64=8,又第 1 组中抽取的号码为 5,所以第 6组中抽取的号码为5× 8+ 5= 45. 8答案: 45[ 解题技法 ] 系统抽样中所抽取编号的特点系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第 1 组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.[提醒 ] 系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.考点三分层抽样[典例] 某电视台在网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有 20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取 100 人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为 ( )A .25,25,25,25B . 48,72,64,16C.20,40,30,10 D .24,36,32,8100 1 1[解析 ] 法一:因为抽样比为201 00000=2010,所以每类人中应抽取的人数分别为 4 800× 2100=24,750A .不全相等B .均不相等C .都相等,且为2 019D .都相等,且为140[答案 ] D[ 解题技法 ] 分层抽样问题的类型及解题思路 (1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算.(3)分层抽样的计算应根据抽样比构造方程求解,其中“抽样比= 样本容量=各层样本数量”总体容量 =各层个体数量 ”[ 题组训练 ]1. (2019 ·山西五校联考 )某校为了解学生的学习情况,采用分层抽样的方法从高一 人、高三 n 人中抽取 81 人进行问卷调查,若高二被抽取的人数为30,则 n = ( )A .860B . 720C .1 020答案: 85[课时跟踪检测 ]1.从 2 019 名学生中选取 50名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从 2200×1 200 36, 6 400 × 1 200 32,1 600× 12008. 法二: 最喜爱、喜爱、一般、不喜欢的比例为 4 800∶7 200∶6 400∶1 600=6∶9∶8∶2, 所以每类人中应抽取的人数分别为 ×100= 6+9+ 8+224, 9 6+9+8+× 100= 36, 8 6+9+8+×100=32,26+9+8+×100=8.1 000 人、高二 1 200 D .1 040解析: 选 D 由已知条件知抽样比为 30 1 410,从而 81 1 000+1 20041,解得 n =1 040 ,故选D.2.(2018 广·州高中综合测试 )已知某地区中小学学生人数如图所示.为 参加某项社会实践活动的意向, 拟采用分层抽样的方法来进行调查. 若高 名学生,则小学与初中共需抽取的学生人数为 ____________________________________________ .20x +20 解得 x =85. 019 名学生中剔除 19 名学生,剩下的 2 000 名学生再按系统抽样的方法抽取,则每名学生入选的概率 () 了解该区学生 中 需 抽 取20 错误 ! =解析:选 C 从 N个个体中抽取 M 个个体,则每个个体被抽到的概率都等于M N,故每名学生入选的概率都相等,且为50.22.福利彩票“双色球”中红球的号码可以从01,02,03,⋯, 32,33 这 33 个两位号码中选取,小明利用如下所示的随机数表选取红色球的 6 个号码,选取方法是从第 1行第 9 列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为 ( )A.12 B . 33C.06 D .16解析:选 C 被选中的红色球的号码依次为 17,12,33,06,32,22,所以第四个被选中的红色球的号码为06.3.某班共有学生 52人,现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知 5 号、 18号、44 号同学在样本中,那么样本中还有一个同学的座号是 ( )A .23B . 27C.31 D .3352解析:选 C 分段间隔为542= 13,故样本中还有一个同学的座号为 18+13= 31.4.某工厂在 12 月份共生产了 3 600 双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a,b, c,且 a,b,c 构成等差数列,则第二车间生产的产品数为 ( )A.800 双B.1 000 双C.1 200双D.1 500 双解析:选 C 因为 a,b,c 成等差数列,所以 2b=a+c,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占 12 月份生产总数的三分之一,即为 1 200 双皮靴.5.(2018 南·宁摸底联考 )已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取 2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为 ( )A .100,20B . 200,20C.200,10 D .100,10解析:选 B 由题图甲可知学生总人数是 10 000,样本容量为 10 000×2%=200,抽取的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取高中生的近视人数为40× 50%=20,故选 B.6.一个总体中有 100 个个体,随机编号为 0,1,2,⋯, 99.依编号顺序平均分成 10 个小组,组号依次为 1,2,3,⋯, 10.现用系统抽样方法抽取一个容量为10 的样本,如果在第一组随机抽取的号码为m,那么在第 k组中抽取的号码个位数字与 m+k 的个位数字相同.若 m= 6,则在第 7 组中抽取的号码是()A .63B . 64C.65 D .66解析:选 A 若 m=6,则在第 7 组中抽取的号码个位数字与 13的个位数字相同,而第 7 组中的编号依次为 60,61,62,63,⋯,69,故在第 7 组中抽取的号码是 63.7.采用系统抽样方法从 960 人中抽取 32 人做问卷调查,为此将他们随机编号为 1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的 32人中,编号落入区间 [1,450] 的人做问卷 A,编号落入区间(450,750]的人做问卷 B,其余的人做问卷 C.则抽到的人中,做问卷 B 的人数为()A .7 B.9C.10 D .15解析:选 C 960÷32=30,故由题意可得抽到的号码构成以9 为首项,以 30 为公差的等差数列,其通项公式为 a n=9+30(n-1)=30n-21.由 450<30n-21≤750,解得 15.7<n≤25.7.又 n为正整数,所以 16≤n≤25,故做问卷 B 的人数为 25- 16+ 1= 10.故选 C.8.某企业三月中旬生产 A,B,C 三种产品共 3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:由于不小心,表格中 A, C产品的有关数据已被污染看不清楚,统计员记得 A 产品的样本容量比C产品的样本容量多 10,根据以上信息,可得 C 的产品数量是件.x 解析:设样本容量为 x,则 3 000×1 300=130,∴x=300.∴A 产品和 C 产品在样本中共有 300-130=170(件).设 C产品的样本容量为 y,则 y+ y+10= 170,∴ y=80.∴C 产品的数量为3300000×80=800(件).答案:8009.某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生产的该产品中共抽取 100 件做使用寿命的测试,则第一分厂应抽取的件数为_ ;由所得样品的测试结果计算出一、二、三分厂取出的产品的使用寿命平均值分别为 1 020 小时、 980 小时、 1 030 小时,估计这个企业所生产的该产品的平均使用寿命为小时.解析:第一分厂应抽取的件数为100×50%=50;该产品的平均使用寿命为 1 020×0.5+ 980×0.2+1030×0.3=1 015.答案: 50 1 01510.将参加冬季越野跑的 600 名选手编号为: 001,002,⋯, 600,采用系统抽样方法抽取一个容量为50 的样本,把编号分为 50 组后,在第一组的 001 到 012这 12 个编号中随机抽得的号码为 004,这600 名选手穿着三种颜色的衣服,从 001 到 301 穿红色衣服,从 302 到 496 穿白色衣服,从 497 到 600 穿黄色衣服,则抽到穿白色衣服的选手人数为.解由题意及系统抽样的定义可知,将这 600 名学生按编号依次分成 50 组,每一组各有 12 第 k(k∈N *)组抽中的号码是 4+12(k-1).令 302≤4+12(k-1)≤496,得 2556≤k≤42,因此抽到穿白色衣服的选手人数为 42- 25=17(人).答案:1711.某初级中学共有学生 2 000 名,各年级男、女生人数如下表:已知在全校学生中随机抽取 1 名,抽到初二年级女生的概率是 0.19.(1)求 x 的值;(2)现用分层抽样的方法在全校抽取 48 名学生,问应在初三年级抽取多少名?x解: (1)∵=0.19,∴ x= 380.2 000(2)初三年级人数为 y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在48 名学全校抽取生,应在初三年级抽取的人数为240800×500=12(名 ).第二节 用样本估计总体、基础知识1.频率分布直方图频率 频率(1)纵轴表示 组距,即小长方形的高= 组距;频率(2)小长方形的面积=组距× 组距 =频率;(3)各个小方形的面积总和等于 1 .2.频率分布表的画法(3)方差 s 2=n [( x 1- x )2+ (x 2- x )2+⋯+ (x n - x )2].第一步:求极差,决定组数和组距,组距=极差; 组数;第二步:分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.3.茎叶图茎叶图是统计中用来表示数据的一种图, 茎是指中间的一列数,叶就是从茎的旁 边生长出来的数.4.中位数、众数、平均数的定义(1) 中位数将一组数据按大小依次排列, 处于最中间位置的一个数据 (或最中间两个数据的平均数 位数.)叫做这组数据的中 (2) 众数 一组数据中出现次数最多的数据叫做这组数据的众数.(3)平均数一组数据的算术平均数即为这组数据的平均数, n 个数据 x 1,x 2,⋯,x n 的平均数 x 1 = n (x 1+ x 2+⋯+5. 样本的数字特征如果有 n 个数据 x 1,x 2,⋯, x n ,那么这 n个数的 1 (1) 平均数 x = n (x 1+ x 2+⋯(2) 标准差s =、常用结论1.频率分布直方图中的常见结论(1)众数的估计值为最高矩形的中点对应的横坐标.(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.2.平均数、方差的公式推广(1)若数据 x1,x2,⋯,x n的平均数为 x,则 mx1+a,mx2+a,mx3+a,⋯,mx n+a 的平均数是 mx + a.(2)若数据 x1,x2,⋯, x n的方差为 s2,则数据 ax1+b,ax2+b,⋯, ax n+b 的方差为 a2s2.考点一茎叶图[典例 ] (2017 山·东高考 )如图所示的茎叶图记录了甲、乙两组各产量数据 (单位:件 ).若这两组数据的中位数相等,且平均值也相等,5名工人某日的则 x 和 y 的值分别为 ( )A .3,5B . 5,5C.3,7 D .5,7[解析 ] 由两组数据的中位数相等可得 65= 60+ y,解得 y= 5,又它们的平均值相等,所以1×[56+62+65+74+(70+x)]=1×(59+61+67+ 65+78),解得 x=3.55[答案 ] A[ 解题技法 ] 茎叶图的应用(1)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.(2)给定两组数据的茎叶图,比较数字特征时,“重心”下移者平均数较大,数据集中者方差较小.[ 题组训练 ]1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,数据的极差与中位数之和为 61,则被污染的数字为 ( )A.1 B.2C.3 D.4解析:选 B 由图可知该组数据的极差为48- 20=28,则该组数据的中位数为 61-28=33,易得被污染的数字为 2.2.甲、乙两名篮球运动员 5 场比赛得分的原始记录如茎叶图所示,若甲、乙两人的平均得分分别为x 甲,x 乙,则下列结论正确的是 ( )A. x 甲< x 乙;乙比甲得分稳定B. x甲> x 乙;甲比乙得分稳定C. x甲 > x 乙;乙比甲得分稳定D. x 甲< x 乙;甲比乙得分稳定2+7+8+ 16+22 8+12+18+21+ 25解析:选 A 因为 x 甲== 11, x 乙== 16.8,所以 x 甲< x 乙且乙比55甲成绩稳定.考点二频率分布直方图[典例]某城市 100 户居民的月平均用电量 (单位:千瓦时 ),以[160,180) ,[180,200) ,[200,220) ,[220,240) ,[240,260) ,[260,280) ,[280,300]分组的频率分布直方图如图.(1) 求直方图中 x 的值;(2)求月平均用电量的众数和中位数.[解] (1)由(0.002 + 0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,解得 x=0.0075. 即直方图中 x 的值为 0.007 5.220+ 240(2)月平均用电量的众数是= 230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,∴月平均用电量的中位数在 [220,240) 内.设中位数为 a,则 0.45+0.012 5×(a-220)=0.5,解得 a= 224,即中位数为 224.[ 变透练清 ]1.某校随机抽取 20 个班,调查各班有出国意向的人数,所得数据的茎叶图如图所示.以 5 为组距将数据分组为 [0,5),[5,10),⋯,[30,35) , [35,40] ,所作的频率分布直方图是 ( )解析:选 A 以 5 为组距将数据分组为 [0,5) ,[5,10) ,⋯,[30,35) ,[35,40] ,各组的频数依次为 1,1,4,2,4,3,3,2,可知画出的频率分布直方图为选项 A 中的图.2. 变结论在本例条件下,在月平均电量为 [220,240) ,[240,260) ,[260,280) ,[280,300] 的四组用户中,用分层抽样的方法抽取 11 户居民,则月平均用电量在 [220,240) 的用户中应抽取 _____________________________________________________________________ 户.解析:月平均用电量在 [220,240) 的用户有 0.012 5 ×20×100 =25(户).同理可得月平均用电量在 [240,260) 的用户有 15 户,月平均用电量在 [260,280] 的用户有 10 户,月平均用电量在[280,300] 的用户有 5 户,故抽取比例为1125+ 15+ 101.5.答案: 53.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年 100位居民每人的月均用水量 (单位:吨 ),将数据按照 [0,0.5),[0.5,1),⋯,[4,4.5]分成 9组,制成了如图所示的频率分布直方图.(1) 求直方图中 a 的值;(2)设该市有 30万居民,估计全市居民中月均用水量不低于 3 吨的人数,说明理由.解: (1)由频率分布直方图可知,月均用水量在 [0,0.5)的频率为 0.08×0.5=0.04.同理,在[0.5,1) ,[1.5,2) ,[2,2.5) ,[3,3.5) , [3.5,4) , [4,4.5] 6 组的频率分别为 0.08,0.21,0.25,0.06,0.04,0.02.由 1- (0.04+ 0.08+0.21+0.25+0.06+ 0.04+ 0.02) = 0.5× a+ 0.5×a,解得 a= 0.30.(2)估计全市居民中月均用水量不低于3 吨的人数为 3.6 万.理由如下:由(1)知, 100位居民中月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30 万居民中月均用水量不低于3 吨的人数为300 000×0.12=36 000=3.6(万).考点三样本的数字特征考法 (一 ) 样本的数字特征与频率分布直方图交汇[典例 ] (2019 辽·宁师范大学附属中学模拟 )某校初三年级有 400 名学生,随机抽查了 40 名学生测试 1 分钟仰卧起坐的成绩 (单位:次 ),将数据整理后绘制成如图所示的频率分布直方图.用样本估计总体,下列结论正确的是 ( )A .该校初三学生1 分钟仰卧起坐的次数的中位数为 25B.该校初三学生1 分钟仰卧起坐的次数的众数为 24C.该校初三学生1 分钟仰卧起坐的次数超过 30 的人数约有 80D.该校初三学生1 分钟仰卧起坐的次数少于 20 的人数约为 8[解析 ] 第一组数据的频率为 0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,∴中位数在第三组内,设中位数为25+x,则 x×0.08=0.5-0.1-0.3=0.1,∴ x =1.25,∴中位数为 26.25 ,故 A 错误;第三组数据所在的矩形最高,第三组数据的中间值为27.5,∴众数为27.5,故 B错误; 1 分钟仰卧起坐的次数超过 30 的频率为 0.2,∴超过 30 次的人数为 400×0.2=80,故 C 正确; 1分钟仰卧起坐的次数少于 20 的频率为 0.1,∴1 分钟仰卧起坐的次数少于 20 的人数为400×0.1= 40,故 D 错误.故选 C.[答案 ] C[ 解题技法 ]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考法 (二) 样本的数字特征与茎叶图交汇[典例 ] 将某选手的 9个得分去掉 1个最高分,去掉 1个最低分, 7 个剩余分数的平均分为91.现场作的 9 个分数的茎叶图后来有 1 个数据模糊,无法辨认,在图中以________________ x表示,则 7 个剩余分数的方差为.[解析 ] 由茎叶图可知去掉的两个数是 87,99,所以 87+90× 2+91× 2+94+90+x=91×7,解得 x=4.1 36故 s2=7[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=7.[答案 ] 376[ 解题技法 ]样本的数字特征与茎叶图综合问题的注意点(1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.考法(三)样本的数字特征与优化决策问题交汇[典例 ] (2018 周·口调研)甲、乙两人在相同条件下各射击 10 次,每次中靶环数情况如图所示.(1)请填写下表(写出计算过程):(2)从下列三个不同的角度对这次测试结果进行分析:①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中 9 环及 9 环以上的次数相结合看(分析谁的成绩好些);③从折线图上两人射击命中环数的走势看(分析谁更有潜力).[解 ] 由题图,知甲射击 10 次中靶环数分别为 9,5,7,8,7,6,8,6,7,7.将它们由小到大排列为 5,6,6,7,7,7,7,8,8,9.乙射击 10 次中靶环数分别为 2,4,6,8,7,7,8,9,9,10.将它们由小到大排列为 2,4,6,7,7,8,8,9,9,10.1(1) x 甲=10× (5+6×2+7×4+ 8×2+9)=7(环),1x 乙=10×(2+4+6+7× 2+8×2+9×2+10)=7(环),s2甲=110×[(5-7)2+(6- 7)2×2+(7- 7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,1s2乙=10×[(2-7)2+(4- 7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+ 9)= 5.4.填表如下:(2)①∵平均数相同, s2甲< s2乙,∴甲成绩比乙稳定.②∵平均数相同,命中 9 环及 9 环以上的次数甲比乙少,∴乙成绩比甲好些.③∵甲成绩在平均数上下波动,而乙处于上升势头,从第三次以后就没有比甲少的情况发生,∴乙更有潜力.[解题技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[题组训练]1.对某商店一个月内每天的顾客人数进行统计,得到样本的茎叶图(如图所示 ),则该样本中的中位数、众数、极差分别是 ( )C .47,45,56极差为 68- 12=56,故选 A.2.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:从这四个人中选择一人参加该运动会射击项目比赛,最佳人选是 ( )A .甲 C .丙解析: 选 C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选 C.3.某仪器厂从新生产的一批零件中随机抽取 40 个进行检测,如图是根据抽样检测得到的零件的质量(单位:克)绘制的频率分布直方图,样本数据按照 [80,82) ,[82,84) ,[84,86) ,[86,88) ,[88,90) ,[90,92) ,[92,94) ,[94,96]分成 8 组,将其按从左到右的顺序分别记为第一组,第二组,⋯⋯,第八组.则样本数据的中位数在 第 组.解析:由题图可得, 前四组的频率为 (0.037 5+ 0.062 5+0.075 0+ 0.100 0)× 2= 0.55,则其频数为 40×0.55 =22,且第四组的频数为 40×0.100 0×2=8,故中位数在第四组.答案: 四D .45,47,53 解析: 选 A 样本共 30 个,中位数为 45+47= 46;显然样本数据出现次数最多的为45,故众数为 45; B .乙 D .丁[课时跟踪检测]A级1.一个频数分布表 (样本容量为则估计样本在 [40,60) 内的数据30)不小心被损坏了一部分,只记得样本中数据在[20,60) 上的频率为 0.8,()A .14B . 15C.16 D .17解析:选 B 由题意,样本中数据在 [20,60) 上的频数为 30×0.8=24,所以估计样本在[40,60)内的数据个数为 24-4- 5=15.2.(2019 ·长春质检 )如图所示是某学校某年级的三个班在一学期内的六次数学测试的平均成绩y 关于测试序号 x 的函数图象,为了容易看出一个班级的成绩变化,将离散的点用虚线连接,根据图象,给出下列结论:①一班成绩始终高于年级平均水平,整体成绩比较好;②二班成绩不够稳定,波动程度较大;③三班成绩虽然多数时间低于年级平均水平,但在稳步提升.其中正确结论的个数为 ( )A.0 B.1C.2 D.3解析:选 D ①由图可知一班每次考试的平均成绩都在年级平均成绩之上,故①正确.②由图可知二班平均成绩的图象高低变化明显,可知成绩不稳定,波动程度较大,故②正确.③由图可知三班平均成绩的图象呈上升趋势,并且图象的大部分都在年级平均成绩图象的下方,故③正确.故选 D.3.(2018 ·贵阳检测)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为 5 组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是 40,则成绩在 80~100 分的学生人数是()A .15 B.18C.20 D.25解析:选 A 根据频率分布直方图,得第二小组的频率是 0.04×10=0.4,∵频数是 40,∴样本容量是400.4 =100,又成绩在 80~ 100 分的频率是(0.01+0.005)×10=0.15,∴成绩在 80~100 分的学生人数是 100×0.15 = 15.故选 A.4.2017 年 4 月,泉州有四处湿地被列入福建省首批重要湿地名录,其中 A,B 两地选择一处进行实地考察.因此,他通过网站了解上周去过的人对它们的综合评分,并将评分数据记录为右图的茎叶图,记A,数据的均值分别为 x A, x B,方差分别为 s A2, s2B.若以备受好评为依据,某B两同学决定从这两个地方地综合评分则下述判断较合理的是(A .因为 x A> x B, s2A>s B2,所以应该去 A地 B.因为 x A> x B, s2A < s2B,所以应该去 A 地 C.因为 x A< x B, s2A > s2B,所以应该去B 地D .因为x A< x B,s2A<s B2,所以应该去 B 地11解析:选 B 因为 x A=×(72+86+87+89+ 92+94)≈86.67, x B=×(74+73+88+86+95+94)=。
本岂目为敕师专用"第十单元 算法初步、统计、统计案例使用建议■ s^rroNGJiwvi1. 编写意图本单元包括两部分内容,一部分是“算法初步”另一部分是“统计、统计案例”. 本单元在编写时注意到以下几点:(1) 突出主干知识.对核心知识和常考知识点进行重点设计,对各种基本题型进行了详细阐述.(2) 统计方法的讲解.编写时把各种统计方法的使用放在了首位 .(3) 把握基本题型.对各种基本题型进行了详细讲解,目的是帮助学生构建知识体系.2. 教学指导在复习过程中,要注意以下几个方面:(1) 对算法初步教学的建议.由于试题主要考查程序框图和基本算法语句,因此复习该部分时要抓住以 下两点:一是程序框图的三种基本逻辑结构,弄清三种基本逻辑结构的功能和使用方法,结合具体题目 掌握一些常见的程序框图题;二是理解基本算法语句,搞清楚条件语句与条件结构的对应关系,循环语 句与循环结构的对应关系等.(2) 对统计教学的建议.由于统计涉及的概念很多,教学中教师应引导学生结合具体题目仔细体会概念 的含义,使学生通过适当练习,学会如何使用概念解题.统计图表是统计中的主要工具,教学中要使学生 掌握从图表中提取有关数据的信息并进行统计推断的方法 .(3) 加强运算能力的培养.统计的数据计算较复杂,要注重培养学生良好的运算习惯,通过统计的复习提 高运算能力. 3. 课时安排本单元包含4讲,1个小题必刷卷,1个解答必刷卷,1个单元测试卷,建议每讲1课时完成,小题必刷卷、 解答必刷卷和单元测试卷各1课时完成,本单元共需7课时.第66讲算法初步考试说明1.了解算法的含义、算法的思想 .2•理解程序框图的三种基本逻辑结构:顺序结构、条件结构、循环结构 •3. 了解几种基本算法语句一一输入语句、输出语句、赋值语句、条件语句、循环语句的含义 【课前双基巩固】 知识聚焦1. (1) 一定规则 明确 有限 ⑵程序2. 程序框文字说明3•依次执行基本结构条件是否成立反复执行 循环体4. (1)输入信息 变量=表达式 ⑵①IF 条件THEN END IF ②IF 条件 THEN ELSE(3)① DO LOOP UNTIL ② WHILE WEND 对点演练1.84 [解析]程序运行过程如下:X =2,S=0,S=22=4,X =2 0=4;S=4+42=2O, x=2 X 4=8;S=2O+82=84>64, 循环结束,输岀S=84.2.3或-3 [解析]该程序是求函数y=|x|的函数值,•••『=,••• X =±3.7 [解析]由程序框图可以看岀,当n=8>6时,循环结束做输岀S=[ 一田一田—田一田_]=7.4.是 否[解析]当X ^60时,应输岀“及格;'当X <60时,应输岀“不及格”.故①处应填“是;'②处应填“否.5.17 [解析]第一次循环得,a=153-119=34;第二次循环得,b=119-34 = 85;第三次循环得,b=85-34=51; 第四次循环得,b=51-34=17;第五次循环得,a=34-17 = 17,此时a=b,输岀a=17. 【课堂考点探究】例1 [思路点拨](1)该程序框图为条件结构,考查分段函数中已知函数值(输岀的值)求自变量(输入值), 在给定的条件下分别列方程求解即可;(2)列举岀循环情况,确定循环终止的条件. ⑴A (2)B [解析]⑴依题意可得y=--输岀的结果为1,即 或解得x=-2或x=3,故选A.⑵若填入的条件为"n<k?",执行该程序,有M= 1+-=-,a=2,b=-,n=2;M=2+- = ,a=-,bd,n=3,终止循环,输 岀M=-,不合题意.若填入的条件为"n<k+1?",则继续循环,M=-+-=—,a=-,b=—,n=4,终止循环,输岀M=—, 符合题意.显然填入n<k+ 2?”及“k+3?”均不符合题意故选B. 变式题(1)B(2)D[解析](1)模拟程序框图的运行过程,如下:a=1,b= 1,S=2,c=1 + 1=2,S=2+2 = 4; c €0, a=1,b=2,c=1 +2=3,S= 4+3=7; c €0, a=2,b=3,c=2 + 3=5,S= 7+5=12; c €0, a=3,b=5,c=3 + 5=8,S= 12+8=20; c€0, a=5,b=8,c=5 + 8=13, S= 20 + 13=33; c €0,a=8,b=13,c=8+13=21,S=33+21 = 54. 此时c>20,终止循环,输岀S=54. 故选B. (2)运行该程序,S=0, n= 1,M= 1,S=1, n=2;M=-2,S=-1, n=3;M=3,S=2 ,n=4;M=-4,S=-2, n=5;M=5,S=3, n=6;M=-6,S=-3, n=7;…;M=-2018, S=-1009, n =2019; M=2019,S=1010, n=2020; M=-2020,S=-1010,此时 n>2019,终止循 环,输岀S=-1010. 故选D.例2 [思路点拨](1)根据输岀的结果是56,终止循环的岀口是“是”,排除选项A,C,再根据该程序框图的 功能是求S n =2+4+6+…+2n 求解.(2)运行该程序,依次写岀每次循环得到的i,S 的值,当S=-lg 11时,满 足条件,退岀循环,输岀i 的值为9,从而得解.(1) D ⑵B 懈析](1)根据输岀的结果是56,终止循环的岀口是“是”,排除选项A,C.该程序框图的功能 是求S n =2+4+6+…+ 2n,由S n =n(n +1)=56,得n=7,所以判断框中的条件可以是“ n>6?".故选D. (2) 该程序运行如下: i=1, S= lg —=-lg 3 >-1; i=3,S=lg-+lg-=lg-=-lg 5 >-1; i=5,S=lg-■lg i =lgi =-lg 7 >-1;i=7,S=lg-+lg-=lg-=-lg 9 >-1; i=9,S=lg_+lg —=lg —=-lg 11 <-1,终止循环,输岀i=9.故选B.变式题(1)C (2)B [解析](1)由程序框图可得输岀的结果为T=cos-+COS—+…+cos—=—+0—1——+0 + —+1 +—= — .⑵该程序框图的功能是求8个观测数据的方差.•••=- >(40+41 +43+43 + 44+46+47+48)=44, .••2=->42+32+12+12+02+22+32+42)=7,故输岀的S 的值为7.故选B.例3 [思路点拨]先判断输入值是否满足条件“ x>9 AND x<100”,然后逐个执行语句,算岀a,b和x的值, 最终输岀x,即为所求.D [解析]若输入x的值是53,满足条件‘x>9 AND x<100 ”则a=53 10 = 5,b=53 MOD 10 =3,x=3X10+5=35,输岀35,程序结束.若输入x的值是125,不满足条件‘x>9 AND x<100 ”,程序结束.故选D.变式题A [解析]输入m=3201, n=1023,第一次循环:r=m MOD n=132, m=n=1023, n=r= 132,此时r老,继续循环;第二次循环:r=m MOD n=99,m=n=132, n=r=99,此时r^0,继续循环;第三次循环:r=m MOD n=33,m=n= 99, n=r=33,此时r老,继续循环;第四次循环:r=m MOD n=0,m=n=33,n=r=0,此时r=0,跳岀循环,输岀m=33. 故选A.备用例题I JIA05HI 0EIYONG LITI _________________________________________________________________________________________________【备选理由】例1是茎叶图与程序框图的结合,是对听课正文例2的补充;例2是与函数有关的程序框图问题;例3是与算法语句有关的问题.例1 [配合例2使用]随机抽取某中学甲、乙两个班各10名同学测量他们的身高,获得身高数据的茎叶图如图①所示,在这20人中,记身高(单位:cm)在[150,160),[160,170),[170,180),[180,190]的人数依次为A1,A2,A3,A4•图②是统计样本中身高在一定范围内的人数的程序框图,若输岀的S的值为18,则判断框内可以填()甲KS LK1勺9 5 D1702 4 T98 7 4 J L63 5 715*①A. i<3?B.i<4?C.i<4?D.i<5?本社目②[解析]B由i的初始值为2,且输岀的S的值为18,可知程序框图的作用是统计身高大于或等于160 cm的人数(恰为18),于是要计算A2+A3+A4的值,因此判断框内可以填“ i<4?”例2 [配合例2使用][2018遂宁模拟]执行如图所示的程序框图,若输入的x=3,则输岀的所有x的值的和为()/«W/输岀耳/T=Jf+lA.243B.363C.729D.1092[解析]D 当x=3时,y是整数; 当x=32时,y是整数;依此类推可知当x=3n(n 6N*)时,y是整数.由x=3n<1000,得n詬,所以输岀的所有x的值为3,9,27,81,243,729,其和为1092,故选D.例3 [配合例3使用][2018成都调研]阅读如图所示的程序,若执行循环体的次数为5,则程序中a的取值范围是()S=0i=1DOS= S+ii=i+1LOOP UNTIL i>aPRINT SENDA.5至詬B.5va<6C.5<a詬D.5<a<6[解析]D执行程序:S=0,i=1,S=1,i=2,2 剝S= 3,i= 3,3 <3;S=6,i=4,4 <3;S=10, i=5,5<a;S=15, i=6,6>a,结束循环,所以5<a<6.故选D.第67讲随机抽样考试说明1.理解随机抽样的必要性和重要性.2.会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.【课前双基巩固】知识聚焦1. (1)不放回抽取(2)相等(3)抽签法随机数法2. (2)差异明显的几个部分3. (1)编号⑵分段间隔k分段⑶简单随机抽样⑷(l+2k)对点演练1.200个零件的长度[解析]200个零件的长度是从总体中抽岀的个体所组成的集合,所以是总体的一个样本.2.系统抽样懈析]根据系统抽样的定义即得.3.20 30 [解析]200 300=20 30,故抽取的50人中,有男同学20人,女同学30人.4.01 [解析]从第1行的第5列和第6列数字开始由左到右依次选岀的编号为08,02,14,19,01,故选岀来的第5个个体编号是01.5.30 [解析]••1203除以40不是整数,•需随机剔除3个个体,从而每一段有30个个体,则分段间隔为30.6.25,56,19 [解析]因为125 280 95=25 56 19,所以根据分层抽样方法的特点知,三个年龄段中抽取的人数分别为25,56,19 .7.①[解析]根据简单随机抽样及分层抽样的定义可得,每个个体被抽到的概率都相等,所以每个个体被抽到的概率都等于——.【课堂考点探究】例1 [思路点拨](1)对四个选项中的说法逐一分析排除;(2)从随机数表第1行的第9列和第10列的数字开始从左到右依次选取两个数字,列举岀选岀来的前4个个体的编号,即可得结果.(1) A ⑵C 懈析](1)这次抽样可能采用的是简单随机抽样的方法,A中说法正确讴次抽样可能采用系统抽样的方法,男生编号为1~20,女生编号为21 ~50,分段间隔为5,依次抽取1号,6号,…,46号,B中说法错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D中说法均错误.故选A.(2) 从随机数表第1行的第9列和第10列的数字开始从左到右依次选取两个数字,选岀来的编号在00~49的前4个个体的编号为33,16,20,38,所以选岀来的第4个个体的编号为38.故选C.变式题175 懈析]从第2行第7列开始向右读取,符合条件的数是785,667,199,507,175,…,所以所求编号为175.例2 [思路点拨]系统抽样即为等距抽样,据此进行判断.D [解析]根据分层抽样的特点可得应从高三年级抽取20人,根据系统抽样的特点可将高三年级学生按编号001〜040,041 ~080,…,761~800分成20组,抽取的学生编号应成等差数列,公差为40,经计算,795-55=740,740不是40的整数倍,因此这组数据不是由系统抽样得到的,故选D.变式题(1)B ⑵B [解析](1)由题意知23 >6=138,138 -10=13余8,所以应先从138瓶饮料中随机剔除8瓶.故选B.⑵按照系统抽样的方法结合题意可得,第四组中抽取的学生编号为20 + (1200舟0) >3=92.例3 [思路点拨]根据分层抽样的特点,先确定抽样比例再求解.(1) C (2)B 懈析](1)由题意知,——=一,解得k=2, /抽取的丙种型号产品的件数为120 > =36.⑵根据题意知抽样比例为——=一,故学生总人数为90 L =6000,所以高三年级被抽取的学生人数为—>6000 -2400 -2000)=24.变式题(1)C (2)5 [解析]⑴・.6,y,z依次构成等差数列,且6,y,z+6依次构成等比数列,•••解得若采用分层抽样的方法抽取12个观测点的数据,则应从容城抽取的观测点的数据个数为------- X12=4,故选C.(2)从全校学生中随机抽取1人,抽到高二年级学生的概率为0.37,则高二年级学生的人数为0.37 X2000 =740,所以高三年级学生的人数为2000 -760 -740 =500,故从高三年级抽取的学生人数为——X500=5.徹弭备用例题JIAOSHl DC YONG LiTi【备选理由】例1考查了简单随机抽样;例2考查分层抽样方法的应用;例3综合考查了简单随机抽样、分层抽样与系统抽样三种抽样方法的区别与联系.例1 [配合例1使用]某工厂利用随机数表对生产的700个零件进行抽样测试,先将700个零件编号为001,002,…,699,700,从中抽取70个样本.若从下面随机数表的第1行第6列开始向右读取数据,则得到的第5个样本的编号是()332 11834297864560732524206443812234 35677357890564284421253313457860 73625300732852345788907236896080 43256780843678953557734899483A.524B.443C.644D.343[解析]B从第1行第6列开始向右读取数据,依次得到297,560,524,206,443,…,所以得到的第5个样本的编号是443.例2 [配合例3使用]一个单位有职工800人,其中具有高级职称的有160人,具有中级职称的有320 人,具有初级职称的有200人,其余人员有120人.为了解职工收入情况,决定按职称采用分层抽样的方法从中抽取容量为40的样本,则从上述各层中依次抽取的人数分别是()A.12,14,10,4B.9,12,12,7C.8,15,12,5D.8,16,10,6[解析]D由题意得,抽样比例为一=一,所以从具有高级职称的职工中抽取的人数为160 X=8,从具有中级职称的职工中抽取的人数为320 1=16,从具有初级职称的职工中抽取的人数为200 X =10,从其余人员中抽取的人数为120 1=6,所以各层中抽取的人数依次是8,16,10,6,故选D.例3 [补充使用]要完成下列两项调查:①某社区有100户高收入家庭,210户中等收入家庭,90户低收入家庭,从中抽取100户调查消费购买力的某项指标[②从某中学高二年级的10名体育特长生中抽取3名调查学习负担情况.应采取的抽样方法分别是()A. ①用系统抽样法,②用简单随机抽样法B. ①用分层抽样法,②用系统抽样法C. ①用分层抽样法,②用简单随机抽样法5.会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题【课前双基巩固】 知识聚焦1. (1)最大值 最小值 ⑵组距 组数 ⑶分组 (4)频率分布表 (5)频率分布直方图2. (1)中点⑵所分的组数组距3. 随时4. (1)最多 从小到大 中间(2)①样本数据 样本容量 样本平均数 对点演练1.25 [解析]依题意知,月均用水量在[2,2 .5)范围内的频率为0.50 >0.5=0.25,故所求居民人数为 100 X0.25=25.2.乙[解析]从茎叶图可以看岀,乙的数据分布更加集中,所以乙运动员的发挥更稳定.3.0.016 [解析]易得射击成绩的平均数为 9.5,故方差S 2=->(9.4-9.5)2+ (9.4-9.5)2+ (9.4-9.5)2+(9.6-9.5)2+(9.7-9.5)2]=0.016.4.3 [解析]设这100个成绩的平均数为一,则一 = ------------------------------------- =3.5.5 8 [解析]由中位数的定义可知 x=5,因为(y+5+8)+30+9+24 =5 >6.8,所以y=8.6.40 [解析]前3个小组的频率和为1-(0.037 5 +0.012 5) X5=0.75,所以第2个小组的频率为 ->0.75 = 0.25,所以抽取的学生人数为 ——=40.7.S 2>S 1>S 3 [解析]由标准差的几何意义得,数据越稳定,标准差越小.又数据越接近均值,数据越稳定, 因此 S 2>S 1>S 3.【课堂考点探究】例1 [思路点拨](1)由频率分布直方图求岀a=0.008,成绩在[40,70)上的频率为0.42,成绩在[70,80)上 的频率为0.4,由此能估计该次数学成绩的中位数;(2)根据频率分布直方图的性质求岀 a 的值,再依次判 断各个说法的正误. (1) C (2)B [解析](1)由频率分布直方图得(0.004+2a+0.03 + 0.04 + 0.01) >0 = 1,解得 a=0.008, /成绩在[40,70)上的频率为(0.004+0.008+0.03) X10=0.42,成绩在[70,80)上的频率为 0.04 X 10 = 0.4,「估计该次数学成绩的中位数是 70+ — X10=72.故选C.⑵由频率分布直方图得 100 >0.001 +0.001 5 X 2+a+2a)=1,解得a=0.002,所以寿命在300 h ~400 h 的异,故应米用简单随机抽样法.第68讲用样本估计总体考试说明1.了解分布的意义和作用 特点.,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的D.①②都用分层抽样法[解析]C 对于①,由于家庭收入差异较大,故应该采用分层抽样法;对于②,由于个体较少,且无明显差 2.理解样本数据标准差的意义和作用 ,会计算数据标准差 3. 能从样本数据中提取基本的数字特征 4. 会用样本的频率分布估计总体分布(如平均数、标准差),并作出合理的解释. ,会用样本的基本数字特征估计总体的基本数字特征 ,理解用样本估计总体频数为0.4X200=80,故①中说法错误;寿命在400 h〜500 h所对应的矩形的面积是0.2,故②中说法正确;用频率分布直方图估计该种电子元件的平均寿命为150 X0.1+250 X0.15+350 M.4+450 >0.2+550 >0.15,故③中说法错误; 寿命超过400 h的频率为0.2+0.15=0.35,故④中说法错误.故选B.变式题解:(1)由频率分布直方图得第七组的频率为1-(0.004 + 0.012+0.016 + 0.03 + 0.02+0.006+0.004) >0=0.08, 频率分布直方图如图.⑵由频率分布直方图得考试成绩在[60,90)内的频率为(0.004 + 0.012 + 0.016) >0 = 0.32,考试成绩在[90,100)内的频率为0.03 >0=0.3,••估计该校高三年级的这500名学生这次考试成绩的中位数为90+ — >0=96.⑶样本中第一组有学生50X0.004 >0=2(人),第六组有学生50 ».006 X10 = 3(人),从样本中考试成绩属于第一组和第六组的所有学生中随机抽取2名,基本事件总数n= =10,这2名学生的分数差的绝对值大于10分包含的基本事件个数m= =6,•这2名学生的分数差的绝对值大于10分的概率P=-=—=0.6.例2 [思路点拨](1)分析样本数据知该药店应选择乙药厂;(2)①先计算从乙药厂所抽取的每件中药材的质量平均数,再求岀总质量:②计算该药店所购买的100件中药材的总费用,列不等式求岀a的最大值.解:(1)根据样本数据知,该药店应选择乙药厂购买中药材.(2) ①从乙药厂所抽取的每件中药材的质量平均数为=一 >7+9 + 11+12+12 + 17 + 18+21 +21 +22)=15,估计该药店所购买的100件中药材的总质量为100 X15=1500(克).②由题可知,n<15的概率为一=-,15<n€0的概率为一=-,n>20的概率为一,则该药店所购买的100件中药材的总费用为100 >^50+100 >a+100 L>00,依题意得100 >>50 + 100 >a+100 L>00 <7000,解得a <75, •••a 的最大值为75. 变式题 ⑴D (2)A [解析](1)甲命中个数的最大值是37,最小值是8,极差为37-8=29,故A 中说法正确;乙命中个数的众数是21,故B 中说法正确; 由茎叶图知甲的命中率比乙高,故C 中说法正确; 甲命中个数的中位数为——=23,故D 中说法错误. 故选D.(2)根据茎叶图中数据知,这组数据的平均数 =->(88 +85+91 +95 + 94+92+90 +93) =91,方差 S 2=->(88-91)2+(85-91)2+(91 -91)2+(95-91)2+(94-91)2+(92-91)2+(90-91)2+(93-91)2]=9.5.故选 A.例3 [思路点拨](1)根据频率分布直方图中小矩形的面积之和为 1可得a=0.30;(2)根据频率分布直方图中小矩形的面积之和可确定 2.5<x<3,然后再根据频率值为0.85计算岀x;(3)设居民月用水量为t 吨 再列出居民每月的水费数据分组与频率分布表,然后再求出该市居民的月平均水费 解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08 + 0.04) >0.5=1,解得 a=0.30. (2) ••前 6 组的频率之和为(0.08 + 0.16+0.30 + 0.40+0.52 + 0.30) >0.5=0.88>0.85, 而前 5 组的频率之和为(0.08 + 0.16+0.30+0.40+0.52) X0.5 = 0.73<0.85, ••2.5vx<3,由 0.3 X x-2.5)=0.85-0.73,解得 x=2.9,因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.⑶设居民月用水量为t 吨时,相应的水费为y 元,则 即y=由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下根据题意,该市居民的月平均水费估计为 1 X 0.04+3 X 3.08 + 5X D.15 + 7X0.20+9X D.26 + 11 X 0.15 + 14 X D.06 + 18X5.04+22 >0.02 = 8.42(元).变式题(1)D(2)C(3)C[解析](1)一级和二级都是质量合格空气,观察统计图可以看岀,1月、2月、6月、7月、8月这5个月的空气质量合格天数均超过了20天,故选项A 叙述正确;1月、2月、3月相比于4月、5月、6月,整体上空气质量较好,故选项B 叙述正确;8月份的空气质量合格天数为30天,且一级达到了 14天,所以8月是1月至8月中空气质量最好的一个月,故选项C 叙述正确;5月份空气 质量合格的只有13天,四级及以上甚至有4天,所以5月是1月至8月中空气质量最差的一个月 所以 选项D 叙述错误.故选D.(2)由频率分布直方图得,甲地区用户满意度评分在[40,60)内的频率为(0.015 + 0.020) X 0=0.35,在[60,70)内的频率为 0.025 »0=0.25,••甲地区用户满意度评分的中位数 m 1 = 60+,时,相应的水费为y 元,则y= y= X 10=66,甲地区用户满意度评分的平均数S i=45 >0.015 X10+55 >0.020 X10+65X0.025 X10+75 >0.020 X10 + 85 >0.010 X10 + 95 >0.010 X10=67.乙地区用户满意度评分在[50,70)内的频率为(0.005 + 0.020) >0=0.25,在[70,80)内的频率为0.035 >0=0.35,•乙地区用户满意度评分的中位数m2=70 + --------- X10叼7.1,乙地区用户满意度评分的平均数S2=55 ».005 X10+65 ».020 >0+75X0.035 X10+85 ».025 X10 + 95 ».015 X10=77.5.••m1<m 2,S1<S2.故选C.⑶因为该市最前面4天的空气质量指数的平均数为->97+51 +36 + 68)=63,最后4天的空气质量指数的平均数为->59 +48 +29 +45) =45.25,所以在该市这22天的空气质量中,从空气质量指数的平均数来看,最后4天的空气质量优于最前面4天的空气质量,即选项A中结论正确;AQI高于100的数据有3 个:143,225,145,所以在该市这22天的空气质量中,有3天达到污染程度,即选项B中结论正确;12月29日的AQI为225,为重度污染,该天的空气质量最差,即选项C中结论错误;AQI在[0,50]内的数据有6 个:36,47,49,48,29,45,即空气质量为优的天数为6,即选项D中结论正确.故选C.■ SIN备用例题I JIAOSI'I 0CIYONG LITI _________________________________________________________________________________________________ 【备选理由】例1考查的是频率分布直方图的识别与理解;例2综合考查茎叶图及频率分布直方图.例1 [配合例1使用]某中学有初中生1800人,高中生1200人.为了了解学生本学期课外阅读的时间,现采用分层抽样的方法从中抽取了100名学生,先统计他们课外阅读的时间,然后按“初中生”和“高中生分为两组,再将每组学生的阅读时间(单位:小时)分为5组:[0,10),[10,20),[20,30),[30,40),[40,50], 并分别加以统计,得到如图所示的频率分布直方图.(1)写岀a的值;⑵试估计该校所有学生中阅读时间不少于30小时的学生人数;⑶从阅读时间不足10小时的样本对应的学生中随机抽取3人,并用X表示其中初中生的人数,求X的分布列和数学期望.解:(1)a=0.030.⑵由分层抽样知,抽取的初中生有60名,高中生有40名.因为初中生中阅读时间不少于30小时的频率为(0.02+0.005) >0 = 0.25,所以所有的初中生中阅读时间不少于30小时的约有0.25 X1800 =450(人).同理,高中生中阅读时间不少于30小时的频率为(0.03 + 0.005) X10=0.35,所以所有的高中生中阅读时间不少于30小时的约有0.35 >200=420(人).所以该校所有学生中阅读时间不少于30小时的约有450+420=870(人).⑶初中生中阅读时间不足10小时的频率为0.005 X10 = 0.05,样本中该小组内的人数为0.05 00=3. 同理,高中生中阅读时间不足10小时的小组内的人数为(0.005 X10) X40=2.故X 的所有可能取值为1,2,3,且P(X=1) =——=—,P(X=2)=——=_,P(X=3)=——.所以X的分布列为X123P———所以E(X)=1 J+2 X+3 X=-.例2 [配合例2使用][2018石家庄二中月考]某市为准备省中学生运动会,对本市甲、乙两个田径队的所有跳高运动员进行了测试,将全体运动员的成绩绘制成频率分布直方图,同时用茎叶图表示甲、乙两队运动员本次测试的成绩(单位:cm,且均为整数),由于某些原因,茎叶图中乙队的部分数据丢失,但已知所有运动员中成绩在190 cm以上(包括190 cm)的只有两个人,且均在甲队,规定:跳高成绩在185 cm以上(包括185 cm)定义为优秀.(1)求甲、乙两队运动员的总人数a及乙队中成绩在[160,170)(单位:cm)内的运动员人数b;⑵在甲、乙两队所有成绩在180 cm以上的运动员中随机选取2人,已知至少有1人成绩为优秀,求两人成绩均优秀的概率;(3) 在甲、乙两队中所有的成绩为优秀的运动员中随机选取2人参加省中学生运动会正式比赛,若所选取运动员中来自甲队的人数为X,求X的分布列及期望.解:(1)由频率分布直方图可知,成绩在190 cm以上(包括190 cm)的运动员的频率为0.005 X10=0.05,••全体运动员总人数a=—=40,••成绩在[160,170)内的运动员的人数为40 X0.03 X0 = 12,由茎叶图可知,甲队成绩在[160,170)内的运动员有3名,•b=2-3=9(人).⑵由频率分布直方图可得,成绩在180 cm以上的运动员总数为(0.020 +0.005) X10 X40=10, 由茎叶图可得,甲、乙两队成绩在180 cm以上的人数恰好有10人,••乙队的这部分数据不缺失,且两队中共有6人成绩优秀,其中甲队有4人,乙队有2人.设事件A为“至少有1人成绩优秀”,事件B为“两人成绩均优秀”,则P(A)=1-P「)=1-—=-,P(AB)=—=-,•P(B|A)= --- =_ X-=—⑶X的所有可能取值为0,1,2,且P(X=0)=——= — ,P(X=1) =——=—,P(X=2)=——=一=-,.•.E X)=O —+1 J+2 =_.第69讲变量间的相关关系、统计案例考试说明1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.2 .了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆).3. 了解回归的基本思想、方法及其简单应用4. 了解独立性检验的思想、方法及其初步应用【课前双基巩固】知识聚焦1. 散点图(1)左下角右上角(2)左上角右下角(3)—条直线2. (1)距离的平方和(2)斜率4.(1)有关系⑵a+b b+d对点演练1. ②[解析]对于①,正方形的边长与面积之间的关系是函数关系,不是相关关系;对于②,农作物的产量与施肥量之间不具有严格的函数关系,但具有相关关系;对于③,人的身高与眼睛近视的度数之间的关系既不是函数关系也不是相关关系;对于④,哥哥的数学成绩与弟弟的数学成绩之间既不是函数关系也不是相关关系.2. 负相关正相关[解析]由这两个散点图可以判断,变量x与y负相关,u与v正相关.3. ③[解析]由已知数据可得,有95%的把握认为“患肺病与吸烟有关”4. =6.5x+17.5 [解析]由题意可知一= ------------ =5厂= -------------- =50,即样本点的中心为(5,50).设回归直线方程为=6.5x+ , ••回归直线过样本点的中心(一厂),.・50=6.5X5+,即=17.5,「回归直线的方程为=6.5x+17.5.5. 正小于[解析]因为散点图呈现上升趋势,所以人体脂肪含量与年龄正相关.因为中间两个数据大约介于15%到20%之间,所以脂肪含量的中位数小于20%.6. ④[解析]由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故①中结论正确.因为回归直线必过样本点的中心「厂),所以②中结论正确.由线性回归方程的意义知,某女生的身高每增加1 cm,其体重约增加0.85 kg,故③中结论正确.当该大学某女生的身高为170 cm时,其体重的估计值是58.79 kg,这不是确定值,因此④中结论不正确.7.27 [解析]一=17.5,一=39,所以=39-(-5) X17.5=126.5,因此当x=20 时,=-5x20 + 126.5=26.5 切.【课堂考点探究】例1 [思路点拨](1)由=-0.1x+1可以判断岀x与y负相关,进而判断岀x与z负相关;(2)利用有关知识逐一判断即可.⑴A ⑵C 懈析](1)显然x与y负相关.又y与z正相关,所以x与z负相关.故选A.(2)①显然不正确,②不正确,应是函数关系,③④⑤正确.变式题A [解析]由相关系数的定义以及散点图所表达的含义可知,r2vr4<0vr3vr i.例2 [思路点拨](1)利用最小二乘法求岀,,从而求岀回归方程;(2)利用所求的回归方程进行回归预测,再计算收缩压与标准值的比值,最后根据题意判断.解:⑴= -------------------------------------- =45,= ---------------------------------------------- = 129,= ------------ = -------------------- «0.91,=-=129-0.91 M5=88.05,••回归直线方程为=0.91 x+88 .05.⑵根据回归直线方程预测,年龄为70岁的老人的标准收缩压约为0.91 >70+88.05=151 .75(mmHg),•/------ 胡.19,••这位收缩压为180 mmHg的70岁老人属于中度高血压人群.变式题解:(1) =- >9 + 7+3+1)=5, =->0.5+3.5+6.5 + 9.5)=5,X i y i=9 ».5 + 7X3.5+3>6.5+1 >9.5=58,=92+72+32+12=140,所以= ------------ =-—,=5-5 X - 一 =—,所以y关于x的线性回归方程为=-—x+—.⑵根据表2和表3可知,该月30天中有3天每天亏损2000元,有6天每天亏损1000元,有12天每天收入2000元,有6天每天收入6000元,有3天每天收入8000元,所以估计小李的洗车店2018年11月份每天的平均收入为一>-2000 X3-1000 >6+2000 X12+6000 >6+8000 X3)=2400(元).例3 [思路点拨](1)根据公式计算K2的观测值撚后根据临界值表中概率值给岀相应结论;(2)先确定随机变量丫的所有可能取值为0,10,20,30,40,再求岀每一个值对应的概率,然后列岀分布列,计算数学期望即可.。
高考数学一轮复习 第十章 算法、统计与统计案例10.3 用样本估计总体考试要求 1.会用统计图表对总体进行估计.2.能用数字特征估计总体集中趋势和总体离散程度.知识梳理1.平均数、中位数和众数(1)平均数:x =1n(x 1+x 2+…+x n ).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据). 2.方差和标准差(1)方差:s 2=1n ∑i =1n (x i -x )2或1n ∑i =1n x 2i -x 2. (2)标准差:s =1n ∑i =1nx i -x 2.常用结论巧用三个有关的结论(1)若x 1,x 2,…,x n 的平均数为1,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m +a ; (2)数据x 1,x 2,…,x n 与数据x 1′=x 1+a ,x 2′=x 2+a ,…,x n ′=x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2. 思考辨析判断下列结论是否正确(请在括号中打“√”或“×”)(1)对一组数据来说,平均数和中位数总是非常接近.(×)(2)方差与标准差具有相同的单位.(×)(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(√)(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√)教材改编题1.给出一组数据:1,3,3,5,5,5,下列说法不正确的是()A.这组数据的极差为4B.这组数据的平均数为3C.这组数据的中位数为4D.这组数据的众数为5答案 B解析这组数据的极差为5-1=4,A正确;平均数为1+3×2+5×36=113,B错误;中位数为3+52=4,C正确;众数为5,D正确.2.下列说法正确的是()A.众数可以准确地反映出总体的情况B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越小答案 C解析对于A,众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得无法客观反映总体特征,所以A错误;对于B,一组数的平均数不可能大于这组数据中的每一个数据,所以B错误;对于C,平均数、众数与中位数从不同的角度描述了一组数据的集中趋势,所以C正确;对于D,方差可以用来衡量一组数据波动的大小,方差越小,数据波动越小,方差越大,数据波动越大,所以D 错误.3.设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( ) A .0.01 B .0.1 C .1 D .10 答案 C解析 ∵样本数据x 1,x 2,…,x n 的方差为0.01,根据任何一组数据同时扩大几倍,方差将变为平方倍增长, ∴数据10x 1,10x 2,…,10x n 的方差为 100×0.01=1.题型一 样本的数字特征例1 (1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为( ) A .92,2.8 B .92,2 C .93,2 D .93,2.8答案 A解析 由题意得所剩数据为90,90,93,94,93. 所以平均数x =90+90+93+94+935=92.方差s 2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8.(2)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x ,方差为s 2,则( ) A.x =4,s 2<2 B.x =4,s 2=2 C.x >4,s 2<2 D.x >4,s 2>2 答案 A解析 设7个数为x 1,x 2,x 3,x 4,x 5,x 6,x 7, 则x 1+x 2+x 3+x 4+x 5+x 6+x 77=4,x 1-42+x 2-42+x 3-42+x 4-42+x 5-42+x 6-42+x 7-427=2,所以x 1+x 2+x 3+x 4+x 5+x 6+x 7=28,(x 1-4)2+(x 2-4)2+(x 3-4)2+(x 4-4)2+(x 5-4)2+(x 6-4)2+(x 7-4)2=14, 则这8个数的平均数为x =18(x 1+x 2+x 3+x 4+x 5+x 6+x 7+4)=18×(28+4)=4,方差为s 2=18×[(x 1-4)2+(x 2-4)2+(x 3-4)2+(x 4-4)2+(x 5-4)2+(x 6-4)2+(x 7-4)2+(4-4)2]=18×(14+0)=74<2. 教师备选某高校分配给某中学一个保送名额,该中学进行校内举荐评选,评选条件除了要求该生获得该校“三好学生”称号,还要求学生在近期连续3次大型考试中,每次考试的名次都在全校前5名(每次考试无并列名次).现有甲、乙、丙、丁四位同学都获得了“三好学生”称号,四位同学在近期连续3次大型考试名次的数据分别为甲同学:平均数为3,众数为2;乙同学:中位数为3,众数为3; 丙同学:众数为3,方差小于3;丁同学:平均数为3,方差小于3. 则一定符合推荐要求的同学有( ) A .甲和乙 B .乙和丁 C .丙和丁 D .甲和丁答案 D解析 对于甲同学,平均数为3,众数为2,则3次考试的成绩的名次为2,2,5,满足要求; 对于乙同学,中位数为3,众数为3, 可举反例:3,3,6,不满足要求;对于丙同学,众数为3,方差小于3, 可举特例:3,3,6,则平均数为4,方差s 2=13×[2×(3-4)2+(6-4)2]=2<3,不满足要求;对于丁同学,平均数为3,方差小于3,设丁同学3次考试的名次分别为x 1,x 2,x 3, 若x 1,x 2,x 3中至少有一个大于等于6, 则方差s 2=13[(x 1-3)2+(x 2-3)2+(x 3-3)2]>3,与已知条件矛盾,所以x 1,x 2,x 3均不大于5,满足要求.思维升华 平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其离散程度.跟踪训练1 (1)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下,由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)( ) A .119.3 B .119.7 C .123.3 D .126.7答案 C解析 由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x ,则(x -120)×0.310=0.1,解得x ≈123.3.(2)(2021·新高考全国Ⅰ改编)有一组样本数据x 1,x 2,…,x n ,由这组数据得到新样本数据y 1,y 2,…,y n ,其中y i =x i +c (i =1,2,…,n ),c 为非零常数,则( ) A .两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差不同答案 C解析设样本数据x1,x2,…,x n的平均数、中位数、标准差、极差分别为x,m,σ,t,依题意得,新样本数据y1,y2,…,y n的平均数、中位数、标准差、极差分别为x+c,m+c,σ,t,因为c≠0,所以C正确,D不正确.题型二总体集中趋势的估计例2棉花是我国纺织工业重要的原料.新疆作为我国最大的产棉区,对国家棉花产业发展、确保棉粮安全以及促进新疆农民增收、实现乡村振兴战略都具有重要意义.准确掌握棉花质量现状、动态,可以促进棉花产业健康和稳定的发展.在新疆某地收购的一批棉花中随机抽测了100根棉花的纤维长度(单位:mm),得到样本的频数分布表如下:(1)在图中作出样本的频率分布直方图;(2)根据(1)中作出的频率分布直方图求这一棉花样本的众数、中位数与平均数,并对这批棉花的众数、中位数和平均数进行估计. 解 (1)样本的频率分布直方图如图所示.(2)由样本的频率分布直方图, 得众数为250+3002=275(mm);设中位数为x ,(x -250)×0.008=50%-48%, 解得x =252.5,即中位数为252.5 mm ; 设平均数为x ,则x =25×0.04+75×0.08+125×0.1+175×0.1+225×0.16+275×0.4+325×0.12 =222(mm),故平均数为222 mm.由样本的这些数据,可得购进的这批棉花的众数、中位数和平均数分别约为275 mm 、252.5 mm 和222 mm. 教师备选某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法不正确的是()A.频率分布直方图中第三组的频数为10B.根据频率分布直方图估计样本的众数为75分C.根据频率分布直方图估计样本的中位数为75分D.根据频率分布直方图估计样本的平均数为75分答案 D解析分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边的中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73(分),故D错误.思维升华频率分布直方图的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);(2)估计该校学生联考数学成绩的众数、平均数.解(1)由频率分布直方图的性质,可得(0.004+a+0.013+0.014+0.016)×20=1,解得a=0.003.所以及格率为(0.016+0.014+0.003)×20=0.66=66%.(2)由图可得,众数估计值为100分.平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).题型三总体离散程度的估计例3(12分)(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;[切入点:方差的公式](2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高). [关键点:显著提高的理解]教师备选从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125] 频数62638228(1)根据上表补全如图所示的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)补全后的频率分布直方图如图所示.(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+02×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数约为100,方差约为104.(3)质量指标值不低于95的产品所占比例约为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2022·蚌埠质检)某校计划在秋季运动会期间开展“运动与健康”知识大赛,为此某班开展了10次模拟测试,以此选拔选手代表班级参赛,下表为甲、乙两名学生的历次模拟测试成绩.甲、乙两名学生测试成绩的平均数分别记作x,y,方差分别记作s21,s22.(1)求x,y,s21,s22;(2)以这10次模拟测试成绩及(1)中的结果为参考,请你从甲、乙两名学生中选出一人代表班级参加比赛,并说明你作出选择的理由.解(1)x=110(98+94+97+97+95+93+93+95+93+95)=95,y=110(92+94+93+94+95+94+96+97+97+98)=95,s21=110[32+(-1)2+22+22+0+(-2)2+(-2)2+0+(-2)2+0]=3,s22=110[(-3)2+(-1)2+(-2)2+(-1)2+0+(-1)2+12+22+22+32]=3.4.(2)答案一:由(1)可知,x=y,s21<s22,甲、乙两人平均分相同,但甲发挥更稳定,所以可以派甲同学代表班级参赛.答案二:由(1)可知,x =y ,s 21<s 22,甲、乙两人平均分相同,两人成绩的方差差距不大,但从10次测试成绩的增减趋势可以发现,甲的成绩总体呈下降趋势,乙的成绩总体呈上升趋势,说明乙的状态越来越好,所以可以派乙同学代表班级参赛.课时精练1.某机构调査了10种食品的卡路里含量,结果如下:107,135,138,140,146,175,179,182,191,195.则这组数据的中位数是( ) A .160.5 B .146 C .175 D .135 答案 A解析 中位数为146+1752=160.5.2.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据( ) A .众数为2 B .平均数为2.5 C .方差为1.6 D .标准差为4答案 C解析 由题中数据可得,众数为2和3, 故A 错误; 平均数为x =5+5+…+2+110=3,故B 错误;方差s 2= 5-32+5-32+…+2-32+1-3210=1.6,标准差为 1.6≠4,故C 正确,D 错误.3.若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则4x 1-3,4x 2-3,…,4x n -3的平均数和标准差分别为( )A.x ,s B .4x -3,s C .4x -3,4sD .4x -3,16s 2-24s +9 答案 C解析 因为x =1n(x 1+x 2+…+x n ),s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],所以4x 1-3,4x 2-3,…,4x n -3的平均数为 x ′=1n [(4x 1-3)+(4x 2-3)+…+(4x n -3)]=1n [4(x 1+x 2+…+x n )-3n ]=4x -3, 标准差为1n [4x 1-3-4x +32+4x 2-3-4x +32+…+4x n -3-4x +32]=41n[x 1-x 2+x 2-x 2+…+x n -x 2]=4s 2=4s .4.某市为推进垃圾分类工作的实施,开展了“垃圾分类进小区”的评比活动.现对该市甲、乙两个小区进行评比,从中各随机选出20户家庭进行评比打分,每户成绩满分为100分,评分后得到如下茎叶图.通过茎叶图比较甲、乙两个小区成绩的平均数及方差大小( )A.x甲<x乙,s2甲<s2乙B.x甲>x乙,s2甲<s2乙C.x甲<x乙,s2甲>s2乙D.x甲>x乙,s2甲>s2乙答案 C解析由茎叶图知,乙小区成绩低的户数少于甲小区,且成绩大多高于甲小区,所以乙小区成绩的平均数大于甲小区.因为乙小区成绩分布比较集中,所以乙小区成绩的方差比甲小区小.5.某大学共有12 000名学生,为了了解学生课外图书阅读量情况,该校随机地从全校学生中抽取1 000名,统计他们每年阅读的书籍数量,由此来估计全体学生当年的阅读书籍数量的情况,下列估计中正确的是(注:同一组数据用该组区间的中点值作为代表)()A.中位数为6B.众数为10C.平均数为6.88D.该校读书不低于8本的人数约为3 600答案 C解析由图知,中位数x在[4,8)内,所以0.06×4+0.1×(x-4)=0.5,解得x=6.6,A错误;由图知,众数在[4,8)内,故众数为6,B错误;平均数为4×(2×0.06+6×0.1+10×0.07+14×0.015+18×0.005)=6.88,C正确;由图知,该校读书不低于8本的频率之和为1-0.16×4=0.36,所以该校读书不低于8本的人数约为0.36×12 000=4 320,D错误.6.(2022·深圳模拟)若甲组样本数据x1,x2,…,x n(数据各不相同)的平均数为2,方差为4,乙组样本数据3x1+a,3x2+a,…,3x n+a的平均数为4,则下列说法不正确的是() A.a的值为-2B.乙组样本数据的方差为36C.两组样本数据的样本中位数一定相同D.两组样本数据的样本极差不同答案 C解析由题意可知,3×2+a=4,故a=-2,故A正确;乙组样本数据方差为9×4=36,故B正确;设甲组样本数据的中位数为x i,则乙组样本数据的中位数为3x i-2,所以两组样本数据的样本中位数不一定相同,故C错误;甲组数据的极差为x max-x min,则乙组数据的极差为(3x max-2)-(3x min-2)=3(x max-x min),所以两组样本数据的样本极差不同,故D正确.7.2021年高考某题的第(1)问的得分情况如下:其中得分的众数是________.答案0解析众数是指一组数据中出现次数最多的数据,根据所给表格知,百分率最高的是0. 8.已知数据x1,x2,…,x9的方差为5,则数据3x1+1,3x2+1,…,3x9+1的方差为________.答案45解析 原数据的方差为5,则线性变换后的数据的方差为32×5=45.9.自中国进入工业化进程以来,个人的文化水平往往影响或在某种程度上决定了个人的薪酬高低,文化水平较高的人往往收入较高.将个人的文化水平用数字表示,记“没有接受过系统学习或自学的成年人”为最低分25分,“顶级尖端人才”为最高分95分.为了分析A 市居民的受教育程度,从A 市居民中随机抽取1 000人的文化水平数据X ,将样本分成小学[25,35),初中[35,45),高中[45,55),专科[55,65),本科[65,75),硕士[75,85),博士[85,95]七组,整理后得到如图所示的频率分布直方图.(1)求样本数据的众数和中位数(保留一位小数);(2)请估计该市居民的平均文化水平.(同组中的每个数据用该组区间的中点值代替) 解 (1)样本数据的众数为65+752=70.0.X ∈[25,65)的频率为0.05+0.05+0.15+0.20=0.45<0.50, X ∈[25,75)的频率为0.05+0.05+0.15+0.20+0.30=0.75>0.50. 所以中位数在区间[65,75)上,中位数为 65+10×0.50-0.450.30=65+53≈66.7.(2)平均文化水平X =30×0.05+40×0.05+50×0.15+60×0.20+70×0.30+80×0.20+90×0.05=64.5.10.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:kg),并绘制频率分布直方图如图.(1)请根据频率分布直方图估计该水果店苹果日销售量的众数、中位数和平均数;(同一组中的数据以这组数据所在区间中点的值作代表)(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能90%地满足顾客的需求(在10天中,大约有9天可以满足顾客的需求).请问每天应该进多少千克苹果?解 (1)由题图可知,区间[80,90)的频率最大, 所以众数为85,中位数设为x ,则0.025+0.1+(x -80)×0.04=0.5,可得x =89.375.平均数为x =(65×0.002 5+75×0.01+85×0.04+95×0.035+105×0.01+115×0.002 5) ×10=89.75.(2)日销售量[60,100)的频率为0.875<0.9, 日销售量[60,110)的频率为0.975>0.9, 故所求的量位于[100,110).由0.9-0.025-0.1-0.4-0.35=0.025, 得100+0.0250.01=102.5,故每天应该进102.5千克苹果.11.已知一组数据1,2,a ,b ,5,8的平均数和中位数均为4,其中a ,b ∈N *,在去掉其中的一个最大数后,该组数据一定不变的是( )A .平均数B .众数C .中位数D .标准差答案 B解析 由题意知,16+a +b6=4,可得a +b =8,又中位数为4,则⎩⎪⎨⎪⎧ a =3,b =5或⎩⎪⎨⎪⎧ a =4,b =4,或⎩⎪⎨⎪⎧b =3,a =5, 当⎩⎪⎨⎪⎧ a =3,b =5或⎩⎪⎨⎪⎧b =3,a =5,时, 众数为5,标准差为433;当⎩⎪⎨⎪⎧ a =4,b =4时,众数为4,标准差为 5. ∴去掉其中的一个最大数后,数据为1,2,a ,b ,5,当⎩⎪⎨⎪⎧ a =3,b =5或⎩⎪⎨⎪⎧b =3,a =5,时,平均数为165,众数为5,中位数为3,标准差为85;当⎩⎪⎨⎪⎧a =4,b =4时,平均数为165,众数为4,中位数为4,标准差为365.综上,数据变化前后一定不变的是众数.12.(2022·东三省四市联考)某同学掷骰子5次,并记录了每次骰子出现的点数,得出平均数为2,方差为2.4的统计结果,则下列点数中一定不出现的是( ) A .1 B .2 C .5 D .6 答案 D解析 因为6-225=3.2,根据方差的计算公式知,方差大于2.4,因此不能出现点数6,因为5-225=1.8<2.4,2-225=0<2.4,1-225=0.2<2.4,则其余的点数1,2,5都有可能出现.13.小华同学每天晚上睡觉前要求自己背诵15个英文单词,若超出记为“+”,不足记为“-”,则上周一至周五,他的完成情况分别为-2,-1,x ,+4,y ,已知这五个数据的平均数是0,方差是5.2,则上周一至周五,小华背诵的单词数量的众数和中位数分别是( ) A .13,14 B .-2,-1 C .13,13 D .-2,-2答案 A解析 因为-2,-1,x ,+4,y 这五个数据的平均数是0,方差是5.2,所以有⎩⎨⎧-2-1+x +4+y5=0,-2-02+-1-02+x -02+4-02+y -025=5.2,解得⎩⎪⎨⎪⎧ x =-2,y =1或⎩⎪⎨⎪⎧x =1,y =-2,不管取哪一组解,这5天的单词量均是以下几个数,13,14,13,19,16, 所以众数和中位数分别是13,14.14.已知一组数据a ,b ,3,5的中位数为7,平均数为8,则ab =________. 答案 135解析 因为一组数据a ,b ,3,5的平均数为8, 所以14(a +b +3+5)=8,解得a +b =24,若a =b ,则a =b =12,此时4个数为3,5,12,12,显然中位数不是7,不妨设a <b ,若a ≤3,则b ≥21,此时4个数排列为a ,3,5,b ,中位数为4,不符合题意, 若3<a ≤5,则19≤b <21,此时4个数排列为3,a ,5,b ,显然中位数不是7, 若a >5,则4个数排列为3,5,a ,b ,则中位数为5+a2=7,解得a =9,则b =15,所以ab =9×15=135.15.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,则年龄在(x -s ,x +s )内的人数占公司人数的百分比是( )(其中x 是平均数,s 为标准差,结果精确到1%)A .14%B .25%C .56%D .67%答案 C解析 因为x =36+36+37+37+40+43+43+44+449=40, s 2=19×(16+16+9+9+0+9+9+16+16)=1009,即s =103, 所以年龄在(x -s ,x +s ),即⎝⎛⎭⎫1103,1303内的人数为5,所以年龄在(x -s ,x +s )内的人数占公司人数的百分比为59≈56%. 16.中国独有的文书工具,即笔、墨、纸、砚,有文房四宝之名,起源于南北朝时期.其中宣纸是文房四宝的一种,宣纸“始于唐代,产于泾县”,因唐代泾县隶属宣州管辖,故因地得名宣纸.宣纸按质量等级分为正牌(优等品)、副牌(合格品)、废品三等.某公司生产的宣纸为纯手工制作,年产宣纸10 000刀(1刀=100张),该公司按照某种质量指标x 给宣纸确定等级如表所示: x 的范围(44,48]∪(52,56] (48,52] [0,44]∪(56,60] 质量等级副牌 正牌 废品在该公司所生产的宣纸中随机抽取了一刀进行检验,得到频率分布直方图如图所示,已知每张正牌宣纸的利润为15元,副牌宣纸的利润为8元,废品的利润为-20元.(1)试估计该公司的年利润;(2)市场上有一种售价为100万元的机器可以改进宣纸的生产工艺,但这种机器的使用寿命为一年,只能提高宣纸的质量,不能增加宣纸的年产量.据调查这种机器生产的宣纸的质量指标x如表所示:x的范围(x-2,x+2)(x-6,x+6)频率0.682 70.954 5其中x为质量指标x的平均值,但是由于人们对传统手工工艺的认可,改进后的正牌和副牌宣纸的利润都将下降3元/张,请问该公司是否购买这种机器,请你为公司提出合理建议,并说明理由.(同一组的数据用该组区间的中点值作代表)解(1)由频率分布直方图得,一刀宣纸有正牌100×0.1×4=40(张),有副牌100×0.05×4×2=40(张),有废品100×0.025×4×2=20(张),∴该公司一刀宣纸的利润的估计值为40×15+40×8-20×20=520(元),∴估计该公司的年利润为520万元.(2)由频率分布直方图得,x=42×0.025×4+46×0.05×4+50×0.1×4+54×0.05×4+58×0.025×4=50.这种机器生产的宣纸的质量指标x如表所示:x的范围(48,52)(44,56)∴一刀宣纸中正牌的张数估计为100×0.682 7=68.27,废品的张数估计为100×(1-0.954 5)=4.55,副牌的张数为100×(0.954 5-0.682 7)=27.18,∴一刀宣纸的利润为68.27×12+27.18×5-4.55×20=864.14(元),∴公司改进后该公司的利润为864.14-100=764.14(万元),∵764.14>520,∴建议该公司购买这种机器.。
小题必刷卷(十四)题组一刷真题角度11. B [解析]依次执行程序框图可得,s=1+(-1)1x 一=_,k=2;s=-+(-1)2X一= ,k=3,满足k > 3,输岀s二.2. B [解析]逐次计算结果为:S=-1,a=1 ,K=2;S=1,a=- 1,K=3;S=-2,a=1,K=4;S=2,a=- 1,K=5;S=-3,a=1,K=6;S=3,a=- 1,K=7,此时输岀S.故输岀的S=3.3. D [解析]程序运行过程如下所示S M t初始状态0 100 1第1次循环结束100 -10 2第2次循环结束90 1 3此时S=90<91,满足条件,程序需在t=3时跳岀循环,即N=2为满足条件的最小值4. D [解析]判断框“ ”中应填入A< 1000,由于是求最小偶数,故处理框“”中应填入n=n+2.选D.5. B [解析]逐一写岀循环:a=14,b=18^a=14,b=4^a=10,b=4^a=6,b=4^a=2,b=4^a=2,b=2,结束循环.故选B6. B [解析]第一次运行-=10是整数,T=1,i= 3;第二次运行-不是整数,i=4;第三次运行-=5是整数,T=2,i=5,符合判断条件i > 5,此时输岀T=2.故选B角度27. C [解析]女教师的人数是110X 70%+150X 40%=137.8. A [解析]不妨设该地区建设前经济收入为100万元,则建设后经济收入为200万元.四个选项的情况分析如下:所以选A9. A [解析]由题图可知,2014年8月至9月的月接待游客量在减少,故A选项错误.10. D [解析]平均最高气温高于20 C的月份有七、八2个月.11. D [解析]由频率分布直方图得,每周的自习时间不少于22.5小时的人数是(0. 16+0.08+0. 04) X 2. 5 X 200=140.角度312. C [解析]易知一=一=22.5,一=——=160.因为=4,所以160=4 X 22.5+,解得=70,所以回归直线方程为=4x+70,当x=24 时,=96+70=166.故选C13. D [解析]由图知,2006年以来我国二氧化硫年排放量与年份负相关,故选D题组二刷模拟14. C [解析]•••高三某班有学生56人,用系统抽样的方法抽取一个容量为4的样本,「•分组间隔为56 - 4=14,又5+14=19, •样本中还有一个学生的编号为19,故选C15. A [解析]=-X (3+5+7+9)=6, =- X (6+a+3+2)=——,•回归方程为=-0. 7X+8. 2,•——=-0.7X6+8. 2,解得a=5.故选A16. D [解析]根据茎叶图数据可知一甲= -------------------------------------------- =27,= -------------------------------------------- =30,甲种树苗的样本数据分布比较集中,故选D 乙17. B [解析]根据列联表中的数据,得口的观测值k= -------------- -- ---- ~5. 059>5. 024,18. C [解析]由(a+0. 035+0. 030+0. 020+0. 010) X 10=1,得a=0. 005.得分在[40,60)内的频率是0. 40,故得分在[40,60)内的参赛者有100X 0. 40=40(名),A中结论正确得分在[60,80)内的频率为0. 5,故从这100 名参赛者中随机选取1人,其得分在[60,80)内的概率为0.5,B中结论正确;设这100位参赛者得分的中位数为X,则0. 4+(x- 60)X 0. 03=0. 5,可得x=—,C中结论错误;根据频率分布直方图知,最高的小矩形底边中点的横坐标为----- =55,二估计得分的众数为55, D中结论正确.故选C19. B [解析]模拟程序的运行,可得x=8,y=3,不满足条件|y-x|< 3,继续循环,x=3,y=-,满足条件|y-x|< 3,退岀循环,输岀y的值为-.故选B220. C [解析]模拟运行该程序:i= 1,S=0,i< 5,i 是奇数,S=-1 ,i=2;i< 5,i 是偶数,S=-1+2 =3,i= 3;i< 5,i 是奇数,S=3- 32=-6,i= 4;i< 5,i 是偶数,S=-6+42=10,i= 5,不满足i< 5,输岀S=10.故选C.21. B [解析]若x€ [3,5),中位数为3,由= ---------- =3,得x=5(舍去);若x € (0,2],中位数为2,由= -------------- =2,得x=0(舍去)若x € (2,3)冲位数为X,由= ---------------- =x,得x=2. 5.从这5个数中任取2 个有10 种结果:(1,2),(1,2. 5),(1,3),(1,4),(2,2.5),(2,3),(2,4),(2. 5,3),(2. 5,4),(3,4),其中2 个数的积大于 5 的结果有(2,3),(2,4),(2.5,3),(2. 5,4),(3,4),共 5 种,故所求概率为一二.故选B22. 24 [解析]由条形图可得喜欢篮球运动的女生有100名,喜欢篮球运动的男生有300名,所以抽取的男生人数为32X-=24.23. ②④[解析]①两个随机变量的线性相关性越强,相关系数|r|越接近1,故①不正确;②回归直线一定经过样本点的中心(_,_),故②正确;③若线性回归方程为=0. 2x+10,则当样本数据中x=10时,可以预测y=12,但是会存在误差,故③不正确;④回归分析中,相关指数R2的值越大说明残差平方和越小,故④正确.综上可得,正确说法的序号为②④.解答必刷卷(六)题组一刷真题1. 解:(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少为80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多为79分钟.因此第二种生产方式的效率更高.(ii )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73. 5分钟.因此第二种生产方式的效率更高.(iii )由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟.因此第二种生产方式的效率更高.(iv )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给岀了4种理由,考生答岀其中任意一种或其他合理理由均可得分)⑵由茎叶图知m——=80.列联表如下:(3)由于K2= ----------- -- ---- =10>6. 635,所以有99%勺把握认为两种生产方式的效率有差异.2. 解:(1)由已知,甲、乙、丙三个部门的员工人数之比为 3 : 2 : 2,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.(2)(i)随机变量X的所有可能取值为0,1,2,3.P(X=k) -------- (k=0,1,2,3).所以,随机变量X的分布列为(ii股事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3 人中,睡眠充足的员工有2人,睡眠不足的员工有1人”则A=B U C且B与C互斥.由⑴知HB)=RX=2),P(C)=P(X=1),故P(A)=P(B U C)=P(X=2)+P(X=1)=-.所以,事件A发生的概率为-.3. 解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=-30. 4+13. 5 X 19=226. 1(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17. 5 X 9=256. 5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看岀,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13. 5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17. 5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii )从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226. 1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给岀了2种理由,答岀其中任意一种或其他合理理由均可)题组二刷模拟4. 解:(1)由(0. 004+0. 012+0. 024+0. 040+0. 012+n) X 10=1,得m=0. 008.样本平均数=95X 0. 004 X 10+105X 0. 012 X 10+115 X 0. 024 X 10+125 X 0. 040X 10+135 X 0. 012X 10+145X 0. 008 X 10=121. 8.(2)数学成绩在[130,140)的同学人数为6,数学成绩在[140,150]的同学人数为4飞的所有可能取值为0,1,2,3.P(E =0)=—=-,P(E =1 )=——二,P(E =2)=一=—,P( E =3)=——=—,所以E的分布列为E(E )=0X—+1 X- +2X—+3X _二.5. ------------------------------------------------------------------------------------ 解:(1)由2X 2列联表中的数据,可得Kf的观测值k= ------------------------------------------------------------------------- - ----------- =------------- -- ----- =-------------- 8.477<10. 828,因此,不能在犯错误的概率不超过0. 001的前提下认为对优惠活动满意与对车辆状况满意有关系(2)由题意可知用户骑行一次获得0元券的概率为一,X的所有可能取值为0,1,2,3,4.P(X=0)= — =——,P(X=1)= X — X—=—,P(X=2)= X -X一+ -二P(X=3)= X_X_=-,P(X=4)= - =—,•••X的分布列为X 的数学期望E(X)=0X 一+1X—+2X 一+3X—+4 X-=.6. 解:(1)由题意可知二=-6,= ------------------------ =110,2 2 2 2 , 2 ,、2(X i - ) =4 +2 +0 +(- 2) +(-4) =40,(X i- )(y i- )=4 X (-60)+2 X (- 25)+0 X 5+(-2) X 30+(-4)X 50=-550, 所以= ---------------- =-—=-13.75,=-=110+13. 75 X (-6)=27. 5,所以y关于x的回归方程为=-13. 75X+27. 5.当x=-12 时,=-13. 75X (- 12)+27. 5=192. 5~ 193,所以可预测日平均气温为-12 C时,该店的外卖订单数为193.⑵由题意知,X的所有可能取值为0,1,2,3.P(X=0)J=—,p(x=1 )=——=一,P(X=2)=——=一,P(X=3)=—=一,所以X的分布列为E(X)=O X —+1 X —+2 X —+3 —=_.7. 解:(1)设下周一和下周二无雨的概率均为P,2 _______________________________________________________________________由题意得p =0. 36,解得p=0. 6.基地收益X的所有可能取值为20,15,10,7. 5,则P(X=20)=0. 36,P(X=15)=0. 24,P(X=10)=0.24,P(X=7. 5)=0. 16,所以基地收益X的分布列为E(X)=20 X 0. 36+15X 0. 24+100. 24+7. 50. 16=14.4,所以基地的预期收益为14.4万元.(2)设基地额外聘请工人时的收益为Y(单位:万元),则E(Y)=20X 0. 6+10 X 0.4=16,E(Y)-E(X)=1. 6,所以当额外聘请工人的成本高于 1.6万元时,不应额外聘请工人;当额外聘请工人的成本低于1.6万元时,应额外聘请工人;当额外聘请工人的成本恰为1.6万元时,是否额外聘请工人均可以.8. 解:(1)样本平均数=170X 0. 02+180X 0. 09+190X 0. 22+200X 0. 33+210X 0. 24+220X 0. 08+230 X 0. 02=200,2 2 2 2 2 2 2s =(- 30) X 0. 02+(- 20) X 0. 09+(- 10) X 0. 22+0 X 0. 33+10 X 0. 24+20 X 0. 08+30 X 0. 02=150. (2)①由(1)知,Z〜^200,150),从而P(187.8<Z W 212 2)=P(200-12. 2<Z< 200+12. 2)=0. 682 6 .②由①知,一件产品的质量指标值位于区间(187.8,212.2]上的概率为0.682 6,可得X~E(100,0.682 6 ),所以E(X)=100X 0. 682 6=68. 26.。
※精品试卷※第十单元算法初步、统计、统计案例第63讲算法初步课前双击巩固1.算法(1)算法通常是指按照解决某一类问题的和的步骤.(2)应用:算法通常可以编成计算机,让计算机执行并解决问题.2.程序框图定义:程序框图又称流程图,是一种用、流程线及来表示算法的图形.3.三种基本逻辑结构4.基本算法语句(1)输入语句、输出语句和赋值语句的格式与功能:※精品试卷※(2)条件语句的格式及框图:①IF-THEN格式:图10-63-1②IF-THEN-ELSE格式:图10-63-2(3)循环语句的格式及框图:①UNTIL语句:图10-63-3②WHILE语句:图10-63-4题组一常识题1.[教材改编]执行如图10-63-5所示的程序框图,运行相应的程序,若输入x的值为2,则输出S的值为.图10-63-52.[教材改编]运行如图10-63-6所示的程序后输出的结果是3,则输入的x值是.图10-63-6题组二常错题◆索引:注意循环结构中控制循环的条件;注意区分程序框图是条件结构还是循环结构.3.若[x]表示不超过x的最大整数,执行如图10-63-7所示的程序框图,则输出S的值为.图10-63-74.操作图10-63-8中的流程图,使得当成绩不低于60分时,输出“及格”,当成绩低于60分时,输出“不及格”,则①处填,②处填.图10-63-85.更相减损术是出自中国古代数学专著《九章算术》的一种算法,其内容如下:“可半者半之,不可半者,副置分母、子之数,以少减多,更相减损,求其等也.以等数约之.”图10-63-9是关于该算法的程序框图,如果输入a= 153,b= 119,则输出的a的值是.图10-63-9课堂考点探究探究点一算法的基本结构1 (1)[2017·咸阳三模]已知如图10-63-10所示的程序框图的输入值x∈[-1,4],则输出y值的取值范围是()A.[0,2]B.[-1,2]C.[-1,15]D.[2,15]图10-63-10(2)如图10-63-11所示的程序框图的运行结果为S=20,则判断框中可以填入的关于k的条件是()图10-63-11A.k>9?B.k≤8?C.k<8?D.k>8?[总结反思] 解决程序框图问题时一定要注意以下几点:(1)不要混淆处理框和输入框;(2)注意区分程序框图是条件结构还是循环结构;(3)注意区分“当型循环结构”和“直到型循环结构”;(4)处理关于循环结构的问题时,一定要正确控制循环次数;(5)要注意各个程序框的顺序.式题 (1)[2017·雅安三诊]执行如图10-63-12所示的程序框图,为使输出的数据为31,则判断框中可以填入的条件为()A.i≤3?B.i≤4?C.i≤6?D.i≤7?图10-63-12(2)[2017·银川一中二模]执行如图10-63-13所示的程序框图,输入n=6,m=4,那么输出的p等于()A.720B.360C.240D.120图10-63-13探究点二算法的交汇性问题考向1与统计的交汇问题2 图10-63-14(1)是某县参加2017年高考的学生身高(单位:cm)的条形统计图,将从左到右的各条形表示的学生人数依次记为A1,A2,…,A10(如A2表示身高(单位:cm)在[150,155)内的学生人数).图(2)是统计图(1)中身高在一定范围内学生人数的一个程序框图.现要统计身高在[160,180)内的学生人数,则在程序框图中的判断框内应填写()图10-63-14A.i<6?B.i<7?C.i<8?D.i<9?[总结反思] 与统计交汇的程序框图问题,多体现在将统计的图表知识(如频率分布直方图、茎叶图等)与程序框图交汇在一起,解决此类问题时应根据题意读懂统计的图表数据后,再根据程序框图的算法进行推理演算.考向2与函数的交汇问题3 [2017·四川绵阳中学三模]某市乘坐出租车的收费办法如下:图10-63-15(1)不超过3千米的里程收费10元;(2)超过3千米的里程按每千米2元收费(对于其中不足千米的部分, 若其小于0.5千米则不收费,若其大于或等于0.5千米则按1千米收费),当车程超过3千米时,另收燃油附加费1元.相应系统收费的程序框图如图10-63-15所示,其中x(单位:千米)为行驶里程,y(单位:元)为所收费用,用[x]表示不大于x的最大整数,则图中①处应填 ()A.y=2[x+0.5]+4B.y=2[x+0.5]+5C.y=2[x-0.5]+4D.y=2[x-0.5]+5[总结反思] 与函数交汇的程序框图问题,常见的有条件结构的应用、分段函数的求值问题,读图时应正确理解题意,根据相应条件选择与之对应的运算法则求值.考向3与数列求和的交汇问题4 图10-63-16图10-63-16是一个算法的程序框图,如果输入i=0,S=0,那么输出的结果为()A.B.C.D.[总结反思] 解决与数列求和交汇的程序框图问题的关键有以下两个方面:一是循环结构的识图、推理,将其输出结果呈现为一个数列求和的形式;二是结合数列求和的知识对结果进行求和运算.常见题型为等差数列、等比数列求和,裂项相消法求和以及周期分组法求和.强化演练1.【考向3】[2017·岳阳二模]执行如图10-63-17所示的程序框图,输出s的值为()图10-63-17A.1B.C.D.2.【考向2】[2017·江西八校联考]执行如图10-63-18所示的程序框图,若输出S的值为4,则判断框中填入的条件可能是()图10-63-18A.k<18?B.k<17?C.k<16?D.k<15?3.【考向3】执行如图10-63-19所示的程序框图,若输出的结果是,则输入的a为()A.6B.5C.4D.3图10-63-194.【考向2】[2017·福州一中质检]执行如图10-63-20所示的程序框图,则输出的结果是()A.1B.C.D.2图10-63-205.【考向1】图10-63-21是计算某年级500名学生期末考试成绩(满分为100分)及格率q的程序框图,则图中处理框内应填入.图10-63-21探究点三基本算法语句5 图10-63-22为一个求50个数的平均数的程序,在横线上应填充的语句为 ()图10-63-22A.i>50B.i<50C.i>=50D.i<=50[总结反思] 应用基本算法语句的四个关注点:(1)输入、输出语句:在输入、输出语句中加提示信息时要加引号,变量之间用逗号隔开.(2)赋值语句:左、右两边不能对换,赋值号左边只能是变量.(3)条件语句:条件语句中包含其他条件语句时,要分清内外条件结构,保证结构完整性.(4)循环语句:分清“UNTIL”语句和“WHILE”语句的格式和特征,不能混用.式题 (1)当a=3时,如图10-63-23所示的程序输出的结果是()A.9B.3C.10D.6图10-63-23(2)在执行图10-63-24中的程序时,如果输入n的值为6,那么输出的结果为()A.6B.720C.120D.1图10-63-24第64讲随机抽样课前双击巩固1.简单随机抽样(1)抽取方式:逐个;(2)每个个体被抽到的概率;(3)常用方法:和.2.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由组成时,往往选用分层抽样.3.系统抽样的步骤假设要从容量为N的总体中抽取容量为n的样本.(1)先将总体的N个个体;(2)确定,对编号进行,当(n是样本容量)是整数时,取k=;(3)在第1段用确定第1个个体编号l(l≤k);(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号,依次进行下去,直到获取整个样本.题组一常识题1.[教材改编]为了了解一批零件的长度,抽测了其中200个零件的长度,在这个抽样中,总体的一个样本是.2.[教材改编]某中学从编号为1~60的60个班级中,随机抽取6个班级进行卫生检查,所抽班级的号码是6,16,26,36,46,56,则这种抽样方法是.3.[教材改编]某学校高三年级有男同学200人,女同学300人,用分层抽样的方法抽取一个容量为50的样本,则应抽取男同学人,女同学人.4.[教材改编]总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为.7816657208026314021443199714019832049234493682003623486969387181题组二常错题◆索引:系统抽样中剔除的个体随机;分层抽样每层抽取的个数比例是相同的;简单随机抽样、系统抽样、分层抽样都是等可能抽样.5.某学校为了解高一年级1203 名学生对某项教改试验的意见,打算从中抽取一个容量为40 的样本,若采用系统抽样,则分段间隔为.6.某公司有员工500人,其中不到35岁的有125人,35~50岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从员工中抽取了100人,则应在这三个年龄段中抽取的人数分别为.7.某校要从高一、高二、高三共2012名学生中选取50名组成志愿团,若先用简单随机抽样的方法从2012名学生中剔除12名,再从剩下的2000名学生中按分层抽样的方法抽取50名,则下面对每名学生入选的概率描述正确的是.(填序号)①都相等且为;②都相等且为;③不完全相等.课堂考点探究探究点一简单随机抽样1 (1)某班级有男生20人,女生30人,从中抽取10人组成样本,其中一次抽样结果是抽到了4名男生、6名女生, 则下列说法正确的是()A.这次抽样可能采用的是简单随机抽样B.这次抽样一定没有采用系统抽样C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率(2)[2017·辽宁实验中学模拟]福利彩票“双色球”中红色球的号码可以从01,02,03,…,32,33这33个两位数号码中选取,小明利用下面的随机数表选取红色球的6个号码,选取方法是从第1行第9列和第10列的数字开始从左到右依次选取两个数字,则第4个被选中的红色球号码为()81 47 23 68 63 93 17 90 12 69 86 81 62 93 50 60 91 33 75 85 61 39 8506 32 35 92 46 22 54 10 02 78 49 82 18 86 70 48 05 46 88 15 19 20 49A.12B.33C.06D.16[总结反思] (1)简单随机抽样满足:①抽取的个体数有限;②逐个抽取;③不放回抽取;④等可能抽取.(2)抽签法适用于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.式题假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋牛奶进行检测,利用随机数表抽样时,先将800袋牛奶按000,001,…,799进行编号,如果从下面随机数表第2行第7列开始向右读取,那么抽取检测的第5袋牛奶的编号为.8442 1753 3157 2455 0688 7704 7447 6721 7633 5025 8392 12066301 6378 5916 9556 6719 9810 5071 7512 8673 5807 4439 52383321 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966 0279探究点二系统抽样2 某学校高一、高二、高三年级学生人数分别为720,720,800,现从全校学生中随机抽取56人参加防火防灾问卷调查.先采用分层抽样方法确定各年级参加调查的人数,再在各年级内采用系统抽样方法确定参加调查的学生.若将高三年级的学生依次编号为001,002,…,800,则高三年级抽取的学生的编号不可能为()A.001,041,…,761B.031,071,…,791C.027,067,…,787D.055,095,…,795[总结反思] 解决系统抽样问题的两个关键步骤:(1)分组的方法应依据抽样比例而定,即根据定义每组抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.式题 (1)某种饮料每箱装6瓶,库存23箱未开封的饮料,现欲对这种饮料进行质量检测,工作人员需从中随机取出10瓶,若采用系统抽样法,则要剔除的饮料的瓶数是()A.2B.8C.6D.4(2)[2018·长沙长郡中学月考]某中学将参加摸底测试的1200名学生编号为1,2,3,…,1200,从中抽取一个容量为50的样本进行学习情况调查,按系统抽样的方法分为50组,如果第一组中抽出的学生编号为20,则第四组中抽取的学生编号为()A.68B.92C.82D.170探究点三分层抽样3 (1)某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为k∶5∶3,现用分层抽样方法抽出一个容量为120的样本,已知A种型号产品共抽取了24件,则抽取的C种型号产品件数为()A.24B.30C.36D.40(2)[2017·衡水中学二模]某学校为了解学生学习的情况,采用分层抽样的方法从高一年级的2400名学生、高二年级的2000名学生、高三年级的n名学生中,抽取90人进行问卷调查.已知高一年级被抽取的学生人数为36,那么高三年级被抽取的学生人数为()A.20B.24C.30D.32[总结反思] 进行分层抽样的相关计算时,常用到的两个关系:(1)=;(2)总体中某两层的个体数之比等于样本中这两层所抽取的个体数之比.式题 (1)为了调研雄安新区的空气质量状况,某课题组对雄县、容城、安新三县空气质量进行调查,按地域特点在三县内设置空气质量观测点.已知三县内观测点的个数分别为6,y,z,依次构成等差数列,且6,y,z+6成等比数列,若采用分层抽样的方法抽取12个观测点的数据,则应从容城抽取的观测点的数据个数为()A.8B.6C.4D.2(2)[2017·乌鲁木齐模拟]某高中有学生2000人,其中高一年级有760人,若从全校学生中随机抽出1人,抽到的学生是高二年级学生的概率为0.37,现采用分层抽样(按年级分层)方法在全校抽取20人,则应在高三年级中抽取的学生人数为.第65讲用样本估计总体课前双击巩固1.作频率分布直方图的步骤(1)求极差(即一组数据中与的差);(2)决定与;(3)将数据;(4)列;(5)画.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时增加,减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以记录,这对数据的记录和表示都能带来方便.4.样本的数字特征(1)众数、中位数、平均数=(2)标准差、方差①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s= .②方差:标准差的平方s 2.s 2=[(x 1-)2+(x 2-)2+…+(x n -)2],其中x i (i=1,2,3,…,n )是,n 是 ,是 .题组一 常识题1.[教材改编] 如图10-65-1是100位居民月均用水量的频率分布直方图,则月均用水量在[2,2.5)(单位:t)范围内的居民有 人.图10-65-12.[教材改编] 某赛季甲、乙两名篮球运动员每场比赛得分数据用茎叶图(如图10-65-2)表示,从茎叶图的分布情况看, 运动员的发挥更稳定.图10-65-23.[教材改编] 某射手在一次训练中五次射击的成绩(单位:环)分别为9.4,9.4,9.4,9.6,9.7,则该射手成绩的方差是 .4.[教材改编] 从某项综合能力测试中抽取100人的成绩,统计如下,则这100个成绩的平均数为 .题组二常错题◆索引:频率分布直方图与茎叶图中识图不清致误;中位数、平均数、众数的概念混淆不清致误;方差、平均数的统计意义不清楚致误.5.如图10-65-3所示的茎叶图记录了甲、乙两组各5名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x= ,y= .图10-65-36.如图10-65-4是某学校抽取的部分学生体重的频率分布直方图,已知图中从左到右的前3个分组的频率依次成等差数列,第2个分组的频数为10,则抽取的学生人数为.图10-65-47.甲、乙、丙三个班各有20名学生,一次数学考试后,三个班学生的成绩与人数统计如下:甲班成绩乙班成绩丙班成绩用s 1,s 2,s 3123的大小关系是 .课堂考点探究探究点一 频率分布直方图1 某手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性,300名男性)进行调查,使其对手机进行打分,得分的频数分布表如下:(1)完成如图10-65-5所示的频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);图10-65-5(2)根据评分的不同,利用分层抽样的方法从男性用户中抽取20名用户,在这20名用户中,从评分不低于80分的用户中任意抽取3名用户,求3名用户中评分小于90分的人数的分布列和数学期望.[总结反思] (1)绘制频率分布直方图时的两个注意点:①制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是,而不是频率.(2)由频率分布直方图进行相关计算时,需掌握的两个关系式:①×组距=频率;②=频率,此关系式的变形为=样本容量,样本容量×频率=频数.式题 [2017·淮北二模]交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念.记交通指数为T,其范围为[0,10],分别有5个级别:T∈[0,2)畅通;T∈[2,4)基本畅通;T∈[4,6)轻度拥堵;T∈[6,8)中度拥堵;T∈[8,10]严重拥堵.一般早高峰时段T≥3,从贵阳市交通指挥中心随机选取了早高峰时段二环以内50个交通路段,依据交通指数数据绘制的频率分布直方图如图10-65-6所示.(1)据此直方图估算T∈[4,8)时交通指数的中位数和平均数.(2)据此直方图求出早高峰时段二环以内的3个路段中至少有2个严重拥堵的概率.(3)某人上班路上所用时间:畅通时为20分钟,基本畅通时为30分钟,轻度拥堵时为35分钟,中度拥堵时为45分钟,严重拥堵时为60分钟.求此人早高峰时所用时间的数学期望.图10-65-6探究点二茎叶图2 “一带一路”经济带的发展规划已经得到了越来越多相关国家的重视和参与.某市顺潮流、乘东风,闻迅而动,决定利用旅游资源优势,撸起袖子大干一场.该市相关部门为了了解游客的情况,以便制定相应的策略,在某月中随机抽取甲、乙两个景点各10天的游客数,画出茎叶图如图10-65-7所示.(1)若景点甲中的数据的中位数是125,景点乙中的数据的平均数是124,求x,y的值;(2)若将图中景点甲中的数据作为该景点较长一段时期内的样本数据,今从这段时期中任取4天,记其中游客数超过120人的天数为ξ,求P(ξ≤2);(3)现从图中共20天的数据中任取2天的数据(甲、乙两景点中各取1天),记其中游客数不低于115人且不高于125人的天数为η,求η的分布列和数学期望.图10-65-7[总结反思] 使用茎叶图时的两个注意点:(1)观察所有的样本数据,弄清图中数字的特点,注意不要漏掉数据;(2)注意不要混淆茎叶图中茎与叶的含义.式题 (1)[2017·北京海淀区一模]《中国诗词大会》是中央电视台首档全民参与的诗词节目,节目以“赏中华诗词、寻文化基因、品生活之美”为基本宗旨,力求通过对诗词知识的比拼及赏析,带动全民重温那些曾经学过的古诗词,分享诗词之美,感受诗词之趣,从古人的智慧和情怀中汲取营养,涵养心灵.如图10-65-8是2016年《中国诗词大会》节目中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有()A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关图10-65-8(2)[2017·宜宾二诊]某生产车间的甲、乙两位工人生产同一种零件,这种零件的标准尺寸为85 mm,现分别从他们生产的零件中各随机抽取8件进行检测,其尺寸(单位:mm)用茎叶图表示如图10-65-9所示,则估计()A.甲、乙生产的零件尺寸的中位数相等B.甲、乙生产的零件质量相当C.甲生产的零件质量比乙生产的零件质量好D.乙生产的零件质量比甲生产的零件质量好图10-65-9探究点三样本数字特征3 [2017·蚌埠质检]某学校高一、高二、高三三个年级共有300名教师,为了调查他们的备课时间情况,通过分层抽样获得了20名教师一周的备课时间,统计数据如下表(单位:小时):(1)试估计该校高三年级的教师人数;(2)从高一年级和高二年级抽出的教师中,各随机选取一人,高一年级选出的人记为甲,高二年级选出的人记为乙,求该周甲的备课时间不比乙的备课时间长的概率;(3)再从高一、高二、高三三个年级中各随机抽取一名教师,他们该周的备课时间分别是8,9,10(单位: 小时),这三个数据与表格中的数据构成的新样本的平均数记为,表格中数据的平均数记为,试判断与的大小(结论不要求证明).[总结反思] 利用频率分布直方图估计样本数字特征的方法:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数.(2)平均数:平均数的估计值等于每个小矩形的面积乘矩形底边中点横坐标之和.(3)众数:最高的矩形底边中点的横坐标.式题 (1)[2017·广西贵港、玉林联考]随着人民生活水平的提高,对城市空气质量的关注度也逐渐增高,图10-65-10是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格空气,下面叙述不正确的是()图10-65-10A.1月至8月空气质量合格天数超过20天的月份有5个B.第二季度与第一季度相比,空气质量达标天数的比重下降了C.8月份是空气质量最好的一个月D.6月份的空气质量最差(2)[2017·佛山一模]本学期王老师任教高三(1)班、高三(2)班两个平行班,两个班都是50名学生,如图10-65-11反映的是两个班学生在本学期5次数学测试中班级平均分的对比,由图可知不正确的结论是 ()图10-65-11A.(1)班的数学成绩平均水平好于(2)班B.(2)班的数学成绩没有(1)班稳定C.下次考试(2)班的数学平均分要高于(1)班D.在第1次考试中,(1),(2)两个班的总平均分为98第66讲变量间的相关关系、统计案例课前双击巩固1.变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系;另一类是,与函数关系不同,是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为,点散布在从左上角到右下角的区域内,两个变量的相关关系为.2.两个变量的线性相关(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有,这条直线叫作.(2)回归方程为=x+,其中=,=-.(3)通过求Q=(y i-bx i-a)2的最小值而得到回归直线的方法,即使得样本数据的点到回归直线的距离的平方和最小,这一方法叫作最小二乘法.(4)相关系数:当r>0时,表明两个变量;当r<0时,表明两个变量.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0时,表明两个变量之间.通常|r|大于时,认为两个变量有很强的线性相关性.3.独立性检验假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:K2=(其中n=a+b+c+d为样本容量).题组一常识题1.[教材改编]下列关系中,属于相关关系的是.(填序号)①正方形的边长与面积;②农作物的产量与施肥量;③人的身高与眼睛近视的度数;④哥哥的数学成绩与弟弟的数学成绩.2.[教材改编]对变量x,y有观测数据(x i,y i)(i=1,2,…,10),得散点图如图10-66-1①;对变量u,v有观测数据(u i,v i)(i=1,2,…,10),得散点图如图②.由这两个散点图可以判断变量x与y, u与v .(填正相关、负相关或不相关)图10-66-13.[教材改编]某医疗机构通过抽样调查(样本容量n=1000),利用2×2列联表和K2统计量研究患肺病是否与吸烟有关.计算得K2的观测值k≈4.453,经查对临界值表知P(K2≥3.841)=0.05,现给出下列四个结论,其中正确的是.(填序号)①在100个吸烟的人中约有95个人患肺病;②若某人吸烟,则他有95%的可能性患肺病;③有95%的把握认为“患肺病与吸烟有关”;④只有5%的把握认为“患肺病与吸烟有关”.4.[教材改编]对具有线性相关关系的变量x和y,测得一组数据如下表所示.若已求得x与y之间的回归直线的斜率为6.5,则这条回归直线的方程为.题组二常错题◆索引:易混淆相关关系与函数关系;误认为样本数据必在回归直线上;利用回归方程分析问题时,所得的数据易误认为是准确值.5.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图10-66-2所示的人体脂肪含量与年龄关系的散点图.根据该图知,人体脂肪含量与年龄相关,且脂肪含量的中位数20%.图10-66-26.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为=0.85x-85.71,则下列结论中不正确的是.(填序号)①y与x具有正的线性相关关系;②回归直线过样本点的中心(,);③若该大学某女生身高增加1 cm,则其体重约增加0.85 kg;④若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg.7.某产品在某销售点的零售价x(单位:元)与每天的销售量y(单位:个)的统计数据如下表所示.由表中数据可得回归直线方程=x+中的=-5,根据模型预测零售价为20元时,每天的销售量约为个.课堂考点探究探究点一变量相关关系的判断1 (1)已知变量x和y满足关系=-0.1x+1,变量y与z正相关.下列结论中正确的是()A.x与y负相关,x与z负相关B.x与y正相关,x与z正相关C.x与y正相关,x与z负相关。
第一节算法与程序框图、基本算法语句[基础梳理]1.算法算法通常是指按照一定规则解决某一类问题的明确和有限的步骤.2.程序框图(1)程序框图的定义:程序框图又称流程图,是一种用程序框、流程线及文字说明来表示算法的图形.通常,程序框图由程序框和流程线组成,一个或几个程序框的组合表示算法中的一个步骤;流程线带有方向箭头,按照算法进行的顺序将程序框连接起来.(2)程序框图中图形符号的意义3.三种基本逻辑结构及相应语句1.三种基本逻辑结构的适用情境(1)顺序结构:要解决的问题不需要分类讨论.(2)条件结构:要解决的问题需要分类讨论.(3)循环结构:要解决的问题要进行许多重复的步骤,且这些步骤之间有相同的规律.2.循环结构的两个形式的区别(1)当型循环结构:先判断是否满足条件,若满足条件,则执行循环体.(2)直到型循环结构:先执行循环体,再判断是否满足条件,直到满足条件时结束循环.3.理解赋值语句要注意的三点(1)赋值语句中的“=”称为赋值号,与等号的意义不同.(2)赋值语句的左边只能是变量的名字,而不能是表达式.(3)对于同一个变量可以多次赋值,变量的值始终等于最近一次赋给它的值,先前的值将会被替换.[四基自测]1.某居民区的物业公司按月向居民收取卫生费,每月收费方法是:4人和4人以下的住户,每户收取6元;超过4人的住户,每超出1人加收1.1元,相应收费系统的程序框图如图所示,则①处应填( )A.y=6+1.1x B.y=15+1.1xC.y=6+1.1(x-4) D.y=15+1.1(x-4)答案:C2.如图所示的程序框图的运行结果是( )A.2 B.2.5C.3.5 D.4答案:B3.阅读下边的程序框图,运行相应的程序,则输出i的值为( )A.2 B.3C.4 D.5答案:C4.(2017·高考全国卷Ⅱ)执行如图所示的程序框图,如果输入的a=-1,则输出的S=( )A.2 B.3C.4 D.5答案:B高考总复习数学(文)第十章算法初步、统计、统计案例5.已知函数y=lg|x-3|,如图所示程序框图表示的是给定x值,求其相应函数值y的算法,请将该程序框图补充完整,其中①处应填_ _______,②处应填________.答案:x<3?y=lg(x-3)考点一求运行后的输出结果◄考基础——练透角度1 输出计算结果[例1] (1)(2016·高考全国卷Ⅲ)执行如图所示的程序框图,如果输入的a=4,b=6,那么输出的n=( )A.3 B.4C.5 D.6解析:运行程序框图,第1次循环,a=2,b=4,a=6,s=6,n=1;第2次循环,a=-2,b=6,a=4,s=10,n=2;第3次循环,a=2,b=4,a=6,s=16,n=3;第4次循环,a=-2,b=6,a=4,s=20,n=4,结束循环,故输出的n=4.答案:B(2)(2018·高考天津卷)阅读如图所示的程序框图,运行相应的程序,若输入N的值为20,则输出T的值为( )A.1 B.2C.3 D.4解析:输入N的值为20,第一次执行条件语句,N=20,i=2,Ni=10是整数,∴T=0+1=1,i=3<5;第二次执行条件语句,N=20,i=3,Ni =203不是整数,∴i=4<5;第三次执行条件语句,N=20,i=4,Ni=5是整数,∴T=1+1=2,i=5,此时i≥5成立,∴输出T=2.故选B.角度2 输出运算关系[例2]某流程图如图所示,现输入如下四个函数,则可以输出的函数是()A.f(x)=x2B.f(x)=|x| xC.f(x)=e x-e-x e x+e-xD.f(x)=1+sin x+cos x 1+sin x-cos x解析:由框图可知输出函数为奇函数且存在零点,依次判断各选项,A为偶函数,B不存在零点,不符合,对于C,由于f(-x)=e-x-e xe-x+e x=-f(x),即函数为奇函数,且存在零点为x=0,对于D,由于其定义域不关于原点对称,故其为非奇非偶函数,故选C.答案:C求程序框图运行结果的思路(1)要明确程序框图中的顺序结构、条件结构和循环结构.(2)要识别运行程序框图,理解框图所解决的实际问题.(3)按照题目的要求完成解答并验证.1.(2019·河北石家庄模拟)当n=4时,执行如图所示的程序框图,则输出的S值为( )A.9 B.15C.31 D.63解析:由程序框图可知,n=4,k=1,S=1,满足条件k≤4;执行循环体,S=3,k=2,满足条件k≤4;执行循环体,S=7,k=3,满足条件k≤4;执行循环体,S=15,k=4,满足条件k≤4;执行循环体,S=31,k=5,不满足条件k≤4,退出循环,输出S的值为31.故选C. 答案:C2.执行下面的程序框图,如果输入的x=0,y=1,n=1,则输出x,y的值满足( )A.y=2x B.y=3xC.y=4x D.y=5x解析:运行程序,第1次循环得x=0,y=1,n=2,第2次循环得x=12,y=2,n=3,第3次循环得x=32,y=6,此时x2+y2≥36,输出x,y,满足C选项.答案:C考点二求输入的值◄考能力——知法[例3] (1)(2017·高考全国卷Ⅲ)执行如图所示的程序框图,为使输出S的值小于91,则输入的正整数N的最小值为( )A.5 B.4C.3 D.2解析:S=0+100=100,M=-10,t=2,100>91;S=100-10=90,M=1,t=3,90<91,输出S,此时,t=3不满足t≤N,所以输入的正整数N的最小值为2,故选D.答案:D(2)《九章算术》是中国古代数学名著,体现了古代劳动人民的数学智慧,其中有一竹节容量问题,某老师根据这一问题的思想设计了如图所示的程序框图,若输出的m的值为35,则输入的a的值为( )A.4 B.5C.7 D.11解析:起始阶段有m=2a-3,i=1,第一次循环,m=2(2a-3)-3=4a-9,i=2;第二次循环,m=2(4a-9)-3=8a-21,i=3;第三次循环,m=2(8a-21)-3=16a-45,i=4;接着计算m=2(16a-45)-3=32a-93,跳出循环,输出m=32a-93,令32a-93=35,得a=4.答案:A(2019·湖南郴州模拟)秦九韶是我国南宋时期著名的数学家,普州(现四川省安岳县)人,他在所著的《数学九章》中提出的多项式求值的秦九韶算法,至今仍是比较先进的算法.如图所示的程序框图给出了利用秦九韶算法求某多项式值的一个实例,若输入x的值为3,每次输入a的值均为4,输出s的值为484,则输入n的值可为( )A .6B .5C .4D .3解析:模拟程序的运行,可得x =3,k =0,s =0,a =4,s =4,k =1,不满足条件k >n ;执行循环体,a =4,s =16,k =2,不满足条件k >n ;执行循环体,a =4,s =52,k =3,不满足条件k >n ;执行循环体,a =4,s =160,k =4,不满足条件k >n ;执行循环体,a =4,s =484,k =5,由题意,此时应该满足条件k >n ,退出循环,输出s 的值为484,可得5>n ≥4,所以输入n 的值可为4.故选C. 答案:C考点三 完善程序框图◄考基础——练透 [例4] (1)(2018·高考全国卷Ⅱ)为计算S =1-12+13-14+…+199-1100,设计了如图所示的程序框图,则在空白框中应填入( ) A .i =i +1B.i=i+2C.i=i+3D.i=i+4解析:把各循环变量在各次循环中的值用表格表示如下.,由上表知i是1→3→5,…,所以i=i+2.故选B.因为N=N+1i答案:B(2)(2017·高考全国卷Ⅰ)如图所示的程序框图是为了求出满足3n-2n>1 000的最小偶数n,那么在和两个空白框中,可以分别填入( )A.A>1 000和n=n+1B.A>1 000和n=n+2C.A≤1 000和n=n+1D.A≤1 000和n=n+2解析:程序框图中A=3n-2n,故判断框中应填入A≤1 000,由于初始值n=0,要求满足A=3n-2n>1 000的最小偶数,故执行框中应填入n=n+2,选D.答案:D解决此类问题,其关键点1.分两种循环直到型循环是“先循环,后判断,条件满足时终止循环”;当型循环则是“先判断,后循环,条件满足时执行循环”.两者的判断框内的条件表述在解决同一问题时是不同的,它们恰好相反.2.理清所用变量(1)计数变量:用来记录某个事件发生的次数,如i=i+1.(2)累加变量:用来计算数据之和,如S=S+i.(3)累乘变量:用来计算数据之积,如p=p×i.(2019·许昌调研)如图给出的是计算12+14+…+1100的值的一个程序框图,则图中判断框内(1)处和执行框中的(2)处应填的语句是( )A.i>100,n=n+1 B.i>100,n=n+2 C.i>50,n=n+2 D.i≤50,n=n+2解析:因为12,14,…,1100共50个数,所以算法框图应运行50次,所以变量i应满足i>50,因为是求偶数的和,所以执行框图n满足n=n+2.故选C.逻辑推理、直观想象——传统文化中的程序框图的应用[例1] (1)(2015·高考全国卷Ⅱ)下边程序框图的算法思路源于我国古代数学名著《九章算术》中的“更相减损术”.执行该程序框图,若输入的a,b分别为14,18,则输出的a=( )A.0 B.2C.4 D.14解析:开始:a=14,b=18.第一次循环:14≠18且14<18,b=18-14=4;第二次循环:14≠4且14>4,a=14-4=10;第三次循环:10≠4且10>4,a=10-4=6;第四次循环:6≠4且6>4,a=6-4=2;第五次循环:2≠4且2<4,b=4-2=2;第六次循环:a=b=2,退出循环,输出a=2,故选B.答案:B(2)(2016·高考全国卷Ⅱ)中国古代有计算多项式值的秦九韶算法,如图是实现该算法的程序框图.执行该程序框图,若输入的x=2,n=2,依次输入的a为2,2,5,则输出的s=( )A.7 B.12C.17 D.34解析:由程序框图知,第一次循环:x=2,n=2,a=2,s=0×2+2=2,k=1;第二次循环:a =2,s =2×2+2=6,k =2;第三次循环:a =5,s =6×2+5=17,k =3.结束循环,输出s 的值为17,故选C. 答案:C [例2] (1)(2019·湖北荆州七校2月联考)宋元时期数学名著《算学启蒙》中有关于“松竹并生”的问题:松长五尺,竹长两尺,松日自半,竹日自倍,松竹何日而长等.下图是源于其思想的一个程序框图,若输入的a ,b 分别为5,2,则输出的n =( )A .2 B.3 C.4 D.5解析:程序运行如下:n =1,a =5+52=152,b =4,a >b ,继续循环; n =2,a =152+12×152=454,b =8,a >b ,继续循环; n =3,a =454+12×454=1358,b =16,a >b ,继续循环;n=4,a=1358+12×1358=40516,b=32,此时,a<b.输出n=4,故选C.答案:C(2)(2019·河南开封模拟)我国古代名著《庄子·天下篇》中有一句名言“一尺之棰,日取其半,万世不竭”,其意思:一尺的木棍,每天截取一半,永远都截不完.现将该木棍依此规律截取,如图所示的程序框图的功能就是计算截取7天后所剩木棍的长度(单位:尺),则①②③处可分别填入的语句是( )A.i<7,s=s-1i,i=2iB.i≤7,s=s-1i,i=2iC.i<7,s=s2,i=i+1D.i≤7,s=s2,i=i+1解析:由题意可知第一天后剩下12,第二天后剩下122,……,由此得出第7天后剩下127,则①应为i≤7,②应为s=s2,③应为i=i+1,故选D.答案:D(3)秦九韶是我国南宋时期的数学家,普州(现四川省安岳县)人,他在所著的《数书九章》中提出的多项式求值的秦九韶算法,至今仍是比较先进的算法.如图所示的程序框图给出了利用秦九韶算法求某多项式值的一个实例,若输入n,x的值分别为4,3,则输出v的值为( )A.20B.61C.183D.548解析:初始值n,x的值分别为4,3,程序运行过程如下所示:v=1,i=3;v=1×3+3=6,i=2;v=6×3+2=20,i=1,v=20×3+1=61,i=0;v=61×3+0=183,i=-1;跳出循环,输出v的值为183,故选C.答案:C课时规范练A组基础对点练1.阅读如图所示的程序框图,运行相应的程序,则输出S的值为( )A.2 B.4C.6 D.8解析:第一次:S=8,n=2,第二次:S=2,n=3,第三次:S=4,n=4,满足n>3,输出S=4.答案:B2.阅读如图的程序框图,运行相应的程序,若输入N的值为19,则输出N的值为( )A.0 B.1C.2 D.3解析:阅读程序框图可得,程序执行过程如下:首先初始化数值为N=19,第一次循环:N=N-1=18,不满足N≤3;第二次循环:N =N 3=6,不满足N ≤3;第三次循环:N =N 3=2,满足N ≤3;此时跳出循环体,输出N =2.答案:C3.执行如图所示的程序框图,则输出的λ是( )A .-4B .-2C .0D .-2或0解析:依题意,若λa +b 与b 垂直,则有(λa +b )·b=4(λ+4)-2(-3λ-2)=0,解得λ=-2;若λa +b与b 平行,则有-2(λ+4)=4(-3λ-2),解得λ=0.结合题中的程序框图,输出的λ是-2.答案:B4.执行如图所示的程序框图,若输入的a ,b ,k 分别为1,2,3,则输出的M =( )A.203B.165C.72D.158解析:第一次循环:M =32,a =2,b =32,n =2;第二次循环:M =83,a =32,b =83,n =3;第三次循环:M =158,a =83,b =158,n =4.则输出的M =158,选D.答案:D5.执行如图所示的程序框图,如果输入的x ,t 均为2,则输出的S =( )A .4B .5C .6D .7解析:k =1≤2,执行第一次循环,M =11×2=2,S =2+3=5,k =1+1=2;k =2≤2,执行第二次循环,M =22×2=2,S =2+5=7,k =2+1=3;k=3>2,终止循环,输出S =7.故选D.答案:D6.阅读如图所示的程序框图,运行相应程序,则输出的i 的值为( )A.3 B.4C.5 D.6解析:第一次执行,i=1,a=2;第二次执行,i=2,a=5;第三次执行,i =3,a=16;第四次执行,i=4,a=65,此时满足条件a>50,跳出循环,故选B.答案:B7.执行如图所示的程序框图,如果输入的x的值是407,y的值是259,那么输出的x的值是( )A.2 849 B.37C.74 D.77解析:输入x的值是407,y的值是259,第一次循环后,S=148,x=259,y =148;第二次循环后,S=111,x=148,y=111;第三次循环后,S=37,x=111,y=37;第四次循环后,S=74,x=74,y=37;第五次循环后,S =37,x=37,y=37,结束循环,所以输出的x的值是37.故选B.答案:B8.(2019·临沂模拟)某程序框图如图所示,若判断框内是k≥n,且n∈N时,输出的S=57,则判断框内的n应为________.解析:由程序框图,可得:S=1,k=1;S=2×1+2=4,k=2;S=2×4+3=11,k=3;S=2×11+4=26,k=4;S=2×26+5=57,k=5.答案:5B组能力提升练9.执行如图所示的程序框图,如果输入的t∈[-1,3],则输出的s属于( )A.[-3,4] B.[-5,2]C.[-4,3] D.[-2,5]解析:作出分段函数s =⎩⎪⎨⎪⎧3t ,-1≤t <1,-t 2+4t ,1≤t ≤3的图象(图略),可知函数s 在[-1,2]上单调递增,在[2,3]上单调递减,∴t ∈[-1,3]时,s ∈[-3,4].答案:A10.(2019·郑州一中质检)执行如图所示的程序框图,若输出y =-3,则输入的θ=( )A.π6B .-π6 C.π3 D .-π3解析:对于A ,当θ=π6时,y =sin θ=sin π6=12,则输出y =12,不合题意;对于B ,当θ=-π6时, y =sin θ=sin(-π6)=-12,则输出y =-12,不合题意;对于C ,当θ=π3时,y=tan θ=tan π3=3,则输出y =3,不合题意;对于D ,当θ=-π3时,y =tan θ=tan(-π3)=-3,则输出y =-3,符合题意.故选D.答案:D11.执行如图所示的程序框图(算法流程图),输出的n 为________.解析:第一次执行循环体a =32,n =2;此时|a -1.414|=|1.5-1.414|=0.086>0.005;第二次执行循环体a =75,n =3;此时|a -1.414|=|1.4-1.414|=0.014>0.005;第三次执行循环体a =1712,n =4;此时|a -1.414|<0.005,此时不满足判断框内的条件,输出n =4.答案:412.阅读如图所示的程序框图,运行相应的程序,输出的结果S =________.解析:由程序框图知,S 可看成一个数列{a n }的前2 018项的和,其中a n =1n (n +1)(n ∈N *,n ≤2 018), ∴S =11×2+12×3+…+12 018×2 019=⎝⎛⎭⎪⎫1-12+ ⎝ ⎛⎭⎪⎫12-13+…+⎝ ⎛⎭⎪⎫12 018-12 019=1-12 019=2 0182 019. 答案:2 0182 019第二节随机抽样[基础梳理]1.简单随机抽样(1)定义:设一个总体含有N个个体.从中逐个不放回地抽取n个个体作为样本(n ≤N),如果每次抽取时总体内各个个体被抽到的机会都相等,就把这种抽样方法叫作简单随机抽样.(2)常用方法:抽签法和随机数法.2.系统抽样(1)定义:在抽样时,将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫作系统抽样(也称为机械抽样).(2)适用范围:适用于总体中的个数较多时.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)适用范围:适用于总体由差异明显的几部分组成时.1.一条规律三种抽样方法的共同点都是等概率不放回抽样.若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是nN.2.三种抽样方法的差异(1)简单随机抽样:总体容量较少,尤其是样本容量较少.(2)系统抽样:适用于元素个数很多且均衡的总体.(3)分层抽样:适用于总体由差异明显的几部分组成的情形.[四基自测]1.2019年4月13日,某中学初三650名学生参加了中考体育测试,为了了解这些学生的体考成绩,现从中抽取了50名学生的体考成绩进行了分析,以下说法正确的是( )A.这50名学生是总体的一个样本B.每位学生的体考成绩是个体C.50名学生是样本容量D.650名学生是总体答案:B2.某工厂生产A,B,C三种不同型号的产品,产品的数量之比依次为3∶4∶7,现在用分层抽样的方法抽出容量为n的样本,样本中A型号产品有15件,那么样本容量n为( )A.50 B.60C.70 D.80答案:C3.假设从高一年级全体同学(500人)中随机抽出60人参加一项活动,利用随机数法抽取样本时,先将500名同学按000,001,…,499进行编号,如果从随机数表第8行第11列的数开始,按三位数连续向右读取,最先抽出的5名同学的号码是(下面摘取了此随机数表第7行和第8行)( )84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 37859 16955 56719 98105 07175 12867 35807 44395 23879 A.455 068 047 447 176B.169 105 071 286 443C.050 358 074 439 332D.447 176 335 025 212答案:B4.设某校共有112名教师,为了支援西部教育事业,现要从中抽取12名组成暑期西部讲师团.若用系统抽样法,则抽样间隔和随机剔除的个体数分别为()A.9,4 B.12,3C.10,2 D.8,2答案:A5.(2018·高考全国卷Ⅲ)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.解析:因为客户数量大,且不同年龄段客户对其服务的评价有较大差异,所以最合适的抽样方法是分层抽样.答案:分层抽样考点一简单随机抽样◄考基础——练透[例1]下列抽样试验中,适合用抽签法的是()A.从某厂生产的5 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱18件)产品中抽取6件进行质量检验C.从甲、乙两厂生产的两箱(每箱18件)产品中抽取6件进行质量检验D.从某厂生产的5 000件产品中抽取10件进行质量检验解析:因为A,D中总体的个体数较大,不适合用抽签法;C中甲、乙两厂生产的产品质量可能差别较大,因此未达到搅拌均匀的条件,也不适合用抽签法;B中总体容量和样本容量都较小,且同厂生产的产品可视为搅拌均匀了.答案:B1.能否用简单随机抽样,要注意:(1)抽取的个体数较少.(2)是逐个抽取.(3)是不放回抽取.(4)是等可能抽取.只有四个特点都满足的抽才是简单随机抽样.2.抽签法与随机数表法的适用情况:(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,7 99进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号为________.答案:785,567,199,507,175考点二系统抽样◄考能力——知法[例2](1)(2019·石家庄模拟)某校为了解1 000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为( )A.16 B.17C.18 D.19解析:因为从1 000名学生中抽取一个容量为40的样本,所以系统抽样的分段间隔为1 00040=25,设第一组随机抽取的号码为x,则抽取的第18组编号为x+17×25=443,所以x=18.答案:C(2)(2019·中山模拟)为了检查某超市货架上的饮料是否含有塑化剂,要从编号依次为1到50的塑料瓶装饮料中抽取5瓶进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5瓶饮料的编号可能是( )A.5,10,15,20,25 B.2,4,8,16,32C.1,2,3,4,5 D.7,17,27,37,47解析:抽取5瓶,应将50瓶分5组.抽样间隔为505=10.答案:D1.系统抽样中所抽取编号的特点系统抽样又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.2.抽样间隔不是整数的处理策略系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.1.(2019·徐州模拟)从编号为0,1,2,…,79的80件产品中,采用系统抽样的方法抽取容量为5的一个样本,若编号为42的产品在样本中,则该样本中产品的最小编号为( ) A.8 B.10C.12 D.16解析:系统抽样的分段间隔为805=16,设样本中产品的最小编号是x,42是第三个编号,因此x+2×16=42,得x=10.答案:B2.(2019·成都模拟)将参加冬季越野跑的600名选手编号为:001,002,…,600,采用系统抽样方法抽取一个容量为50的样本,把编号分为50组后,在第一组的001到012这12个编号中随机抽得的号码为004,这600名选手穿着三种颜色的衣服,从001到301穿红色衣服,从302到496穿白色衣服,从497到600穿黄色衣服,则抽到穿白色衣服的选手人数为________.解析:由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k(k∈N*)组抽中的号码是4+12(k-1).令302≤4+12(k-1)≤496,得2556≤k≤42,因此抽到穿白色衣服的选手人数为42-25=17(人).答案:17考点三分层抽样◄考基础——练透[例3](1)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取的件数为________.解析:本题考查分层抽样方法及用样本估计总体.从丙种型号的产品中抽取的件数为60×300200+400+300+100=18.答案:18(2)某学校共有师生3200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.解析:本题属于分层抽样,设该学校的教师人数为x,所以1603 200=160-150x,所以x=200.答案:200分层抽样是针对样本的差异性明显,根据各层所占的比例进行抽样,其关键点为:(1)求抽样比,根据已知条件,求抽样比.(2)列方程,利用抽样比,建立关于所求参数的方程.(3)得结论,解方程,求出参数的值,即可得出结论.1.(2019·滨州模拟)某学校三个兴趣小组的学生人数分布如下表(每名学生只参加一个小组)(单位:人).学校要对这三个小组的活动效果进行抽样调查,按小组分层抽样的方法,从参加这三个兴趣小组的学生中抽取30人,结果篮球组被抽出12人,则a的值为____ ____.解析:由分层抽样知识,得12∶(45+15)=(30-12)∶(30+10+a+20),∴a=30.答案:302.(2019·昆明检测)某公司员工对户外运动分别持“喜欢”“不喜欢”和“一般”三种态度,其中持“一般”态度的比持“不喜欢”态度的多12人,按分层抽样方法从该公司全体员工中选出部分员工座谈户外运动,如果选出的人有6位对户外运动持“喜欢”态度,有1位对户外运动持“不喜欢”态度,有3位对户外运动持“一般”态度,那么这个公司全体员工中对户外运动持“喜欢”态度的有( )A.36人B.30人C.24人D.18人解析:设公司员工对户外运动持“喜欢”“不喜欢”“一般”态度的人数分别为6x,x,3x,由题意可得3x-x=12,x=6,所以对户外运动持“喜欢”态度的有6×6=36(人).答案:A数据分析、数学运算——抓阄问题中等可能性的学科素养(1)抽样方法的抓阄法,不分先后,每个个体被抽到的可能性是相同的.这体现了抽样的公平性.[例] 某手机在十一期间进行了促销活动,将参与的顾客甲等100位顾客的身份证号码写成了一百个阄,有5位嘉宾从中抽取一个阄为获奖人,则顾客甲在第一个人、第二个人……第五个人抽到的可能性相同吗?整个过程甲被抽到的概率是多少?解析:甲被第一个人抽到的概率为P1=1100,甲被第二个人抽到的概率P2=99100×199=1100,甲被三个人抽到的概率P 3=99100×9899×198=1100,甲被四个人抽到的概率P 4=99100×9899×9798×197=1100,甲被五个人抽到的概率P 5=99100×9899×9798×9697×196=1100,整个过程甲被抽到的概率P =1100×5=120.课时规范练A 组 基础对点练1.下列抽取样本的方式易用简单随机抽样的有( )①从无限多个个体中抽取50个个体作为样本;②箱子里有100支铅笔,今从中选取10支进行检验,在抽样操作时,从中任意拿出一支检测后再放回箱子里;③从50个个体中一次性抽取5个个体作为样本.A .0个B .1个C .2个D .3个解析:①不满足样本的总体数较少的特点;②不满足不放回抽取的特点;③不满足逐个抽取的特点.答案:A2.(1)某学校为了了解2018年高考数学学科的考试成绩,在高考后对1200名学生进行抽样调查,其中文科400名考生,理科600名考生,艺术和体育类考生共200名,从中抽取120名考生作为样本.(2)从30名家长中抽取5名参加座谈会.Ⅰ.简单随机抽样法 Ⅱ.系统抽样法 Ⅲ.分层抽样法问题与方法配对正确的是( )A .(1)Ⅲ,(2)ⅠB .(1)Ⅰ,(2)ⅡC .(1)Ⅱ,(2)ⅢD .(1)Ⅲ,(2)Ⅱ解析:通过分析可知,对于(1),应采用分层抽样法;对于(2),应采用简单随机抽样法.答案:A3.某学校为调查高三年级的240名学生完成课后作业所需的时间,采取了两种抽样调查方式:第一种由学生会的同学随机抽取24名同学进行调查;第二种由教务处对高三年级的学生进行编号,从001到240,抽取学号最后一位为3的同学进行调查,则这两种抽样方法依次为( )A.分层抽样,简单随机抽样B.简单随机抽样,分层抽样C.分层抽样,系统抽样D.简单随机抽样,系统抽样解析:由三种抽样方法的定义可知,题中第一种方法为简单随机抽样,第二种为系统抽样.答案:D4.对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3解析:根据抽样方法的概念可知,简单随机抽样、系统抽样和分层抽样三种抽样方法中每个个体被抽到的概率相等,均是n,故p1=p2=p3.N答案:D5.(2019·洛阳模拟)某大学数学系共有本科生1 000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为 ( )A.80 B.40C.60 D.20解析:因为要用分层抽样的方法从该系所有本科生中抽取一个容量为200的样本,一、二、三、四年级的学生比为4∶3∶2∶1,所以三年级要抽取的学生人数是24+3+2+1×200=40.答案:B6.高三某班有学生56人,现将所有同学随机编号,用系统抽样的方法,抽取一个容量为4的样本,已知5号、33号、47号学生在样本中,则样本中还有一个学生的编号为( ) A.13 B.17C.19 D.21解析:因为47-33=14,所以由系统抽样的定义可知样本中的另一个学生的编号为5+14=19.答案:C7.现有60瓶饮料,编号从1到60,若用系统抽样的方法从中抽取6瓶进行检验,则所抽取的编号可能为( )A.3,13,23,33,43,53B.2,14,26,38,40,52C.5,8,31,36,48,54D.5,10,15,20,25,30解析:A中所抽取的编号均匀分布在总体中,且间隔相等,故A正确;B中所抽取的编号间隔不相等,故B错误;C中所抽取的编号没有均匀分布在总体中,且间隔不相等,故C错误;D中所抽取的编号没有均匀分布在总体中,故D错误.答案:A8.利用简单随机抽样,从n个个体中抽取一个容量为10的样本,若第二次抽取时,余下的每个个体被抽到的概率为13,则在整个抽样过程中,每个个体被抽到的概率为( )。
单元检测十 算法、统计与统计案例(提升卷)考生注意:1.本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,共4页.2.答卷前,考生务必用蓝、黑色字迹的钢笔或圆珠笔将自己的姓名、班级、学号填写在相应位置上.3.本次考试时间100分钟,满分130分. 4.请在密封线内作答,保持试卷清洁完整.第Ⅰ卷(选择题 共60分)一、选择题(本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2018·上海十四校联考)若x 1,x 2,x 3,…,x 10的平均数为3,则3(x 1-2),3(x 2-2),3(x 3-2),…,3(x 10-2)的平均数为( ) A .3B .9C .18D .27 答案 A解析 由题意得x 1+x 2+x 3+…+x 10=30,所以3(x 1-2)+3(x 2-2)+3(x 3-2)+…+3(x 10-2)=3(x 1+x 2+x 3+…+x 10)-60=30,所以所求平均数3(x -2)=3010=3,故选A.2.(2018·青岛模拟)一个公司有8名员工,其中6位员工的月工资分别为5 200,5 300,5 500,6 100,6 500,6 600,另两位员工数据不清楚,那么8位员工月工资的中位数不可能是( ) A .5800B .6000C .6200D .6400 答案 D解析 由题意知,当另外两位员工的工资都小于5200时,中位数为(5300+5500)÷2=5400;当另外两位员工的工资都大于6600时,中位数为(6100+6500)÷2=6300,所以8位员工月工资的中位数的取值区间为[5 400,6 300],所以这8位员工月工资的中位数不可能是6400,故选D.3.若x 1,x 2,…,x 2019的平均数为3,标准差为4,且y i =-3(x i -2),i =1,2,…,2019,则新数据y 1,y 2,…,y 2019的平均数和标准差分别为( ) A .-9,12 B .-9,36 C .-3,36 D .-3,12答案 D解析 由平均数和标准差的性质可知,若x 1,x 2,x 3,…,x n 的平均数为x ,标准差为s ,则kx 1+b ,kx 2+b ,kx 3+b ,…,kx n +b 的平均数为k x +b ,标准差为|k |s ,据此结合题意可得y1,y2,…,y2019的平均数为-3(3-2)=-3,标准差为3×4=12,故选D.4.执行如图所示的程序框图,若输出的结果为1,则输入x的值为( )A.-2或-1或3 B.2或-2C.3或-1 D.3或-2答案 D解析由-2x-3=1 ,解得x=-2 ,因为-2>2 不成立,所以-2是输入的x的值;由log3(x2-2x)=1 ,即x2-2x=3,解得x=3或x=-1(舍去).综上,x的值为-2或3,故选D.5.(2018·济南模拟)中国诗词大会的播出引发了全民的读书热,某小学语文老师在班里开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图,若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱号者”的称号,根据该次比赛的成绩按照称号的不同进行分层抽样抽选10名学生,则抽选的学生中获得“诗词能手”称号的人数为( )A .2B .4C .5D .6 答案 B解析 由茎叶图得班里40名学生中,获得“诗词达人”称号的有8人,获得“诗词能手”称号的有16人,获得“诗词爱好者”称号的有16人,则由分层抽样的概念得选取的10名学生中,获得“诗词能手”称号的人数为10×1640=4,故选B.6.某市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛,他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86.若正实数a ,b 满足a ,G ,b 成等差数列,且x ,G ,y 成等比数列,则1a +4b的最小值为( )A.49B .2C.94D .9答案 C解析甲班学生成绩的中位数是80+x=81,解得x=1.由茎叶图可知乙班学生的总分为76+80×3+90×3+(0+2+y+1+3+6)=598+y,又乙班学生成绩的平均数是86,所以86×7=598+y,解得y=4.若正实数a,b满足a,G,b成等差数列,且x,G,y成等比数列,则2G=a+b,xy=G2,即有a+b=4,则1a+4b=14(a+b)·⎝⎛⎭⎪⎫1a+4b=14⎝⎛⎭⎪⎫1+4+ba+4ab≥14⎝⎛⎭⎪⎫5+2ba·4ab=14×9=94,当且仅当a=43,b=83时,取等号.故选C.7.某校九年级有400名学生,随机抽取了40名学生,测试1分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,用样本估计总体,下列结论正确的是( )A.该校九年级学生1分钟仰卧起坐的次数的中位数为25B.该校九年级学生1分钟仰卧起坐的次数的众数为24C.该校九年级学生1分钟仰卧起坐的次数超过30的人数约为80D.该校九年级学生1分钟仰卧起坐的次数少于20的人数约为8答案 C解析第一组数据的频率为0.02×5=0.1,第二组数据的频率为0.06×5=0.3,第三组数据的频率为0.08×5=0.4,所以中位数在第三组内,设中位数为25+x,则x×0.08=0.5-0.1-0.3=0.1,所以x=1.25,所以中位数为26.25,故A错误;最高矩形是第三组数据,第三组数据的中间值为27.5,所以众数为27.5,故B错误;学生1分钟仰卧起坐的成绩超过30次的频率为0.04×5=0.2,所以超过30次的人数为400×0.2=80,故C正确;学生1分钟仰卧起坐的成绩少于20次的频率为0.02×5=0.1,所以1分钟仰卧起坐的成绩少于20次的人数为400×0.1=40,故D错误.故选C.8.某程序框图如图所示,若输出S=3,则判断框中M为( )A.k<14?B.k≤14? C.k≤15? D.k>15? 答案 B解析由程序框图可知S=11+2+12+3+…+1k+k+1,因为1k+k+1=k+1-k,所以S=2-1+3-2+4-3+…+k+1-k=k+1-1,所以S=k+1-1=3,解得k=15,即当k=15时程序退出,故选B.9.某班一次测试成绩的茎叶图和频率分布直方图可见部分如图,根据图中的信息可确定被抽测的人数及分数在[90,100]内的人数分别为( )A.20,2B.24,4C.25,2D.25,4答案 C解析 由频率分布直方图可得分数在[50,60)内的频率是0.008×10=0.08,又由茎叶图可得分数在[50,60)内的频数是2,则被抽测的人数为20.08=25.又由频率分布直方图可得分数在[90,100]内的频率与分数在[50,60)内的频率相同,则频数也相同,都是2,故选C. 10.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用2×2列联表进行独立性检验,经计算K 2=6.705,则所得到的统计学结论是认为“学生性别与支持该活动没有关系”的把握是( )A.99.9%B .99%C .1%D .0.1% 答案 C解析 因为 6.635<6.705<10.828,所以有1%的把握认为“学生性别与支持该活动没有关系”,故选C.11.设某中学的高中女生体重y (单位:kg)与身高x (单位:cm)具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,3,…,n ),用最小二乘法近似得到线性回归方程为y ^=0.85x -85.71,则下列结论中不正确的是( ) A .y 与x 具有正线性相关关系 B .回归直线过样本点的中心(x ,y )C .若该中学某高中女生身高增加1cm ,则其体重约增加0.85kgD .若该中学某高中女生身高为160cm ,则可断定其体重必为50.29kg 答案 D解析 y 与x 具有正线性相关关系,A 正确;由线性回归方程的性质可知,B 正确;身高每增加1 cm ,体重约增加0.85 kg ,C 正确;某女生身高为160 cm ,则其身高约为50.29 kg ,D 错误,故选D.12.以下四个结论,正确的是( )①质检员从匀速传递的产品生产流水线上,每间隔10分钟抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②在频率分布直方图中,所有小矩形的面积之和为1;③在线性回归方程y ^=0.2x +12中,当变量x 每增加一个单位时,变量y 一定增加0.2个单位;④对于两个分类变量X 与Y ,求出其统计量K 2的观测值k ,观测值k 越大,我们认为“X 与Y有关系”的把握程度就越大. A .①④B.②③C.①③D.②④ 答案 D解析 对于①,易得这样的抽样为系统抽样,①错误;对于②,由频率分布直方图的概念易得②正确;对于③,由线性回归方程的概念易得变量y 约增加0.2个单位,③错误;对于④,由独立性检验易得④正确.综上所述,故选D.第Ⅱ卷(非选择题 共70分)二、填空题(本题共4小题,每小题5分,共20分.把答案填在题中横线上)13.下表是一个容量为10的样本数据分组后的频数分布.若利用组中值近似计算本组数据平均数x ,则x 的值为________.答案 19.7解析 由题意得平均数x =14×2+17×1+20×3+23×42+1+3+4=19.7.14.抽样统计甲、乙两名学生的5次训练成绩(单位:分),结果如下:则成绩较为稳定(方差较小)的那位学生成绩的方差为________. 答案 20解析 由数据可得甲的平均数是15(65+80+70+85+75)=75,方差为15[(65-75)2+(80-75)2+(70-75)2+(85-75)2+(75-75)2]=50,乙的平均数是15(80+70+75+80+70)=75,方差为15[(80-75)2+(70-75)2+(75-75)2+(80-75)2+(70-75)2]=20<50,故成绩较稳定的学生为乙,其方差为20.15.为了解某一段公路汽车通过时的车速情况,现随机抽测了通过这段公路的200辆汽车的时速,所得数据均在[40,80]中,其频率分布直方图如图所示,则在抽测的200辆汽车中,时速在[40,60)内的汽车有________辆.答案 80解析 由频率分布直方图可得时速在[40,60)内的频率为(0.01+0.03)×10=0.4,则时速在[40,60)内的汽车有0.4×200=80(辆).16.下列命题中,正确的命题是________.(写出所有正确命题的序号)①回归直线y ^=b ^x +a ^恒过样本点的中心(x ,y ),且至少过一个样本点; ②将一组数据的每个数据都加一个相同的常数后,方差不变; ③用R 2来刻画回归效果,R 2越接近0,说明回归的效果越好;④用系统抽样法从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为126,则第一组中用抽签法确定的号码为6. 答案 ②④解析 回归直线y ^=b ^x +a ^恒过样本点的中心(x ,y ),不一定过样本点,①错误;将一组数据的每个数据都加一个相同的常数后,数据的波动性不变,故方差不变,②正确;用R 2来刻画回归效果,R 2越接近1,说明回归的效果越好,③错误;④中系统抽样方法是正确的.故正确的命题有②④.三、解答题(本题共4小题,共50分.解答应写出文字说明、证明过程或演算步骤) 17.(12分)某网站针对“2019年法定节假日调休安排”提出的A ,B ,C 三种放假方案进行了问卷调查,调查结果如下:(1)从所有参与调查的人中,用分层抽样的方法抽取n 个人,已知从支持A 方案的人中抽取了6人,求n 的值;(2)从支持B 方案的人中,用分层抽样的方法抽取5人,这5人中在35岁以下的人数是多少?35岁以上(含35岁)的人数是多少? 解 (1)由题意知,6100+200=n200+400+800+100+100+400,解得n =40.(2)这5人中,35岁以下的人数为5400+100×400=4,35岁以上(含35岁)的人数为5400+100×100=1.18.(12分)每年的春节后,某市市政府都会发动公务员参与到植树活动中去.为保证树苗的质量,林管部门在植树前会对树苗进行检测,现从甲、乙两种树苗中各抽取了10株树苗,量出的高度如下(单位:厘米).甲:37,21,31,20,29,19,32,23,25,33; 乙:10,30,47,27,46,34,26,10,44,46.(1)根据量出的高度,完成茎叶图;(2)根据你填写的茎叶图,对甲、乙两种树苗的高度作比较,写出两个统计结论. 解 (1)茎叶图如图所示.(2)统计结论:①甲种树苗的平均高度小于乙种树苗的平均高度;②甲种树苗比乙种树苗长得更整齐;③甲种树苗高度的中位数为27,乙种树苗高度的中位数为32.19.(13分)某机构就是否支持发展共享单车随机调查了50人,他们年龄的分布及支持发展共享单车的人数统计如下表:由以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.1的前提下,认为年龄与是否支持发展共享单车有关系.参考数据:参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 根据所给数据得到如下2×2列联表:根据2×2列联表中的数据,得到K 2的观测值为 k =50×(30×5-10×5)2(30+10)(5+5)(30+5)(10+5)≈2.38<2.706. ∴不能在犯错误的概率不超过0.1的前提下,认为年龄与是否支持发展共享单车有关系. 20.(13分)某农科所对冬季昼夜温差x (℃)与某反季节新品种大豆种子的发芽数y (颗)之间的关系进行了分析研究,他们分别记录了12月1日至12月5日每天的昼夜温差与实验室每天每100颗种子的发芽数,得到的数据如下表所示:该农科所确定的研究方案是:先从这5组数据中选取3组求线性回归方程,剩下的2组数据用于线性回归方程的检验.(1)请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^; (2)若由线性回归方程得到的估计数据与所选的验证数据的误差不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得到的线性回归方程是否可靠?如果可靠,请预测温差为14℃时种子的发芽数;如果不可靠,请说明理由. 解 (1)由已知得x =11+13+123=12, y =25+30+263=27, 则b ^=52,a ^=y -b ^x =-3.所以y 关于x 的线性回归方程为y ^=52x -3.(2)当x =10时,y ^=52×10-3=22,|22-23|<2;当x =8时,y ^=52×8-3=17,|17-16|<2.所以(1)中所得到的线性回归方程是可靠的. 当x =14时,有y ^=52×14-3=32,即预测当温差为14℃时,每天每100颗种子的发芽数约为32颗.。
2020版高考数学大一轮复习第十章算法统计与统计案例10.1 算法与程序框图1.程序框图(1)通常用一些通用图形符号构成一张图来表示算法.这种图称做程序框图(简称框图).(2)基本的程序框图有起、止框、输入、输出框、处理框、判断框、流程线等图形符号和连接线构成.2.三种基本逻辑结构3.基本算法语句(1)赋值语句①概念:用来表明赋给某一个变量一个具体的确定值的语句.②一般格式:变量名=表达式.③作用:计算出赋值号右边表达式的值,把该值赋给赋值号左边的变量,使该变量的值等于表达式的值.(2)输入语句①概念:用来控制输入结构的语句.②一般格式:变量名=input.③作用:把程序和初始数据分开.(3)输出语句①概念:用来控制把求解结果在屏幕上显示(或打印)的语句.②一般格式:print(%io(2),表达式).③作用:将结果在屏幕上输出.(4)条件语句①处理条件分支逻辑结构的算法语句.②条件语句的格式及框图.a.if语句最简单的格式及对应的框图b.if语句的一般格式及对应的框图(5)循环语句①算法中的循环结构是由循环语句来实现的.②循环语句的格式及框图.a.for语句b.while语句概念方法微思考1.三种基本结构的共同点是什么?提示三种基本结构的共同点即只有一个入口和一个出口,每一个基本结构的每一部分都有机会被执行到,而且结构内不存在死循环.2.赋值语句“变量=表达式”中,左右能否交换?提示赋值语句左右不能对换,赋值语句是将赋值号右边的表达式的值赋给赋值号左边的变量,如Y=x,表示用x的值替代变量Y的原先的取值,不能改写为x=Y,因为后者表示用Y 的值替代变量x原先的值.3.条件分支结构能否同时执行“是”分支和“否”分支?提示不能.条件分支结构无论判断条件是否成立,只能执行“是”分支或“否”分支之一,不可能同时执行,也不可能都不执行.题组一思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)算法只能解决一个问题,不能重复使用.( ×)(2)程序框图中的图形符号可以由个人来确定.( ×)(3)输入框只能紧接开始框,输出框只能紧接结束框.( ×)(4)条件分支结构中判断框的出口有两个,但在执行时,只有一个出口是有效的.( √ ) (5)5=x 是赋值语句.( × )(6)输入语句可以同时给多个变量赋值.( √ ) 题组二 教材改编2.执行如图所示的程序框图,则输出S 的值为( )A.-32B.32C.-12D.12答案 D解析 按照程序框图依次循环运算,当k =5时,停止循环,当k =5时,S =sin 5π6=12. 3.如图为计算y =|x |函数值的程序框图,则此程序框图中的判断框内应填.答案 x <0解析 输入x 应判断x 是否大于等于零,由图知判断框应填x <0?. 题组三 易错自纠4.中国古代有计算多项式值的秦九韶算法,如图是实现该算法的程序框图,执行该程序框图,若输入的x =2,n =2,依次输入的a 为2,2,5,则输出的s 等于( )A.7B.12C.17D.34 答案 C解析 由框图可知,输入x =2,n =2,a =2,s =2,k =1,不满足条件;a =2,s =4+2=6,k =2,不满足条件;a =5,s =12+5=17,k =3,满足条件,输出s =17,故选C.5.执行如图所示的程序框图,若输出k 的值为8,则判断框内可填入的条件是( )A.s ≤34B.s ≤56C.s ≤1112D.s ≤2524答案 C解析 由s =0,k =0满足条件,则k =2,s =12,满足条件;k =4,s =12+14=34,满足条件;k =6,s =34+16=1112,满足条件;k =8,s =1112+18=2524,不满足条件,输出k =8,所以应填“s ≤1112”.6.运行如图所示的程序框图,若输出的y 值的范围是[0,10],则输入的x 值的范围是.答案 [-7,9]解析 该程序的功能是计算分段函数的值, y =⎩⎪⎨⎪⎧3-x ,x <-1,x 2,-1≤x ≤1,x +1,x >1.当x <-1时,由0≤3-x ≤10可得-7≤x <-1; 当-1≤x ≤1时,0≤x 2≤10恒成立; 当x >1时,由0≤x +1≤10可得1<x ≤9. 综上,输入的x 值的范围是[-7,9].题型一 顺序结构和条件分支结构命题点1 顺序结构例1阅读如图所示程序框图.若输入x 为3,则输出的y 的值为( )A.24B.25C.30D.40 答案 D命题点2 条件分支结构例2如图所示的程序框图,其作用是输入x 的值,输出相应的y 值,若x =y ,则这样的x 的值有( )A.1个B.2个C.3个D.4个 答案 C解析 当x ≤2时,令y =x 2=x ⇒x (x -1)=0, 解得x =0或x =1;当2<x ≤5时,令y =2x -4=x ⇒x =4; 当x >5时,令y =1x=x ,无解.综上可得,这样的x 的值有3个.思维升华应用顺序结构与条件分支结构的注意点(1)顺序结构:顺序结构是最简单的算法结构,语句与语句之间、框与框之间是按从上到下的顺序进行的.(2)条件分支结构:利用条件分支结构解决算法问题时,重点是判断框,判断框内的条件不同,对应的下一程序框中的内容和操作要相应地进行变化,故要重点分析判断框内的条件是否满足. 跟踪训练1(1)阅读如图所示的程序框图,若输入的a ,b ,c 的值分别为14,6,20,则输出的a ,b ,c 的值分别是.答案 20,14,6(2)执行如图所示的程序框图,若输出y =-3,则输入的θ等于( )A.π6B.-π6C.π3D.-π3答案 D解析 对于A ,当θ=π6时,y =sin θ=sin π6=12,则输出y =12,不合题意;对于B ,当θ=-π6时,y =sin θ=sin ⎝ ⎛⎭⎪⎫-π6=-12, 则输出y =-12,不合题意;对于C ,当θ=π3时,y =tan θ=tan π3=3,则输出y =3,不合题意;对于D ,当θ=-π3时,y =tan θ=tan ⎝ ⎛⎭⎪⎫-π3=-3, 则输出y =-3,符合题意.题型二 循环结构命题点1 由程序框图求输出结果例3(2017·全国Ⅱ)执行如图所示的程序框图,如果输入的a =-1,则输出的S 等于( )A.2B.3C.4D.5答案 B解析当K=1时,S=0+(-1)×1=-1,a=1,执行K=K+1后,K=2;当K=2时,S=-1+1×2=1,a=-1,执行K=K+1后,K=3;当K=3时,S=1+(-1)×3=-2,a=1,执行K=K+1后,K=4;当K=4时,S=-2+1×4=2,a=-1,执行K=K+1后,K=5;当K=5时,S=2+(-1)×5=-3,a=1,执行K=K+1后,K=6;当K=6时,S=-3+1×6=3,执行K=K+1后,K=7>6,输出S=3.结束循环.故选B.命题点2 完善程序框图例4(2017·全国Ⅰ)如图所示的程序框图是为了求出满足3n-2n>1000的最小偶数n,那么在◇和▭两个空白框中,可以分别填入( )A.A>1000和n=n+1B.A>1000和n=n+2C.A≤1000和n=n+1D.A≤1000和n=n+2答案 D解析因为题目要求的是“满足3n-2n>1000的最小偶数n”,所以n的叠加值为2,所以▭内填入“n=n+2”.由程序框图知,当◇内的条件不满足时,输出n,所以◇内填入“A≤1 000”.故选D.命题点3 辨析程序框图的功能例5(2018·大连联考)如果执行如图的程序框图,输入正整数N (N ≥2)和实数a 1,a 2,…,a N ,输出A ,B ,则( )A.A +B 为a 1,a 2,…,a N 的和B.A +B2为a 1,a 2,…,a N 的算术平均数C.A 和B 分别是a 1,a 2,…,a N 中最大的数和最小的数D.A 和B 分别是a 1,a 2,…,a N 中最小的数和最大的数 答案 C解析 不妨令N =3,a 1<a 2<a 3, 则有k =1,x =a 1,A =a 1,B =a 1;k =2,x =a 2,A =a 2; k =3,x =a 3,A =a 3,故输出A =a 3,B =a 1,故选C.思维升华 (1)已知程序框图,求输出的结果,可按程序框图的流程依次执行,最后得出结果. (2)完善程序框图问题,结合初始条件和输出结果,分析控制循环的变量应满足的条件或累加、累乘的变量的表达式.跟踪训练2(1)(2017·山东)执行两次如图所示的程序框图,若第一次输入的x 的值为7,第二次输入的x 的值为9,则第一次、第二次输出的a 的值分别为( )A.0,0B.1,1C.0,1D.1,0答案 D解析 当x =7时,∵b =2,∴b 2=4<7=x . 又7不能被2整除,∴b =2+1=3.此时b 2=9>7=x ,∴退出循环,a =1,∴输出a =1. 当x =9时,∵b =2,∴b 2=4<9=x . 又9不能被2整除,∴b =2+1=3.此时b 2=9=x ,又9能被3整除,∴退出循环,a =0. ∴输出a =0. 故选D.(2)如图是计算1+13+15+…+131的值的程序框图,则图中①②处应填写的语句分别是( )A.n =n +2,i >16B.n =n +2,i ≥16C.n =n +1,i >16D.n =n +1,i ≥16答案 A解析 式子1+13+15+…+131中所有项的分母构成首项为1,公差为2的等差数列.由31=1+(k -1)×2,得k =16,即数列共有16项.1.古代著名数学典籍《九章算术》在“商功”篇章中有这样的描述:“今有圆亭,下周三丈,上周二丈,问积几何?”其中“圆亭”指的是正圆台体形建筑物.算法为:“上下底面周长相乘,加上底面周长自乘、下底面周长自乘的和,再乘以高,最后除以36.”可以用程序框图写出它的算法,如图,今有圆亭上底面周长为6,下底面周长为12,高为3,则它的体积为( )A.32B.29C.27D.21 答案 D解析 由题意可得a =6,b =12,h =3, 可得A =3×(6×6+12×12+6×12)=756,V =75636=21. 故程序输出V 的值为21.2.执行如图所示的程序框图,输出的S 值为( )A.4B.9C.16D.21答案 B解析模拟程序的运行,可得n=1,S=0;执行循环体,S=1,n=3;不满足条件n>6,执行循环体,S=4,n=5;不满足条件n>6,执行循环体,S=9,n=7;此时,满足条件n>6,退出循环,输出S的值为9.3.运行如图所示的程序框图,若输出的s的值为-21,则判断框中可以填( )A.a<64B.a≤64C.a<128D.a≤128答案 A解析运行程序如下:a=1,s=0,s=1,a=-2,s=1-2,a=4,s=1-2+4,a=-8,s=1-2+4-8,a=16,S=1-2+4-8+16,a=-32,s=1-2+4-8+16-32=-21,a=64.4.相传黄帝时代,在制定乐律时,用“三分损益”的方法得到不同的竹管,吹出不同的音调.“三分损益”包含“三分损一”和“三分益一”,用现代数学的方法解释如下,“三分损一”是在原来的长度减去一分,即变为原来的三分之二;“三分益一”是在原来的长度增加一分,即变为原来的三分之四,如图的程序是与“三分损益”结合的计算过程,若输入的x 的值为1,输出的x的值为( )A.1627B.3227C.89D.23 答案 B解析 因为x =1⇒x =23,i =2⇒x =89,i =3⇒x =3227,i =4,结束循环,输出结果x =3227,故选B.5.根据某校10位高一同学的身高(单位:cm)画出茎叶图(图1),其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,设计一个程序框图(图2),用A i (i =1,2,…,10)表示第i 个同学的身高,计算这些同学身高的方差,则程序框图①中要补充的语句是( )A.B =B +A iB.B =B +A 2i C.B =(B +A i -A )2D.B =B 2+A 2i答案 B解析 由s 2=(x 1-x )2+(x 2-x )2+…+(x n -x )2n=x 21+x 22+…+x 2n -2(x 1+x 2+…+x n )x +n x2n=x 21+x 22+…+x 2n -2n x 2+n x2n=x 21+x 22+…+x 2n n-x 2,循环退出时i =11,知x 2=⎝ ⎛⎭⎪⎫A i -12.∴B =A 21+A 22+…+A 210,故程序框图①中要补充的语句是B =B +A 2i .6.我国古代数学著作《孙子算经》中有这样一道算术题:“今有物不知其数,三三数之剩一,五五数之剩三,七七数之剩六,问物几何?”人们把此类题目称为“中国剩余定理”.若正整数N 除以正整数m 后的余数为n ,则记为N ≡n (mod m ),例如10≡2(mod4).现将该问题以程序框图给出,执行该程序框图,则输出的n 等于( )A.13B.11C.15D.8 答案 A解析 ①n =9,9≡0(mod3),②n =10,10≡1(mod3),10≡0(mod5), ③n =11,11≡2(mod3), ④n =12,12≡0(mod3),⑤n =13,13≡1(mod3),13≡3(mod5), 所以输出n 的值为13,故选A. 7.如图所示,程序框图的功能是( )A.求⎩⎨⎧⎭⎬⎫1n 的前10项和B.求⎩⎨⎧⎭⎬⎫12n 的前10项和C.求⎩⎨⎧⎭⎬⎫1n 的前11项和D.求⎩⎨⎧⎭⎬⎫12n 的前11项和答案 B解析 运行程序如下:S =0+12,n =4,k =2,S =0+12+14,n =6,k =3,…, S =0+12+14+…+120,n =22,k =11,所以该程序求得是⎩⎨⎧⎭⎬⎫12n 的前10项和.8.如图1,一块黄铜板上插着三根宝石针,在其中一根针上从下到上穿好由大到小的若干金片.若按照下面的法则移动这些金片:每次只能移动一片金片;每次移动的金片必须套在某根针上;大片不能叠在小片上面.设移完n 片金片总共需要的次数为a n ,可推得a n +1=2a n +1.如图2是求移动次数的程序框图模型,则输出的结果是( )A.1022B.1023C.1024D.1025答案 B解析 记n 个金属片从2号针移动到3号针最少需要a n 次; 则根据算法思想有:S =1; 第一次循环,S =3; 第二次循环,S =7; 第三次循环,S =15, …,第九次循环S =1023,S >1000,输出S =1023,故选B.9.运行如图所示的框图对应的程序,输出的结果为________.答案 19解析 第一次循环:S =9>1,S =1,k =2, 第二次循环:S =19,k =4,第三次循环:S =13,k =8,第四次循环:S =1,k =16, 第五次循环:S =19,k =32,第六次循环:S =13,k =64,第七次循环:S =1,k =128, 第八次循环:S =19,k =256,第九次循环:S =13,k =512,第十次循环:S =1,k =1024,第十一次循环:S =19,k =2048>2019,输出S =19.10.执行如图所示的程序框图,若输入的a ,b 的值分别为0和9,则输出的i 的值为.答案 3解析 第1次循环:i =1,a =1,b =8,a <b ; 第2次循环:i =2,a =3,b =6,a <b ;第3次循环:i =3,a =6,b =3,a >b ,输出i 的值为3.11.执行如图所示的程序框图,如果输出S =3,那么判断框内应填入的条件是.答案 k ≤7解析 首次进入循环体,S =1×log 23,k =3;第二次进入循环体,S =lg3lg2×lg4lg3=2,k =4;依次循环,第六次进入循环体,S =3,k =8, 此时结束循环,则判断框内填k ≤7.12.设a 是一个各位数字都不是0且没有重复数字的三位数.将组成a 的3个数字按从小到大排成的三位数记为I (a ),按从大到小排成的三位数记为D (a )(例如a =815,则I (a )=158,D (a )=851).阅读如图所示的程序框图,运行相应的程序,任意输入一个a ,输出的结果b =.答案 495解析 取a 1=815,则b 1=851-158=693≠815, 则a 2=693;由a 2=693知b 2=963-369=594≠693,则a 3=594; 由a 3=594知b 3=954-459=495≠594,则a 4=495; 由a 4=495知b 4=954-459=495=a 4,则输出b =495.13.(2018·大连模拟)关于函数f (x )=⎩⎪⎨⎪⎧-x ,1<x ≤4,cos x ,-1≤x ≤1的程序框图如图所示,现输入区间[a ,b ],则输出的区间是.答案 [0,1]解析 由程序框图的第一个判断条件为f (x )>0,当f (x )=cos x ,x ∈[-1,1]时满足.然后进入第二个判断框,需要解不等式f ′(x )=-sin x ≤0,即0≤x ≤1.故输出区间为[0,1]. 14.(2018·沈阳质检)我国南北朝时期的数学家张丘建是世界数学史上解决不定方程的第一人,他在《张丘建算经》中给出一个解不定方程的百鸡问题,问题如下:鸡翁一,值钱五,鸡母一,值钱三,鸡雏三,值钱一.百钱买百鸡,问鸡翁母雏各几何?用代数方法表述为:设鸡翁、鸡母、鸡雏的数量分别为x ,y ,z ,则鸡翁、鸡母、鸡雏的数量即为方程组⎩⎪⎨⎪⎧5x +3y +z 3=100,x +y +z =100的解.其解题过程可用程序框图表示,如图所示,则程序框图中正整数m 的值为.答案 4解析 由⎩⎪⎨⎪⎧5x +3y +z 3=100,x +y +z =100,得y =25-74x ,故x 必为4的倍数, 当x =4t 时,y =25-7t ,由y =25-7t >0得,t 的最大值为3, 故判断框应填入的是t <4, 即m =4.15.执行如图所示的程序框图,如果输入的x ,y ∈R ,那么输出的S 的最大值为.答案 4解析 当条件x ≥0,y ≥0,x +y ≤2不成立时输出S 的值为1;当条件x ≥0,y ≥0,x +y ≤2成立时S =2x +y ,作出不等式组⎩⎪⎨⎪⎧x ≥0,y ≥0,x +y ≤2表示的平面区域如图中阴影部分(含边界),由图可知当直线S =2x +y 经过点M (2,0)时S 最大,其最大值为2×2+0=4,故输出S 的最大值为4.16.已知函数f (x )=ax 3+12x 2在x =-1处取得极大值,记g (x )=1f ′(x ).程序框图如图所示,若输出的结果S >20182019,则判断框中可以填入的关于n 的判断条件是.(填序号)①n ≤2019 ②n ≤2018 ③n >2019 ④n >2018答案 ①解析 由题意得f ′(x )=3ax 2+x ,由f ′(-1)=0, 得a =13,∴f ′(x )=x 2+x ,即g (x )=1x 2+x =1x (x +1)=1x -1x +1. 由程序框图可知S =0+g (1)+g (2)+…+g (n ) =0+1-12+12-13+…+1n -1n +1=1-1n +1,由1-1n +1>20182019,得n >2018. 故可填入①.2020版高考数学大一轮复习第十章算法统计与统计案例§10.2 随机抽样1.简单随机抽样(1)定义:从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数表法.2.系统抽样(1)定义:当总体数量很大时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样.(2)系统抽样适用于大规模的抽样调查,由于抽样的间隔相等,因此系统抽样也被称作等距抽样.3.分层抽样(1)分层抽样的定义:在抽样时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体由有明显差别的几个部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样.概念方法微思考三种抽样方法有什么共同点和联系?提示(1)抽样过程中每个个体被抽取的机会均等.(2)系统抽样中在起始部分抽样时采用简单随机抽样;分层抽样中各层抽样时采用简单随机抽样或系统抽样.题组一思考辨析1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)简单随机抽样是一种不放回抽样.( √)(2)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( ×)(3)抽签法中,先抽的人抽中的可能性大.( ×)(4)系统抽样在第1段抽样时采用简单随机抽样.( √)(5)要从1002个学生中用系统抽样的方法选取一个容量为20的样本,需要剔除2个学生,这样对被剔除者不公平.( ×)(6)分层抽样中,每个个体被抽到的可能性与层数及分层有关.( ×)题组二教材改编2.在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5 000名居民的阅读时间的全体是( )A.总体B.个体C.样本的容量D.从总体中抽取的一个样本答案 A解析由题目条件知,5000名居民的阅读时间的全体是总体;其中1名居民的阅读时间是个体;从5000名居民某天的阅读时间中抽取的200名居民的阅读时间是从总体中抽取的一个样本,样本容量是200.3.某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为( )A.33,34,33B.25,56,19C.20,40,30D.30,50,20答案 B解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为25,56,19.4.某班共有52人,现根据学生的学号,用系统抽样的方法,抽取一个容量为4的样本,已知3号,29号,42号学生在样本中,那么样本中还有一个学生的学号是( )A.10B.11C.12D.16答案 D解析从被抽中的3名学生的学号中可以看出学号间距为13,所以样本中还有一个学生的学号是16,故选D.题组三易错自纠5.从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是( ) A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,6,16,32答案 B解析间隔距离为10,故可能的编号是3,13,23,33,43.6.从300名学生(其中男生180人,女生120人)中按性别用分层抽样的方法抽取50人参加比赛,则应该抽取的男生人数为________.答案30解析因为男生与女生的比例为180∶120=3∶2,所以应该抽取的男生人数为50×33+2=30.题型一简单随机抽样例1(1)某班级有男生20人,女生30人,从中抽取10人作为样本,其中一次抽样结果是:抽到了4名男生,6名女生,则下列命题正确的是( )A.这次抽样中可能采用的是简单随机抽样B.这次抽样一定没有采用系统抽样C.这次抽样中每个女生被抽到的概率大于每个男生被抽到的概率D.这次抽样中每个女生被抽到的概率小于每个男生被抽到的概率答案 A解析利用排除法求解.这次抽样可能采用的是简单随机抽样,A正确;这次抽样可能采用系统抽样,男生编号为1~20,女生编号为21~50,间隔为5,依次抽取1号,6号,…,46号便可,B错误;这次抽样中每个女生被抽到的概率等于每个男生被抽到的概率,C和D均错误.(2)福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球的号码为( )A.12B.33C.06D.16答案 C解析被选中的红色球的号码依次为17,12,33,06,32,22.所以第四个被选中的红色球的号码为06.思维升华应用简单随机抽样应注意的问题(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(2)在使用随机数表法时,如遇到三位数或四位数,可从选择的随机数表中的某行某列的数字计起,每三个或四个作为一个单位,自左向右选取,将超过总体号码或出现重复号码的数字舍去.跟踪训练1(1)在简单随机抽样中,某一个个体被抽到的可能性( )A.与第n次有关,第一次可能性最大B.与第n次有关,第一次可能性最小C.与第n次无关,与抽取的第n个样本有关D.与第n次无关,每次可能性相等答案 D解析∵在简单随机抽样中,每个个体被抽到可能性都相等,与第n次无关,∴D正确.(2)总体由编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( )A.08B.07C.02D.01答案 D解析由题意知前5个个体的编号为08,02,14,07,01.题型二系统抽样例2(1)利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽取一个容量为16的样本,如果抽出的产品中有一个产品的编号为13,则抽到产品的最大编号为( ) A.73B.78C.77D.76 答案 B解析 样本的分段间隔为8016=5,所以13号在第三组,则最大的编号为13+(16-3)×5=78.(2)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A.11B.12C.13D.14 答案 B解析 由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. 引申探究1.若本例(2)中条件不变,若号码“5”被抽到,那么号码“55”________被抽到.(填“能”或“不能”) 答案 不能解析 若55被抽到,则55=5+20n ,n =2.5,n 不是整数.故不能被抽到.2.若本例(2)中条件不变,若在编号为[481,720]中抽取8人,则样本容量为________. 答案 28解析 因为在编号[481,720]中共有720-480=240人,又在[481,720]中抽取8人, 所以抽样比应为240∶8=30∶1,又因为单位职工共有840人,所以应抽取的样本容量为84030=28.思维升华 (1)系统抽样适用的条件是总体容量较大,样本容量也较大.(2)使用系统抽样时,若总体容量不能被样本容量整除,可以先从总体中随机地剔除几个个体,从而确定分段间隔.(3)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定. 跟踪训练2将参加夏令营的600名学生按001,002,…,600进行编号.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分别住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,则三个营区被抽中的人数依次为( ) A.26,16,8 B.25,17,8 C.25,16,9 D.24,17,9答案 B解析 由题意及系统抽样的定义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N +)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此第Ⅰ营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此第Ⅱ营区被抽中的人数是42-25=17;第Ⅲ营区被抽中的人数为50-25-17=8.题型三 分层抽样命题点1 求总体或样本容量例3(1)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n 等于( ) A.9B.10C.12D.13 答案 D解析 ∵360=n120+80+60,∴n =13.(2)某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n 的样本,其中甲种产品有18件,则样本容量n 等于( ) A.54B.90C.45D.126 答案 B解析 依题意得33+5+7×n =18,解得n =90,即样本容量为90.命题点2 求某层入样的个体数例4(1)某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:电视台为了了解观众的具体想法和意见,打算从中抽取100人进行详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽取的人数分别为( ) A.25,25,25,25B.48,72,64,16C.20,40,30,10D.24,36,32,8答案 D解析 方法一 因为抽样比为10020000=1200,所以每类人中应抽取的人数分别为4800×1200=24,7200×1200=36,6400×1200=32,1600×1200=8.方法二 最喜爱、喜爱、一般、不喜欢的比例为4800∶7200∶6400∶1600=6∶9∶8∶2, 所以每类人中应抽取的人数分别为66+9+8+2×100=24,96+9+8+2×100=36,86+9+8+2×100=32,26+9+8+2×100=8.(2)我国古代数学专著《九章算术》中有一衰分问题:今有北乡八千一百人,西乡七千四百八十八人,南乡六千九百一十二人,凡三乡,发役三百人,则北乡遣( ) A.104人 B.108人 C.112人 D.120人答案 B解析 由题意可知,这是一个分层抽样的问题,其中北乡可抽取的人数为300×81008100+7488+6912=300×810022500=108,故选B.思维升华分层抽样问题类型及解题思路(1)求某层应抽个体数量:按该层所占总体的比例计算.(2)已知某层个体数量,求总体容量或反之:根据分层抽样就是按比例抽样,列比例式进行计算.(3)确定是否应用分层抽样:分层抽样适用于总体中个体差异较大的情况.跟踪训练3(1)某校为了了解学生学习的情况,采用分层抽样的方法从高一1000人,高二1200人,高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n 等于( ) A.860 B.720 C.1020 D.1040答案 D解析 分层抽样是按比例抽样的, 所以81×12001000+1200+n =30,解得n =1040.(2)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件,为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取________件. 答案 18解析 ∵样本容量总体个数=60200+400+300+100=350,∴应从丙种型号的产品中抽取350×300=18(件).1.某工厂平均每天生产某种机器零件10000件,要求产品检验员每天抽取50件零件,检查其质量状况,采用系统抽样方法抽取,将零件编号为0000,0001,0002,…,9999,若抽取的第一组中的号码为0010,则第三组抽取的号码为( ) A.0210 B.0410 C.0610 D.0810答案 B解析 将零件分成50段,分段间隔为200,因此,第三组抽取的号码为0010+2×200=0410,故选B.2.打桥牌时,将洗好的扑克牌(52张)随机确定一张为起始牌后,开始按次序搬牌,对任何一家来说,都是从52张总体中抽取一个13张的样本,则这种抽样方法是( ) A.系统抽样 B.分层抽样C.简单随机抽样D.非以上三种抽样方法答案 A解析 符合系统抽样的特点,故选A.3.下列抽取样本的方式属于简单随机抽样的个数为( ) ①从无限多个个体中抽取100个个体作为样本;②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里; ③从20件玩具中一次性抽取3件进行质量检验;④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. A.0B.1C.2D.3 答案 A解析 ①不是简单随机抽样.②不是简单随机抽样.由于它是放回抽样.。
课时达标 第55讲一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60B 解析 根据频率分布直方图,低于60分的同学所占频率为(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50.故选B.2.(2017·山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7A 解析 根据两组数据的中位数相等可得65=60+y , 解得y =5,又因为它们的平均值相等,所以56+62+65+74+(70+x )5=59+61+67+(60+5)+785,解得x =3.故选A.3.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >aD 解析 平均数a =110×(15+17+14+10+15+17+17+16+14+12)=14.7,中位数b =15,众数c =17,所以c >b >a .4.(2019·杭州二中月考)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成五组,并绘制频率分布直方图(如图所示).根据一般标准,高三男生的体重超过65 kg 属于偏胖,低于55 kg 属于偏瘦.已知图中从左到右第一、第三、第四、第五小组的频率分别为0.25,0.2,0.1,0.05,第二小组的频数为400,则估计该校高三年级的男生总数和体重正常的频率分别为( )A .1 000,0.5B .800,0.5C .800,0.6D .1 000,0.6D 解析 由已知得,第二小组的频率为1-0.25-0.2-0.1-0.05=0.4,所以该校高三年级的男生总数是4000.4=1 000,体重正常的频率为0.4+0.2=0.6.5.(2019·长治二中月考)一个公司有8名员工,其中6名员工的月工资分别为5 200,5 300,5 500,6 100,6 500,6 600,另两名员工数据不清楚,那么8名员工月工资的中位数不可能是( )A .5 800B .6 000C .6 200D .6 400D 解析 由题意,把8名员工的工资由小到大排列,中位数为中间两数的平均值,若另两名员工的工资都低于5 200,则中位数为5 300+5 5002=5 400,若另两名员工的工资都高于6 600,则中位数为6 100+6 5002=6 300.所以8名员工工资的中位数的取值范围为[5400,6 300],故员工工资的中位数不可能为6 400.6.下面左图是某学习小组学生数学考试成绩的茎叶图,1号到16号同学的成绩依次为A 1,A 2,…,A 16,右图是统计茎叶图中成绩在一定范围内的学生人数的算法流程图,那么该算法流程图输出的结果是( )A .6B .10C .91D .92B 解析 由算法流程图可知,其统计的是数学成绩大于等于90的人数,所以由茎叶图知,数学成绩大于等于90的人数为10,因此输出结果为10.故选B.二、填空题7.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在60株树木中底部周长小于100 cm 的株数为________.解析 由题意,在抽测的60株树木中,底部周长小于100 cm 的株数为(0.015+0.025)×10×60=24.★答案★ 248.如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.⎪⎪⎪018 90 3 5解析 因为x =8+9+10+13+155=11,所以s 2=15×[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.★答案★ 6.89.为了调查某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.解析 设5个班级的人数分别为x 1,x 2,x 3,x 4,x 5,则15×(x 1+x 2+x 3+x 4+x 5)=7,15×[(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2]=4,即5个整数平方和为20,最大的数比7大但与7的差值不能大于或等于4,否则方差大于4,故最大值为10,最小值为4.★答案★ 10 三、解答题10.随机观测生产某种零件的某工厂25名工人的日加工零件数(单位:件),获得数据如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根据上述数据得到样本的频率分布表如表所示.分组 频数 频率 [25,30] 3 0.12 (30,35] 5 0.20 (35,40] 8 0.32 (40,45] n 1 f 1 (45,50]n 2f 2(1)确定样本频率分布表中n 1212(2)根据上述频率分布表,画出样本频率分布直方图和频率分布折线图.解析 (1)由所给数据知,落在区间(40,45]内的有7个,落在(45,50]内的有2个,故n 1=7,n 2=2,所以f 1=n 125=725=0.28,f 2=n 225=225=0.08.(2)样本频率分布直方图和频率分布折线图如图所示.11.为参加学校的“我爱古诗词”知识竞赛,小王所在班级组织了一次古诗词知识测试,并将全班同学的分数(得分取正整数,满分为100分)进行统计,以下是根据这次测试成绩制作的不完整的频率分布表和频率分布直方图.频率分布表组别分组频数频率1[50,60)90.182[60,70)a3[70,80)200.404[80,90)0.085[90,100]2b合计 1请根据以上频率分布表和频率分布直方图,回答下列问题:(1)求出a,b,c,d的值;(2)老师说:“小王的测试成绩是全班同学成绩的中位数”,那么小王的测试成绩在什么范围内.解析(1)样本容量为9÷0.18=50,50×0.08=4,所以a=50-9-20-4-2=15,b=2÷50=0.04,c=15÷50÷10=0.03,d=0.04÷10=0.004.(2)因为样本容量为50,则样本的中位数是第25,26个数据的平均数,而第25,26个数据均位于70≤x<80范围内,所以小王的测试成绩在70≤x<80范围内.12.(2019·河北大学附中月考)某城市为满足市民的出行需要和节能环保的要求,在公共场所提供单车共享服务,某部门为了对共享单车进行更好的监管,随机抽取了20位市民对共享单车的情况进行了问卷调查,并根据其满足度评分值制作了茎叶图如下:(1)分别计算男性打分的中位数和女性打分的平均数;(2)从打分在80分以下(不含80分)的市民中抽取3人,求有女性被抽中的概率.解析(1)由茎叶图可知男性打分的中位数为80+822=81,女性打分的平均数为110×(77+78+80+83+85+88+89+92+97+99)=86.8.(2)由茎叶图可知,80分以下的市民共有6人,其中男性4人,记作A ,B ,C ,D ,女性2人,记作a ,b ,从6人中抽取3人所构成的基本事件空间为{ABC ,ABD ,ABa ,ABb ,ACD ,ACa ,ACb ,ADa ,ADb ,Aab ,BCD ,BCa ,BCb ,BDa ,BDb ,Bab ,CDa ,CDb ,Cab ,Dab },共20个基本事件,其中“有女性被抽中”包含的基本事件有{ABa ,ABb ,ACa ,ACb ,ADa ,ADb ,Aab ,BCa ,BCb ,BDa ,BDb ,Bab ,CDa ,CDb ,Cab ,Dab },共16个基本事件,所以从打分在80分以下(不含80分)的市民中抽取3人,有女性被抽中的概率P =1620=45.13.[选做题](2019·曲靖一中月考)某校对高三年级的学生进行体检,现将高三男生的体重(单位:kg)数据进行整理后分成六组,并绘制频率分布直方图(如图).已知图中从左到右第一、第六小组的频率分别为0.16,0.07,第一、第二、第三小组的频率成等比数列,第三、第四、第五、第六小组的频率成等差数列,且第三小组的频数为100,则该校高三年级的男生人数为________.解析 设第三小组的频率为x ,等比数列的公比为q ,等差数列的公差为d ,则⎩⎨⎧0.16=x q2,x +3d =0.07,0.16+x q +x +x +d +x +2d +0.07=1,解得q =1.25,x =0.25,因为第三小组的人数为100,所以该校高三年级的男生人数为1000.25=400.★答案★ 400感谢您的下载!快乐分享,知识无限!由Ruize收集整理!。
单元质检十算法初步、统计与统计案例(时间:45分钟满分:100分)单元质检卷第20页一、选择题(本大题共6小题,每小题7分,共42分)1.执行如图所示的程序框图,输出的s值为()A.12B.56C.76D.712答案:B解析:第一步:s=1-12=12,k=2,k<3;第二步:s=12+13=56,k=3,输出s.故选B.2.某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图如图所示,则这1 000名学生在该次自主招生水平测试中成绩不低于70分的学生人数是()A.300B.400C.500D.600答案:D解析:依题意,得题中的1 000名学生在该次自主招生水平测试中成绩不低于70分的学生人数是1 000×(0.035+0.015+0.010)×10=600,故选D.3.某校共有2 000名学生,各年级男、女生人数如表所示.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.18.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( )A.12B.16C.18D.24 答案:B解析:由题意可得二年级的女生的人数为2 000×0.18=360,则一、二年级学生总数363+387+360+390=1 500,故三年级学生总数是2 000-1 500=500. 因此,用分层抽样法在三年级抽取的学生数为64×5002 000=16.故选B .4.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.根据某地某日早7点到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图如图所示,则甲、乙两地PM2.5的方差较小的是( )A.甲B.乙C.甲、乙相等D.无法确定 答案:A解析:从茎叶图上可以观察到:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地PM2.5的方差较小.5.在利用最小二乘法求回归方程y ^=0.67x+54.9时,用到了下面表中的5组数据,则表格中A.68B.70C.75D.72答案:A解析:由题意可得x =15(10+20+30+40+50)=30,y =15(62+a+75+81+89)=15(a+307). 因为回归直线方程y ^=0.67x+54.9过样本点的中心,所以15(a+307)=0.67×30+54.9,解得a=68.6.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:据此估计允许参加面试的分数线是() A.75 B.80 C.85 D.90答案:B解析:因为参加笔试的400人中择优选出100人,所以每个人被择优选出的概率P=100400=14.因为随机调查24名笔试者,所以估计能够参加面试的人数为24×14=6.观察表格可知,分数在[80,85)的有5人,分数在[85,90)的有1人,故面试的分数线大约为80分,故选B . 二、填空题(本大题共3小题,每小题7分,共21分)7.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的方差s 2= . 答案:265 解析:∵2+3+7+8+a5=5,∴a=5.∴s 2=15[(2-5)2+(3-5)2+(7-5)2+(8-5)2+(5-5)2]=265.8.有24名投资者想到海南某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为1~24号,再用系统抽样方法抽出6名投资者,邀请他们到海南某地实地考察.其中年龄不超过55岁的人数为 .答案:2解析:因为系统抽样方法是等距抽样,所以从小到大每4人(一个区间)抽出一人.因为不超过55岁落在(39,40,41,41),(42,45,51,53),所以应抽取2人.9.执行如图所示的程序框图,若输出的结果为80,则判断框内应填入 .答案:n>7?解析:模拟程序的运行,可得S=0,n=1,a=3,执行循环体,S=3,a=5,不满足条件,执行循环体,n=2;S=8,a=7,不满足条件,执行循环体,n=3;S=15,a=9,不满足条件,执行循环体,n=4;S=24,a=11,不满足条件,执行循环体,n=5;S=35,a=13,不满足条件,执行循环体,n=6;S=48,a=15,不满足条件,执行循环体,n=7;S=63,a=17,不满足条件,执行循环体,n=8;S=80,a=19,由题意,此时满足条件,退出循环,输出的S结果为80,则判断框内应填入“n>7?”.三、解答题(本大题共3小题,共37分)10.(12分)从某校随机抽取200名学生,获得了他们一周课外阅读时间(单位:h)的数据,整理得到数据的频数分布表和频率分布直方图(如图).(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12 h的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的200名学生该周课外阅读时间的平均数在第几组.解:(1)由频率分布表可知该周课外阅读时间不少于12 h的频数为12+4+4=20,故可估计该周课外阅读时间少于12 h的概率为1-20=0.9.200(2)由频率分布表可知数据在[4,6)的频数为34,故这一组的频率为0.17,即a=0.085,数据在[8,10)的频数为50,故这一组的频率为0.25,即b=0.125.(3)数据的平均数为1200(1×12+3×16+5×34+7×44+9×50+11×24+13×12+15×4+17×4)=7.68(h),故样本中的200名学生该周课外阅读时间的平均数在第四组.11.(12分)某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东西两部各5个城市,得到观看该节目的人数(单位:千人)如下茎叶图所示,其中一个数字被污损.(1)求东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数的概率.(2)随着节目的播出,极大激发了观众对成语知识的学习积累的热情,从中获益匪浅.现从观看该节目的观众中随机统计了4名观众的周均学习成语知识的时间y (单位:时)与年龄由表中数据分析,x ,y 呈线性相关关系,试求线性回归方程y ^=b ^x+a ^,并预测年龄为60岁的观众周均学习成语知识的时间. 参考公式:b ^=∑i=1nx i y i -nx y∑i=1nx i2-nx 2,a ^=y −b ^x .解:(1)设被污损的数字为a ,则a 有10种情况.令88+89+90+91+92>83+83+87+90+a+99, 则a<8,东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数,有8种情况,所求概率为810=45.(2)由题意可知x =35,y =3.5,∑i=14x i y i=525,∑i=14x i 2=5 400,所以b ^=7100,a ^=2120,所以y ^=7100x+2120. 当x=60时,y ^=7100×60+2120=5.25(时).故预测年龄为60岁的观众周均学习成语知识的时间为5.25时.12.(13分)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名学生的课外体育锻炼平均每天运动的时间(单位:min)进行调查,将收集到的数据分成[0,10),[10,20),[20,30),[30,40),[40,50),[50,60]六组,并作出频率分布直方图(如图).将日均课外体育锻炼时间不低于40 min的学生评价为“课外体育达标”.(1)请根据频率分布直方图中的数据填写下面的2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?(2)现从“课外体育达标”学生中按分层抽样抽取5人,再从这5名学生中随机抽取2人参加体育知识问卷调查,求抽取的这2人课外体育锻炼时间都在[40,50)内的概率.附参考公式与数据:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)解:(1)根据频率分布直方图,得“课外体育达标”的学生数为200×(0.020+0.005)×10=50.由2×2列联表可知“课外体育达标”的男生人数为30,女生人数为20.补全2×2列联表如下:计算K的观测值k=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=200×(60×20-90×30)290×110×150×50≈6.061<6.635,故在犯错误的概率不超过0.01的前提下不能认为“课外体育达标”与性别有关.(2)从“课外体育达标”学生中按分层抽样抽取5人,其中课外体育锻炼时间在[40,50)内有5×0.0200.020+0.005=4(人),分别记为a,b,c,d;在[50,60]上有1人,记为E.从这5人中抽取2人,总的基本事件有ab,ac,ad,aE,bc,bd,bE,cd,cE,dE共10种,其中2人都=0.6.在[40,50)内的基本事件有ab,ac,ad,bc,bd,cd共6种,故所求的概率为610。
第1讲 随机抽样1.以选择题或填空题的形式考查随机抽样方法以及有关的计算.特别是对分层抽样的考查,几乎每年都出现在高考试题中.2.在解答题中与概率统计的有关问题相结合进行综合考查.【复习指导】1.本讲复习时,应准确理解三种抽样方法的定义,搞清它们之间的联系与区别,灵活选择恰当的抽样方法抽取样本.2.新课标高考近几年常将抽样方法与频率分布直方图、概率等相结合进行综合考查,因此,要加强这方面的训练.基础梳理1.简单随机抽样(1)定义:设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.(2)最常用的简单随机抽样的方法:抽签法和随机数法.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本.(1)编号:先将总体的N 个个体编号;(2)分段:确定分段间隔k ,对编号进行分段,当N n (n 是样本容量)是整数时,取k=N n ;(3)确定首个个体:在第1段用简单随机抽样确定第一个个体编号l (l ≤k );(4)获取样本:按照一定的规则抽取样本,通常是将l 加上间隔k 得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.4.分层抽样的步骤(1)分层:将总体按某种特征分成若干部分;(2)确定比例:计算各层的个体数与总体的个体数的比;(3)确定各层应抽取的样本容量;(4)在每一层进行抽样(各层分别按简单随机抽样或系统抽样的方法抽取),综合每层抽样,组成样本.一条规律三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是n N.三个特点(1)简单随机抽样的特点:总体中的个体性质相似,无明显层次;总体容量较小,尤其是样本容量较小;用简单随机抽样法抽出的个体带有随机性,个体间无固定间距.(2)系统抽样的特点:适用于元素个数很多且均衡的总体;各个个体被抽到的机会均等;总体分组后,在起始部分抽样时,采用简单随机抽样.(3)分层抽样的特点:适用于总体由差异明显的几部分组成的情况;分层后,在每一层抽样时可采用简单随机抽样或系统抽样.双基自测1.(人教A版教材习题改编)某公司有员工500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人,为了调查员工的身体健康状况,从中抽取100名员工,则应在这三个年龄段分别抽取人数为().A.33人,34人,33人B.25人,56人,19人C.30人,40人,30人D.30人,50人,20人解析因为125∶280∶95=25∶56∶19,所以抽取人数分别为:25人,56人,19人.答案 B2.(2012·福州质检)为了了解全校240名学生的身高情况,从中抽取40名学生进行测量,下列说法正确的是().A.总体是240 B.个体是每一个学生C.样本是40名学生D.样本容量是40解析总体容量是240,总体是240名学生的身高;个体是每名学生的身高;样本是40名学生的身高;样本容量是40.答案 D3.(2012·昆明调研)下列说法中正确说法的个数是().①总体中的个体数不多时宜用简单随机抽样法;②在总体均分后的每一部分进行抽样时,采用的是简单随机抽样;③百货商场的抓奖活动是抽签法;④整个抽样过程中,每个个体被抽取的概率相等(有剔除时例外).A.1 B.2 C.3 D.4解析①②③显然正确,系统抽样无论有无剔除都是等概率抽样;④不正确.答案 C4.老师在班级50名学生中,依次抽取学号为5,10,15,20,25,30,35,40,45,50的学生进行作业检查,这种抽样方法是().A.随机抽样B.分层抽样C.系统抽样D.以上都不是解析因为所抽取学生的学号成等差数列,即为等距离抽样,属于系统抽样.答案 C5.(2011·天津)一支田径队有男运动员48人,女运动员36人,若用分层抽样的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________.解析抽取的男运动员的人数为2148+36×48=12.答案12考向一简单随机抽样【例1】►某车间工人加工一种轴承100件,为了了解这种轴承的直径,要从中抽取10件轴承在同一条件下测量,如何采用简单随机抽样的方法抽取样本?[审题视点] 考虑到总体中个体数较少,利用抽签法或随机数表法均可容易获取样本.须按这两种抽样方法的操作步骤进行.抽签法应“编号、制签、搅匀、抽取”;随机数表法应“编号、确定起始数、读数、取得样本”.解法一(抽签法)将100件轴承编号为1,2,…,100,并做好大小、形状相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这10个号签对应的轴的直径.法二(随机数表法)将100件轴承编号为00,01,02,…,99,在随机数表中选定一个起始位置,如取第21行(见随机数表)第1个数开始,选取10个为68,34,30,13,70,55,74,30,77,40,这10件即为所要抽取的样本.(1)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀,一般地,当总体容量和样本容量都较小时可用抽签法.(2)随机数表中共随机出现0,1,2,…,9十个数字,也就是说,在表中的每个位置上出现各个数字的机会都是相等的.在使用随机数表时,如遇到三位数或四位数时,可从选择的随机数表中的某行某列的数字计起,每三个或每四个作为一个单位,自左向右选取,有超过总体号码或出现重复号码的数字舍去.【训练1】福利彩票的中奖号码是在1~36个号码中,选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号的适宜的抽样方法是________.答案抽签法考向二系统抽样【例2】►用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生从1~160编号,按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组抽出的号码为123,则第2组中应抽出个体的号码是________.[审题视点] 根据系统抽样的特点,确定组数和每组的样本数,写出每组抽取号码的表达式,确定第一组所抽取的号码数,代入公式即可求得第2组抽取样本的号码.解析由题意可知,系统抽样的组数为20,间隔为8,设第1组抽出的号码为x,则由系统抽样的法则可知,第n组抽出个体的号码应该为x+(n-1)×8,所以第16组应抽出的号码为x+(16-1)×8=123,解得x=3,所以第2组中应抽出个体的号码为3+(2-1)×8=11.答案11(1)系统抽样的特点——机械抽样,又称等距抽样,所以依次抽取的样本对应的号码就是一个等差数列,首项就是第1组所抽取样本的号码,公差为间隔数,根据等差数列的通项公式就可以确定每一组内所要抽取的样本号码.(2)系统抽样时,如果总体中的个数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行.【训练2】从编号为1~50的50枚最新研制的某种型号的导弹中随机抽取5枚来进行发射实验,若采用每部分选取的号码间隔一样的系统抽样方法,则所选取5枚导弹的编号可能是().A.5,10,15,20,25 B.3,13,23,33,43C.1,2,3,4,5 D.2,4,6,16,32解析间隔距离为10,故可能编号是3,13,23,33,43.答案 B考向三分层抽样【例3】►某市电视台在因特网上征集电视节目的现场参与观众,报名的共有 1 2000人,分别来自4个城区,其中东城区2 400人,西城区4 600人,南城区3 800人,北城区1 200人,从中抽取60人参加现场节目,应当如何抽取?[审题视点] 因为地域有名显的差异,故采用分层抽样.解因为:60∶1 2000=1∶200,所以2 400200=12,4 600200=23,3 800200=19,1 200200=6.故从东城区中抽取12人,从西城中抽23人,从南城中抽19人,从北城区中抽6人.在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.【训练3】(2010·重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为().A.7 B.15C.25 D.35解析由题意知,青年职工人数∶中年职工人数∶老年职工人数=350∶250∶150=7∶5∶3.由样本中青年职工为7人得样本容量为15.答案B难点突破22——高考中抽样方法问题从近两年新课标高考试题可以看出高考主要是以选择题或填空题的形式考查抽样方法,难度并不大.其中重点考查分层抽样,其次是系统抽样.计算时应注意:分层抽样是按比例抽样,系统抽样首先是对总体分段的计算,注意分段时可能要排除一些个体,各段的间距是一样的.【示例1】►(2011·福建)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为().【示例2】►(2011·山东)某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生.为了解学生的就业倾向,用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为________.【示例3】►(2010.湖北)将参加夏令营的600名学生编号为:001,002, (600)采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为().A.26,16,8 B.25,17,8C.25,16,9 D.24,17,9第2讲用样本估计总体1.考查样本的频率分布(分布表、直方图、茎叶图)中的有关计算,样本特征数(众数、中位数、平均数、标准差)的计算.主要以选择题、填空题为主.2.考查以样本的分布估计总体的分布(以样本的频率估计总体的频率、以样本的特征数估计总体的特征数).【复习指导】1.由于高考对统计考查的覆盖面广,几乎对所有的统计考点都有所涉及,其中频率分布直方图、均值与方差、茎叶图是核心考点,需要好好掌握.复习时,对于统计的任何环节都不能遗漏,最主要的是掌握好统计的基础知识,适度的题量练习.2.高考对频率分布直方图或茎叶图与概率相结合的题目考查日益频繁.因此,复习时要加强这方面的训练,弄清图表中有关量的含义,并从中提炼出有用的信息,为后面的概率计算打好基础.基础梳理1.频率分布直方图(1)通常我们对总体作出的估计一般分成两种:一种是用样本的频率分布估计总体的分布;另一种是用样本的数字特征估计总体的数字特征.(2)作频率分布直方图的步骤①求极差(即一组数据中最大值与最小值的差).②决定组距与组数.③将数据分组.④列频率分布表.⑤画频率分布直方图.(3)在频率分布直方图中,纵轴表示频率组距,数据落在各小组内的频率用各小长方形的面积表示.各小长方形的面积总和等于1.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.3.茎叶图的优点用茎叶图表示数据有两个突出的优点:一是统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.4.样本方差与标准差设样本的元素为x1,x2,…,x n,样本的平均数为x,(1)样本方差:s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(2)样本标准差:s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].两个异同(1)众数、中位数与平均数的异同①众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.②由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.③众数考查各数据出现的频率,其大小只与这组数据中的部分数据有关.当一组数据中有不少数据多次重复出现时,其众数往往更能反映问题.④某些数据的变动对中位数可能没有影响.中位数可能出现在所给数据中,也可能不在所给数据中.当一组数据中的个别数据变动较大时,可用中位数描述其集中趋势.(2)标准差与方差的异同标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度就越大;标准差、方差越小,数据的离散程度则越小,因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.三个特征利用频率分布直方图估计样本的数字特征:(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.双基自测1.(人教A版教材习题改编)某工厂生产滚珠,从某批产品中随机抽取8粒,量得直径分别为(单位:mm):14.7,14.6,15.1,15.0,14.8,15.1,15.0,14.9,则估计该厂生产的滚珠直径的平均数为().A.14.8 mm B.14.9 mmC.15.0 mm D.15.1 mm解析平均数x=18(14.7+14.6+15.1+15.0+14.8+15.1+15.0+14.9)=14.9(mm).答案 B2.(2012·合肥月考)一个容量为100的样本,其数据的分组与各组的频数如下:组别(0,10](10,20](20,30](30,40](40,50](50,60](60,70] 频数1213241516137则样本数据落在(10,40]上的频率为().A.0.13 B.0.39C.0.52 D.0.64解析由列表可知样本数据落在(10,40]上的频数为52,故其频率为0.52.答案 C3.(人教A版教材习题改编)10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是().A .14B .16C .15D .17解析 将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为15+152=15. 答案 C 4.某雷达测速区规定:凡车速大于或等于70 km/h 的汽车视为“超速”,并将受到处罚,如图是某路段的一个检测点对200辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可以看出被处罚的汽车大约有( ). A .30辆 B .40辆 C .60辆 D .80辆解析 由题图可知,车速大于或等于70 km/h 的汽车的频率为0.02×10=0.2,则将被处罚的汽车大约有200×0.2=40(辆). 答案 B5.(2011·江苏)某老师从星期一到星期五收到的信件数分别为10,6,8,5,6,则该组数据的方差s 2=________.解析 平均数x =10+6+8+5+65=7.∴s 2=15[(10-7)2+(6-7)2+(8-7)2+(5-7)2+ (6-7)2]=15×(9+1+1+4+1)=3.2. 答案 3.2考向一 频率分布直方图的绘制与应用【例1】►某校从参加高一年级期中考试的学生中随机抽出60名学生,将其物理成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图,观察图形的信息,回答下列问题:(1)求分数在[70,80)内的频率,并补全这个频率分布直方图;(2)统计方法中,同一组数据常用该组区间的中点值作为代表,据此估计本次考试中的平均分.[审题视点] 利用各小长方形的面积和等于1求[70,80)内的频率.解(1)设分数在[70,80)内的频率为x,根据频率分布直方图,有(0.010+0.015×2+0.025+0.005)×10+x=1,可得x=0.3,所以频率分布直方图如图所示.(2)平均分为:x=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71(分).频率分布直方图直观形象地表示了样本的频率分布,从这个直方图上可以求出样本数据在各个组的频率分布.根据频率分布直方图估计样本(或者总体)的平均值时,一般是采取组中值乘以各组的频率的方法.【训练1】(2011·湖北)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为().A.18 B.36C.54 D.72解析样本数据落在区间[10,12)内的频率1-(0.19+0.15+0.05+0.02)×2=0.18,所以数据落在此区间的频数为200×0.18=36.答案 B考向二茎叶图的应用【例2】►如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则一定有().A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关[审题视点] 去掉的最低分和最高分就是第一行和第三行的数据,剩下的数我们只要计算其叶上数字之和,即可对问题作出结论.解析去掉一个最高分和一个最低分后,甲选手叶上的数字之和是20,乙选手叶上的数字之和是25,故a2>a1.故选B.答案 B由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.【训练2】在一项大西瓜品种的实验中,共收获甲种大西瓜13个、乙种大西瓜11个,并把这些大西瓜的重量(单位:斤,1斤=500克)制成了茎叶图,如图所示,据此茎叶图写出对甲乙两种大西瓜重量的两条统计结论是:(1)__________________________________________;(2)__________________________________________.解析从这个茎叶图可以看出,甲种大西瓜的重量大致对称,平均重量、众数及中位数都是30多斤;乙种大西瓜的重量除了一个51斤外,也大致对称,平均重量、众数及中位数都是20多斤,但甲种大西瓜的产量比乙种稳定,总体情况比乙好.答案(1)甲种大西瓜的平均重量大于乙种大西瓜(2)甲种大西瓜的产量比乙种大西瓜稳定考向三用样本的数字特征估计总体的数字特征【例3】►甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.[审题视点] (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x甲=10+13+12+14+165=13,x乙=13+14+12+12+145=13,s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.(2)由s2甲>s2乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其波动大小.【训练3】甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲108999乙1010799如果甲、乙两人中只有1人入选,则入选的最佳人选应是________.解析x甲=x乙=9环,s2甲=15[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=2 5,s2乙=15[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s2甲,故甲更稳定,故填甲.答案甲规范解答19——怎样解答茎叶图与概率的综合性问题【问题研究】 茎叶图是一个将数据分成主、次两部分,把主要部分当做茎、次要部分当作叶表达数据的一个图,它是一种常用的统计图.因此考题常将茎叶图作为载体来考查平均数、方差以及概率问题.【解决方案】 首先对茎叶图中的数据全面分析,然后再根据茎叶图的数据解决其它问题.【示例】►(本题满分12分)(2011·北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵数为19的概率.(注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n的平均数)第(1)问直接套入公式求值;第(2)问利用古典概型的知识解决.[解答示范] (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为x =8+8+9+104=354.(2分)方差为s 2=14⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫8-3542+⎝ ⎛⎭⎪⎫9-3542+⎝ ⎛⎭⎪⎫10-3542=1116.(5分)(2)记甲组四名同学为A 1,A 2,A 3,A 4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B 1,B 2,B 3,B 4,他们植树的棵数依次为9,8,9,10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是:(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4),(A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4),(A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4),(9分)用C 表示:“选出的两名同学的植树总棵数为19”这一事件,则C 中的结果有4个,它们是:(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2).故所求概率为P (C )=416=14.(12分)茎叶图一般记录两组的数据,它最直观、最清晰,但利用茎叶图解决概率问题时对重复出现的数据要重复记录,不能遗漏.第3讲 变量间的相关关系与统计案例以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简单应用. 【复习指导】高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用.复习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式.基础梳理1.相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关. 2.线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线. 3.回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法.(2)回归方程:两个具有线性相关关系的变量的一组数据: (x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归方程为y ^=b^x +a ^,则⎩⎪⎨⎪⎧b ^=∑i =1n (x i-x )(y i-y )∑i =1n (x i-x )2=∑i =1nx i y i-n xy∑i =1nx 2i-n x2,a^=y -b ^ x .其中,b 是回归方程的斜率,a 是在y 轴上的截距. 4.样本相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n (x i -x )2∑i =1n(y i -y )2,用它来衡量两个变量间的线性相关关系.(1)当r >0时,表明两个变量正相关; (2)当r <0时,表明两个变量负相关;(3)r 的绝对值越接近1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常当|r |>0.75时,认为两个变量有很强的线性相关关系. 5.线性回归模型(1)y =bx +a +e 中,a 、b 称为模型的未知参数;e 称为随机误差. (2)相关指数用相关指数R 2来刻画回归的效果,其计算公式是:R 2= ,R 2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好.在线性回归模型中,R 2表示解释变量对预报变量变化的贡献率,R 2越接近于1,表示回归效果越好. 6.独立性检验(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量.例如:是否吸烟,宗教信仰,国籍等.(2)列出的两个分类变量的频数表,称为列联表.(3)一般地,假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表y1y2总计x1 a b a+bx2 c d c+d总计a+c b+d a+b+c+dK2=n(ad-bc)2(a+b)(a+c)(c+d)(b+d)(其中n=a+b+c+d为样本容量),可利用独立性检验判断表来判断“x与y的关系”.这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.两个规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.(2)当K2≥3.841时,则有95%的把握说事A与B有关;当K2≥6.635时,则有99%的把握说事件A与B有关;当K2≤2.706时,则认为事件A与B无关.三个注意(1)回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否则,求出的回归直线方程毫无意义.(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体.(3)独立性检验的随机变量K2=3.841是判断是否有关系的临界值,K2≤3.841应判断为没有充分证据显示事件A与B有关系,而不能作为小于95%的量化值来判断.。
单元质检十算法初步、统计与统计案例
(时间:45分钟满分:100分)
一、选择题(本大题共6小题,每小题7分,共42分)
1.(2018北京,文3)执行如图所示的程序框图,输出的s值为()
A.1
2B.5
6
C.7
6
D.7
12
:s=1-1
2=1
2
,k=2,k<3;
第二步:s=1
2+1
3
=5
6
,k=3,输出s=5
6
.故选B.
2.
某大学对1 000名学生的自主招生水平测试成绩进行统计,得到样本频率分布直方图(如图),则这1 000名学生在该次自主招生水平测试中成绩不低于70分的学生人数是()
A.300
B.400
C.500
D.600
,得题中的1000名学生在该次自主招生水平测试中成绩不低于70分的学生人数是
1000×(0.035+0.015+0.010)×10=600,故选D.
3.已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成
原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()
图①
图②
A.100,10
B.200,10
C.100,20
D.200,20
,总人数为3500+4500+2000=10000,
样本容量为10000×2%=200.
=40.
根据分层抽样的定义,抽取的高中生人数为200×2000
10000
因为高中生近视率为50%,所以抽取的高中生近视的人数为40×50%=20.
4.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.根据某地某日早7点
到晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图如图所示,则甲、
乙两地PM2.5的方差较小的是()
A.甲
B.乙
C.甲、乙相等
D.无法确定
:甲监测点的样本数据比乙监测点的样本数据更加集中,因此甲地PM2.5的方差较小.
5.有24名投资者想到海南某地投资,他们年龄的茎叶图如图所示,先将他们的年龄从小到大编号为1~24号,再用系统抽样方法抽出6名投资者,邀请他们到海南某地实地考察.其中年龄不超过55岁的人数为( )
A.1
B.2
C.3
D.不确定
,所以从小到大每4人(一个区间)抽出一人.因为不超过55岁落在(39,40,41,41),(42,45,51,53),所以应抽取2人.
6.某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试.现随机调查了24名笔试者的成绩,如下表所示:
据此估计允许参加面试的分数线是( ) A.75 B.80
C.85
D.90
400人中择优选出100人,所以每个人被择优选出的概率P=100400=1
4.因为随机调查24名笔试者,所以估计能够参加面试的人数为24×1
4=6.观察表格可知,分数在[80,85)的有5人,分数在[85,90)的有1人,故面试的分数线大约为80分,故选B . 二、填空题(本大题共3小题,每小题7分,共21分)
7.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的方差
s 2
= . ∵
2+3+7+8+a
5=5,∴a=5.
∴s 2=1
5[(2-5)2+(3-5)2+(7-5)2+(8-5)2+(5-5)2]=26
5.
8.某高中1 000名学生的身高情况如下表,已知从这批学生随机抽取1名,抽到偏矮男生的概率为0.12.若用分层抽样的方法,从这批学生中随机抽取50名,偏高学生有 名.
x=1000×0.12=120,
所以y+z=220.
所以偏高学生占学生总数的比例为220
1000
=11
50
,所以随机抽取50名学生中偏高学生有
50×11
50=11(名).
9.执行如图所示的程序框图,输出S 的值为 .
,模拟程序框图的运行过程,可得i=1,S=0;
满足条件i<4,S=ln2,i=2;
满足条件i<4,S=ln2+ln3-ln2=ln3,i=3;
满足条件i<4,S=ln3+ln4-ln3=ln4,i=4;
不满足条件i<4,退出循环,输出S的值为ln4.
三、解答题(本大题共3小题,共37分)
10.(12分)从某校随机抽取200名学生,获得了他们一周课外阅读时间(单位:h)的数据,整理得到数据的频数分布表和频率分布直方图(如图).
9 [16,1 8]
4
合计20 0
(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12 h的概率;
(2)求频率分布直方图中的a,b的值;
(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的200名学生该周课外阅
读时间的平均数在第几组.
由频率分布表可知该周课外阅读时间不少于12h的频数为12+4+4=20,故可估计该周课外阅读
时间少于12h的概率为1-20
200
=0.9.
(2)由频率分布表可知数据在[4,6)的频数为34,故这一组的频率为0.17,即a=0.085,数据在[8,10)的频数为50,故这一组的频率为0.25,即b=0.125.
(3)数据的平均数为
1
200
(12×1+3×16+5×34+7×44+9×50+11×24+13×12+15×4+17×4)=7.68(h),故样本中的200名
学生该周课外阅读时间的平均数在第四组.
11.(12分)(2018山东省实验中学三诊)某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东西两部各5个城市,得到观看该节目的人数(单位:千人)如下茎叶图所示,其中一个数字被污损.
(1)求东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数的概率;
(2)随着节目的播出,极大激发了观众对成语知识的学习积累的热情,从中获益匪浅.现从观看该节目的观众中随机统计了4名观众的周均学习成语知识的时间y (单位:小时)与年龄x (单位:岁),并制作了对照表(如下表所示):
由表中数据分析,x ,y
呈线性相关关系,试求线性回归方程a ^=b ^
x+
a
^,并预测年龄为60岁的观众周均学习成语知识的时间.
参考公式:a
^=
∑a =1a a a a a -aaa
a a
2-aa 2,a ^=a −a
^a . 设被污损的数字为a ,则a 有10种情况.
令88+89+90+91+92>83+83+87+90+a+99,则a<8,东部各城市观看该节目观众平均人数超过西部各城市观看该节目观众平均人数,有8种情况,所求概率为8
10
=4
5.
(2)由题意可知a =35,a =3.5,∑a =14x i y i =525,∑i =1
4
a a 2=5400,
所以a
^=7100
,a
^=21
20,所以a ^=7
100x+21
20
.
当x=60时,a
^=7100
×60+21
20=5.25(小时).
故预测年龄为60岁的观众周均学习成语知识的时间为5.25小时.
12.(13分)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:
旧养殖法
新养殖法
(1)记A 表示事件“旧养殖法的箱产量低于50 kg ”,估计A 的概率;
(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;
(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较.
附:
K
2
=a (aa -aa
)
2
(a +a )(a +a )(a +a )(a +a ).
旧养殖法的箱产量低于50kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.
因此,事件A 的概率估计值为0.62.
(2)根据箱产量的频率分布直方图得列联表
K 2
=
200×(62×66-34×38)2
100×100×96×104
≈15.705.
由于15.705>6.635,因此有99%的把握认为箱产量与养殖方法有关.
(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50kg 到55kg 之间,旧养殖法的箱产量平均值(或中位数)在45kg 到50kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.。