高一数学必修3统计测试题
- 格式:doc
- 大小:1.35 MB
- 文档页数:7
一、选择题1.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .392.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为193.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.75.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .816.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和677.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-.A .①②③B .①③④C .①②④D .②③④8.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C .12x x <,甲比乙成绩稳定D .12x x >,甲比乙成绩稳定9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.16.由茎叶图可知,甲组数据的众数和乙组数据的极差分别是__________.17.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
第一章1. 家中配电盒至电视机的线路断了,检测故障的算法中,为了使检测的次数尽可能少,第一步检测的是 B(A)靠近电视的一小段,开始检查 (B)电路中点处检查 (C)靠近配电盒的一小段开始检查 (D)随机挑一段检查2. 早上从起床到出门需要洗脸刷牙(5min)、刷水壶(2min)、烧水(8min)、泡面(3min)、吃饭(10min)、听广播(8min)几个步骤,从下列选项中选最好的一种算法 C (A)S1洗脸刷牙、S2刷水壶、S3烧水、S4泡面、S5吃饭、S6听广播 (B)S1刷水壶、S2烧水同时洗脸刷牙、S3泡面、S4吃饭、S5听广播 (C)S1刷水壶、S2烧水同时洗脸刷牙、S3泡面、S4吃饭同时听广播 (D)S1吃饭同时听广播、S2泡面、S3烧水同时洗脸刷牙、S4刷水壶 3. 给出以下四个问题:①输入一个数x ,输出它的相反数;②求面积为6的正方形的周长;③求三个数a ,b ,c ,中的最大数;④求函数⎩⎨⎧<+≥-=)0(2)0(1)(x x x x x f 的函数值;⑤求两个正整数a ,b 相除的商及余数.其中不需要用条件语句来描述其算法的有_____125_______. 4. 下面的问题中必须用条件分支结构才能实现的是__23__________.①求面积为1的正三角形的周长; ②求方程0ax b +=(,a b 为常数)的根; ③求两个实数,a b 中的最大者; ④求1+2+3+…+100的值 5. 840和1764的最大公约数是84.6. 用秦九韶算法计算多项式23456()1235879653f x x x x x x x =+-++++,在4x =-时的值时,3V 的值为 C(A)-845 (B)220 (C)-57 (D)34 9.___28_____.12.(08-广东-9)阅读下图的程序框图,若输入4m =,3n =,则输出a =12,i =3;13.按如图所示的框图运算:若输入x =8,则输出k =5;(基本算法语句)1.下列给出的赋值语句中正确的是 B(A)M =4 (B)M M -= (C)3==A B (D)0=+y x 2.下列给变量赋值的语句正确的是 D(A)3a =(B)1a a +=(C)3a b c ===(D)8a a =+ 3.下列赋值语句中错误的是 C(A)1N N =+ (B)*K K K = (C)()C A B D =+ (D)M=M/5第二章一、选择题:1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( D ).A.简单随机抽样 B.系统抽样C.分层抽样 D.先从老年人中剔除一人,然后分层抽样2.某学校为了了解高一年级学生对教师教学的意见,打算从高一年级2007名学生中抽取50名进行抽查,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下2000人再按系统抽样的方法进行,则每人入选的机会( C )A. 不全相等B. 均不相等C. 都相等D. 无法确定3.有20位同学,编号从1至20,现在从中抽取4人作问卷调查,用系统抽样方法确定所抽的编号为( A )k=5A.5,10,15,20B.2,6,10,14C.2,4,6,8D.5,8,11,144.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。
一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
[A.基础达标]1.用随机数表法从100名同学(男生25人)中抽选20人进行评教,某男同学被抽到的机率是( ) A.1100 B.125 C.15D.14解析:选C.简洁随机抽样是等可能性抽样,每个个体被抽到的机率都是20100=15.故选C.2.(2021·昌乐二中检测)用随机数法进行抽样有以下几个步骤:①将总体中的个体编号;②猎取样本号码;③选定开头的数字;④选定读数的方向. 这些步骤的先后挨次应为( ) A .①②③④ B .①③④② C .③②①④ D .④③①② 解析:选B.先编号,再选数.3.下列抽样试验中,适合用抽签法的是( )A .从某厂生产的3 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D .从某厂生产的3 000件产品中抽取10件进行质量检验解析:选B.A 、D 中个体总数较大,不适合用抽签法;C 中甲、乙两厂生产的两箱产品性质可能差别较大,因此未达到搅拌均匀的条件,也不适于用抽签法;B 中个体数和样本容量均较小,且同厂生产的两箱产品,性质差别不大,可以看成是搅拌均匀了.4.某工厂的质检人员对生产的100件产品接受随机数表法抽取10件检查,对100件产品接受下面的编号方法:①01,02,03,…,100;②001,002,003,…,100;③00,01,02,…,99.其中正确的序号是 ( ) A .①② B .①③ C .②③ D .③解析:选C.依据随机数表法的要求,只有编号数字位数相同,才能达到随机等可能抽样. 5.(2021·青岛检测)对于简洁随机抽样,下列说法中正确的为( )①它要求总体的个数有限,以便对其中各个个体被抽取的概率进行分析;②它是从总体中逐个地进行抽取;③它是一种不放回抽样;④它是一种等概率抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的概率相等,而且在整个抽样过程中,各个个体被抽取的概率也相等,从而保证了这种抽样方法的公正性.A .①②③B .①②④C .①③④D .①②③④解析:选D.这四点全是简洁随机抽样的特点. 6.下列调查的样本合理的是________.①在校内发出一千张印有全校各班级的选票,要求被调查同学在其中一个班级旁画“√”,以了解最受欢迎的老师是谁;②从一万多名工人中,经过选举,确定100名代表,然后投票表决,了解工人们对厂长的信任状况;③到老年公寓进行调查,了解全市老年人的健康状况;④为了了解全班同学每天的睡眠时间,在每个小组中各选取3名同学进行调查.解析:①中样本不具有代表性、有效性,在班级前画“√”与了解最受欢迎的老师没有关系;③中样本缺乏代表性;而②④是合理的样本.答案:②④7.某中学高一班级有400人,高二班级有320人,高三班级有280人,以每人被抽取的可能性均为0.2,从该中学抽取一个容量为n 的样本,则n =________.解析:∵n400+320+280=0.2,∴n =200.答案:2008.一个总体数为60的个体编号为00,01,02,…,59,现需从中抽取一个容量为7的样本,请从随机数表的倒数第5行(下表为随机数表的最终5行)第11~12列的18开头,依次向下,到最终一行后向右,直到取足样本,则抽取样本的号码是________.95 33 95 22 00 18 74 72 00 18 46 40 62 98 80 54 97 20 56 95 38 79 58 69 32 81 76 80 26 92 15 74 80 08 32 16 46 70 50 80 82 80 84 25 39 90 84 60 79 80 67 72 16 42 79 71 59 73 05 50 24 36 59 87 38 82 07 53 89 35 08 22 23 71 77 91 01 93 20 49 96 35 23 79 18 05 98 90 07 35 82 96 59 26 94 66 39 67 98 60解析:先选取18,向下81、90、82不符合要求,下面选取05,向右读数,07、35、59、26、39,因此抽取的样本的号码为:18、05、07、35、59、26、39.答案:18、05、07、35、59、26、399.某车间工人加工一种轴100件,为了了解这种轴的直径,要从中抽取10件轴在同一条件下测量,如何接受简洁随机抽样的方法抽取样本?解:法一:(抽签法)将100件轴编号为1,2,…,100,并做好大小、外形相同的号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着逐个不放回地抽取10个号签,然后测量这10个号签对应的轴的直径.法二:(随机数表法)将100件轴编号为00,01,…,99,在随机数表中选定一个起始位置,如取第21行第1个数开头(见教材P 103附表),向右选取10个为68,34,30,13,70,55,74,77,40,44,这10个号码对应的轴即为所要抽取的对象.10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,并写出抽样过程.解:应使用抽签法,步骤如下:①将30辆汽车进行编号,号码是1,2,3,…,30; ②将1~30这30个编号写到大小、外形都相同的号签上; ③将写好的号签放入一个不透亮 的容器中,并搅拌均匀;④从容器中每次抽取一个号签,连续抽取3次,并记录下上面的编号;⑤所得号码对应的3辆汽车就是要抽取的对象.[B.力量提升]1.接受简洁随机抽样从含有6个个体的总体中抽取一个容量为3的样本,某个个体前两次未被抽到,则第三次被抽到的机会是( )A.12B.13C.16D.15解析:选A.从含有6个个体的总体中,抽取容量为3的样本,则每个个体在每次被抽到的机会都是12,这与第几次抽取无关.2.为了了解全校240名高一同学的体重状况,从中抽取40名同学进行测量.下列说法正确的是( ) A .总体是240 B .个体是每一名同学 C .样本是40名同学D .样本容量是40解析:选D.本题中的争辩对象是同学的体重,而不是同学自身.总体是240名同学的体重,个体是每一名同学的体重,样本是抽取的40名同学的体重,总体容量是240,样本容量是40.3.齐鲁风彩“七乐彩”的中奖号码是从1~30个号码中选出7个号码来按规章确定中奖状况,这种从30个号码中选7个号码的抽样方法是________.解析:当总体的个数不多时,宜接受抽签法.由于它简便易行,可用不同的方式制签,抽签也便利. 答案:抽签法4.2022年10月10日,袁隆平“超级稻”亩产创1 026.7公斤新纪录.要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子进行试验,利用随机数表法抽取种子,先将850颗种子按001,002, (850)行编号,假如从随机数表第3行第6列的数开头向右读,请依次写出最先检验的4颗种子的编号:________.(随机数表见教材P 103附表)解析:从随机数表第3行第6列的数2开头向右读第一个小于850的数字是227,其次个数字是665,第三个数字是650,第四个数字是267,符合题意.答案:227,665,650,2675.某电视台进行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选择10人,从18名香港艺人中随机选择6人,从10名台湾艺人中随机选择4人.试用抽签法确定选中的艺人,并确定他们的表演挨次.解:第一步:先确定艺人:(1)将30名内地艺人从01到30编号,然后用相同的纸条做成30个号签,在每个号签上写上这些编号,然后放入一个不透亮 小筒中摇匀,从中抽出10个号签,则相应编号的艺人参与演出;(2)运用相同的方法分别从18名香港艺人中抽取6人,从10名台湾艺人中抽取4人.其次步:确定演出挨次:确定了演出人员后,再用相同的纸条做成20个号签,上面写上1到20这20个数字,代表演出的挨次,让每个演员抽一张,每人抽到的号签上的数字就是这位演员的演出挨次,再汇总即可.6.(选做题)(2021·洛阳高一检测)现在有一种够级玩耍,其用具为四副扑克,包括大小鬼(又称为花)在内共216张牌,参与人数为6人,并围成一圈.够级开头时,从这6人中随机指定一人从已经洗好的扑克牌中随机抽取一张牌(这叫开牌),然后按逆时针方向,依据这张牌上的数字来确定抓牌的先后,这6人依次从216张牌中抓取36张牌,问这种抓牌的方法是否是简洁随机抽样?解:简洁随机抽样的实质是逐个地从总体中随机抽取样本,而这里只是随机确定了起始的牌,其他各张牌虽然是逐张抓牌,但是各张在谁手里已被确定,只有抽取的第一张扑克牌是随机抽取的,其他215张牌已经确定,即这215张扑克牌被抽取的可能性与第一张扑克牌被抽取的可能性不相同,所以不是简洁随机抽样.。
第2课时统计课后篇巩固探究A组1.下列不具有相关关系的是()A.单产不为常数时,土地面积和总产量B.人的身高与体重C.季节与学生的学习成绩D.学生的学习态度与学习成绩.2.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽取50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是()A.5B.7C.11D.13k==16,即每16人抽取一个人.因为39=2×16+7,所以第1小组中抽取的数为7.3.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.9.4,0.484B.9.4,0.016C.9.5,0.04D.9.5,0.016=9.5.方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.4.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店为() A.2家B.3家C.5家D.13家1:在整个抽样过程中,每个个体被抽到的可能性为,则抽取的中型商店为75×=5(家).方法2:因为大、中、小型商店数的比为30∶75∶195=2∶5∶13,所以抽取的中型商店为20×=5(家).答案:C5.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A.6万元B.8万元C.10万元D.12万元解析:由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为25×=10(万元).答案:C6.从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:分组[90,100) [100,110) [110,120) [120,130) [130,140) [140,150)频数 1 2 3 10 1则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的.解析:由表中可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14.故约占苹果总数的=0.70=70%.答案:70%7.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元 4 2 3 5销售额y/万元49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为元.解析:=3.5,=42,∴=42-9.4×3.5=9.1,∴回归方程为=9.4x+9.1,∴当x=6时,=9.4×6+9.1=65.5..58.现有同一型号的电脑96台,为了了解这种电脑每开机一次所产生的辐射情况,从中抽取10台在同一条件下做开机实验,测量开机一次所产生的辐射,得到如下数据:13.712.914.413.813.312.713.513.613.113.4(1)写出采用简单随机抽样抽取上述样本的过程;(2)根据样本,请估计总体平均数与总体标准差的情况.解:(1)利用随机数表法或抽签法.具体过程如下:方法一(抽签法):①将96台电脑随机编号为1~96;②将以上96个分别写在96X相同的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的容器中,充分搅拌均匀;④从容器中逐个抽取10个号签,每次取完后再次搅拌均匀,并记录上面的;⑤找出和所得对应的10台电脑,组成样本.方法二(随机数表法):①将96台电脑随机编号,编号为00,01,02, (95)②在随机数表中任选一数作为开始,然后依次向右读,每次读两位,凡不在00~95中的数和前面已读过的数跳过不读,直到读出10个符合条件的数;③这10个数所对应的10台电脑即是我们所要抽取的样本.(2)=13.44;s2=≈0.461.故总体平均数为13.44,总体标准差约为0.461.9.对某班50人进行智力测验,其得分如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,5 5,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测试成绩的最大值和最小值各是多少?(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频数分布图.(3)分析这个频数分布图,你能得出什么结论?解:(1)最小值是32,最大值是97.(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,列表如下:区间[30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)频数 1 6 12 14 9 6 2频数分布图如下图所示.(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.10.导学号17504078已知学生的总成绩与数学成绩之间有线性相关关系,下表给出了5名同学在一次考试中的总成绩和数学成绩(单位:分).学生编号1 2 3 4 5成绩总成绩/x482 383 421 364 362数学成绩/y78 65 71 64 61(1)求数学成绩与总成绩的回归直线方程.(2)根据以上信息,如果一个学生的总成绩为450分,试估计这个学生的数学成绩;(3)如果另一位学生的数学成绩为92分,试估计其总成绩是多少?解:(1)列出下表,并进行有关计算.编号x y x2xy1 482 78 232 324 37 5962 383 65 146 689 24 8953 421 71 177 241 29 8914 364 64 132 496 23 2965 362 61 131 044 22 082合计 2 012 339 819 794 137 760由上表可得,可得≈0.132,-0.132×≈14.683.故数学成绩y对总成绩x的回归直线方程为=14.683+0.132x.(2)由(1)得当总成绩x为450分时,=14.683+0.132×450≈74(分),即数学成绩大约为74分.(3)若数学成绩为92分,将=92代入回归直线方程=14.683+0.132x中,得x≈586(分).故估计该生的总成绩在586分左右.B组1.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为()A.1+a,4B.1+a,4+aC.1,4D.1,4+a解析:=+a=1+a.s2===4.答案:A2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则()A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e==5.5,又众数m o=5,平均值(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,故m o<m e<.答案:D3.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为x(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10 000名教师参加了此项活动,如图是此次调查中某一项的程序框图,其输出的结果为6 200,则该市参加活动的教师中平均每年读书本数在0~20之间的频率是()A.3 800B.6 200C.0.38D.0.62解析:由程序框图知,当x>20时,S=S+1,故输出的S值应是10 000名教师中读书本数大于20的人数,故S=6 200,∴在0~20之间的频率为=0.38.答案:C4.(2017某某某某二中高三一模)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得为12的学生,则在第八组中抽得为的学生.解析:由题意得,在第八组中抽得为12+(8-3)×5=37.答案:375.某公司为改善职工的出行条件,随机抽取50名职工,调查他们的居住地与公司的距离d(单位:千米).若样本数据分组为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],由数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司的距离不超过4千米的人数为.解析:样本中职工居住地与公司的距离不超过4千米的频率为(0.1+0.14)×2=0.48,所以样本中职工居住地与公司的距离不超过4千米的人数为50×0.48=24.答案:246.导学号17504079从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125)频数 6 26 38 22 8(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.7.导学号17504080某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68(1)求回归直线方程x+,其中=-20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)=8.5,=80.∵=-20,,∴=80+20×8.5=250.∴回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-20(x-8.25)2+361.25,∴该产品的单价定为8.25元时,工厂获得的利润最大.。
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .23.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>4.某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x的回归方程类型的是( ) A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④7.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,88.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为A .y = x-1B .y = x+1C .y =88+12x D .y = 1769.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .16010.某校高一年级有学生1800人,高二年级有学生1500人,高三年级有1200人,为了调查学生的视力状况,采用分层抽样的方法抽取学生,若在抽取的样本中,高一年级的学生有60人,则该样本中高三年级的学生人数为( ) A .60B .50C .40D .3011.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=15.中医药是反映中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系,是中华文明的瑰宝.某科研机构研究发现,某品种中成药的药物成份A 的含量x (单位:g )与药物功效y (单位:药物单位)之间具有关系:(20)y x x =-.检测这种药品一个批次的5个样本,得到成份A 的平均值为8g ,标准差为2g ,估计这批中成药的药物功效的平均值为__________药物单位.16.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..17.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.18.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.19.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
一、选择题1.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温x C ︒171382月销售量y (件)24334055由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件2.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .724.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生5.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④6.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3 D .丁地:总体均值为2,总体方差为37.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .918.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位9.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1810.已知某企业上半年前5个月产品广告投入与利润额统计如下:由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元11.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.对具有线性相关关系的变量x ,y 有一组观测数据()(),1,2,3,,8i i x y i =,其回归直线方程是12y x a =+,且8116i i x ==∑,8148i i y ==∑,则实数a =__________.15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示:根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.17.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.18.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.19.已知某人连续5次投掷飞镖的环数分别是8,9,10,10,8,则该组数据的方差为______.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.2020年1月末,新冠疫情爆发,经过全国人民的努力,2月中旬,疫情得到了初步的控制,湖北省以外地区的每日新增确诊人数开始减少,某同学针对这个问题,选取他在统计学中学到的一元线性回归模型,作了数学探究:他于2月17日统计了2月7日至16日这十天湖北省以外地区的每日新增确诊人数,表格如下: 日期 2.7 2.8 2.9 2.10 2.11 2.12 2.132.14 2.15 2.16代号x 123 45 6 78910新增确诊人数y558 509444381 377 312 267221166 115y x y x 计算出: 5.5,335x y ==,()()1013955iii x x y y =--=-∑,()210182.5ii x x =-=∑(1)请你帮这位同学计算出y 与x 的线性回归方程(精确到0.1),然后根据这个方程估计湖北省以外地区新增确诊人数为零时的大概日期;附:回归方程y bx a =+中斜率和截距的最小二乘法估计公式分别为:()()()1012101iii ii x x y y b x x ==--=-∑∑,a y bx =-(2)实际上2月17日至2月22日的新增确诊人数如下:出评价.22.据统计某品牌服装专卖店一周内每天获取得纯利润y (百元)与每天销售这种服装件数x (百件)之间有如下一组数据.该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500). (1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程.(精确到0.01) (3)估计每天销售1200件这种服装时获多少纯利润? 附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 23879 33211 23429 78645 60782 52420 74438 15510 01342 99660 27954 参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下:企业数13 40 35 8 4(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).24.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表: 气温()x ℃ 27 29 30 32 33 35 数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.在社会实践活动中,“求知”小组为了研究某种商品的价格x (元)和需求量y (件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料: 日期 11月1日 11月2日 11月3日 11月4日 11月5日 x (元) 14 16 18 20 22 y (件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.3.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯,故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误. 所以说法正确的是①③. 故选B. 【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.6.D解析:D 【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差7.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.8.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.9.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】 根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题. 10.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .726.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s9.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,810.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人. 16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.参考数据:7772111y9.24,t39.75,0.53,7 2.646i i ii i iiy=====⋅≈≈∑∑∑(y-y).参考公式:相关系数()()()()()()11112211,ni i n n nii i i i in ni i ii ii it t y yr t t y y t y t yt t y y======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,ni iiniit t y yb a y btt t==⋅--==-⋅-∑∑.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y关于x的回归直线方程ˆˆˆy bx a=+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni iiniix y nx yx naxb y bx====---∑∑)25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:温度(单位:C︒)212324272932死亡数y(单位:株)61120275777经计算:611266iix x===∑,611336iiy y===∑,()()61557i iix x y y=--=∑,()62184iix x=-=∑,()6213930iiy y=-=∑,()621ˆ236.64iiy y=-=∑,8.0653167e≈,其中ix,iy分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i=.(1)若用线性回归模型,求y关于x的回归方程ˆˆˆy bx a=+(结果精确到0.1);(2)若用非线性回归模型求得y关于x的回归方程0.2303ˆ0.06xy e=,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.3.D解析:D由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kx y ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+, 令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.5.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=,【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.9.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】 (1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53iii i t t t y y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑。
最新北师大版高中数学必修三测试题全套及答案章末综合测评(一)统计(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.为了调查全国人口的寿命,抽查了十一个省(市)的2 500名城镇居民,这个问题中“2 500名城镇居民的寿命的全体”是()A.总体B.个体C.样本D.样本容量【解析】每个人的寿命是个体,抽出的2 500名城镇居民的寿命的全体是从总体中抽取的一个样本.【答案】 C2.为了了解1 200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为()A.40B.30C.20D.12【解析】系统抽样也叫间隔抽样,抽多少就分成多少组,总数除以组数=间隔数,即k=1 20040=30.【答案】 B3.一个容量为80的样本中数据的最大值是140,最小值是51,组距是10,则应将样本数据分为()A.10组B.9组C.8组D.7组【解析】根据频率分布表的步骤,极差组距=140-5110=8.9,所以分成9组.【答案】 B4.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12C.13 D.14【解析】依据系统抽样的特点分42组,每组20人,区间[481,720]包含25组到36组,每组抽一个,则抽到的人数为12.【答案】 B5.甲、乙两名篮球运动员在某几场比赛中得分的茎叶图如图1所示,则甲、乙两人在这几场比赛中得分的中位数之和是()图1A.63 B.64C.65 D.66【解析】由茎叶图知甲比赛得分的中位数为36,乙比赛得分的中位数为27,故甲、乙两人得分的中位数之和为27+36=63.【答案】 A6.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球数的标准差为0.3.下列说法中,正确的个数为()①甲队的进球技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.A.1 B.2C.3 D.4【解析】因为甲队的平均进球数比乙队多,所以甲队技术较好,①正确;乙队的标准差比甲队小,标准差越小越稳定,所以乙队发挥稳定,②也正确;乙队平均每场进球数为1.8,所以乙队几乎每场都进球,③正确;由于s甲=3,s乙=0.3,所以甲队与乙队相比,不稳定,所以甲队的表现时好时坏,④正确,故选D.【答案】 D7.某学校为调查学生的学习情况,对学生的课堂笔记进行了抽样调查,已知某班级一共有56名学生,根据学号(001~056),用系统抽样的方法抽取一个容量为4的样本,已知007号、021号、049号在样本中,那么样本中还有一个学生的学号为()A.014 B.028C.035 D.042【解析】由系统抽样的原理知,抽样的间隔为564=14,故第一组的学号为001~014,所以007为第一组内抽取的学号,所以第二组抽取的学号为021;第三组抽取的学号为035;第四组抽取的学号为049.故选C.【答案】 C8.从800件产品中抽取60件进行质检,利用随机数表法抽取样本时,先将800件产品按001,002,…,800进行编号.如果从随机数表第8行第8列的数8开始往右读数(随机数表第7行至第9行的数如下),则抽取的第4件产品的编号是()844217533157245506887704744767217633502583921206766301637859169556671998105071751286735807443952387933211234297864560782524207443815510013429966027954A.169 B.556C.671 D.105【解析】找到第8行第8列的数8,并开始向右读,每次读取三位,凡不在001~800中的数跳过去不读,前面已经读过的也跳过去不读,从而最先抽取的4件产品的编号依次是169,556,671,105.故抽取的第4件产品的编号是105.【答案】 D9.对具有线性相关关系的变量x,Y有一组观测数据(x i,y i)(i=1,2,…,8),其回归直线方程是:y=16x+a,且x1+x2+x3+…+x8=3,y1+y2+y3+…+y8=6,则a=()A.116 B.18C.14D.1116【解析】 因为x 1+x 2+x 3+…+x 8=3,y 1+y 2+y 3+…+y 8=6, 所以x =38,y =34,所以样本中心点的坐标为⎝ ⎛⎭⎪⎫38,34,代入回归直线方程得34=16×38+a ,所以a =1116. 【答案】 D10.(2015·安徽高考)若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为( )A .8B .15C .16D .32【解析】 已知样本数据x 1,x 2,…,x 10的标准差为s =8,则s 2=64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为22s 2=22×64,所以其标准差为22×64=2×8=16,故选C.【答案】 C11.(2015·福建高考)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程y =b x +a ,其中b =0.76,a =y -b x .据此估计,该社区一户年收入为15万元家庭的年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元【解析】 由题意知,x =8.2+8.6+10.0+11.3+11.95=10,y =6.2+7.5+8.0+8.5+9.85=8,∴a ^=8-0.76×10=0.4,∴当x =15时,y ^=0.76×15+0.4=11.8(万元). 【答案】 B12.(2016·日照高一检测)样本(x 1,x 2,…,x n )的平均数为x ,样本(y 1,y 2,…,y m )的平均数为y (x ≠y ).若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z =ax +(1-a )y ,其中0<a <12,则n ,m 的大小关系为( )A .n <mB .n >mC .n =mD .不能确定【解析】 由题意知,样本(x 1,…,x n ,y 1,…,y m )的平均数为z =nx +my m +n=nn +m x +m n +m y ,且z =ax +(1-a )y ,所以a =n n +m ,1-a =m n +m .又因为0<a <12,所以0<n n +m<12,解得n <m . 【答案】 A二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上) 13.(2015·江苏高考)已知一组数据4,6,5,8,7,6,那么这组数据的平均数为______. 【解析】 x -=4+6+5+8+7+66=6.【答案】 614.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t/hm 2):【解析】 由题意,需比较s 2甲与s 2乙的大小.由于x 甲=x 乙=10,s 2甲=0.02,s 2乙=0.244,则s 2甲<s 2乙,因此甲产量比较稳定. 【答案】 甲15.(2015·湖北高考)某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图2所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.图2【解析】(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000.【答案】(1)3(2)6 00016.(2016·潍坊高一检测)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17].将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,图3是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.图3【解析】因为第一组与第二组共有20人,并且根据图像知第一组与第二组的频率之比=12.又因为第一组与第三组的频率之比是是0.24∶0.16=3∶2,所以第一组的人数为20×350.24∶0.36=2∶3,所以第三组有12÷23=18人.因为第三组中没有疗效的人数为6,所以第三组中有疗效的人数是18-6=12.【答案】 12三、解答题(本大题共6小题,共70分,解答应写出必要的文字说明,证明过程或演算步骤)17.(本小题满分10分)某校高中三年级有503名学生,为了了解他们的身体状况,准备按1∶10的比例抽取一个样本,试用系统抽样方法进行抽取,并写出抽样过程.【解】 (1)用简单随机抽样法从503名学生中剔除3名学生. (2)采用随机的方式将500名学生编号为1,2,3,…,500. (3)确定分段间隔,样本容量为500×110=50, 分段间隔k =50050=10,即将500名学生分成50部分,其中每一部分包括10名学生,即把1,2,3,…,500均分成50段.(4)在第一段用简单随机抽样法确定起始的个体编号l ,例如,l =8.(5)按照事先确定的规则抽取样本:从8号起,每隔10个抽取1个号码,这样得到一个容量为50的样本:8,18,28,38,…,488,498.编号为8,18,28,…,488,498的学生便作为抽取的一个样本参与试验.18.(本小题满分12分)两台机床同时生产一种零件,在10天中,两台机床每天的次品数如下:甲:1,0,2,0,2,3,0,4,1,2; 乙:1,3,2,1,0,2,1,1,0,1.(1)哪台机床次品数的平均数较小? (2)哪台机床的生产状况比较稳定? 【解】 (1)x甲=(1+0+2+0+2+3+0+4+1+2)×110=1.5,x乙=(1+3+2+1+0+2+1+1+0+1)×110=1.2.∵x甲>x乙,∴乙车床次品数的平均数较小.(2)s2甲=110[(1-1.5)2+(0-1.5)2+(2-1.5)2+(0-1.5)2+(2-1.5)2+(3-1.5)2+(0-1.5)2+(4-1.5)2+(1-1.5)2+(2-1.5)2]=1.65,同理s2乙=0.76,∵s2甲>s2乙,∴乙车床的生产状况比较稳定.19.(本小题满分12分)为了了解小学生的体能情况,抽取了某校一个年级的部分学生进行一分钟跳绳次数测试,将取得数据整理后,画出频率分布直方图(如图4).已知图中从左到右前三个小组频率分别为0.1,0.3,0.4,第一小组的频数为5.图4(1)求第四小组的频率;(2)参加这次测试的学生有多少人;(3)若次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率是多少.【解】(1)由累积频率为1知,第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,∴x=50.即参加这次测试的学生有50人.(3)达标率为0.3+0.4+0.2=0.9,∴估计该年级学生跳绳测试的达标率为90%.20.(本小题满分12分)为了了解中学生的身体发育情况,对某一中学同年龄的50名男生的身高进行了测量,结果如下:[157,161)3人;[161,165)4人;[165,169)12人;[169,173)13人;[173,177)12人;[177,181]6人.(1)列出频率分布表;(2)画出频率分布直方图;(3)估计总体在[165,177)间的比例.【解】(1)列出频率分布表:分组频数频率频率组距[157,161)30.060.015[161,165)40.080.02[165,169)120.240.06[169,173)130.260.065[173,177)120.240.06[177,181]60.120.03合计50 1.00(2)画出频率分布直方图如图:(3)因0.24+0.26+0.24=0.74,所以估计总体在[165,177)间的比例为74%.21.(本小题满分12分)(2014·全国卷Ⅱ)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:甲部门乙部门3 5 9440 4 4 89 75 1 2 2 4 5 6 6 7 7 7 8 99 7 6 6 5 3 3 2 1 1 060 1 1 2 3 4 6 8 89 8 8 7 7 7 6 6 5 5 5 5 5 4 4 4 3 3 3 2 1 0 070 0 1 1 3 4 4 96 6 5 5 2 0 0 8 1 2 3 3 4 56 3 2 2 2 090 1 1 4 5 6100 0 0(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.【解】(1)由所给茎叶图知,将50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本的中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.22.(本小题满分12分)(2015·广东高考)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图6.图6(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?【解】(1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1得x=0.007 5,∴直方图中x的值为0.007 5.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.009 5+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a,则(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,解得a=224,即中位数为224.(3)月平均用电量在[220,240)的用户有0.012 5×20×100=25(户),同理可求月平均用电量为[240,260),[260,280),[280,300]的用户分别有15户、10户、5户,故抽取比例为1125+15+10+5=1 5,∴从月平均用电量在[220,240)的用户中应抽取25×15=5(户).章末综合测评(二)算法初步一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下面的叙述中,不是解决问题的算法的是()A.从北京到海南岛旅游,先坐火车,再坐飞机抵达B.按顺序进行下列运算:1+1=2,2+1=3,3+1=4,…,99+1=100C.方程x2-4=0有两个实根D.求1+2+3+4+5的值,先计算1+2=3,再计算3+3=6,6+4=10,10+5=15,最终结果为15【解析】算法是解决某类问题的一系列步骤或程序,C只是描述了事实,没有解决问题的步骤.【答案】 C2.用二分法求方程x2-10=0的近似根的算法中要用哪种算法结构()A.顺序结构B.选择结构C.循环结构D.以上都用【解析】由求方程x2-10=0的近似根的算法设计知以上三种结构都用到.【答案】 D3.下列程序中的For语句终止循环时,S等于()S=0For M=1To10S=S+MNext输出S.A.1B.5C.10D.55【解析】S=0+1+2+3+…+10=55.【答案】 D4.下列给出的赋值语句中正确的是()A.0=M B.x=-xC.B=A=-3 D.x+y=0【解析】赋值语句不能计算,不能出现两个或两个以上的“=”且变量在“=”左边.【答案】 B5.当A=1时,下列程序输入A;A=A*2A=A*3A=A*4A=A*5输出A.输出的结果A是()A.5 B.6C.15 D.120【解析】运行A=A*2得A=1×2=2.运行A=A*3得A=2×3=6.运行A=A*4得A=6×4=24.运行A=A*5得A=24×5=120.即A=120.故选D.【答案】 D6.(2014·福建高考)阅读如图1所示的程序框图,运行相应的程序,输出的n的值为()图1A.1 B.2C.3 D.4【解析】当n=1时,21>12成立,执行循环,n=2;当n=2时,22>22不成立,结束循环,输出n=2,故选B.【答案】 B7.(2016·菏泽高一检测)执行如图2所示的算法框图,输出的S值为()图2A.2 B.4C.8 D.16【解析】运行如下:①k=0,S=1;②S=1×20=1,k=1;③S=1×21=2,k=2;④S =2×22=8,k =3.此时输出S .【答案】 C8.(2015·福建高考)阅读如图3所示的程序框图,运行相应的程序,若输入x 的值为1,则输出y 的值为( )图3A .2B .7C .8D .128【解析】 由程序框图知,y =⎩⎪⎨⎪⎧2x ,x ≥2,9-x ,x <2.∵输入x 的值为1,比2小,∴执行的程序要实现的功能为9-1=8,故输出y 的值为8. 【答案】 C9.(2016·北京高考)执行如图4所示的程序框图,若输入的a 值为1,则输出的k 值为( )图4A .1B .2C .3D .4【解析】 开始a =1,b =1,k =0;第一次循环a=-1,k=1;2第二次循环a=-2,k=2;第三次循环a=1,条件判断为“是”,跳出循环,此时k=2.【答案】 B10.阅读如图5所示的算法框图,若输出s的值为-7,则判断框内可填写()图5A.i≥3 B.i≥4C.i≥5 D.i≥6【解析】此算法框图运行如下:①i=1,s=2;②s=1,i=3;③s=-2,i=5;④s =-7,i=7此时应结束循环.所以i=5时不满足循环条件,i=7时满足循环条件.【答案】 D11.当a=16时,下面的算法输出的结果是()If a<10 Theny=2*aElsey=a *aEnd If输出y.A.9B.32 C .10D .256【解析】 该程序是求分段函数y =⎩⎪⎨⎪⎧2a (a <10),a 2(a ≥10)的函数值,所以当a =16时y =162=256.【答案】 D12.阅读如图6所示的程序框图,运行相应的程序,若输入m 的值为2,则输出的结果i =( )图6A .2B .3C .4D .5【解析】 m =2,A =1,B =1,i =0. 第一次:i =0+1=1,A =1×2=2, B =1×1=1,A >B ;第二次:i =1+1=2,A =2×2=4, B =1×2=2,A >B ;第三次:i =2+1=3,A =4×2=8, B =2×3=6,A >B ;第四次:i =3+1=4,A =8×2=16, B =6×4=24,A <B . 终止循环,输出i =4.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上)13.如图7是求12+22+32+…+1002的值的算法框图,则正整数n=________.图7【解析】由题意知s=12+22+32+…+1002,先计算s=s+i2,i再加1,故n=100.【答案】10014.下面的程序运行后输出的结果是________.x=1i=1Dox=x+1i=i+1Loop While i<=5输出x.【解析】每循环一次时,x与i均增加1直到i>5时为止,所以输出的结果为6.【答案】 615.如图8给出一个程序框图,其作用是输入x的值,输出相应的y的值,若要使输入的x的值与输出的y的值相等,则这样的x的值的集合为________.图8【解析】这个程序框图对应的函数为y =⎩⎪⎨⎪⎧x 2,x ≤2,2x -3,2<x ≤5,1x ,x >5.当x ≤2时,由x 2=x ,得x =0或1; 当2<x ≤5时,由2x -3=x ,得x =3;当x >5时,由1x =x ,得x =±1(舍),故x =0或1或3.【答案】 {0,1,3} 16.已知程序:【解析】 由程序知,当x >0时, 3x2+3=6.解得x =2; 当x <0时,-3x 2+5=6,解得x =-23, 显然x =0不成立. 【答案】 2或-23三、解答题(本大题共6小题,共70分,解答应写出必要的文字说明,证明过程或演算步骤) 17.(本小题满分10分)下面给出了一个问题的算法: 1.输入x .2.若x ≥4,则y =2x -1;否则,y =x 2-2x +3.3.输出y .问题:(1)这个算法解决的问题是什么? (2)当输入的x 值为多少时,输出的y 值最小?【解】 (1)这个算法解决的问题是求分段函数y =⎩⎪⎨⎪⎧2x -1,x ≥4,x 2-2x +3,x <4的函数值.(2)当x ≥4时,y =2x -1≥7;当x <4时,y =x 2-2x +3=(x -1)2+2≥2,所以y min =2,此时x =1.即当输入的x 值为1时,输出的y 值最小.18.(本小题满分12分)将某科成绩分为3个等级:85分~100分为“A”;60分~84分为“B”;60分以下为“C”.试用条件语句表示某个成绩等级的程序(分数为整数).【解】 程序:19.(本小题满分12分)已知函数y =⎩⎪⎨⎪⎧2x +1,x <0,1,x =0,x 2+1,x >0.画出算法框图并编写算法语句,输入自变量x 的值,输出相应的函数值. 【解】 算法框图如图所示:算法语句如下:输入x;If x<0 Theny=2*x+1ElseIf x=0 Theny=1Elsey=x2+1End IfEnd If输出y.20.(本小题满分12分)给出30个数:1,2,4,7,…,其规律是:第1个数是1,第2个数比第1个数大1,第3个数比第2个数大2,第4个数比第3个数大3,依此类推.要计算这30个数的和,现已给出了解决该问题的算法框图(如图9所示),图9(1)请在图中处理框内①处和判断框中的②处填上合适的语句,使之能完成该题算法功能;(2)根据算法框图写出算法.【解】 (1)因为是求30个数的和.故循环体应执行30次,其中i 是计数变量,因此判断框内的条件就是限制计数变量i 的,故应为i >30.算法中的变量p 实质是表示参与求和的各个数,由于它也是变化的,且满足第i 个数比其前一个数大i -1,第i +1个数比其前一个数大i ,故应有p =p +i .故①处应填p =p +i ;②处应填i >30.(2)根据框图.写出算法如下: i =1 p =1 S =0 Do S =S +p p =p +i i =i +1Loop While i <=30 输出S .21.(本小题满分12分)如图10所示,在边长为4的正方形ABCD 的边上有一点P ,沿着折线BCDA 由点B (起点)向点A (终点)运动.设点P 运动的路程为x ,△APB 的面积为y ,求y 与x 之间的函数关系式.并写出算法,画出算法框图,写出程序.图10【解】 函数关系如下 y =⎩⎪⎨⎪⎧2x (0≤x ≤4),8(4<x ≤8),2(12-x )(8<x ≤12).算法如下: 1.输入x .2.如果0≤x ≤4,则使y =2x ;否则执行3. 3.如果4<x ≤8,则使y =8;否则执行4.4.如果8<x≤12,则使y=2(12-x);否则结束.5.输出y.算法框图如图所示:算法语句:输入x;If x>=0And x<=4Theny=2*xElseIf x<=8Theny=8ElseIf x<=12Theny=2*(12-x)End IfEnd IfEnd If输出y.22.(本小题满分12分)设计一个算法,求满足1×2+2×3+…+n×(n+1)<1 000的最大整数n,画出框图,并用循环语句描述.【解】算法框图如下所示:用语句描述为:n=0S=0Don=n+1S=S+n*(n+1)Loop While S<1 000输出n-1.章末综合测评(三)概率(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列事件:①如果a,b是实数,那么b+a=a+b;②某地1月1日刮西北风;③当x是实数时,x2≥0;④一个电影院某天的上座率超过50%,其中是随机事件的有() A.1个B.2个C.3个D.4个【解析】由题意可知①③是必然事件,②④是随机事件.【答案】 B2.(2016·全国卷Ⅱ)从区间[0,1]随机抽取2n个数x1,x2,…,x n,y1,y2,…,y n,构成n 个数对(x1,y1),(x2,y2),…,(x n,y n),其中两数的平方和小于1的数对共有m个,则用随机模拟的方法得到的圆周率π的近似值为()A.4nm B.2nmC.4mn D.2mn【解析】分别确定n个数对(x1,y1),(x2,y2),…,(x n,y n)和m 个两数的平方和小于1的数对所在的平面区域,再用随机模拟的方法和几何概型求出圆周率π的近似值.因为x1,x2,…,x n,y1,y2,…,y n都在区间[0,1]内随机抽取,所以构成的n个数对(x1,y1),(x2,y2),…,(x n,y n)都在正方形OABC内(包括边界),如图所示.若两数的平方和小于1,则对应的数对在扇形OAC内(不包括扇形圆弧上的点所对应的数对),故在扇形OAC内的数对有m个.用随机模拟的方法可得S扇形S正方形=mn,即π4=mn,所以π=4mn.【答案】 C3.从含有3个元素的集合中任取一个子集,所取的子集是含有两个元素的集合的概率是()A.310 B.112C.4564 D.38【解析】所有子集共8个,其中含有2个元素的为{a,b},{a,c},{b,c},所以概率为38.【答案】 D4.(2016·山东青岛一模)如图1所示,四个相同的直角三角形与中间的小正方形拼成一个边长为2的大正方形,若直角三角形中较小的锐角θ=π6.现在向该正方形区域内随机地投掷一枚飞镖,则飞镖落在小正方形内的概率是()图1A.2-32B.2+32 C.1+32D.1-32【解析】 易知小正方形的边长为3-1,故小正方形的面积为S 1=(3-1)2=4-23,大正方形的面积为S =2×2=4,故飞镖落在小正方形内的概率P =S 1S =4-234=2-32.【答案】 A5.4张卡片上分别写有数字1,2,3,4.从这4张卡片中随机抽取2张,则抽取的2张卡片上的数字之和为奇数的概率为( )A.13B.12C.23D.34【解析】 基本事件为(1,2),(1,3),(1,4),(2,3),(2,4),(3,4)共6个,其中两数字之和为奇数的有(1,2),(2,3),(1,4),(3,4),所以概率为23.【答案】 C6.在面积为S 的△ABC 的边AB 上任取一点P ,则△PBC 的面积不小于S3的概率是( ) A.23 B.13 C.34D.14【解析】 如图,设点M 为AB 的三等分点,要使△PBC 的面积不小于S3,则点P 只能在AM 上选取,由几何概型的概率公式得所求概率|AM ||AB |=23|AB ||AB |=23.【答案】 A7.(2016·东北八校二模)甲、乙两人玩猜数字游戏,先由甲心中想一个数字,记为a ,再由乙猜甲刚才所想的数字,把乙猜的数字记为b ,其中a ,b ∈{1,2,3,4,5,6},若|a -b |≤1,就称甲、乙“心有灵犀”.现任意找两人玩这个游戏,则他们“心有灵犀”的概率为( )A.19 B.29 C.718D.49【解析】 任意找两人玩这个游戏,共有6×6=36种猜数字结果,其中满足|a -b |≤1的有如下情形:①a =1,b =1,2;②a =2,b =1,2,3;③a =3,b =2,3,4;④a =4,b =3,4,5;⑤a =5,b =4,5,6;⑥a =6,b =5,6,总共16种,故他们“心有灵犀”的概率为P =1636=49.【答案】 D8.ABCD 为长方形,AB =2,BC =1,O 为AB 的中点,在长方形ABCD 内随机取一点,取到的点到O 的距离大于1的概率为( )A.π4 B .1-π4 C.π8D .1-π8【解析】 长方形面积为2,以O 为圆心,1为半径作圆,在矩形内部的部分(半圆)面积为π2,因此取到的点到O 的距离小于1的概率为π2,取到的点到O 的距离大于1的概率为2-π22=1-π4.【答案】 B9.设a 是甲抛掷一枚骰子得到的点数,则方程x 2+ax +2=0有两个不相等的实数根的概率为( )A.23B.13C.12D.512【解析】 若方程有实根,则a 2-8>0.a 的所有取值情况共6种,满足a 2-8>0的有4种情况,故P =46=23.【答案】 A10.(2016·石家庄高一检测)有分别写着数字1到120的120张卡片,从中取出1张,这张卡片上的数字是2的倍数或是3的倍数的概率是( )A.12B.34C.47D.23【解析】 是2的倍数的数有60个,是3的倍数的数有40个,是6的倍数的数有20个,∴P =60+40-20120=23.【答案】 D11.(2015·湖北高考)在区间[0,1]上随机取两个数x ,y ,记p 1为事件“x +y ≤12”的概率,p 2为事件“xy ≤12”的概率,则( )A .p 1<p 2<12 B .p 2<12<p 1 C.12<p 2<p 1D .p 1<12<p 2【解析】 如图,满足条件的x ,y 构成的点(x ,y )在正方形OBCA 内,其面积为1.事件“x +y ≤12”对应的图形为阴影△ODE ,其面积为12×12×12=18,故p 1=18<12,事件“xy ≤12”对应的图形为斜线表示部分,其面积显然大于12,故p 2>12,则p 1<12<p 2,故选D.【答案】 D12.如图2所示,在矩形ABCD 中,AB =5,AD =7.现在向该矩形内随机投一点P ,则∠APB >90°的概率为( )图2A.536B.556πC.18πD.18【解析】 由于是向该矩形内随机投一点P ,点P 落在矩形内的机会是均等的,故可以认为矩形ABCD 为区域Ω.要使得∠APB >90°,需满足点P 落在以线段AB 为直径的半圆内,以线段AB 为直径的半圆可看作区域A .记“点P 落在以线段AB 为直径的半圆内”为事件A ,于是求∠APB >90°的概率转化为求以线段AB 为直径的半圆的面积与矩形ABCD 的面积的比,依题意,得μA =12π×⎝ ⎛⎭⎪⎫522=25π8,矩形ABCD 的面积μΩ=35,故所求的概率为P (A )=25π835=5π56.【答案】 B二、填空题(本大题共4小题,每小题5分,共20分,将答案填在题中的横线上) 13.某产品分一、二、三级,其中一、二级是正品,若生产中出现正品的概率是0.98,二级品的概率是0.21,则出现一级品与三级品的概率分别是________,________.【解析】 由题意知出现一级品的概率是0.98-0.21=0.77,又由对立事件的概率公式可得出现三级品的概率是1-0.98=0.02.【答案】 0.77 0.0214.如图3的矩形,长为5 m ,宽为2 m ,在矩形内随机地撒300粒黄豆,数得落在阴影部分的黄豆数为138粒,则我们可以估计出阴影部分的面积为________m 2.图3【解析】 由题意得138300=S 阴5×2,S 阴=235.【答案】 23515.在箱子中装有十张卡片,分别写有1到10的十个整数;从箱子中任取一张卡片,记下它的读数x ,然后再放回箱子中;第二次再从箱子中任取一张卡片,记下它的读数y ,则x +y 是10的倍数的概率为________.【解析】 先后两次取卡片,形成的有序数对有(1,1),(1,2),(1,3),…,(1,10),…,(10,10),共计100个.因为x +y 是10的倍数,这些数对应该是(1,9),(2,8),(3,7),(4,6),(5,5),(6,4),(7,3),(8,2),(9,1),(10,10)共10个,故x +y 是10的倍数的概率为P =10100=110.【答案】 11016.(2015·重庆高考)在区间[0,5]上随机地选择一个数p ,则方程x 2+2px +3p -2=0有两个负根的概率为________.【解析】 ∵方程x 2+2px +3p -2=0有两个负根, ∴⎩⎪⎨⎪⎧Δ=4p 2-4(3p -2)≥0,x 1+x 2=-2p <0,x 1x 2=3p -2>0,解得23<p ≤1或p ≥2.故所求概率P =⎝ ⎛⎭⎪⎫1-23+(5-2)5-0=23.【答案】23三、解答题(本大题共6小题,共70分,解答应写出必要的文字说明,证明过程或演算步骤)17.(本小题满分10分)某饮料公司对一名员工进行测试以便确定其考评级别,公司准备了两种不同的饮料共5杯,其颜色完全相同,并且其中3杯为A 饮料,另外2杯为B 饮料,公司要求此员工一一品尝后,从5杯饮料中选出3杯A 饮料,若该员工3杯都选对,则评为优秀;若3杯选对2杯,则评为良好;否则评为合格.假设此人对A 和B 两种饮料没有鉴别能力.(1)求此人被评为优秀的概率; (2)求此人被评为良好及以上的概率.【解】 将5杯饮料编号为1,2,3,4,5,编号1,2,3表示A 饮料,编号4,5表示B 饮料,则从5种饮料中选出3杯的所有可能情况为(1,2,3),(1,2,4),(1,2,5),(1,3,4),(1,3,5),(1,4,5),(2,3,4),(2,3,5),(2,4,5),(3,4,5),共有10种,令D 表示此人被评为优秀的事件,E 表示此人被评为良好的事件,F 表示此人被评为良好及以上的事件,则(1)P (D )=110.(2)P (E )=35,P (F )=P (D )+P (E )=710.18.(本小题满分12分)将一颗质地均匀的正方体骰子(六个面的点数分别为1,2,3,4,5,6)先后抛掷两次,记第一次出现的点数为x ,第二次出现的点数为y .(1)求事件“x +y ≤3”的概率; (2)求事件“|x -y |=2”的概率.【解】 设(x ,y )表示一个基本事件,则掷两次骰子包括(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),…,(6,5),(6,6),共36个基本事件.(1)用A 表示事件“x +y ≤3”,则A 的结果有(1,1),(1,2),(2,1),共3个基本事件. ∴P (A )=336=112.即事件“x +y ≤3”的概率为112. (2)用B 表示事件“|x -y |=2”,则B 的结果有(1,3),(2,4),(3,5),(4,6),(6,4),(5,3),(4,2),(3,1)共8个基本事件. ∴P (B )=836=29.即事件“|x -y |=2”的概率为29.19.(本小题满分12分)在甲、乙两个盒子中分别装有标号为1,2,3,4,5的五个球,现从甲、乙两个盒子中各取出1个球,每个球被取出的可能性相等.(1)求取出的两个球上标号为相邻整数的概率;(2)求取出的两个球上标号之和与标号之积都不小于5的概率.【解】 设从甲、乙两个盒子中各取出1个球,编号分别为x ,y ,用(x ,y )表示抽取的结果,结果有以下25种:(1,1),(1,2),(1,3),(1,4),(1,5),(2,1),(2,2),(2,3),(2,4),(2,5),(3,1),(3,2),(3,3),(3,4),(3,5),(4,1),(4,2),(4,3),(4,4),(4,5),(5,1),(5,2),(5,3),(5,4),(5,5).(1)取出的两个球上标号为相邻整数的结果有以下8种:(1,2),(2,1),(2,3),(3,2),(3,4),(4,3),(4,5),(5,4),故所求概率为P =825,即取出的两个球上标号为相邻整数的概率为825.(2)标号之和与标号之积都不小于5的结果有以下17种:(1,5),(2,3),(2,4),(2,5),(3,2),(3,3),(3,4),(3,5),(4,2),(4,3),(4,4),(4,5),(5,1),(5,2),(5,3),(5,4),(5,5),故所求概率为P =1725,故取出的两个球上标号之和与标号之积都不小于5的概率是1725.20. (本小题满分12分)把一颗骰子抛掷两次,第一次出现的点数记为a ,第二次出现的点数记为b .试就方程组⎩⎨⎧ ax +by =3,x +2y =2解答下列各题: (1)求方程组只有一组解的概率;(2)求方程组只有正数解(x 与y 都为正)的概率.【解】 (1)当且仅当a b ≠12时,方程组只有一组解;a b =12的情况有三种:⎩⎪⎨⎪⎧ a =1,b =2或⎩⎪⎨⎪⎧ a =2,b =4或⎩⎪⎨⎪⎧a =3,b =6.而抛掷两次的所有情况有6×6=36(种),所以方程组只有一组解的概率为P =1-336=1112.(2)因为方程组只有正数解,所以两直线的交点一定在第一象限,解方程组得 ⎩⎪⎨⎪⎧ x =6-2b 2a -b ,y =2a -32a -b .当⎩⎪⎨⎪⎧ 2a -b >0,6-2b >0,2a -3>0,或⎩⎪⎨⎪⎧ 2a -b <0,6-2b <0,2a -3<0,且a >0,b >0,。
章末综合测评(三) 概率(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列事件中,随机事件的个数为( )①在学校明年召开的田径运动会上,学生张涛获得100米短跑冠军;②在体育课上,体育老师随机抽取一名学生去拿体育器材,抽到李凯;③从标有1,2,3,4的4张号签中任取一张,恰为1号签; ④在标准大气压下,水在4℃时结冰. A .1 B .2 C .3D .4【解析】 ①在明年运动会上,可能获冠军,也可能不获冠军.②李凯不一定被抽到.③任取一张不一定为1号签.④在标准大气压下水在4℃时不可能结冰,故①②③是随机事件,④是不可能事件.【答案】 C2.下列说法正确的是( )A .甲、乙二人比赛,甲胜的概率为35,则比赛5场,甲胜3场 B .某医院治疗一种疾病的治愈率为10%,前9个病人没有治愈,则第10个病人一定治愈C .随机试验的频率与概率相等D .天气预报中,预报明天降水概率为90%,是指降水的可能性是90%【解析】 概率只是说明事件发生的可能性大小,其发生具有随机性.故选D.【答案】 D3.(2016·开封高一检测)给甲、乙、丙三人打电话,若打电话的顺序是任意的,则第一个打电话给甲的概率是( )A.16 B .13 C.12D .23【解析】 给三人打电话的不同顺序有6种可能,其中第一个给甲打电话的可能有2种,故所求概率为P =26=13.故选B.【答案】 B4.在区间[-2,1]上随机取一个数x ,则x ∈[0,1]的概率为( ) A.13 B .14 C.12D .23【解析】 由几何概型的概率计算公式可知x ∈[0,1]的概率P =1-01-(-2)=13.故选A. 【答案】 A5.1升水中有1只微生物,任取0.1升化验,则有微生物的概率为()A.0.1 B.0.2C.0.3 D.0.4【解析】本题考查的是体积型几何概型.【答案】 A6.(2016·天水高一检测)从一批产品中取出三件产品,设A=“三件产品全不是次品”,B=“三件产品全是次品”,C=“三件产品不全是次品”,则下列结论正确的是()A.A与C互斥B.B与C互斥C.任何两个均互斥D.任何两个均不互斥【解析】互斥事件是不可能同时发生的事件,所以B与C互斥.【答案】 B7.某人从甲地去乙地共走了500 m,途中要过一条宽为x m的河流,他不小心把一件物品丢在途中,若物品掉在河里就找不到,若物品不掉在河里,则能找到,已知该物品能找到的概率为45,则河宽为()A.100 m B.80 m C.50 m D.40 m【解析】设河宽为x m,则1-x500=45,所以x=100.【答案】 A8.从一批羽毛球中任取一个,如果其质量小于4.8 g 的概率是0.3,质量不小于4.85 g 的概率是0.32,那么质量在[4.8,4.85)范围内的概率是( )A .0.62B .0.38C .0.70D .0.68【解析】 记“取到质量小于4.8 g ”为事件A ,“取到质量不小于4.85 g ”为事件B ,“取到质量在[4.8,4.85)范围内”为事件C .易知事件A ,B ,C 互斥,且A ∪B ∪C 为必然事件.所以P (A ∪B ∪C )=P (A )+P (B )+P (C )=0.3+0.32+P (C )=1,即P (C )=1-0.3-0.32=0.38.【答案】 B9.如图1,矩形ABCD 中,点E 为边CD 的中点,若在矩形ABCD 内部随机取一个点Q ,则点Q 取自△ABE 内部的概率等于( ) 【导学号:28750071】图1A.14 B .13 C.12D .23【解析】 点E 为边CD 的中点,故所求的概率P =△ABE 的面积矩形ABCD 的面积=12.【答案】 C10.将区间[0,1]内的均匀随机数x 1转化为区间[-2,2]内的均匀随机数x ,需要实施的变换为( )A .x =x 1*2B .x =x 1*4C .x =x 1*2-2D .x =x 1*4-2【解析】 由题意可知x =x 1*(2+2)-2=4x 1-2. 【答案】 D11.先后抛掷两颗骰子,设出现的点数之和是12,11,10的概率依次是P 1,P 2,P 3,则( )A .P 1=P 2<P 3B .P 1<P 2<P 3C .P 1<P 2=P 3D .P 3=P 2<P 1【解析】 先后抛掷两颗骰子的点数共有36个基本事件:(1,1),(1,2),(1,3),…,(6,6),并且每个基本事件都是等可能发生的.而点数之和为12的只有1个:(6,6);点数之和为11的有2个:(5,6),(6,5);点数之和为10的有3个:(4,6),(5,5),(6,4),故P 1<P 2<P 3.【答案】 B12.在5件产品中,有3件一等品和2件二等品,从中任取2件,则下列选项中以710为概率的事件是( )A .恰有1件一等品B .至少有一件一等品C .至多有一件一等品D .都不是一等品【解析】 将3件一等品编号为1,2,3,2件二等品编号为4,5,从中任取2件有10种取法:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5).其中恰含有1件一等品的取法有:(1,4),(1,5),(2,4),(2,5),(3,4),(3,5),恰有1件一等品的概率为P 1=610,恰有2件一等品的取法有:(1,2),(1,3),(2,3).故恰有2件一等品的概率为P 2=310,其对立事件是“至多有一件一等品”,概率为P 3=1-P 2=1-310=710.【答案】 C二、填空题(本大题共4小题,每小题5分,共20分,把答案填在题中横线上).13.一个袋子中有5个红球,3个白球,4个绿球,8个黑球,如果随机地摸出一个球,记A ={摸出黑球},B ={摸出白球},C ={摸出绿球},D ={摸出红球},则P (A )=________;P (B )=________;P (C ∪D )=________.【解析】 由古典概型的算法可得P (A )=820=25,P (B )=320,P (C ∪D )=P (C )+P (D )=420+520=920.【答案】 25 320 92014.在区间(0,1)内任取一个数a ,能使方程x 2+2ax +12=0有两个相异实根的概率为________.【解析】 方程有两个相异实根的条件是Δ=(2a )2-4×1×12=4a 2-2>0,解得|a |>22,又a ∈(0,1),所以22<a <1,区间⎝ ⎛⎭⎪⎫22,1的长度为1-22,而区间(0,1)的长度为1,所以方程有两个相异实根的概率为1-221=2-22.【答案】 2-2215.甲、乙两组各有三名同学,他们在一次测验中的成绩的茎叶图如图2所示,如果分别从甲、乙两组中各随机选取一名同学,则这两名同学的成绩相同的概率是________.图2【解析】 由题意可知从甲、乙两组中各随机选取一名同学,共有9种选法,其中这两名同学的成绩相同的选法只有1种,故所求概率P =19.【答案】 1916.(2016·合肥高一检测)甲乙两人玩猜数字游戏,先由甲心中任想一个数字记为a ,再由乙猜甲刚才想的数字,把乙猜的数字记为b ,且a、b∈{0,1,2,…,9}.若|a-b|≤1,则称甲乙“心有灵犀”.现任意找两人玩这个游戏,则二人“心有灵犀”的概率为________.【解析】此题可化为任意从0~9中取两数(可重复)共有10×10=100种取法.若|a-b|≤1分两类,当甲取0或9时,乙只能猜0、1或8、9共4种,当甲取2~8中的任一数字时,分别有3种选择,共3×8=24种,所以P=24+410×10=725.【答案】7 25三、解答题(本大题共6小题,共70分,解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)(2015·陕西高考)随机抽取一个年份,对西安市该年4月份的天气情况进行统计,结果如下:(1)在4月份任取一天,估计西安市在该天不下雨...的概率;(2)西安市某学校拟从4月份的一个晴天..开始举行连续2天的运动会,估计运动会期间不下雨...的概率. 【解】 (1)在容量为30的样本中,不下雨的天数是26,以频率估计概率,4月份任选一天,西安市不下雨的概率为2630=1315.(2)称相邻的两个日期为“互邻日期对”(如,1日与2日,2日与3日等).这样,在4月份中,前一天为晴天的互邻日期对有16个,其中后一天不下雨的有14个,所以晴天的次日不下雨的频率为78.以频率估计概率,运动会期间不下雨的概率为78.18.(本小题满分12分)对某班一次测验成绩进行统计,如下表所示:(1)求该班成绩在[80,100]内的概率; (2)求该班成绩在[60,100]内的概率.【解】 记该班的测试成绩在[60,70),[70,80),[80,90),[90,100]内依次为事件A ,B ,C ,D ,由题意知事件A ,B ,C ,D 是彼此互斥的.(1)该班成绩在[80,100]内的概率是P (C ∪D )=P (C )+P (D )=0.25+0.15=0.4.(2)该班成绩在[60,100]内的概率是P (A ∪B ∪C ∪D )=P (A )+P (B )+P (C )+P (D )=0.17+0.36+0.25+0.15=0.93.19.(本小题满分12分)小王、小李两位同学玩掷骰子(骰子质地均匀)游戏,规则:小王先掷一枚骰子,向上的点数记为x;小李后掷一枚骰子,向上的点数记为y.(1)在直角坐标系xOy中,以(x,y)为坐标的点共有几个?(2)规定:若x+y≥10,则小王赢;若x+y≤4,则小李赢,其他情况不分输赢.试问这个游戏规则公平吗?请说明理由. 【导学号:28750072】【解】(1)由于x,y取值为1,2,3,4,5,6,则以(x,y)为坐标的点有:(1,1),(1,2),(1,3),(1,4),(1,5),(1,6),(2,1),(2,2),(2,3),(2,4),(2,5),(2,6),(3,1),(3,2),(3,3),(3,4),(3,5),(3,6),(4,1),(4,2),(4,3),(4,4),(4,5),(4,6),(5,1),(5,2),(5,3),(5,4),(5,5),(5,6),(6,1),(6,2),(6,3),(6,4),(6,5),(6,6),共有36个,即以(x,y)为坐标的点共有36个.(2)满足x+y≥10的点有:(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6个,所以小王赢的概率是636=1 6,满足x+y≤4的点有:(1,1),(1,2),(1,3),(2,1),(2,2),(3,1),共6个,所以小李赢的概率是636=1 6,则小王赢的概率等于小李赢的概率,所以这个游戏规则公平.20.(本小题满分12分)(2014·天津高考)某校夏令营有3名男同学A,B,C和3名女同学X,Y,Z,其年级情况如下表:现从这6名同学中随机选出2人参加知识竞赛(每人被选到的可能性相同).(1)用表中字母列举出所有可能的结果;(2)设M为事件“选出的2人来自不同年级且恰有1名男同学和1名女同学”,求事件M发生的概率.【解】(1)从6名同学中随机选出2人参加知识竞赛的所有可能结果为{A,B},{A,C},{A,X},{A,Y},{A,Z},{B,C},{B,X},{B,Y},{B,Z},{C,X},{C,Y},{C,Z},{X,Y},{X,Z},{Y,Z},共15种.(2)选出的2人来自不同年级且恰有1名男同学和1名女同学的所有可能结果为{A,Y},{A,Z},{B,X},{B,Z},{C,X},{C,Y},共6种.因此,事件M发生的概率P(M)=615=25.21.(本小题满分12分)(2014·四川高考)一个盒子里装有三张卡片,分别标记有数字1,2,3,这三张卡片除标记的数字外完全相同.随机有放回地抽取3次,每次抽取1张,将抽取的卡片上的数字依次记为a,b,c.(1)求“抽取的卡片上的数字满足a +b =c ”的概率;(2)求“抽取的卡片上的数字a ,b ,c 不完全相同”的概率.【解】 (1)由题意知,(a ,b ,c )所有的可能为(1,1,1),(1,1,2),(1,1,3),(1,2,1),(1,2,2),(1,2,3),(1,3,1),(1,3,2),(1,3,3),(2,1,1),(2,1,2),(2,1,3),(2,2,1),(2,2,2),(2,2,3),(2,3,1),(2,3,2),(2,3,3),(3,1,1),(3,1,2),(3,1,3),(3,2,1),(3,2,2),(3,2,3),(3,3,1),(3,3,2),(3,3,3),共27种.设“抽取的卡片上的数字满足a +b =c ”为事件A ,则事件A 包括(1,1,2),(1,2,3),(2,1,3),共3种.所以P (A )=327=19.因此,“抽取的卡片上的数字满足a +b =c ”的概率为19.(2)设“抽取的卡片上的数字a ,b ,c 不完全相同”为事件B ,则事件B 包括(1,1,1),(2,2,2),(3,3,3),共3种.所以P (B )=1-P (B )=1-327=89.因此,“抽取的卡片上的数字a ,b ,c 不完全相同”的概率为89.22.(本小题满分12分)把参加某次铅球投掷的同学的成绩(单位:米)进行整理,分成以下6个小组:[5.25,6.15),[6.15,7.05),[7.05,7.95),[7.95,8.85),[8.85,9.75),[9.75,10.65],并绘制出频率分布直方图,如图3所示是这个频率分布直方图的一部分.已知从左到右前5个小组的频率分别为0.04,0.10,0.14,0.28,0.30,第6小组的频数是7.规定:投掷成绩不小于7.95米的为合格.图3(1)求这次铅球投掷成绩合格的人数;(2)你认为这次铅球投掷的同学的成绩的中位数在第几组?请说明理由;(3)若参加这次铅球投掷的学生中,有5人的成绩为优秀,现在要从成绩优秀的学生中,随机选出2人参加相关部门组织的经验交流会,已知a、b两位同学的成绩均为优秀,求a、b两位同学中至少有1人被选到的概率.【解】(1)∵第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)=0.14.∴参加这次铅球投掷的总人数为70.14=50.根据规定,第4、5、6组的成绩均为合格,人数为(0.28+0.30+0.14)×50=36.(2)∵成绩在第1、2、3组的人数为(0.04+0.10+0.14)×50=14,成绩在第5、6组的人数为(0.30+0.14)×50=22,参加这次铅球投掷的总人数为50,∴这次铅球投掷的同学的成绩的中位数在[7.95,8.85)内,即第4组.(3)设这次铅球投掷成绩优秀的5人分别为a、b、c、d、e,则选出2人的所有可能的情况为:ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10种,其中a、b至少有1人的情况为:ab,ac,ad,ae,bc,bd,be,共有7种,∴a、b两位同学中至少有1人被选到的概率为P=7 10.。
§2 统计◆ 基本定义:(1)总体:在统计中,所有考查对象的全体叫做全体.(2) 个体:在所有考查对象中的每一个考查对象都叫做个体. (3) 样本:从总体中抽取的一部分个体叫做总体的样本. (4) 样本容量:样本中个体的数目叫做样本容量.❖ 抽样方法:(1)简单随机抽样(simple random sampling ):设一个总体的个数为N.如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时每个个体被抽到的概率相等,就称这样的抽样为简单的随机抽样,简单随机抽样常用的方法有抽签法和随机数表法. (关于制签和随机数表的制作,请参照课本第41页)(2)系统抽样(systematic sampling):将总体平均分成几个部分,然后按照一定的规则,从每一部分抽取一个个体作为样本。
先用随机的方法将总体进行编号,如果整除不能被n N 就从中用随机数表法剔除几个个体,使得能整除,然后分组,一般是样本容量是多少,就分几组,间隔nNk =,然后从第一组中用简单实际抽样的方法抽取一个个体,假设编号为 l ,然后就可以将编号为()k n l k l k l l 1...2,,-+++++ 的个体抽出作为样本,实际就是从每一组抽取与第一组相同编号的个体。
(3)分层抽样(stratifed sampling ):当已知总体是由有差异明显的几部分组成时,常将总体分成几部分,然后按各部分所占的比例进行抽样,这种抽样叫做分层抽样,其中所分成的各部分叫做层.样本容量越大,估计越精确!颜老师友情提醒:1. 把每一种抽样的具体步骤看清楚,要求会写过程2. 个体数N 的总体中抽取一个样本容量为n 的样本,那么在整个抽样过程中每个个体被抽到的概率都相等,且等于Nn.其实三种抽样的每一个个体都是等几率的被抽到的 3. 三种抽样都是不放回的抽样 4. 在具体问题中对于样本,总体,个体应该时代单位的,如考察一个班级的学生的视力状况,从中抽取20个同学,则个体应该是20名同学的视力,而不是20名同学,样本容量则为20,同样的总体也是全班级同学的视力♦ 两种抽样方法的区别与联系:★ 典型例题剖析:例1、一个总体含有6个个体,从中抽取一个样本容量为2的样本,说明为什么在整个抽样过程中每个个体被抽到的概率相等.解:设任意一个个体为α,那么个体α被抽到分两种情况:(1)第一次被抽到:根据等可能事件概率得P 1=61, (2)第二次被抽到:即是个体α第一次没被抽到、第二次被抽到这两件事都发生.个体α第一次没被抽到的概率是65, 个体α第一次没被抽第二次被抽到的概率是51.根据相互独立事件同时发生的概率公式, 个体α第二次被抽到的概率是P 2=65×51=61.(也可这样分析:根据等可能事件的概率求得,一共取了两次,根据分步原理所有可能结果为6×5=30,个体α第一次没被抽到第二次被抽到这个随机事件所含的可能结果为5×1=5,所以个体α第二次被抽到的概率是P 2=305=61) 个体α在第一次被抽到与在第二次被抽到是互斥事件,根据互斥事件的概率加法公式,在先后抽取2个个体的过程中,个体α被抽到的概率P= P 1+ P 2=61+61=31. 由个体α的任意性,说明在抽样过程中每个个体被抽到的概率都相等(都等于31) 点评:注意区分“任一个个体α每次抽取时被抽到的概率”与“任一个个体α在整个抽样过程中个体α被抽到的概率”的区别,一般地,如果用简单随机抽样从个体数为N 的总体中抽取一个容量为n 的样本,那么“任一个个体α每次抽取时被抽到的概率”都相等且等于N1,“任一个个体α在整个抽样过程中被抽到的概率”为Nn . 例2、(1)在120个零件中,一级品24个,二级品36个,三级品60个,从中抽取一个容量为20的一个样本,求 ① 每个个体被抽到的概率,② 若有简单随机抽样方法抽取时,其中个体α第15次被抽到的的概率, ③ 若用分层抽抽样样方法抽取时其中一级品中的每个个体被抽到的概率.解:① 因为总体个数为120,样本容量为20,则每个个体被抽到的概率P 1=12020=61② 因为总体个数为120,则体α第15次被抽到的的概率P 2=1201 ③ 用分层抽样方法:按比例12020=61分别在一级品、二级品、三级品中抽取24×61=4个,36×61=6个,60×61=10,所以一级品中的每个个体被抽到的概率为P 3=244=61.注:其实用分层抽样方法抽取时二级品、三级品中每个体被抽到的概率也都为61.点评:本题说明两种抽样方法都能保证在抽样过程中,每个个体被抽到的概率都相等.且为Nn . 例3、某地区有3000人参加今年的高考,现从中抽取一个样本对他们进行分析,每个考生被抽到的概率为101,求这个样本容量. 解:设样本容量为n ,则3000n =101,所以n=300.点评:“在整个抽样过程中个体α被抽到的概率”为Nn这一结论的逆用. 例4、下列抽取样本的方式是否属于简单随机抽样?说明理由. (1) 从无限多个个体中抽取50个个体作样本.(2) 盒子里共有100个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.解:(1) 不是简单随机抽样.由于被抽取样本的总体个数是无限的.(2) 不是简单随机抽样.由于不符合“逐个抽取”的原则,且抽出的结果可能是只有一个零件重复出现.点评:简单随机抽样的特点:(1) 它要求被抽取样本的总体个数是有限的. (2) 它是从总体中逐个地进行抽取. (3) 它是一种不放回抽样.例5、 某校有学生1200人,为了调查午休对学习成绩的影响情况,计划抽取一个样本容量为60的样本,问此样本若采用简单随机抽样将如何进行?解:可用两种方法: 方法一:(抽签法)(1)编号: 将1200名学生进行随机编号为1,2, …,1200,(可按学生的学号或按学生的生日进行编号).(2)制签:做1200个大小、形状相同的号签,分别写上这1200个数,放在个容器里,并进行均匀搅拌.(3)逐个抽取:连续抽取60个号签,号签对应的同学即为样本. 方法二:(随机数表法)(1)编号: 将1200名学生进行编号分别为0000,0001,…, 1199,(2)选数:在课本附表1随机数表中任选一个数作为开始.(如从第11行第7列的数9开始)(3) 读数:从选定的数开始向右(或向上、向下、向左)读下去,选取介于范围的号码,直到满60个号码为止.(4) 抽取:抽取与读出的号码相对应的学生进行分析.点评:抽签法和随机数表法是常见的两种简单随机抽样方法,本问题显然用随机数表法更方便一些,因为总体个数较多.另外随机数表法编号时,位数要一样,首数确定后,可向左、向右、向上、向下各个确定的方向进行抽取.例6、某工厂中共有职工3000人,其中,中、青、老职工的比例为5∶3∶2,从所有职工中抽取一个样本容量为400的样本,应采取哪种抽样方法较合理?且中、青、老年职工应分别抽取多少人?解:采用分层抽抽样样方法较为合理.由样本容量为400,中、青、老职工的比例为5∶3∶2,所以应抽取中年职工为400×105=200人, 应抽取青年职工为400×103=120人, 应抽取青年职工为400×102=80人. 例6. 见课本43P 例1.点评:因为总体由三类差异较明显的个体构成,所以应采用分层抽抽样样方法进行抽取.总体分布的估计ⅰ.频率分布表:见课本第51页: ★ 例11. 注意全距,组距的确定。
【成才之路】2015-2016学年高中数学第一章统计综合能力测试北师大版必修3本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.时间120分钟,满分150分.第Ⅰ卷(选择题共60分)一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.2015年的世界无烟日(5月31日)之前,小华学习小组为了了解本地区大约有多少成年人吸烟,随机调查了100个成年人,结果其中有15个成年人吸烟.对于这个关于数据收集与处理的问题,下列说法正确的是( )A.调查的方式是普查B.本地区约有15%的成年人吸烟C.样本是15个吸烟的成年人D.本地区只有85个成年人不吸烟[答案] B[解析]调查方式显然是抽样调查,∴A错误.样本是这100个成年人.∴C也错误,显然D不正确.故选B.2.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( )A.简单随机抽样法 B.系统抽样法C.分层抽样法 D.抽签法[答案] B[解析]所抽出的编号都间隔5,故是系统抽样.3.下列问题,最适合用简单随机抽样的是( )A.某电影院有32排座位,每排有40个座位,座位号为1~40.有一次报告会坐满了听众,报告会结束后为听取意见,要留下32名听众进行座谈B.从10台冰箱中抽出3台进行质量检查C.某学校在编人员160人.其中行政人员16人,教师112人,后勤人员32人.教育部门为了解学校机构改革意见,要从中抽取一个容量为20的样本D.某乡农田有:山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩. 现抽取农田480亩估计全乡农田某种作物的平均亩产量[答案] B[解析]A项的总体容量较大,用简单随机抽样法比较麻烦;B项的总体容量较小,用简单随机抽样法比较方便;C项由于学校各类人员对这一问题的看法可能差异较大,不宜采用简单随机抽样法;D 项的总体容量较大,且各类田地的产量差别很大,也不宜采用简单随机抽样法.4.一个容量为50的样本数据,分组后,组距与频数如下:[12.5,15.5),2;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),6;[30.5,33.5),4.根据分组情况估计小于30.5的数据占( )A .18% B.30% C .60% D.92%[答案] D[解析] (2+8+9+11+10+6)÷50=92%.5.如图所示的是2006年至2015年某省城镇居民百户家庭人口数的茎叶图,图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到2006年至2015年此省城镇居民百户家庭人口数的平均数为( )2 9 1 1 5 83 0 2 6 31247[答案] B[解析] 由茎叶图得到2006年至2015年城镇居民百户家庭人口数为:291,291,295,298,302,306,310,312,314,317,所以平均数为291+291+295+298+302+306+310+312+314+31710=3 03610=303.6.6.某地区共有10万户居民,该地区城市住户与农村住户之比为4∶6,根据分层抽样方法,调查了该地区1 000户居民冰箱拥有情况,调查结果如下表所示,那么可以估计该地区农村住户中无冰箱的总户数约为( )万户 C .1.76万户 D.0.24万户[答案] A[解析] 由于城市住户与农村住户之比为4∶6,城市住户有4万户,农村住户有6万户,调查的1 000户居民中共400户城市住户,有600户农村住户,其中农村住户中无冰箱的有160户,所以可估计该地区农村住户中无冰箱的总户数约为10×1601 000=1.6(万户).7.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 520 2 3 33 1 24 4 8 94 5 5 5 7 7 8 8 950 0 1 1 4 7 96 17 8A.46,45,56B.46,45,53C.47,45,56 D.45,47,53[答案] A[解析]本题考查了茎叶图的应用及其样本的中位数、众数、极差等数字特征,由茎叶图可知,中位数为46,众数为45,极差为68-12=56.在求一组数据的中位数时,一定不要忘记先将这些数据排序再判断.8.有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为( )A.18 B.36C.54 D.72[答案] B[解析]频率分布直方图中所有小矩形的面积之和为1,每个小矩形的面积表示样本数据落在该区间内的频率,故样本数据落在区间[10,12)内的频率为1-2×(0.02+0.05+0.15+0.19)=0.18,故样本数据落在区间[10,12)内的频数为0.18×200=36.9.已知两个变量x,y之间具有线性相关关系,测得(x,y)的四组值分别为(1,2),(2,4),(3,5),(4,7),则y与x之间的回归直线方程为( )A.y=0.8x+3 B.y=-1.2x+7.5C.y=1.6x+0.5 D.y=1.3x+1.2[答案] C[解析] 利用排除法. ∵x =14(1+2+3+4)= 2.5,y =14(2+4+5+7)=4.5,由于回归直线方程y =bx +a 必过定点(2.5,4.5),故排除A 、D.又由四组数值知y 随x 的增大而增大,知b >0,排除B.10.某路段检查站监控录像显示,在某时段内,有 1 000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为如下图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90 km/h 的约有( )A .100辆 B.200辆 C .300辆 D.400辆[答案] C[解析] 由题图可知汽车中车速在[60,90)的频率为10×(0.01+0.02+0.04)=0.7, ∴在[90,110]的频率为(1-0.7)=0.3.∴车速不小于90 km/h 的汽车数量约为0.3×1 000=300辆.11.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1 B.2 C .3 D.4[答案] D[解析] 依题意,可得 ⎩⎪⎨⎪⎧10=x +y +10+11+95,2=15[x -102+y -102+10-102+11-102+9-102],⇒⎩⎪⎨⎪⎧x +y =20,x -102+y -102=8,⇒⎩⎪⎨⎪⎧x =12y =8,或⎩⎪⎨⎪⎧x =8y =12,所以|x-y|=4.12.甲,乙,丙三名运动员在某次测试中各射击20次,三人测试成绩的频率分布条形图分别如图1,图2和图3,若s甲,s乙,s丙分别表示他们测试成绩的标准差,则( )A.s甲<s乙<s丙 B.s甲<s丙<s乙C.s乙<s甲<s丙 D.s丙<s甲<s乙[答案] D[解析]由频率分布条形图可得甲,乙,丙三名运动员的平均成绩分别为x-甲=0.25×(7+8+9+10)=8.5;x-乙=0.3×7+8×0.2+9×0.2+10×0.3=8.5;x-丙=0.2×7+8×0.3+9×0.3+10×0.2=8.5,s2甲=0.25×(1.52+0.52+0.52+1.52)=1.25;s2乙=0.3×1.52+0.52×0.2+0.52×0.2+1.52×0.3=1.45;s2丙=0.2×1.52+0.52×0.3+0.52×0.3+1.52×0.2=1.05,∴s丙<s甲<s乙.第Ⅱ卷(非选择题共90分)二、填空题(本大题共4个小题,每小题5分,共20分,将正确答案填在题中横线上)13.一个容量为40的样本,共分成6组,第1~4组的频数分别为10,5,7,6,第5组的频率是0.10,则第6组的频率是________.[答案]0.20[解析]第5组的频数为40×0.10=4,第6组的频数为40-(10+5+7+6+4)=8,则频率为840=0.20.14.(2015·某某文,12)已知样本数据x1,x2,…,x n的均值x=5,则样本数据2x1+1,2x2+1,…,2x n+1的均值为________.[答案]11[解析]因为样本数据x1,x2,…,x n的均值x=5,所以样本数据2x1+1,2x2+1,…,2x n+1的均值为2x+1=2×5+1=11.15.(2014·某某,6)设抽测的树木的底部周长均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100cm.[答案] 24[解析] 本题考查频率分布直方图.由题意在抽测的60株树木中,底部周长小于100cm 的株数为(0.015+0.025)×10×60=24.频率分布直方图中的纵坐标为频率组距,此处经常误认为纵坐标是频率.16.下图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.0 8 9 10 3 5(注:方差s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2],其中x -为x 1,x 2,…,x n 的平均数)[答案] 6.8[解析] 本题考查茎叶图、方差的概念. 由茎叶图知x -=8+9+10+13+155=11,∴s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.三、解答题(本大题共6个小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.(本小题满分10分)在同等条件下,对30辆同一型号的汽车进行耗油1升所行走路程的试验,得到如下数据(单位:km):14.1 12.3 13.7 14.0 12.8 12.9 13.1 13.6 14.4 13.8 12.6 13.8 12.6 13.2 13.3 14.2 13.9 12.7 13.0 13.2 13.5 13.6 13.4 13.6 12.1 12.5 13.1 13.5 13.2 13.4以前两位数为茎画出上面数据的茎叶图(只有单侧有数据),并找出中位数.[解析]茎叶图如图所示.1213566789130112223445566 6 788914012 4中位数为13.35.18.(本小题满分12分)某高级中学共有学生3 000名,各年级男、女人数如下表:高一年级高二年级高三年级女生523x y男生487490z已知在全校学生中随机抽取1名,抽到高二年级女生的概率是0.17.(1)问高二年级有多少名女生?(2)现对各年级用分层抽样的方法在全校抽取300名学生,问应在高三年级抽取多少名学生?[解析](1)由题设可知x3000=0.17,所以x=510.(2)高三年级人数为y+z=3000-(523+487+490+510)=990,现用分层抽样的方法在全校抽取300名学生,应在高三年级抽取的人数为:3003000×990=99名.答:(1)高二年级有510名女生;(2)在高三年级抽取99名学生.19.(本小题满分12分)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示).分组频率[1.00,1.05)(1)(2)估计数据落在[1.15,1.30)中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数.[解析] (1)根据频率分布直方图可知,频率=组距×频率组距故可得下表:(2)0.30+0.15+0.02=中的概率约为0.47. (3)120×1006=2000.所以水库中鱼的总条数约为2000条.20.(本小题满分12分)某农场为了从三种不同的西红柿品种中选出高产稳定的西红柿品种,分别在5块试验田上试种,每块试验田均为0.5公顷,产量情况如下表:问哪一种西红柿既高产又稳定?[解析] 因为x 甲=15(21.5+20.4+22.0+21.2+19.9)=21.0(kg),x 乙=15(21.3+18.9+18.9+21.4+19.8)=20.06(kg), x 丙=15(17.8+23.3+21.4+19.9+20.9)=20.66(kg),所以s 甲=15[21.5-21.02+…+19.9-21.02]≈0.756(kg);s 乙=15[21.3-21.062+…+19.8-21.062]≈1.104(kg);s 丙=15[17.8-20.662+…+20.9-20.662]≈1.807(kg).由于x 甲>x 丙>x 乙,s 甲<s 乙<s 丙,所以甲种西红柿既高产又稳定.21.(本小题满分12分)某某统计局就某地居民的月收入调查了10 000人,并根据所得数据画出了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率; (2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用分层抽样的方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?[解析] (1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15. (2)∵0.000 2×(1 500-1 000)=0.1, 0.000 4×(2 000-1 500)=0.2, 0.000 5×(2 500-2 000)=0.25,0.1+0.2+0.25=0.55>0.5.∴样本数据的中位数为2 000+0.5-0.1+0.20.000 5=2 000+400=2 400(元).(3)居民月收入在[2 500,3 000)的频率为0.000 5×(3 000-2 500)=0.25, 所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人), 再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×2 50010 000=25(人).22.(本小题满分12分)(2015·新课标Ⅰ理,19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =,(1)根据散点图判断,y =a +bx 与y =c +d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:(①年宣传费x =49时,年销售量及年利润的预报值是多少? ②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘估计分别为word 11 / 11 β^=,α^=v -β^u .[解析] (1)由散点图可以判断,y =c +d x 适合作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程,由于d ^=∑i =18w i -wy i -y ∑i =18 w i -w2=108.81.6=68, c ^=y -d ^w =563-68×6.8=100.6.∴y 关于w 的线性回归方程为y ^=100.6+68w ,∴y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x=-x +13.6x +20.12,∴当x =13.62=6.8,即x =46.24时,z ^取得最大值. 故年宣传费为46.24千元时,年利润的预报值最大.。
一、选择题1.一组数据的平均数为x ,方差为2s ,将这组数据的每个数都乘以()0a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均数为x B .这组新数据的平均数为a x + C .这组新数据的方差为2asD .这组新数据的标准差为2a s2.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1964.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .295.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为(A.95 B.96 C.97 D.986.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为().78066572080263142947182198003204923449353623486969387481A.02B.14C.18D.297.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5 B.5,5 C.5,8 D.8,88.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64 B.96 C.144 D.1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是()A.90.5 B.91.5 C.90 D.9110.已知x,y的取值如表:x2678y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .11.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .7二、填空题13.对具有线性相关关系的变量x ,y 有一组观测数据()(),1,2,3,,8i i x y i =,其回归直线方程是12y x a =+,且8116i i x ==∑,8148i i y ==∑,则实数a =__________.14.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.15.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 16.为调查某校学生每天用于课外阅读的时间,现从该校3000名学生中随机抽取100名学生进行问卷调查,所得数据均在区间[50,100]上,其频率分布直方图如图所示,则估计该校学生中每天用于阅读的时间在[70,80)(单位:分钟)内的学生人数为____.17.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:^y =0.245x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加_______万元.18.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.19.目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表: 企业abcdefghij满意度x (%) 21 33 24 20 25 21 24 23 25 12 投资额y (万元)79868978767265625944y x (2)约定:投资额y 关于满意度x 的相关系数r 的绝对值在0.7以上(含0.7)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额y 关于满意度x 的线性回归方程(精确到0.1).参考数据:22.8x =,71y =,1022110248i i x x =-≈∑,643.7,10110406i i i x y x y =-=∑,222851984=,2287116188⨯=.附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-.线性相关系数ni ix y nx yr -=∑.22.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 23.画糖人是一种以糖为材料在石板上进行造型的民间艺术.某糖人师傅在公园内画糖人,每天卖出某种糖人的个数与价格相关,其相关数据统计如下表:卖出糖人的个数y (个)5450 46 43 39(1)根据表中数据求y 关于x 的回归直线方程;(2)若该种造型的糖人的成本为2元/个,为使糖人师傅每天获得最大利润,则该种糖人应定价多少元?(精确到1元)参考公式:回归直线方程^^^y b x a =+,其中^121()()()niii nii x x y y b x x ==--=-∑∑,^^^a y b x =-.24.某地区不同身高的未成年男性的体重平均值如下表: 身高/cm6070 80 90 100 110 120 130 140 150 160 170 体重/kg 6.137.909.9012.1515.0217.5020.9226.8631.1138.8547.2555.05(1)根据散点图判断,y a bx =+与xy a b =⋅哪一个能比较近似地反映这个地区未成年男性体重kg y 与身高cm x 的回归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的判断结果及下表中数据,建立y 关于x 的回归方程(表中ln i i u y =,0.66 1.93e ≈,0.22 1.02e ≈).xyu()1221ii x x =-∑()()121iii x x y y =--∑ ()()121iii x x u u =--∑11524.0532.9614200 6143.3 284参考公式:()()()1122211n niii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,a y b x =-⋅.25.学校为了了解高三学生每天自主学习中国古典文学的时间,随机抽取了高三男生和女生各50名进行问卷调查,其中每天自主学习中国古典文学的时间超过3小时的学生称为“古文迷”,否则为“非古文迷”,调查结果如表:(Ⅰ)根据表中数据能否判断有60%的把握认为“古文迷”与性别有关?(Ⅱ)现从调查的女生中按分层抽样的方法抽出5人进行调查,求所抽取的5人中“古文迷”和“非古文迷”的人数;(Ⅲ)现从(Ⅱ)中所抽取的5人中再随机抽取3人进行调查,记这3人中“古文迷”的人数为ξ,求随机变量ξ的分布列与数学期望.参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.参考数据:26.某土特产销售总公司为了解其经营状况,调查了其下属各分公司月销售额和利润,得到数据如下表:在统计中发现月销售额x和月利润额y具有线性相关关系.(Ⅰ)根据如下的参考公式与参考数据,求月利润y与月销售额x之间的线性回归方程;(Ⅱ)若该总公司还有一个分公司“雅果”月销售额为10万元,试求估计它的月利润额是多少?(参考公式:1221ni i i n i i x y nx y b x nx==-⋅=-∑∑,a y b x =-,其中:1112ni ii x y ==∑,21200)nii x==∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s , 则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x x x xx xx xx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axax axax axax axax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.2.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.3.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.4.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.5.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.6.D解析:D 【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去. 详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29. 选D .点睛:本题考查随机数表,考查对概念基本运用能力.7.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图8.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可.【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题. 10.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标.【详解】根据题意可得,,由线性回归方程一定过样本中心点,. 故选:B .【点睛】 本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题. 11.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a =7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .393.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件4.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .805.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.56.一组数据的平均数为x ,方差为2s ,将这组数据的每个数都乘以()0a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均数为x B .这组新数据的平均数为a x + C .这组新数据的方差为2asD .这组新数据的标准差为2a s7.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号1,2,⋯,960,分组后在第一组采用简单随机抽样的方法抽到的号码为29,则抽到的32人中,编号落入区间[]200,480的人数为 A .7B .9C .10D .128.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④9.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .1810.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和6711.已知x ,y 取值如下表:x0 1 4 5 6 8 y 1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.1312.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .0815二、填空题13.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.14.水痘是一种传染性很强的病毒性疾病,容易在春天爆发,武汉疾控中心为了调查某高校高一年级学生注射水痘疫苗的人数,在高一年级随机抽取了5个班级,每个班级的人数互不相同,若把每个班抽取的人数作为样本数据,已知样本平均数为5,样本方差为4,则样本数据中最大值为__________.15.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).16.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________ 17.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.18.已知由样本数据点集合(){},|1,2,3,,i ix y i n =,求得的回归直线方程为1.230.08y x Λ=+ ,且4x =。
综合检测(一)第一章统计(时间120分钟,满分150分)一、选择题(本大题共10小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.为了调查全国人口的寿命,抽查了十一个省(市)的2 500名城镇居民,这个问题中“2 500名城镇居民的寿命的全体”是()A.总体B.个体C.样本D.样本容量【解析】每个人的寿命是个体,抽出的2 500名城镇居民的寿命的全体是从总体中抽取的一个样本.【答案】 C2.某班的60名同学已编号1,2,3,…,60,为了解该班同学的作业情况,老师收取了号码能被5整除的12名同学的作业本,这里运用的抽样方法是()A.简单随机抽样法B.系统抽样法C.分层抽样法D.抽签法【解析】抽出的号码是5,10,15,…,60.符合系统抽样的特点“等距抽样”.【答案】 B3.(2013·湖南高考)某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n的样本进行调查,其中从丙车间的产品中抽取了3件,则n=()A.9 B.10C.12 D.13【解析】依题意得360=n120+80+60,故n=13.【答案】 D4.有一个容量为80的样本,数据的最大值是140,最小值是51,组距为10,则可以分为()A.10组B.9组C.8组D.7组【解析】由题意知极差为:140-51=89.8910=8.9,故应分为9组.【答案】 B5.(2013·福建高考)某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70)[70,80),[80,90),[90,100]加以统计,得到如图1所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()图1A.588 B.480C.450 D.120【解析】不少于60分的学生的频率为(0.030+0.025+0.015+0.010)×10=0.8,∴该模块测试成绩不少于60分的学生人数应为600×0.8=480.【答案】 B6.下列图形中具有相关关系的两个变量是()【解析】A、B为函数关系,D中所有点大约集中在一条直线附近,故具有相关关系.【答案】 D图27.(2012·陕西高考)设(x 1,y 1),(x 2,y 2),…,(x n ,y n )是变量x 和y 的n 次方个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图2),以下结论正确的是( )A .直线l 过点(x ,y )B .x 和y 的相关系数为直线l 的斜率C .x 和y 的相关系数在0到1之间D .当n 为偶数时,分布在l 两侧的样本点的个数一定相同 【答案】 A8.(2013·福建高考)已知x 与y 之间的几组数据如下表:据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A .b >b ′,a >a ′B .b >b ′,a <a ′C .b <b ′,a >a ′D .b <b ′,a <a ′【解析】 由(1,0),(2,2)求b ′,a ′. b ′=2-02-1=2,a ′=0-2×1=-2. 求b ^,a ^时,∑i =16x i y i =0+4+3+12+15+24=58,x =3.5,y =136, ∑i =16x 2i =1+4+9+16+25+36=91,∴b ^=58-6×3.5×13691-6×3.52=57,a ^=136-57×3.5=136-52=-13,∴b ^<b ′,a ^>a ′. 【答案】 C图39.A ,B 两名同学在5次数学考试中的成绩统计的茎叶图3所示,若A ,B 两人的平均成绩分别是X A ,X B ,则下列的结论正确的是( )A .X A <XB ,B 比A 成绩稳定 B .X A >X B ,B 比A 成绩稳定C .X A <X B ,A 比B 成绩稳定D .X A >X B ,A 比B 成绩稳定【解析】 由茎叶图知,A 同学的5次数学成绩的平均值为X A =15(91+92+96+103+128)=102,X B =15(99+108+107+114+112)=108,∴X A <X B ,且B 较A 更稳定,故选A. 【答案】 A10.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图4所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )图4A .m e =m o =xB .m e =m o <xC .m e <m o <xD .m 0<m o <x【解析】 30个数中第15个数是5,第16个数是6,所以中位数为5+62=5.5,众数为5,x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930.【答案】 D二、填空题(本大题共5小题,每小题5分,共25分,将答案填在题中的横线上) 11.某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图5).根据频率分布直方图推测,这3 000名学生在该次数学考试中成绩小于60分的学生数是________.图5【解析】 由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60的学生数为3 000×0.2=600.【答案】 60012.(2012·浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.【解析】 男生人数为560×280560+420=160.【答案】 16013.为了解某地高一年级男生的身高情况,从其中的一个学校选取容量为60的样本(60名男生的身高,单位:cm),分组情况如下:分组151.5~ 158.5158.5~ 165.5 165.5~ 172.5 172.5~ 179.5 频数 6 21 m 频率a0.1则表中的【解析】 由表中信息可知,0.1=m60,∴m =0.1×60=6,则身高在165.5~172.5内的频数为60-6-21-6=27.∴a =2760=0.45.【答案】 6 0.4514.如图3是某保险公司提供的资料,在1万元以上的保险单中,821少于2.5万元,那么不少于2.5万元的保险单有________万元.图3【解析】 不少于1万元的占700万元的21%,金额为700×21%=147万元,1万元以上的保险单中,超过或等于2.5万元的保险单占1321,金额为1321×147=91万元,故不少于2.5万元的保险单有91万元.【答案】 9115.(2012·郑州高一检测)样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.【解析】 由题意知,15(a +0+1+2+3)=1,所以a =-1,∴样本方差s 2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.【答案】 2三、解答题(本大题共6小题,共75分.解答应写出文字说明,证明过程或演算步骤) 16.(本小题满分12分)某篮球运动员在2013赛季各场比赛的得分情况如下:12,15,24,25,31,31,36,36,37,39,44,49,50.如何分析该运动员的整体水平及发挥的稳定程度?【解】 画出茎叶图如图所示:由茎叶图可以看出,该运动员的平均得分及中位数、众数都在20到40之间,且分布较对称,集中程度高,说明该运动员发挥比较稳定17.(本小题满分12分)从高三学生中抽取50名学生参加数学竞赛,成绩的分组及各组的频率如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100),8. (1)列出样本的频率分布表(含累积频率); (2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例; (4)估计成绩在85分以下的学生比例. 【解】 (1)频率分布表如下:成绩分组 频数 频率 累积频率 [40,50) 2 0.04 0.04 [50,60) 3 0.06 0.1 [60,70) 10 0.2 0.3 [70,80) 15 0.3 0.6 [80,90) 12 0.24 0.84 [90,100) 8 0.16 1.00 估计501.00(2)频率分布直方图如图所示:(3)成绩在[60,90)分的学生比例,即学生成绩在[60,90)分的频率,0.2+0.3+0.24=74%. (4)成绩在85分以下的学生比例,即学生成绩不足85分的频率.设相应频率为b ,则b -0.685-80=0.84-0.690-80,故b =0.72. 估计成绩在85分以下的学生约占72%.18.(本小题满分12分)以下是某地搜集到的新房屋的销售价格y 和房屋的面积x 的数据:房屋面积(m 2)11511080135105销售价格(万元)24.821.618.429.222(1)(2)求线性回归方程,并在散点图中画出回归直线;(3)根据(2)的结果估计当房屋面积为150 m2时的销售价格.【解】(1)数据对应的散点图如图所示:(2)x=109,y=23.2,∑i=15(x i-x)2=1 570,∑i=15(x i-x)(y i-y)=308,设所求的回归直线方程为y=bx+a,则b=3081 570≈0.196 2,a=y-b x=23.2-109×0.196 2=1.814 2,故所求回归直线方程为y=0.196 2x+1.814 2.(3)据(2),当x=150 m2时,销售价格的估计值为y=0.196 2×150+1.814 2=31.244 2(万元).19.(本小题满分13分)某高校在2013年的自主招生考试成绩中随机抽取100名学生的笔试成绩,把成绩分组,得到的频率分布表如下:组号分组频数频率第1组[160,165)50.050第2组[165,170)①0.350第3组[170,175)30②第4组[175,180)200.200第5组[180,185]100.100总计100 1.00(1)(2)这次笔试成绩的中位数落在哪组内?(3)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽多少名学生进入第二轮面试?【解】(1)由题意知第2组的频数为100-5-30-20-10=35(人)(或100×0.35=35(人));第3组的频率为1-0.050-0.350-0.200-0.100=0.300(或30100=0.300).(2)第1组和第2组的频率的和为0.400,第4组和第5组的频率的和为0.300,所以这次笔试成绩的中位数落在第3组内.(3)因为第3、4、5组共有60名学生,所以利用分层抽样在60名学生中抽取6名学生,每组分别为:第3组:3060×6=3(人),第4组:2060×6=2(人),第5组:1060×6=1(人).所以第3、4、5组分别抽取3人,2人,1人.20.(本小题满分13分)某个服装店经营某种服装,在某周内获纯利润y (元)与该周每天销售这种服装件数x 之间的一组数据关系见下表:x 3 4 5 6 7 8 9 y66697381899091已知:Σ7i =1x 2i =280,Σ7i =1x i y i =3 487. (1)求x ,y ; (2)画出散点图;(3)求纯利润y 与每天销售件数x 之间的回归直线方程. 【解】 (1)x =3+4+5+6+7+8+97=6(件),y =66+69+73+81+89+90+917=5597≈79.86(元).(2)散点图如下:(3)由散点图知,y 与x 有线性相关关系. 设回归直线方程为y =bx +a . 由Σ7i =1x 2i =280, Σ7i =1x 1y i =3 487, x =6,y =5597,得打印版高中数学 b =3 487-7×6×5597280-7×36=13328=4.75, a =5597-6×4.75≈51.36. 故回归直线方程为y =4.75x +51.36.21.(本小题满分13分)从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲:7,8,6,9,6,5,9,9,7,4乙:9,5,7,8,7,6,8,6,7,7(1)分别计算甲、乙两人射击命中环数的极差、众数和中位数;(2)分别计算甲、乙两人射击命中环数的平均数、方差、标准差;(3)比较两人的成绩,然后决定选择哪一个人参赛.【解】 (1)甲:极差是9-4=5,众数是9,中位数是7;乙:极差是9-5=4,众数是7,中位数是7.(2)x 甲=7+8+6+9+6+5+9+9+7+410=7, s 2甲=110[(7-7)2+(8-7)2+(6-7)2+(9-7)2+(6-7)2+(5-7)2+(9-7)2+(9-7)2+(7-7)2+(4-7)2]=2.8,s 甲=s 2甲= 2.8≈1.673; x 乙=9+5+7+8+7+6+8+6+7+710=7, s 2乙=110[(9-7)2+(5-7)2+(7-7)2+(8-7)2+(7-7)2+(6-7)2+(8-7)2+(6-7)2+(7-7)2+(7-7)2]=1.2,s 乙=s 2乙= 1.2≈1.095. (3)∵x 甲=x 乙,s 甲>s 乙,∴甲、乙两人的平均成绩相等,乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,应选择乙参赛.。
一、选择题1.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温x C ︒171382月销售量y (件)24334055由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件2.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .3.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和674.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④5.某宠物商店对30只宠物狗的体重(单位:千克)作了测量,并根据所得数据画出了频率分布直方图如下图所示,则这30只宠物狗体重(单位:千克)的平均值大约为( )A.15.5 B.15.6 C.15.7 D.166.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25 C.20 D.157.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是()A.31号B.32号C.33号D.34号8.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64 B.96 C.144 D.1609.已知x,y的取值如表:x2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.10.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数()A .40B .45C .48D .5011.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.14.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.15.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.16.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.17.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x3 4 5 6y23.5 55.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 18.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 .19.某班60名学生参加普法知识竞赛,成绩都在区间[40100],上,其频率分布直方图如图所示,则成绩不低于60分的人数为___.20.某校对全校1200名男女学生进行健康调查,采用分层抽样法抽取一个容量为200的样本,已知女生抽了95人,则该校的男生数是__________.三、解答题21.某食品厂为了检测某批袋装食品的质量,从该批食品中抽取了一个容量为100的样本,测量它们的质量(单位:克).根据数据分为[)92,94,[)94,96,[)96,98,[)99,100,[)100,102,[)102,104,[]104,106七组,其频率分布直方图如图所示.(1)根据频率分布直方图,估计这批袋装食品质量的中位数.(保留一位小数) (2)记产品质量在[)98,102内为优等品,每袋可获利5元;产品质量在[)92,94内为不合格品,每袋亏损2元;其余的为合格品,每袋可获利3元.若该批食品共有10000袋,以样本的频率代替总体在各组的频率,求该批袋装食品的总利润.22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出关于的线性回归方程ˆˆˆy bx a =+;(2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.为了了解高中新生的体能情况,某学校抽取部分高一学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从 左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12﹒(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.24.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推) 年份x 1 2 3 4 5 6 7 8 9 人数y23545781010(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i i x ==∑.25.新能源汽车的春天来了!2018年3月5日上午,李克强总理做政府工作报告时表示,将新能源汽车车辆购置税优惠政策再延长三年,自2018年1月1日至2020年12月31日,对购置的新能源汽车免征车辆购置税.某人计划于2018年5月购买一辆某品牌新能源汽车,他从当地该品牌销售网站了解到近五个月实际销量如下表:(1)经分析,可用线性回归模型拟合当地该品牌新能源汽车实际销量y(万辆)与月份编号t之间的相关关系.请用最小二乘法求y关于t的线性回归方程y bt a=+,并预测2018年5月份当地该品牌新能源汽车的销量;(2)2018年6月12日,中央财政和地方财政将根据新能源汽车的最大续航里程(新能源汽车的最大续航里程是指理论上新能源汽车所装的燃料或电池所能够提供给车跑的最远里程)对购车补贴进行新一轮调整.已知某地拟购买新能源汽车的消费群体十分庞大,某调研机构对其中的200名消费者的购车补贴金额的心理预期值进行了一个抽样调查,得到如下一份频数表:将频率视为概率,现用随机抽样方法从该地区拟购买新能源汽车的所有消费者中随机抽取3人,记被抽取3人中对补贴金额的心理预期值不低于3万元的人数为ξ,求ξ的分布列及数学期望()Eξ.参考公式及数据:①回归方程y bx a=+,其中()()()1122211ˆn ni i i ii in ni ii ix x y y x y nxybx x x nx====---==--∑∑∑∑,a y bx=-,②5118.8i iit y ==∑.26.随着各国经贸关系的进一步加深,许多国外的热带水果进入国内市场,牛油果作为一种热带水果,越来越多的中国消费者对这种水果有了一种全新的认识,它富含多种维生素、丰富的脂肪和蛋白质,钠、钾、镁、钙等含量也高,除作生果食用外也可作菜肴和罐头.牛油果原产于墨西哥和中美洲,后在加利福尼亚州被普遍种植.因此加利福尼亚州成为世界上最大的牛油果生产地,在全世界热带和亚热带地区均有种植,但以美国南部、危地马拉、墨西哥及古巴栽培最多,并形成了墨西哥系、危地马拉系、西印度系三大种群,我国的广东、海南、福建、广西、台湾、云南及四川等地都有少量栽培.市场上的牛油果大部分都是进口的.为了调查市场上牛油果的等级代码数值x与销售单价y之间的关系,经统计得到如下数据:等级代码数值x 38 48 58 68 78 88 销售单价y (元/kg )16.818.820.822.82425.8(1)已知销售单价y 与等级代码数值x 之间存在线性相关关系,利用前5组数据求出y 关于x 的线性回归方程;(2)若由(1)中线性回归方程得到的估计值与最后一组数据的实际值之间的误差不超过1,则认为所求回归方程是有效可靠的,请判断所求回归直线方程是否有效可靠? (3)若一果园估计可以收获等级代码数值为85的牛油果980kg ,求该果园估计收入为多少元.参考公式:对一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,b y bx =-.参考数据:516169.6i ii x y==∑,52117820i i x ==∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.3.B解析:B【解析】【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解.【详解】设更正前甲,乙,…的成绩依次为a1,a2,…,a50,则a1+a2+…+a50=50×70,即60+90+a3+…+a50=50×70,(a1﹣70)2+(a2﹣70)2+…+(a50﹣70)2=50×75,即102+202+(a3﹣70)2+…+(a50﹣70)2=50×75.更正后平均分为x=150×(80+70+a3+…+a50)=70;方差为s2=150×[(80﹣70)2+(70﹣70)2+(a3﹣70)2+…+(a50﹣70)2]=150×[100+(a3﹣70)2+…+(a50﹣70)2]=150×[100+50×75﹣102﹣202]=67.故选B.【点睛】本题考查平均数与方差的概念与应用问题,是基础题.4.C解析:C【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可.【详解】①设某大学的女生体重y(kg)与身高x(cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的线性回归方程为y∧=0.85x﹣85.71,则若该大学某女生身高增加1cm,则其体重约增加0.85kg,正确;②关于x的方程x2﹣mx+1=0(m>2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确;③设定圆C的方程为(x﹣a)2+(x﹣b)2=r2,其上定点A(x0,y0),设B(a+r cosθ,b+r sinθ),P(x,y),由12OP =(OA OB+)得22x a rcosxy b rsinyθθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x﹣x0﹣a)2+(2y﹣y0﹣b)2=r2,即动点P的轨迹为圆,∴故③不正确;④由22143x y+=,得a2=4,b2=3,∴1c==.则F(﹣1,0),如图:过F作垂直于x轴的直线,交椭圆于A(x轴上方),则x A=﹣1,代入椭圆方程可得32Ay=.当P为椭圆上顶点时,P(0FPk=32OAk=-,∴当直线FPOP的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,.当P为椭圆下顶点时,P(0,∴当直线FPOP,32),综上,直线OP(O为原点)的斜率的取值范围是32⎛⎫-∞-⎪⎝⎭,∪,32).故选C【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.5.B解析:B【分析】由频率分布直方图分别计算出各组得频率、频数,然后再计算出体重的平均值【详解】由频率分布直方图可以计算出各组频率分别为:0.10.20.250.250.15,,,,,0.05频数为:367.57.54.51.5,,,,,则平均值为:113136157.5177.519 4.521 1.515.630⨯+⨯+⨯+⨯+⨯+⨯=故选B 【点睛】本题主要考查了由频率分布直方图计算平均数,需要注意计算不要出错6.C解析:C【详解】抽取比例为1501 30000200=,1400020200∴⨯=,抽取数量为20,故选C.7.C解析:C【解析】【分析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号.【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷,已知03号,18号被抽取,所以应该抽取181533+=号,故选C.【点睛】本题主要考查了抽样,系统抽样,属于中档题.8.D解析:D【解析】【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数.【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81= 12816,因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】 根据题意可得,,由线性回归方程一定过样本中心点,.故选:B . 【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.B解析:B 【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118; 120,120,121,122,122; 123,124,124,126127; 128,128,129,129,129; 131,131,131,132,132; 132,133,134,134,135; 137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5. 本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.14.2【解析】【分析】根据系统抽样的概念结合可得最后结果为2【详解】学生总数不能被容量整除根据系统抽样的方法应从总体中随机剔除个体保证整除∵故应从总体中随机剔除个体的数目是2故答案为2【点睛】本题主要考解析:2 【解析】 【分析】根据系统抽样的概念结合2544262=⨯+,可得最后结果为2. 【详解】学生总数不能被容量整除,根据系统抽样的方法,应从总体中随机剔除个体,保证整除. ∵2544262=⨯+,故应从总体中随机剔除个体的数目是2,故答案为2. 【点睛】本题主要考查系统抽样,属于基础题;从容量为N 的总体中抽取容量为n 的样本,系统抽样的前面两个步骤是:(1)将总体中的N 个个体进行编号;(2)当Nn为整数时,抽样距即为N n ;当N n不是整数时,从总体中剔除一些个体,使剩下的总体中的个体的个数N '能被n 整除.15.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a ∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.16.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果. 详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.17.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a 的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+,解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.18.【解析】分析:先根据平均数求x 的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为解析:45【解析】分析:先根据平均数求x 的值,再求数据的方差. 详解:由题得8+9+8109,10.5x x ++=∴=所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n=-+-+⋅⋅⋅+-. 19.30【解析】由题意可得:则成绩不低于分的人数为人解析:30 【解析】 由题意可得:()400.0150.0300.0250.0051030⨯+++⨯=则成绩不低于60分的人数为30人20.630【解析】每层的抽样比为女生抽了95人所以男生抽取105人因此共有男生人故填630解析:630 【解析】 每层的抽样比为200112006=,女生抽了95人,所以男生抽取105人,因此共有男生1056630⨯=人,故填630.三、解答题21.(1)99.6;(2)35600元. 【分析】(1)根据频率分布直方图中的中位数在长方形面积为0.5的地方取得得解. (2)求出批食品中优等品、不合格品、合格品的袋数得总利润. 【详解】(1)因为(0.020.040.12)20.360.5,0.360.0920.540.5++⨯=<+⨯=>, 所以样本质量的中位数在[98,100)内.设样本质量的中位数为m ,则980.0920.360.52m -⨯⨯+=, 解得99.6m ≈,故这批袋装食品质量的中位数为99.6.(2)由题意可得,这批食品中优等品有10000(0.090.10)23800⨯+⨯=袋, 这批食品中不合格品有100000.022400⨯⨯=袋, 这批食品中合格品有1000038004005800--=袋.故该批袋装食品的总利润为3800558003400235600⨯+⨯-⨯=元. 【点睛】频率分布直方图中的中位数求法在长方形面积为0.5的地方取得是解题关键,属于基础题. 22.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii i i x y x yb x x==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩, 所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题.23.(1)0.08,150;(2)88%;(3)第四小组,理由见解析 【解析】试题分析:(1)由频率分布直方图中各小矩形面积之和为1结合面积之比得到第二小组的频率,从而求得样本容量;(2)由频率分布直方图中各小矩形的面积和为1与面积之比可求出达标的频率即达标率;(3)求出前四组的频数即可得到中位数所在的区间. 试题(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为: 又因为频率=所以(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内. 考点:频率分布直方图 24.(1)6;689;(2) 1.3 1.1y x =-,12人. 【分析】(1)由表格中的数据,利用平均数和方差的公式,即可求解;(2)由表中近五年的数据,利用公式,求得ˆˆ,b a ,求得回归直线方程,代入10x =,即可作出结论. 【详解】(1)由表格中的数据,利用平均数的计算公式,可得2354578101069++++++++=.由方差的公式,可得()()()2222168263610699s ⎡⎤=-+-++-=⎣⎦.(2)由表中近五年的数据知,7x =,8y =,95293i ii x y ==∑,925255i i x ==∑,9592255293578ˆ 1.32555495i ii i i x y xybx x==--⨯⨯===-⨯-∑∑,又a y bx =-,所以8 1.37 1.1a =-⨯=-, 故y 与x 的线性回归方程为 1.3 1.1y x =-, 当10x =时, 1.310 1.111.912y =⨯-=≈,故估计该校2020年参加“北约”“华约”考试而获得加分的学生有12人. 【点睛】本题主要考查了平均数与方差的计算,以及回归直线方程的求解及应用,其中解答中认真审题,根据公式准确计算是解答的关键,着重考查运算与求解能力. 25.(1)约为2万辆;(2)见解析 【分析】(1)利用最小二乘法求y 得关于t 的线性回归方程为0.3208ˆ.0yt =+,再令6t =得到2018年5月份当地该品牌新能源汽车的销量.(2)先分析得到ξ~33,5B ⎛⎫ ⎪⎝⎭,再根据二项分布求ξ的分布列及数学期望()E ξ. 【详解】 (1)易知1234535t ++++==,0.50.61 1.4 1.71.045y ++++==,522222211234555ii t ==++++=∑,218.853 1.040.32555ˆ3b -⨯⨯==-⨯,1.040.320ˆ3.08a=-⨯= 则y 关于t 的线性回归方程为0.3208ˆ.0yt =+, 当6t =时,ˆ 2.00y=,即2018年5月份当地该品牌新能源汽车的销量约为2万辆. (2)根据给定的频数表可知,任意抽取1名拟购买新能源汽车的消费者,对补贴金额的心理预期值不低于3万元的概率为12032005=,由题意可知ξ~33,5B ⎛⎫⎪⎝⎭,ξ的所有可能取值为0,1,2,3ξ的分布列为:()0303328055125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()12133236155125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭ ()21233254255125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()30333227355125P C ξ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭所以()5E ξ= 【点睛】(1)本题主要考查回归方程的求法,考查二项分布,意在考查学生对这些知识的掌握水平和分析推理能力.(2) 如果在一次试验中某事件发生的概率是P ,那么在n 次独立重复试验中这个事件恰好发生K 次的概率是()(1)kkn kn n P k C p p ξ-==-,(0,1,2,3,...k n =).正好是二项式[(1)]n p p -+的展开式的第1k +项.所以记作ξ~(,)B n p ,读作ξ服从二项分布,其中,n p 为参数.26.(1)0.1849.968y x =+;(2)所求回归直线方程是有效可靠的;(3)该果园预计收入25095.84元. 【分析】(1)求出x 的平均值x ,y 的平均值y ,再根据公式求出b 和a ,即可得出回归方程;。
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.54.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .815. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39 B .42C .45D .507.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和928.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64 B .96C .144D .1609.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位12.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 二、填空题13.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =)满足4115ii x==∑,4112i i y ==∑,若广告费用x 和销售额y 之间具有线性相关关系,且回归直线方程为^y bx a =+,0.6b =,那么广告费用为5千元时,可预测的销售额为___万元. 14.某校为了解1000名高一新生的身体生长状况,用系统抽样法(按等距的规则)抽取40名同学进行检查,将学生从1~1000进行编号,现已知第18组抽取的号码为443,则第一组用简单随机抽样抽取的号码为_________15.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.16.已知一组数据为2,3,4,5,6,则这组数据的方差为______.17.已知一组数据:5.7,5.8,6.1,6.4,6.5,则该数据的方差是__________. 18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X 1011.3 11.8 12.5 13 U 10 11.3 11.8 12.5 13 Y12345V54321用b 1表示变量Y 与X 之间的回归系数,b 2表示变量V 与U 之间的回归系数,则b 1与b 2的大小关系是___.19.某中学调查了400名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[]17.5,30,样本数据分组为[)17.5,20,[)20,22.5,[)22.5,25,[)25,27.5,[]27.5,30.根据直方图,这400名学生中每周的自习时间不少于22.5小时的人数是__________人.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下: 年份 2014 2015 20162017 2018 2019 编号x 1 2 3 4 5 6 数量y (辆)4196116190218275(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位. 参考数据:61936ii y==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.23.2018年,依托用户碎片化时间的娱乐需求、分享需求以及视频态的信息负载力,短视频快速崛起;与此同时,移动阅读方兴未艾,从侧面反应了人们对精神富足的一种追求,在习惯了大众娱乐所带来的短暂愉悦后,部分用户依旧对有着传统文学底蕴的严肃阅读青睐有加.某读书APP 抽样调查了非一线城市M 和一线城市N 各100名用户的日使用时长(单位:分钟),绘制成频率分布直方图如下,其中日使用时长不低于60分钟的用户记为“活跃用户”.(1)请填写以下22⨯列联表,并判断是否有99.5%的把握认为用户活跃与否与所在城市有关?活跃用户 不活跃用户 合计城市M 城市N 合计(2)以频率估计概率,从城市M 中任选2名用户,从城市N 中任选1名用户,设这3名用户中活跃用户的人数为ξ,求ξ的分布列和数学期望.(3)该读书APP 还统计了2018年4个季度的用户使用时长y (单位:百万小时),发现y 与季度(x )线性相关,得到回归直线为ˆ4ˆyx a =+,已知这4个季度的用户平均使用时长为12.3百万小时,试以此回归方程估计2019年第一季度(5x =)该读书APP 用户使用时长约为多少百万小时. 附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥ 0.025 0.010 0.005 0.001 0k5.0246.6357.87910.82824.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:s =(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b cd =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.C【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.4.A解析:A 【解析】利用茎叶图、平均数的性质直接求解. 【详解】由一组数据的茎叶图得: 该组数据的平均数为:1(7581858995)855++++=. 故选:A . 【点睛】本题考查平均数的求法,考查茎叶图、平均数的性质等基础知识,考查运算求解能力,是基础题.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:先求均值,确定ˆb,再求自变量为19对应函数值得结果. 详解:因为2523.52220.5330333639122,344442x y ++++++====,所以1348022,3224ˆb-==- 所以19(2)8042y =⨯-+=选B.点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .7.A解析:A 【解析】8个班参加合唱比赛的得分从小到大排列分别是87,89,90,91,92,93,94,96,中位数是91,92,的平均数91.5,平均数是87+89+90+91+92+93+94+968=91.58.D解析:D 【解析】 【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数. 【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D. 【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.A解析:A 【分析】可以通过n P 与0P 之间的大小关系进行判断. 【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001nn P P k P =+<,呈下降趋势. 【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.A解析:A 【解析】分析:先观察表中数据的规律,确定回归系数b 的符号,再计算x 和y ,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y 随当天气温x 升高而减少,则0b <,排除C 、D. 计算1169=(504712151923273136)1111x -++++++++++= 11228=(15615013212813011610489937654)111.641111y ++++++++++=≈ 将x 代入选项A ,得1692.352147.767111.6311ˆy=-⨯+= 将x 代入选项B ,得1692.352127.76591.6311ˆy=-⨯+= 所以选项A 正确. 故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b 符号的判断和回归直线过样本中心点(,)x y 是解题关键.二、填空题13.75【解析】【分析】计算然后将代入回归直线得从而得回归方程然后令x=5解得y 即为所求【详解】∵∴∵∴∴样本中心点为(3)又回归直线过(3)即3=06×+解得=所以回归直线方程为y =06x+令x =5时解析:75 【解析】 【分析】计算x ,y ,然后将x ,y 代入回归直线得a ,从而得回归方程,然后令x =5解得y 即为所求. 【详解】 ∵4115i i x ==∑,∴154x =, ∵4112i i y ==∑,∴1234y ==, ∴样本中心点为(154,3), 又回归直线0.6ˆyx a =+过(154,3),即3=0.6×154+a ,解得a =34, 所以回归直线方程为y =0.6x +34, 令x =5时,y =0.6×5+34=3.75万元 故答案为:3.75. 【点睛】本题考查线性回归方程的应用,以及利用线性回归方程进行预测,要注意回归直线必过样本中心点.14.18【解析】【分析】由题意知抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为即可解得【详解】因为抽样方法为系统抽样因此若第一组抽取号码为x 则第18组抽取的号码为解得【点睛】本题主要考解析:18 【解析】 【分析】由题意知,抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,即可解得. 【详解】因为抽样方法为系统抽样,因此,若第一组抽取号码为x ,则第18组抽取的号码为1725443x +⨯=,解得18x =. 【点睛】本题主要考查了系统抽样,属于中档题.15.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.16.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大解析:2 【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.17.1【解析】分析:先利用平均数公式求出平均数再利用方差公式即可得结果详解:的平均数为的方差为故答案为点睛:本题考查主要考查平均数公式与方差公式属于基础题样本数据的算术平均数公式;样本方差公式标准差解析:1 【解析】分析:先利用平均数公式求出平均数,再利用方差公式即可得结果. 详解:5.7,5.8,6.1,6.4,6.5的平均数为5.7+5.8+6.1+6.4+6.56.15=,5.7,5.8,6.1,6.4,6.5∴的方差为()()()()()222225.76.1+5.8 6.1+6.1 6.1+6.4 6.1+6.5 6.10.15-----=,故答案为0.1.点睛:本题考查主要考查平均数公式与方差公式,属于基础题. 样本数据的算术平均数公式12n 1(x +x +...+x )x n =;样本方差公式2222121[()()...()]n s x x x x x x n =-+-++-,标准差s =18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.280【解析】由频率分布直方图得这名大学生中每周的自习时间不少于小时的频率为这名大学生中每周的自习时间不少于小时的人数为故答案为解析:280 【解析】由频率分布直方图得这400名大学生中每周的自习时间不少于22.5小时的频率为()0.16+0.080.04 2.50.7,+⨯=∴这400名大学生中每周的自习时间不少于22.5小时的人数为4000.7280⨯=,故答案为280.20.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2 【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b aa b=,即36b a ==时,取等号 故答案为2三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可. 【详解】 解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=.6162221640816 3.5156ˆ46916356i ii ii x yxy bxx ==--⨯⨯===-⨯-∑∑,ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556ii i yy =-=∑.6221621()556110.9737586()ii i ii yy R yy ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好; (2)在(1)中求得的线性回归方程中,取9x =, 可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位. 【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 23.(1)见解析;(2)见解析;(3) 22.3百万小时 【分析】(1)根据频率分布直方图求数据填入对应表格,再根据卡方公式求2K ,最后对照数据作判断,(2)先确定随机变量取法,再判断从M 城市中任选的2名用户中活跃用户数服从二项分布,从N 城市中任选的1名用户中活跃用户数服从两点分布,进而求得对应概率,列表得分布列,最后根据数学期望公式得期望,(3)先求均值,解得ˆa,再估计5x =对应函数值. 【详解】(1)由已知可得以下22⨯列联表:计算()2220060208040200K 9.5247.8791001001406021⨯⨯-⨯==≈>⨯⨯⨯ , 所以有99.5%的把握认为用户是否活跃与所在城市有关. (2)由统计数据可知,城市M 中活跃用户占35,城市N 中活跃用户占45, 设从M 城市中任选的2名用户中活跃用户数为X ,则3~2,5X B ⎛⎫ ⎪⎝⎭设从N 城市中任选的1名用户中活跃用户数为Y ,则Y 服从两点分布,其中()415P Y ==. 故0,1,2,3ξ=,()()()20221400055125P P X P Y C ξ⎛⎫===⋅==⋅=⎪⎝⎭; ()()()()()2012224321*********555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅+⋅⋅⋅=⎪⎝⎭;()()()()()2122223431572112055555125P P X P Y P X P Y C C ξ⎛⎫===⋅=+=⋅==⋅⋅+⋅⋅=⎪⎝⎭;()()()222343632155125P P X P Y C ξ⎛⎫===⋅==⋅= ⎪⎝⎭. 故所求ξ的分布列为()428573601232125125125125E ξ=⨯+⨯+⨯+⨯=. (3)由已知可得 2.5x =,又12.3y =,可得12.34ˆ2.5a=⨯+,所以ˆ 2.3a =,所以4 2.3ˆy x =+. 以5x =代入可得ˆ22.3y=(百万小时), 即2019年第一季度该读书APP 用户使用时长约为22.3百万小时. 【点睛】本题考查频率分布直方图、回归直线方程以及分布列和数学期望,考查基本分析求解能力,属中档题.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为53)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费. 【详解】(1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=> 所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为01010080908x x --==因为10个分数的标准差6s ==所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元; 将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元. 【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641(0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
【成才之路】2014-2015学年高中数学第1章统计基础知识测试北师大版必修3 本试卷分第卷(选择题)和第卷(非选择题)两部分。
时间120分钟,满分150分。
第卷(选择题 共50分) 一、选择题(本大题共10个小题,每小题5分,共50分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.下列哪种工作不能使用抽样方法进行( ) A.测定一批炮弹的射程 B.测定海洋水域的某种微生物的含量 C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度 D.检测某学校全体高三学生的身高和体重的情况 [答案] D [解析] 抽样是为了用总体中的部分个体(即样本)来估计总体的情况,选项A、B、C都是从总体中抽取部分个体进行检验,选项D是检测全体学生的身体状况,所以,要对全体学生的身体都进行检验,而不能采取抽样的方法. 2.从一堆苹果中任取10只,称得它们的质量如下(单位:克): 125 120 122 105 130 114 116 95 120 134 则样本数据落在[114.5,124.5)内的频率为( ) A.0.2 B.0.3 C.0.4 D.0.5 [答案] C [解析] 该题考查频率的计算公式.属基础题. 在[114.5,124.5]范围内的频数m=4,样本容量n=10,所求频率=0.4. 3.某学校高二年级共有526人,为了调查学生每天用于休息的时间,决定抽取10%的学生进行调查;一次数学月考中,某班有12人在100分以上,30人在90~100分,12人低于90分,现从中抽取9人了解有关情况;运动会工作人员为参加4×100 m接力的6支队安排跑道.就这三个事件,恰当的抽样方法分别为( ) A.分层抽样、分层抽样、简单随机抽样 B.系统抽样、系统抽样、简单随机抽样 C.分层抽样、简单随机抽样、简单随机抽样 D.系统抽样、分层抽样、简单随机抽样 [答案] D [解析] 中人数较多,可采用系统抽样;适合用分层抽样;适合于简单随机抽样. 4.某工厂生产A,B,C三种不同型号的产品,产品数量之比依次为23∶5,现用分层抽样方法,抽出一个容量为n的样本,样本中A型号的产品有16件,则此样本的容量n等于( ) A.100 B.200 C.90 D.80 [答案] D [解析] =,得n=80. 5.一组观察值4,3,5,6出现的次数分别为3,2,4,2,则样本平均值约为( ) A.4.55 B.4.5 C.12.5 D.1.64 [答案] A [解析] 样本平均值为=≈4.55. 6.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )1 2 52 0 2 33 3 1 2 4 4 8 94 5 5 5 7 7 8 8 95 0 0 1 1 4 7 96 1 7 8 A.46,45,56 B.46,45,53 C.47,45,56 D.45,47,53 [答案] A [解析] 本题考查了茎叶图的应用及其样本的中位数、众数、极差等数字特征,由茎叶图可知,中位数为46,众数为45,极差为68-12=56.在求一组数据的中位数时,一定不要忘记先将这些数据排序再判断. 7.某市场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为2.5万元,则11时至12时的销售额为( ) A.6万元B.8万元 C.10万元 D.12万元 [答案] C [解析] 设11时至12时的销售额为x万元,因为9时至10时的销售额为2.5万元,依题意得=,得x=10万元. 8.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x(cm) 174 176 176 176 178 儿子身高y(cm) 175 175 176 177 177 则y对x的线性回归方程为( ) A.y=x-1 B.y=x+1 C.y=88+x D.y=176 [答案] C [解析] 本题主要考查线性回归方程以及运算求解能力.利用公式求系数. ==176, ==176, b==,a=-b=88, 所以y=88+x. 9.(2014·山东理,7)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.下图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( ) A.6 B.8 C.12 D.18 [答案] C [解析] 本题考查频率分布直方图的识读. 第一、二两组的频率为0.24+0.16=0.4 志愿者的总人数为=50(人). 第三组的人数为:50×0.36=18(人) 有疗效的人数为18-6=12(人) 频率分布直方图中频率与频数的关系是解题关键. 10.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) A.甲地:总体均值为3,中位数为4 B.乙地:总体均值为1,总体方差大于0 C.丙地:中位数为2,众数为3 D.丁地:总体均值为2,总体方差为3 [答案] D [解析] 解法一:A中,若连续10天甲地新增疑似病例数据分别为x1=x2=x3=x4=0,x5=x6=x7=x8=x9=4,x10=10,此时总体均值为3,中位数为4,但第10天新增疑似病例超过7,故A错;B中,若x1=x2=x3=x4=x5=x6=x7=x8=x9=0,x10=10,此时,总体均值为1,方差大于0,但第10天新增疑似病例超过7,故B错;C中,若x1=x2=x3=x4=0,x5=1,x6=3,x7=3,x8=3,x9=8,x10=9,此时,中位数为2,众数为3,但第9天、第10天新增疑似病例超过7,故C错,故选D. 解法二:由于甲地总体均值为3,中位数为4,即中间天数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合;乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合. 第卷(非选择题 共100分) 二、填空题(本大题共5个小题,每小题5分,共25分,将正确答案填在题中横线上) 11.某班级有52名学生,要从中抽取10名学生调查学习情况,若采用系统抽样方法,则此班内每个学生被抽到的机会是________. [答案] [解析] 采用系统抽样,要先剔除2名学生,确定间隔k=5,但是每名学生被剔除的机会一样,故虽然剔除了2名学生,这52名学生中每名学生被抽到的机会仍相等,且均为=. 12.一个社会调查机构就某地居民的月收入调查10 000人,并根据所得数据画了样本的频率分布直方图(如图所示).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人. [答案] 25 [解析] 样本数据在[2 500,3 000]内的频率为0.0005×500=0.25. 故应抽出100×0.25=25(人). 13.青年歌手大奖赛共有10名选手参赛,并请了7名评委,如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,去掉一个最高分和一个最低分后,甲、乙选手剩余数据的平均成绩分别为________. 甲乙8 5 7 9 8 6 5 4 8 4 4 4 6 7 2 9 3 [答案] 84.2,85 [解析] 甲的成绩是75,78,84,85,86,88,92,去掉一个最高分92和一个最低分75后,则甲的平均成绩为84.2;乙的成绩是79,84,84,84,86,87,93,去掉一个最高分93和一个最低分79后,则乙的平均成绩为85. 14.某地区有农民、工人、知识分子家庭共计2 004家,其中农民家庭1 600户,工人家庭303户.现要从中抽出容量为40的样本进行年人均收入的调查,则在整个抽样过程中,可以用到下列抽样方法中的________.(将你认为正确的选项的序号都填上) 简单随机抽样 系统抽样 分层抽样 [答案] [解析] 显然要用分层抽样.由于抽样比不是整数,先剔除4人,要用简单随机抽样——借助随机数表,各类家庭中抽样可用系统抽样. 15.某地为了了解该地区10 000户家庭的用电情况,采用分层抽样的方法抽取了500户家庭的月平均用电量,并根据这500户家庭的月平均用电量画出频率分布直方图(如图所示),则该地区10 000户家庭中月平均用电度数在[70,80]的家庭有________户. [答案] 1 200 [解析] 由频率分布直方图可得,月平均用电度数在[70,80]的家庭占总体的12%,所以共有10 000×12%=1 200户. 三、解答题(本大题共6个小题,共75分,解答应写出文字说明、证明过程或演算步骤) 16.(本小题满分12分)某公司为了了解一年内用水情况,抽查了10天的用水量如下表: 天数 1 1 1 2 2 1 2 吨数 22 38 40 41 44 5095 根据表中提供的信息解答下面问题: (1)这10天中,该公司每天用水的平均数是多少? (2)这10天中,该公司每天用水的中位数是多少? (3)你认为应该使用平均数和中位数中哪一个数来描述该公司每天的用水量? [解析] (1)= =51(t). (2)中位数==42.5(t). (3)用中位数42.5t来描述该公司的每天用水量较合适.因为平均数受极端数据22,95的影响较大. 17.(本小题满分12分)某学校青年志愿者协会共有250名成员,其中高一学生88名,高二学生112名,高三学生50人,为了了解志愿者活动与学校学习之间的关系,需要抽取50名学生进行调查.试确定抽样方法,并写出过程. [解析] 分三种情况抽样: (1)简单随机抽样,每位同学被抽取的概率为. (2)系统抽样,将250名同学编号001~250,编号间隔5个,将其分成50个小组,每个小组抽取1人,相邻组抽取的编号也间隔5. (3)分层抽样,高一抽取18个,高二抽取22个,高三抽取10个. 18.(本小题满分12分)国家队教练为了选拔一名篮球队员入队,分别对甲、乙两名球员的10场同级别比赛进行了跟踪,将他们的每场得分记录如下表: 场次 1 2 3 4 5 6 7 8 9 10 甲40 23 2935 35 54 42 48 56 10 乙20 15 19 44 9 34 4218 45 51 (1)求甲、乙球员得分的中位数和极差. (2)甲球员得分在区间[30,50)的频率是多少? (3)如果你是教练,你将选拔哪位球员入队?请说明理由. [解析] (1)由题表画出茎叶图,如下图所示. 甲乙0 9 0 1 58 9 9 3 2 0 5 5 3 48 2 0 4 2 4 5 6 4 5 1甲球员得分的中位数为=37.5, 极差为56-10=46; 乙球员得分的中位数为=27, 极差为51-9=42. (2)甲球员得分在区间[30,50)的频率为=. (3)如果我是教练,我将选拔甲球员入队,原因如下:甲球员得分集中在茎叶图的下方,且叶的分布是“单峰”,说明甲球员得分平均数接近40,甲球员得分的中位数为37.5分,且状态稳定;而乙球员得分较分散,其得分的中位数为27分,低于甲球员,平均得分也小于甲球员. 19.(本小题满分12分)为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:千克),并将所得数据分组,画出频率分布直方图(如图所示). 分组频率[1.00,1.05) [1.05,1.10) [1.10,1.15)[1.15,1.20) [1.20,1.25) [1.25,1.30) (1)在频率分布表中填写相应的频率; (2)估计数据落在[1.15,1.30)中的概率为多少; (3)将上面捕捞的100条鱼分别作一记号后再放回水库,几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条,请根据这一情况来估计该水库中鱼的总条数. [解析] (1)根据频率分布直方图可知,频率=组距×故可得下表: 分组频率[1.00,1.05) 0.05 [1.05,1.10) 0.20 [1.10,1.15)0.28 [1.15,1.20) 0.30 [1.20,1.25) 0.15 [1.25,1.30) 0.02(2)0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47. (3)=2000. 所以水库中鱼的总条数约为2000条. 20.(本小题满分13分)两台机床同时生产直径为10的零件,为了检验产品质量,质量检验员从两台机床的产品中各抽出4件进行测量,结果如下: 机床甲10 9.8 10 10.2 机床乙10.1 10 9.9 10 如果你是质量检验员,在收集到上述数据后,你将通过怎样的运算来判断哪台机床生产的零件质量更符合要求? [解析] 甲=(10+9.8+10+10.2)=10, 乙=(10.1+10+9.9+10)=10, 由于甲=乙,因此,平均直径反映不出两台机床生产的零件的质量优劣. s=[(10-10)2+(9.8-10)2+(10-10)2+(10.2-10)2]=0.02, s=[(10.1-10)2+(10-10)2+(9.9-10)2+(10-10)2]=0.005. 这说明乙机床生产出的零件直径波动小,因此,从产品质量稳定性的角度考虑,乙机床生产的零件质量更符合要求. 21.(本小题满分14分)某个体服装店经营某种服装在某周内获纯利y(元)与该周每天销售这种服装件数x之间有如下一组数据: x 3 4 5 6 7 8 9 y 66 69 73 81 89 9091 (1)求,; (2)画出散点图,并用最小二乘法求出y关于x的线性回归方程; (3)估计每天销售10件这种服装时可获纯利润多少元? [解析] (1)由已知得=(3+4+5+6+7+8+9)=6. =(66+69+73+81+89+90+91)≈79.86. (2)散点图如图所示, =280,iyi=3 487. 设回归直线方程为y=bx+a,则 b==≈4.75, a=-b=79.86-4.75×6=51.36. 所求回归直线方程为y=4.75x+51.36. (3)当x=10时,y=98.86,估计每天销售这种服装10件可获纯利98.86元.。
本章达标检测(满分:150分;时间:120分钟)一、单项选择题(本大题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列说法中正确的是( )A.相关关系是一种不确定的关系,回归分析是对相关关系的分析,因此没有实际意义B.独立性检验对分类变量关系的研究没有100%的把握,所以独立性检验研究的结果在实际中没有多大的实际意义C.相关关系可以对变量的发展趋势进行预报,这种预报可能会是错误的D.独立性检验如果得出的结论有99%的可信度,就意味着这个结论一定是正确的2.若经验回归方程为y^=2-3.5x,则变量x增加一个单位,变量y平均( )A.减少3.5个单位B.增加2个单位C.增加3.5个单位D.减少2个单位3.根据如下样本观测数据可得到的经验回归方程为y^=bx+a,则( )x 3 4 5 6 7 8y 4.0 2.5 -0.5 0.5 -2.0 -3.0A.a>0,b<0B.a>0,b>0C.a<0,b<0D.a<0,b>04.下图是变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到经验回归方程:y^=b1x+a1,样本相关系数为r1;方案二:剔除点(10,32),根据剩下数据,得到经验回归方程:y^=b2x+a2,样本相关系数为r2,则( )A.0<r1<r2<1B.0<r2<r1<1C.-1<r1<r2<0D.-1<r2<r1<05.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:单位:人男女合计爱好40 20 60不爱好20 30 50合计60 50 110由χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)算得χ2=110×(40×30-20×20)260×50×60×50≈7.8.附表:α0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 参照附表,得到的正确结论是( )A.有99%以上的把握认为“爱好该项运动和性别有关”B.有99%以上的把握认为“爱好该项运动和性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”6.观察下列各图,其中两个分类变量x,y 之间关系最强的是( )7.某调查者在调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:序号 科研费用支出x i利润y i x i y i x i 21 5 31 155 252 11 40 440 12134 30 120 16 45 34 170 25 5 3 25 75 96 2 20 40 4 合计30180 1 000200则利润y 关于科研费用支出x 的经验回归方程为( ) 参考公式:b ^=∑i=1nx i y i -nxy ∑i=1nx i2-nx 2,a ^=y -b ^x .A.y ^=2x+20B.y ^=2x-20 C.y ^=20x+2 D.y ^=20x-28.春节期间,“履行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民能否做到“光盘”,得到如下的列联表:单位:人不能做到“光盘”能做到“光盘”合计男45 10 55女30 15 45 合计75 25 100附:α0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.参照附表,得到的正确结论是( )A.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过0.01的前提下认为“该市居民能否做到‘光盘’与性别无关”C.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”D.在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别无关”二、多项选择题(本大题共4小题,每小题5分,共20分.在每小题给出的选项中,有多个选项符合题目要求,全部选对的得5分,部分选对的得3分,有选错的得0分)9.下列说法正确的是( )A.在回归分析中,可以借助散点图判断两个变量是否具有线性相关关系B.在回归分析中,可以通过残差图发现原始数据中的可疑数据,残差平方和越小,模型的拟合效果越好C.在回归分析模型中,样本相关系数的绝对值越大,说明模型的拟合效果越好D.在经验回归方程y^=0.1x+10中,当解释变量x每增加1个单位时,响应变量y^增加0.1个单位10.独立性检验中,为了调查变量X与变量Y的关系,经过计算得到χ2≥6.635=x0.01,其表示的意义是( )A.有99%的把握认为变量X与变量Y没有关系B.有1%的把握认为变量X与变量Y有关系C.有99%的把握认为变量X与变量Y有关系D.有1%的把握认为变量X与变量Y没有关系11.已知由样本数据(x i,y i),i=1,2,…,n求得的经验回归方程为y^=1.5x+0.5,且x=3,现发现两个样本点(1.2,2.2)和(4.8,7.8)误差较大,去除后重新求得的经验回归直线l的斜率为1.2,则( )A.变量x与y具有正相关关系B.去除后的经验回归方程为y^=1.2x+1.4C.去除后y的估计值增加速度变快D.去除后样本点(2,3.75)的残差为0.0512.某校团委对“学生性别和喜欢运动是否有关”进行了一次调查,其中被调查的,女生喜欢运动的人数占女男、女生人数相同,男生喜欢运动的人数占男生人数的45生人数的3,若有95%的把握认为“是否喜欢运动和性别有关”,则被调查人中男生5可能有( )附:α 0.05 0.01 x α3.8416.635χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d ),其中n=a+b+c+d. A.25人 B.45人C.60人D.75人三、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中横线上) 13.下列是关于男婴与女婴出生调查的列联表:单位:人晚上出生 白天出生合计 男婴 45 A B 女婴 E 35 C 合计98D180那么A= ,B= ,C= ,D= ,E= .14.已知样本容量为11,计算得∑i=111x i =66,∑i=111y i =132,经验回归方程为y ^=0.3x+a,则a= .15.某单位为了了解用电量y(度)与气温x(℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了如下对照表,由表中数据得经验回归方程y ^=b ^x+a ^,其中b ^=-2.现预测当气温为-4 ℃时,用电量的度数为 . 气温x(℃) 18 13 10 -1 用电量y(度)2434386416.某部门通过随机调查89名工作人员的休闲方式是读书还是健身,得到的数据如下表:单位:人读书健身合计女24 31 55男8 26 34合计32 57 89在犯错误的概率不超过的前提下认为性别与休闲方式有关系.附表:α0.1 0.05 0.01 0.005 0.001xα 2.706 3.841 6.635 7.879 10.828四、解答题(本大题共6小题,共70分.解答应写出文字说明,证明过程或演算步骤)17.(本小题满分10分)2017年10月18日至10月24日,中国共产党第十九次全国人民代表大会在北京顺利召开.大会期间,北京某高中举办了一次“喜迎十九大”的读书读报知识竞赛,参赛选手为从高一年级和高二年级各随机抽取的100名学生.图1和图2分别是高一年级和高二年级参赛选手成绩(单位:分)的频率分布直方图.(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(同一组的数据用该组区间的中点值代表)(2)完成下面的2×2列联表,并依据α=0.01的独立性检验,分析高一、高二两个年级学生这次读书读报知识竞赛的成绩是否有差异.单位:人成绩低于60分成绩不低于60分合计高一年级高二年级合计附: χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.α0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.82818. (本小题满分12分)某连锁经营公司的5个零售店某月的销售额和利润如下表:商店名称 A B C D E 销售额x/千万元 3 5 6 7 9 利润y/百万元23345(1)画出散点图,观察散点图,说明两个变量是否线性相关; (2)用最小二乘法计算利润y 关于销售额x 的经验回归方程; (3)当销售额为4千万元时,估计利润为多少. 参考公式:b ^=∑i=1nx i y i -nxy ∑i=1nx i 2-nx 2,a ^=y -b ^x .19. (本小题满分12分)2020年3月,由于疫情的影响,各地学生在家进行网上在线学习,为了研究学生在网上学习的情况,某学校在网上随机抽取120名学生对线上教育进行调查,其中男生与女生的人数之比为11∶13,男生中有30人对线上教育满意,女生中有15人表示对线上教育不满意.(1)完成下面的2×2列联表,依据α=0.01的独立性检验,分析对线上教育是否满意与性别是否有关;单位:人满意不满意合计男生女生合计120(2)从被调查的对线上教育满意的学生中,利用分层随机抽样抽取8名学生,再在这8名学生中抽取3名学生作线上学习的经验介绍,其中抽取男生的人数为X,求X的分布列及期望.附: χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.α0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.82820. (本小题满分12分)某省级示范高中高三年级对各科考试的评价指标中有“难度系数”和“区分度”两个指标,难度系数=年级总平均分满分,区分度=实验班的平均分-普通班的平均分满分.(1)某次数学考试(满分为150分),随机从实验班和普通班各抽取三人,实验班三人的成绩分别为147分,142分,137分;普通班三人的成绩分别为97分,102分,113分.通过样本估计本次考试的区分度(精确到0.01); (2)该校高三年级6次数学考试的统计数据如下表: 难度系数x 0.64 0.71 0.74 0.76 0.77 0.82 区分度y 0.18 0.230.240.240.220.15①计算样本相关系数r,|r|<0.75时,认为相关性弱;|r|≥0.75时,认为相关性强.通过计算说明,能否利用线性回归模型描述y 与x 的关系(精确到0.01); ②令t i =|x i -0.74|(i=1,2,…,6),求出y 关于t 的经验回归方程,并预测x=0.75时y 的值(精确到0.01).附:∑i=16x i y i =0.930 9,√∑i=16(x i -x )2√∑i=16(y i -y )2≈0.011 2, ∑i=16t i y i =0.048 3,∑i=16(t i -t )2=0.007 3.样本相关系数r=∑i=1nx i y i -nxy√∑i=1n(x i -x )√∑i=1n(y i -y ),经验回归方程y ^=b ^x+a ^的斜率和截距的最小二乘估计分别为b ^=∑i=1nx i y i -nxy ∑i=1n(x i -x )2,a ^=y -b ^x .21. (本小题满分12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到的频率分布直方图分别如图1,图2.图1图2(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名25周岁以下组工人的概率;(2)规定日平均生产件数不少于80者为生产能手,请你根据已知条件列出2×2列联表,依据α=0.1的独立性检验,分析生产能手与工人所在的年龄组是否有关. 附:α0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.22. (本小题满分12分)某地区在一次考试后,从全体考生中随机抽取44名,获取他们本次考试的数学成绩x(单位:分)和物理成绩y(单位:分),绘制成如下散点图:根据散点图可以看出y与x之间具有线性相关关系,但图中有两个异常点A,B.经调查得知,A考生由于感冒导致物理考试发挥失常,B考生因故未能参加物理考试.为了使分析结果更科学准确,剔除这两组数据后,对剩下的数据进行处理,得到一些统计值:∑i=142x i =4 641,∑i=142y i =3 108,∑i=142x i y i =350 350,∑i=142(x i -x )2=13 814.5,∑i=142(y i -y )2=5 250,其中x i ,y i 分别表示这42名同学的数学成绩、物理成绩,i=1,2,…,42,y 与x 的样本相关系数r≈0.81.(1)若不剔除A,B 两名考生的数据,用44组数据作回归分析,设此时y 与x 的样本相关系数为r 0.试判断r 0与r 的大小关系,并说明理由;(2)求y 关于x 的经验回归方程(精确到0.01),如果B 考生加了这次物理考试(已知B 考生的数学成绩为125分),估计其物理成绩是多少;(精确到个位)(3)从概率统计规律看,本次考试该地区的物理成绩X 服从正态分布N(μ,σ2).以剔除后的物理成绩作为样本,用样本平均数y 作为μ的估计值,用样本方差s 2作为σ2的估计值.试求该地区5 000名考生中,物理成绩位于区间[62.8,85.2]的人数Z 的数学期望.(精确到个位) 附:①经验回归方程y ^=b ^x+a ^中,b ^=∑i=1n(x i -x )(y i -y )∑i=1n(x i -x )2,a ^=y -b ^x .②若X~N(μ,σ2),则P(μ-σ≤X≤μ+σ)≈0.682 7,P(μ-2σ≤X≤μ+2σ)≈0.954 5. ③√125≈11.2.答案全解全析 本章达标检测一、单项选择题1.C 相关关系虽然是一种不确定的关系,但是回归分析可以在某种程度上对变量的发展趋势进行预报,这种预报在尽量减小误差的条件下可以对生产与生活起到一定的指导作用,独立性检验对分类变量的研究也是不确定的,但是其结果也有一定的实际意义.故选C.2.A 由经验回归方程可知b ^=-3.5,则变量x 增加一个单位,y ^减少3.5个单位,即变量y 平均减少3.5个单位.3.A 依据题中的成对样本数据作散点图如下,由图可知,a>0,b<0.4.A 观察散点图可知,变量x 和y 呈现正相关,所以0<r 1<1,0<r 2<1, 剔除点(10,32)之后,可看出经验回归方程y ^=b 2x+a 2拟合数据效果更好,所以r 2更接近1. 所以0<r 1<r 2<1.故选A.5.A 因为χ2>6.635=x 0.01,所以有99%以上的把握认为“爱好该项运动和性别有关”,故选A.6.D 结合选项可知,D 图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.7.A 设经验回归方程为y ^=b ^x+a ^.由题表中数据得,b ^=1 000-6×5×30200-6×52=2,∴a ^=30-2×5=20,∴经验回归方程为y ^=2x+20. 8.C χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )=100×(45×15-10×30)255×45×75×25≈3.030,∵x 0.1< χ2<x 0.05,∴在犯错误的概率不超过0.1的前提下认为“该市居民能否做到‘光盘’与性别有关”. 二、多项选择题9.ABD 对于A,可以借助散点图直观判断两个变量是否具有线性相关关系,所以正确;对于B,可用残差平方和判断模型的拟合效果,残差平方和越小,模型的拟合效果越好,所以正确;对于C,样本相关系数的绝对值越大,只能说明两个变量具有较强的相关性,不能作为分析模型的拟合效果好坏的依据,应该是R 2越大,模型的拟合效果越好,所以错误;对于D,在经验回归方程y ^=0.1x+10中,当解释变量x 每增加1个单位时,响应变量y ^增加0.1个单位,所以正确. 故选ABD.10.CD 独立性检验中, χ2≥6.635=x 0.01,它表示的意义是有1%的把握认为变量X 与变量Y 没有关系,D 正确; 有99%的把握认为变量X 与变量Y 有关系,C 正确.故选CD.11.AB ∵x =3,经验回归方程为y ^=1.5x+0.5,∴y =5,∵重新求得的经验回归直线l 的斜率为1.2,∴变量x 与y 具有正相关关系,设新的数据的所有横坐标的平均值为x ',纵坐标的平均值为y ',则(n-2)x '=n x -(1.2+4.8)=3n-6=3(n-2),(n-2)y '=n y -(2.2+7.8)=5n-10=5(n-2),故x '=3,y '=5, a ^=y '-b ^x '=5-1.2×3=1.4.故新的经验回归方程为y ^=1.2x+1.4,故A,B 正确;因为斜率为1.2不变,所以去除后y 的估计值增长速度不变,C 错误;把x=2代入新的经验回归方程中,得y ^=3.8,3.75-3.8=-0.05,故D 错误.故选AB. 12.BC 设被调查人中男生有x 人,依题意可得列联表如下:单位:人喜欢运动不喜欢运动合计 男生 45x 15x x 女生 35x 25x x 合计75x35x2x若有95%的把握认为“是否喜欢运动和性别有关”,则3.841≤χ2=2x 21<6.635,解得40.330 5≤x<69.667 5,由题意知x>0,且x 是5的整数倍,所以结合选项知45和60满足题意. 故选BC. 三、填空题13.答案 47;92;88;82;53 解析 ∵45+E=98,∴E=53. ∵E+35=C,∴C=88.∵98+D=180,∴D=82. ∵A+35=D,∴A=47. ∵45+A=B,∴B=92. 14.答案 10.2解析 ∵∑i=111x i =66,∑i=111y i =132,∴x =6,y =12,∴a=12-0.3×6=10.2. 15.答案 68解析 由题表中数据可得x =14×(18+13+10-1)=10,y =14×(24+34+38+64)=40,所以经验回归直线y ^=-2x+a ^过点(10,40),故a ^=60. 所以当x=-4时,y ^=-2×(-4)+60=68. 16.答案 0.1解析 由题中列联表中的数据,得χ2=89×(24×26-31×8)255×34×32×57≈3.689,因为χ2>2.706=x 0.1,所以在犯错误的概率不超过0.1的前提下认为性别与休闲方式有关系. 四、解答题17.解析 (1)高一年级参赛学生的平均成绩为(45×0.04+55×0.04+65×0.01+75×0.01)×10=54(分),高二年级参赛学生的平均成绩为(45×0.015+55×0.025+65×0.035+75×0.025)×10=62(分).(4分) (2)补全2×2列联表如下:单位:人成绩低于 60分成绩不低于 60分合计高一年级 80 20 100 高二年级 40 60 100 合计12080200零假设为H 0:两个年级的成绩相互独立,即高一、高二两个年级学生这次读书读报知识竞赛的成绩没有差异.计算可得χ2=200×(80×60-20×40)2100×100×120×80≈33.333>6.635=x 0.01,根据α=0.01的独立性检验,推断H 0不成立,即认为高一、高二两个年级学生这次读书读报知识竞赛的成绩有差异.(10分) 18.解析 (1)散点图如图所示.由散点图可以看出变量x,y 线性相关.(4分) (2)设经验回归方程为y ^=b ^x+a ^.易得y =3.4,x =6,∑i=15x i y i =112,∑i=15x i 2=200,所以b ^=112-5×6×3.4200-5×62=0.5,a ^=y -b ^x =3.4-0.5×6=0.4,即利润y 关于销售额x 的经验回归方程为y ^=0.5x+0.4.(9分)(3)当销售额为4千万元时,利润约为0.5×4+0.4=2.4(百万元).(12分) 19.解析 (1)男生人数为120×1111+13=55,所以女生人数为120-55=65,于是可完成2×2列联表如下:单位:人满意 不满意 合计 男生 30 25 55 女生 50 15 65 合计8040120(3分)零假设为H 0:对线上教育是否满意与性别无关.计算可得 χ2=120×(30×15-25×50)255×65×80×40≈6.713>6.635=x 0.01,依据α=0.01的独立性检验,推断H 0不成立,即认为对线上教育是否满意与性别有关.(6分)(2)由(1)可知男生抽取3人,女生抽取5人,依题可知X 的可能取值为0,1,2,3,并且X 服从超几何分布,P(X=k)=C 3k C 53-kC 83(k=0,1,2,3),即P(X=0)=C 53C 83=528,P(X=1)=C 31C 52C 83=1528,P(X=2)=C 32C 51C 83=1556,P(X=3)=C 33C 83=156.(9分)所以X 的分布列为X 0 1 2 3 P52815281556156可得E(X)=0×528+1×1528+2×1556+3×156=98.(12分) 20.解析 (1)实验班三人成绩的平均值为142,普通班三人成绩的平均值为104,故估计本次考试的区分度为142-104150≈0.25.(3分)(2)①由题中的表格可知x =16×(0.64+0.71+0.74+0.76+0.77+0.82)=0.74, y =16×(0.18+0.23+0.24+0.24+0.22+0.15)=0.21,故r=∑i=16x i y i -nxy√∑i=16(x i -x )2√∑i=16(y i -y )2≈-0.13.因为|r|<0.75,所以相关性弱,故不能利用线性回归模型描述y 与x 的关系.(6分) ②y 与t 的对应数据如下表:t 0.10 0.030 0.020.03 0.08 区分度y0.180.23 0.24 0.240.220.15则b ^=∑i=16t i y i -6ty∑i=16(t i -t )2≈0.048 3-6×0.266×0.210.007 3≈-0.86,所以a ^=y -b ^t ≈0.21+0.86×0.266≈0.25,所以所求经验回归方程为y ^=-0.86t+0.25,(10分) 当x=0.75时,t=0.01,则y≈0.24.(12分)21.解析 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名.所以样本中日平均生产件数不足60的工人中,25周岁以上组工人有60×0.05=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.05=2(人),记为B 1,B 2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2). 其中,至少有1名25周岁以下组工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2),故所求概率P=710.(5分)(2)由题中频率分布直方图可知,在抽取的100名工人中,25周岁以上组中的生产能手有60×0.25=15(人),25周岁以下组中的生产能手有40×0.375=15(人), 据此可得2×2列联表如下:单位:人生产能手 非生产能手合计 25周岁以上组 15 45 60 25周岁以下组15 25 40 合计3070100(8分)零假设为H 0:生产能手与工人所在的年龄组无关.计算可得χ2=100×(15×25-45×15)260×40×30×70≈1.79<2.706=x 0.1.(10分)依据α=0.1的独立性检验,没有充分证据推断H 0不成立,因此认为H 0成立,即认为生产能手与工人所在的年龄组无关.(12分) 22.解析 (1)r 0<r.理由如下:由题图可知,y 与x 呈现正相关, ①异常点A,B 会降低变量之间的线性相关程度.②44个数据点与其经验回归直线的总偏差更大,回归效果更差,所以样本相关系数更小.③42个数据点与其经验回归直线的总偏差更小,回归效果更好,所以样本相关系数更大.④42个数据点更贴近其经验回归直线. ⑤44个数据点与其经验回归直线更离散.(4分)(2)设y 关于x 的经验回归方程为y ^=b ^x+a ^.由题中数据可得:x =142∑i=142x i =110.5,y =142∑i=142y i =74,所以∑i=142(x i -x )(y i -y )=∑i=142x i y i -42xy =350 350-42×110.5×74=6 916. 又因为∑i=142(x i -x )2=13 814.5,所以b ^=∑i=142(x i -x )(y i -y )∑i=142(x i -x )2≈0.50,a ^=y -b ^x ≈74-0.50×110.5≈18.75, 所以y ^=0.50x+18.75.将x=125代入,得y=0.50×125+18.75=62.5+18.75≈81, 所以估计B 考生的物理成绩为81分.(8分)(3)y=142∑i=142y i=74,s2=142∑i=142(y i-y)2=142×5 250=125,所以X~N(74,125),又因为√125≈11.2,所以P(62.8≤X≤85.2)=P(74-11.2≤X≤74+11.2)≈0.682 7,所以Z~B(5 000,0.682 7),所以E(Z)=5 000×0.682 7≈3 414,即该地区本次考试物理成绩位于区间[62.8,85.2]的人数Z的数学期望约为3 414.(12分)。
挑战数学系列-----统计
出卷人:李务兵姓名:………….. 班级……………记分:……………
(本试卷共20道题,总分150 时间120分钟)
一、选择题(本题有10个小题,每小题5分,共50分)
1.为了了解所加工的一批零件的长度,抽测了200个零件的长度,在这个问题中,200个零件的长度是()A.总体 B. 个体 C. 总体的一个样本 D. 样本容量
2.要采用分层抽样方法从100道选择题、50道判断题、50道填空题、20道解答题中选取22道题目组成一份试卷,则从中选出填空题的道数是()
A.10
B.5
C.2
D.20
3.容量为20的样本,已知某组的频率为0.25,则该组的频数为()
A.5
B.15
C.2
D.80
4. 为了了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为40的样本,考虑用系统抽样,则分段的间隔k为()A.40 B. 30 C. 20 D. 12
5. 一批热水器共98台,其中甲厂生产的有56台,乙厂生产的有42台,用分层抽样从中抽出一个容量为14的样本,那么甲、乙两厂各抽得的热水器的台数是()A.甲厂9台,乙厂5台 B. 甲厂8台,乙厂6台
C. 甲厂10台,乙厂4台
D. 甲厂7台,乙厂7台
6. 下列叙述中正确的是()A.从频率分布表可以看出样本数据对于平均数的波动大小
B. 频数是指落在各个小组内的数据
C. 每小组的频数与样本容量之比是这个小组的频率
D. 组数是样本平均数除以组距
7. 某工厂生产产品,用传送带将产品送至下一个工序,质检人员每隔十分钟在传送带某一位置取一件检验,则这种抽样的方法为()A.简单随机抽样 B. 系统抽样
C. 分层抽样
D. 非上述情况
8. 频率分布直方图红,小长方形的面积等于()A.组距 B. 频率 C. 组数 D. 频数
9. 一组数据的方差为3,将这组数据中的每一个数据都扩大到原来的3倍,所得到的一组数据的方差是()A.1 B. 27 C. 9 D. 3
10. 两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2. 那么样本甲和样本乙的波动大小情况是()A.甲、乙波动大小一样 B. 甲的波动比乙的波动大
C. 乙的波动比甲的波动大 C. 甲、乙的波动大小无法比较
二、填空题(本题有4个小题,每小题5分,共20分)
11.要完成下列两项调查,①从钱二高高三658人、高二726人、高一578人中选取200人进行视力调查;②从钱二高高二(12)抽选4位学生参加座谈会。
应采取的抽样方法分别是…………………………………………………
12. 观察新生婴儿的体重,其频率分布直方图如图:
则新生婴儿体重在(2700,3000)的频率为______________________
13. 已知样本99,100,101,x,y的平均数是100,方差是2,则xy=_____________
14. 甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图所示:
则甲得分的方差为__________,乙得分的方差为_____________.从而你得出的结论是__________________________________________.
三、解答题
15.(12分)某中学高一年级有x个学生,高二年级共有900个学生,高三年级有y个学生,采用分层抽样抽一个容量为370人样本,高一年级抽取120人,高三年级抽取100人,则全校高中部共有多少学生?
16.(14分)如图,是某单位职工年龄(取正整数)的频数分布图,根据图形提供的信息,回答下列问题(直接写出答案)
注:每组可含最低值,不含最高值
(1)该单位职工共有多少人?
(2)不小于38岁但小于44岁的职工人数占职工总人数的百分比是多少?
(3)如果42岁的职工有4人,那么年龄在42岁以上的职工有几人?
17.(14分)对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:门:甲、乙谁的平均成绩较好?谁的各门功课发展较平衡?
18. (12分)下面是一个病人在4月7日早上6点到4月9日的体温记录折线图,回答下列问题:
(1)护士每隔几小时给病人量一次体温?
(2)这个病人的体温最高是多少摄氏度?最低是多少摄氏度?
(3)他在4月8日12时的体温约为多少摄氏度?
(4)他的体温在哪段时间里下降得最快?哪段时间里比较稳定?
(5)从体温看,这个病人的病情是在恶化还是在好转?
19.(14分)如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:
(1)79.5---89.5这一组的频数、频率分别是多少?
(2)估计这次环保知识竞赛的及格率(60分及以上为及格)
20. (14分)以下是某地搜集到的新房屋的销售价格 y和房屋的面积x的数据:
(1)画出数据对应的散点图;
(2)求线性回归方程,并在散点图中加上回归直线;
(3)据(2)的结果估计当房屋面积为150㎡时的销售价格.
高一数学统计测试题参考答案
1.选(C )
2. 选(C )
3. 选(D )
4. 选(B)
5. 选(B)
6.选(C)
7.选(B)
8.选(B)
9. 选(B)
10.选(C)
11. 答案:10
1 12.答案:0.3
13.答案:996
14.答案:甲得分的方差为:4,乙得分的方差为:0.8,结论:乙的成绩较稳定,甲的成绩在不断提高,而乙的成绩则无明显提高.
15.【解】由题意得
100
120370900100120--==y x 解得 x=720,y=600
所以高中部共有学生2200人
16.【解】:(1)该单位有职工50人
(2)38--44岁之间的职工人数占职工总人数的60%
(3)年龄在42岁以上的职工有15人
17.【解】74)7090708060(5
1=++++=甲x 73)7580706080(5
1=++++=乙x 10441646145
1222222=++++=)(甲s 562731375
1222222=++++=)(乙s ∵ 2
2乙甲乙甲,s s x x >>
∴ 甲的平均成绩较好,乙的各门功课发展较平衡
18.【解】(1)6小时
(2)最高温度39.5℃,最低是36.8℃
(3)4月8日12时的体温是37.5℃
(4)在4月7日6点到12点的体温下降得最快,4月9日12点到18点比较稳定
(5)虚线表示标准体温
(6)好转
19.【解】(1)频率为:0.025×10=0.25,频数:60×0.25=15
(2)0.015×10+0.025×10+0.03×10+0.005×10=0.75
20.【解】(1)数据对应的散点图如图所示:
(2)1095151==∑=i i x x ,1570)(251
=-=∑=x x l i i xx , 308))((,2.2351
=--==∑=y y x x l y i i i xy
设所求回归直线方程为a bx y +=
, 则1962.01570
308≈==xx xy
l l b 8166.115703081092.23≈⨯
-=-=x b y a 故所求回归直线方程为8166.11962.0+=x y
(3)据(2),当x=150(㎡)时,销售价格的估计值为:
2466.318166.11501962.0=+⨯=y (万元)。