高一数学必修三之统计
- 格式:doc
- 大小:528.50 KB
- 文档页数:9
一、选择题1.2015年年岁史诗大剧《芈月传》风靡大江南北,影响力不亚于以前的《甄嬛传》.某记者调查了大量《芈月传》的观众,发现年龄段与爱看的比例存在较好的线性相关关系,年龄在[]10,14,[]15,19,[]20,24,[]25,29,[]30,34的爱看比例分别为10%,18%,20%,30%,%t .现用这5个年龄段的中间值x 代表年龄段,如12代表[]10,14,17代表[]15,19,根据前四个数据求得x 关于爱看比例y 的线性回归方程为( 4.68)%y kx =-,由此可推测t 的值为( )A .33B .35C .37D .392.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A .中位数为83B .众数为85C .平均数为85D .方差为193.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.75.已知一组数据的茎叶图如图所示,则该组数据的平均数为( )A .85B .84C .83D .816.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和677.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-.A .①②③B .①③④C .①②④D .②③④8.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C .12x x <,甲比乙成绩稳定D .12x x >,甲比乙成绩稳定9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.16.由茎叶图可知,甲组数据的众数和乙组数据的极差分别是__________.17.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
§5 用样本估计总体 5.1 估计总体的分布学习 目标1.理解什么是频率分布表、频率分布直方图、频率折线图.(数学抽象)2.会列频率分布表,会画频率分布直方图和频率折线图,能根据频率分布直方图解决问题.(数据分析、直观想象)3.了解用样本估计总体的意义.(数学抽象)导思 1.频率分布直方图纵轴的含义是什么?2.频率分布直方图的制作步骤是什么?3.如何画频率折线图?1.频率分布表和频率分布直方图 (1)频率分布表编制的方法步骤:(2)频率分布表与频率分布直方图有什么不同?提示:频率分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.2.频率折线图(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.频率分布表、频率分布直方图与频率折线图各有什么优缺点?提示:①频率分布表:优点:频率分布表在数量表示上比较确切;缺点:不够直观、形象,分析数据分布的总体趋势不太方便;②频率分布直方图:优点:频率分布直方图能非常直观地表明数据分布的形状,使我们能够看到在分布表中看不清楚的数据模式;缺点:从直方图本身得不出原始的数据内容,也就是说,把数据表示成直方图后,原有的具体数据信息就被抹掉了;③频率折线图:优点是它反映了数据的变化趋势.缺点:由图本身得不到原始的数据信息.1.辨析记忆(对的打“√”,错的打“×”)(1)频率分布直方图中的纵坐标指的是频率的值.()(2)频率分布直方图的宽度没有实际意义.()(3)频率分布直方图中各小矩形的面积之和可以不为1.()(4)在画频率折线图时,可以画成与横轴相连.()提示:(1)×.纵坐标指的是频率与组距的比值.(2) ×.频率分布直方图的宽度表示组距.(3)×.各小矩形的面积之和一定为1.(4) √.为了方便看图,一般习惯把频率折线图画成与横轴相连,所以横轴上左右两端点没有实际的意义.2.已知一个容量为40的样本,把它分成6组,第一组到第四组的频数分别为5,6,7,10,第五组的频率是0.2,那么第六组的频数是________,频率是________. 【解析】第五组的频数为0.2×40=8.所以第六组的频数为40-5-6-7-10-8=4.频率为440=0.1.答案:40.13.200辆汽车通过某一段公路时的时速的频率分布直方图如图所示,时速在[50,60)内的汽车有________.【解析】因为小长方形的面积即为对应的频率,时速在[50,60)内的频率为0.3,所以有200×0.3=60(辆).答案:60辆4.(教材例题改编)一个容量为n的样本,分成若干组,已知某组的频数和频率分别为50和0.25,则n=________.【解析】由题意得50n=0.25,所以n=200.答案:200类型一频率分布直方图的绘制(数据分析、直观想象)【典例】1.频率分布直方图中,小矩形的面积等于()A.组距B.频率C.组数D.频数2.调查某校高一年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161(1)作出频率分布表;(2)画出频率分布直方图.【思路导引】1.根据频率直方图中小矩形的几何意义,即可求解. 2.极差=180-151=29,组距为3,可分为10组.【解析】1.选B.根据小矩形的宽及高的意义,可知小矩形的面积为一组样本数据的频率.2.(1)①求极差:从数据中可看出,最大值是180,最小值是151,故极差为180-151=29.②确定组距与组数:取3为组距,则极差组距 =293 =923 ,故可将样本数据分成10组.③第一组起点定为150.5,组距为3,这样分出10组:[150.5,153.5),[153.5,156.5),[156.5,159.5),[159.5,162.5),[162.5,165.5),[165.5,168.5),[168.5,171.5),[171.5,174.5),[174.5,177.5),[177.5,180.5]. ④列频率分布表174.5~177.510.025177.5~180.510.025(2)画频率分布直方图如图所示:绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.1.有一个容量为45的样本数据,分组后各组的频数如下:(12.5,15.5],3;(15.5,18.5],8;(18.5,21.5],9;(21.5,24.5],11;(24.5,27.5],10;(27.5,30.5],4.由此估计,不大于27.5的数据约为总体的()A.91% B.92% C.95% D.30%【解析】选A.不大于27.5的样本数为:3+8+9+11+10=41,所以约占总体百分比为4145×100%≈91%.2.某中学同年级40名男生的体重数据如下(单位:千克):616059595958585757575756 565656565656555555555454 54545353525252525251515150504948列出样本的频率分布表,画出频率分布直方图. 【解析】①计算极差:61-48=13(千克); ②决定组距与组数,取组距为2,因为132 =612 ,所以共分7组;③决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下7组:47.5~49.5,49.5~51.5,51.5~53.5,53.5~55.5,55.5~57.5,57.5~59.5,59.5~61.5.④列出频率分布表如下:分组(Δx i ) 频数(n i ) 频率(f i ) 47.5~49.5 2 0.05 49.5~51.5 5 0.125 51.5~53.5 7 0.175 53.5~55.5 8 0.20 55.5~57.5 11 0.275 57.5~59.5 5 0.125 59.5~61.5 2 0.05 合计401.00⑤作出频率分布直方图如下:3.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:107~109,3株;109~111,9株;111~113,13株;113~115,16株;115~117,26株;117~119,20株;119~121,7株;121~123,4株;123~125,2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在109~121范围内的可能性是百分之几.【解析】(1)频率分布表如下:分组频数频率累积频率107~10930.030.03109~11190.090.12111~113130.130.25113~115160.160.41115~117260.260.67117~119200.200.87119~12170.070.94121~12340.040.98123~12520.02 1.00合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在109~121范围内的频率为:0.94-0.03=0.91,即数据落在109~121范围内的可能性是91%.类型二频率折线图的画法及应用【典例】从高三学生中抽取50名同学参加数学竞赛,成绩的分组及各组的频数如下(单位:分):40~50,2;50~60,3;60~70,10;70~80,15;80~90,12;90~100,8.(1)列出样本的频率分布表;(2)画出频率分布直方图及频率折线图; (3)估计成绩在60~90分的学生比例.【思路导引】画频率分布直方图和折线图⇒制作好频率分布表⇒纵坐标表示频率与组距的比值.【解析】(1)样本的频率分布表如下:成绩分组(Δx i ) 频数(n i ) 频率(f i ) f i Δx i 40~50 2 0.04 0.004 50~60 3 0.06 0.006 60~70 10 0.2 0.02 70~80 15 0.3 0.03 80~90 12 0.24 0.024 90~10080.160.016(2)频率分布直方图及频率折线图如图所示:(3)成绩在60~90的频率为1-0.04-0.06-0.16=0.74, 所以可估计成绩在60~90分的学生比例为74%.本例条件不变,估计成绩在50~80分的学生的比例.【解析】成绩在50~60分的学生的频数为3,在60~70的学生的频数为10,在70~80分的学生的频数为15,所以成绩在50~80分的学生的频数为28,占总体的2850 =1425 .频率折线图的作法及应用(1)作法:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)应用:频率折线图也是用一个单位长度表示一定的数量,但是,它是根据数量的多少在图中描出各个点,然后把各个点用线段顺次连接成的折线,因此,它不但可以表现出数量的多少,而且能够以折线的起伏,清楚而直观地表示出数量的增减变化的情况.提醒:画图时,横轴和纵轴的单位可不一致.有一个容量为100的某校毕业生起始月薪的样本,数据的分组及各组的频数如下:起始月薪(百元)[13,14)[14,15)[15,16)[16,17) 频数7112623起始月薪(百元)[17,18)[18,19)[19,20)[20,21]频数1584 6(1)列出样本的频率分布表;(2)画出频率分布直方图和频率折线图;(3)根据频率分布估计该校毕业生起始月薪低于2 000元的频率.【解析】(1)样本的频率分布表为起始月薪(百元)频数频率[13,14)70.07[14,15)110.11[15,16)260.26[16,17)230.23[17,18)150.15[18,19)80.08[19,20)40.04[20,21]60.06总计100 1.00(2)频率分布直方图和频率折线图如图.(3)起始月薪低于2 000元的频率为0.07+0.11+…+0.04=0.94,故起始月薪低于2 000元的频率的估计值是0.94.【补偿训练】某学校随机抽取部分新生调查其上学路上所需时间(单位:分钟),并将所得数据绘制成频率分布直方图(如图),其中,上学路上所需时间的范围是[0,100],样本数据分组为[0,20),[20,40),[40,60),[60,80), [80,100].(1)求直方图中x的值;(2)如果上学路上所需时间不少于40分钟的学生可申请在学校住宿,请估计学校1 000名新生中有多少名学生可以申请住宿.【解析】(1)由(x+0.012 5+0.006 5+0.003×2)×20=1,解得x=0.025.(2)上学所需时间不少于40分钟的学生的频率为:(0.006 5+0.003×2)×20=0.25,估计学校1 000名新生中有1 000×0.25=250名学生可以申请住宿.答:估计学校1 000名新生中有250名学生可以申请住宿.类型三用样本分布估计总体分布【典例】1.(2021·全国甲卷)为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是()A.该地农户家庭年收入低于4.5万元的农户比率估计为6%B.该地农户家庭年收入不低于10.5万元的农户比率估计为10%C.估计该地农户家庭年收入的平均值不超过6.5万元D.估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少;(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.【思路导引】1.利用频率分布直方图,计算出低于60分的人数的频率p,利用频数除以相应的频率p 得总人数.2.利用110次以上(含110次)的矩形面积除以所有的矩形面积之和,即可估计高一学生的达标率.【解析】1.选C. 低于4.5万元的比率估计为0.02×1+0.04×1=0.06=6%,故A 正确;不低于10.5万元的比率估计为(0.04+0.02×3)×1=0.1=10%,故B 正确;平均值为:(3×0.02+4×0.04+5×0.1+6×0.14+7×0.2+8×0.2+9×0.1+10×0.1+11×0.04+12×0.02+13×0.02+14×0.02)×1=7.68万元,故C 不正确;4.5万元到8.5万元的比率为:0.1×1+0.14×1+0.2×1+0.2×1=0.64=64%,故D 正确.2.(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此,第二小组的频率为:42+4+17+15+9+3=0.08. 又因为第二小组频率=第二小组频数样本容量, 所以样本容量=第二小组频数第二小组频率=120.08 =150. (2)由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%. (3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.用样本估计总体的常用方法(1)用频率分布表估计总体分布.根据样本数据可以制作频率分布表,利用频率分布表中的数据,如各小组的频数、频率,可以对总体中的有关量进行估计.(2)用频率分布直方图估计总体分布.根据样本数据绘制出的频率分布直方图具有直观的特点,可以直接判断出样本中数据的分布特点和变化趋势与规律,并由此对总体进行估计.(3)用频率折线图估计总体分布.由样本频率分布直方图可以绘制出频率折线图,且样本容量越大,分组的组距不断缩小,那么折线图就越接近于总体分布,从而由频率折线图对总体估计就越精确.某幼儿园根据部分同年龄段女童的身高数据绘制了频率分布直方图,其中身高的变化范围是[96,106](单位:厘米),样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].(1)求出x 的值;(2)已知样本中身高小于100厘米的人数是36,求出样本容量N 的数值;(3)根据频率分布直方图提供的数据,求出样本中身高大于或等于98厘米并且小于104厘米的学生数.【解析】(1)由题意可知:(0.050+0.100+0.150+0.125+x )×2=1,解得:x =0.075.(2)设样本中身高小于100厘米的频率为p 1,所以,p 1=(0.050+0.100)×2=0.30,而p 1=36N ,所以N =36p 1=360.30 =120. (3)样本中身高大于或等于98厘米并且小于104厘米的频率为p 2=(0.100+0.150+0.125)×2=0.75,所以身高大于或等于98厘米并且小于104厘米的学生数n =p 2N =120×0.75=90.。
高中必修三数学统计教案
主题:统计学概述
目标:学生能够了解统计学的基本概念和应用,并掌握一些基本的统计方法。
一、引入
通过实例引入统计学的概念,让学生了解统计学在日常生活中的重要性。
二、概念介绍
1.统计学的定义和作用:统计学是研究数据收集、整理、分析和解释的一门学科,是现代科学和社会科学中不可或缺的工具。
2.统计学的基本概念:总体、样本、抽样、数据等。
三、常用统计方法
1.描述统计方法:平均数、中位数、众数等。
2.概率统计方法:频率分布、概率分布、期望值等。
3.推断统计方法:参数估计、假设检验等。
四、练习
1.实例分析:通过实例让学生掌握如何应用统计方法进行数据分析。
2.练习题:让学生做一些实践练习,巩固所学的统计方法。
五、总结
总结本节课的内容,强调统计学的重要性,并展望后续学习内容。
六、作业
布置相关作业,让学生进一步巩固所学知识。
七、扩展
介绍一些统计学在现代科学研究和社会应用中的具体案例,激发学生对统计学的兴趣和好奇心。
注:此为一份简单的高中必修三数学统计教案范本,具体教学内容和方法可根据教学需求进行调整和改进。
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm ),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm 的株数n 是 ( )A .30B .60C .70D .803.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.某产品的广告费用与销售额的统计数据如下表:( ) 广告费用(万元) 销售客(万元)根据上表中的数据可以求得线性回归方程中的为,据此模型预报广告费用为万元时销售额为( ) A .万元B .万元C .万元D .万元6. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日 7.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .8.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表:根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 12.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .18二、填空题13.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 14.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.15.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.16.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.17.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.18.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x(2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.某地级市共有200000中学生,其中有7%学生在2017年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策的学生中困难程度分为三个等次:一般困难、很困难、特别困难,且人数之比为5:3:2,为进一步帮助这些学生,当地市政府设立“专项教育基金”,对这三个等次的困难学生每年每人分别补助1000元、1500元、2000元.经济学家调查发现,当地人均可支配年收入较上一年每增加%n ,一般困难的学生中有3%n 会脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生有2%n 转为一般困难学生,特别困难的学生中有%n 转为很困难学生.现统计了该地级市2013年到2017年共5年的人均可支配年收入,对数据初步处理后得到了如图所示的散点图和表中统计量的值,其中年份x 取13时代表2013年,x 取14时代表2014年,……依此类推,且x 与y (单位:万元)近似满足关系式y x βα=+.(2013年至2019年该市中学生人数大致保持不变)y521()ii yy =-∑51()()iii x x y y =--∑0.8 3.11(1)估计该市2018年人均可支配年收入为多少万元?(2)试问该市2018年的“专项教育基金”的财政预算大约为多少万元?附:对于一组具有线性相关关系的数据11(,)u υ,22(,)u υ,…,(,)n n u υ,其回归直线方程u υβα=+的斜率和截距的最小二乘估计分别为121()()()niii nii u u uu υυβ==--=-∑∑,u αυβ=-.23.某玻璃工艺品加工厂有2条生产线用于生产其款产品,每条生产线一天能生产200件该产品,该产品市场评级规定:评分在10分及以上的为A 等品,低于10分的为B 等品.厂家将A 等品售价定为2000元/件,B 等品售价定为1200元/件. 下面是检验员在现有生产线上随机抽取的16件产品的评分:经计算得16119.9716i i x x ===∑,()1616222211110.0451616i i i i s x x x x ===-=-=∑∑,其中i x 为抽取的第i 件产品的评分,1,2,,16i =⋅⋅⋅.该厂计划通过增加生产工序来改进生产工艺,已知对一条生产线增加生产工序每年需花费1500万元,改进后该条生产线产能不变,但生产出的每件产品评分均提高0.05.已知该厂现有一笔1500万元的资金.(1)若厂家用这1500万元改进一条生产线,根据随机抽取的16件产品的评分. (i )估计改进后该生产线生产的产品中A 等品所占的比例; (ii )估计改进后该厂生产的所有产品评分的平均数和方差.(2)某金融机构向该厂推销一款年收益率为8.2%的理财产品,请你利用所学知识分析,将这1500万元用于购买该款理财产品所获得的收益,与通过改进一条生产线使产品评分提高所增加的收益相对比,一年后哪种方案的收益更大? (一年按365天计算) 24.学校为了了解高三学生每天自主学习中国古典文学的时间,随机抽取了高三男生和女生各50名进行问卷调查,其中每天自主学习中国古典文学的时间超过3小时的学生称为“古文迷”,否则为“非古文迷”,调查结果如表:(Ⅰ)根据表中数据能否判断有60%的把握认为“古文迷”与性别有关?(Ⅱ)现从调查的女生中按分层抽样的方法抽出5人进行调查,求所抽取的5人中“古文迷”和“非古文迷”的人数;(Ⅲ)现从(Ⅱ)中所抽取的5人中再随机抽取3人进行调查,记这3人中“古文迷”的人数为ξ,求随机变量ξ的分布列与数学期望.参考公式:22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.参考数据:20()P K k ≥0.50 0.40 0.25 0.05 0.025 0.010 0k0.4550.7081.3213.8415.0246.63525.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式。
高一数学必修三知识点梳理在高中一年级的数学学习中,必修三是一个重要的学习内容。
这个学期的数学知识点既包括继续深化和巩固必修一、必修二的知识,同时也引入了一些新的概念和方法。
下面将对高一数学必修三的主要知识点进行梳理和总结。
一、函数与导数函数与导数是高一数学必修三的核心内容。
一元函数和二元函数的概念在必修一中有所涉及,而在这个学期,学生将进一步学习函数的性质与图像、函数的运算、反函数的概念及相关性质等。
这些知识点的学习将有助于学生更好地理解函数的基本概念和运算规则。
导数的概念是本学期数学学习的重点和难点之一。
学生需要掌握导数的定义、导数的计算公式和导数的几何意义。
此外,导数与函数图像的关系,如导数的增减性、极值与最值等知识也需要学生掌握。
理解导数概念的同时,学生还需要通过实际问题的解答,培养对导数的应用能力。
二、三角函数高一必修三的数学学习中,三角函数是另一个重要的内容。
在这个学期,学生将学习到正弦、余弦、正切函数的定义、性质和图像。
同时,学生还需要掌握三角函数的诱导公式、复合角公式以及对应的逆三角函数的概念和性质。
三角函数的学习对解决与角度有关的实际问题具有重要意义。
三、解析几何解析几何也是高一必修三中的一项重要内容。
学生需要掌握平面直角坐标系和空间直角坐标系的性质与应用,理解直线和圆的方程和性质。
需要特别注意的是,对于椭圆、抛物线、双曲线这类曲线的性质,学生需要通过图像和公式掌握其基本特点和方程求解的方法。
四、数列与数学归纳法高一必修三中还涉及到数列与数学归纳法的学习。
数列的概念、等差数列、等比数列及其求和公式是学生需要掌握的基本知识。
此外,学生还需要学习数列极限的定义和性质,以及利用数学归纳法证明数学命题的方法。
五、概率与统计高一必修三中的概率与统计是数学学科的一项重要内容。
学生需要掌握基本的概率和统计概念,例如事件与样本空间、频率与概率的关系等。
在概率部分,学生需要熟练掌握计算概率的方法以及应用概率解决实际问题。
一、选择题1.某商场为了了解毛衣的月销售量y (件)与月平均气温x (C ︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表: 月平均气温x C ︒171382月销售量y (件)24334055由表中数据算出线性回归方程y bx a =+中的2b =-,气象部门预测下个月的平均气温为6C ︒,据此估计该商场下个月毛衣销售量约为( )A .58件B .40件C .38件D .46件2.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .724.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生5.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④6.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3 D .丁地:总体均值为2,总体方差为37.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .918.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位D .y 平均减少2个单位9.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1810.已知某企业上半年前5个月产品广告投入与利润额统计如下:由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元11.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .1112.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.对具有线性相关关系的变量x ,y 有一组观测数据()(),1,2,3,,8i i x y i =,其回归直线方程是12y x a =+,且8116i i x ==∑,8148i i y ==∑,则实数a =__________.15.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示:根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.16.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.17.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.18.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.19.已知某人连续5次投掷飞镖的环数分别是8,9,10,10,8,则该组数据的方差为______.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.2020年1月末,新冠疫情爆发,经过全国人民的努力,2月中旬,疫情得到了初步的控制,湖北省以外地区的每日新增确诊人数开始减少,某同学针对这个问题,选取他在统计学中学到的一元线性回归模型,作了数学探究:他于2月17日统计了2月7日至16日这十天湖北省以外地区的每日新增确诊人数,表格如下: 日期 2.7 2.8 2.9 2.10 2.11 2.12 2.132.14 2.15 2.16代号x 123 45 6 78910新增确诊人数y558 509444381 377 312 267221166 115y x y x 计算出: 5.5,335x y ==,()()1013955iii x x y y =--=-∑,()210182.5ii x x =-=∑(1)请你帮这位同学计算出y 与x 的线性回归方程(精确到0.1),然后根据这个方程估计湖北省以外地区新增确诊人数为零时的大概日期;附:回归方程y bx a =+中斜率和截距的最小二乘法估计公式分别为:()()()1012101iii ii x x y y b x x ==--=-∑∑,a y bx =-(2)实际上2月17日至2月22日的新增确诊人数如下:出评价.22.据统计某品牌服装专卖店一周内每天获取得纯利润y (百元)与每天销售这种服装件数x (百件)之间有如下一组数据.该专卖店计划在国庆节举行大型促销活动以提高该品牌服装的知名度,为了检验服装的质量,现从厂家购进的500件服装中抽取60件进行检验,(服装进货编号为001-500). (1)利用随机数表抽样本时,如果从随机数表第8行第2列的数开始按三位数连贯向右读取,试写出最先检测的5件服装的编号;(2)求该专卖店每天的纯利y 与每天销售件数x 之间的回归直线方程.(精确到0.01) (3)估计每天销售1200件这种服装时获多少纯利润? 附表:(随机数表第7行至第9行)84421 75331 57245 50688 77047 44767 21763 35025 83921 20676 63016 47859 16955 56719 98105 07185 12867 35807 44395 23879 33211 23429 78645 60782 52420 74438 15510 01342 99660 27954 参考数据:721280i i x==∑,72145309i i y ==∑,713487i i i x y ==∑.参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-23.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下:企业数13 40 35 8 4(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).24.为了解某小卖部冷饮销量与气温之间的关系,随机统计并制作了6天卖出的冷饮的数量与当天最高气温的对照表: 气温()x ℃ 27 29 30 32 33 35 数量y121520272836(1)画出散点图,并求出y 关于x 的线性回归方程;(2)根据天气预报,某天最高气温为36.6℃,请你根据这些数据预测这天小卖部卖出的冷饮数量.附:一组数据11(,)x y ,22(,)x y ,,(,)n n x y 的回归直线y a bx =+的斜率和截距的最小二乘估计为()()()121ˆniii ni i x x y y bx x ==--=-∑∑,ˆa y bx=- 25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.在社会实践活动中,“求知”小组为了研究某种商品的价格x (元)和需求量y (件)之间的关系,随机统计了11月1日至11月5日该商品价格和需求量的情况,得到如下资料: 日期 11月1日 11月2日 11月3日 11月4日 11月5日 x (元) 14 16 18 20 22 y (件)1210743该小组所确定的研究方案是:先从这五天中选取2天数据,用剩下的3天数据求线性回归方程,再对被选取的2天数据进行检验.(1)若选取的是11月1日与11月5日两天数据,请根据11月2日至11月4日的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2件,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表格得(),x y 为:()10,38,因为(),x y 在回归方程y bx a =+上且2b =-,()38102a ∴=⨯-+,解得58a =∴2ˆ58y x =-+,当6x =时,26ˆ5846y=-⨯+=,故选D. 考点:1、线性回归方程的性质;2、回归方程的应用.2.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.3.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯,故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误. 所以说法正确的是①③. 故选B. 【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.6.D解析:D 【详解】试题分析:由于甲地总体均值为,中位数为,即中间两个数(第天)人数的平均数为,因此后面的人数可以大于,故甲地不符合.乙地中总体均值为,因此这天的感染人数总数为,又由于方差大于,故这天中不可能每天都是,可以有一天大于,故乙地不符合,丙地中中位数为,众数为,出现的最多,并且可以出现,故丙地不符合,故丁地符合.考点:众数、中位数、平均数、方差7.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.8.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.9.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】 根据题意得,用分层抽样在各层中的抽样比为421105020=, 则在高三年级抽取的人数是14001625⨯=人, 故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题. 10.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
2.1.3分层抽样问题导航(1)什么叫分层抽样?(2)分层抽样适用于什么状况?(3)分层抽样时,每个个体被抽到的机会是相等的吗?1.分层抽样的概念一般地,在抽样时,将总体分成互不交叉的层,然后依据肯定的比例,从各层独立地抽取肯定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所把握的各种信息,并充分考虑保持样本结构与总体结构的全都性,这对提高样本的代表性格外重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.1.推断下列各题.(对的打“√”,错的打“×”)(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样;()(2)在分层抽样时,每层可以不等可能抽样;()(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.()解析:(1)由于分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规章进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.(2)分层抽样时,每层仍旧要等可能抽样.(3)与层数及分层无关.答案:(1)×(2)×(3)×2.某地区为了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽取1100的居民家庭进行调查,这种抽样是()A.简洁随机抽样B.系统抽样C.分层抽样D.分类抽样解析:选C.符合分层抽样的特点.3.一个班共有54人,其中男、女比为5∶4,若抽取9人参与教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.解析:男、女每人被抽取的可能是相同的,由于男同学共有54×59=30(人),女同学共有54×49=24(人),所以每个男同学被抽取的可能性为530=16,每个女同学被抽取的可能性为424=16.答案:16164.分层抽样的操作步骤是什么?解:总体分层;依据比例独立抽取.1.分层抽样的特点(1)适用于总体由有明显差别的几部分组成的状况.(2)抽取的样本更好地反映了总体的状况.(3)是等可能性抽样,每个个体被抽到的可能性都是nN.2.分层抽样的公正性假如总体中个体的总数是N,样本容量为n,第i层中个数为N i,则第i层中要抽取的个体数为n i=n·N iN.每一个个体被抽取的可能性是n iN i=1N i·n·N iN=nN,与层数无关.所以对全部个体来说,被抽取的可能性是一样的,与层数及分层无关,所以分层抽样是公正的.3.分层抽样需留意的问题(1)分层抽样中分多少层、如何分层要视具体状况而定,总的原则是每层内样本的差异要小,不同层之间的样本差异要大,且互不重叠.(2)抽取比例由每层个体占总体的比例确定.(3)各层抽样按简洁随机抽样或系统抽样进行.分层抽样的概念某中学有老年老师20人,中年老师65人,青年老师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是()A.抽签法B.系统抽样C.分层抽样D.随机数法[解析]各部分之间有明显的差异是分层抽样的依据.[答案] C方法归纳各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是机敏的,可用简洁随机抽样,也可接受系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公正性.1.(1)某市有四所重点高校,为了解该市高校生的课外书籍阅读状况,则接受下列哪种方法抽取样本最合适(四所高校图书馆的藏书有肯定的差距)( )A .抽签法B .随机数表法C .系统抽样法D .分层抽样法解析:选D. 由于学校图书馆的藏书对同学课外书籍阅读影响比较大,因此实行分层抽样.(2)某校高三班级有男生800人,女生600人,为了解该班级同学的身体健康状况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是( )A .简洁随机抽样法B .抽签法C .随机数表法D .分层抽样法解析:选D.总体中个体差异比较明显,且抽取的比例也符合分层抽样.分层抽样的应用(2022·高考湖北卷)甲、乙两套设备生产的同类型产品共4 800件,接受分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.[解析] 设乙设备生产的产品总数为x 件,则甲设备生产的产品总数为(4 800-x )件.由分层抽样特点,结合题意可得5080=4 800-x4 800,解得x =1 800.[答案] 1 800[互动探究] 将本例条件“若样本中有50件产品由甲设备生产”换为“已知甲、乙两套设备生产的同类型产品数量之比为5∶3”,求样本中抽取的由甲、乙设备生产的数量分别是多少件?解:设样本中抽取的由甲、乙设备生产的数量分别是x ,y 件,则x =80×55+3=50,y =80×35+3=30.故样本中抽取的由甲、乙设备生产的数量分别是50,30件. 方法归纳在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i ∶N i =n ∶N .2.(1)为了调查城市PM 2.5的状况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为( )A .3B .4C .5D .6解析:选B.依据分层抽样的特点可知,抽样比例为1248=14,则应抽取的中型城市数为16×14=4.(2)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工________人.解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×18=10.答案:10三种抽样方法的考查选择合适的抽样方法抽样,并写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取10个入样; (2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样; (3)有甲厂生产的300个篮球,抽取10个入样; (4)有甲厂生产的300个篮球,抽取30个入样. [解] (1)总体容量较小,用抽签法.①将30个篮球编号,编号为00,01, (29)②将以上30个编号分别写在完全一样的一张小纸条上,揉成小球,制成号签. ③把号签放入一个不透亮 的袋子中,充分搅拌均匀. ④从袋子中逐个抽取10个号签,并记录上面的号码. ⑤找出和所得号码对应的篮球即可得到样本.(2)总体由差异明显的两个层次组成,需选用分层抽样.①确定抽取个数.由于1030=13,所以甲厂生产的应抽取213=7(个),乙厂生产的应抽取93=3(个).②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本. (3)总体容量较大,样本容量较小,宜用随机数表法. ①将300个篮球用随机方式编号,编号为001,002, (300)②在随机数表中随机地确定一个数作为开头,如(教材P 103附表)第8行第29列的数“7”开头.任选一个方向作为读数方向,比如向右读.③从数“7”开头向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大,宜用系统抽样.①将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段,其中每一段包含30030=10个个体.②在第一段000,001,002,…,009这十个编号中用简洁随机抽样抽出一个(如002)作为起始号码.③将编号为002,012,022,…,292的个体抽出,即可组成所要求的样本.方法归纳(1)简洁随机抽样、系统抽样和分层抽样是三种常用的抽样方法,在实际生活中有着广泛的应用.(2)三种抽样的适用范围不同,各自的特点也不同,但各种方法间又有亲密联系.在应用时要依据实际状况选取合适的方法.(3)三种抽样中每个个体被抽到的可能性都是相同的.扫一扫进入91导学网()三种抽样方法的比较3.(1)某饮料公司在华东、华南、华西、华北四个地区分别有200个、180个、180个、140个销售点.公司为了调查产品销售的状况,需从这700个销售点中抽取一个容量为100的样本,记这项调查为①;在华南地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务状况,记这项调查为②.则完成①、②这两项调查宜接受的抽样方法依次是()A.分层抽样法、系统抽样法B.分层抽样法、简洁随机抽样法C.系统抽样法、分层抽样法D.简洁随机抽样法、分层抽样法解析:选B. 当总体中个体较多时宜接受系统抽样;当总体中的个体差异较大时,宜接受分层抽样;当总体中个体较少时,宜接受简洁随机抽样.依题意,第①项调查应接受分层抽样法、第②项调查应接受简洁随机抽样法.故选B.(2)调查某班同学的平均身高,从50名同学中抽取5名,抽样方法是________,假如男女身高有显著不同(男生30人,女生20人),抽样方法是________.解析:从50名同学中抽取5名,总体中个体数不多,接受简洁随机抽样;总体中个体差异比较明显,接受分层抽样.答案:简洁随机抽样分层抽样(3)下列问题中,接受怎样的抽样方法较为合理?①从10台电冰箱中抽取3台进行质量检查;②某学校有160名教职工,其中老师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.解:①抽签法,由于总体容量较小,宜用抽签法.②分层抽样,由于学校各类人员对这一问题的看法可能差异较大,用分层抽样.易错警示分层抽样的应用某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,假如接受系统抽样和分层抽样方法抽取,不用剔除个体;假如样本容量增加1个,则在接受系统抽样时,需要在总体中先剔除1个个体,则样本容量为________.[解析]总体容量N=36.当样本容量为n时,系统抽样间隔为36n∈N+,所以n是36的约数;分层抽样的抽样比为n36,求得工程师、技术员、技工的抽样人数分别为n6,n3,n2,所以n应是6的倍数,所以n=6或12或18或36.当样本容量为n+1时,总体中先剔除1人时还有35人,系统抽样间隔为35n+1∈N+,所以n只能是6.[答案] 6[错因与防范]由36n,n6,n3,n2∈N+求n时,n的值有遗漏;35n+1∈N+易错写成36n+1∈N+.为猎取各层入样数目,需先正确计算出抽样比k=样本容量总体容量,若k与某层个体数的积不是整数时,可先将该层等可能性剔除多余个体.4.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长状况,接受分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25C.20 D.15解析:选C.抽样比为150∶30 000=1∶200,则样本中松树苗的数量为4 000×1200=20.故选C.1.某高校共有同学5 600人,其中有专科生1 300人、本科生3 000人、争辩生1 300人,现接受分层抽样的方法调查同学利用因特网查找学习资料的状况,抽取的样本为280人,则应在专科生、本科生与争辩生这三类同学中分别抽取( )A .65人、150人、65人B .30人、150人、100人C .93人、94人、93人D .80人、120人、80人解析:选A.依据分层抽样按比例抽取的特点,有5 600280=1 300x =3 000y =1 300z ,解得x =z =65,y =150,即专科生、本科生与争辩生应分别抽取65、150、65,故选A.2.某地共有10万户居民,从中随机调查了1 000户拥有彩电的调查结果如下表:彩电 城市 农村 有 432 400 无48120若该地区城市与农村住户之比为4∶6,估量该地区无彩电的农村总户数约为( )A .0.923万户B .1.385万户C .1.8万户D .1.2万户 解析:选B.无彩电的农村总户数约为10×610×120520≈1.385万户.3.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本的容量n =________.解析:由分层抽样的特点,得n ×22+3+5=16,所以n =80.答案:804.某校对全校男、女同学共1 200名进行健康调查,选用分层抽样抽取一个容量为200的样本,已知男生比女生多抽了10人,则该校男生人数为________.解析:入样比例=2001 200=16,则男生应抽105人,设男生为x 人,所以105x =16⇒x =630.答案:630[A.基础达标]1.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取1个容量为100的样本,记作①;某学校高一班级有12名女排运动员,要从中选出3名调查学习负担状况,记作②.那么完成上述两项调查应接受的抽样方法是( )A .①用简洁随机抽样法;②用系统抽样法B .①用分层抽样法;②用简洁随机抽样法C .①用系统抽样法;②用分层抽样法D .①用分层抽样法;②用系统抽样法解析:选B.对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的3部分组成,而所调查的指标与收入状况亲密相关,所以应接受分层抽样法.对于②,总体中的个体数较少,而且所调查内容对12名调查对象是“公平”的,所以应接受简洁随机抽样法.2.已知某单位有职工120人,其中男职工90人,现接受分层抽样的方法(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为( )A .30B .36C .40D .无法确定解析:选B.分层抽样中抽样比肯定相同,设样本容量为n ,由题意得,n 120=2790,解得n =36.3.(2022·高考重庆卷)某中学有高中生3 500人,学校生1 500人,为了解同学的学习状况,用分层抽样的方法从该校同学中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250解析:选A.法一:由题意可得70n -70=3 5001 500,解得n =100,故选A.法二:由题意,抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n =5 000×150=100.4.(2021·中山高一检测)某校选修乒乓球课程的同学中,高一班级有30名,高二班级有40名,现用分层抽样的方法在这70名同学中抽取一个样本,已知在高一班级的同学中抽取了6名,则在高二班级的同学中应抽取的人数为( )A .6B .8C .10D .12解析:选B.设高二班级抽取x 人,则有630=x40,解得x =8,故选B.5.(2021·潍坊高一检测)某学校在校同学2 000人,为了同学的“德、智、体”全面进展,学校进行了跑步和登山竞赛活动,每人都参与而且只参与其中一项竞赛,各班级参与竞赛的人数状况如下表:高一班级高二班级高三班级跑步人数 a b c 登山人数xyz其中a ∶b ∶c =2∶5∶3,全校参与登山的人数占总人数的14.为了了解同学对本次活动的满足程度,从中抽取一个200人的样本进行调查,则高三班级参与跑步的同学中应抽取( )A .15人B .30人C .40人D .45人解析:选D.全校参与登山的人数是2 000×14=500,所以参与跑步的人数是1 500,应抽取1 5002 000×200=150,c =150×310=45(人).6.某学校高一、高二、高三班级的同学人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个班级的同学中抽取一个容量为50的样本,则应从高二班级抽取________名同学.解析:抽取比例与同学比例全都.设应从高二班级抽取x 名同学,则x ∶50=3∶10.解得x =15.答案:157.某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应当抽取________辆,________辆,________辆.解析:由于461 200+6 000+2 000=1200,所以这三种型号的轿车依次应当抽取1 200×1200=6辆,6 000×1200=30辆,2 000×1200=10辆.即这三种型号的轿车依次应当抽取6辆、30辆、10辆进行检验.答案:6 30 108.某地区有农夫、工人、学问分子家庭共计2 015家,其中农夫家庭1 600户,工人家庭303户.现要从中抽出容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法中的________.(将你认为正确的选项的序号都填上)①简洁随机抽样;②系统抽样;③分层抽样.解析:为了保证抽样的合理性,应对农夫、工人、学问分子分层抽样,在各层中接受系统抽样和简洁随机抽样,抽样时还要先用简洁随机抽样剔除多余的个体.答案:①②③ 9.(2021·莱州高一检测)某校高一班级500名同学中,血型为O 的有200人,血型为A 的有125人,B 型的有125人,AB 型的有50人.为了争辩血型与色弱的关系,要从中抽取一个容量为40的样本,应如何抽样?写出血型为AB 型的抽样过程.解:由于40÷500=225,所以应用分层抽样法抽取血型为O 型的225×200=16(人),A 型的225×125=10(人),B 型的225×125=10(人),AB 型的225×50=4(人).AB 型的4人可以这样抽取:第一步,将50人随机编号,编号为1,2, (50)其次步,把以上50人的编号分别写在大小相同的小纸片上,揉成小球,制成号签. 第三步,把得到的号签放入一个不透亮 的袋子中,充分搅拌均匀. 第四步,从袋子中逐个抽取4个号签,并记录上面的编号. 第五步,依据所得编号找出对应的4人即可得到样本.10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参与其中一组.在参与活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参与活动总人数的14,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满足程度,现用分层抽样的方法从参与活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人所占比例分别为a 、b 、c , 则有x ×40%+3xb 4x =47.5%,x ×10%+3xc 4x =10%,解得b =50%,c =10%, 故a =100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%. (2)游泳组中,抽取的青年人人数为200×34×40%=60(人);抽取的中年人人数为200×34×50%=75(人);抽取的老年人人数为200×34×10%=15(人).即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.[B.力量提升]1.某鱼贩一次贩运草鱼、青鱼、鲢鱼、鲤鱼及鲫鱼各有80条、20条、40条、40条、20条,现从中抽取一个容量为20的样本进行质量检测,若接受分层抽样的方法抽取样本,则抽取的青鱼与鲤鱼共有( )A .6条B .8条C .10条D .12条解析:选A.设抽取的青鱼与鲤鱼共有x 条,依据分层抽样的比例特点有20+4080+20+40+40+20=x 20,所以x=6.2.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x 份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁同学问卷中抽取60份,则在15~16岁同学中抽取的问卷份数为( )A .60B .80C .120D .180解析:选C.11~12岁回收180份,其中在11~12岁同学问卷中抽取60份,则抽样比为13.∵从回收的问卷中按年龄段分层抽取容量为300的样本,∴从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷总数为30013=900(份),则15~16岁回收问卷份数为:x =900-120-180-240=360(份).∴在15~16岁同学中抽取的问卷份数为360×13=120(份),故选C.3.某校高一班级有x 名同学,高二班级有y 名同学,高三班级有z 名同学,接受分层抽样抽取一个容量为45的样本,高一班级被抽取20人,高二班级被抽取10人,高三班级共有同学300人,则此学校共有同学________人.解析:高三班级被抽取了45-20-10=15(人),设此学校共有同学N 人,则45N =15300,解得N =900.答案:900 4.(2021·泰安质检)某企业三月中旬生产A ,B ,C 三种产品共3 000件,依据分层抽样的结果,企业统计员制作了如下的统计表格:由于不当心,表格中A 、C A 产品的样本容量比C 产品的样本容量多10,依据以上信息,可得C 产品的数量是________件.解析:抽样比为130∶1 300=1∶10,又A 产品的样本容量比C 产品的样本容量多10,故C 产品的数量是[(3 000-1 300)-100]×12=800(件).答案:8005.某校有在校高中生共1 600人,其中高一班级同学520人,高二班级同学500人,高三班级同学580人.假如想通过抽查其中的80人来调查同学的消费状况,考虑到不同班级同学的消费状况有明显差别,而同一班级内消费状况差异较小,问应接受怎样的抽样方法?高三班级同学中应抽查多少人?解:因不同班级的同学消费状况有明显差别,所以应接受分层抽样.由于520∶500∶580=26∶25∶29,于是将80分成比例为26∶25∶29的三部分.设三部分各抽个体数分别为26x ,25x ,29x ,由26x +25x +29x =80,解得x =1.所以高三班级同学中应抽查29人.6.(选做题)某中学进行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名学校生、4 000名高中生中进行问卷调查,假如要在全部答卷中抽出120份用于评估.(1)应如何抽取才能得到比较客观的评价结论?(2)要从3 000份学校生的答卷中抽取一个容量为48的样本,假如接受简洁随机抽样,应如何操作? (3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取得到所需的样本?解:(1)由于这次活动对教职员工、学校生和高中生产生的影响不相同,所以应当实行分层抽样的方法进行抽样.∵样本容量为120,总体个数为500+3 000+4 000=7 500(名),则抽样比为1207 500=2125.∴500×2125=8(人),3 000×2125=48(人),4 000×2125=64(人),∴在教职员工、学校生、高中生中抽取的个体数分别是8、48、64.分层抽样的步骤是:第一步,分为教职员工、学校生、高中生共三层.其次步,确定每层抽取个体的个数:在教职员工、学校生、高中生中抽取的个体数分别是8、48、64. 第三步,各层分别按简洁随机抽样的方法抽取样本. 第四步,综合每层抽样,组成样本.这样便完成了整个抽样过程,就能得到比较客观的评价结论.(2)由于简洁随机抽样有两种方法:抽签法或随机数表法.若用抽签法,则要做3 000个号签,费时费劲,因此接受随机数表法抽取样本,步骤是:第一步,编号:将3 000份答卷都编上号码:0 001,0 002,…,3 000. 其次步,在随机数表上随机选取一个起始位置.第三步,规定读数方向:向右连续取数字,以4个数为一组,遇到右边线时接下一行左边线连续向右连续取数,若读取的4位数大于3 000,则去掉,假如遇到相同号码则只取一个,这样始终到取满48个号码为止.(3)由于4 000÷64=62.5不是整数,故应先使用简洁随机抽样法从4 000名同学中随机剔除32个个体,再将剩余的3 968个个体进行编号:1,2,…,3 968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第一部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开头,每隔62个号码抽取一个,这样得到一个容量为64的样本:23,85,147,209,271,333,395,457,…,3 929.。
一、选择题1.工人月工资y (元)与劳动生产率x (千元)变化的回归直线方程为=50+80x ,下列判断不正确的是( )A .劳动生产率为1000元时,工资约为130元B .工人月工资与劳动者生产率具有正相关关系C .劳动生产率提高1000元时,则工资约提高130元D .当月工资为210元时,劳动生产率约为2000元2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.已知变量x ,y 的关系可以用模型kx y ce =拟合,设ln z y =,其变换后得到一组数据下:x 16 17 18 19 z50344131由上表可得线性回归方程4z x a =-+,则( ) A .4-B .4e -C .109D .109e4.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度5.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .726.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .637.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.如图是两组各7名同学体重(单位:kg )数据的茎叶图,设1、2两组数据的平均数依次为1x 和2x ,标准差依次为12s s 、,那么( )(注:标准差222121[()()...()]n s x x x x x x n=-+-++-A .1212,x x s s >>B .1212,x x s s ><C .1212,x x s s <<D .1212,x x s s9.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( )A .2,5B .5,5C .5,8D .8,810.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5011.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.已知一组数据12,,,n x x x 的平均数3x =,则数据1232,32,,32n x x x +++的平均数为( ) A .3B .5C .9D .11二、填空题13.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.14.随机抽取100名年龄在[10,20),[20,30),…,[50,60)年龄段的市民进行问卷调查,由此得到样本的频率分布直方图如图所示.从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人,则在[50,60)年龄段抽取的人数为______.15.某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人,在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取______人. 16.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________. 17.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________.18.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.为弘扬我国优秀的传统文化,某小学六年级从甲、乙两个班各选出7名学生参加成语知识竞赛,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则的值为__________.三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:月份i 7 8 9 10 11 12 销售单价i x (元) 9 9.5 10 10.5 11 8.5 销售量i y (元)111086514y x (2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆybx a =+,其中1221ˆni ii nii x y nx yb xnx ==-=-∑∑,ˆˆay bx =-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.参考数据:7772111y9.24,t39.75,0.53,7 2.646i i ii i iiy=====⋅≈≈∑∑∑(y-y).参考公式:相关系数()()()()()()11112211,ni i n n nii i i i in ni i ii ii it t y yr t t y y t y t yt t y y======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,ni iiniit t y yb a y btt t==⋅--==-⋅-∑∑.23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y关于x的回归直线方程ˆˆˆy bx a=+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni iiniix y nx yx naxb y bx====---∑∑)25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数:温度(单位:C︒)212324272932死亡数y(单位:株)61120275777经计算:611266iix x===∑,611336iiy y===∑,()()61557i iix x y y=--=∑,()62184iix x=-=∑,()6213930iiy y=-=∑,()621ˆ236.64iiy y=-=∑,8.0653167e≈,其中ix,iy分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i=.(1)若用线性回归模型,求y关于x的回归方程ˆˆˆy bx a=+(结果精确到0.1);(2)若用非线性回归模型求得y关于x的回归方程0.2303ˆ0.06xy e=,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x ,已知这10个分数的平均数90x =,标准差6s =,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221nii xnx s n=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】试题分析:根据线性回归方程=50+80x 的意义,对选项中的命题进行分析、判断即可. 解:根据线性回归方程为=50+80x ,得;劳动生产率为1000元时,工资约为50+80×1=130元,A 正确; ∵=80>0,∴工人月工资与劳动者生产率具有正相关关系,B 正确;劳动生产率提高1000元时,工资约提高=80元,C 错误;当月工资为210元时,210=50+80x ,解得x=2, 此时劳动生产率约为2000元,D 正确. 故选C .考点:线性回归方程.2.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.3.D解析:D由已知求得x 与z 的值,代入线性回归方程求得a ,再由kxy ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+,结合z lny =,得z lnc kx =+,则109lnc =,由此求得c 值.【详解】 解:1617181917.54x +++==,50344131394z +++==. 代入4z x a =-+,得39417.5a =-⨯+,则109a =.∴4109z x =-+,由kx y ce =,得()kx kx lny ln ce lnc lne lnc kx ==+=+, 令z lny =,则z lnc kx =+,109lnc ∴=,则109c e =. 故选:D . 【点睛】本题考查回归方程的求法,考查数学转化思想方法,考查计算能力,属于中档题.4.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.5.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=,【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.8.C解析:C 【分析】由茎叶图分别计算出两组数的平均数和标准差,然后比较大小 【详解】读取茎叶图得到两组数据分别为: (1)53565758617072,,,,,, (2)54565860617273,,,,,,()()11503678112022617x kg =+⨯++++++=,()()215046810112223627x kg =+⨯++++++=,1s ==,2s == 则1212,x x s s << 故选C 【点睛】本题给出茎叶图,需要求出数据的平均数和方差,着重考查了茎叶图的认识,样本特征数的计算等知识,属于基础题.9.C解析:C 【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图10.C解析:C 【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数. 【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=, 则前3小组的频率之和为10.250.75-=, 则该校报名学生的总人数为360.7548÷=,故选C. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.12.D解析:D 【解析】分析:一组数据中的每一个数加或减一个数,它的平均数也加或减这个数;;依此规律求解即可.详解::∵一组数据12,,,n x x x 的平均数为3, ∴另一组数据1232,32,,32n x x x +++的平均数121211323232[32]33211n n x x x x x x n n n=++++⋯++=++⋯++=⨯+=()(), 故选D.点睛:本题考查了平均数,平均数是指在一组数据中所有数据之和再除以数据的个数.它是反映数据集中趋势的一项指标.二、填空题13.3【分析】先由频率之和等于1得出的值计算身高在的频率之比根据比例得出身高在内的学生中抽取的人数【详解】身高在的频率之比为所以从身高在内的学生中抽取的人数应为故答案为:【点睛】本题主要考查了根据频率分解析:3 【分析】先由频率之和等于1得出a 的值,计算身高在[)120,130,[)130,140,[]140,150的频率之比,根据比例得出身高在[]140,150内的学生中抽取的人数. 【详解】(0.0050.010.020.035)101a ++++⨯=0.03a ∴=身高在[)120,130,[)130,140,[]140,150的频率之比为0.03:0.02:0.013:2:1= 所以从身高在[]140,150内的学生中抽取的人数应为11836⨯= 故答案为:3 【点睛】本题主要考查了根据频率分布直方图求参数的值以及分层抽样计算各层总数,属于中档题.14.3【分析】根据频率分布直方图求得不小于40岁的人的频率及人数再利用分层抽样的方法即可求解得到答案【详解】根据频率分布直方图得样本中不小于40岁的人的频率是0015×10+0005×10=02所以不小解析:3 【分析】根据频率分布直方图,求得不小于40岁的人的频率及人数,再利用分层抽样的方法,即可求解,得到答案. 【详解】根据频率分布直方图,得样本中不小于40岁的人的频率是0.015×10+0.005×10=0.2, 所以不小于40岁的人的频数是100×0.2=20;从不小于40岁的人中按年龄段分层抽样的方法随机抽取12人, 在[50,60)年龄段抽取的人数为0.0051010012320⨯⨯⨯=.【点睛】本题主要考查了频率分布直方图的应用,其中解答中熟记频率分布直方图的性质,以及频率分布直方图中概率的计算方法是解答的关键,着重考查了推理与运算能力,属于基础题.15.40【分析】设应从B 校抽取n 人利用分层抽样的性质列出方程组能求出结果【详解】设应从B 校抽取n 人某市有ABC 三所学校各校有高三文科学生分别为650人500人350人在三月进行全市联考后准备用分层抽样的解析:40 【分析】设应从B 校抽取n 人,利用分层抽样的性质列出方程组,能求出结果. 【详解】设应从B 校抽取n 人,某市有A 、B 、C 三所学校,各校有高三文科学生分别为650人,500人,350人, 在三月进行全市联考后,准备用分层抽样的方法从所有高三文科学生中抽取容量为120的样本,120n650500350500∴=++,解得n 40=.故答案为40. 【点睛】本题考查应从B 校学生中抽取人数的求法,考查分层抽样的性质等基础知识,考查运算求解能力,是基础题.16.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆy bx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.17.②④⑤【解析】分析:根据方程性质回归方程性质及其含义卡方含义确定命题真假详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程若变量增加一个单位时则平均减少5个单位;曲线上的点与该点的坐解析:②④⑤ 【解析】分析:根据方程性质、回归方程性质及其含义、卡方含义确定命题真假. 详解:由方差的性质知①正确;由线性回归方程的特点知③正确;回归方程ˆ35yx =-中若变量x 增加一个单位时,则y 平均减少5个单位; 曲线上的点与该点的坐标之间不一定具有相关关系;在一个22⨯列联表中,由计算得213.079K =,只能确定两个变量之间有相关关系的可能性,所以②④⑤均错误.点睛:本题考查方程性质、回归方程性质及其含义、卡方含义,考查对基本概念理解与简单应用能力.18.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1 【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=. 点睛:本题考查平均数,考查基本求解能力.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.35【解析】79+78+80+80+x+85+92+967=85解得x=5根据中位数为83可知y=3故yx=35 解析:【解析】,解得,根据中位数为,可知,故.三、解答题21.(1) 3.240ˆyx =-+;(2)可以认为所得的回归直线方程是理想的;(3)该产品的销售单价为7.5元/件时,获得的利润最大. 【分析】(1)计算x 、y ,求出回归系数,写出回归直线方程;(2)根据回归直线方程,计算对应的数值,判断回归直线方程是否理想; (3)求销售利润函数W ,根据二次函数的图象与性质求最大值即可. 【详解】 (1)因为1(99.51010.511)105x =++++=,1(1110865)85y =++++=,所以23925108ˆ 3.2502.5510b -⨯⨯==--⨯,则8( 3.2)00ˆ14a =--⨯=, ∴y 关于x 的回归直线方程为 3.240ˆyx =-+ (2)剩余数据为12月份,此时8.5x =,14y =,现进行检测,当8.5x =时,ˆ 3.28.54012.8y=-⨯+=,则ˆ||12.814 1.22y y -=-=<,所以可以认为所得的回归直线方程是理想的. (3)令销售利润为W ,则22( 2.5)( 3.240) 3.248100 3.2(7.5)80W x x x x x =--+=-+-=--+.∴当7.5x =时,W 取最大值.所以该产品的销售单价为7.5元/件时,获得的利润最大. 【点睛】函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系,如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .22.(1)散点图见解析,y 与t 的线性相关性相当高,理由见解析;(2)0.920.1011 2.02y =+⨯=,2.02万户.【分析】(1)根据表格中对应的t 与y 的关系,描绘散点图,并根据参考数据求r ,说明相关性;(2)根据参考数据求ˆb和ˆa ,求回归直线方程,并令11t =,求y 的预测值.【详解】(1)作出散点图如图所示:由条形图数据和参考数据得()()7722114,0.53iii i t t t y y ===⋅-=⋅-≈∑∑,()()77711139.7549.24 2.79ii i i i i i i tty y t y t y ===⋅--=-=-⨯=∑∑∑,2.790.990.532 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关性相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由9.24 1.327y ==及(1)得()()()717212.79ˆ0.1028iii i i t t y y b t t==⋅--==≈⋅-∑∑, ˆˆ 1.320.1040.92ay bt =-≈-⨯=,所以,y 关于t 的回归方程为:0.920.10y t =+. 将11t=代入回归方程得:0.920.1011 2.02y =+⨯=,所以预测11月份该省煤改气、煤改电的用户数量达到2.02万户. 【点睛】关键点点睛:本题考查回归直线方程,此类问题的关键是根据参考数据和公式相结合,求ˆb和ˆa ,一般计算量较大,需计算严谨,准确. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数; (4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑。
高一数学必修三之统计一:选择题:1.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A . c b a >> B.a c b >> C .b a c >> D .a b c >> 2.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( ) A.3.5 B .3- C .3D.5.0- 3.要从已编号(160)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的6枚导弹的编号可能是( )A.5,10,15,20,25,30 B .3,13,23,33,43,53 C .1,2,3,4,5,6 D.2,4,8,16,32,48 4.第三组的频数和频率分别是 ( )A .14和0.14 B.0.14和14 C.141和0.14 D . 31和1415.一个容量为40的样本数据分组后组数与频数如下:[25,25.3),6;[25.3,25.6),4;[25.6,25.9),10;[25.9,26.2),8;[26.2,26.5),8;[26.5,26.8),4;则样本在[25,25.9)上的频 率为( )A .203ﻩ ﻩB.101ﻩ C.21ﻩﻩ D .416.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员 工的健康情况,用分层抽样的方法抽一个容量为7的样本,其中30岁以上的员工应抽多少( )A.2人ﻩﻩ B.4人 ﻩC.5人 ﻩﻩD .1人 7.把21化为二进制数,则此数为( )A .10011(2) ﻩB.10110(2)ﻩﻩC .10101(2) D.11001(2)8. 在抽取产品的尺寸过程中,将其尺寸分成若干组,[),a b 是其中一组,抽查出的个体在该组 上的频率为m ,该组上的直方图的高为h,则a b -= ( )A .hm ﻩﻩﻩB .mhC .hmﻩ ﻩD.h +m 9、现有200辆汽车通过某一段公路时的时速的频率分布直方图如右图所示, 时速在[50,60)的汽车大约有( )A .30辆B .40辆C .60辆D .80辆10.图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为1210A A A ,,,(如2A 表示身高(单位:cm )在[)150155,内的学生人数). 图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm (含160cm,不含180cm )的学生人数,那么在流程图中的判断框内应填写的条件是( ) A.9i <B.8i <C.7i <ﻩ D.6i <二:填空题11.经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的同学当中有5位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 人。
12.数据70,71,72,73的标准差是______________。
13.数据123,,,...,n a a a a 的方差为2σ,平均数为μ,则(1)数据123,,,...,,(0)n ka b ka b ka b ka b kb ++++≠的标准差为 ,平均数为 .(2)数据123(),(),(),...,(),(0)n k a b k a b k a b k a b kb ++++≠的标准差为 ,平均数为 。
14.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在(]2700,3000的频率为 。
15.已知样本9,10,11,,x y 的平均数是10,标准差是2,则xy = . 16. 一个容量为20的样本数据,分组后组距与频数如右表所示:则样本在区间(),50-∞ 上的频率为_________________。
17.某单位有老年人28人,中年人54人,青年人81人,为调查身体健康状况,需要从中抽取一个 容量为36的样本,用分层抽样方法应分别从老年人、中年人、青年人中各抽取 人、 人、______人。
三:解答题18.为了了解初三学生女生身高情况,某中学对初三女生身高进行了一次测量,所得数据整理后列出了频率分布表如下:组 别 频数 频率 145.5~149.5 1 0.02 149.5~153.5 4 0.08 153.5~157.5 20 0.40 157.5~161.5 15 0.30 161.5~165.58 0.16 165.5~169.5M n 合 计MN,,,m n M N (3)全体女生中身高在哪组范围内的人数最多?组距[)20,10 [)30,20 [)40,30 [)50,40 [)60,50 [)70,60频数 23454219.某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法抽取一个容量为185的样本,已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有多少学生?20.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)画出数据对应的散点图;(2)求线性回归方程,并在散点图中加上回归直线;150m时的销售价格.(3)据(2)的结果估计当房屋面积为221.已知α、)4,0(πβ∈且)2sin(sin 3βαβ+=,2tan 12tan42αα-=.求βα+的值.22.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产 量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据(1) 请画出上表数据的散点图;(2) 请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y bx a =+; (3) 已知该厂技术改造前100吨甲产品能耗为90吨标准煤;试根据(2)求出的线性 回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤? (3×2.5+4×3+5×4+6×4.5=66.5)23. 意大利数学家菲波拉契,在1202年出版的一书里提出了这样的一个问题:一对兔子饲养到第二个月进入成年,第三个月生一对小兔,以后每个月生一对小兔,所生小兔能全部存活并且也是第二个月成年,第三个月生一对小兔,以后每月生一对小兔.问这样下去到年底应有多少对兔子?试画出解决此问题的程序框图,并编写相应的程序.参考答案:题次 1 2 3 4 5 6 7 8 9 10 答案 DBBACACBCB11题、3;因为3位执“一般”对应1位“不喜欢”,即“一般”是“不喜欢”的3倍,而他们的差为12人,即“一般”有18人,“不喜欢”的有6人,且“喜欢”是“不喜欢”的6倍,即30人, 全班有54人,1305432-⨯= 12.52 因为 7071727371.5,4X +++== 222215[(7071.5)(7171.5)(7271.5)(7371.5)]42s =-+-+-+-= 13题.解:(1)kσ,k b μ+(2)k σ,k kb μ+14题.0.3; 15题.96; 16题.0.7; 17题.6人;12人;18人18题.解:(1)150,50(1420158)20.02M m ===-++++= 21,0.0450N n ===(3)在153.5157.5范围内最多19题. 解:从高三年级抽取的学生人数为185(7560)50-+= 而抽取的比例为501100020=,高中部共有的学生为1185370020÷=20题.解:(1)数据对应的散点图如图所示:(2)1095151==∑=i i x x ,1570)(251=-=∑=x x l i i xx ,308))((,2.2351=--==∑=y y x x l y i i i xy设所求回归直线方程为a bx y +=,则1962.01570308≈==xx xy l l b ;8166.115703081092.23≈⨯-=-=x b y a故所求回归直线方程为8166.11962.0+=x y(3)据(2),当2150x m =时,销售价格的估计值为: 2466.318166.11501962.0=+⨯=y(万元)21.解:∵αβαβααβαβ++=+-+=)(2)( )2sin(sin 3βαβ+=∴[][]αβααβα++=-+)(sin )(sin 3∴αβααβααβααβαsin )cos(cos )sin(sin )cos(3cos )sin(3+++=+-+) ∴αβααβαsin )cos(4cos )sin(2+=+∴αβαtan 2)tan(=+ 又∵2tan 12tan42αα-= ∴212tan 12tan22=-αα∴21tan =α ∴1212tan 2)tan(=⨯==+αβα ∴4πβα=+22题.解 方法1(不作要求):设线性回归方程为y bx a =+,则222222222(,)(3 2.5)(43)(54)(6 4.5)42(1814)(3 2.5)(43)(54)(6 4.5)f a b b a b a b a b a a a b b b a b =+-++-++-++-=+-+-+-+-+-∴79 3.5 4.52ba b -==-时, (,)f a b 取得最小值2222(1.51)(0.50.5)(0.50.5)(1.51)b b b b -+-+-+-即22250.5[(32)(1)]572b b b b -+-=-+,∴0.7,0.35b a ==时f (a,b )取得最小值; 所以线性回归方程为0.70.35y x =+;方法2:由系数公式可知,266.54 4.5 3.566.5634.5, 3.5,0.75864 4.5x y b -⨯⨯-=====-⨯93.50.70.352a =-⨯=,所以线性回归方程为0.70.35y x =+; (4) x =100时,0.70.3570.35y x =+=,所以预测生产100吨甲产品的生产能耗比技术 改造前降低19.65吨标准煤.23题.解: 分析: 根据题意可知,第一个月有1对小兔,第二个月有1对成年兔子,第三个月有两对兔子,从第三个月开始,每个月的兔子对数是前面两个月兔子对数的和,设第N 个月有两F对兔子,第N -1个月有S 对兔子,第N-2个月有Q 对兔子,则有F=S+Q,一个月后,即第N+1个月时,式中变量S 的新值应变第N 个月兔子的对数(F 的旧值),变量Q的新值应变为第N-1个月兔子的对数(S 的旧值),这样,用S+Q 求出变量F 的新值就是N+1个月兔子的数,依此类推,可以得到一个数序列,数序列的第12项就是年底应有兔子对数,我们可以先确定前两个月的兔子对数均为1,以此为基准,构造一个循环程序,让表示“第×个月的I 从3逐次增加1,一直变化到12,最后一次循环得到的F ”就是所求结果.流程图和程序如下:。