统计学(第五版)贾俊平期末考试模拟试题
- 格式:doc
- 大小:241.37 KB
- 文档页数:9
模拟试题二一. 单项选择题(每小题2分,共20分)一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示:故障次数()0 123概率()正好发生1次故障的概率为()A.B.C.D.要观察200名消费者每月手机话费支出的分布状况,最适合的图形是()A.饼图B.条形图C.箱线图D.直方图从某种瓶装饮料中随机抽取10瓶,测得每瓶的平均净含量为355毫升。
已知该种饮料的净含量服从正态分布,且标准差为5毫升。
则该种饮料平均净含量的90%的置信区间为()A.B.C.D.根据最小二乘法拟合线性回归方程是使()A.B.C.D.一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。
随机抽取由200名学生组成的一个随机样本,检验假设,,得到样本比例为。
检验统计量的值为()A.B.C.D.在实验设计中,将种“处理”随机地指派给试验单元的设计称为()A.试验单元B.完全随机化设计C.随机化区组设计D.因子设计某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是()A.直线模型B.二次曲线模型C.指数曲线模型D.修正指数曲线模型在因子分析中,变量的共同度量反映的是()A.第个公因子被变量的解释的程度B.第个公因子的相对重要程度C.第个变量对公因子的相对重要程度D.变量的信息能够被第个公因子所解释的程度如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是()A.Mann-Whitney检验B.Wilcoxon符号秩检验C.Kruskal-Wallis检验D.Spearman秩相关及其检验在二元线性回归方程中,偏回归系数的含义是()A.变动一个单位时,的平均变动值为B.变动一个单位时,因变量的平均变动值为C.在不变的条件下,变动一个单位时,的平均变动值为D.在不变的条件下,变动一个单位时,的平均变动值为二. 简要回答下列问题(每小题10分,共20分)画出时间序列预测方法选择的框图。
目 录第1章 导 论1.1 复习笔记1.2 课后习题详解1.3 典型习题详解第2章 数据的搜集2.1 复习笔记2.2 课后习题详解2.3 典型习题详解第3章 数据的图表展示3.1 复习笔记3.2 课后习题详解3.3 典型习题详解第4章 数据的概括性度量4.1 复习笔记4.2 课后习题详解4.3 典型习题详解第5章 概率与概率分布5.1 复习笔记5.2 课后习题详解5.3 典型习题详解第6章 统计量及其抽样分布6.1 复习笔记6.2 课后习题详解6.3 典型习题详解第7章 参数估计7.1 复习笔记7.2 课后习题详解7.3 典型习题详解第8章 假设检验8.1 复习笔记8.2 课后习题详解8.3 典型习题详解第9章 分类数据分析9.1 复习笔记9.2 课后习题详解9.3 典型习题详解第10章 方差分析10.1 复习笔记10.2 课后习题详解10.3 典型习题详解第11章 一元线性回归11.1 复习笔记11.2 课后习题详解11.3 典型习题详解第12章 多元线性回归12.1 复习笔记12.2 课后习题详解12.3 典型习题详解第13章 时间序列分析和预测13.1 复习笔记13.2 课后习题详解13.3 典型习题详解第14章 指 数14.1 复习笔记14.2 课后习题详解14.3 典型习题详解第1章 导 论1.1 复习笔记一、统计学1统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
数据收集也就是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2.数据分析所用的方法(1)描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;(2)推断统计:研究如何利用样本数据来推断总体特征的统计方法。
二、统计数据的类型1分类数据、顺序数据、数值型数据(按计量尺度不同分类)(1)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的;(2)顺序数据:只能归于某一有序类别的非数字型数据。
模拟试题二一.单项选择题(每小题2分,共20分)一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示:故障次数()0 1 2 3概率()0.05 0.25 0.40 0.30正好发生1次故障的概率为()A.0.05B.0.25C.0.40D.0.30要观察200名消费者每月手机话费支出的分布状况,最适合的图形是()A.饼图B.条形图C.箱线图D.直方图从某种瓶装饮料中随机抽取10瓶,测得每瓶的平均净含量为355毫升。
已知该种饮料的净含量服从正态分布,且标准差为5毫升。
则该种饮料平均净含量的90%的置信区间为()A.B.C.D.根据最小二乘法拟合线性回归方程是使()A.B.C.D.一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。
随机抽取由200名学生组成的一个随机样本,检验假设,,得到样本比例为。
检验统计量的值为()A.B.C.D.在实验设计中,将种“处理”随机地指派给试验单元的设计称为()A.试验单元B.完全随机化设计C.随机化区组设计D.因子设计某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是()A.直线模型B.二次曲线模型C.指数曲线模型D.修正指数曲线模型在因子分析中,变量的共同度量反映的是()A.第个公因子被变量的解释的程度B.第个公因子的相对重要程度C.第个变量对公因子的相对重要程度D.变量的信息能够被第个公因子所解释的程度如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是()A.Mann-Whitney检验B.Wilcoxon符号秩检验C.Kruskal-Wallis检验D.Spearman秩相关及其检验在二元线性回归方程中,偏回归系数的含义是()A.变动一个单位时,的平均变动值为B.变动一个单位时,因变量的平均变动值为C.在不变的条件下,变动一个单位时,的平均变动值为D.在不变的条件下,变动一个单位时,的平均变动值为二.简要回答下列问题(每小题10分,共20分)画出时间序列预测方法选择的框图。
《统计学》练习1一、填空题(每空1分,共20分)1、四分位差排除了数列两端各单位标志值的影响。
2、由一组频数2,5,6,7得到的一组频率依次是、、和,如果这组频数各增加20%,则所得到的频率。
3、已知一个开口等距分组数列最后一组的下限为600,其相邻组的组中值为580,则最后一组的上限可以确定为,其组中值为。
4、如果各组相应的累积频率依次为,,,,1,观察样本总数为100,则各组相应的观察频数为。
M可反映总体的趋势,四分位差可反映总体的程度,数据组5、中位数e1,2,5,5,6,7,8,9中位数是 , 四分位差是。
6、已知正态总体标准差是2,要求置信水平为和最大允许误差为,在重复抽样方式下必要样本容量是,如果置信水平增大,必要样本容量将。
7、某班学生的平均成绩是80分,标准差是10分。
如果已知该班学生的考试分数为对称分布,可以判断考试分数在70到90分之间的学生大约占 % 。
H假设,则犯了8、在假设检验中,由于抽样的偶然性,拒绝了实际上成立的错误。
9、设总体均值为100,总体方差为25,样本容量为n,若n足够大,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从。
10、从一批零件中抽出20个测量其直径,测得平均直径为5.2cm,标准差为1.6cm,想知道这批零件的直径是否服从标准直径5cm,在显着性水平α下,接受域为。
11、某地区的出租房月租金的标准差为80元,要估计总体均值的95%的置信区间,希望的边际误差为15元,应抽取的样本量为。
二、单选题(每题1分,共10分)1、两个总体的平均数不相等,标准差相等,则( )A、平均数大,代表性大B、平均数小,代表性大C、两个总体的平均数代表性相同D、无法判断2、分组数据各组的组限不变,每组的频数均增加40,则其加权算术平均数的值( )A、增加40B、增加40%C、不变化D、无法判断3、以下数字特征不刻画分散程度的是( )A、四分位差B、中位数C、离散系数D、标准差4、当最大允许误差扩大时,区间估计的可靠性将()A、保持不变B、随之扩大C、随之变小D、无法定论5、假设检验中的显着性水平α就是所犯的 ( )A、第一类错误B、第一类错误的概率C 、第二类错误D 、第二类错误的概率6、中心极限定理可保证在大量观察下 ( )A 、 样本平均数趋近于总体平均数的趋势B 、 样本方差趋近于总体方差的趋势C 、样本平均数分布趋近于正态分布的趋势D 、 样本比例趋近于总体比例的趋势7、设总体X 服从期望为μ,方差为2σ的正态分布,2σ已知而μ为未知参数,12(,,...,)n x x x 是从X 中抽取的样本,记11ni i X x n ==∑,则μ的置信度为的置信区间是 ( )A 、 (0.975,0.975)X X nn-+ B 、 ( 1.96, 1.96)X X nn-+ C 、 ( 1.28, 1.28)X X nn-+ D 、 (0.90,0.90)X X nn-+8、根据一个具体的样本求出的总体均值的95%的置信区间 ( )A 、以95%的概率包含总体均值B 、有5%的可能性包含总体均值C 、一定包含总体均值D 、要么包含总体均值,要么不包含总体均值 9、假设检验中,显着性水平α表示 ( )A 、 {}00P H H 接受为伪 B 、无具体含义C 、 置信度为α?D 、{}00P H H 拒绝为真10、自动包装机装出的每包重量服从正态分布,规定每包重量的方差不超过A ,为了检查包装机的工作是否正常,对它生产的产品进行抽样检验,取零假设为2A σ≤,检验水平为,则下列陈述中,正确的是 ( )A 、 如果生产正常,则检验结果也认为正常的概率为95%B 、 如果生产不正常,则检验结果也认为不正常的概率为95%C 、 如果检验的结果认为正常,则生产确实正常的概率为95%D 、 如果检验的结果认为不正常,则生产确实不正常的概率为95%三、判断题(每题1分,共10分)1、已知分组数据的各组组限为:10~15,15~20,20~25,取值为15的这个样本被分在第一组。
【关键字】单位《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A.分类变量B.顺序变量C.数值型变量D.离散变量7.要反映我国工业企业的整体业绩水平,总体单位是()A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A.分类数据B.顺序数据C.截面数据D.时间序列数据10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
分析数据:分为描述统计方法和推断统计方法两种方法。
描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计:是研究如何利用样本数据来推断总体特征的统计方法。
推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。
数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。
(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。
3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。
在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。
统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。
4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。
样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。
抽样的目的是根据样本提供的信息推断总体的特征。
5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。
样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。
统计学期末(单选、10个填空、5个判断、三个计算、一道论述)第一章导论1、统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
分析数据:分为描述统计方法和推断统计方法两种方法。
描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
推断统计:是研究如何利用样本数据来推断总体特征的统计方法。
推断统计内容包含参数估计和假设检验2、统计数据的类型:(1)按照采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据与数值型数据。
注意:分类数据和顺序数据都是表现事物的品质特征,通常是用文字来表述的,其结果均表现为类别,因此可以通称为定性数据或品质数据(qualitative data)。
数值型数据说明的是现象的数量特征,通常用数值来表现,因此可以统称为定量数据或数量数据(quantitative data)。
(2)按照统计数据的收集方法,可以将统计数据分为观测数据和实验数据。
(3)按照被描述的现象与时间的关系,可以将统计数据分为截面数据、时间序列数据(和面板数据 panal data)。
3、抽样独立性问题:总体区分为有限总体和无限总体,目的是为了判别在抽样中每次抽取是否独立(类似抽小球是否放回的问题)。
在统计推断中,通常是针对无限总体的,因而通常把总体看做随机变量(random variable)。
统计上的总体通常是一组观测数据,而不是一群人或者一些物品的简单集合。
4、统计指标按其所反映的数量特点和作用不同,分为数量指标、质量指标。
样本(sample)是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量(sample size)。
抽样的目的是根据样本提供的信息推断总体的特征。
5、总体参数(parameter)是用来描述总体特征的概括性数字度量,是研究者想要了解的某种特征值。
样本统计量(statistic)是用来描述样本特征的概括性数字度量,是根据样本数量计算出来的一个量。
cha.4选择题(贾俊平《统计学》第五版配套指导书选择题)《统计学》补充作业第四章补充作业第四章1、一组数据中出现频数最多的变量值称为()A.众数B.中位数C.四分位数D.平均数2、下列关于众数的叙述,不正确的是()A.一组数据可能存在多个众数B.众数主要适用于分类数据C.一组数据的众数是唯一的D.众数不受极端值的影响3、一组数据排序后处于中间位置上的变量值称为()A.众数B.中位数C. 四分位数D.平均数4、一组数据排序后处于25%和75%位置上的值称为()A.众数B.中位数C. 四分位数D.平均数5、非众数组的频数占总频数的比例称为()A.异众比率B.离散系数C.平均差D.标准差6、四分位差是()A.上四分位数减下四分位数的结果B.下四分位数减下四分位数的结果C.下四分位数加上四分位数D.下四分位数与上四分位数的中间值7、一组数据的最大值与最小值之差称为()A.平均差B.标准差C.极差D.四分位差8、各变量值与其平均数离差平方的平均数称为()A.极差B.平均差C.方差D.标准差9、变量值与其平均数的离差除以标准差后的值称为()A.标准分数B.离散系数C.方差D.标准差10、如果一个数据的标准分数是-2,表明该数据()A.比平均数高出2个平均差B.比平均数低2个标准差C.等于2倍的平均数D.等于2倍的标准差11、如果一个数据的标准分数是3,表明该数据()A.比平均数高出3个标准差B. 比平均数低3个标准差C.等于3倍的平均数D.等于3倍的标准差12、经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围内大约有()A.68%的数据B.95%的数据C.99%的数据D.100%的数据13、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围内大约有()A.68%的数据B.95%的数据C.99%的数据D.100%的数据14、经验法则表明,当一组数据对称分布时,在平均数加减3个标准差的范围内大约有()A.68%的数据B.95%的数据C.99%的数据D.100%的数据15、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=2,其意义是()A.至少有75%的数据落在平均数加减2个标准差的范围之内B.至少有89%的数据落在平均数加减2个标准差的范围之内C. 至少有94%的数据落在平均数加减2个标准差的范围之内D. 至少有99%的数据落在平均数加减2个标准差的范围之内16、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=3,其意义是()A.至少有75%的数据落在平均数加减3个标准差的范围之内B.至少有89%的数据落在平均数加减3个标准差的范围之内C.至少有94%的数据落在平均数加减3个标准差的范围之内D.至少有99%的数据落在平均数加减3个标准差的范围之内17、如果一组数据不是对称分布的,根据切比雪夫不等式,对于k=4,其意义是()A.至少有75%的数据落在平均数加减4个标准差的范围之内B.至少有89%的数据落在平均数加减4个标准差的范围之内C.至少有94%的数据落在平均数加减4个标准差的范围之内D.至少有99%的数据落在平均数加减4个标准差的范围之内18、离散系数的主要用途是()A.反映一组数据的离散水平B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平19、比较两组数据的离散程度最适合的统计量是()A.极差B.平均差C.标准差D.离散系数20、偏态系数测度了数据分布的非对称性程度。
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
《统计学》分章习题及答案(贾俊平,第五版)主编:杨群目录习题部分 (2)第1章导论 (3)第2章数据的搜集 (4)第3章数据的整理与显示 (5)第4章数据的概括性度量 (6)第5章概率与概率分布 (9)第6章统计量及其抽样分布 (10)第7章参数估计 (11)第8章假设检验 (12)第9章分类数据分析 (13)第10章方差分析 (15)第11章一元线性回归 (17)第12章多元线性回归 (19)第13章时间序列分析和预测 (22)第14章指数 (25)答案部分 (29)第1章导论 (29)第2章数据的搜集 (29)第3章数据的图表展示 (29)第4章数据的概括性度量 (30)第5章概率与概率分布 (31)第6章统计量及其抽样分布 (32)第7章参数估计 (32)第8章假设检验 (33)第9章分类数据分析 (33)第10章方差分析 (35)第11章一元线性回归 (35)第12章多元线性回归 (37)第13章时间序列分析和预测 (38)第14章指数 (40)习题部分第1章导论一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
模拟试题二一.单项选择题(每小题2分,共20分)一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示:故障次数()0 1 2 3概率()0.05 0.25 0.40 0.30正好发生1次故障的概率为()A.0.05B.0.25C.0.40D.0.30要观察200名消费者每月手机话费支出的分布状况,最适合的图形是()A.饼图B.条形图C.箱线图D.直方图从某种瓶装饮料中随机抽取10瓶,测得每瓶的平均净含量为355毫升。
已知该种饮料的净含量服从正态分布,且标准差为5毫升。
则该种饮料平均净含量的90%的置信区间为()A.B.C.D.根据最小二乘法拟合线性回归方程是使()A.B.C.D.一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。
随机抽取由200名学生组成的一个随机样本,检验假设,,得到样本比例为。
检验统计量的值为()A.B.C.D.在实验设计中,将种“处理”随机地指派给试验单元的设计称为()A.试验单元B.完全随机化设计C.随机化区组设计D.因子设计某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是()A.直线模型B.二次曲线模型C.指数曲线模型D.修正指数曲线模型在因子分析中,变量的共同度量反映的是()A.第个公因子被变量的解释的程度B.第个公因子的相对重要程度C.第个变量对公因子的相对重要程度D.变量的信息能够被第个公因子所解释的程度如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是()A.Mann-Whitney检验B.Wilcoxon符号秩检验C.Kruskal-Wallis检验D.Spearman秩相关及其检验在二元线性回归方程中,偏回归系数的含义是()A.变动一个单位时,的平均变动值为B.变动一个单位时,因变量的平均变动值为C.在不变的条件下,变动一个单位时,的平均变动值为D.在不变的条件下,变动一个单位时,的平均变动值为二.简要回答下列问题(每小题10分,共20分)画出时间序列预测方法选择的框图。
时间序列预测与分析选择题1、不存在趋势的序列称为()。
A、平稳序列B、周期性序列C、季节性序列D、非平稳序列2、包含趋势性、季节性或周期性的序列称为()。
A、平稳序列B、周期性序列C、季节性序列D、非平稳序列3、时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为()。
A、趋势B、季节性C、周期性D、随机性4、时间序列在一年内重复出现的周期性波动称为()。
A、趋势B、季节性C、周期性D、随机性5、时间序列中呈现出来的围绕长期趋势的一种波浪形或震荡式变动称为()。
A、趋势B、季节性C、周期性D、随机性6、时间序列中除去趋势、周期性和季节性之后的偶然性波动称为()。
A、趋势B、季节性C、周期性D、随机性7、从下面的图形可以判断该时间序列中存在()。
A、趋势B、季节性C、周期性D、趋势和随机性8、增长率是时间序列中()。
A、报告期观察值与基期观察值之比B、报告期观察值与基期观察值之比减1C、报告期观察值与基期观察值之比加1D、基期观察值与报告期观察值之比减19、环比增长率是()。
A、报告期观察值与前一时期观察值之比减1B、报告期观察值与前一时期观察值之比加1C、报告期观察值与某一固定时期观察值之比减1D、报告期观察值与某一固定时期观察值之比加110、定基增长率是()。
A、报告期观察值与前一时期观察值之比减1B、报告期观察值与前一时期观察值之比加1C、报告期观察值与某一固定时期观察值之比减1D、报告期观察值与某一固定时期观察值之比加111、时间序列中各逐期环比值的几何平均数减1 后的结果称为()。
A、环比增长率B、定基增长率C、平均增长率D、年度化增长率12、增长1个百分点而增加的绝对数量称为()。
A、环比增长率B、平均增长率C、年度化增长率D、增长1%的绝对值13、判断时间序列是否存在趋势成分的一种方法是()。
A、计算环比增长率B、利用回归分析拟合一条趋势线C、计算平均增长率D、计算季节指数14、指数平滑法适合于预测()。
模拟试题一一.单项选择题(每小题2分,共20分)4名大学生每月的手机话费支出(单位:元)分别是:64.3,60.4,77.6,51.2,53.1,57.5,5 3.9 , 47.8 , 53.5 。
手机话费支出的平均数是()A.53.9B.57.7C.55.2D.56.5项调查表明,在所抽取的2000个消费者中,他们每月在网上购物的平均花费是200元,这项调查的总体是()A.2000个消费者B.2000个消费者的平均花费金额C.所有在网上购物的消费者D.所有在网上购物的消费者的总花费额:在参数估计中,要求用来估计总体参数的统计量与总体参数的离差越小越好。
这种评价标准称'下面关于回归模型的假定中不正确的是()A.误差项£是一个期望值为0的随机变量2B.对于所有的x值,E的方差B 都相同C.误差项E是一个服从正态分布的随机变量,且独立D.自变量x是随机的5某药品生产企业采用一种新的配方生产某种药品,并声称新配方药的疗效远好于旧的配方。
为检验企业的朔方是否属实,医药管理部门抽取一个样本进行检验,提出的假设为凤;如。
该检验所犯的第n类错误是指()新药的疗效有显著提高,得出新药疗效没有显著提高的结论新药的疗效有显著提高,得出新药的疗效有显著提高的结论新药的疗效没有显著提高的结论,得出新药疗效没有显著提高的结论新药的疗效没有显著提高,得出新药疗效有显著提高的结论家研究机构从事水稻品种的研发。
最近研究出3个新的水稻品。
为检验不同品种的平均产量是否相同,对每个品种分别在5个地块上进行试验,共获得15个产量数据。
在该项研究中,反映全部15个产量数据之间称为()A.总误差B.组内误差C.组间误差D.处理误差趋势变动的特点是()A. 呈现出固定长度的周期性变动B. 呈现出波浪形或振荡式变动在一年内重复出现的周期性波动D. 呈现出某种持续向上或持续下降的变动般而言,选择主成分的标准通常是要求所选主成分的累积方差总和占全部方差的()A. 60%以上B. 70%以上C. 80%以上D. 90%以上如果要检验样本数据是否来自某一正态分布的总体,可采用的非参数检验方法是()A. 符号检验3. Wilcoxon符号秩检验二项分布检验D. K-S检验⑴在聚类分析中,根据样本对多个变量进行分类称为()A.应型聚类B. 2型聚类C.层次聚类D. K-均值聚类二.简要回答下列问题(每小题10分,共20分)直方图和条形图各自的应用场合是什么?二者有何区另打"从一批食品抽取20袋作为样本。
统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版)第一部分思考题第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
第1章 导 论一、单项选择题1.指出下面的变量哪一个属于分类变量?( )A.年龄B.工资C.汽车产量D.购买商品时的支付方式(现金、信用卡、支票)【答案】D【解析】分类变量是指观测结果表现为某种类别的变量。
题中D项购买商品时的支付方式分为三类:现金、信用卡和支票,因此属于分类变量。
ABC三项均属于数值型变量。
2.指出下面的变量哪一个属于顺序变量?( )A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)【答案】D【解析】顺序变量又称为有序分类变量,观测结果表现为某种有序类别的变量。
C项员工对企业某项改革措施的态度按顺序依次表现为:赞成、中立、反对三种,因此属于顺序变量。
ABD三项均属于数值型变量。
3.指出下面的变量哪一个属于数值型变量?( )A.年龄B.性别C.企业类型D.员工对企业某项改革措施的态度(赞成、中立、反对)【答案】A【解析】数值型变量又称为定量变量,观测结果表现为数字的变量。
A项生活费支出的观测结果表现为数字的变量,因此为数值型变量。
BD项均为顺序变量,C项为分类变量。
4.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是( )。
A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入【答案】B【解析】总体是指包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。
题中的总体为200万个家庭。
5.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本是( )。
B.200万个家庭C.2000个家庭的总收入D.200万个家庭的人均收入【答案】A【解析】样本是指从总体中抽取的一部分元素的集合。
题中的样本为2000个家庭。
6.某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
目 录第1章 导 论1.1 复习笔记1.2 课后习题详解1.3 典型习题详解第2章 数据的搜集2.1 复习笔记2.2 课后习题详解2.3 典型习题详解第3章 数据的图表展示3.1 复习笔记3.2 课后习题详解3.3 典型习题详解第4章 数据的概括性度量4.1 复习笔记4.2 课后习题详解4.3 典型习题详解第5章 概率与概率分布5.1 复习笔记5.2 课后习题详解5.3 典型习题详解第6章 统计量及其抽样分布6.1 复习笔记6.2 课后习题详解6.3 典型习题详解第7章 参数估计7.1 复习笔记7.2 课后习题详解7.3 典型习题详解第8章 假设检验8.1 复习笔记8.2 课后习题详解8.3 典型习题详解第9章 分类数据分析9.1 复习笔记9.2 课后习题详解9.3 典型习题详解第10章 方差分析10.1 复习笔记10.2 课后习题详解10.3 典型习题详解第11章 一元线性回归11.1 复习笔记11.2 课后习题详解11.3 典型习题详解第12章 多元线性回归12.1 复习笔记12.2 课后习题详解12.3 典型习题详解第13章 时间序列分析和预测13.1 复习笔记13.2 课后习题详解13.3 典型习题详解第14章 指 数14.1 复习笔记14.2 课后习题详解14.3 典型习题详解第1章 导 论1.1 复习笔记一、统计学1统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
数据收集也就是取得统计数据;数据处理是将数据用图表等形式展示出来;数据分析则是选择适当的统计方法研究数据,并从数据中提取有用信息进而得出结论。
2.数据分析所用的方法(1)描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;(2)推断统计:研究如何利用样本数据来推断总体特征的统计方法。
二、统计数据的类型1分类数据、顺序数据、数值型数据(按计量尺度不同分类)(1)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表述的;(2)顺序数据:只能归于某一有序类别的非数字型数据。
《统计学》模拟试卷(一)一、填空题(每空1分,共10分)1、依据统计数据的收集方法不同,可将其分为【观测数据】数据和【实验数据】数据。
2、收集的属于不同时间上的数据称为【时间序列】数据。
3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值=5,则总体均值的置信水平为99%的置信区间[4.742 ,5.258] (Z 0.005=2.58)4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为【21%】5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 1080,中位数为1080。
6、判定系数的取值范围是 [0,1] 。
7、设总体X ~),(2σμN ,x 为样本均值,S 为样本标准差。
当σ未知,且为小样本时,则n sx μ-服从自由度为n-1的___t__分布。
8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 16 个。
二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。
每小题1分,共14分)3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值的无偏估计值为( 2 ) ①、32.5 ②、33 ③、39.64、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( 3 5、若两个变量的平均水平接近,平均差越大的变量,其( 2 )①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( 2 ) ②、越小7、若某总体次数分布呈轻微左偏分布,则成立的有 ( 2 )①、x >e M >o M ②、x <e M <o M ③、x >o M >e M8、方差分析中的原假设是关于所研究因素 ( 2 )①、各水平总体方差是否相等 ②、各水平的理论均值是否相等③、同一水平内部数量差异是否相等9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度( 1 ) ①、甲类较大 ②、乙类较大 ③、两类相同10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本指数为 ( 3 ) ①、187.5% ②、7% ③、106.48% 11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。
一
要从
((
A.
B.
C.
D.
根据最小二乘法拟合线性回归方程是使()
A.
B.
C.
D.
一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。
随机抽取由200名学生组
成的一个随机样本,检验假设,,得到样本比例为。
检验统计量的值为()
A.
B.
C.
D.
在实验设计中,将种“处理”随机地指派给试验单元的设计称为()
A.试验单元
B.完全随机化设计
C.随机化区组设计
D.因子设计
某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是()
A.直线模型
B.二次曲线模型
C.指数曲线模型
D.修正指数曲线模型
在因子分析中,变量的共同度量反映的是()
A.第个公因子被变量的解释的程度
B.第个公因子的相对重要程度
C.第个变量对公因子的相对重要程度
D.变量的信息能够被第个公因子所解释的程度
如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是()
A.Mann-Whitney检验
B.Wilcoxon符号秩检验
C.Kruskal-Wallis检验
D.Spearman秩相关及其检验
在二元线性回归方程中,偏回归系数的含义是()
A.变动一个单位时,的平均变动值为
B.变动一个单位时,因变量的平均变动值为
C.在不变的条件下,变动一个单位时,的平均变动值为
在不,变,的为
画
简
假
:,,,一
为
:,对
模拟试题二解答
一、单项选择题(每小题2分,共20分)
1.B;
2. D;
3. C;
4. B;
5. A;
6. B;
7. C;
8. D;
9. A;10. C。
二、简要回答下列问题(每小题10分,共20分)
1. 框图如下:
2. (1)对数据进行检验,以判断手头的数据是否适合作因子分析。
用于因子分析的变量必须是相关的。
一般来说,相关矩阵中的大部分相关系数小于0.3,就不适合作因子分析了。
(2)因子提取。
根据原始变量提取出少数几个因子,使得少数几个因子能够反映原始变量的绝大部分信息,从而达到变量降维的目的。
(3)因子命名。
一个因子往往包含了多个原始变量的信息,它究竟反映了原始变量的哪些共同信息?因子分析得到的因子的含义是模糊的,需要重新命名,以便对研究的问题做出合理解释。
(4)根据因子得分函数计算因子在每个样本上的具体取值,以便对各样本进行综合评价和排序。
三、计算与分析各题(每小题15分,共60分)
1.(1)散点图如下:
从散点图可以看出,需求量与价格之间存在负线性关系,即随着价格的提高,需求量则随之下降。
(2)由最小二乘法可得:
,。
总需求量与价格的一元线性回归方程为:。
回归系数表示:价格每增加1元,总需求量平均减少6.25公斤。
(3)公斤。
2. 两个供应商灯泡使用寿命的直方图如下:
从集中程度来看,供应商甲的灯泡的使用寿命多数集中在1100小时~1300小时之间,供应商乙的灯泡的使用寿命多数集中在900小时~1100小时之间。
从离散程度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。
(2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供应商灯泡使用寿命的分布基本上是对称分布的。
(3)计算两个供应商灯泡使用寿命的平均数如下:
小时。
小时。
甲供应商灯泡使用寿命更长。
(4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
小时。
小时。
由于,说明供应商乙的灯泡寿命更稳定。
3. (1)已知:,,,。
网络用户每天平均上网时间的95%的置信区间为:
即(6.17,6.83)。
(2)样本比例。
龄在20岁以下的网络用户比例的95%的置信区间为:
即(33.6%,46.4%)。
4. (1)A=10
5.2-69.7=35.5;B=69.7÷4=17.425;C=35.5÷15=2.367;D=14.425÷2.367=7.361。
(2)B=17.425被称为组间方差,反映组间平均误差的大小;C=2.367被称为组内方差,反映组内平均误差的大小。
(3)由于,拒绝原假设,表明五个总体的均值之间不全相等。