应用统计学试题及答案解析
- 格式:doc
- 大小:81.00 KB
- 文档页数:14
应用统计真题大题解析及答案统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有着广泛的应用。
掌握统计学的基本概念和方法,对于提高数据处理和决策分析能力至关重要。
本文将通过对一些经典的应用统计题目进行解析和答案讲解,帮助读者更好地理解统计学的应用。
1. 样本调查样本调查是统计学中常用的数据采集方式之一。
假设某市有10万户家庭,为了更好地了解该市家庭收入水平的分布情况,抽取了1000户家庭进行调查。
调查结果显示,平均家庭收入为5000元,标准差为1000元。
请回答以下问题:(1) 该市家庭收入的总和约为多少?(2) 用95%的置信水平估计该市家庭收入的总和的区间范围。
解析:(1) 样本调查的目的是通过抽样得到的样本数据,推断整个总体的情况。
根据样本均值与总体比例关系的无偏性,可得总体的平均值估计为(样本平均数 * 总体规模 / 样本规模)。
所以,该市家庭收入的总和约为(5000 * 10万 / 1000) = 50亿元。
(2) 置信水平为95%,即我们希望有95%的把握区间估计包含真实总体参数。
根据正态分布的性质和样本数量大于30的条件,可以使用正态分布进行处理。
置信区间的计算公式为(样本均值± z * (总体标准差 / 样本大小的平方根))。
根据标准正态分布表,对应95%的置信水平,z值约为1.96。
因此,估计的置信区间为(5000 ± 1.96 * (1000 / √1000)),即(4853, 5147)。
2. 假设检验假设检验是统计学中常用的验证假设的方法。
某超市打算推出一个新产品,声称其每包含有1000克。
为验证该声称是否准确,随机抽取了36包产品进行称重,并得到了平均重量为985克,标准差为30克。
根据这些数据,判断该声称是否准确。
解析:假设检验一般包括原假设(H0)和备择假设(H1)。
在这个案例中,我们可以将原假设设定为"该产品的平均重量为1000克",备择假设设定为"该产品的平均重量不为1000克"。
应用统计学试题和答案一. 单项选择题(10%, 每题1分)1、()是指构成总体的每—个单位必须或至少有—个共同的性质,正是这个共同的性质才使得这些个体组合在一起,形成一个整体。
A.大量性B.差异性C.同质性D.社会性2、对全国各铁路交通枢纽的货运量、货物种类等进行调查,以了解全国铁路货运概况。
这种调查属于()。
A.普查B.抽样调查C.重点调查D.典型调查3、在抽样调查中,无法避免的误差是()。
A.登记误差B.系统性误差C.计算误差D.抽样误差4、统计表中的主词是指()。
A、表中全部统计资料的内容B、描述研究对象的指标C、各种指标所描述的研究对象D、分布在各栏中的指标数值5、将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为()。
A、动态相对指标B、结构相对指标C、比例相对指标D、比较相对指标6、某企业计划产品产量比上年提高10%,实际提高了15%,则计划完成程度为()。
A.150%B.5%C.4.56%D.104.55%7、两个总体的平均数不等,但标准差相等,则()。
A、小平均数的代表性大B、大平均数的代表性大C、两个平均数代表性相同D、无法判断代表性大小8、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y = 10 + 70x,这意味着年劳动生产率每提高1千元,工人工资平均()。
A、增加70元B、减少70元C、增加80元D、减少80元9、变量间相关程度越低,则相关系数的数值( )。
A、越小B、越接近于0C、越接近于– 1D、越接近于110、产品产量报告期比基期增长25%,单位产品成本减少20%,则生产总成本()。
A、增长5%B、增长20%C、减少80%D、没有变动二. 多项选择题(20%, 每题2分)1.要了解某地区全部大学生的就业情况,那么()。
A.全部大学毕业生是研究总体B.大学毕业生总数是统计指标C.大学毕业生就业率是统计标志D.反映每位大学毕业生特征的职业是数量指标2.某市要调查全市现有养老机构情况,全市每一个养老机构是()。
应用统计学试题及答案一. 单项选择题 (10%, 每题1分)1.要了解某企业职工的文化水平情况,则总体单位是()。
A.该企业的全部职工B.该企业每一个职工的文化程度C.该企业的每一个职工D.该企业全部职工的平均文化程度2.对一批食品进行质量检验,最适宜采用的调查方法是()。
A.全面调查B.抽样调查C.典型调查D.重点调查3.将某地区40个工业企业按产值多少分组而编制的变量数列中,变量值是()。
A.产值B.工厂数C.各组的产值数D.各组的工厂数4.某企业某月产品销售额为20万元,月末库存商品为30万元,这两个总量指标是()。
A.时期指标B.时点指标C.前者为时期指标,后者为时点指标D.前者为时点指标,后者为时期指标5.离散程度大小与平均数代表性之间存在()。
A.正比关系B.反比关系C.恒等关系D.依存关系6.下面4个动态数列中,属于时点数列的是()。
A.历年招生人数动态数列B.历年增加在校生人数动态数列C.历年在校生人数动态数列D.历年毕业生人数动态数列7.在材料单耗综合指数中,每种产品的材料单耗指标是()。
A.质量指标B.数量指标C.相对指标D.总量指标A、提高B、下降C、不变D、条件不够,无法判断8.某企业产品为连续性生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是()。
A.整群抽样 B.简单随机抽样C.类型抽样 D.纯随机抽样9.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y =10 + 70x,这意味着年劳动生产率每提高1 000元时,工人工资平均()。
A.增加70元B.减少70元C.增加80元 D.减少80元10.对某市全部商业企业职工的生活状况进行调查,调查对象是()。
A.该市全部商业企业B.该市全部商业企业职工C.该市每一个商业企业D.该市商业企业每一名职工二. 多项选择题 (20%, 每题2分)1.下面说法正确的是()。
A.性别、文化程度、企业所属行业类型都是品质标志B.企业的职工人数、企业管理人员数都是数量标志C.某地区职工的工资总额是统计指标D.在校学生的年龄是连续变量2.我国第六次人口普查的标准时间是2010年11月1日零时,下列情况应统计人口数的有()。
《应用统计学》本科第一章导论一、单项选择题1.统计有三种涵义,其基础是( )。
(1)统计学 (2)统计话动 (3)统计方法 (4)统计资料2.一个统计总体( )。
(1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标3.若要了解某市工业生产设备情况,则总体单位是该市( )。
(1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备4.某班学生数学考试成绩分刷为65分、71分、80分和87分,这四个数字是( )。
(1)指标 (2)标志 (3)变量 (4)标志值5.下列属于品质标志的是( )。
(1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资6.现要了解某机床厂的生产经营情况,该厂的产量和利润是( )。
(1)连续变量 (2)离散变量 ()3前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量7.劳动生产率是( )。
(1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标8.统计规律性主要是通过运用下述方法经整理、分析后得出的结论( )。
(1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法9.( )是统计的基础功能。
(1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能10.( )是统计的根本准则,是统计的生命线。
(1)真实性 (2)及时件 (3)总体性 (4)连续性11.构成统计总体的必要条件是( )。
(1)差异性 (2)综合性 (3)社会性 (4)同质性12.数理统计学的奠基人是( )。
(1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔13.统汁研究的数量必须是( )。
(1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量14.数量指标一般表现为( )。
(1)平均数 (2)相对数 (3)绝对数 (1)众数15.指标是说明总体特征的.标志则是说明总体单位特征的,所以( )。
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分)1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。
试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。
已知:8.2,6.12==S x 0455.0=α 则有: 202275.02==Z Z α 平均误差=4.078.22==n S极限误差8.04.0222=⨯==∆nS Z α据公式x x ±=±∆ 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 3、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 2。
附:1080512)(=∑-=i x x i 8.392512)(=∑-=i y yi 58=x 2.144=y3题 解① 计算估计的回归方程:∑∑∑∑∑--=)(221x x n y x xy n β==-⨯⨯-⨯290217900572129042430554003060=0.567 =-=∑∑nxnyββ10144.2 – 0.567×58=111.314估计的回归方程为:y=111.314+0.567x② 计算判定系数:4计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。
4题 解:① 拉氏加权产量指数= 1000001.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑② 帕氏单位成本总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q pq q p q ++==⨯+⨯+⨯∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题)1、我国人口普查的调查对象是 ,调查单位是 。
应用统计学试题和答案 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】《统计学》模拟试卷(一)一、填空题(每空1分,共10分)1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。
2、收集的属于不同时间上的数据称为数据。
3、设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值x=5,则总体均值的置信水平为99%的置信区间_________________。
=4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP年度化增长率为。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为,中位数为。
6、判定系数的取值范围是。
7、设总体X~),(2σμN,x为样本均值,S 为样本标准差。
当σ未知,且为小样本时,则nsxμ-服从自由度为n-1的___________________分布。
8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有个。
二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。
每小题1分,共14分)1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( )①、应用统计学②、描述统计学③、推断统计学2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数()①、扩大2倍②、减少到1/3 ③、不变3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值的无偏估计值为()①、②、33 ③、4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为,2001~2002年两年平均为,试确定1998~2002五年的年平均发展速度 ( )5、若两个变量的平均水平接近,平均差越大的变量,其( )①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( )①、越大 ②、越小 ③、不变7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )①、x > e M >o M ②、x <e M <o M ③、x >o M >e M 8、方差分析中的原假设是关于所研究因素 ( ) ①、各水平总体方差是否相等 ②、各水平的理论均值是否相等③、同一水平内部数量差异是否相等9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度 ( ) ①、甲类较大 ②、乙类较大 ③、两类相同10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本指数为 ( ) ①、% ②、7% ③、%11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。
大学课程《应用统计学》试题及答案一、单项选择题1、统计学具有()特点A. 数量性和总体性B.数量性和差异性C. 总体性和差异性D.数量性和答案:A2、“统计”作为社会经济生活中经常使用的名词,以下哪项不是其含义()A. 统计工作B.统计资料C. 统计数据D.统计科学答案:C3、专业、性别属于以下哪项统计数据的计量尺度()。
A. 定类尺度B.定序尺度C. 定距尺度D.定比尺度答案:A4、在对工业企业的生产设备进行普查时,调查对象是()。
A . 所有工业企业 B. 每一个工业企业D. 工业企业的每台生产设备C . 工业企业的所有生产设备答案:C5、统计有三种涵义,其中()是基础、是源。
A. 统计学B. 统计资料C. 统计工作D. 统计方法答案:C6、要了解100 个学生的学习情况,则总体单位()。
A. 100 个学生B. 100 个学生的学习情况D. 每一个学生的学习情况C. 每一个学答案:C7、下列变量中属于连续变量的是()。
A. 职工人数B. 设备台数C . 学生的年龄 D. 工业企业数答案:C8、其数量随总体范围的大小而增减的指标是()。
A. 数量指标B. 质量指标D.相对指标C. 品质指标答案:A二、多项选择题1、下列哪项可以归于无限总体内。
()A. 中国目前居民B. 电脑内所有零件C. 某快递公司所有订单D. 报警电话E.美国现在的农业科研所数答案:CD2、要了解100 个工业企业的生产情况,则统计指标有()。
A. 100 个工业企业的工业总产值B. 每一个工人的月工资C. 全部工业企业D. 一个工业企业的工资总额E. 全部工业企业的劳动生产率答案:AE3、下面哪些属于变量()。
A、可变品质标志B、质量指标C、数量指标D、可变的数量标志E、某一指标数值答案:BCD4、指标是说明总体特征的,标志是说明总体单位特征的,则()。
A. 数量指标可以用数值表示B. 质量指标不能用数值表示C. 数量标志可以用数值表示D. 品质标志不能用数值表示F.品质标志和质量指标都可以用数值表示答案:ACD三、判断题1、总体性是统计研究的前提。
应用统计试题及答案一、选择题1.统计学是一门研究什么的科学?A. 数字B. 数据C. 模型D. 计算答案:B. 数据2.统计学的基本任务是什么?A. 数据分析B. 模型建立C. 结果预测D. 变量选择答案:A. 数据分析3.以下哪个是统计学的一个分支?A. 物理学B. 化学C. 经济学D. 历史学答案:C. 经济学4.统计学中,样本是指什么?A. 全体实验对象B. 全体研究对象C. 随机选取的一部分对象D. 不具备代表性的对象答案:C. 随机选取的一部分对象5.哪个指标用于衡量数据的离散程度?A. 均值B. 中位数C. 标准差D. 方差答案:D. 方差二、填空题1.描述数据离散程度的指标是__________。
答案:标准差2.样本容量为100,抽样误差为0.05,那么置信度为__________。
答案:0.953.样本的均值称为__________。
答案:样本均值4.样本容量为200,样本均值为25,样本标准差为5,总体标准差为10,那么样本的标准误差为__________。
答案:0.35365.样本的方差称为__________。
答案:样本方差三、计算题1.某城市有60%的居民喜欢看电影,现在随机调查了200名居民,其中有120人表示喜欢看电影。
根据这个调查结果,估计该城市所有居民喜欢看电影的比例,并给出95%的置信区间。
答案:样本比例 = 120/200 = 0.6标准误差 = sqrt(0.6(1-0.6)/200) = 0.0346置信区间 = 样本比例 ± 1.96 ×标准误差= 0.6 ± 1.96 × 0.0346= [0.5322, 0.6678]结论:根据这个调查结果,我们可以估计该城市所有居民喜欢看电影的比例为0.6,并且有95%的置信度认为比例在0.5322到0.6678之间。
2.某农场种植了1000棵苹果树,调查其中200棵树的产量,平均每棵树的产量为150斤,样本标准差为30斤。
应用统计学试题和答案统计学(Statistics)是研究收集、整理、描述、分析和解释数据的一门学科,广泛应用于各个领域。
本文将介绍一些应用统计学的试题以及相应的答案,旨在帮助读者加深对统计学概念和方法的理解。
一、选择题1. 下列哪个量不是描述数据分布的度量指标?A. 平均值B. 方差C. 中位数D. 相关系数答案:D2. 如果一组数据呈正态分布,那么其中约有多少比例的数据会落在1个标准差范围内?A. 34%B. 68%C. 95%D. 99.7%答案:B3. 在某班级的成绩中,小明的成绩排在全班第80%的位置,那么小明的排名在班级中大约是第几名?A. 第16名B. 第20名C. 第24名D. 第32名答案:C二、填空题1. 某产品的年销售量(单位:万件)如下:18、21、25、16、19、23、20。
请计算这组数据的平均值。
答案:平均值= (18 + 21 + 25 + 16 + 19 + 23 + 20) / 7 = 142 / 7 ≈ 20.292. 某网络游戏每天的在线人数(单位:千人)如下:12、10、9、14、15、11、13。
请计算这组数据的中位数。
答案:首先将数据排序:9、10、11、12、13、14、15。
中位数为中间值,即第4个数和第5个数的平均值,所以中位数为 (12 + 13) / 2 = 12.5三、计算题某班级学生的数学考试成绩如下:1. 请计算这组数据的标准差。
答案:首先计算平均值:(85 + 76 + 92 + 88 + 79 + 81 + 90 + 84 + 87 + 93) / 10 ≈ 85.5然后计算每个数据与平均值的差的平方,并求和:(85-85.5)^2 + (76-85.5)^2 + ... + (93-85.5)^2 ≈ 230.5标准差= √(230.5 / 10) ≈ 4.82. 请计算这组数据的相关系数。
答案:首先计算每个数据与平均值的差,并求平方:(85-85.5)^2,(76-85.5)^2,...,(93-85.5)^2然后计算每个数据与平均值的差的乘积,并求和:(85-85.5)(76-85.5),(85-85.5)(92-85.5),...,(93-85.5)(87-85.5)最后计算相关系数:相关系数 = (每个数据与平均值的差的乘积的和) / √[(每个数据与平均值的差的平方的和) × (每个数据与平均值的差的平方的和)]计算结果为相关系数≈ 0.757四、应用题某超市的顾客每天购买的商品件数如下:1. 请计算这组数据的众数。
应用统计学课后习题与参考答案第一章一、选择题1.一个统计总体(D)。
A.只能有一个标志 B.只能有一个指标C.可以有多个标志 D.可以有多个指标2.对100名职工的工资收入情况进行调查,则总体单位是(D)。
A.100名职工 B.100名职工的工资总额C.每一名职工 D.每一名职工的工资 3.某班学生统计学考试成绩分别为65分、72分、81分和87分,这4个数字是(D)。
A.指标 B.标志C.变量 D.标志值4.下列属于品质标志的是(B)。
A.工人年龄 B.工人性别C.工人体重 D.工人工资5.某工业企业的职工数、商品销售额是(C)。
A.连续变量 B.离散变量C.前者是离散变量,后者是连续变量 D.前者是连续变量,后者是离散变量 6.下面指标中,属于质量指标的是(C)。
A.全国人口数 B.国内生产总值C.劳动生产率 D.工人工资7.以下指标中属于质量指标的是(C)。
A.播种面积 B.销售量C.单位成本 D.产量8.下列各项中属于数量指标的是(B)。
A.劳动生产率 B.产量C.人口密度 D.资金利税率二、简答题1.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。
(1)这一研究的总体是什么?总体是“所有的网上购物者”。
(2)“消费者在网上购物的原因”是定类变量、定序变量还是数值型变量?分类变量。
(3)研究者所关心的参数是什么?所有的网上购物者的月平均花费。
(4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量?统计量。
(5)研究者所使用的主要是描述统计方法还是推断统计方法?推断统计方法。
2.要调查某商场销售的全部冰箱情况,试指出总体、个体是什么?试举若干品质标志、数量标志、数量指标和质量指标。
总体:该商店销售的所有冰箱。
总体单位:该商店销售的每一台冰箱。
品质标志:型号、产地、颜色。
数量标志:容量、外形尺寸;数量指标:销售量、销售额。
质量指标:不合格率、平均每天销售量、每小时电消耗量。
一、简答题(3*3=9分)1、试举例说明总体和总体单位之间的关系。
2、举例说明标志和指标之间的关系。
3、抽样调查、重点调查和典型调查这3种非全面调查的区别是什么4、季节变动的测定常用什么方法?简述其基本步骤。
5、影响抽样误差的因素有哪些?二、宏发电脑公司在全国各地有36家销售分公司,为了分析各公司的销售情况,宏发公司调查了这36家公司上个月的销售额,所得数据如表3-4所示。
(6分)表3-4 分公司销售额数据表(单位:万元)60 60 62 65 65 66 67 70 7172 73 74 75 76 76 76 76 7778 78 79 79 80 82 83 84 8486 87 88 89 89 90 91 92 92根据上面的资料进行适当分组,并编制频数分布表。
解:“销售额”是连续变量,应编制组距式频数分布表。
具体过程如下:第一步:计算全距:926032R=-=第二步:按经验公式确定组数:1 3.3lg367 K≈+≈第三步:确定组距:32/75d=≈第四步:确定组限:以60为最小组的下限,其他组限利用组距依次确定。
第五步:编制频数分布表。
如表3-8所示。
三、某厂对3个车间1季度生产情况分析如下:第1车间实际产量为190件,完成计划95%;第2车间实际产量为250件,完成计划100%;第3车间实际产量为609件,完成计划105%。
则3个车间产品产量的平均计划完成程度为:95%100%105%100%3++=。
另外,1车间产品单位成本为18元/件,2车间产品单位成本为12元/件,3车间产品单位成本为15元/件,则3个车间平均单位成本为:181215153++=元/件。
以上平均指标的计算是否正确?如不正确请说明理由并改正。
(6分)答:两种计算均不正确。
平均计划完成程度的计算,因各车间计划产值不同,不能对其进行简单平均,这样也不符合计划完成程度指标的特定含义。
正确的计算方法是:平均计划完成程度190250609101.84%1902506090.95 1.0 1.05m x m x ++===++∑∑ 平均单位成本的计算也因各车间的产量不同,不能简单相加,产量的多少对平均单位成本有直接的影响。
应用统计学一、计算题(请在以下题目中任选2题作答,每题25分,共50分)1、下表中的数据是主修信息系统专业并获得企业管理学士学位的学生,毕业后的月薪(用y 表示)和他在校学习时的总评分(用x 表示)的回归方程。
2、某一汽车装配操作线完成时间的计划均值为2.2分钟。
由于完成时间既受上一道装配操作线的影响,又影响到下一道装配操作线的生产,所以保持2.2分钟的标准是很重要的。
一个随机样本由45项组成,其完成时间的样本均值为2.39分钟,样本标准差为0.20分钟。
在0.05的显著性水平下检验操作线是否达到了2.2分钟的标准。
96.12=αμ3、设总体X 的概率密度函数为2(ln )2,0(,)0,0x x f x x μμ--⎧>=≤⎩其中μ为未知参数,nX X X ,...,,21是来自X 的样本。
(1)试求13)(+=μμg 的极大似然估计量)(g ˆμ; (2)试验证)(g ˆμ 是)(μg 的无偏估计量。
4、某商店为解决居民对某种商品的需要,调查了100户住户,得出每月每户平均需要量为10千克,样本方差为9。
若这个商店供应10000户,求最少需要准备多少这种商品,才能以95%的概率满足需要?5、根据下表中Y与X 两个变量的样本数据,建立Y与X的一元线性回归方程。
Y ijf X 5 10 15 20yf120 0 0 8 10 18140 3 4 3 0 10fx3 4 11 10 286、假定某化工原料在处理前和处理后取样得到的含脂率如下表:处理前0.140 0.138 0.143 0.142 0.144 0.137处理后0.135 0.140 0.142 0.136 0.138 0.140假定处理前后含脂率都服从正态分布,问处理后与处理前含脂率均值有无显著差异。
7、某茶叶制造商声称其生产的一种包装茶叶平均每包重量不低于150克,已知茶叶包装重量服从正态分布,现从一批包装茶叶中随机抽取100包,检验结果如下:每包重量(克) 包数(包)f x xfx-(x-)2f148—149 10 148.5 1485 -1.8 32.4149—150 20 149.5 2990 -0.8 12.8 150—151 50 150.5 7525 0.2 2.0 151—152 20 151.5 3030 1.2 28.8合计100 -- 15030 -- 76.0要求:(1)计算该样本每包重量的均值和标准差;(2)以99%的概率估计该批茶叶平均每包重量的置信区间(t0.005(99)≈2.626);(3)在ɑ=0.01的显著性水平上检验该制造商的说法是否可信(t0.01(99)≈2.364)(4)以95%的概率对这批包装茶叶达到包重150克的比例作出区间估计(Z0.025=1.96);(写出公式、计算过程,标准差及置信上、下保留3位小数)8、一种新型减肥方法自称其参加者在第一个星期平均能减去至少8磅体重.由40名使用了该种方法的个人组成一个随机样本,其减去的体重的样本均值为7磅,样本标准差为3.2磅.你对该减肥方法的结论是什么?(α=0.05,μα/2=1.96, μα=1.647)9、某地区社会商品零售额资料如下:要求:1)用最小平方法配合直线趋势方程:2)预测2005年社会商品零售额。
大学课程《应用统计学》试题及答案一、单项选择题1、作为抽样推断基础的必须是()A.模拟抽样B.随机抽样C.非随机抽样D.虚拟抽样答案:B2、下列哪项不属于抽样调查的误差()A.系统性误差B.登记性误差C.责任性误差D.偶然性误差答案:C3、以下关于样本统计量的说法中正确的是(B)。
A.唯一且已知B.不唯一但可抽样计算而可知C.不唯一也不可知D.唯一但不可知答案:B4、在抽样推断中,可以计算和控制的误差是()。
B.抽样实际误差 B.抽样标准误差D.系统性误差C.非随机误差答案:B5、二维随机变量(X,Y)服从二维正态分布,则X+Y 与X-Y 不相关的充要条件为()(A) EX EY(B) EX 2 [EX ]2 EY 2 [EY ]2(C) EX 2 EY 2(D) EX 2 [EX ]2 EY 2 [EY ]2答案:B6、样本容量也称()。
A.样本个数B.样本单位数D.样本指标数C.样本可能数目答案:B7.设随机变量X 与Y 相互独立,且X~B(16,0.5),Y 服从参数为9 的泊松分布,则D(X-2Y+3)=()A.-14B.-11C.40D.43答案:C8、在抽样方法中,最简单和最基本的一种抽样方法是()。
A.分层抽样B.等距抽样D.整群抽样C.简单随机抽样答案:C二、多项选择题1、以下属于常用抽样方法的是()A.简单随机抽样B.分层抽样C.等距抽样D.整群抽样E.PPS 抽样答案:ABCDE)2、统计量常用的分布是(A.卡方分布B.t 分布C.F 分布D.随机分布E.抽样分布答案:ABC3、影响抽样误差的因素有()。
A.总体方差2B.样本容量nC.概率保证程度D.抽样组织方式E.抽样方法答案:ABDE4、从一个总体中可以抽取许多个样本,因此(A.抽样指标的数值不是唯一确定的B.抽样指标是用来估计总体参数的C.总体指标是随机变量D.样本指标是随机变量E.样本指标称为统计量答案:ABDE三、判断题1、样本具有随机性,因为样本是根据随机原则从总体单位中抽取的。
二、单项选择题(每题1分,共10分)1.重点调查中的重点单位是指( )A.处于较好状态的单位B.体现当前工作重点的单位C.规模较大的单位D.在所要调查的数量特征上占有较大比重的单位2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。
A.各组的权数必须相等B.各组的组中值必须相等C.各组数据在各组中均匀分布D.各组的组中值都能取整数值3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分;乙班平均分为75分,标准差为7.5分。
由此可知两个班考试成绩的离散程度()A.甲班较大B.乙班较大C.两班相同D.无法作比较4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为()A.520公斤B.530公斤C.540公斤D.550公斤5.时间序列若无季节变动,则其各月(季)季节指数应为()A.100%B.400%C.120%D.1200%6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是()A.上升趋势B.下降趋势C.水平态势D.不能确定7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。
8.置信概率表达了区间估计的()A.精确性B.可靠性C.显着性D.规范性9.H0:μ=μ,选用Z统计量进行检验,接受原假设H的标准是()A.|Z|≥Zα B.|Z|<Zα/2 C.Z≥Zα/2 D.Z>-Zα10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归方程可能是正确的?()A.y=125-10xB.y=-50+8xC.y=150-20xD.y=-15-6x三、多项选择题(每题2分,共10分)1.抽样调查的特点有()。
A.抽选调查单位时必须遵循随机原则B.抽选出的单位有典型意义C.抽选出的是重点单位D.使用部分单位的指标数值去推断和估计总体的指标数值E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是()A.单位成本计划完成程度为80%B. 单位成本计划完成程度为101.05%C.没完成单位成本计划D.完成了单位成本计划E.单位成本实际比计划少降低了1个百分点3.数据离散程度的测度值中,不受极端数值影响的是()A.极差B.异众比率C.四分位差D.标准差E.离散系数4.下列指标属于时点指标的是( )A.增加人口数B.在校学生数C.利润额D.商品库存额E.银行储蓄存款余额5. 两个变量x 与y 之间完全线性相关,以下结论中正确的是( ) A.相关系数 ?r ?=1 B.相关系数 ?r ?=0 C.估计标准误差S y =0 D.估计标准误差S y =1 E.判定系数r 2=1 F.判定系数r 2=0单项选择题(每题1分,共10分) 1.D 2.C 3.A 4.A 5.A 6.B 7.A 8.B 9.B 10.B 一、多项选择题 (每题2分,共10分)1.ADE 2.BCE 3.BC 4.BDE 5.ACE(每题错1项扣1分,错2项及以上扣2分)五、简答题 (5分)加权算术平均数受哪几个因素的影响?若报告期与基期相比各组平均数没变,则总平均数的变动情况可能会怎样?请说明原因。
《应用统计学》作业考核试题及答案一、选择题(每题2分,共20分)1. 下列哪一项不是统计学的基本任务?A. 描述数据的特征B. 探索变量之间的关系C. 预测未来的趋势D. 淘汰错误的数据答案:D2. 以下哪个分布是离散型分布?A. 正态分布B. 二项分布C. 指数分布D. 卡方分布答案:B3. 在样本量为n的情况下,样本均值的期望值是?A. 0B. 1C. nD. μ(总体均值)答案:D4. 当总体方差已知时,对总体均值进行区间估计所使用的分布是?A. t分布B. F分布C. 卡方分布D. 正态分布答案:D5. 以下哪个方法用于检验两个独立样本的均值是否存在显著差异?A. t检验B. 卡方检验C. 方差分析D. 相关分析答案:A二、填空题(每题2分,共20分)1. 统计数据的类型分为______和______。
答案:定量数据,定性数据2. 在进行参数估计时,无偏性和一致性是评价估计量的两个重要标准,其中______是指估计量的期望值等于被估计的参数。
答案:无偏性3. 假设检验的基本思想是______。
答案:小概率原理4. 在进行相关分析时,皮尔逊相关系数的取值范围是______。
答案:[-1, 1]5. 当总体方差未知且样本量较小(n < 30)时,对总体均值进行区间估计所使用的分布是______。
答案:t分布三、计算题(每题10分,共30分)1. 已知某班级学生的身高数据如下(单位:cm):170,165,175,160,180,170,165,175,165,160求该班级学生身高的平均数、中位数和方差。
答案:平均数:(170 + 165 + 175 + 160 + 180 + 170 + 165 + 175 + 165 + 160) / 10 = 168.5中位数:(165 + 165) / 2 = 165方差:((170 - 168.5)^2 + (165 - 168.5)^2 + (175 - 168.5)^2 + (160 - 168.5)^2 + (180 - 168.5)^2 + (170 - 168.5)^2 + (165 - 168.5)^2 + (175 - 168.5)^2 + (165 - 168.5)^2 + (160 - 168.5)^2) / 10 ≈ 11.752. 某企业生产的产品寿命(单位:小时)服从正态分布,已知平均寿命为100小时,标准差为10小时。
六、计算题:要求写出计算公式、过程,结果保留两位小数,共4题,每题10分1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元;试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;φ2=0.954549=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计;已知:8.2,6.12==S x 0455.0=α则有:202275.02==Z Z α 平均误差=4.078.22==n S极限误差8.04.0222=⨯==∆nS Z α据公式xx ±=±∆ 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为11.8,13.4 3要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R ; 附:1080512)(=∑-=i x x i8.392512)(=∑-=i y y i 58=x 2.144=y3题 解① 计算估计的回归方程:∑∑∑∑∑--=)(221x x n y x xy n β==-⨯⨯-⨯290217900572129042430554003060=0.567 =-=∑∑nxnyββ10144.2 – 0.567×58=111.314估计的回归方程为:y=111.314+0.567x② 计算判定系数:4计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数;4题 解:① 拉氏加权产量指数= 1000001.1445.4 1.13530.0 1.08655.2111.60%45.430.055.2q p q q p q ⨯+⨯+⨯==++∑∑② 帕氏单位成本总指数=11100053.633.858.5100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==⨯+⨯+⨯∑∑ 模拟试卷二 一、填空题每小题1分,共10题1、我国人口普查的调查对象是 ,调查单位是 ;2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况;3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示;4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% ; 7、对回归系数的显着性检验,通常采用的是 t 检验;8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p<a ;1、 具有我国国籍并在我国境内长住的人指自然人、每一个人2、 频数密度 6、7.1%3、 饼图、条形 7、t4、 286.5 8、P<α5、 44% 9、16二、单项选择题在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内;每小题1分,共14分1、研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ①、应用统计学 ②、描述统计学 ③、推断统计学2、若某总体次数分布呈轻微左偏分布,则成立的有①、x > e M >o M ③、x >o M >e M3>σ,x 甲>x 乙,由此可推断②、甲组x 的代表性高于乙组 ③、甲、乙组的工作均衡性相同4、通常所说的指数是指①、个体指数 ②、动态相对数 ③、复杂现象总体综合变动的相对数5、抽样误差大小①、不可事先计算,但能控制 ②、能够控制,但不能消灭 ③、能够控制和消灭6、某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为①、算术平均数 ②、中位数 ③、几何平均数7、某企业生产属连续性生产,为了检查产品质量,在每天生产过程中每隔一小时抽取一件产品进行检验.这种抽样方式是①、简单随机抽样 ②、分层抽样 ③、等距抽样8、在假设检验中,若500:,500:10<≥μμH H ,则此检验是 ①、左侧检验 ②、右侧检验 ③、双侧检验9、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征;在乘法模型中,季节指数是以其平均数等于什么为条件而构成的 ①、100% ②、400% ③、1200%10、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为①、45 ②、40 ③、4411、若直线回归方程中的回归系数1ˆβ为负数,则 ①、r 为0 ②、r 为负数 ③、r 为正数12、当分布数列中各变量值的频率相等时 ①、该数列众数等于中位数 ②、该数列众数等于算术均值 ③、该数列无众数13、某次考试学生的考试成绩X 近似服从正态分布,()64,78~N X ,则可认为有大约68.26%的学生考试成绩分布的范围是 ①、70,80 ②、70,86 ③、62,9414、某班有40名学生,其中男女学生各占一半,则该班学生的成数方差为①、三、多项选择题:在下列备选答案中,有一个以上正确答案,请将其全部选出并把顺序号填入括号内;共7题,每题2分;1、二手数据审核的主要内容是数据的①、适用性 ②、时效性 ③、准确性2、下列命题正确的有①、样本容量与置信水平与正比 ②、样本容量与总体方差成反比 ③、样本容量与边际误差成反比 3、统计中计算数值型数据的平均数时,依据资料的不同,平均数的计算形式有 ①、算术平均数 ②、移动平均数 ③、调和平均数4、某商业企业今年与去年相比,各种商品的价格总指数为117.5%,这一结果说明①、商品零售价格平均上涨了17.5% ②、商品零售量平均上涨了17.5% ③、由于价格提高使零售额增长了17.5%5、指出下列表述中哪些肯定是错误的①、1.1,3.1100ˆ-=--=r x y②、8.0,5.2304ˆ=--=r x y ③、6.0,5180ˆ=-=r x y6、区间估计①、没有考虑抽样误差大小 ②、考虑了抽样误差大小 ③、能说明估计结论的可靠程度 7、回归分析中①、t 检验是双侧检验 ②、F 检验是检验回归方程的显着性 ③、在一元线性回归分析中,t 检验和F 检验是等价的四、判断题:判断命题的正误,对的,在题干前的括号内打√号;错的,在题干前的括号内打×号;共10题,每题1分;Y1、统计要说明现象总体的数量特征,必须要先搜集该总体中的全部个体的数据; Y2、询问调查属于定性方法,它通常围绕一个特定的主题取得有关定性资料; Y3、箱线图主要展示分组的数值型数据的分布;N 4、异众比率主要用于衡量中位数对一组数据的代表程度;N 5、统计数据的误差通常有抽样误差和非抽样误差两类; N6、若一组数据的均值是450,则所有的观测值都在450周围; Y7、移动平均不仅能消除季节变动,还能消除不规则变动; N8、右侧检验中,如果P 值<α,则拒绝H 0; Y9、 r=0说明两个变量之间不存在相关关系;Y10、方差分析是为了推断多个总体的方差是否相等而进行的假设检验; 五、简要回答下列问题共2题,每题6分; 2、根据下面的方差分析表回答有关的问题:方差分析注:试验因素A 有三个水平;⑴写出原假设及备择假设;⑵写出SST,SSA,SSE,e A T f f f ,,,MSA,MSE,n 以及P 值; ⑶判断因素A 是否显着; 答案 ⑴ 原假设 3210:μμμ==H备择假设 ()3,2,1:1=i H i μ不全等⑵ SST=0.001245 SSA=0.001053 SSE=0.000192 14=T f 2=A f 12=e f MSA=0.000527 MSE=0.000016 15=nP 值=1.34E-05⑶ F 值=32.91667>()88529.312,2=αF拒绝原假设,因素A 显着;六、计算题:要求写出计算公式、过程,结果保留两位小数,共4题,每题10分1、某小区居民共有居民500户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成;采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对;1求总体中赞成该项改革的户数比例的置信区间,置信水平为95.45%Z α/2=22如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查 设边际误差E=0.081题 解:1 n = 50 p = 32/50 =64%E=()213.58%64%13.58%50.42%,77.58%αZ ==±置信区间为即 应抽取100户进行调查;21采用指数平滑法平滑系数α=0.5预测第十周的营业额F 8=555.19;2若经过计算,平滑系数α=0.5时误差均方=3847.31,平滑系数α=0.3时误差均方=5112.92,问用哪一个平滑系数预测更合适2题 解:2平滑系数α=0.5时误差均方=3847.31<平滑系数α=0.3时误差均方=5112.92∴ 用平滑系数α=0.5预测更合适;3、某汽车生产商欲了解广告费用x 对销售量y 的影响,收集了过去12年的有关数据;通过计算得到下面的有关结果:①求A 、B 、C 的值;②销售量的变差中有多少是由于广告费用的变动引起的③销售量与广告费用之间的相关系数是多少 ④写出估计的回归方程并解释回归系数的实际意义;⑤检验线性关系的显着性 a =0.053题 解1A=SSR / 1=1422708.6 B=SSE / n-2=220158.07/10=22015.807C=MSR / MSE=1422708.6/22015.807=64.6221221422708.6086.60%1642866.67SSR RSST === 表明销售量的变差中有88.60%是由于广告费用的变动引起的;30.93R ===4估计的回归方程:回归系数1ˆ 1.420211β=表示广告费用每增加一个单位,销售量平均增加1.420211个单位;5检验线性关系的显着性:H 0 :01=β∵Significance F=2.17E-09<α=0.05∴拒绝H 0,, 线性关系显着;4、某企业三种产品的出口价及出口量资料如下:(1)计算拉氏出口量指数;2计算帕氏出口价指数4题 解:统计学试卷及答案三一、 判断题1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识;2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段; 3.统计数据误差分为抽样误差和非抽样误差;4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据 5.用来描述样本特征的概括性数字度量称为参数;6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数<众数; 7.通过散点图可以判断两个变量之间有无相关关系; 8.所有可能样本均值的数学期望等于总体均值;9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变动四种;10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一种特殊相对数; 二、单项选择题1.D 2.C 3.B 4.C 5.B 6.C 7.A 8.C 9.B 10.B 11.B 12.C 13.C 14.B 15.B1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查;在该项研究中样本是 ;A 100所中学B 20个城市C 全国的高中生D 100所中学的高中生2.一名统计学专业的学生为了完成其统计作业,在统计年鉴中找到的2005年城镇家庭的人均收入数据;这一数据属于;A 分类数据B 顺序数据C 截面数据D 时间序列数据3.某连续变量数列,其首组为50以下;又知其邻近组的组中值为75,则首组的组中值为A 24B 25C 26D 274.两组数据相比较 ;A 标准差大的离散程度也就大B 标准差大的离散程度就小C 离散系数大的离散程度也就大D 离散系数大的离散程度就小5.在下列指数中,属于质量指数的是 ;A 产量指数B 单位产品成本指数C 生产工时指数D 销售量指数6.定基增长速度与环比增长速度的关系为 ;A 定基增长速度等于相应的各个环比增长速度的算术和B 定基增长速度等于相应的各个环比增长速度的连乘积C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1D 定基增长速度等于相应的各个环比增长速度的连乘积加1或100%7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了 ;A 1.8%B 2.5%C 20%D 18%8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的 ;A 2倍B 3倍C 4倍D 5倍9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是 ;A 低度相关关系B 完全相关关系C 高度相关关系D 完全不相关10.合理施肥量与农作物亩产量之间的关系是 ;A 函数关系B 相关关系C 没有关系D 正比例关系11.在回归分析中,描述因变量y如何依赖自变量x和误差项ε的方程称为 ;A 回归方程B 回归模型C 估计的回归方程D 理论回归方程12.平均指标是用来反映一组数据分布的的指标;A 相关程度B 离散程度C 集中程度D 离差程度13.在正态总体方差已知时,在小样本条件下,总体均值在1-α置信水平下的置信区间可以写为 ;A nz x 22σα± B nt x σα2±ns z x 22α±14.在其他条件不变的情况下,降低估计的置信水平,其估计的置信区间将 ; A 变宽 B 变窄 C 保持不变 D 无法确定15.在同等条件下,重复抽样误差和不重复抽样误差相比 ; A 两者相等 B 前者大于后者 C 前者小于后者 D 无法判断三、 多项选择题1.按计量尺度不同,统计数据可分为三类即 A 时间序列数据 B 实验数据 C 分类数据 D 顺序数据 E 数值型数据 2.统计调查方案的内容包括 ;A 确定调查目的B 确定调查对象和调查单位C 设计调查项目和调查表D 调查所采用的方式和方法E 调查时间及调查组织和实施的具体细则 3.反映分类数据的图示方法包括 ;A 条形图B 直方图C 圆饼图D 累积频数分布图E 茎叶图 4.具有相关关系的有 ;A 工号和工作效率B 受教育程度与收入水平C 子女身高和父母身高D 收入水平与消费量E 人口与物价水平 5.下列属于时期数列的有 ;A 某商店各月库存数B 某商店各月的销售额C 某企业历年产品产量D 某企业某年内各季度产值E 某企业某年各月末人数 1.CDE 2. ABCDE 3.AC 4.BCD 5.BCD 五、计算分析题1.从一个正态总体中随机抽取样本容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11;求总体均值95%的置信区间;已知365.2)18(025.0=-t ;12分1.解:已知n=8,总体服从正态分布,σ未知,样本抽样分布服从t 分布 365.2)18(025.0=-t 置信下限=10-2.89=7.11 置信上限=10+2.89=12.89总体均值μ的95%的置信区间为 7.11,12.89 2.已知某企业连续5年钢产量资料如下:试根据上表资料填出表中数字;注意没有的数字划“—”,不准有空格10分3.某商场出售三种商品销售资料如下表所示:14分试计算:1三种商品销售额总指数;2三种商品的价格综合指数;3三种商品的销售量综合指数;4分析销售量和价格变动对销售额影响的绝对数和相对数;注:计算结果保留2位小数4.某地区1991—1995年个人消费支出和收入资料如下:14分要求:1计算个人收入与消费支出之间的相关系数,说明两个变量之间的关系强度;2用个人收入作自变量,消费支出作因变量,求出估计的直线回归方程,并解释回归系数的实际意义;3当个人收入为100万元时预测该地区的消费支出为多少注:计算结果保留4位小数答案:统计学试卷三标准答案一、判断题在题后的括号里正确划“√”、错误划“×”,每题1分,共计10分1.√ 2.√ 3. √ 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √五、计算分析题本题共50分2.已知某企业连续五年钢产量资料如下:3.某企业三种产品的销售资料如下表所示:相对数:商品销售额指数%84.160285004584011===∑∑qp q p K pq绝对数:元)(1734028500458400011=-=-∑∑q p q p 2价格综合指数%54.11739000458401011===∑∑q p q p3相销售量综合指数%84.1362850039000001===∑∑p q p q 4综合分析160.84%=136.84%117.54% 17340元=10500元+3840元从相对数上看:三种商品销售额报告期比基期提高了60.84%,是由于销售价格的提高是销售额提高了17.54%和由于销售量的增加使销售额提高了36.84%两因素共同影响的结果;从绝对值上看,报告期比基期多销售17340元,由于销售价格的提高而使销售额增加6840元和由于销售量的提高是销售额增加10500元两因素共同影响的结果;19872.0)345244615)(385301135(345385271125])(][)([222222=-⨯-⨯⨯-⨯=---=∑∑∑∑∑∑∑y y n x x n yx xy n r 8.09872.0>=r ,所以两个变量之间为高度相关;2设估计的值直线回归方程为 x y ∧∧∧+=10ββ∴ x y 1688.19976.20+-=∧回归系数1.1688说明当个人收入增加1个万元时,消费支出平均增加1.1688万元;3当100=x 万时,8824.951001688.19976.20y =⨯+-=∧。
应用统计基础试题及答案一、选择题1. 以下哪项不是描述数据集中趋势的统计量?A. 平均数B. 中位数C. 众数D. 方差答案:D2. 标准差和方差之间的关系是什么?A. 标准差是方差的平方根B. 方差是标准差的平方C. 标准差是方差的倒数D. 方差是标准差的立方根答案:B3. 以下哪个是衡量数据离散程度的统计量?A. 均值B. 众数C. 极差D. 所有选项都是答案:C二、填空题1. 样本均值的计算公式为 _________(用样本数据的和除以样本数量)。
答案:(样本数据的和)/n2. 一个数据集的方差是衡量数据点与 _________ 的平均差异。
答案:均值三、解答题1. 给定一组数据:10, 12, 14, 16, 18, 20。
计算这组数据的中位数。
答案:首先将数据按顺序排列:10, 12, 14, 16, 18, 20。
因为数据点数为偶数,所以中位数是中间两个数的平均值,即(14+16)/2=15。
2. 假设一家公司的员工工资数据如下:3000, 3200, 3500, 4000, 4500。
计算这组数据的平均数和标准差。
答案:平均数 = (3000 + 3200 + 3500 + 4000 + 4500) / 5 = 3750。
标准差= √[(1/5) * ( (3000-3750)^2 + (3200-3750)^2 + (3500-3750)^2 + (4000-3750)^2 + (4500-3750)^2 )] = 500。
四、判断题1. 相关系数为-1表示完全正相关。
(错误)2. 一个数据集的方差越大,其数据点越集中。
(错误)3. 样本容量增加时,样本均值的标准误差会减小。
(正确)答案:1. 错误2. 错误3. 正确五、简答题1. 描述统计学中“总体”和“样本”的区别。
答案:在统计学中,“总体”指的是研究中所关注的所有个体的集合,而“样本”是从总体中抽取的一部分个体。
总体是研究的完整对象,而样本是总体的代表性子集。
大学课程《应用统计学》试题及答案一、单项选择题1、要了解居民消费支出状况,应该采用()A.普查B.重点调查C.统计报表制度D.抽样调查答案:D2、以下哪种集中趋势的描述指标适用于任意分布类型。
()A.算术均数B.中位数C.几何均数D.众数答案:A)3、以下描述数据间结构状况较为合适的是(A.直方图B.线图C.饼图D.条线图答案:C4、如果所有标志值的频数都减少为原来的1/5 ,而标志值仍然不变,那么算术平均数()。
A.不变B.扩大到原来的5 倍C.减少为原来的1/5D.不能预测其变化答案:A5、在下列两两组合的平均指标中,两个平均数完全不受极端数值影响的是()。
A.算术平均数和中位数B.几何平均数和众数D.众数和中位数C.算术平均数和众数答案:D6、总量指标按反映总体的时间状态不同,可分为()。
A.时期指标和时点指标B.总体标志总量和总体单位总数C.数量指标和质量指标D.实物量指标、价值量指标和劳动量指标答案:A7、标志值较小的一组其权数较大时,则算术平均数()。
A.接近标志值较大的一组B.接近标志值较小的一组D.仅受标志值影响C.不受权数影响答案:B8、若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大,则()。
A.甲单位的平均数代表性比较大B.甲单位的平均数代表性比较小D.无法判断C.两单位的平均数一样大答案:B二、多项选择题1、以下关于变量数列中频率的说法中正确的是()A.各族频率之和一定大于0B.各组频率大于1D.各族频率之和等于1C.各族频率大于或等于0E.各族频率之和小于1答案:CD2、适合编制组距式分配数列的变量是()A.变异范围小的连续变量B.所有离散变量C.变异范围大的连续变量D.变异范围大的离散变量E.变异范围小的离散变量答案:CD3、统计指标的表现形式有()。
A.比重指标B.总量指标C.相对指标D.人均指标E.平均指标答案:BCE4、某单位100 名职工按工资额分为3000 元以下、3000~4000 元、4000~6000元、6000~8000 元、8000 元以上等5 个组。
应用统计学试题和答案分析1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。
试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间。
解题过程:由于样本量n=49是大样本,应用中心极限定理,样本均值的极限分布为正态分布,因此可以用正态分布对总体均值进行区间估计。
已知:x=12.6,S=2.8,α=0.0455(φ(2)=0.9545)则有:Zα/2=Z0.=1.96平均误差=2.8/√49=0.4极限误差Δ=1.96×0.4=0.784置信区间为x±Δ,代入数据得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4)。
2、从某一行业中随机抽取5家企业,所得产品产量与生产费用的数据如下:产品产量(台)xi:40、50、50、70、80;生产费用(万元)yi:130、140、145、150、156.要求:①利用最小二乘法求出估计的回归方程;②计算判定系数R2.解题过程:首先计算xi、yi、xi^2、yi^2、xiyi的和:xi=40+50+50+70+80=290yi=130+140+145+150+156=721xi^2=40^2+50^2+50^2+70^2+80^2=1080yi^2=130^2+140^2+145^2+150^2+156^2=xiyi=40×130+50×140+50×145+70×150+80×156=代入最小二乘法公式计算斜率β和截距α:n∑xiyi-∑xi∑yiβ=———————————n∑xi^2-(∑xi)^25×-290×7210.5675×1080-(290)^2α=1/n(∑yi-β∑xi)1/5(721-0.567×290)111.314因此,估计的回归方程为y=111.314+0.567x。
北京工业大学经济与管理学院2007-2008年度
第一学期期末 应用统计学
主考教师
专业: 学号: 姓名: 成绩:
1 C
2 B
3 A
4 C
5 B
6 B
7 A
8 A
9 C 10 C
一.单选题(每题2分,共20分)
1. 在对工业企业的生产设备进行普查时,调查对象是
A 所有工业企业
B 每一个工业企业
C 工业企业的所有生产设备
D 工业企业的每台生产设备
2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4
3.某连续变量数列,其末组为“500以上”。
又知其邻组的组中值为480,则末组的组中值为
A 520
B 510
C 530
D 540
4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D.
1%109%107%1053
5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分
比为
A. –5%
B. –4.76%
C. –33.3%
D. 3.85%
6.对不同年份的产品成本配合的直线方程为x y 75.1280ˆ
-=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位
7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公
斤,则该乡全部早稻亩产为
A. 520公斤
B. 530公斤
C. 540公斤
D. 550公斤
8.甲乙两个车间工人日加工零件数的均值和标准差如下:
甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大:
A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较
9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的
10. 如果相关系数r=0,则表明两个变量之间
A. 相关程度很低
B.不存在任何相关关系
C. 不存在线性相关关系
D.存在非线性相关关系
二.多选题(每题2分,共14分)
1.下列数据中属于时点数的有
A. 流动资金平均余额20万元
B. 储蓄存款余额500万元
C. 商品销售额80万元
D. 固定资产300万元
E.企业职工人数2000人
2.在数据的集中趋势的测量值中,不受极端数值影响的测度值是
A. 均值
B. 众数
C. 中位数
D. 几何平均数
E. 调和平均数
3.普查是
A 全面调查
B 非全面调查
C 一次性调查
D 专门调查
E 经常性调查
4.根据分组整理后的数据计算加权均值
A.受各组变量值和权数两个因素影响
B.假定各组数据在各组中均匀分布
C.结果不如根据原始数据计算的简单均值精确
D.实际数据呈均匀对称分布时计算结果比较准确
E.结果不受极大值和极小值影响
5. 平均差与方差或标准差相比其主要缺点是 A. 没有充分利用全部数据的信息 B. 易受极端值的影响
C. 数学处理上采用绝对值,不便于计算
D. 在数学性质上不是最优的
E. 计算结果不够准确
6.指出下列指数中的拉氏指数 ∑∑0
1
11.
q
p q
p A ∑∑1
011.
q
p q p B ∑∑0
1
0.
q
p q p C ∑∑1
10
1
1
11.
q p p p
q p D ∑∑0
1.
q
p q p E
7.若变量x 与y 之间存在完全线性相关,以下结论中正确的有
A.相关系数r=1
B.相关系数|r|=1
C.判定系数r =1
D.估计标准误差Sy=0
E.估计标准误差Sy=1
三. 填空题 (每空1分,共10分)
1. 实际中常用的统计调查方法和方式主要有 、 和统计报表等。
2. 采用组距分组时应遵循 原则,为了解决“不重”的问题,统计分组中习惯
上规定 .
3. 四分位差是说明 代表性高低的测度值,异众比率是衡量 代表性程度的
测度值.
4.影响时间数列的因素通常可以分为 、 循环波动和
不规则波动四类。
5.作为综合指数变形的加权算术平均数指数的权数是;加权调和平均数指数的权数是。
四. 简答题( 每题8分,共16分)
1. 简要说明在对两组数据差异程度进行比较时,能否直接比较两组数据的标准差.
2.企业有技术工和辅助工两类职工,而且技术工的平均工资高于辅助工。
假设本年与上年相比,各类职工的平均工资水平没有变化。
试问:全厂职工的平均工资是否会发生变化?如果会发生变化,请说明原因。
五. 计算题(共40分)
1.(12分) 某收购公司分别在甲、乙两个市场收购某种产品,其收购价格和收购额资料如
下:
试比较哪一市场的平均收购价格低,并说明原因. [些出公式,计算过程,结果保留两位小数]
2.(14)某百货公司两种商品的有关销售数据如下:
要求: (1) 计算两种商品的加权价格指数及由于价格变动而增加的销售额;
(2) 计算两种商品的加权销售量指数及由于销售量变动而增加的销售额.
[些出公式,计算过程,指数百分比保留2位小数]
3.(14分)甲、乙两个生产车间加工相同的零件,甲车间工人日加工零件的均值为150件,标准差为13.2件,乙车间工人日加工零件的分布如下;
计算乙车间日加工零件的均值及标准差,并比较甲、乙两个车间日加工零件的离散程度。
* * (写出公式、计算过程、结果保留2为小数)
* *
答案
一、单选题
1 C
2 B
3 A
4 C
5 B
6 B
7 A
8 A
9 C 10 C
二、多选题
1 ABDE
2 BC
3 ACD
4 ABCD
5 CD
6 CE
7 BD
三、填空题
1 普查,抽样调查
2 不重不漏,上组限不在内
3 中位数,众数
4 长期趋势,季节变动
5 基期变量值总量,报告其变量值总量
四、简答题
1.答题要点:
当对比的两个事物是同属性,并且平均水平相同时,可以直接比较两组数据的标准差。
在两组数据属性不同时,或平均水平不等时,需要通过计算离散系数说明其平均数的代表性强弱。
2.答题要点:
有可能发生变化,尽管报告期和基期相比,工资水平均没有变化,但其人员结构若有变化,也会导致总体工资水平的变动。
五、计算题
1、答题要点:
3.042.884003.232003.6360015200x
M M X =++=∑∑=甲 3.362.8
28003.232003.61080016800x M M
X =++=∑∑=乙 乙市场的平均价格高于甲市场的主要原因是,乙市场高价格的商品销售量大,由于销售
量结构不同导致两市场平均价格不等。
2、答题要点:
分)
(万元)(=-费额=由于价格变动增加的消分)(++=)价格指数=(3211852063%35.11112
.11401.166140661
1110111=∑∑q p p p q
p 分)
(万元)(=-消费额=由于销售量变动增加的分)(=+=)销售量指数=(3251601853%625.115160
18516012.11401.1661200110
1=∑∑q p q p p p 3、答题要点:
120f xf X =∑∑=乙 ()12.25f f x -x 2=∑∑=乙σ
所以,乙车间日常零件数离散程度小于甲车间。