4-1统计学
- 格式:doc
- 大小:60.00 KB
- 文档页数:2
1-4章共165题一、判断题题库答案(第一章)1.参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
() +2.身高和体重都属于离散变量。
() -3.学生人数、企业数和产品产量属于离散变量。
() +4.对有限总体可进行全面调查或非全面调查,对无限总体只能进行非全面调查。
() +5.总体分为有限总体和无线总体主要是为了判别在抽样中每次抽取是否独立。
() +6.样本是包含所研究的全部个体(数据)的集合,通常由所研究的一些个体组成。
() -7.总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。
() +8.截面数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。
() -9.统计学是一门应用性很强的方法论性质的学科。
() +10在检查灯泡的使用寿命时采用普查方式。
() -11.在调查某班人数时,人数是离散变量。
() +12.变量是说明现象某种特征的概念,特点是从一次观察到下一次观察结果会呈现出差别或变化。
() +13.某公司每月的销售利润是变量。
() +14. 年龄是数量标志。
() +15. 性别是数量标志。
() -16. 人口普查和工业普查是典型的普查类型。
() +17.离散变量是任意两个变量之间取值是无限的。
() -18.连续变量任意两个变量之间取值是有限的。
() -19.指标体系是由一系列反映社会经济现象数量特征的相对独立又相互联系的统计指标构成的整体。
() +(第二章)1.所有统计数据追踪其初始开源,都是来自调查或实验。
() +3.相对来说,一手数据搜集比较容易、采集成本低、搜集速度快。
() -4.实验大多是对自然现象而言的。
() +5.调查通常是对社会现象而言的。
() +6.搜集二手资料是研究生首先考虑并采用的,分析也应该首先从对二手数据的分析开始。
()+7.概率抽样不是根据随机原则抽样的。
()-8.简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。
第4章(数据的概括性度量)学习指导数据分布的特征可以从三个方面进行描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。
掌握计算、特点及其应用场合。
主要内容学习要点2.1 集中趋势的度量众数▶概念:众数。
▶众数的特点。
中位数和分位数▶概念:中位数,四分位数。
▶中位数和四分位数的特点。
▶中位数和四分位数的计算。
平均数▶概念:平均数,简单平均数,加权平均数,调和平均数,几何平均数。
▶简单平均数和加权平均数的计算。
▶用Excel中的统计函数计算平均数。
▶几何平均数的计算和应用场合。
众数、中位数和平均数的比较▶众数、中位数和平均数在分布上的关系。
▶众数、中位数和平均数的特点及应用场合。
异众比率▶概念:异众比率异众比率的计算和应用场合。
2.2离散程度的度量四分位差(内距)概念:四分位差。
四分位差的计算。
用Excel中的统计函数计算四分位差。
方差和标准差概念:极差,平均差,方差,标准差。
样本方差和标准差的计算。
用Excel计算标准差。
离散系数概念:离散系数。
离散系数的计算。
离散系数的用途。
2.3偏态与峰态的度量偏态及其测度概念:偏态,偏态系数。
用Excel计算偏态系数。
偏态系数数值的意义。
峰态及其测度概念:峰态,峰态系数。
用Excel计算峰态系数。
峰态系数数值的意义。
Excel统计函数的应用。
一)判断题1,各变量值与其平均数的离差之和为最小值。
( )2.当各组的变量值所出现的频率相等时,加权算术平均数中的权数就失去作用,因而,加权算术平均数也就等于简单算术平均数( )3.比较两总体的平均数的代表性,离散系数较小的总体,平均数代表性亦小。
( )4,平均数与次数和的乘积等于各变量值与次数乘积的和。
( )5.若两总体的平均数不同,而标准差相同,则离散系数也相同。
( )6.并非任意一个变量数列都可以计算其算术平均数、中位数和众数。
答案附在后面有一些(在题目上若要打印先把答案去掉)每单元后面都有答案第一章导论【重点】了解统计的科学涵义,明确统计学的学科性质及基本研究方法,掌握统计数据的特点及其不同类型,牢固掌握统计学的基本概念。
【难点】准确掌把数据不同类型,牢固掌握统计学的基本概念并结合实例分析。
思考题1.1什么是描述统计学、推断统计学?怎样理解描述统计学和推断统计学在探索事物数量规律性中的地位和作用?1.2统计学发展史上有哪几个主要学派?1.3“统计学”一词有哪几种含义?1.4什么是统计学?怎样理解统计学与统计数据的关系?1.5统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.6举例说明总体、样本、参数、统计量、变量这几个概念。
练习题一、单项选择题1、指出下面的数据哪一个属于分类数据()A、年龄B、工资C、汽车产量D、购买商品的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据()A、年龄B、工资C、汽车产量D、员工对企业某项制度改革措施的态度(赞成、中立、反对)3、某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入4、了解居民的消费支出情况,则()A、居民的消费支出情况是总体B、所有居民是总体C、居民的消费支出情况是总体单位D、所有居民是总体单位5、统计学研究的基本特点是()A、从数量上认识总体单位的特征和规律B、从数量上认识总体的特征和规律C、从性质上认识总体单位的特征和规律D、从性质上认识总体的特征和规律6、一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A、分类变量B、顺序变量C、数值型变量D、离散变量7、要反映我国工业企业的整体业绩水平,总体单位是()A、我国每一家工业企业B、我国所有工业企业C、我国工业企业总数D、我国工业企业的利润总额8、一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
【课程讲义】第四章差异量数【教学目标】明确差异量数是描述数据离中趋势的一种量数,它与集中量数一起描述数据的全貌;明确标准差是所有差异量数中代表性最好的;掌握各种差异量数的概念、性质、计算方法、适用条件。
【学习方法】了解、理解、计算与应用。
【重点难点】差异量数的概念及适用条件;各种差异量数的计算方法;标准分数及百分等级的概念、适用条件及计算方法。
【讲义内容】前一章讨论的集中量数反映的是一组数据的集中趋势,代表一组数据的一般水平。
但是客观事物总是千差万别的,一组数据中不是所有的数值都与一般水平相等,而是有的高些,有的低些,彼此参差不齐。
描述一组数据波动情况的量数成为差异量数。
差异量数常用来衡量集中量数的代表性程度。
差异量数越大,则集中量数的代表性越小;差异量数越小,则集中量数的代表性越大。
差异量数分为:绝对差异量数和相对差异量数绝对差异量数:标准差,方差,四分差;相对差异量数:差异系数另外,本章还讲到相对地位量数:标准分数,百分等级。
第一节标准差一、标准差的概念及适用条件(一)概念标准差是一组数据中每个数据与其算术平均数之差的平方和,除以总的数据个数,再求算术平方根。
标准差的计算公式为:n XS2)(X-∑=(4.1)X为算术平均数,n为数据的个数。
(二)适用条件1.与算术平均数配合使用,与算术平均数的适用条件相同。
即一组数据的一般水平适合用算术平均数描述时,其离散程度宜用标准差描述;2.计算其他统计量时,如差异系数,标准分数,相关系数等,需要用到标准差;3.在推论统计中,尤其是进行方差分析时,常用方差表示数据的离散程度。
二.标准差的计算方法(一)未分组资料标准差的计算方法1.基本公式法用标准差的定义n XS2)(X-∑=,计算标准差。
例1 某校四年级举行数学竞赛,一班、二班分别派九名选手参加,成绩如下表。
试比较两个班的成绩。
4-1 四年级一班九名学生竞赛成绩统计表4-2 四年级二班九名学生竞赛成绩统计表解:先求年级一班的平均数和标准差。
《统计学》测验(一)参考答案一、判断题(把正确的符号“√”或错误的符号“×”。
每小题1分,共6分)1、社会经济统计的研究对象是社会经济现象总体的各个方面。
(×)2、总体单位是标志的承担者,标志是依附于单位的。
(√)3、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
(×)4、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的。
(×)5、对全国各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。
这种调查属于非全面调查。
(√)6、为了保证总体中每一个单位在分组时不被遗漏,分组时应满足最小组的下限低于最小变量值、最大组的上限高于最大变量值这个条件。
( √ )二、单项选择题(每小题1分,共14分)1、对某市工业企业先按产品类别分组,再在此基础上按企业规模分组,这种分组形式叫做( D )。
A.简单分组 B.平行分组 C.再分组 D.复合分组2、某城市工业企业未安装设备普查,总体单位是(B )。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此( C )。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、某地区农民家庭年人均纯收入最高为2600元,最低为1000元,据此分为八组形成闭式等距数列,各组的组距为(B )。
A.300 B.200 C.1600 D.1005、指标是说明总体特征的,标志是说明总体单位特征的,所以( B )A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示6、连续调查与不连续调查的划分依据是(B )A、调查的组织形式B、调查登记的时间是否连续C、调查单位包括的范围是否全面D、调查资料的来源7、某市工业企业2005年生产经营成果年报呈报时间规定在2006年1月31日,则调查期限为(B )。
统计学词汇及符号第1部分(原创版)目录1.统计学概述2.统计学基本概念3.描述性统计4.推断性统计5.统计学符号与术语正文一、统计学概述统计学是一门研究收集、整理、分析、解释、展示数据的方法和技巧的科学。
统计学的应用广泛,涉及自然科学、社会科学和商业等多个领域。
统计学的主要目的是从数据中获取有关现象和事物的信息,以便对未来事件进行预测和决策。
二、统计学基本概念1.数据:数据是统计学的基础,是对观察到的事物或现象的记录。
数据可以是数字、文字或图像等形式。
2.样本:样本是从总体中抽取的一部分数据。
通过对样本的研究,可以推断总体的性质和规律。
3.总体:总体是指研究对象的全体。
总体可以分为参数和统计量。
4.参数:参数是描述总体性质的数值,如总体均值、方差等。
5.统计量:统计量是根据样本数据计算的用于描述总体的数值,如样本均值、样本方差等。
三、描述性统计描述性统计是通过计算各种统计量,对数据进行概括和描述的方法。
常用的描述性统计方法有:1.均值:均值是数据的平均数,用于衡量数据的中心位置。
2.中位数:中位数是将数据从小到大排序后,位于中间位置的数值。
3.众数:众数是数据中出现次数最多的数值。
4.方差:方差是数据与其均值之差的平方的平均数,用于衡量数据的离散程度。
5.标准差:标准差是方差的平方根,用于衡量数据的离散程度。
四、推断性统计推断性统计是通过样本数据,对总体参数进行估计和推断的方法。
常用的推断性统计方法有:1.假设检验:假设检验是通过比较样本统计量与总体参数的差异,对原假设进行检验的方法。
2.置信区间:置信区间是对总体参数的区间估计,表示我们对总体参数的精确度有一定的把握。
3.回归分析:回归分析是研究两个或多个变量之间关系的方法,包括线性回归、多元回归等。
五、统计学符号与术语1.符号:统计学中使用特定的符号表示各种统计量和概念,如σ表示标准差,μ表示均值等。
2.术语:统计学中使用专业的术语描述各种概念和方法,如误差、偏差、峰度等。
大学统计学考试练习题及答案41.[单选题]回归平方和SSR反映了y的总变差中( )。
A)由于x与y之间的线性关系引起的y的变化部分B)除了x对y的线性影响之外的其他因素对y的变差的影响C)由于x与y之间的非线性关系引起的y的变化部分D)由于x与y之间的函数关系引起的y的变化部分答案:A解析:2.[单选题]根据各季度商品销售额数据计算的季节指数分别为:一季度 125%,二季度70%,三季度100%,四季度105%。
受季节因素影响最大的是()A)一季度B)二季度C)三季度D)四季度答案:B解析:3.[单选题]抽样平均误差反映了样本指标与总体指标之间的( )A)实际误差B)实际误差的绝对值C)平均误差程度D)可能误差范围答案:C解析:4.[单选题]标志是( )A)说明总体特征的名称B)说明总体单位特征的名称C)说明总体单位数量特征的名称D)说明总体单位品质特征的名称答案:B解析:5.[单选题]统计对总体数量的认识是A)从总体到单位B)从单位到总体C)从定量到定性解析:6.[单选题]在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为。
( )A)8B)0.32C)2D)12.5答案:C解析:7.[单选题][]假如学生测验成绩记录为优、良、及格和不及格,为了说明全班同学测验成绩的水平高低,其集中趋势的测度:A)可以采用算数平均数B)可以采用众数或中位数C)只能采用众数D)只能采用四分位数答案:B解析:8.[单选题]简单分组与复合分组的区别在于()。
A)总体的复杂程度不同B)组数多少不同C)选择分组标志的性质不同D)选择的分组标志的数量不同答案:D解析:9.[单选题]某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。
第一组和第四组的组中值分别为( )A)750和2500B)800和2250C)800和2500D)750和2250答案:D解析:10.[单选题]在全市200万个家庭中抽取2000个家庭为样本,以推断该城市所有职工家庭的人均收入。
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.0075 12.50单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652(4)计算偏态系数和峰态系数:Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
1、确定组数: ()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=6 2、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:种是所有颐客都进入一个等待队列:另—种是顾客在三千业务窗口处列队3排等待。
第四章 差异量教学目的:1.理解全距、四分位距、百分位距、平均差、方差、标准差和差异系数等概念;2.掌握各种差异量指标的计算方法。
数据的分布特征不仅有集中趋势,还有离中趋势。
以动态的眼光,从不同的角度看,数据是向中间变动的,也是向两端变动的。
两组数据可能平均水平相同,但两组数据的分布特征并不完全相同。
【如】:比较以下两组数据 A 组:88、82、73、76、81 B 组:92、86、70、72、80两组平均数,80==B A X X 但R A =88-73=15,R B=92-70=22。
即A 组较集中,B 组较分散。
因此,我们描述一组数据的分布特征,既要描述其集中趋势,也要描述其离中趋势。
差异量:表示一组数据的离中趋势或变异程度的量称为差异量。
常用的差异量指标有全距、四分位距、百分位距、平均差、方差、标准差和差异系数。
第一节全距、四分位距、百分位距一、全距全距:是一组数距中最大值与最小值之差。
优点:意义明确,计算方便。
缺点:反响不灵敏,易受极端值影响。
二、四分位距〔一〕四分位距的的概念四分位距:是指一组按大小顺序排列的数据中间部位50%个频数距离的一半。
QD :表示四分位距; Q 3:表示第三四分位数; Q 1:表示第一四分位数。
所以:四分位距的公式又为: 〔二〕四分位数的计算方法 1、原始数据计算法〔1〕将数据由小到大进行排列;〔2〕分别求出三位四分位数〔点〕;〔3〕代入公式计算。
【例如】:有以下16个数据25、22、29、12、40、15、14、39、37、31、33、19、17、20、35、30,其中四分位距的计算方法如下:〔1〕先将原始数据从小到大排列好;12、14、15、17、*19、20、22、25、*29、30、31、33、*35、37、39、40Q1=18 Md=27 Q3=34〔2〕求出Q1、Md、Q3;〔3〕将Q1、Md、Q3的得数代入公式〔4.1〕。
2、频数分布表计算法利用频数分布表计算公式为:关键是分别计算P75和P25,百分位数计算方法掌握了,这里的计算就不会有什么问题。
第 1 页 共 2 页
考
生答题不得过此··················密
····························封
·························线
···························· 专
业
年
级
班级 姓名
学号 ··················装
····························订·························线···························· 1、17世纪中叶的政治算术学派被看作是统计学派的开端,其主要代表人物是( )。
A .威廉.配第 B.恩格尔 C. 约翰.格朗特 D. 凯特勒 2、在测度集中趋势时,受极端值影响最大的测度值是( ) A .平均数 B.众数 C .中位数 D .都相同 3、比较不同总体或样本数据的离散程度,最适合的测度值是( ) A .异众比例 B. 四分位差 C. 方差 D .变异系数 4、下列各项中属于时期指标的是( ) A.职工人数 B.工资总额 C.产品库存量 D.设备台数 5、从产品生产线上每隔10分钟抽取一件产品进行质量检验。
推断全天产品的合格率时,其抽样方式可看作( ) A .简单随机抽样 B .整群抽样 C.分层抽样 D.等距抽样 6、若某单位3-6月月末的职工人数分别为:600、615、630、660人,则其二季度的平均人数为( )。
A .625 B.626 C.635 D.630 7、若今年比去年的环比发展速度为112%,去年比前年的环比发展速度为103%,那么今年比前年的平均发展速度为 ( ) A .109.0% B .107.4% C.108.9% D.115.4% 8、一组数据中,出现次数最多的那个测度值是( ) A .众数 B .中位数 C .算术平均数 D .几何平均数 9、某连续变量数列,其末组为500以上,又知其邻组的组中值为480,则末组的组中值为( ) A.520 B.510 C.530 D.540 10、如果一组数据其众数M 0、中位数M e 和均值x 之间的数量关系为:x <M e <M 0,那么对此组数据分布的分析,下面哪个结论正确( )
A .对称分布
B .左偏分布
C .右偏分布
D .尖峰分布 11、数值型数据分组时,若某标志值刚好等于相邻两组上下限数值时( ) A .将此数值归入上限所在组 B.将此数值归入下限所在组 C. 归入这两组中任意一组均可 D.另立一组 12、对占全国钢产量80%以上的几个大型钢企业进行钢产量调查,这种调查方法是( ) A 、抽样调查 B 、典型调查 C 、重点调查 D 、普查 13、两变量之间的相关系数r=0.90,通常情况下,根据经验知两变量之间的线性关系为( ) A .高度正相关 B .高度负相关 C .不相关 D .低度正相关 14、假设检验中,第二类错误的概率 表示( )。
A.原假设为真时接受原假设的概率 B.原假设为真时拒绝原假设的概率 C.原假设不真时接受原假设的概率 D.原假设不真时拒绝原假设的概率 15、第五次人口普查结果表明,我国人口男女比例为106:100,该指标属于( ) A. 结构相对数 B.比较相对数 C. 比例相对数 D.强度相对数 二、多项选择题(每小题2分,共10分) 1、下列关系中,存在负相关关系有( ) A. 机床使用年限和维修费用 B.人均储蓄额与人均消费额 C. 商品价格与销售量 D.人均消费额与人均可支配收入 E. 货币购买力指数与居民消费价格指数 2、统计指标体系设计的原则是 ( )
A .科学性 B.目的性 C. 整体性 D.统一性 E.可比性
3、评价估计量是否优良的常用标准有( )。
A.无偏性
B.有效性
C.准确性
D.一致性
E.随机性 4、“统计”一词的涵义包括( )
A .统计设计
B .统计科学
C .统计资料
D .统计工作
E .统计组织
5、影响抽样误差的因素有( ) A.样本单位数 B.抽样方法 C.抽样组织形式
D.总体单位标志值变异程度
E.调查误差。