第二章 统计数据收集与整理
- 格式:pdf
- 大小:290.40 KB
- 文档页数:22
第⼆章统计数据的搜集与整理第⼆章统计数据的搜集与整理(⼀)教学⽬的通过本章的学习,了解统计数据搜集与整理的基本理论与⽅法,掌握各种⽅法的特性。
(⼆)基本要求要求灵活运⽤各种数据搜集的⽅式⽅法,并对所得数据进⾏加⼯整理,为以后各章学习打下基础。
(三)教学要点1、数据搜集的⽅式⽅法;2、统计调查⽅案的设计;3、统计分组;4、变量数列的编制;5、统计数据的显⽰。
(四)教学时数9课时(五)教学内容本章共分四节:第⼀节数据的计量与类型⼀、数据的计量尺度在计量学的⼀般分类⽅法中,依据对事物计量的精确程度,可将所采⽤的计量尺度由低级到⾼级、由粗略到精确分为四个层次,即名类尺度、顺序尺度、区间尺度和⽐尺度。
1.定类尺度定类尺度(Nominal scale,亦称分类尺度、列名尺度等)是这样⼀种品质标志,按照它可对研究客体进⾏平⾏的分类或分组,使同类同质,异类异质。
例如,按照性别将⼈⼝分为男、⼥两类;按照经济性质将企业分为国有、集体、私营、混合制企业等。
这⾥的“性别”和“经济性质”就是两种名类尺度。
名类尺度是最粗略、计量层次最低的计量尺度,利⽤它只可测度事物之间的类别差,⽽不能了解各类之间的其他差别。
名类尺度计量的结果表现为某种类别,但为了便于统计处理,例如为了计算和识别,也可⽤不同数字或编码表⽰不同类别。
⽐如⽤1表⽰男,0表⽰⼥;⽤1表⽰国有企业,2表⽰集体企业,3表⽰私营企业,等等。
这些数字只是不同类别的代码,决不意味着它区分了⼤⼩,更不能进⾏任何数学运算。
名类尺度能对事物做最基本的测度,是其他计量尺度的基础。
2.定序尺度定序尺度(Ordinal scale,亦称序数尺度、顺位尺度等)是这样⼀种品质标志,利⽤它不仅能将事物分成不同的类别,还可确定这些类别的等级差别或序列差别。
例如“产品等级”就是⼀种测度产品质量好坏的顺序尺度,它可将产品分为⼀等品、⼆等品、三等品、次品等;“考试成绩”也是⼀种顺序尺度,它可将成绩分为优、良、中、及格、不及格等;“对某⼀事物的态度”作为⼀种顺序尺度,可将⼈们的态度分为⾮常同意、同意、保持中⽴、不同意、⾮常不同意,等等。
第二章统计数据的收集、整理与显示2.1统计数据的收集一、统计数据的来源1、直接来源(原始来源):分为实验和统计调查(直接观察、报告、采访、登记)2、间接来源(二手资料):出版物、网络二、统计调查组织方式1、分类①按调查单位的范围大小分:全面调查和非全面调查②按调查时间是否连续分:经常性调查和一次性调查③按调查组织方式分:统计报表和专门调查。
其中专门调查又分为普查、重点调查、典型调查、抽样调查2、统计报表制度:按照国家统一规定的各项要求,自下而上地定期向国家和主管部门报送基本统计资料的一种报告制度①优点:能保证统计资料的全面性和连续性;能保证统计资料的统一性和及时性;能满足各级部门对统计资料的需要②缺点:统计报表过多会增加基层负担;有可能由于虚假瞒报而影响统计资料质量3、普查:是指国家为详尽了解某项重要的国情国力而专门组织的一次性全面调查(主要用于搜集时点资料)①作用:可以为抽样调查提供抽样框;可以收集统计报表所不能提供的反映重大国情国力的基本统计信息②局限:由于需要大量的人力、物力、财力,不宜经常进行4、重点调查:是指为了解总体基本情况,在调查对象中只选择一部分重点单位进行调查的一种非全面调查组织方式。
(这些单位数目不多,但其标志值在总体标志总量中占有较大比重,能反映总体的基本情况)①作用:能以较少的投入和较快的速度取得总体基本情况及变动趋势的资料②局限:只适用于客观存在重点单位的情况5、典型调查:是指在对调查对象有一定了解的基础上,有意识的选择少数典型单位进行调查的一种非全面调查方式。
(指在数量表现上具有普遍意义呵呵代表性的总体单位,可以用来推断总体的数量)①作用:一定条件下能估计总体指标数值;可以用来研究新生事物②缺陷:不能确定推断的把握程度,无法计算和控制推断误差6、抽样调查:是指按照随机原则从调查对象中抽取一部分样本单位进行调查,再用样本资料推断把握总体的数量特征的一种非全面调查组织方式。
第二章
第二章 统计数据的初步整理
教学要点: 第一节 统计调查方案设计 第二节 统计分组 第三节 统计图表
第二章
第一节 统计调查方案设计
一、统计调查的组织形式 二、统计数据搜集的方法 三、统计调查方案设计 四、统计调查的要求
第二章
一 统 计 调 查 组 织 形 式
全面调查
(1)普查(general survey) (2)统计报表(Statistical report forms)
非全面调查
(1)抽样调查(Sampling survey) (2)重点调查(Key-point investigation) (3)典型调查(Model survey)
划类选典式(representation) 解剖麻雀式(typical survey)
第二章
二 统 计 数 据 搜 集 的 方 法
数据搜集方法有询问调查和观察实验两大类。
询问调查 (1)访问调查(如 Delghi法) (2)邮寄调查 (3)电话调查 (4)电脑、报刊等 媒体辅助调查 (5)座谈会 (6)个别深度访问 观察与实验 (1)观察法 调查人员边观察边 记录以收集信息的 方法。
(2)实验法 在设定的条件下, 对调查对象进行实 验取得所需资料的 方法。
第二章
三 统 计 调 查 方 案 设 计
1.确定调查目的 2.确定调查对象和调查单位 3.确定调查纲要及指标体系,统一 指标口径 4.确定调查项目拟定调查表
项目少而精,规范,以数字信息为主。
单一表 一览表
5.确定调查时间和调查期限 6.制定调查的组织实施计划
第二章
四 统 计 调 查 的 要 求
准确性 及时性 完整性
第二章
第二节 统计数据分组
Statistical of divided groups
分组作用 分组方法 有关分组的基本概念 分组的基本步骤
第二章
一
分组作用
(1)划分研究对象的类型(类型分组) type of divided groups (2)研究总体结构及比例(结构分组) structure of divided groups (3)研究现象间依存关系(分析分组) analyze of divided groups
目的:对获取的相关资料按一定标志分成若干类型的组,使 组内差异尽量小,而组与组之间差异则较为明显,从而使 大量无序数据变为有序。
第二章
二 分组类型和方法
简单分组 复合分组 通过主—从 标志反映层 次性类型、 结构等主从 关系入手, 分层次分 组,形成分 组体系。
单项式分组(单一组) 组距式分组(区间组) (1)开口组:全距两端有极端 值,数据不多较分散 (2)比口组:分布不分散,无极 端值且第一组及最末组均有上下 限 (3)等距组:数据分布均匀,组 距=全距/组数 (4)异距组:数据分布不均匀。
三 分 组 的 基 本 步 骤
据出现的次数。
(2)频率 freuence:调查数据出现的次数占总调查数据单位数的 比例。
与概率不同,概率表达的是某个调查数据出现的可能性大 小。
(3)组距 class interval: 每组下限与上限之间的距离为组距, 有 等距数列和不等距(异距)数列之分。
(4)全距 total interval:也称作极差,是调查数据中的最大值与 最小值之差。
(5)组限 class limit: 每组区间两端的极值称组限,如果各组的 组限都齐全,成为闭口组;组限不齐全,即最小组缺下限或最大 组缺上限,称为开口组。
(6)组中值 mid-value class-mark也称组标,是各组变量值的代 表值,通常在均匀分布或对称分布中为上下限的中点,即组中值 =(上限+下限)/2。
在按几何级差分布的依据分组中,组中值为 各组上下限的几何重点,也即对数意义上的组中值,或者。
对于开口组中值的计算方式可以利用如下公式: 无下限组的组中值=,无上限组的组中值=
(1)(1)频数 frequent number of numbers:调查数据中某个数
第二章
第二章
四 分 组 的 基 本 步 骤
(1)计算全距 R=Max-Min (2)观察全体,选择分组方法
离散型变量,上下限不重合。
连续性变量,上下限重合。
(3)计算组距 经验公式法:根据全距除以组距即可得到分组体 系。
特吉斯经验公式:如数据呈单峰分布,则可采用美 国统计学家斯特吉斯在分组时的理论公式: 组数=1+3.322 logN (N为数据个数) 组数=全距÷(1+3.322 logN) 上限=最小值+组距/2, 下限=最小值-组距/2 (4)计算各组频数,频率累计频率积累及频数,反 映分布特征。
通常选用组中值或组的平均值来反映分布情况。
第二章
例表
某工地砌筑工程与工人数
100 80 比率 60 40 20 0 1 10 2 3 日产量 比率(%) 累积比率 4 33.3 23.3 66.6 33.3 20.1 13.3 5 86.7 100
日产量 工人数 比率(%) 20 21 22 23 24 3 7 10 6 4 10.0 23.3 33.3 20.1 13.3
合计
30
100.0
第二章
第三节 统计数据图表
统计表 统计图
第二章
统计表
统计表 statistical table
单一表 single table
分组表 group table
复合表 complex table
统计图
第二章
一图解千文。
Excel 中给出的有14种图表形式。
①点状图像:点状图 Point,彩点图 DeltaPoint,三维点图 Point3D,形象点图 ImagePoint; ②线状图像:折线图 Line,多条折线图 Lines,8条折线图 Lines8,箭头图 Arrows,贝塞尔曲线图 Bezier,等高线图 Contour,线点图 LinePoint; ③面状图像:三角表面图 TriangleSurf,金字塔图 Pyramid,瀑布 图 WaterFall,高低图 HighLow,区域图 Area,形状图 Shape; ④柱状图像,直方图 Bar,三维柱图 Bar3D,连柱图 BarJoin,形 象柱图 ImageBar,容积图 Volume,蜡烛图 Candle,误差柱图 ErrorBar,误差图 Errors,漏斗图 Funnel,柱图 Histogram; ⑤粱状图像:进度图 Gantt,横条图 HorizBar; ⑥圆形图像:饼图 Pie,圆环图 Donut,气泡图 Bubble,时钟图 Clock; ⑦方形图像:箱点图 BoxPlot,箱点横图 BoxPlotH,日历图 Calenda,彩格图 ColorGrid; ⑧网状图像:雷达图 Radar,极地图 Polar,风向频率图 WindRose,史密斯图 Smith。
第二章
散点图(Scatter)
60 50 货运周转量 40 30 20 10 0 0 20 40 国内生产总值 60 80 系列1
第二章
饼状图( Pie )
第二章
直方图(Histogram )
第二章
扇形图 ( pie diagram—圆形结构图)
13% 10% 15% 21%
7% 8% 33% 非常不满意 不满意 一般 满意 非常满意
36% 31% 26%
第二章
曲线图
累积频率分布图(%) 100.00 90.00 80.00 70.00 60.00 50.00 40.00 30.00 20.00 10.00 0.00 100 90 63.3
23.3 10 80—90 90—100 100—110 110—120 120—130 累积频率(%)
频数(人)
线状图(line,折线图)
16 14 12 10 8 6 4 2 0
零件数(个)
10 5- 11 0 11 0- 11 5 11 5- 12 0 12 0- 12 5 12 5- 13 0 13 0- 13 5 13 5- 14 0
频数(人)
第二章
第二章
条形图 ( bar )
2007年关中地区人口分布对比(万人) 铜川 渭南 宝鸡 杨凌 咸阳 西安 0 200 400 600 14.14 494.3 716 800 374.3 84.4 534
。