当前位置:文档之家› 统计学大作业

统计学大作业

宁波大红鹰学院

工商管理分院

《应用统计学》实验(践)报告

专业:工商管理专业

班级:

学生姓名:

同组人员:

任课老师:黄涛

2017年6月12日

目录

实验(一) SPSS安装 (2)

实验(二)统计数据的搜集与整理 (6)

实验(三)统计数据的图表描述 (9)

实验四统计数据的度量 (16)

实验五统计抽样与参数估计 (19)

实验六相关与回归分析 (24)

实验七统计数据的动态分析 (33)

实验八统计指数分析 (35)

实验(一) SPSS安装

一、实验名称:SPSS安装

二、实验目的:学会安装spss软件及有关操作

三、实验步骤:SPSS的安装和启动

在启动SPSS软件之前,需要先在计算机上进行安装。

其安装方法主要有两种:一是直接使用SPSS安装光盘进行

安装;二是通过网络下载SPSS安装程序进行安装。本小节使用第二种方法详细介绍SPSS的安装步骤(以IBM SPSS 19.0为例)。

1.打开计算机,找到已经下载到计算机上的SPSS安装程序。如图一

图一

2.单击该图标,按照顺序下去,直到出现如下界面,单击“下一步”,则弹出对话框;个人用户选择第一个“单个用户许可证”,如果图二所示。

图二

3.单击“下一步”,切换到用户协议对话框。在该对话框中接受用户协议,然后单击“下一步”,如图三所示。

图三

4.单击“下一步”,显示客户信息。在该对话框中填写好用户姓名与单位,然后单击“下一步”,如图四所示。

图四

5.单击“下一步”,语言选择。选择“英语”,然后单击“下一步”,如图五所示。

图五

6.在弹出的对话框中是选择文件安装位置,如图六所示。在该对话框中单击“更改”,可调整软件的安装位置。

图七

7.在选择文件安装对话框中单击“下一步”,在弹出的对话框中单击“安装”即可,如图七所示。

图七

8.此时则弹出正在安装的界面,如图八所示。

图八

9.在以上安装程序完后,则弹出授权许可证的对话框。把框中的勾去掉,单击“确定”,如图九所示。

图九

10.此时则弹出产品授权对话框,选择“启用以用于临时使用”按钮,单击“下一步”,如图十所示。

图十

11.单击“”按钮,选择文件“temp.txt”,再单击“打开”,如图十一所示。

图十一

12.单击“下一步”,弹出临时使用期已启用对话框,单击“完成”。如图十二所示。

图十二13.再找到已经下载到计算机上的SPSS安装程序的补丁,双击该程序,单击“下一步”,如图十三所示。

图十三

14.确认好安装文件夹路径,单击“下一步”,便开始安装,如图十四所示。

图十四

安装完成后,便可以启动SPSS软件了。启动SPSS软件的方法主要有以下三种:

(1)单击“开始”菜单中的IBM SPSS 19.0命令,

如图十五所示。

图十五

(2)双击.sav格式的文件,因为SPSS的默认文件格

式为.sav。

(3)从安装程序直接启动。如果在桌面创建了SPSS

快捷菜单,可双击桌面上的快速启动图标四、实验后记(必写)

实验(二)统计数据的搜集与整理

一、实验名称:统计数据的搜集与整理

二、实验内容:上网搜集反映我国历年国民经济发展情况的主要统计数据(包括:国内生产总值、固定资产投资总额、进出口额、社会商品零售总额、能源消耗量、年末人口总数、人均可支配收入、铁路货运量、居民消费价格指数、人口出生率、城镇人口数和农村人口数)。

三、实验步骤

1、请说出上述统计指标的含义。

国内生产总值:是指一个国家或者地区所有常驻单位在一定时期内生产的所有最终产品和劳务的市场价值。GDP是国民经济核算的核心指标,也是衡量一个国家或地区总体经济状况重要指标。

固定资产投资总额:以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。

进出口额:指实际进出我国国境的货物总金额。进出口总额用以观察一个国家在对外贸易方面的总规模。我国规定出口货物按离岸价格统计,进口货物按到岸价格统计。

社会商品零售总额:指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农业居民零售额的总和。

能源消耗量:指能源使用单位在报告期内实际消费的一次能源二次能源的数量。

年末人口总数:是指某年12月31日24时的人口数,或者是下年l月1日零时的人口数,即下年的年初人口数。年末人口数或下年年初人口数通过人口经常登记或抽样调查推算的办法取得,也可以用(上年年末人口数+本年出生人数-本年死亡人数+本年迁入人数-本年迁出人数)求得。

人均可支配收入:指居民家庭全部收入中,可用于支付生活费用的收入。人均可支配收入是按家庭全部人口计算的平均每人生活费收入。它包括居民家庭所有成员的工资、奖金、津贴、洗理费、书报费、交通补贴、价格补贴、独生子女费以及离、退休者收入、赡养赠送收入、出售财物收入、利息收入、稿费、讲课费等全部经常和一次性收入,但应扣除赡养、赠送支出、记帐补贴、个种税金(个人所得税、车船使用税等)

铁路货运量:货运量是指设计线(或区段)一年内单方向需要运输的货物吨数。

居民消费价格指数:CPI(Consumer Price Index),即居民消费价格指数,指在反映一定时期内居民所消费商品及服务项目的价格水平变动趋势和变动程度。居民消费价格水平的变动率在一定程度上反映了通货膨胀(或紧缩)的程度。居民消费价格指数是度量居民生活消费品和服务价格水平随着时间变动的相对数,综合反映居民购买的生活消费品和服务价格水平的变动情况。是进行国民经济核算、宏观经济分析和预测、实施价格总水平调控的一项重要指标,并且世界各国一般用消费价格指数作为测定通货膨胀的主要指标。人口出生率:指某地在一个时期内(通常指一年)出生人数与平均人口之比,它反映了人口的出生水平,一般用千分数表示。

城镇人口数:是指居住于城市、集镇的人口,主要依据人群的居住地和所从事的产业进行归类。“城镇人口”的特点所

从事的产业为非农业生产性产业(自然经济)为主的人群及其家庭;一般认为城镇人口占有率的高低反应出一个地区的工业化、城镇化或城市化水平。在中国大陆,“城镇人口”自1990年代前后在统计学领域渐渐使用较多的用语,以代替之前非农业人口。农村人口数:包括农业人口和一部分非农业人口。中国现行统计制度规定:农村人口包括:①国营农场户数中的常住人口。②乡村户数中的常住人口。其中包括常住农村的外出民工、工厂临时工、户口在农村的外出学生,但不包括户口在农村的国家职工。

2、请将相关数据整理至一张表格中

2003-2013年数据表:

2、相关数据表格

3、请指出所搜集到的各组数据有何特征和规律。

答:逐年上涨的趋势,每年的数据都在不断地攀升,经济不断发展。

4、投资、出口、内需是拉动GDP增长的三驾马车,从数据中能否看出谁的贡献最大?为什么?

答:从数据中看出是投资的贡献最大。原因从数据观察看出投资的增长量最大,且增长速度最快,影响力最大。今后我国应大力发展内需,使投资、出口、内需三者达到均衡。

5、GDP与人均可支配收入、铁路货运量存在什么关系?

答:人均可支配收入越高铁路货运量也越大。

6.请计算我国历年的城镇化率。

四、实验后记(必写)

出现的错误与解决(概述)在实验过程当中经常会忘记勾选显示正态图,导致后面要再去修改,非常浪费时间。

希望

希望能够熟练掌握spss软件,不用看着视频来做,操作起来更方便、更快。

实验(三)统计数据的图表描述

习题2.1结果分析

描述性统计表

从表2.1中可以读出以下信息:有效样本为50个,没有缺失值。学生的平均体重为62.782,标准差为6.7214,最大值是76.2,最小值是48.3等等。

频数分布

表2.2给出了学生体重的频数分布。该表中从左到右分别是有效样本值、频数、频数占总数的百分比、有效数占总数的百分比、累计百分比。

表2.1 描述

表2.2 频

(1)带正态曲线的直方图

图2.1是学生体重的直方图,从图中可以看出学生体重近似服从正态分布,而且集中趋势是集中在63。

图 2.1 正态曲

习题2.2结果分析

如表2.3所示,样本个数为50个,极差为27,最小值是154,最大值是181,均值为169.72,均值的标准误是0.989,标准差是6.993-0.446,峰度系数是-0.760。

表 2.3 描述

描述性统计分析有一个特色是,它可以将原始数据转换成标准化的取值并以变量的形式存入当前的数据库。如图2.2所示。

习题2.3分析结果

(1) 数据记录统计表

从表2.4中可以读出以下信息:粤东气温组有12个样本,粤西气温组也是12个样本,都没有缺失值记录。

案例处理摘要

地区

案例

有效

缺失

合计

N

百分比 N

百分比

N

百分比 降雨量

粤东 12 100.0% 0 .0% 12 100.0% 粤西

12

100.0%

0 .0%

12 100.0%

(2) 城市分组的各组描述统计量

从表2.5中可以看到各组的描述统计量,包括均值、标准差、最大值、最小值、极差等。

(3) M 估计量

M 估计量可以用来判别数据中有无明显异常值。Spss 输出的M 估计量有4种,分别是Huber 、Tukey 、Hampel 、Andrews 提出来的,其区别似乎使用的权重不同。从表2.6中可以看到4种不同权重下的最大似然数。容易发现,粤东和粤西的降雨量的4个M 估计量离平均数和中位数都很近,这就说明数据中应该没有明显的异常值。

(4) 分组后的百分位数

百分位数是一种位置指标,它将一组观察值分为两部分。比如百分位数5代表的值就表示理论上有5%的观察值比该值小,有95%的观察值比该值大。表2.7中可以看出分组后的各个百分位数。

百分位数

地区 百分位数

5 10 25 50 75 90 95

加权平均(定义 1) 降雨量

粤东 1369.100 1381.070 1409.625 1499.450 1859.325 2178.100 . 粤西

1222.600

1235.740

1377.450 1922.800 2304.375 2391.200

.

Tukey 的枢纽 降雨量 粤东 1409.650 1499.450 1770.750 粤西

1382.500

1922.800

2294.250

(5) 最大值最小值(TOP5)

表2.8给出了分组后的5

(6) 正态分布的检验结果

如表2.9所示,两组的显著性都很低,正态分布特征不明显。

正态性检验

地区

Kolmogorov-Smirnov a

Shapiro-Wilk

统计量

df

Sig. 统计量

df

Sig. 降雨量

粤东 .302 12 .003 .775 12 .005 粤西

.224

12

.098

.849

12

.036

a. Lilliefors 显著水平修正

(7) 直方图

两个地区降雨量的直方图如图2.3所示,容易发现两组各年降雨量都无明显集中趋势。

(8) 茎叶图

图2.4所示是两组数据的茎叶图。从左往右分别是频数、茎、叶三部分。其中茎代表数值的整数部分,叶代表数值的小数部分。每行的茎叶构成的数字再乘以茎宽,则为实际数据的近似值。

(9) 正态概率图

图2.5是粤东和粤西降雨量的正态概率图,其中的斜线表示正态分布的标准线,点表示实际数据的分布,各点越接近于直线,则数据的分布越接近于正态分布。本例中两个地区的分布拟合度都不是很好,说明正态分布并不明显。

(10)去除掉趋势的正态概率图

图2.6是去除掉趋势的正态概率图。去掉趋势的正态概率图反映的是按正态分布计算的理论值和实际值之差(也就是残差)的分布情况。如果数据从正态分布,数据应该均与的分布在中间标准线的上下。本例中,数据点的分布不仅不均匀,还存在着一定的波动趋势,所以正态分布特征不明显。

(11)箱图

图2.7给出了粤东降雨量和粤西降雨量的箱图。其中箱分为四分位间距的范围。所谓四分位间距救市百分位数75代表的值减去百分位数25代表的值。中间的粗线表示平均数,上面和下面的细线分别表示最大值和最小值。

习题2.4结果分析

本例的数据信息

如表2.10所示,样本数1799,没有缺失值。

表2.10

案例处理摘要

案例

有效的缺失合计

N 百分比N 百分比N 百分比

学校 * 升学1799 100.0% 0 .0% 1799 100.0%

(1)列联表

如表2.11所示,X中学的升学率是97.5%

(2)卡方检验结果

如表2.12所示,卡方检验的结果是不显著的,说明两个学校的升学率之间差别不明显。

表2.12

图2.8

频数分布图分组下的频数分布如图2.8所示。

实验四统计数据的度量

一、实验名称:统计数据的度量

二、实验目的:

在掌握相对指标和平均指标基本理论和方法的基础上,能运用SPSS对统计数据进行描述性分析。通过训练,了解统计方法的实际应用。从而提高统计方法实际应用的技能水平。

表A 公司2011年的主要业务数据

表B 公司200名业务员月销售额统计数据(单位:千元)

14.3 20.4 24.6 35.3 34.2 30.5 30.4 12.6 17.6 15.4 42.3 18.3 19.5 20.0 22.1 24.3 17.2 19.2 20.4 22.5 20.6

19.7

21.6

22.6

21.6

19.7

18.0

17.6

16.5

15.6

三、实验步骤:

1、对公司2011年主要业务数据(表A )进行结构分析。并作简要文字说明

企业财产险

家庭财产险

机动车辆险

船舶险

货物运输险

卫星及核能险

建筑、安装工

程险

其他险

合计

有效333333333缺失

00

710164.633355848.9667

1040217.6375191.3667

552790.67930.7333

6502715364.0333

2522534.967649303.253260.91202605.3

79410.9540278.68038.97657515234.12624706.9149042.18250.11716113646.814373.81249.21849.71746.4207319.1593896.736148944.24621

952303.969

59547.03013

544780.572

6628.11199

58267.96786

13683.0627

2265858.233

149042.18250.11716113646.814373.81249.21849.71746.4207319.11332148.6106035.91900887132516.41103719.414504.1116656.329111.64735578.92130493.9

167546.9

3120653

225574.1

1658371.8

23792.2

195081

46092.1

7567604.9

标准差极小值极大值和

统计量

N

均值中值众数

保险项目企业财产险家庭财产险机动车辆险船舶险货物运输险卫星及核能险建筑、安装工程险其他险保险金额(万元)71.89% 3.98%8.28% 6.58% 6.93%0.60%0.89%0.84%保费收入(万元)28.13% 2.24%40.14% 2.80%23.31%0.31% 2.46%0.61%赔款及付给(万元)24.74% 2.03%45.82% 3.03%20.58%0.31% 2.92%0.58%

该公司2011年度保险项目保险金额第一的是企财产险高达149042.1(万元)占总保险金额的71.89%,第二的为机动车辆险,金额为17161(万元),占总金额的8.28%。两者所占份额相差巨大。

保费收入第一的是机动车辆险价值为1900886.6(万元)占总保险收入的40.14%;保险收入第二是企业财产险为1332148.6(万元),占总保险收入的28.13%。

保险项目赔款及付给第一的是机动车辆险为1202605.3(万元)占总赔款付给的45.82%;第二的是企业财产险为649303.29(万元),占总赔款付给的24.74%

综上所述,企业财产险和车辆险的市场份额多于其他。 2、对(表B )数据进行编码、录入,建立SPSS 数据文件。

3、利用SPSS ,计算有关统计量(均值、中位数、众数、四分位数、极差、四分位差、标准差、偏度和峰

度),并生成直方图和箱线图。

均值:21.8950、中位数:19.5250、众数:17.25、四分位数:25%的数:17.0025、50%的数:19.5250、75%的数:25.8150、极差:35.99、四分位差:8.8125、标准差:7.66122、偏度:0.883、峰度:

0.260

四、实验后记(必写)

实验五统计抽样与参数估计

一、实验名称:统计抽样与参数估计

二、实验内容:

通过实训,掌握利用SPSS统计软件进行区间估计的基本步骤。

第一题:背景资料:有几位大学生组成的调查组,为了解他们所在地区居民的收入情况,作为匡算某种商品需求量的依据之一,从该地区230万居民中随机抽取了500人进行调查,取得有关收入数据如表所示。样本数据单位:万元

第二题:背景资料:近期有多家超市接到顾客投诉,反映国内某品牌直饮净水器的使用寿命太短。国家规定该规格直饮净水器的平均使用寿命不低于1200升。为了检验该产品的质量,超市随机抽取100件该

统计学大作业

宁波大红鹰学院 工商管理分院 《应用统计学》实验(践)报告 专业:工商管理专业 班级: 学生姓名: 同组人员: 无 任课老师:黄涛 2017年6月12日

目录 实验(一) SPSS安装 (2) 实验(二)统计数据的搜集与整理 (6) 实验(三)统计数据的图表描述 (9) 实验四统计数据的度量 (16) 实验五统计抽样与参数估计 (19) 实验六相关与回归分析 (24) 实验七统计数据的动态分析 (33) 实验八统计指数分析 (35)

实验(一) SPSS安装 一、实验名称:SPSS安装 二、实验目的:学会安装spss软件及有关操作 三、实验步骤:SPSS的安装和启动 在启动SPSS软件之前,需要先在计算机上进行安装。 其安装方法主要有两种:一是直接使用SPSS安装光盘进行 安装;二是通过网络下载SPSS安装程序进行安装。本小节使用第二种方法详细介绍SPSS的安装步骤(以IBM SPSS 19.0为例)。 1.打开计算机,找到已经下载到计算机上的SPSS安装程序。如图一 图一 2.单击该图标,按照顺序下去,直到出现如下界面,单击“下一步”,则弹出对话框;个人用户选择第一个“单个用户许可证”,如果图二所示。 图二 3.单击“下一步”,切换到用户协议对话框。在该对话框中接受用户协议,然后单击“下一步”,如图三所示。 图三 4.单击“下一步”,显示客户信息。在该对话框中填写好用户姓名与单位,然后单击“下一步”,如图四所示。 图四 5.单击“下一步”,语言选择。选择“英语”,然后单击“下一步”,如图五所示。

图五 6.在弹出的对话框中是选择文件安装位置,如图六所示。在该对话框中单击“更改”,可调整软件的安装位置。 图七 7.在选择文件安装对话框中单击“下一步”,在弹出的对话框中单击“安装”即可,如图七所示。 图七 8.此时则弹出正在安装的界面,如图八所示。 图八 9.在以上安装程序完后,则弹出授权许可证的对话框。把框中的勾去掉,单击“确定”,如图九所示。 图九 10.此时则弹出产品授权对话框,选择“启用以用于临时使用”按钮,单击“下一步”,如图十所示。

教育统计学大作业

教育统计学大作业 存在一种直接关系,可以用一条直线来描述它们之间的关系。非线性相关:两个变量之间的关系不是直接的,不能用一条直线来描述它们之间的关系。例如:一个人的年龄与健康状况之间的关系可能是非线性相关,因为随着年龄的增长,健康状况可能会出现不同的变化趋势。 2.举例说明相关关系在教育领域中的应用。 相关关系在教育领域中有着广泛的应用。例如,在教育投资领域中,研究教育投资与教育发展速度之间的相关关系,可以帮助政府和教育机构更好地制定教育投资政策,提高教育资源的利用效率。在教师教学领域中,研究教师的教学水平与学生的研究效果之间的相关关系,可以帮助教师更好地了解自己的教学效果,从而改进教学方法和提高教学质量。在家庭教育领域中,研究父母养育方式与孩子道德发展之间的相关关系,可以帮助家长更好地了解自己的养育方式是否合理,从而改进养育方法,提高孩子的道德素质。 3.描述统计和推断统计的区别是什么?

描述统计和推断统计是教育统计学中两个重要的概念。描述统计是对已有数据的整理和概括,目的是为了更好地了解数据的分布情况和特征,从而为进一步的分析和研究提供基础。推断统计则是利用已有的样本数据,对总体特征进行推断和估计,目的是为了更好地了解总体的情况,从而为决策提供依据。因此,描述统计和推断统计的区别在于,描述统计是对已有数据的概括和整理,而推断统计是对总体特征的推断和估计。 本文介绍了统计学中的一些基本概念和应用。首先,统计学中的相关关系可以分为线性相关和非线性相关。线性相关表现为一种直线关系,而非线性相关则表现为某种曲线形式。其次,推断统计是一种统计方法,通过样本提供的信息,运用概率的理论进行分析、论证,估计或推测总体的分布特征。推断统计的内容包括总体参数估计和假设检验。最后,实验设计是为指导实验而预先制定的计划,其目的在于研究如何科学、有效和经济地进行实验。机械抽样是其中一种常见的抽样方法。 在应用方面,本文给出了两个例子。第一个例子是编制一个完整的频数分布表,该表展示了20个学生的体育成绩以5 分为组距的分布情况。第二个例子是通过平均数差异显著性检验来判断两个年级学生的测查结果有无显著性差异。该检验需

2021年天大应用统计学考试期末大作业

应用统计学 要求: 1. 独立完成, 作答时要写明题型、 题号; 2. 作答方法: 手写作答或电脑录入, 使用A4格式白纸; 3. 提交方法: 以下两种方法任选其一, 1) 手写作答同学能够将作业以图片形式打包压缩上传; 2) 提交电子文档同学能够将作业以word 文档格式上传; 4. 上传文件命名为“中心-学号-姓名-科目.rar ” 或“中心-学号-姓名-科目.doc ”; 5. 文件容量大小: 不得超出10MB 。 请在以下五组题目中任选一组作答, 满分100分。 第一组: 一、 计算题(每小题25分, 共50分) 1、 下表中数据是主修信息系统专业并取得企业管理学士学位学生, 毕业后月薪(用y 表示)和她在校学习时总评分(用x 表示)回归方程。 2、 设总体X 概率密度函数为 2(ln )2,0 (,)0,0x x f x x μμ-- ⎧>=≤⎩ 其中μ为未知参数, n X X X ,...,,21是来自X 样本。 (1)试求13)(+=μμg 极大似然估量量)(g ˆμ;

(2)试验证)(g ˆμ 是)(μg 无偏估量量。 二、 简答题(每小题25分, 共50分) 1. 在统计假设检验中, 假如轻易拒绝了原假设会造成严重后果时, 应取显著性水平较大还是较小, 为何? 2. 加权算术平均数受哪多个原因影响?若汇报期与基期相比各组平均数没变, 则总平均数变动情况可能会怎样?请说明原因。 第二组: 一、 计算题(每小题25分, 共50分) 1、 某一汽车装配操作线完成时间计划均值为2.2分钟。因为完成时间既受上一道装配操作线影响, 又影响到下一道装配操作线生产, 所以保持 2.2分钟标准是很关键。一个样本由45项组成, 其完成时间样本均值为2.39分钟, 样本标准差为0.20分钟。在0.05显著性水平下检验操作线是否达成了2.2分钟标准。 96 .12 =αμ 2、 某商店为处理居民对某种商品需要, 调查了100户住户, 得出每个月每户平均需要量为10千克, 样本方差为9。若这个商店供给10000户, 求最少需要准备多少这种商品, 才能以95%概率满足需要? 二、 简答题(每小题25分, 共50分) 1. 解释相关关系含义, 说明相关关系特点。 2. 为何对总体均值进行估量时, 样本容量越大, 估量越正确? 第三组:

数学分析统计学大作业

数学分析统计学大作业 3、利用居民储蓄调查数据,从中随机选取85%的样本,进行频数分析,实现以下分析目标: 1. 分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较; 2.分析不同年龄的储户对什么合算的认同是否一致。 3.检验城镇储户的一次存款金额的均值为5000元,是否可信? 先从全部数据中随机选取85%的样本 操作:数据-选择个案-随机个案样本85% (1)分析储户一次存款金额的分布,基本描述统计量,并对城镇储户和农村储户进行比较 思路:(1)数据分组,将存(取)款金额重新分成五组,五组区间分布为,少于500元,500-2000元,2000-3500元,3500-5000元,5000元以上。分组后进行频数分析并绘制带正态曲线的直方图.(2)利用SPSS的频数分析计算所有样本的存(取)款金额的四分位数;然后,按照户口类型对数据进行拆分(Split file)并重新计算分位数,分别得到城镇户口和农村户口的存(取)款金额的四分位数。 操作:转换-重新编码为不同变量—a5存款金额分组—添加新值和旧值—分析-描述统计-概率-存款金额分组-图标直方图

操作:数据-拆分文件—户口-比较组-频率-统计量—四分位数

操作:分析—描述统计—描述-存取款金额-选项 结论:(1)由存款金额分组频数表我们可以看出,一次存款在500以下的人数最多,最少的是2001~3500范围内的。(2)对城镇户口和农村户口的存取款金额的四分位数进行比较,可以发现城镇户口的四分位数都高于农村户口的四分位数。由此可以知道,城镇户口的存取款金额高于农村户口的存取款金额。城镇户口的存取款金额的分布层次较多,而农村户口的存取款金额几乎分布在2000以下。 (2)分析不同年龄的储户对什么合算的认同是否一致 思路:利用交叉列联表行列变量间关系的分析不同年龄的储户对什么合算的认同是否一致。操作:分析-描述统计—交叉表-行年龄-列什么合算 结论:在20岁以下以及50岁以上的人们认为买东西合算和存钱合算的人一样多,其余年龄层都认为把钱用来买东西更合算,尤其是20~35岁的人们。 (3)检验城镇储户的一次存款金额的均值为5000元,是否可信? 思路:以“户口”将数据进行拆分,然后用总体均值的检验以95%的置信度来检验“城镇居民一次存款金额的均值为5000元"是否可信。 操作:数据—拆分文件—户口-分析—比较均值-单样本t检验-存取款金额-检验值5000

统计学实验大作业

统计学实验大作业 基于中国各主要省市气候状况的分析与比较 一.案例背景 中国国土面积广阔,东西南北地区在各个方面都有很大的差异,我们能够适应家乡的气候环境,但是换个地方生活呢?情况就会不同了,拿学生选择大学来 说,最好是选择与自己的家乡的气候差异不大的地方的学校,所以,为了能更好 地了解各地区的气候差异,我选择了2010年底中国各省市的关于年平均气温,年 极端最高气温,年极端最低气温,年平均相对湿度,全年日照时间,全年降水量 的数据,进行统计分析。比较各个省市之间的气候状况,并对造成这种差异的原 因进行分析。 二.数据来源及说明 使用的数据来源于国家统计局,关于中国各个主要省市2010年底年平均气温,年极端最高气温,年极端最低气温,年平均相对湿度,全年日照时间,全年 降水量六个指标的数据。 三.分析方法及要求 用聚类分析的方法将各个省市按照不同的尺度分类,用多元回归分析的方法研究年平均相对湿度,全年日照时间,全年降水量,年极端最高气温,年极端最 低气温对年平均气温的影响极其多远回归方程。 四.实验内容 聚类分析 * * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * * Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E 0 5 10 15 20 25 Label Num +---------+---------+---------+---------+---------+ 南京 12 -+ 合肥 14 -+ 武汉 20 -+ 南宁 23 -+-----+ 上海 11 -+ | 杭州 13 -+ |

统计学调查问卷大作业

西安外国语大学 商学院 关于大学生参加计算机培训机构情况的调查分析 班级:会计1301 小组成员:胡秋叶林文妍孟小娇陈婷 婷魏晨汪雨柳杨婷张琳敏刘丹璇毋凯

伦黄香香高旭宏指导老师:单春霞 目录 一、选题依据和意义................................................................ -1 - 选题依据............................................................................... -1 - 选题意义:........................................................................... -1 - 二、进展计划和小组分工 ....................................................... -2 - 三、调查过程 ............................................................................ -3 - 四、问卷内容............................................................................ -4 一 五、问卷调查结果汇总与分析............................................... -6 - 分析1 ........................................................................................................ - 7 - 分析2 ........................................................................................................ - 9 - 分析3 ...................................................................................................... — 11 —六、我们的建议...................................................................... -13 -

统计学作业重点知识点

第二章习题〔离散程度指标〕 1.[习题集P23第9题]某车间有两个小组,每组都是7人,每人日产量数如下:第一组:20、40、60、70、80、100、120;第二组:67、68、69、70、71、72、73。已知两组工人每人平均日产量件数为70件,试计算:〔1〕R;〔2〕A.D;〔3〕S.D,并比较哪个组的平均数代表性大? 要求:如计算过程有小数,请保存至小数点后两位,余均同。 试据此分别计算其平均日产量,并说明哪个班的平均日产量代表性大? 假定生产条件相同,试计算这两个品种的收获率〔产量/播种面积〕,确定哪一品种具有较大的稳定性和推广价值。 注意:播种面积是“f〞,而产量等于收获率乘以播种面积,因而是“xf〞。 4.[习题集P25第15题]各标志值对任意数的方差为500,而这个任意数与标志值平均数之差为12,试确定标志值的方差〔提示:方差是离差平方的平均数。此题中的500是标志值与任意数的方差,即所测度的离差发生在标志值与某一任意数之间,而所求的方差是标志值与均值之间的方差〕。 第二章习题〔平均指标〕

试计算该局企业平均职工人数以及第20百分位数。 2.[习题集P21第3题]某乡播种2800亩早稻,其中35%的稻田使用良种,平均亩产750斤,其余的稻田平均亩产仅480斤。试问:〔1〕全部耕地早稻平均亩产是多少?〔2〕早稻的全部产量是多少? 试计算产品方案与实际的平均等级和平均出厂价格,指出两者间的经济联系〔提示:可对产品等级进行赋值,此后计算〕。 依据该资料计算亩产的中位数和众数,并推断其分布态势。 第三章《时间序列分析》作业 1.[习题集P51第1题]某厂去年上半年的工人人数和工业总产值资料如下:

统计学大作业

一.小组成员分配表

二. 调查背景,意义及其可行 选题背景及研究意义: 步入大学的我们,学习的压力不再那么大,竞争意识不断增强,生存的压力和工作的前途越来越逼近我们;但是,对于丰富的周末时间,我校的学生怎么安排,做什么事情,我小组组织了一次调查; 通过这次调查我们可以更好的了解同学们的周末课余时间安排,对于我们如何合理的安排自己的课余时间有借鉴指导意义,并学会安排自己的课余时间做一些积极有益的事; 研究的可行性分析: 1、研究团队了解大学生周末时间安排及其状况,设计调查问卷、在大学里实施比较方便,从而能够获取可靠数据; 2、研究团队学习了应用统计学,掌握了获取数据的有效方法,能够撰写大学生周末时间安排调查报告; 3、能够利用Excel统计软件处理数据,达到预期目的; 三 . 具体实施计划 第一部分调查方案设计 1.调查方案 a)调查目的:通过调查了解大学生的周末时间安排的主要状况,使同学们树立科学合 理的时间观,合理安排周末时间,使同学们能够度过充实的有意义的周末生活; b)调查对象:济南大学在校生 c)调查单位:抽取的样本学生 d)调查程序: ①设计调查问卷,明确调查方向和内容; ②分发调查问卷;随机抽取山东科技大学在校大;

③大一大二大三各30人左右作为调查单位; 2.根据回收有效问卷进行数据分析,具体内容如下: 一大学生时间安排按各年级分析 二课余时间安排结构分析 1.看书复习2.兼职3.娱乐 4.社团活动5.其他 3主要思路: 1)根据样本的时间分配安排,分布状况的均值、置信区间等分布的数字特征,推断大学生总体分布的相应参数; 2)根据时间结构安排的各项时间花费安排进行均值之差的比较以及方差比的区间估计. 3)根据大一、大二、大三进行三个总体娱乐及学习和其他时间安排均值之差及方差比的区间估计. 4)根据对时间安排主要分配结构的分析算出频数频率 5)作出结论 4调查时间:2015年5月 第二部分调查问卷设计 大学生周末时间安排状况问卷调查 您好,我是会计学专业的学生,为了解大学生的周末课余时间安排状况,帮助大学生树立科学合理的时间观,我们为此进行了一次社会调查;我们的调查需要您的配合,此问卷采用匿名填写方式,

统计学回归分析大作业

建筑业总产值影响因素的分析 一、问题的提出 通过研究1995-2012年我国建筑行业总产值与建筑行业的动力装备率、劳动力人数、技术装备率以及国有企业总产值在行业总产值中所占比重的关系,来建立建筑行业总产值与其影响因素直接的归回模型,并分析其原因。 本文全部数据来源于《中国统计年鉴》。 表1.1 1995-2012年建筑行业总产值及其影响因素 年份建筑行业总 产值(亿元) 动力装备率 (千瓦/人) 劳动力人数 (万人) 技术装备 率(元/人) 国有企业所 占比重 1995 5793.75 4.70 1497.87 4264.00 0.63 1996 8282.25 4.60 2121.87 4154.00 0.50 1997 9126.48 4.10 2101.51 4729.00 0.50 1998 10061.99 4.30 2029.99 5127.00 0.45 1999 11152.86 4.50 2020.13 5756.00 0.44 2000 12497.60 4.60 1994.30 6304.00 0.40 2001 15361.56 4.86 2110.66 7136.00 0.35 2002 18527.18 4.91 2245.19 9675.00 0.30 2003 23083.87 4.85 2414.27 9957.00 0.26 2004 27745.38 5.80 2557.86 9297.00 0.26 2005 34552.10 5.10 2699.92 9273.48 0.24 2006 41557.16 4.92 2878.16 9109.14 0.22 2007 51043.71 4.97 3133.71 9208.36 0.21 2008 62036.81 5.50 3314.95 9915.00 0.20 2009 76807.74 5.20 3672.56 10088.00 0.20 2010 96031.13 4.66 4160.44 9547.04 0.19 2011 116463.32 5.66 3852.47 12025.29 0.18 2012 137217.86 5.69 4267.24 13374.17 0.17 为了研究影响建筑行业总产值的因素,把建筑行业总产值(亿元)作为被解释变量Y,将动力装备率(千瓦/人)、技术装备率(元/人)、劳动力人数(万人)、国有企业所占比重作为解释变量,分别设为X1、X2、X3、X4,假定其多元线性回归模型表示为: Y=β0+β1X1+β2X2+β3X3+β4X4

统计学大作业调查实验报告计划总结计划

精选文档 大学生第一份工作预期调 查与剖析 学号: 姓名: 班级: 老师: .

精选文档 第一部分检查方案设计 一、检查方案 1.检查目的:跟着每年大学毕业生的人数逐年增添以及考研人数的递加,大学生就业局势不 容乐观,再加上此刻经济的委靡,就业就更为困难了,面对这样现实,正确的择业和就业观念愈来愈重要。此次检盘问卷主要针对上海大学生的将来规划、毕业选择、对工作和企业的主观意向、薪资预期等几个方面进行检查,经过这些问题能够认识今世大学生的就业观点和将来希望,而后和当下的就业态势和职业人士的实质状况做对照,剖析出今世大学生就业观 的特色,帮助大学生更深入认识自己,更全面认识自己,指引大学生更为理性和客观地规划自己的将来。 2.检核对象:XX大学本科生 3.检查单位:抽取的样本学生 4.检查程序: 1)设计检盘问卷,明确检查方向和内容; 2)散发检盘问卷。随机抽取大一、大二、大三、大四在校本科生40人左右作为检查单位; 3)依据回收有效问卷进行剖析,详细内容以下: 依据样本的工作看重方面,工作地域、散布状况的均值、方差平散布的数字特色,推测 人大学生整体散布的相应参数; 依据性别进行男女两个整体预期月薪均值之差的比较以及方差比的区间预计 依据低年级(大一、大二)、高年级(大三、大四)进行四个整体月薪预期均值之差及 方差比的区间预计 绘制统计图形使样本数据直观化并对统计量进行剖析 4.检查时间:2013年12月1日—2013年12月3日 二、问卷设计 在经过网上收集资料以及咨询学长学姐后,拟订设计的问卷以下: 对于大学生第一份工作及薪资的预期问卷的检查 ××同学: 您好,请配合我们达成以下检盘问卷,请在切合您的实质状况的选项下画“√” Q1.您的性别: A.男 B.女

应用统计学大作业

《应用统计方法》作业 学院:机电工程学院 专业:机械工程 学号:Z******** ****** 班级:六班 课堂编号:49 任课教师:*** 日期: 2019年11月30日

例3-7 在某项实验中,测得变量y 与因素x 数据如表3-14所示,试建立适当的y 与因素x 的回归方程(α=0.01)。 解: 绘制散点图,如图1所示。 图1 由图1可看出,以下5种曲线方程的曲线图都与散点图接近,因此都可以作为曲线回归的选择对象。 (1) y =β0+β1√x (2) y =β0+β1lg x (3) y =β0+β1/x (4) y =β0+β1ln x (5) y =β0+β1√x 3 1) 方案1 选取曲线回归(1)求解,令x ′=√x ,应用EXCEL 可算得数据,列入表1,由表1得。 表1 曲线(1)数据预处理计算

l x′x′=∑(x ′i −x′ ̅)213 i=1=11.66703 l yy =∑(y i −y ̅)2=21.2105113 i=1 l x′y =∑(x ′i −x ′̅)(y i −y ̅)=13.9389407813 i=1 由此得 β1̂= l x′y l x′x′=13.93894078 11.66703 =1.194729 β0̂=y ̅−β1̂x ′̅=109.9362−1.194729×3.04243=106.3013 故所求的回归方程为 y ̂=106.3013+1.194729x′ 进行变量还原得回归方程 y ̂=106.3013+1.194729√x 检验假设H 01: β1=0 S 回2=β1̂l x′y =1.194729×13.93894078=16.65325 S 残2=l yy −S 回2 =21.21051−16.65325=4.557255 F =S 回2 S 残 2 11⁄= 16.65325 4.55725511 ⁄=40.19652 对给定的α=0.01,查F (1,11)表得临界值λ=9.65,由于F >λ,检验效果显著,所以拒绝H 01,即方案(1)提供的回归方程有意义。 2) 方案2 选取曲线回归(2)求解,令x ′=lg x ,应用EXCEL 可算得数据,列入表2,由表2得. 表2 曲线(2)数据预处理计算

数理统计大作业

数理统计学大作业 学院航空航天工程学部专业飞行器设计 班级航宇二班 学号142103130228 姓名张立 指导教师姜永 负责教师 沈阳航空航天大学 2014年12月

目录 (2) 前言 (3) 一、采集样本数据整理及SPSS统计软件的实现 (4) 1.1、数据的收集方法及说明 (4) 1.2、数据整理:给出频数、频率分布表及偏度和峰度 (4) 1.3、画出直方图和折线图 (6) 1.4、经验分布函数和图形 (6) 1.5、各种概率分布 (7) 二、给出总体分布的参数估计 (12) 2.1、矩估计法 (12) 2.2、最大似然估计 (12) 2.3、参数区间估计 (13) 三、参数的假设检验 (16) 3.1. 样本统计数据的t检验 (16) 3.2样本统计数据的2χ检验 (17) 四、非参数假设检验( 2 χ拟合优度检验) (18) 4.1、2χ拟合优度检验 (18) 五、结论 (20) 参考文献 (21)

数理统计学是研究有效地运用数据收集与数据处理、多种模型与技术分析、社会调查与统计分析等,对科技前沿和国民经济重大问题和复杂问题,以及社会和政府中的大量问题,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的应用广泛的基础性学科。随着科学技术的发展,数理统计的作用在国民生活中越来越重要,特别是现在随着大数据的时代来临,迫切的需要我们对大量数据的处理能力,当然这些大量的数据不可能用人工计算,有很多可以实际应用的数理统计软件,这次大作业我使用的是SPSS软件。 由于数理统计是一门实用性极强的学科,在学习中要紧扣它的实际背景,理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据,并根据处理的结果作出合理的统计推断,该结论的可靠性有多少要有一个总体的思维框架,这样,学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望,就要考虑到:1.如何寻求合适的估计量的途径,2.如何比较多个估计量的优劣。这样,针对1按不同的统计思想可推出矩估计和极大似然估计,而针对2又可分为无偏估计、有效估计、相合估计,因为不同的估计名称有着不同的含义,一个具体估计量可以满足上面的每一个,也可能不满足。掌握了寻求估计的统计思想,具体寻求估计的步骤往往是“套路子”的,并不困难,然而如果没有从根本上理解,仅死背套路子往往会出现各种错误.

统计学原理作业及答案(完整)

《统计学原理》作业(一) (第一~第三章) 一、判断题 1、社会经济统计工作得研究对象就就是社会经济现象总体得数量方面。( √) 2、统计调查过程中采用得大量观察法,就就是指必须对研究对象得所有单位进行调查。( × ) 3、全面调查包括普查与统计报表。(×) 4、统计分组得关键就就是确定组限与组距( ×) 5、在全国工业普查中,全国企业数就就是统计总体,每个工业企业就就是总体单位。(×) 6、我国得人口普查每十年进行一次,因此它就就是一种连续性调查方法。(×) 7、对全国各大型钢铁生产基地得生产情况进行调查,以掌握全国钢铁生产得基本情况。这种调查属于非全面调查。(√) 8、对某市工程技术人员进行普查,该市工程技术人员得工资收入水平就就是数量标志。(√) 9、对我国主要粮食作物产区进行调查,以掌握全国主要粮食作物生长得基本情况,这种调查就就是重点调查。(√) 10、我国人口普查得总体单位与调查单位都就就是每一个人,而填报单位就就是户。( √ ) 二、单项选择题 1、设某地区有670家工业企业,要研究这些企业得产品生产情况,总体单位就就是(C ) A、每个工业企业; B、670家工业企业; C、每一件产品; D、全部工业产品 2、某市工业企业2003年生产经营成果年报呈报时间规定在2004年1月31日,则调查期限为(B )。ﻩ A、一日 B、一个月ﻩ C、一年ﻩ D、一年零一个月 3、在全国人口普查中(B)。ﻩﻩ A、男性就就是品质标志 B、人得年龄就就是变量C、人口得平均寿命就就是数量标志 D、全国人口就就是统计指标 4、某机床厂要统计该企业得自动机床得产量与产值,上述两个变量就就是( D )。 A、二者均为离散变量 B、二者均为连续变量 C、前者为连续变量,后者为离散变量 D、前者为离散变量,后者为连续变量 5、下列调查中,调查单位与填报单位一致得就就是( D )ﻩﻩ A、企业设备调查ﻩB、人口普查 C、农村耕地调查ﻩD、工业企业现状调查 6、抽样调查与重点调查得主要区别就就是( Dﻩ)。ﻩﻩﻩ A、作用不同B、组织方式不同C、灵活程度不同ﻩD、选取调查单位得方法不同 7、下列调查属于不连续调查得就就是(ﻩA )。ﻩ A、每月统计商品库存额 B、每旬统计产品产量 C、每月统计商品销售额D、每季统计进出口贸易额8、全面调查与非全面调查得划分就就是以( C ) A、时间就就是否连续来划分得 B、最后取得得资料就就是否完全来划分得 C、调查对象所包括得单位就就是否完全来划分得 D、调查组织规模得大小划分得 9、下列分组中哪个就就是按品质标志分组( B) A、企业按年生产能力分组 B、产品按品种分组 C、家庭按年收入水平分组 D、人口按年龄分组 三、多项选择题 1、总体单位就就是总体得基本组成单位,就就是标志得直接承担者。因此(A、D) A、在国营企业这个总体下,每个国营企业就就就是总体单位; B、在工业总产值这个总体下,单位总产值就就就是总体单位;

统计学期末大作业题目及答案.

统计学实践作业

参数估计练习题 1. 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽取36人,调查他们每天上网的时间(单位:小时),得到的数据见book3.1表。 求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 平均 3.316666667 标准误差0.268224616 中位数 3.25 众数 5.4 标准差 1.609347694 方差 2.59 峰度-0.887704917 偏度0.211008874 区域 5.9 最小值0.5 最大值 6.4 求和119.4 观测数36 最大(1) 6.4 最小(1) 0.5 置信度 (90.0%) 0.453184918 置信区间 2.863481748 3.769851585 平均 3.316666667 标准误 差0.268224616 中位数 3.25 众数 5.4 标准差 1.609347694 方差 2.59 峰度-0.887704917 偏度0.211008874 区域 5.9 最小值0.5 最大值 6.4 求和119.4 观测数36 最大(1) 6.4 最小(1) 0.5

置信度 (95.0%) 0.544524915 置信区 间 2.772141751 3.861191582 平均 3.316666667 标准误 差0.268224616 中位数 3.25 众数 5.4 标准差 1.609347694 方差 2.59 峰度-0.887704917 偏度0.211008874 区域 5.9 最小值0.5 最大值 6.4 求和119.4 观测数36 最大(1) 6.4 最小(1) 0.5 置信度 (99.0%) 0.730591706 置信区 间 2.58607496 4.047258373 2.某机器生产的袋茶重量(g)的数据见book 3.2。构造其平均重量的置信水 平为90%、95%和99%的置信区间。 平均 3.32952381 标准误 差0.05272334 中位数 3.25 众数 3.2 标准差0.241608696 方差0.058374762 峰度0.413855703 偏度0.776971476 区域0.95 最小值 2.95 最大值 3.9

统计学调查问卷报告分析期末大作业

关于我校勤工俭学情况的调查问卷 学院:应用数学学院 专业:统计学 姓名:韦盛芝 学号:1217020072 目录 一、调查方案 2 1.1调查背景 2

1.2调查目的 2 1.3调查过程 2 1.4调查问卷 2 二、调查者的基本信息 5 2.1被调查者的学院分布 5 2.2被调查者的年级分布 5 2.3被调查者的性别分布 6 三、调查报告分析 7 Q1.您参加过哪一类型的勤工俭学工作: 7 Q2.您或您身边的同学想参加勤工俭学的积极性怎样: 7 Q3.您或您身边的同学参加勤工俭学的原因(多选): 8 Q4.您或您身边的同学没参加勤工俭学的原因是(多选): 8 Q5.您能够及时收到勤工俭学信息: 9 Q6.您觉得勤工俭学的信息发布渠道怎样: 10 Q7.您觉得学校提供勤工俭学工作岗位的数量怎样: 10 Q8.您觉得学校勤工俭学的工资水平怎样: 11 Q9.您参加勤工俭学一个月的酬薪有: 11

Q10 您或身边的同学能很好地协调勤工俭学与学习之间的关系吗? 12 Q11.您有没想过放弃勤工俭学: 13 Q12.参加勤工俭学能帮您解决经济困难问题吗: 13 Q13.参加勤工俭学对您的生活带来的改变: 14 Q14.报名了勤工俭学工作,信息没有收到回复,是否觉得自己不被尊 重: 15 Q15.对于短期勤工俭学和长期勤工俭学您更倾向于选择: 15 Q16.您是否有参加工作后,没有收到酬薪: 16 Q17.是否有参加过一些不太适合被调查者的身份去做的工作: 17 Q18.您对我们工作的建议(信息发布方式、信息发布渠道、面试、录取等等): 17 Q19.在图书馆上班与老师的关系是否融洽: 17 Q20.在图书馆上班与其他被调查者工的关系如何: 18 Q21.如果临时有事,找人换班或代班是否觉得困难: 19 Q22.觉得在图书馆工作有空闲时间不能够看书是否觉得浪费时间: 19 Q23.觉得在图书馆工作的工作量怎样: 20 Q24.您了解图书馆有被调查者干部对被调查者工工作进行监察吗: 20 Q25.觉得对被调查者工工作进行监督是否有意义: 21

相关主题
文本预览
相关文档 最新文档