计量地理学上机作业
- 格式:doc
- 大小:421.50 KB
- 文档页数:11
计量地理学上机指导书1. 什么是计量地理学计量地理学是地理学的一个分支,强调利用统计学和计量学方法,对社会经济和自然现象进行定量分析和测量。
计量地理学的目的是研究空间现象中的联系和变化,例如人口、经济、环境等方面。
计量地理学的一个主要特点是强调数据、模型以及模式。
通过对数据的收集、分析和解释,可以推断出某些模式或规律,从而使研究者能够更好地理解空间现象的本质。
2. 数据的收集和分析在计量地理学中,数据的收集和分析是至关重要的工作。
通常,这涉及到从多个来源(如官方统计机构、地图数据等)上获取数据,然后通过各种方法、工具和技术,对数据进行加工、分析和解释。
例如,可以使用GIS技术创建空间数据库,以便检索、查询和分析空间现象,例如地形、分布、密度、可达性等。
还可以使用统计学方法,例如相关性分析、回归分析和聚类分析等,来识别和解释不同因素之间的关系和影响。
3. 模型的建立和验证在计量地理学中,模型是一种描述现象的简化方法。
通过一个准确、完整和合理的模型,研究者可以预测不同因素之间的关系,并识别可能导致变化的因素。
然而,模型的建立和验证是一个极其复杂的过程,需要考虑多种因素,例如模型的结构、数据的质量、模型的设置等。
模型验证的过程中,研究者通常会使用一系列技术和工具,例如模型诊断、模型拟合、模型调整等。
这些技术的目的是检查模型是否准确、完整和可靠,以便在不确定的情况下提供一个可预测性的结论。
4. 计量地理学的应用计量地理学在许多领域得到了广泛应用,例如城市规划、土地利用、环境管理、交通规划等。
下面我们以城市规划为例,介绍计量地理学的应用。
城市规划是一项非常复杂的任务。
通过计量地理学技术,规划者可以分析人口分布、土地利用、交通流、环境污染等方面的数据,从而设计出更好的城市规划方案。
例如,规划者可以用GIS技术来计算一个社区的人口密度,从而更好地预测其发展趋势和需求。
此外,计量地理学技术还可以预测交通流量和拥堵状况,从而确定哪些道路和街道需要扩建和改造。
计量地理学(8)答案及评分标准一 .填空题(每空 1 分,共 10 分) 1. 质量标志;2. n-2;3. 99.73%;4. t 检验法; 5. STDEV ;8.标准化;9.最大相似性 10. 累积百分率 6.下降;7.F(X1)≤F(X2)二,1.B;2.D;3.A;4.B;5.C;6.D;7.C;8.B;9.A;10.D 三,1.AD;2.BC;3.ABD;4.BD;5.AC 四.名词解释题(每小题 3 分,共 15 分) . 1.趋势面:是一种光滑的数学曲面,它能集中地代表地理数据在大范围内的空间变化趋势, (1 分)趋势面与实际面上的地理曲面不同,它只是实际曲面的一种近似值. 分)因此实 (1 际曲面应包括趋势面和剩余曲面两部分. 分) (1 2.众数:是一个地理观测(或调查)系列中出现频数(或次数)最多的数. (1 分)具有典型性和代表性, 分)它在频数分布曲线上的位置正居最高点上. 分) (1 (1 3.F 分布:若 F=ξ/η,其中ξ和η相互独立,则ξ= x1 / f 1 , η= x 2 / f 2 , X1 为具有自由度2 22为 f1 的变量,X22 为具有自由度 f2 的 x2 变量,称变量 F 服从 F-分布.4.直通性:直通性是运输网的重要特征之一(1 分) ,节点的直通性表现在以下两个方面:环中节点与网络中其它环路节点的联结情况, 分) (1 ,运输流在节点上与网络中其它节点的联结情况. 分) (1 5. 方差分析:把平方和与自由度同时进行分解(1 分) ,用F 检验法对整个回归方程进行显著性检验的方法,称为方差分析. 分) (2 五.简答题(每题 5 分,共 10 分) 1.(1)分布范围在 0-1 之间; 分) (1 (2)越趋于 1,曲线相关程度越密切①等于 1,两个要素完全曲线相关②等于 0,两个要素完全无曲线相关; 分) (2 (3)Ryx≥r(1 分) (4)Ryx 与 Rxy 不相等(1 分) 2.计算步骤: 1)计算基准点 I 点到各点的全部距离 rih 2)计算基准点到边界的最短距离 rb 3)选出rh≤rb 距离,并从小到大排列, 4)列出各点的最短距离距阵 5)计算各级最临近距离. 六,1,原命题错误, 分) (2M 0 = Lm 0 +f m +1 260 ×h = 5+ × 1 = 5 + 0.5 = 5.5 (2 分) 260 + 253 f m 1 + f m 12. 原命题正确(2 分) ,原因解释(6 分)∑ ∑ ∑ ∑x = 6 + 5 + 8 + 1 + 4 + 7 + 6 + 3 + 3 + 7 = 50 y = 12 . 6 + 10 . 4 + 18 . 5 + 3 . 0 + 8 . 1 + 16 . 3 + 6 . 2 + 6 . 6 + 16 . 8 = 110 . 8 x 2 = 6 2 + 5 2 + 8 2 + 1 2 + 4 2 + 7 2 + 6 2 + 3 2 + 3 2 + 7 2 = 294y 2 = 12 . 6 2 + 10 . 4 2 + 18 . 5 2 + 3 . 0 2 + 8 . 1 2 + 16 . 3 2+ 12 . 3 2 + 6 . 2 2 + 6 . 6 2 + 16 . 8 2 = 1465 . 00 ∑ xy = 6 × 12 . 6 +5 × 10 . 4 + 8 × 18 . 5 + 1 × 3 . 0 + 4 × 8 . 1+ 7 × 16 . 3 + 6 × 12 . 3 + 3 × 6 . 2 + 3 × 6 . 6 + 7 × 16 . 8 = 654 . 9γ ==[n ∑ [ 10x2∑ xy ∑ x ∑ ( ∑ x ) ][n ∑ yn2y2(∑ .82y)2]10 × 654 × 294 50. 09 50 × 1102][ 10.8 110× 1465]答:因为 r=0.987,所以二者高度正相关. 七. 论述题(每题 9 分,共 18 分) 1. 2.三年滑动平均法的计算结果与原始数据的误差小.(1 分)(数据共 4 分,错一个扣 0.5 分, 扣完为止) 序号 1 2 3 4 5 6 7 8 9 10 11 年份 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 农业总产值 7662.1 8127.0 9084.7 10995.5 15750.5 20340.9 22353.7 23788.4 24541.9 24519.1 8301.26 9412.27 11943.57 15695.63 19481.70 22161.00 23561.33 24283.13 10329.96 12865.72 15705.06 18645.8 21355.08 23108.8 三年滑动平均五年滑动平均八,综合应用题(每题 15 分,共 15 分) 评分标准:每步 2 分,最短路径 1 分解:首先给 v1 标上 P 标号 P(v1)=0,表示从 v1 到 v1 的最短路径为零.其它点(v2,v3,…,v7)标上 T 标号T(vj)=+∞(j=2,3,…,7) . 第一步:① v1 是刚得到 P 标号的点.因为(v1,v2),(v1,v3),(v1,v4)∈E,而且 v2, v3,v4 是 T 标号,所以修改这三个点的 T标号为T(v2)=min[T(v2),P(v1)+w12]=min[ +∞,0+2]=2T(v3)=min[T(v3),P(v1)+w13 ]= min[ +∞,0+5]=5 T(v4)=min[T(v4),P(v1)+w14 ]= min[ +∞,0+3]=3 ② 在所有 T 标号中,T(V2)=2 最小,于是令 P(V2)=2. 第二步: ①v2 是刚得到 P 标号的点.因为(v2,v3),(v2,v6)∈E,而且 v3, v6 是 T 标号,故修改v3 和 v6 的 T 标号为: T(v3)=min[T(v3),P(v2)+w23]=min[5,2+2]=4T(v6)=min[T(v6),P(v2)+w26]=min[+∞,2+7]=9 ② 在所有的 T 标号中,T(v4)=3 最小,于是令 P(v4)=3.第三步:① v4 是刚得到 P 标号的点.因为(v4,v5)∈E,而且 v5 是 T 标号,故修改 v5 的 T标号为: T(v5)=min[T(v5),P(v4)+w45]=min[+∞,3+5]=8 ② 在所有的 T 标号中,T(v3)=4 最小,故令 P(v3)=4.第四步:① v3 是刚得到 P 标号的点.因为(v3,v5),(v3,v6)∈E,而且 v5 和 v6 为 T 标号,故修改 v5 和 v6 的 T 标号为: T(v5)=min[T(v5),P(v3)+w35]=min[8,4+3]=7T(v6)=min[T(v6),P(v3)+w36]=min[9,4+5]=9 ② 在所有的 T 标号中,T(v5)=7 最小,故令 P(v5)=7.第五步:① v5 是刚得到 P 标号的点.因为(v5,v6),(v5 ,v7)∈E,而且 v6 和 v7 都是 T 标号,故修改它们的 T 标号为: T(v6)=min[T(v6),P(v5)+w56]=min[9,7+1]= 8T(v7)=min[T(v7),P(v5)+w57]=min[+∞,7+7]=14 ② 在所有 T 标号中,T(v6)=8 最小,于是令:P(v6)=8① v6 是刚得到 P 标号的点.因为(v6,v7)∈E,而且 v7 为 T 标号,故修改它的 T 标号为: T(v7)=min[T(v7),P(v6)+w67]=min[14,8+5]=13 ② 目前只有 v7 是 T 标号,故令: P(v7)=13. 从城镇 v1 到 v7 之间的最短路径为(v1,v2,v3,v5,v6,v7),最短路径长度为 13.。
计量地理学实验报告集团公司文件内部编码:(TTT-UUTT-MMYB-URTTY-ITTLTY-河南理工大学测绘与国土信息工程学院《计量地理学》实验报告姓名:袁程学号:专业班级:自然地理与资源环境14-02指导教师:郜智方2017年3月31日┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄┄实验成绩:□优秀:格式完全符合规范要求,内容完整,图标美观,结果正确,体会深刻;严格遵守实习纪律,按时上交实验报告。
□良好:格式符合规范要求,内容完整,图标规范,结果正确,体会较深刻;严格遵守实习纪律,按时上交实验报告。
□中等:格式基本符合规范要求,内容较完整,结果正确,有一定体会;能遵守实习纪律,能按时上交实验报告。
□及格:格式问题较多,内容基本完整,结果基本正确,有一定体会;能遵守实习纪律,能按时上交实验报告。
□不及格:格式问题突出有抄袭现象/不遵守实习纪律/未时上交实验报告。
实习报告一:利用相关软件对数据作简单的统计处理自然地理与资源环境14-02班姓名:袁程一、实验目的:利用Excel和Matlab对数据做简单的统计处理。
二、实验内容(1)练习在Excel(2)练习在Excel中,对“铅.xls”文件中数据进行分组,求均值、中位数、众数等的操作,并绘制频数分布柱状图和累计频率曲线图;(3)在Matlab中进行简单统计处。
点击界面中选择相应函数即可实现运算,或者在运算格键入“=”后直接输入函数实现。
(4)如果对函数用法不清楚,点击上图中“有关该函数的帮助”查看帮助。
在“搜索函数”栏还可以输入汉字查询相关函数。
(5)相关函数:平均值AVERAGE、中位数MEDIAN、众数MODE、极差MAX(:)-MIN(:)、离差平方和DEVSQ、方差VARP、标准差STDEVP、标准差无偏估计(S)STDEV、偏度系数SKEW、峰度系数KURT。
(6)分组可借助COUNTIF函数实现绘制直方图和曲线图,在excel中,点击“插入”——“图表”,然后根据提示完成。
计量地理学期末第二章1. 地理数据有哪几种类型,各种类型地理数据之间的区别和联系是什么?答:地理数据就是用一定的测度方式描述和衡量地理对象的有关量化指标。
按类型可分为:1)空间数据:点数据,线数据,面数据;2)属性数据:数量标志数据,品质标志数据地理数据之间的区别与联系:数据包括空间数据和属性数据,空间数据的表达可以采用栅格和矢量两种形式。
空间数据表现了地理空间实体的位置、大小、形状、方向以及几何拓扑关系。
属性数据表现了空间实体的空间属性以外的其他属性特征,属性数据主要是对空间数据的说明。
如一个城市点,它的属性数据有人口,GDP,绿化率等等描述指标。
它们有密切的关系,两者互相结合才能将一个地理试题表达清楚。
^2. 各种类型的地理数据的测度方法分别是什么?地理数据主要包括空间数据和属性数据:空间数据——对于空间数据的表达,可以将其归纳为点、线、面三种几何实体以及描述它们之间空间联系的拓扑关系;属性数据——对于属性数据的表达,需要从数量标志数据和品质标志数据两方面进行描述。
其测度方法主要有:(1) 数量标志数据①间隔尺度(Interval Scale)数据: 以有量纲的数据形式表示测度对象在某种单位(量纲)下的绝对量。
②比例尺度(Ratio Scale)数据: 以无量纲的数据形式表示测度对象的相对量。
这种数据要求事先规定一个基点,然后将其它同类数据与基点数据相比较,换算为基点数据的比例。
【(2) 品质标志数据①有序(Ordinal)数据。
当测度标准不是连续的量,而是只表示其顺序关系的数据,这种数据并不表示量的多少,而只是给出一个等级或次序。
②二元数据。
即用0、1 两个数据表示地理事物、地理现象或地理事件的是非判断问题。
③名义尺度(Nominal Scale)数据。
即用数字表示地理实体、地理要素、地理现象或地理事件的状态类型。
3. 地理数据的基本特征有哪些?1)数量化、形式化与逻辑化2 )不确定性3 )多种时空尺度,4 ) 多维性4. 地理数据采集的来源渠道有哪些?1)来自于观测、测量部门的有关专业数据。
中山大学计量地理学作业1,谈谈自己了解到的生活中的计量地理学个人觉得计量地理学在生活中其实出现得还是比较多的,可能我们之前并没有刻意去留意,认真观察一下,我们还是可以发现其实计量地理学的应用还是颇为广泛的。
简单点来说,计量地理学可以说得上是一门利用数学方法解析和研究地理科学的学科。
具体我举几个例子:例一,利用数学方法中的聚类分析我们可以进行各种地理区域的划分;例二,利用网络分析方法我们可以研究交通网络,河流水系等地理网络;例三,投入产出分析可以用于产业部门的联系,劳动地域构成分析等。
因此,计量地理学是一门应用比较广泛的学科,既有着数学类学科和地理学科的共性,同时其本身也有着独特的性质和特殊的应用,在我们生活中,计量地理学涉及到方方面面。
2,谈谈你所理解的定量地理学和定性地理学。
一门学科要想从经验科学发展成为理论科学,首先必须成为一门实证科学,而数量化乃是实证化的基本前提。
因此定量地理学的出现是理所当然的,但是关于定量和定性两者谁优谁劣的问题始终没有一个满意结果,为什么呢?是否证明定量地理学就一定是一个错误呢?如很多地理问题是无法定量化的,比如地质上某个断裂走向是北东向的,地质图上标明的地层,某地区岩石绢云母化等等。
同时还有不同学科带来的量纲不一致无法运算的问题。
比如遥感影像上亮度值为AA,地球物理讲某地地磁异常量值XX,地球化学某种元素含量是YY,某断裂长度是ZZ……如何将这些量纲不一致,数值相差十几个数量级的数据进行定量分析等等。
然而定性研究是地理学的传统方法,一般分成定性记述和定性论述两种形式。
定性的优点是重点突出、印象深刻,缺点是对研究对象局限于形象描述、概略评估,其可靠性和有效性受研究者的水平、经验、思维方式等主观因素影响很大。
因此,定量地理学和定性地理学两者结合起来进行地理现象的研究无疑是往后发展的方向,这里我们没有必要去讨论到底应该选择哪个,问题不在于定性和定量上面,在于地理这门学科本身就是一门复杂的科学,我们目前尚未可以给地理学一个准确的科学定义,因此,在技术还没有达到一定水平的今天,我们应该好好的结合定量和定性地理学的研究方法以促进地理学的发展!。
地理建模作业3 地信111班黄宗财25号1、下表给出了某地区2002~2004 年各季度用电量,试用季节性预测法预测该地区2005 年各季度的用电量。
解:(1)将原始时间序列求滑动平均,消除季节变动和不规则变动,保留长期趋势,三点滑动平均法公式:滑动平均结果如下:(2)求季节性指标。
季节系数=原始序列y/滑动平均值,目的分离出季节变动;把各季度的季节系数平均得到季节指标,求得θ=4/3.498=1.143432,季节性指标乘以θ得到校正后的季节性指标。
如下图:(3)求预测模型用二次指数平滑法求预测模型系数,取α=0.2,分别用以下公式求一次指数平滑S(1)和S(2),用以下公式计算趋势预测模型的系数a t和b t::预测模型系数如下:得到预测模型为:y12+k=(2391.24-87.85*k)*1. 1.143(4)求得2005年各季度用电量(104KW)预测值为:(最后一列)2、下面是武汉市户籍人口的时间序列(1985-2002),建立自回归模型,并利用模型进行人口预测,利用1996年-2002人口数据,利用灰色模型进行人口预测,并比较自回归模型与灰色模型的预测精度。
年份人口年份人口年份人口1985 6083925 1991 6770312 1997 72390171986 6199553 1992 6844645 1998 73179071987 6293398 1993 6916923 1999 74019931988 6417236 1994 7000050 2000 74919431989 6532563 1995 7100100 2001 75822591990 6697458 1996 7159414 2002 7680958解:(1)自相关回归模型预测。
求y(人口)算出自相关系数r1中的和,得到:算出r2中的和,得到通过上述的相关系数的计算过程知道,r1的样本数为18,所以自由度为ϯ=18-2=16.在置信度α=0.001下查询相关系数的临界值检验表的r0.01=0.780表明一阶相关系数r1和二阶自相关系数r2都有高度的显著性。
计量地理学实习报告一、实验目的通过实例,了解各种统计方法的基本原理及其在地理学中的应用,掌握各种描述地理数据分布的离散程度的指标的计算,以及掌握对数据进行变异系数和基尼系数分析的方法。
二、实验内容1、某学期班级成绩的极差、离差、离差平方和、方差、标准差和标准差的无偏估计以及变异系数计算(附Excel表)。
成绩离差离差平方离差平方和方差标准差无偏估计变异系数平均值极差59 -17.5263 307.1719 8049.474 212.0914 14.56336 14.75885 0.069587 76.52632 5265 -11.5263 132.856198 21.47368 461.118946 -30.5263 931.856278 1.47368 2.17173368 -8.52632 72.6981375 -1.52632 2.32965368 -8.52632 72.6981386 9.47368 89.7506163 -13.5263 182.961367 -9.52632 90.7507796 19.47368 379.224271 -5.52632 30.5402156 -20.5263 421.329862 -14.5263 211.01495 18.47368 341.276967 -9.52632 90.7507768 -8.52632 72.6981346 -30.5263 931.856249 -27.5263 757.698398 21.47368 461.118997 20.47368 419.171696 19.47368 379.224293 16.47368 271.382186 9.47368 89.7506182 5.47368 29.9611786 9.47368 89.7506176 -0.52632 0.27701386 9.47368 89.7506172 -4.52632 20.4875776 -0.52632 0.27701374 -2.52632 6.38229373 -3.52632 12.4349379 2.47368 6.11909383 6.47368 41.9085386 9.47368 89.7506186 9.47368 89.7506196 19.47368 379.2242极差=52 8059.47476.52632 212.091414.56336217.823614.758850.0695872、安徽各市人均GDP的变异函数分析(1998——2005)安徽省各市人均GDP数据(1998—2005)及其变异函数值如下图所示:得出的安徽省各市人均GDP变异系数图如下:根据安徽省各市1998—2005年的人口数与GDP数据,计算出的基尼系数值及其图如下所示:从图中我们可以看出,在1998至2005年期间,人均GDP的变异系数,以1999年、2001年和2002年为转折点,即:在1998—1999年期间呈下降趋势,而在1999—2001年期间呈上升趋势,但是在2001—2002年又再次下降,最后从2002年不断上升。
地理建模作业3 地信111班黄宗财25号1、下表给出了某地区2002~2004 年各季度用电量,试用季节性预测法预测该地区2005 年各季度的用电量。
解:(1)将原始时间序列求滑动平均,消除季节变动和不规则变动,保留长期趋势,三点滑动平均法公式:滑动平均结果如下:(2)求季节性指标。
季节系数=原始序列y/滑动平均值,目的分离出季节变动;把各季度的季节系数平均得到季节指标,求得θ=4/3.498=1.143432,季节性指标乘以θ得到校正后的季节性指标。
如下图:(3)求预测模型用二次指数平滑法求预测模型系数,取α=0.2,分别用以下公式求一次指数平滑S(1)和S(2),用以下公式计算趋势预测模型的系数a t和b t::预测模型系数如下:得到预测模型为:y12+k=(2391.24-87.85*k)*1. 1.143(4)求得2005年各季度用电量(104KW)预测值为:(最后一列)2、下面是武汉市户籍人口的时间序列(1985-2002),建立自回归模型,并利用模型进行人口预测,利用1996年-2002人口数据,利用灰色模型进行人口预测,并比较自回归模型与灰色模型的预测精度。
年份人口年份人口年份人口1985 6083925 1991 6770312 1997 72390171986 6199553 1992 6844645 1998 73179071987 6293398 1993 6916923 1999 74019931988 6417236 1994 7000050 2000 74919431989 6532563 1995 7100100 2001 75822591990 6697458 1996 7159414 2002 7680958解:(1)自相关回归模型预测。
求y(人口)算出自相关系数r1中的和,得到:算出r2中的和,得到通过上述的相关系数的计算过程知道,r1的样本数为18,所以自由度为ϯ=18-2=16.在置信度α=0.001下查询相关系数的临界值检验表的r0.01=0.780表明一阶相关系数r1和二阶自相关系数r2都有高度的显著性。
一、主成分分析1、数据来源查阅《浙江省统计年鉴2014》与《浙江省土地利用总体规划(2006—2020)》。
选取杭州市、宁波市与绍兴市三个地级市的县级行政单位的人口、财政收入、国民生产总值、居民收入、三次产业从业人数与产值、粮食产量、耕地面积、居民点面积等数据。
2、研究方法与数据处理主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。
在土地评价中用主成分分析的方法把大量错综复杂的变量变成几个少数几个综合因子是一种常见方法。
2.1数据预处理影响土地整治的因素很多,例如当地的经济水平,人口的变化发展、土地集约程度、产业发展状况等。
现参考其它研究成果,选取人均财政收入(X1)、人均生产总值(X2)、农村居民人均纯收入(X3)、农村居民二三产从业比(X4)、农村居民二三产产值比(X5)、人均粮食产量(X6)、人均耕地面积(X7)、农村居民人均居民点面积(X8)等八项数据作为环杭州湾土地整治优先度评价的指标。
根据初始数据计算出八项指标数值如表1。
表1 环杭州湾区域土地整治优先度评价指标区域x1x2x3x4x5x6x7x8杭州市区 1.6814.03 1.850.820.93100.150.2442.61桐庐县0.48 6.38 1.520.730.87228.700.55135.09淳安县0.25 3.500.940.530.74205.820.42101.49建德市0.31 4.85 1.310.580.85194.47 1.67220.45富阳市0.648.27 1.740.690.90225.950.46131.60临安市0.457.24 1.580.730.87169.760.47134.61宁波市区 2.2217.53 2.020.870.93113.540.4274.70余姚市0.748.50 1.800.800.90250.680.72143.05慈溪市0.789.20 2.040.870.91116.970.6384.12奉化市0.50 5.67 1.770.740.83149.000.7791.18象山县0.50 6.23 1.640.620.72193.490.70136.32绍兴市区0.979.05 1.880.860.9290.120.1743.86诸暨市0.497.66 1.910.810.88358.480.51130.92上虞市0.507.42 1.770.690.86377.840.54114.76嵊州市0.27 4.95 1.490.740.85232.670.54117.01绍兴县0.9713.97 2.180.880.92289.130.3578.16新昌县0.46 6.45 1.460.650.90185.240.43103.532.2数据分析步骤(1)将表1数据导入spss软件,设置变量视图与数据视图,如图1、图2。
计量地理学第6章作业题_参考答案1. 证明题1)对于标准化的数据,任意两个长度为n 的向量x 和y 之间的相关系数可以表示为y x n r T1=. 任意两个m 列、n 行的矩阵X 和Y 之间的相关系数矩阵为Y X nR T1=, 式中R 为一个m *m 的方阵。
这里假定数据的排列都是从上到下为样品、从左到右为变量。
在因子分析中,因子模型可以表为如下矩阵方程形式EU FA Y +=,式中Y 为标准化的原始数据矩阵,F 为(标准化的)公因子得分矩阵,A 为公因子载荷,E 为单因子得分,U 为单因子载荷。
试证明公因子载荷矩阵为原始变量与公因子得分之间的相关系数矩阵。
2)已知主成分或者因子载荷为变量与主成分之间的相关系数。
对于长度为n 的两个变量而言,基于标准化数值的因子载荷矩阵可以表作⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎦⎤⎢⎣⎡=22122111222112111111x f n xf n x f n x f n a a a a A T T T T. 将该矩阵转置,即得主成分载荷矩阵(SPSS 给出正是矩阵A 的转置形式)。
要求解决如下问题。
(1)已经证明2121221112122221121122221212212111111r a a a a r a a a a a a a a a a a a =+=+=+=+.这类r 为原始变量之间的相关系数。
试进一步证明R A A =T ,这里R 为原始变量的相关系数矩阵。
(2)已经证明22222212111212111112221121221221110λλ=+=+=+=+a a a a a a a a a a a a a a a a .这类λ为主成分得分的方差。
试进一步证明Λ=T AA ,这里Λ为相关系数矩阵R 的特征值构成的对角线矩阵,即主成分得分的方差形成的对角阵。
2. 计算-分析题1)美国统计学家Richard Stone于1947年开展的关于国民经济的主成分分析(PCA)比较著名,现在已经成为经典案例之一。
1、大家都知道糖尿病病人主要靠胰岛素来治疗。
现测量22 名糖尿病病人(以ID 来编号)血中的血糖值(Y)、胰岛素值(X1)和生长激素值(X2)(数据见表1)。
表1 糖尿病病人体检数据ID Y X1X2ID Y X1X21 12.21 15.21 9.51 12 9.49 16.4 6.532 14.54 15.77 11.43 13 10.16 21.69 7.163 12.27 11.93 8.53 14 8.38 23.18 5.864 12.04 14.61 12.17 15 8.49 23.26 6.325 7.88 19.86 6.33 16 7.71 25.73 10.346 11.12 16.22 13.52 17 11.38 16.89 12.757 10.43 17.46 10.07 18 10.82 11.25 10.888 13.32 10.32 18.89 19 12.49 13.77 11.069 19.59 5.95 13.14 20 9.21 24.42 10.1610 9.05 18.71 9.63 21 8.57 22.95 10.9211 6.44 25.13 6.19 22 12.82 16.48 9.96(1)试分析Y、X1和X2间的两两/双变量间的线性关系;(2)在X1(胰岛素)相同的情况下,试分析X2(生长激素)与Y(血糖)的关系;(3)在X2(生长激素)相同的情况下,试分析X1(胰岛素)与Y(血糖)的关系;(4)试说明以上的分析数据为什么会存在差别?解答:实验操作步骤(1)(2)(3)(1)试分析 Y 、X 1 和 X 2 间的两两/双变量间的相关关系;** Correlation is significant at the 0.01 level (2-tailed).(2)在 X 1(胰岛素)相同的情况下,试分析 X 2(生长激素)与 Y (血糖)的关系;(3)在 X 2(生长激素)相同的情况下,试分析 X 1(胰岛素)与 Y (血糖)的关系;以上为上机操作最终结果。
地理数学方法上机实习2(方差分析部分)上机实习目的:1. 掌握方差分析的前提条件及其检验方法2. 掌握单因素方差分析过程3. 掌握双因素方差分析过程4. 了解多因素方差分析上机练习数据1 为研究某地理要素在A,B,C,D四类地区是否相同,每地区随机采集了30个样本,样本观测值如exercise4所示。
问:该地理要素在这四个地区是否相同?如果不完全相同,进一步分析其差异性。
2 为研究某地理要素的分布是否具有垂直地带性规律,在其分布的海报高程内(400-2500m),按照等间隔采样的方法随机选择了12个高程,每高程下沿经度方向随机采集了10个样本,数据如exercise 5所示。
问:该地理要素的分布是否具有垂直地带性规律?3 某地理要素可能受到因素A,B的影响,现设计一控制试验,因素A有3个处理,因素B有4个处理,每处理下均采集了10个样本,数据如exercise 6所示。
问:因素A和B是否影响该地理要素?4 采用5种生长素处理豌豆,未处理为对照,待种子发芽后,分别每盆中移植4株,每组为6盆,每盆一个处理,试验共有4组24盆,并按组排于温室中,使同组各盆的环境条件一致。
当各盆见第一朵花时记录4株豌豆的总节间数,数据如exercise7所示,问:生长素是否影响豌豆的生长?一、 方差分析的前提条件及其检验1.正态性正态性的非参数检验方法有两种:一是针对小样本的Shapiro-Wilk检验,二是针对大样本的K-S检验。
2. 独立性独立性的非参数检验方法为游程检验(Runs)。
3. 方差的同质性方差同质性的参数检验方法为Levene 检验。
二、单因素方差分析(exercise 4 and exercise 5)1. 前提条件的检验正态性检验、方差齐性、独立性检验(通常不检验独立性)Shapiro-Wilk检验结果表明:在0.05水平上,四个处理均服从正态分布。
F检验(Levene检验)结果表明:在0.05水平上,四个处理满足方差齐性。
计量地理学实验报告(湖南科技大学)学院专业班级学号姓名指导老师完成时间《计量地理学》第一次实验报告实验日期:10月30日实验地点:机房(一)实验名称多元线性回归分析、岭回归分析、逐步回归分析(二)实验目的通过实际上机操纵,学会运用相关软件对数据进行回归分析,了解每一种回归分析方法的适用情况,并灵活运用各种回归分析方法处理对应数据,通过软件处理变量之间相关关系,建立预测方程。
(三)实验内容运用DPS软件,首先输入一组数据,对其进行多元回归分析,若经过检验没有发现变量间存在多重共线性,且显著性水平达到要求,则根据相关数据建立回归方程。
若存在多重共线性,则选择其它几种方法对其进行回归分析,从而克服多重共线性的问题,最后得出最准确的回归方程。
(四)实验步骤与结论一、多元线性回归多元线性回归适用分析于不存在多重线性关系的变量之间的相关关系。
因此在进行分析以后,要运用相关系数、方差膨胀因子这些指标对其变量之间是否存在多重共线性进行检验,然后在写出回归方程后,对方程进行显著性检验。
显著性水平达到要求的,说明建立的回归方程有效。
下面以研究车流、气温、湿度及风速作为自变量,以大气中一氧化氮的含量作为自变量建立回归方程为例,进行多元线性回归的操作,处理如下数据:1500 21.8 77 0.6 0.121200 27 58 1.7 0.11476 27 65 0.65 0.1291820 22 83 0.4 0.1351436 28 68 2 0.099948 22.5 69 2 0.0051440 21.5 79 2.4 0.0111084 28.5 59 3 0.0031844 26 73 1 0.141116 35 92 2.8 0.0391656 20 83 1.45 0.0591536 23 57 1.5 0.087960 24.8 67 1.5 0.0391784 23.3 83 0.9 0.2221496 27 65 0.65 0.1451060 26 58 1.83 0.0291436 28 68 2 0.0991、操作步骤与数据记录:打开DPS软件——编辑下表1-1中的数据,定义成数据块——点击“多元分析”——在“回归分析”的菜单下选择“线性回归”系统出现如下界面,下图为残差分析图,用于对模型的拟合效果进行分析:点击“返回编辑”按钮,从系统给出的数据结果中提取下列重要信息:(1)检验多重共线性的膨胀系数表1-1和相关系数表1-2(表1-1)变量平均值标准差膨胀系数VIFx1 1403.5 303.0582 1.7553x2 25.2458 3.6069 1.1897x3 71.0833 9.9779 1.2022x4 1.3638 0.7671 1.7403y 0.0871 0.0594(表1-2)(2)用于进行显著性检验的方差分析表1-3(表1-3)(3)用于建立模拟方程的回归系数表1-4(表1-4)2、数据分析(1)多重共线性检验指标:膨胀系数>10或相关系数>0.8,则说明存在严重的多重共线性关系。
《计量地理学》实验报告专业:地理与旅游学院班级:学号:姓名:成绩:2014-2015学年第二学期地理与旅游学院实验二统计图表、空间罗伦兹曲线实验日期:2016-5-24 实验地点:JE328一、实验目的掌握地理研究中常用的统计图表的作法,空间罗伦兹曲线的作法二、实验内容运用 EXCEL 的绘图模块,对理研究中常用的图表进行绘制,重点掌握曲线图、直方图、立方图、双轴曲线图等。
运用 EXCEL 的计算模块,绘制空间罗伦兹曲线三、实验步骤(使用课本习题数据)1、(单要素) 空间罗伦兹曲线的绘制基本原理:作一长方形,长方形的水平轴为部门或区域单元,垂直轴为累积百分率。
对角线 OX 表示各部门或区域单元的要素分布是均等的。
曲线的上凸程度,表示要素的部门或区域单元集中化程度,上凸程度越大,就表示要素越是集中于某些产业部门。
主要步骤:(1) 计算该地区各亚区GDP占总GDP比重,并且按从大到小重新排序;(2) 从大到小,逐次计算累计百分;(3) 以自然序号为横坐标(x),累计百分比为纵坐标(y); 以(部门代码,累计百分比) 为坐标点,连成一个上凸的曲线,即罗伦次曲线见图。
(4)结果分析:从图中可以看出,实际分布曲线的上凸程度较小,说明该地区的GDP分布较为均匀。
2、(双要素) 空间罗伦兹曲线的绘制基本原理:作一正方形,正方形的水平轴与垂直轴都为累积百分率。
对角线 OX 表示沿两种分布之间是完全相对应的,有相同的百分率和累积百分率。
曲线离开对角线的远近就是这两种分布的差异程度的测度。
主要步骤:(1)确立研究对象:使用人口与 GDP进行比较;(2)计算各亚区人口占总人口的比重与各亚区GDP占总GDP的比重;(3)计算 r 值: R=GDP 比重/人口比重(4)把各亚区的 R 值由大到小的顺序排列,相应的计算出 GDP 和人口的累积百分比分别以 GDP 和人口的累积百分比为纵轴和横轴,把各个地区的数值点在直角坐标系内。
《计量地理学》各章习题第一章1.在地理学研究中应用数学方法应该注意哪些问题?2.在现代地理学中,应用了哪些主要的数学方法,其主要用途是什么?3.怎样评价现代地理学中应用数学方法,在我国地理学界对数学方法应用的情况怎样?第二章1.根据1990~2003年的中国经济统计年鉴,以各省(直辖市、自治区)的GDP数据为变量,运用平均值、方差、变异系数等统计量,对全国各年经济发展的一般水平、差异情况进行计算和分析。
2.对于黄土高原西部地区某山区县的人工造林地调查数据,以地块面积作为统计分组标志,计算各组数据的频数、频率,编制成的统计分组表如下所示,试计算中位数和众数。
表1某县人工造林地面积的统计分组数据分组序号 1 2 3 4 5 6 7 8 9 10 11分组标志(面积: ha) (0,1] (1,2] (2,3] (3,4] (4,5] (5,6] (6,7] (7,8] (8,9] (9,10] (10,11) 组中值0.5 1.5 2.5 3.5 4.5 5.5 6.5 7.5 8.5 9.5 10.5 频数(地块个数)25 96 136 214 253 286 260 203 154 85 24 频率(%) 1.44 5.53 7.83 12.33 14.57 16.47 14.98 11.69 8.87 4.90 1.38 向上累计频数25 121 257 471 724 1010 1270 1473 1627 1712 1736 向下累计频数1736 1711 1615 1479 1265 1012 726 466 263 109 243.各种类型的地理数据的测度方法分别是什么?数学方法和地理信息系统在地理数据处理中各自发挥什么样的作用?第三章1.主成分分析方法计算:(1)某医学院测得20例肝病患者的4项肝功能指标:SGPT(转氨酶)X1,肝大指数X2,ZnT(硫酸锌浊度)X3,AFP(胎甲球)X4,数据见下表。
说明:
R33=1 R3y=0.89
R代表样本数为7 且X3在a=0.007上显著
这是X1 X2 X3 Y 之间的相关系数矩阵
R11=1. R12=0.311 R13=0.507 R1y=0.808 R21=0.311 R22=1. R23=0.771 R2y=0.68 R31=0.507 R32=0.771 R33=1. R3y=0.89 近似矩阵为相关系数
说明:
如上图:实测点全部落在线上,说明误差小,模型效果好。
Sig即α
Sig=0.000……1 模型在此值上显著
Df1(为第一个自由度)=1
Df2(为第二个自由度)=n-1-1=10
R方是相关系数。
R方=0.999
常数=a=0.838 b=1.049
4.一元非线性回归模型:
说明:
由上图及下表综合分析:
F值要选最大的
R方选最大的
Sig.要找最小的
综合分析:取R方=0.997 F=1469.738 sig=0.000……可判断,点大多落在对数曲线上,所以为对数曲线
a=0.449 b=0.049
确定模型Y=0.449+0.049X
5.多元线形回归模型
说明:
样本个数7
系数表:
三元线性回归模型为Y=b o+b1X1+b2X2+b3X3
b o=-28.817 b1=1.132 b2=0.056 b3=0.111 模型:Y=1.132X1+0.056X2+0.111X3-28.817 Anova b:
回归平方和为308.842
残差平方和为10.838
L yy总计=319.680
Df1=3
均方即回归平方差
F=28.497 sig=0.010
模型在sig=0.010上显著
6.逐步回归模型(最优模型)
说明:
样本29
b0=367.737 b1=27.910 b6==-14.801 b5=46.737
最优模型:y=367.737+27.910x1-14.801x6+46.737x5
7.聚类分析
* * * * * * * * * * * * * * * * * * * H I E R A R C H I C A L C L U S T E R A N A L Y S I S * * * * * * * * * * * * * * * * * * *
Dendrogram using Average Linkage (Between Groups)
Rescaled Distance Cluster Combine
C A S E 0 5 10 15 20 25
Label Num +---------+---------+---------+---------+---------+
4 -+---+
5 -+ +-------------------------------------------+
6 -----+ | 1 -+---+ | 3 -+ +-------------------------------------------+ 2 -----+
说明:
由树状图,分为两类。
4、5、6为一类,1、3、2为一类
8.主成分分析
说明:
解释的总方差表中:
合计为特征值(第一特征值为4.838、第二为1.706…….)
方差的%为贡献率
累积%为累积贡献率
第三个的累计贡献率在为83.982,符合
成分矩阵表:
成分矩阵即为主成分载荷
1、2、3分别代表:z1、z2、z3三个综合指标而表中表示的是变量与主成分之间的相关系数
计量地理上机实验
学院:地理科学学院
姓名:李阳
学号:20091101500。