4GIS空间数据库

  • 格式:doc
  • 大小:52.50 KB
  • 文档页数:6

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第四章GIS空间数据库

第一节空间数据库概述

一、数据库概念

数据库有三个基本部分组成:

⑴ 数据集(库):按一定结构组织起来的相关数据的集合,既包括数据与数据间的联系。

⑵ 物理存储介质:计算机的外存与内存储器,外存存储数据,内存存储操作系统与数据库管理系统,并有一定数量的缓冲区,用于数据处理。

⑶ 数据库软件:核心是数据库管理系统(DBMS),对数据进行建立、定义、管理与维护,还有数据库应用系统,通过空间分析模型对数据进行分析与决策。

二、数据库特征

⑴ 数据集中控制维护管理。

⑵数据独立于应用程序。

⑶ 数据共享,多用户可同时存续数据,提高使用效率。

⑷ 减少数据冗余,提高数据的一致性。

⑸ 数据结构化,数据按一定结构形式构成,数据间具有联系。

⑹ 数据保护功能,具有使用权限,确保数据安全。

第二节数据模型

一、关系模型

关系模型是以数学理论为基础构建的数据模型,它把复杂的数据结构归纳为简单的二元关系,即把每一个实体集看作是一个二维表。关系模型是用一个单一的二维表结构表示实体及实体间的联系,而满足一定条件的二维表称为一个关系。其中每一行是一个实体(记录),每一列是一个实体属性(字段),表中第一行是各字段的型的集合。

作为一个关系的二维表,必须满足以下条件:

⑴ 表中的每一个属性值都是不可再分的基本单元;

⑵ 表中每一列的属性名必须是唯一的;

⑶ 表中每一列必须有相同的数据类型;

⑷ 表中不能有完全相同的行;

关系模型的最大特点是描述的一致性,结构简单清晰。显然,实体及其联系在关系表中一目了然。也可以通过关系之间的连接运算建立新的关系,对关系数据库的查询和统计操作均通过布尔逻辑与数学关系运算实现。关系模型存取路径完全对用户隐蔽,使程序与数据具有高度的独立性。关系模型使用与维护方便。

由关系数据结构组成的数据库系统称为关系数据库系统。在关系数据库中,对数据的操作几乎全部建立在一个或多个关系表格上,通过对这些表格的操作来实现对数据的管理。

二、层次模型与树结构

层次模型是在数据处理中发展最早、技术上已成熟的一种数据模型。他的特点是将数据组织成一棵有根结点的定向的有序树(树指无回的连通图),它是一棵倒挂的树,树分根、枝、叶。它必须满足两个条件:①有一个结点,没有父结点,②其它结点中有且仅有一个父结点。没有父亲的结点称为根结点,其余的结点称为从属结点。从属结点中有下属的为枝,无下属为叶。从根结点开始按父子联系依次连接的结点序列称为层次路径。如一所高校,它由校、院、系、专业、教师、学生等构成,其结构图就像一棵树,校是树根(称根结点),院、系、师、生等为枝(结点),枝结点向上向下都有联系,向上只能有唯一的联系,向下可有若干联系,向下无任何联系的为叶,如具体某个学生。在层次模型中,必须按照从根开始的某条路径进行访问。

层次模型表达的实体间的联系是一对多关系,当实体具有层次关系时,适宜采用层次型数据库进行管理。一对多关系指一个父属性对应多个子属性,而一个子属性只对应一个父属性。层次模型中一切联系都是向下的。

在树形结构中,表示方法是多样的。如一本书A分为B、C两章,B章又分为D、E、F三节;C章分为G、H两节,E节又分为两小节I、J。

三、网状模型与图结构

用丛结构表示的实体间的联系模型叫网状结构模型。层次模型根结点只有一个,根以外的其它结点只有一个父结点,若打破此限制,则层次模型就形成了网状模型。因此网状模型是在层次模型基础上发展起来的,层次模型是网状模型的特殊形式,网状模型是层次模型的一般形式。

从另一个角度上讲,网状模型是在层次结构的基础发展起来的,它扩充了层次结构对联系的限制,因此可灵活地表示实体间的多种关系。它需满足以下条件:

⑴ 可以有一个以上的结点没有父结点。

⑵ 至少有一个结点有多于一个的父结点。

⑶ 结点间可以有多种联系。

四、三种数据模型的比较(见黄杏元等地理信息系统p126表4)

(一)三种数据模型优缺点分析

目前,不同的地理信息系统分别用到了以上三种模型。以上三种模型可分为两类,其中层次模型与网状模型,都依赖于某种固定的连接关系。层次模型,记录按树结构存储,而且所有记录只能有一个所有者,用户可以通过路径与其它记录的连接来存取每一个记录。网状结构是层次结构的一般形式(层次结构是网状结构的特殊情况),在网状结构中,一个已知的记录可以有多个所有者等。在层次与网状结构中,数据库中最低层的记录如果不与它的父记录发生关系就会失去意义,这样的模型,叫做面向结构的模型。而关系模型可称为面向操作的模型。

⑴关系模型是潜力较大的模型,也是微型机上使用最多的模型。所谓关系模型就是一个二维表,表中数据本身自然地建立起它们之间的联系,并用关系代数与关系运算来操作数据。它的数据结构灵活、清晰,通过逻辑运算与数学运算进行查询、检索、修改、运算,数据易于更新。关系模型在数据库中增加数据项的方式有两种:一是产生一个新表,二是向已有的表中追加数据项。当数据库需要修改或更新时,不需要重新组织数据结构。关系模型的缺点是没有预先考虑存取路径,因而使查询速度非常慢。

⑵层次结构的优点是容易理解,易于更新与扩充,但查找比较麻烦,需要大量的索引文件,某些数据可能重复多次,因而冗余量大。

⑶网状结构中的任一记录可与任意多个记录建立关系,因此与层次模型比较,大大地减少了冗余,在表示关系复杂的地理数据和网状特征的地理实体效果好,但网状结构数据指针比较复杂,数据更新要繁琐。

从本质上看,层次与网状模型是相同的,在逻辑上它们都用结点表示实体,用连线表示实体间的联系;从物理上,它们都用指针来实现两个文件间的联系,只不过网络模型中的连线、指针较为复杂而已。

(二)传统数据库管理系统的局限性

以上三种模型可以说是传统的数据库模型,在数据管理上有明显不足:⑴传统数据库主要处理的对象是属性特征的数据,只能操作和查询文字和数字,无法有效地支持复杂对象如图形图像等,而地理空间数据中有大量的空间数据需要操作和查询;⑵ 传统的数据库管理系统管理的是不连续的相关性较小的数字和字符,而地理数据是连续的,而且有很强的空间相关性;⑶传统数据库系统管理的数据类型较少,空间关系简单,而地理数据类型是多样的,并存在着复杂的空间关系;⑷ 传统数据库不能以自然的、接近人类思维的方式表示实体及其联系。

为了更好的模拟和操作现实世界中的复杂现象,克服传统数据模型的局限性,人们从更高的层次探讨新的数据模型。包括:⑴以数据库设计为背景而产生的实体-联系(E-R)模型;⑵从操作角度模拟客观世界且具有严密代数基础的函数数据模型;⑶对事物及其联系进行自然表达的语义网络模型;⑷基于图论多层次数据抽象的超图数据模型;⑸基于逻辑的演绎数据模型;⑹面向对象的概念和面向对象程序设计为基础的面向对象数据模型。其中面向对象的数据模型是高层次模型的最重要发展。