空间数据库的构建
第21卷第3期
2002年9月《新疆师范大学学报>(自然科学版)JournalofXinjiangNormalUniversity
(NaturalSciencesV01.21,No.3Sub.2002Edition)
空间数据库的构建
杨雪峰
(新疆师范大学生命与环境科学学院,乌鲁木齐,830054)
提要面对地理信息系统中大量的数据处理和管理问题,一个重要的解决方法是构造一个空间数据库,本文首先探讨了
建立一个空间数据库的基本理论问题,其中包括元数据的概念,及元数据在空间数据库中的作用,之后论述了两种空间数据库的构建方法:基于文件管理的方法和空闯数据库管理的方法。两种方法都以模块化GIS环境(MGE)为例进行说明。
关键词空间数据库MGE
[-TP311.1313中图分类号:文献标识码:A文章编号:1008—9659一(2002)一03—0018—08
空间数据库构建的意义
长期以来,地理研究主要用野外考察和调查的方法,研究资源环境的过去、现在和未来,其研究成果为定性的报告和图件,而不能数量化,普通图件或者属性数据库,无法在制定重大的宏观决策时提供准确的基础地理数据,这无论对提高研究工作效率还是成果应用效益都不利。因而,迫切需要有新的技术方法和手段改变这种状况,要做到这一点,建立基础性的空间数据库是先决条件。
与此同时,大量资源、环境、自然灾害、可持续发展问题的分析和监测应用,以及遥感、GPS等空间信息技术的飞速发展也在为GIS提供更多更高质量的数据源并且提出更高的要求,因此,处理分析多分辨率、多时空维、类型复杂的海量地理数据的技术愈发成为地理信息发展的瓶颈。“数字地球”的提出高度概括了空间数据集成和一体化的概念。
资源环境监测的数据通常分散在多个子系统中,每个子系统有不同的平台和数据更新周期,而且子系统中的某个数据元素可能在相关的另一个子系统中有着不同的含义,在此情况下数据质量无法得到保障。
资源环境数据仓库是面向资源环境的、综合的、不同时间的、稳定的数据集合,它有助于对资源环境决策的数据收集、分类和整理,并用于支持资源环境管理的决策制定过程。国家决策部门可以方便地访问以各种形式存储于资源环境数据仓库中的信息。
数据仓库化是资源环境数据处理的过程,它将资源环境各个部门内分散的原始监测数据和社会经济部门外来的数据汇集和整理在一起,为国家提供完整、及时、准确和明了的决策信息,使国家有关决策部门能够真正地利用决策支持分析工具直接从资源环境信息池中随机地提取、分析数据,有效地服务于国家资源环境的全方位决策。作为一个决策环境,资源环境数据仓库收集存储了各种不同数据源中的数据;通过对数据的集成给国家有关决策者提供了分布在全国各个系统,跨平台的数据,它帮助用户从传统的公共数据访问模式过渡到信息的访问,实现了将数据转化为信息、转化为知识的过程。
作为研究人口、资源、环境、经济及其相互作用的资源环境决策支持系统,着重于研究各对象之间的信息
[收稿日期]2000.3.12[作者简介]杨雪峰(1972一),男,汉族,硕士,现在新疆师范大学地理系从事GIS教学与科研工作.
・62・新疆师范大学学报(自然科学版)
流、用来预测、规划和管理物质流和能量流,以便进行合理的人为干预。为了开拓资源环境研究的深度和广度,必须将科学理论、经验知识和专家判断有机地结合起来,实现决策与知识的综合集成,而建立资源环境数据仓库正成为资源环境科学研究的基石。
社会的需求不仅仅对于一般信息资源,也包括空间信息资源。GIS的全数字图形化方式正在影响着人们对信息的需求。同时,地理信息系统在商业化的进程中逐渐采用的组件式GIS、与关系型数据库的集成,使其逐步融入主流的信息产业,使不问平台的数据交换成为可能。一个全面的区域空间数据库的建立和发展对于这一区域各部门的需求都是必要的。
2空间数据库构建的理论基础
GIS系统的数据库设计和建立是一个系统建设的基石。随着计算机技术的迅速发展,运算和存储海量数据的问题已基本得到了解决。当前GIS数据库建设面临的主要问题是如何进行综合数据的归一化和定量化表达。一个跨部门、多学科结合的空问信息数据库中包括不同来源和不同类型的数据资料,例如地面观测点数据、遥感影像数据、基础地理数据以及其它空间相关的数据库,如何有机地把不同来源和不同类型的数据组合到一个数据库中,就显得非常重要。目前对矢量数据库的管理较为成熟,但对遥感影像数据库、DEM模型数据库以及三库集成的管理还比较落后。
随着传统数字化地图建库周期长、时效性差等问题的日益突出,信息量丰富、更新及时、利用价值高的遥感影像和DEM模型更将成为未来数字地图的基础。因此,应在建立和完善矢量数据库的基础上,开发影像数据库和DEM数据库管理系统。
数据库设计的概念,除了遵循传统的数据库设计的理论和方法,即在遵循规范化设计的基础上,还要注重其自身的特点。在此之中,一个重要的概念是元数据的概念。从某种意义上讲,它决定了空间数据库的集成效果和使用效果。
元数据库是关于数据库描述信息的数据库,主要目的是将整个集成系统的各个数据库信息纳入系统的统一管理之下,形成地理信息系统的数据仓库,并维持整个系统数据的完整性,在此基础上实现数据库的集成。
从实际需要出发,各种类型的地理信息元数据库至少应包括如下内容:
2.1RS影像库(栅格数据)的元数据库:包括影像编码、影像类型、内容描述、成像时间(季相和时相)、影像空间范围(最小外接矩形经纬度)、存储格式、存储位置(网络地址)等。
2.2数字地图数据库(矢量数据)的元数据库:包括数字地图数据库编码、数据库名称、主题描述、存储格式、比例尺、投影方式、空间范围(最小外接矩形经纬度)、建立时间、网络地址、连接的统计数据库序号等。
在基于元数据的地理信息系统数据集成平台上可实现以下功能:
2.3在数据库集成平台上直观显示整个集成系统数据集的空间范围,并可对每个元数据项代表的具体数据库进行可视化信息查询。
2.4集成平台服务器实现按照时间、空问、属性等单要素或其组合的元数据库查询,返回相应的元数据库数据项。
2.5根据用户要求和元数据库数据项的内容,自动生成相应的RS、GIS功能软件宏语言或API调用,启动相应的功能软件进行数据处理,并将处理结果返回给用户。
2.6通过RS影像号实现了RS影像库和RS信息提取库之间的有机和动态连接;RS信息提取库和GIS数据库都属于空间矢量方式,可以用同样的方式进行处理。通过这种有机动态连接,保证了整个数据的逻辑完整性。
2.7使各数据库的存储不局限于特定的物理位置,而可以存储在系统的任何位置,只要在元数据库中相应注册即可,因此增强数据管理的灵活性。
第3期杨雪峰空间数据库的构建・63・
图1元数据库设计
3空间数据库构建的方案
数据库是地理信息系统重要的核心部分,数据库设计质量的好坏,不仅影响到系统建设的速度和成本,而且影响到系统的运行,应用和管理。数据库存放的数据有两大类:空间数据和属性数据。数据库设计时考虑最多的是空间数据与非空间数据相对独立问题和空间数据分布式处理的问题,传统GIS数据库的设计方式用图形数据库系统管理空间数据及部分非空间数据,另一部分非空间数据以分布式关系数据库系统管理,空间数据与非空间数据按照唯一标识码进行连接。这种数据库结构是空间数据与非空间数据在物理上分离,逻辑上统一相连。这种数据库的设计方式主要原因是传统的GIS,RDMS技术不能适应多种多样的数据源,导致空间数据,属性数据及其它数据的分离,只能在一个相对松散的环境下结合起来。随着GIS技术和数据库技术的发展,出现全关系化的数据库设计模式。下面分别从这两种设计模式出发讨论空间数据库的设计。3.1基于文件的空间数据库设计
这种设计就是传统GIS数据库的设计方式,这里是在MGE环境下的设计过程。模块化GIS环境(MGE)及其配套产品是Intergraph公司的GIS产品。模块化概念方便了用户的理解与应用。开放和创新的开发原则为用户提供了基于非专用软硬件平台的GIS集成方法。本着方便用户的想法,Intergrapb的公司的软件产品始终保持着相同的数据格式。不管采用何种操作系统与平台,几年前生成的数据仍然可用于最新版本的软件而无需进行大量的输入和输出处理工作。MGE可以运行在Windows95、98及NT上,并且支持多种网络环境。
3.2MGE的软件结构
MGE采用混合结构的数据模型,即采用关系数据库管理属性数据,专门的空间数据管理系统管理空问定位数据,通过MGE的RIS(relationalinter{acesystem)模块或ODBC,可以挂接多种对用户透明的关系数据库管理系统,如Oracle,Sybase,Ingres,Informix,SQLServer等,这种结构保证了软件界面和菜单的一致性,方便了用户的使用和开发。
・64・新疆师范大学学报(自然科学版)
MGE通过定义项目(project)来存贮、管理空间数据。Project是MGE中组织图形文件、属性表格和其它辅助文件的基本结构。
3.2.1NIGE下的数据库设计
MGE环境下数据库设计流程,主要包括三个部分,即需求分析、逻辑设计和物理设计.如图:
数据库逻辑模型设计
数据库物理模型设计l’]定义FEATURE的属性
图2MGE数据库设计
设计主要内容包括:确定数据库及属性,定义每一种属性,坐标登录。
3.2.2确定数据层及属性。设计数据库的第一步是确定数据库应包括什么数据,这分两步处理:a确定地理特征及其属性。b数据层组织。当确定了必要的特征及相应的属性后,就可以进行数据层组织,地理特征的类型分为点,线,面边界,面中心,标签,未定义。
3.2.3定义每一种属性。在MGE中,属性定义用特征,特征类型,分类表,层线宽,色彩及相应属性表等来实现。
3.2.4坐标登录。当确定了数据层后,应确保同一地理区域的各个数据层是与地理位置严格一致的。
3.2.5空间数据进入数据库。空间数据进入计算机建立数据库有两种方法:a.数字化。MGE数字化的方法有栅格数字化。b.由其它系统导人。MGE除了提供了传统的与其他GIS的转换功能模块外,新的7.1版本核心功能增加了使用了Geomedia技术的Geoclient模块,可以不加任何转换的将dgn、dwg、Arc/Info、ArcVew、Maplnfo、MSAccess、OracleSC等多个GIS数据源的数据直接读取,置于一个统一的系统中,查询、分析等操作结果与原始数据动态连接。
3.3数据库的集成策略
这里的集成指的是把物理上相对独立分布的数据库,通过GIS系统软件平台,形成一个逻辑上集中的空间数据库群,从而在GIS软件提供的信息查询和空间分析的基础上,产生能够满足不同用户不问需求的地理空间信息。
MGE环境下的数据库集成是通过底层关系数据库MSsqI。Server或oracle的视图(View)实现的。视图是一个数据库对象,是通过对数据库的查询而建立的虚拟表,有命名的行和列,和其它表一样用户可以对它进行任何的操作。但视图并不是作为数据集存储在数据库中,它的数据来自基表。当用户修改视图时,实
第3期杨雪峰空间数据库的构建・65・际上是对它的基表进行修改,而对基表的修改会自动地映射到它的视图中。根据这一机制,建立各个数据库的系统表和用户自定义的属性表的视图,从而实现数据库的集成。
由于1:10万矢量数据库是核心数据库,在集成时把它作为主数据库。把MGE系统表建立在主数据库中,并通过视图把系统表映射到其它数据库:同样通过视图把其它数据库用户自定义的属性表映射到主数据库中。通过主数据库可实现对所有数据库的访问,实现了各数据库的集成。图形数据存储在服务器不同的目录下或网络环境中不同节点上。通过集成在MGE已平台上形成了九个逻辑上集中的数据库群,从而可以充分利用MGE区提供的查询和分析功能,产生满足不同需求的空间信息,提高了系统的运行效率。系统逻辑结构如下图所示:
地名数据库其它
姆
影V≯
V1eW像
库蛹1:10万欠量数据库v{a口lDEM库
图3空间数据库集成
集成的核心是将分散的子系统形成一个统一的整体,以取得系统的协同效益。近年来,随着GIS应用的广泛和深入,已建立了一大批地理信息系统。随着网络技术的发展和实际的需求,这些分散的系统要求集成运行,以实现信息共享,提高系统运行效率。同时各个数据库仍是独立的子数据库,可以独立运行,方便了各个数据库的维护和扩展。
这种结构是基于文件的,图形数据、影像数据、DEM数据都以文件的形式.存储在网络环境下的计算机中。这实际上包括了两部分的内容,一是通过相关界面系统(RIS)实现。RIS允许通过一个分享内存连接到数据库,也允许通过TCP/IP,XNS,DNP和ISO协议通过网络数据远程登录到数据库。如果当地数据管理管理员同意,可追加远程数据管理表。另一部分是通过网络文件系统(NFS或NFM)实现的。采取NFS的节点提供有用户权限用户远程登录作为当地驱动器的能力。系统物理结构可能如下:
2
圈4MGE数据库物理结构这种设计系统的安全性由MGE系统和RDMS系统共同提供,RDMS提供用户权限和访问权限,
・66・新疆师范大学学报(自然科学版)2002年MGE系统负责用户及权限审核。数据的分布式管理由MGE核心提供。
这种数据管理集成方式的缺点是各种数据,特别是图形数据和属性数据分开放置,在有些情况下,容易造成两者间的不一致,并且分开管理也增加了管理的难度。
3.3.1全关系的空间数据库设计
比较理想的方式是各类数据的集中存储,至少是图形数据和属性数据的集中存储。
当今主流数据库仍然是关系模型数据库,传统的关系数据库在处理空间数据上遇到了很大的问题,使得空间数据库在一段时间内未能获得突破。一些世界著名的GIS厂商相继开发了一些基于网络环境的同时存储空间与属性数据的地理信息系统软件,其中主要的有Arc/Info的SDE及oracle的SDo和SC另外还有Maplnfo的SpatialWare等。
ESRI的SDE产品扩展了关系数据管理功能,在其中增加了管理空间数据的功能,例如在。Oracle和Informix上。SDE对空间数据的存储,是通过将空间数据加到关系数据库中来实现的。SDE数据的访问方法同访问关系数据库的方法大致相同:连接SDE数据库;定义SQL查询;执行查询;提取记录;循环访问记录集中的每一条记录。ArcView作为客户端软件以文件共享方式访问Arc/Info服务器,并且Arc/info,Arcview可以通过SDE来访问ORACL空间数据库(集成空间地图数据和属性数据),从而提供网络化GIS.如下图所示:
客户端服务器端
结果返回
图5全关系空同数据库方累一
从ESRI产品的广泛应用程度上说,这种方案是比较理想的。
根据实际条件,采用的是第二种方案,即IntergraphGeoMedia,MGE与OracleSc。
Oracle早在其7.3版本中增加了管理空间数据的模块SDO,在8.O版本中改进为SC,Intergraph公司与ORACLE结成技术联盟,由ORACLE的SDO提供综合空间数据(图形和属性)的管理和存储服务,ORACLESC(Spatial--Cartridge)Oracle具有如下突出的优点:
3.3.2支持大型数据库和多用户高性能事务处理
Oracle支持最大的数据库,其大小可到8TB,可充分利用硬件设备。支持大量用户同时在同一数据上实现各种数据应用,并使数据争用最小,保证数据一致性。系统维护具有很高的性能.适合空间数据的海量存储和密集空间操作的需要。
3.3.3具有可移植性、可兼容性和可连接性由于Oracle软件可在许多不同的操作系统上运行,因而在Oracle上所开发的应用可移植到任何操作系
第3期杨雪峰空间数据库的构建・67・统,只需很少修改或不需要修改。Oracle软件同工业标准相兼容,包括许多标准的操作系统,所开发应用系统可在任何操作系统上运行。可连接性是指Oracle允许不同类型的计算机和操作系统通过网络共享信息。适合建立大范围的异构环境下的大型空问数据库。
3.3.4先进性
从最早的关系型数据库到Oracle8,一直到最新的全面Internet的数据库Oracle8i(它把数据库和Internet彻底地结合在一起),其技术都处于领先地位。在此基础上,适合在更广泛的领域范围内实现数据集成和共享。
INTERGRAPH公司宣布其新产品均将接受SDO,SC数据存储方式,并在其新产品GeoMedia中实现了对ORACLESDO数据的操作。GeoMedia是利用Intergraph公司最新Jupiter技术而开发的第一个以数据库为中心的Gis产品。Jupiter是一个开放的标准环境,它可以创建一个纯Windows的应用,而不需要传统的CAD内核,不需要在Windows操作系统上再额外加一层。
对于桌面GIS产品来说,其数据管理方式则利用了最新的数据仓库管理技术,即将空间图形信息,和属性信息全部存放在关系型数据库管理系统中,用户在Gis系统中见不到任何零散的文件,所有信息的管理和查询处理均在关系型数据库管理系统中进行。数据质量的管理除在GeoMedia中控制外,更重要的是在关系型数据库管理系统中严格执行。充分利用关系型数据库管理系统中的数据安全管理方式和质量控制体系来保证Gis数据的完善与安全。
GeoMedia重要特性之一是多数据源访问一一允许同时获取多种数据源的数据:MGE、framme、Arc/info’、ArcView、Maplnfo、OracleiSDOSC、MSAccess和CAD文件。
Mge如前所述,新的7.1版本核心功能增加了使用了GeoMedia技术的GeoClient模块。这些条件具备了在此基础上构筑能够运行在多种网络环境下的一体的空间数据库系统。
这种搭配结构性如图所示:
—曳
狐apinfo
Client
图6全关系空间数据库方累二
(注:ArcView3.1中增加了处理MGEProject的能力,Maplnfo5.5以上增加了对OracleSc的支持能力)
此系统的核心是GeoMedia。由于我们使用的ORACLE8.0未带有SC模块,GeoMedia在用到Oracle时并不需要SC或SDO,GeoMedia可创建同样格式的数据,并可以从外部连接或修改它自己创建的空间数据。通过GeoMedia从多个GIS平台的数据源中抽取特征要素和属性记录,经过重定义放到当前工作空间
・68・新疆师范大学学报(自然科学版)
(Workspace)中,可以进行测览、编辑生成新的SC库,再导入Oracle中,形成SC数据层。不同空间数据的安排可以有多种选择,可从易维护性和使用性上考虑,最常用的是把不同主题的数据分别放置到不同的数据库中。
系统的安全性和并发性控制统一由Oracle负责。本系统中所处理的数据对区域的发展具有重要意义,不能允许所有用户随意存取和更改。因此必须对系统数据的存取和改动进行严格的控制,保护和存储服务器中的数据。系统还应对用户的登录权、管理任务操作权、数据库访问权限等其它方面具有高度控制能力,以杜绝对数据的非法操作,造成不可估量的损失。此系统的安全机制全部由Oracle提供,由Oracle负责用户审订,数据库访问权限,存取控制,排斥可疑数据等.并提供所有数据的一致性检查。
4结论
系统有许多尚待改进之处,需要建立用户赖以从资源环境数据仓库中获取所需信息的工具,这种工具应建立在元数据的基础上,如何在元数据的框架内组织和运用所有的空间数据,这是系统可用性和完整性的重要基础。在对元数据和其它各类数据的理解及结合方式的研究将促进系统基础的形成。可行的技术方法主要是在Oracle,Geomedia系统上的二次开发。GeoMedia提供了大量的可视化编程对象,Oracle本身就有众多的开发工具。在此基础上,容易建立易用的,在元数据框架上的空间数据库系统工具和用户工具。
参考文献
朱翊.空间数据的全关系化管理应用尝试.遥感信息,1999,55(3)
邹逸江.客户机/服务器结构的地图数据库系统设计.测绘学报,1999,28(3)
毛锋.地理信息系统一一MGE方法.石油工业出版社,1997
毛锋.地理信息系统建库技术及应用.科学出版社。1999
张健挺,万庆.地理信息系统集成平台框架结构研究.遥感学报,1999,3(1)
李岩.迟国彬,廖其芳,李鹏德.地理信息系统软件集成方法与实践.地球科学进展,1999,14(6)
沈体雁,程承旗.地理无数据技术系统的设计与实现.武汉测绘科技大学学报,1999,24(4)
许云涛,李华;李春裸,郑蕾.多种GIS系统集成模式的讨论.测绘信息与工程,1999,4
TheBuildingofGISSpatialDatabase
YangXuefeng
(GeographyDepartmentofXinjiangNormalUniversity,Urumqi,830053)
Abstract
ofdataTheconstructionofaspatialdatabaseisavitalsolutiontotheproblemsofpaperagreatamountprocessingandmanagementingeographicalinformationsystem.This
afirstlydiscussesthebasictheoryofconstructingspatialdatabase,includingthe
onconceptofmeta--dataanditsfunctioninthedatabasetwowaystospatialdatabase.Secondly,based
constructthedocumentmanagementandthespatialspatialdatabasesareproposed.BothhavebeenillustratedbyMGE.
MGEKeywordsSpatialDatabase