GIS发展存在的问题
第16卷第2期 2007年4月 ENGINEERING
测 绘 工 程 Vol.16l.2
, 2007 OFSURVEYINGANDMAPPING Apr.
GIS发展存在的问题
胡圣武
(河南理工大学测绘学院,河南焦作454000)
摘 要:通过理论分析与GIS发展的历程相结合的方法研究GIS发展存在的几个理论问题:空间数据概念的完整性、空间数据量、面向多维空间、动态分析的空间数据结构、3DGIS、空间数据质量、空间数据的及时更新以及GIS空间数据的初始化和空间尺度等。这些问题目前还没有得到很好的解决。文中对GIS的基本理论存在的问题进行了系统的研究并指出其重要性。
关键词:GIS;空间数据;多维空间;空间尺度;空间数据质量
中图分类号:P208 文献标识码:A 文章编号:1006-7949(2007)02-0006-05
ResearchonsomeproblemsinGISdevelopment
HUSheng-wu
(SchoolofGeodesyandGeomatics,HepnanPolytechnicalUniversity,Jiaozuo454000,Hepnan,China)
Abstract:ItadoptsamethodthatiscombinedbetweentheoryanalysiswithGISdevelopmentcourse.Someprob-lemsofGISspacedatahavebeendiscussed,suchasitsconcept,3DGIS,quality,structure,initialization,datatimelyupdataspaceandspacemeasurement,etc.Theseproblemshavenotbeencommendablysolvedatpresent.BreakthroughinnovationpointofitisthatitpresentssomeproblemsinGISbasetheoryandpointsouttheim-portanceoftheproblems
Keywords:GIS;spacedata;mult-idimensionspace;spacemeasurement;spatialdataquality 回顾地理信息系统(GIS)发展的历史,可以看出:1)其发展轨迹由地图学到地图数据库,再到计算机辅助制图,然后到今天的地球科学与信息学的合成)))地球信息学,学科本身不断发展并融合其它相关学科;2)GIS的应用领域不断拓广,应用层面也不断深入;3)对分析功能的关注程度逐渐加强。
GIS的功能主要体现在3个方面[1]:数据库功能、可视化功能和分析功能。当前地理信息的管理及可视化已囊括了相当范围,包含对地理空间实体的定位、浏览、查询、管理和动态监测,属性数据的统计分析等方面,理论较为成熟,在实践中也有广泛的应用。然而,作为GIS区别于MIS或其它信息系统的一个本质特征,不管是理论研究还是实践应用,空间分析都是一个相对薄弱的环节[2]。对已有地理信息数据的深入分析、预测及动态过程的管理和控制等分析功能,实质上会产生更巨大的社会、经济效益,具有更广阔的发展前景。因此,地理信息分析必
收稿日期:2006-07-26
项目来源:国家自然科学基金资助项目(40474003)作者简介:胡圣武(1970~),男,副教授,博士.
将成为今后GIS研究的重点和热点。
空间分析是地理信息分析的重要方面,相对属性数据分析来说更加复杂,学术界对此也倾注了更多的重视。但是,关于GIS空间分析的几个基础理论问题,如空间数据概念的完整性,空间数据量,GIS的基础空间尺度等,以往的研究还有所欠缺。因此,使得GIS的发展在目前遇到了一些困惑,或者说难以解决的瓶颈问题。本文试图对这些问题进行较为明确的阐述,以供讨论。
1 地理信息空间数据
地理信息是指与研究对象的空间地理分布有关的信息,它表示地球表层物体及环境所固有的数量、质量、分布特征,相互联系和变化规律。地理信息从哲学角度来讲,可以分为质、数、时、空4类;从地学的角度讲,可以分为空间数据和属性数据。质、数、时特征属于属性数据,空特征则属于空间数据。
第2期 胡圣武:GIS发展存在的问题#7#
空间数据是实体本身的地理属性,包含实体本身的位置数据以及实体间的空间关系数据2部分,是地理信息的本质特征。笔者认为:以往对于地理信息的空间数据的认知不够完全,完整的空间数据概念由/位0、/邻0、/近0、/势04类信息综合描述更为全面和妥当。对于这4类信息笔者的定义如下:
/位0即空间点、线、面实体的位置数据。如经纬度,大地高或笛卡儿坐标x、y、z。这一类数据是基本的、必须的。其数据量是有限的。
/邻0即空间点、线、面实体的邻接关系数据,它们一般均通过/公共元0或/邻接元0相互关系和区分。也即讨论比较多的/拓扑0关系数据。/邻0数据是GIS空间分析的基础,如土地利用发展变化中的叠置分析。/邻0数据量远大于/位0数据量。
/近0即空间点、线、面实体间及附近空间的关系数据。如地理空间中随比例尺缩小两个实体间在符号化时的压盖、避让等关系数据。/近0数据量是巨大的,在矢量数据结构下,显式地组织是有相当困难的。
/势0即空间全部实体间的相互关系,它也表明空间各实体对空间任一点的影响,如空间中/场0的概念。势数据蔓延整个地理空间,无边无涯。目前看来,矢量实体目标间的/势0关系尚无法表达。显然,/近0及/势0,所描述的是对各实体本身以及实体外的空间关系,对准确刻划空间实体特征是非常必要的,并与现代科学关于空间是决定于物质及运动的观点是一致的。
现象能够进行跨比例尺、多分辨率三维虚拟表示,甚至是跨时间维的动态过程,不但要求在空间上综合,还在时间上综合。这时除了/邻0数据外,必然还需要空间的/近0和/势0关系数据。
GIS学科本身的发展历程正说明了这一点:要完整地描述空间实体的位置、形态、空间分布和相互关系,/邻0、/近0、/势0信息是必不可少的;应用越广越深入,对于空间关系数据的需求也就越全面。完整的空间数据概念是解决空间数据的处理、综合和分析必要的数据基础。举例说明如下:
机助编绘问题。单个空间实体的绘制,知道其空间位置和类别数据,即可进行符号化,即制图学中/清绘0,无论它本身的形状怎样综合,可以不涉及其它,这种绘图系统已十分普遍。
随着比例尺的缩小,解决多个点、线、面实体间的压盖、避让需要/近0数据。在进行编绘时,对/近0数据的需要,甚至还是动态的,在人工参与的情况下,人眼不断扫描,并时刻监视它的移动和压盖来完成这一操作,这一动态过程实际上是以不断变化的/近0关系数据为基础的。由此可看出,/制图综合0这个国际难题的关键,实质上是空间数据及其组织问题。
GIS网络分析问题。空间关系数据在网络分析的各个内容上都有体现。
1)相应于/邻0问题,如连通分析中的/爆管分析0;
2)相应于/近0问题,如路径分析中的最短路径、最小生成树。对一般障碍条件下的最短路径(ES-PO)求解问题,/迷宫导引0问题;
3)相应于/势0问题,如著名的/货郎担0问题是要考虑网络中所有实体间的相互关系,才能做出判断,至今未解;
4)网络中的P中心设置、空间网络设计问题,综合考虑/近0和/势0,都是在实践中尚未解决的难题。
随着GIS的进一步发展,作为空间分析的基础)))空间的/邻0、/近0、/势0关系数据会越来越重要,理应得到人们更广泛、更深入地关注。
2 空间数据与GIS的发展
在GIS发展的起源传统的地图学时代,在纸质图上集中关注的是地理空间中各个实体的位置数据。到了计算机技术飞速发展的20世纪70年代,
空间信息的传输由简单线划变成多媒体形式,虽然这些信息的表达形式和手段越来越丰富,但其功能的出发点还是传统研究GIS的角度)))主要用于计算机辅助制图,把描述或表现的重点放在/位0数据和少量的关系数据上。如现行矢量型GIS平台Arc/Info、MGE等均构造在矢量的分层拓扑模型之上,它给出了空间的/位0、/邻0、/层0的概念,对于GIS的空间分析发展是一个巨大的飞跃:依赖/位0和/邻0数据,使得能够轻松地对空间的点、线、面进行缓冲区分析、叠置分析。人们在对GIS这种出色的特性感到兴奋的同时,逐渐又提出了更高的要求。这其中一个重要的例子即是制图综合。如/数字地球,3 GIS发展存在的问题
3.1 空间数据量问题
对于描述空间的这4类数据信息,/位0、/邻0、/近0、/势04类数据的复杂性依次增强,数据量也依次增大。/位0数据是最小的,邻近关系数据相对于0
#8#测 绘 工 程 第16卷
实体间的相互关系、相互作用,如物质流、信息流、能量流,数据极其复杂。对于空间实体的相互关系,从邻近关系来讲,首先是全形态的相互关系,对于不等权、不平衡的相互关系;有条件的相互关系;复杂约束条件下的相互关系以及优化过程,这些数据更加复杂,其数据量惊人。如以矢量数据结构为基础的GIS网络分析中,如果有5000个结点,结点之间的通路可能达到C25000,大约12500000条,则其空间关系数据量估算如表1所示。
表1 GIS空间数据量分析
空间位置数据
/位0
结点数据存储大约需要0.04Mb,弧段数据的位置存储需要约1000Mb,总计1000.04Mb.结点与弧段之间的拓扑关系数据约需要25Mb,
/邻0
线与线之间的邻接关系约25Mb,共计50Mb(因为只是点线之间的拓扑关系,所以小于位置数据)
只单纯考虑点的/近0数据。限制在整数空间,即栅格空间近似考虑,则是5000个结点缓冲区内
空间关系数据
/近0
相互关系的数据。/近0数据量与缓冲区宽度相关。若L=1,每一个结点有8个近点,为82*C25000个关系量;若L=2,每一个结点又增加16个近点,则为(82+162)*C25000个关系量;其余类推。
/势0
区域内所有点与这5000个结点所产生的关系量,无穷大
间数据。这样庞大的数据量,无论对于数据的初始化组织,还是存储管理,都是一个瓶颈,因而其应对
方法已成为GIS发展的困惑之一。
3.2 空间数据质量的问题
空间数据的质量问题已经引起了国内外的重视,其具体体现就是空间数据的不确定性问题,目前国内外学者对此问题进行了大量的研究并取得了丰富的成果[3],但还存在如下的问题需要大力研究。
1)空间数据质量问题在GIS软件中没有专门的模块。现在对GIS的不确定性的研究还停留在理论上,GIS产品中得不到体现。
2)空间数据的不确定性的表示还没有得到圆满解决。目前对于空间数据的不确定性主要是研究位置的不确定性,主要是在/E)带0的基础上进行大量的研究,对于属性数据的不确定性的研究还较少,且如何表示还很少涉及。
3)空间数据的模糊不确定性的研究还处在初步阶段。目前对于空间数据的模糊不确定性已经引起人们的重视,但对模糊不确定性的处理、表示、控制等方面还需要进一步研究。
4)空间数据的不确定性的处理方法问题。目前对于不确定性提出了很多方法,但没有一种方法得到通用,每种方法都有局限性。
3.3 复杂动态系统的空间数据结构
动态GIS,即一个区域的多时刻的快照与某个或某些因素的动力学机理模拟和探索。复杂动态系统具有多因素、多过程、多周期、多系统特征。如/厄尔尼诺0、/拉尼娜0现象这样的大型地理实体动态模拟过程,它们具有很多的单纯过程和衔接过程,以及各个过程间的转换、分解和合并,相应的数据准备和组织形式必须系统地针对这种复杂对象而设置。传统的点、线、面、体组织方式较为适合静态数据,对于水、气等大型、动态的空间对象,则并不完全适宜。
究竟应该怎样描述这种复杂、动态系统的空间数据,对于这类问题的空间分析究竟应该采用什么样的途径或方法更为合适,这也是GIS发展的一大困惑。
3.4 空间数据的初始化问题
与前述的空间数据完整性和空间数据量问题紧密相关的一个问题)))空间数据的初始化,也是GIS发展的瓶颈之一。空间数据的初始化,简单地说即是空间分析或处理算法对起始数据的要求和具体准备,这是大过程或连续过程中最感困难的。其主要表现在:
/说明:1000个结点,500000条弧段,每一个结点以坐标对((float)x,(float)y)表示,每一条弧段以点坐标串表示,假设平均每一条弧段的点串含大约10个点。每一条弧段的路长用double型表示;点、弧段间的邻接关系由一个邻接矩阵来表示(其它表示方法虽会减少存储空间,但不会产生数量级的影响)。
由表1数据可以看出,再加上网络分析所需要的其他数据,如所有弧段的弧长及权值约需空间200Mb,这样不计/近0和/势0数据,共需要约1250M存储空间。另外,表1中对/近0数据的估算,是只考虑点的情况,如果再考虑线、面(各含有数目不
等的多个空间点)缓冲区的相互关系,那么/近0数据量远远超过/邻0数据,是无法估量的。在现有及将来可预见的有限硬件条件下,这种矢量方式的空间关系数据组织及管理起来都是有相当困难的,更不用说进行分析了。
从长远和广义角度考虑,一个理想的、大区域的GIS应用系统要尽可能涵盖多方面的用途,这导致GIS空间数据矢量初始化的时候不能舍弃/位0、/0
第2期 胡圣武:GIS发展存在的问题#9#
/势04个方面,GIS本身空间数据量非常巨大,而同时复杂过程和大过程对之要求是全面的。
2)目前计算机按照某些确定的模式(型)处理数据得到结果数据的方式和途径,使得多数情况下,依赖于矢量结构下显式的空间数据组织,这时庞大的数据量及显式数据使初始化过程难以实施。
3)GIS空间关系数据的组织过程异常困难。原来所认为的空间数据初始化的过程仅仅包含了空间/位0数据的输入,对于/邻0数据信息则归在后续处理过程中,而/近0和/势0数据,基本上没有体现。如基于矢量数据组织这些空间数据,则初始化的过程可能会包括以下几个处理过程:¹实体/位0数据的输入;º/邻0数据的组织;»/近0和/势0数据的初始化;¼/位0及其他三类关系数据的动态更新。空间中的/近0,在矢量结构中,如果通过/位0算出则效率极低,而/势0要在矢量结构中算出来极为困难,即使算得出来,工作量也难以估量。同时,实际应用中的空间数据是动态变化的,如数据更新时,仅含/位0、/邻0数据在内的拼图接边,就很耗时耗力,且经常达不到实时要求。总之,庞大的数据量,复杂而显式的结构,再加上其动态变化,地学大系统中数据的准备与组织可谓难上加难。
简化数据准备与组织过程,达到/00初始化,在复杂地理信息软件工程中非常关键。如果不能解决/00初始化,就很难做到动态处理、过程衔接和实现地球信息较大综合性过程。3.5 空间尺度问题
地理信息的分析与量度空间是分不开的。因此,采用什么样的空间尺度或空间数学基础,才能够更准确、更客观地刻划现实世界,也是一个基础的理论问题。
目前,在所有的GIS系统中均使用欧氏空间,笔者认为这个量度标准不完全合理。因为地球椭球空间才是GIS的主定义空间。欧氏空间所能解决的问题只限于相对小的、局部的、静止的问题。地球上大部分位置上的各向异性及尺度的非线性及非欧几何特点,与目前分析和处理的各向同性以及尺度均衡的欧氏空间假设,也只在小区域、低精度下才近似相容,而与中、大区域GIS和数字地球的发展趋势矛盾将日趋激烈。这可由以下两个例子来说明。
例1:相邻两个国家的12nmile的领海划分。解决这种问题的方法就不能够采用欧氏空间所定义的尺度空间,利用缓冲区进行划分,这很可能会导致不公平。因为欧氏空间的线性特点不能够准确刻划例2:/厄尔尼诺0、/拉尼娜0现象等主要全球环境问题的空间分析。类似的这种全球性环境现象显然是不适合用欧氏空间尺度来做为基础空间来进行分析的。
在量度空间上的困惑,产生了诸如以上许许多多的实际问题。准确的量度空间,在GI的理论和实践发展中都是十分急迫的。3.6 空间数据及时更新问题
空间数据是地理信息系统的血液,空间数据的质量是GIS发展的关键,没有高质量的数据的GIS只不过是一堆完美的垃圾
[4]
。由于经济的高速发
展,社会日新月异,因此空间数据的变化很快。GIS要得到真正的应用必须对空间数据及时更新。
目前,GIS的数据更新主要存在如下几个问题:1)GIS的更新数据的获取还比较困难。对于GIS数据的及时更新靠常规的测量技术是不行的,主要是依靠遥感图像。目前遥感技术虽然有了很大的发展,遥感图像的分辨率也提高了不少,但是想获取分辨率很高的遥感图像是非常困难的,主要的原因是经济的问题,目前1m分辨率的遥感图像是比较昂贵的。
2)GIS的数据更新目前还存在许多技术的问题。如:数据格式的问题,现在GIS中的数据很多是矢量数据,而更新数据是栅格数据,虽然矢量和栅格数据可以转换,但对于大量的数据更新存在不少问题;数据的配准问题、数据更新位置的确定等。3.7 3DGIS的问题
关于GIS维数,特别是由2D到3D,是人们关注的热点。很多的学者对于3DGIS进行了研究,且取得了不少的成果。目前3DGIS的研究主要集中在对3DGIS的数据模型,提出了许多三维数据模型。吴立新、史文中等对GIS空间维数作了进一步的阐述,将空间维数划分为2D,2.5D,准3D和真3D,认为真3DGIS是将3D空间坐标(x,y,z)作为独立参数来进行空间实体对象的几何建模,其数学表达式为F=f(x,y,z),它所建立的模型不仅可以实现真3D可视化,还可以进行3D空间分析[5]。
目前,三维GIS研究取得了丰富的成果,但三维GIS在技术上还有很多问题没有解决,使三维GIS在目前还没有得到应用,停留在理论的研究水平。具体问题如下:
1)目前还没有一种三维数据结构模型在三维GIS中得到普及推广。现在虽然提出了一些数据结构模型,但都是在一定的条件下有效,离开了相应的
#10#测 绘 工 程 第16卷
结构和数据模型是三维GIS技术的一个关键,对真正实现三维GIS起着至关重要的作用。目前对此问题还没有实质性进展。
2)三维GIS数据的存储问题。二维GIS需要海量的数据。二维数据要变成三维数据,那么数据容量就会成倍的增加。现在计算机的硬盘已经很大,但对于三维GIS的数据而言,还是不够的。如何存储三维GIS数据也是一个非常重要的问题,目前提出的三维数据结构都有一定的局限性,不能从根本上解决问题。
3)如何获得三维GIS数据的问题。目前获得的数据都是二维数据、静态的数据。目前的遥感图像数据还是二维数据,通过像片的立体相对获得高程数据,得到DEM,严格来说DEM不能算作是三维GIS数据,且从像片上获得DEM数据也不是很容易的。
4)如何考虑三维GIS的不确定性问题。如,在不确定性下如何三维数据建模、如何体现其不确定性等。目前的科学研究已经知道GIS数据是不可避免的含有不确定性,具体可参阅文献[6]、[7]、[8]。现在的研究都是在三维GIS数据没有误差的情况下进行的研究,这与实际情况很不相吻合,导致三维GIS及其产品将是一堆完美的垃圾。
5)如何研究与开发三维GIS应用软件。目前对三维GIS的研究还没有一个真正的软件,目前有些GIS软件所实现的最多是2.5维GIS。
视化,更重要的是服务于分析决策。不管是可视化,分析或是决策,它们深入的发展进程表明,完整的空间信息的概念及范畴十分重要。这是一个重要的理论问题,对于实践有相当重要的意义。GIS数据的输入和组织是现在制约GIS发展的瓶颈,现有传统的矢量途径对于复杂的空间分析所需要的数据进行初始化上已显现了它自身的局限性,必须用新的思路和方法进行解决。包括GIS的空间尺度在内,本文所提出的这些问题不仅仅是理论上的,也是GIS实践中客观存在的,需要深入、广泛地讨论,以促进GIS学科本身的发展和其更深层次的应用。
参考文献
[1]邬伦,刘瑜,张晶,等.地理信息系统)))原理、方法和应用[M].北京:科学出版社,2001.
[2]胡鹏,杨传勇,李国建.GIS发展瓶颈、理论及万象GIS实践[J].武汉测绘科技大学学报,2000,25(3):212-215.[3]史文中.空间数据与空间分析不确定性原理[M].北京:科学出版社,2005.
[
4]刘大杰,史文中,童小华,等.GIS空间数据的精度分析与质量控制[M].上海:上海科学技术文献出版社,1999.[5]吴立新,史文中.3DGIS与3DGMS中的空间构模技术[J].地理与地理信息科学,2003,19(1):5-11.[6]胡圣武.基于模糊理论的GIS质量评价与可靠性分析[D].武汉:武汉大学,2004.
[7]胡圣武,王新洲,陶本藻.论GIS的不确定性[J].测绘通报,2004(9):31-34.
[8]胡圣武,李爱国,李长春.论GIS的模糊不确定性[J].地域研究与开发,2006,28(2):56-60.
4 结 论
GIS的应用不仅仅是为了空间信息的管理和可
[责任编辑:刘文霞]
(上接第5页)
[2]RobertB.Mckercher,BertramWolfe.Understanding
WestrenCanada.sDominionLandSurveySystem[M].Alberta,Canada,1978,20-29.
[3]Kang-tsungChang.IntroductiontoGeographicInformation
Systems[M].
NewYork:
McGraw-HillCompanies,
Inc.,2004:349-374.
[4]PENGZhongRen,TSOUMingHsiang.InternetGIS:Dis-tributedgeographicalinformationservicesfortheinternetandwirelessnetworks[M].NewJersey:JohnWiley&Sons,Inc.,2003:151-205.
[5]LOCP,ALBERTK.W.Yeung.Conceptsandtechniques
ofgeographicsinformationsystems[M].NewJersey:
Prentice-Hall,Inc.,2002:419-430.
[6]JohnPWilson,AStewartFotheringham,PipForer.
TransactioninGIS[M].Oxford:BlackwellPublishersLimited,2001:165-170.
[7]HASSENA.Karimi,AminHammad.Telegeoinformatics:
Location-basedcomputingandservices[M].Danvers,USA:CRCPress,2004:111-130.
[8]HUANGBo.ImplementationofGIS/GPS-Basedairport
pavementmanagementsystem-acasestudy[A].Queens-land,Australia:6thInternationalConferenceonManag-ingPavements,2004,10.
[责任编辑:张德福]