排版模板1
空间数据的分析与应用
【摘要】本电子文档重点描写了关于空间数据分析、空间数据质量、空间数据库的应用等几个方面的内容。着重介绍了空间数据质量的检查以及数据库的具体应用示例。 【关键词】分析;质量;应用;模式
1 引言
空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,它可以用来描述来自现实世界的目标,它具有定位、定性、时间和空间关系等特性。空间数据是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数据。空间数据结构又是指空间数据的编排方式和组织关系。空间数据编码是指空间数据结构的具体实现,是将图形数据、影像数据、统计数据等资料按一定的数据结构转换为适合计算机存储和处理的形式。不同数据源采用不同的数据结构处理,内容相差极大,计算机处理数据的效率很大程度取决于数据结构。随着信息技术的飞速发展和企业界新需求的不断提出,以面向事务处理为主的空间数据库系统已不能满足需要,信息系统开始从管理转向决策处理,空间数据仓库就是为满足这种新的需求而提出的空间信息集成方案。
本文将从空间数据分析、空间数据质量、空间数据库的应用等几个方面对空间数据进行介绍。
2 空间数据分析
2.1 空间数据特征
2.1.1 属性特征
用以描述空间数据的特性,即用来说明“是什么”,如数据的类别、等级、数量、名称等。它指的是除了时间和空间特征以外的空间现象的其他特征,如地形的坡度、波向、某地的年降雨量、土地酸碱度、土地覆盖类型、交通流量等。 2.1.2 空间特征
用以描述空间数据的地理方位,如经纬度。空间特征指的是空间元素的位置、形状和大小等几何特征,以及与相邻元素的空间关系。空间位置可以通过坐标来描述。空间元素的形状和大小一般也是通过空间坐标来体现。通常情况下,人们对空间目标的定位不是通过记忆其空间坐标,而是确定某一目标与其他更熟
悉的目标间的空间位置关系。但对于计算机系统而言,使用坐标是空间定位最直接最简单的方法。 2.1.3 时间特征
用以描述事物或现象随时间的变化,例如人口数的逐年变化、地貌的变化等。空间数据总是在某一特定时间或时间段内采集得到或计算得到的。由于有些空间数据随时间的变化相对较慢,因此往往被忽略[5]。但设计良好的空间数据库应包含多个时态的信息,如何有效地利用多时态势数据在空间数据库中进行时空分析和动态模拟是空间数据库研究的热点问题之一。
2.2空间影响
空间影响的存在基本上排除了经典统计方法在空间数据分析中的直接应用,它们是空间统计学和空间统计经济学诞生和发展的根本原因。在这两类空间影响中,空间依赖性或空间自相关被视为理论地理学和区域科学的研究核心。在应用研究领域,空间依赖性可来源于各种测量误差,包括空间过程与政区边界的不一致、空间单元的整合、以及空间外延和空间溢出的存在等。此外,研究对象的空间组织与空间结构也会产生一系列空间互动和空间依赖的复杂分布;由此而发展出的一系列模型如空间流模型、空间分布模型、空间结构模型、空间过程模型都直接或间接地包含了空间依赖性这一变量。虽然空间依赖性有点像统计经济学中检验的时间序列数据的序列相关,但鉴于空间数据的多方向性,空间依赖性不能通过直接套用经典统计学中的方法来解决。
第二类空间影响是空间非均质性,它反映了研究对象空间行为或空间关系的不稳定。更确切地说,这意味着研究对象的因果关系和变量随空间区位而变化。如用统计经济学模型对一组包括发达地区和不发达地区的横截面数据进行建模并估计,就可能出现空间非均质性的问题。与解决空间依赖性这类问题不同的是,大部分空间非均质性的问题都可以通过经典统计方法来解决。但在某些情况下,研究对象空间结构与空间流之间复杂的相互影响可能造成空间依赖性和空间非均
质性的同时存在。当这一情况发生时,如何区分这两类截然不同的空间影响将会十分困难,因为经典的统计学和统计经济学对此无能为力。
3空间数据质量
城市基础地理信息系统是以1 / 5 0 0 地形图为主要的数据源, 将地形图要素按照一定的分类和编码系统分为十大类, 并赋予相应的编码, 属性数据是以人工方式输人数据库中, 并通过数据转换的方式进行G IS 数据建库。在这一系列的过程中, 数据质量的检查与验收贯穿始终。
3.1空间数据的误差来源
要进行数据质量的控制, 首先要了解G IS 数据质量控制是指控制空间数据的可靠性和精度, 因此也有必要了解建库过程中的误差来源。在建库过程中空间数据的误差可分为源误差、处理误差和应用误差等三种类型。
三种误差中, 数据处理误差远远小于数据源的误差, 使用误差看来不属于数据本身的误差, 但这些因素直接影响到应用的效果, 所以也应列为空间数据误差的范畴, 在给空间数据的质量评定中应考虑多方面的因素。对空间数据质量控制的主要任务是针对可能产生误差的各个环节进行必要的控制, 尽量减弱这些误差的影响, 同时对空间数据的质量进行检验和评价。
3.2数字化采集与质量控制
在建立城市基础地理信息系统中, 地图数字化包括手工数字化和扫描矢量化是常用的空间数据采集手段, 在这一阶段, 除了可以程序化的部分, 人工干预的也比较多, 同时由于建立G IS 库不仅需要的是图形数据, 还需要有属性数据相匹配, 因此在进行质量检查的时候, 我们要兼顾对图形数据和属性数据两方面的检查。在数字化采集阶段我们主要是对图形数据进行质量检查[7]。
在建立城市基础地理信息系统中, 地图数字化包括手工数字化和扫描矢量化是常用的空间数据采集手段, 在这一阶段, 除了可以程序化的部分, 人工干预的也比较多, 同时由于建立G IS 库不仅需要的是图形数据, 还需要有属性数据相匹配, 因此在进行质量检查的时候, 我们要兼顾对图形数据和属性数据两方面的检查。在数字化采集阶段我们主要是对图形数据进行质量检查。
3.3属性数据的质量检查
G IS 数据的关键是属性数据, 这是一般地形图所不能比拟的, 它的属性覆盖面很广, 有楼层、房屋名称、道路名、路宽、道路材料、门牌号等, 根据不同的用户还可以扩充, 这些属性我们首先是在图形数据采集时赋予相应的数据库中, 然后再通过处理与图形数据连结到一起, 这一系列的处理是在G IS 软件使用平台如A R C I/ N F O 中完成的, 因此对属性数据的质量检查我们也是在最终的G IS 软件使用平台上完成的[2]。
属性数据的质量控制应包括属性数据的逻辑检查和数据库记录的抽样检验。属性数据的逻辑检查是根据数据之间存在的逻辑关系对数据进行检查,例如检查建筑物层的属性数据, 要求代码不为零, 有用途的房屋数据必须有名称, 要求一般的建筑物楼层不能为零等, 检查道路边线及道路中心线的属性数据时, 这两个层应同时进行检查, 道路边线的级别应与道路中心线的同等级, 同一条路接边的道路边线等级应相同, 对路宽应在检查完分幅图以后, 拼图对一条路赋予一个路宽, 同时道路中心线中一个名称的道路应连续。这些逻辑检查的方法是通过编制数据库检查程序, 自动进行并报告检查情况, 进行交互式改正。
4 空间数据库的应用
4.1 空间数据库的应用模式
4.1.1 文件与关系数据库混合管理系统
由于空间数据具有以上几个特征,市场上通用的关系数据库管理系统难以满足要求。因而大部分GIS软件采用混合管理的模式。即用文件系统管理几何图形数据,用商用关系数据库管理系统管理属性数据,它们之间的联系通过目标标识或者内部连[2]。
早期系统由于属性数据必须通过关系数据库管理系统,图形处理的用户界面和属性的用户界面是分开的,它们只是通过一个内部码连接,如图2所示,导致这种连接方式的主要原因是早期的数据库管理系统不提供编程的高级语言如Fortran 或C的接口,只能采用数据库操纵语言。
最近几年,随着数据库技术的发展, 越来越多的数据库管理系统提供高级编程语言C 和 Fortran等接口,使得地理信息系统可以在C语言的环境下,直接操纵属性数据, 并通过C语言的对话框和列表框显示属性数据, 或通过对话框输入SQL语句,并将该语句通过C语言与数据库的接口查询属性数据库, 并在GIS的用户界面下,显示查询结果,这种模式称为混合处理模式。
4.1.2 全关系型空间数据库管理系统
全关系型空间数据库管理系统是指图形和属性数据都用现有的关系数据库管理系统管理。关系数据库管理系统的软件厂商不作任何扩展,由GIS 软件商在此基础上进行开发,使之不仅能管理结构化的属性数据, 而且能管理非结构化的图形数据。用关系数据库管理系统管理图形数据有两种模式, 一种是基于关系模型的方式,图形数据按照关系数据模型组织。这种组织方式由于涉及一系列关系连接运算,相当费时,例如为了显示一个多边形,需要找出组成多边形的采样点坐标。它要涉及到4个关系表,作多次连接投影运算,这一查询的语句如下: Select X, Y
From P, E,N , C Where P·P# = E·P# and E·E# = N ·E # and (N·BN = C·N # and N·EN = C·N # ) 4.1.3 对象-关系数据库管理系统
由于直接采用通用的关系数据库管理系统的效率不高,而非结构化的空间数据又十分重要,所以许多数据库管理系统的软件商纷纷在关系数据库管理系统中进行扩展, 使之能直接存贮和管理非结构化的空间数据, 如 Ingres, Inform ix 和Oracle 等都推出了空间数据管理的专用模块, 定义了操纵点、线、面、圆、长方形等空间对象的A P I函数。这些函数,将各种空间对象的数据结构进行了预先的定义,用户使用时必须满足它的数据结构要求,用户不能根据GIS 要求(即使是GIS 软件商)再定义。例如这种函数涉及的空间对象一般不带拓扑关系, 多边形的数据是直接跟随边界的空间坐标, 那么GIS用户就不能将设计的拓扑数据结构采用这种对象—关系模型进行存贮。这种扩展的空间对象管理模块主要解决了空间数据变长记录的管理,由于由数据库软件商进行扩展,效率要比前面所述的二进制块的管理高得多。但是它仍然没有解决对象的嵌套问题,空间数据结构也不能由用户任意定义, 使用上仍然受到一定限制。 4.1.4 面向对象空间数据库管理系统
面向对象模型最适应于空间数据的表达和管理,它不仅支持变长记录, 而且支持对象的嵌套、信息的继承与聚集。面向对象的空间数据库管理系统允许用户定义对象和对象的数据结构以及它的操作。这样,我们可以将空间对象根据GIS的需要,定义出合适的数据结构和一组操作。这种空间数据结构可以是不带拓扑关系的面条数据结构, 也可以是拓扑数据结构, 当采用拓扑数据结构时, 往往涉及对象的嵌套、对象
的连接和对象与信息聚集。当前已经推出了若干个面向对象数据库管理系统如O2、Object store otorn 等, 也出现了一些基于面向对象的数据库管理系统的地理信息系统,如GDE 等。但由于面向对象数据库管理系统还不够成熟, 价格又昂贵, 目前在GIS领域还不太通用。相反基于对象—关系的空间数据库管理系统将可能成GIS空间数据管理的主流。
4.1.5 面向对象的矢栅一体化空间数据库管理系统
以上所述空间数据库管理系统主要是针对图形矢量空间数据的管理而采取的方案。当前除图形矢量数据以外,还存在大量影像数据和DEM 数据,如何将矢量数据、 影像数据、DEM 数据和属性数据进行统一管理, 已成为空间数据库的一个重要研究方向(Ehlers, 1989, Figueroa, 1990)。一种实现方案是采用面向对象矢栅一体化空间数据模型。面向对象的矢栅一体化数据模型是面向对象技术与空间数据库技术相结合的产物。面向对象技术已成为现代计算机技术的主流技术。在众多领域,面向对象技术已成为新一代软件体系结构的基石。面向对象数据模型和面向对象的空间数据管理一直是地理信息系统领域所追求的目标。自80
年代末、90年代初,人们就相当重视面向对象技术在GIS 领域中的应用, 软件技术也在不断发生变革,较早推出的面向对象 GIS 软件 System 9,对面向对象方法GIS 中的应用起了较大推动作用,之后的Small Word已使面向对象GIS达到了普及应用阶段。
4.2 空间数据库的实际应用——石油地质空间数
据库
针对油田上游业务特点,利用空间数据库管理各类空间对象(表 1),建立一个涵盖勘探开发工程设计及油田建设等领域的公共基础地理数据库及其应用系统平台。
4.2.1 实施步骤
空间数据库和GIS应用平台建设:分析石油空间对象、构建空间数库;开发基于空间数据库的 GIS成图和 GIS应用平台,确立空间对象的服务和安全管理体系。
专业服务体系的设计和开发建设:构建专业服务体系,内容包括构架专业。服务体系,制定专业服务的规范和标准;建立专业服务管理器,内容包括自由配置专业服务的名称 调用路径 参数设置方法调用方式配置与空间对象的关联功能包括添加配置修改专业服务;制作专业服务,内容包括改造各分类数据库的专业功能,制作成专业服务的形式按油田企业标准设计服务,使之统一风格功能包括查询专业库数据,用
图形或表格进行展示[8]。 4.2.2 应用效果分析
就像我们在日常应用中看到的那样,当打开一幅复杂的图件时,由于图上有太多的东西(断层等值线、井位测线等),使人看了眼花缭乱,一时难于找到希望看到的东西该图形平台采用分层管理的模式为科研人员解决了这一难题 通过分层的机制,科研人员可以关闭不希望看到的层,从而凸现所关注的相关地质信息 若要查找某个图元(图上的一个元素),图形平台提供了许多方法找到它,通过名称(比如井名),通过类别、通过层类通过大小通过颜色当找到后,系统通过一个特殊的标志显示出图元的位置通过数字制图平台上的工具,可删除不再需要的层(包括动态图层)可让某层或某些层闪烁。
结束语
经过一段时间的努力,我终于完成了地理信息系统论文。在这个过程中,我学到了很多东西,包括地理信息系统的相关内容,也包括如何去正确书写一篇论文。
总之,通过这篇论文,我深刻体会到要做好一个完整的事情,需要有系统的思维方式和方法,对待要解决的问题,要耐心、要善于运用已有的资源来充实自己。同时我也深刻的认识到,在对待一个新事物时,一定要从整体考虑,完成一步之后再做下一步,这样才能更加有效。
References (参考文献)
[1]
严寒冰. GIS的空间数据模型[C]. 浙江理工大学学报 :严寒冰, 2012.
[2] 施一军, 潘云忠. G I S 建库中对空间数据质量控制的一些方
法与措施[C]. 江苏:江苏测绘, 2001.
[3] 王晓丹, 王伟龙. 广东省区域经济差异的探索性空间数据分
析:1 990 — 2009[C]. 广州:华南师范大学出版社, 2011. [4] 胡圣武, 张光胜, 王宏涛. 空间数据建库研究[C]. 河南,焦作:
地球科学与环境学报, 2007.
[5] 应龙根, 宁越敏. 空间数据:性质、影响和分析方法*[C]. 上海:
地球科学进展, 2004.
[6] 王军. 空间数据库结课报告[C]. 武汉:中国地质大学出版社,
2013.
[7] 李伟. 空间数据库技术分析与研究[C]. 河北邢台:计算机光盘
软件与应用, 2013.
[8] 武玉红, 刘毅勇. 空间数据挖掘及其在军事领域的应用[C].
北京:军事运筹与系统工程, 2006.
[9] 韩李涛, 赵军. 空间数据质量相关问题探讨[C]. 山东,泰安:
山东科技大学出版社, 2003.
[10] 杨永崇, 范玖国. 三维空间数据采集方法的分析与比较研究
[C]. 西安:测绘科学, 2009.