数字高程模型的误差处理与精度评估
20
铁 道 勘 察 2004年第5期
数字高程模型的误差处理与精度评估*
杨晓云 顾利亚 岑敏仪
(西南交通大学地理信息工程中心, 四川成都610031)
Error Processing and Accuracy Assessment of
Digital Elevation Model (DEM)
Yang Xiaoyun Gu Liya Cen Minyi
摘 要 从数字高程模型(DE M) 误差处理模型框架入手, 分别介绍DE M 误差源的确定、误差的检测、误差的传播、误差管理及削弱等方面的研究成果, 并分析探讨了有关DEM 精度改善和评估的方法和策略。
关键词 数字高程模型 误差处理模型框架
精度评估
有关地理信息系统(GIS) 数据不确定性的处理已经成为目前诸多领域研究的焦点, 其中包括不确定性数据的特征、可视化、存储、建模以及如何导入GIS 系统进行应用等。DE M 作为GI S 系统重要的数据来源, 同样也面临着这些问题。Li 和Chen [1]提出 DE M 误差处理模型框架 得到了广泛的应用。如图1所示, 图中包含5个部分, 按照一定顺序排列, 从下到上划分为4个层次, 也就是说, 只有完成了低层次的处理, 才能进行高层次的处理。关于底层 误差源的确定 包括
对原始数据精度、密度及分布, 地形属性以及DE M 生产方式的分析, 目前已经存在大量研究成果。第2层次 误差的检测 主要处理源数据误差对DEM 产品精度的影响。第3层次集中讨论DE M 生产中误差的传播, 特别是内插算法引起的误差分析。第4层次包含两部分内容, 其一是 误差管理 , 面向输出产品的精度控制, 通常采取的方法是设定具体的生产规范; 其二是 误差削弱 , 通过设计一定的算法减少输出产品的误差, 尤其是粗差。下面就对这几个部分分别进行论述。
图1 DEM 误差处理框架图
1 DEM 误差源的确定
1. 1 影响DEM 数据精度的主要因素
*
影响DE M 质量的因素是多种多样的, Li [2]指出以下几个因素是影响DE M 精度的关键因素。
(1) 地形表面的特征
地形表面特征决定了地形表面表达的难易程度, 因而在影响最终DEM 表面精度的各种因素中扮演了重要的角色。在地形表面的各种特征中, 坡度被认为是最重要的描述因子。
Thierry Toutin [3]通过试验验证坡度对DE M 质量的基金项目:国家自然科学基金资助项目(40271092) 。收稿日期:20040917
第一作者简介:杨晓云(1979-) , 女, 天津塘沽人, 西南交通大学测量工程系硕士生, 专业方向为大地测量学与测量工程。
数字高程模型的误差处理与精度评估:杨晓云 顾利亚 岑敏仪
21
小, 最大的误差出现在最大的坡度处, 并实验证明它们之间的关系是呈线性特征的。另外, 立体像对的几何特征越强, DE M 歧异值出现的可能性越大。
(2) DE M 原始数据的分布和密度
DE M 原始数据的分布是影响DE M 精度的另一个主要因素, 数据的分布可以用位置、结构和方位来描述。DEM 原始数据的密度可根据点的平均间距、单位面积点的数量及数据在空间变化上的截止频率等形式来确定, 它是影响DE M 表面精度的最重要因素。
(3) DE M 表面建模方法
DE M 表面可通过两种方式来建立, 一种直接以量测数据建立, 另一种是以间接方式建立, 即通过从随机点到格网点的内插处理过程, 最终建立DEM 模型。内插的处理过程肯定会带来地貌表达可信度的损失, 原始数据的误差会通过建模过程传递到最终的DE M 表面。
(4) DE M 表面的自身特性
最终DEM 表面的特征代表了决定DE M 表面与地形表面相互吻合程度的因素, 因而也就决定了DEM 表面的精度, 对于DEM 可视化表达的准确与否具有决定性的作用。
其传播规律的, 在此基础上, DEM 误差又可分为源误差、操作和计算误差, 如表2[4]所示。在以上几种误差中, 对DE M 精度影响最大的是原始数据的采集误差和高程内插误差(其他误差可以通过改进技术和提高设备质量得以控制) 。
表2 基于生产过程的DE M 误差分类
源数据误差地图数字化误差地面数据量测误差遥感数据误差
操作和计算误差计算字长引起的误差
拓扑分析误差数据分类高程内插误差
(1) 原始数据的采集误差:主要来自原始资料的误差、采点设备误差、人为误差、坐标转换误差。
(2) 高程内插误差:在DEM 的生产过程中, 无论采用什么样的内插算法, 内插点的计算高程总是与实际量测高程之间存在差异。
研究发现, 高程内插的误差一方面和选用的数学方法(内插算法) 有关, 另一方面与采点方式有关。
2 DEM 误差的检测
在上述的误差来源中, 只有源数据中的误差(即DE M 的采样误差) 对DE M 产品最终精度有直接的影响, 而其它因子(DE M 建模过程中生成) 的影响则是间接的。 误差处理模型 中第2个层次 误差的检测 就是对这些直接影响因素的讨论。
一般说来, DE M 源数据的精度与其生产方式密切相关, 不同的生产方式获得的DE M 的精度也有所不同。目前采用的生产手段主要有以下几种:摄影测量数据采集方法、地面量测方法、现有地形图生成方法、机载激光扫描的方法、合成孔径雷达干涉(Synthetic Aperture Radar Interferometry, 简称InSAR) 技术等。其中地面直接量测方法的精度最高, 可以达到厘米甚至毫米的精度, 然而由于其采集效率较低, 不适用于大面积DE M 的生产。龚建雅、李志林
[5]
1. 2 DEM 误差元素的分类
国际制图协会(IC A) 空间数据质量委员会指出, 空间数据的质量控制应该从以下7个方面进行:位置精度、属性精度、逻辑一致性、要素完备性、现势性、附件质量、语意精度。DEM 的质量评估和误差分析也应从
这几个方面着手。然而在目前的研究中, 人们往往只侧重于DE M 的高程精度的研究, 忽略了水平位置精度对高程精度的影响。由此产生的一些误差分类体系, 也是基于高程精度的, 如表1所示。汤国安指出, DE M 作为地形表面的数字化模拟, 能否正确地描述原始地貌应该成为DE M 精度的重要指标以此为基础进行DE M 精度评估。
表1 基于误差理论的DE M 误差分类
分类标准误差的构成误差的范围误差之间的相关性误差的空间特征
DEM 误差类型随机误差、系统误差、粗差全局误差、局部误差绝对误差、相对误差周期误差、峰值误差
[4]
, 因而他提出了地
形描述误差(DEM terrain representation error) 的概念, 并
通过大量的试验对比
发现使用解析测图仪进行DE M 数据的量测是较为可靠的方法, 其不利的因素则是采取自动匹配量测通常会带来系统误差。
目前, 根据DE M 不同生产方式的自身特点, 在相关领域中已经存在大量的DE M 质量控制和精度评估的方法及策略, 相对而言, 这是个较为成熟的研究领
域。
另外, 在实际的研究和生产过程中, DE M 的误差产生是和生产过程密切相关的, GIS 研究人员更多地3 DEM 误差的传播
22
铁 道 勘 察 2004年第5期
其产品精度的影响, 包含两部分内容:
DE M 表面量测数据到内插数据的误差传播。
DE M 复杂表面通过简单数学函数进行建模所带来的误差(如图2所示) [4]
。
图2 利用数学函数对DE M 表面进行重建的误差分析
其中前者是主要因素, 因此这部分的精度评价侧重于对高程内插的误差分析。目前, 高程内插的精度估计方法有以下几种:任意点法、剖面法、等高线法等; 数学分析方法有传递函数法和协方差函数法。任意点法即事先将检查点按格网或任意形式进行分布, 对生成的DEM 在这些点处进行检查。可运用协方差函数法从理论上估算网格点或任意点处的高程误差, 也可以将这些点处的内插高程和实际高程逐一比较得到各个点的误差, 然后算出中误差。
协方差函数法是将地表起伏看作一个随机函数, 然后用一个协方差函数来表示地表起伏的复杂程度。它假定各参考点之间的互相关性仅取决于点间的水平距离, 而与点位和方向无关。
剖面法是按一定的剖面量测计算高程点和实际高程点的精度计算方法。剖面可以是沿X 方向、Y 方向或任意方向。和任意点法一样, 可以用数学方法(如传递函数法) 计算任意剖面的误差, 也可以用实际剖面和内插剖面相比较的方法估算高程误差。
传递函数法的基础是傅立叶级数, 其原理是任何一个连续曲面的剖面均可表示为一个傅立叶级数, 通过断面的实际量测高程和拟合高程傅立叶级数来估计误差。
在实际应用中, 为评价DE M 精度的总体状况以及DE M 是否和实际地形吻合的情况, 一般采用DE M 内插回放等高线的方法, 即将回放后的等高线和原有等高线相比较, 检查等高线误差的实际状况。等高线回放法一般包括回放原有的等高线(如等高线高程点作为参考点时) 和回放中间等高线的方法(如当等高线高程为100、120、140 时, 回放110、130、150 处或105、125、145 处的等高线) , 比较内插处的高程值, 这种方法可以得到其它内插点处的高程连续分布。
DE M 常常是一组用矩阵形式表示的高程组, 实际达和检查高程误差。用影像来检查DE M 的手段主要有两种, 即用灰度和彩色影像。两种方法均采用色彩对照表建立各个高程值和灰度或彩色之间的对应关系, 对DEM 的局部进行详细检测, 进而计算出局部区域DE M 的误差。这种方法工作量大, 主要用于对局部DE M 进行区域的详细检测和分析。
通过上述DE M 精度评定方法的对比分析可以发现, 广泛使用的试验法判别精度, 检查点的取样缺乏严密的理论基础, 在实验和理论分析中采用 中误差 来评价内插误差的前提并不充分。对于协方差法是把起伏的地表看作一个随机函数, 然而事实并非如此, 地表往往是一个极其复杂的确定几何面, 因此该方法评定内插精度效果较差。而传递函数法仅仅满足地表起伏变化均匀的情况, 忽略了某些特征点、线对内插精度的影响。另外, 上述两种方法并不适用于评价整个区域DE M 的误差情况和实际分布, 结论通常与实际情况不符。在目前对DEM 尚缺乏有效理论精度估计的情况下, 回放等高线法仍是一种准确、全面、自然的误差评价方法。
此外, Ackermann [6]针对某一特定情况给出了精度评价经验模型, Makarovic , kubik 和Botman , Fred -eriksen [9]等也给出一些理论分析模型。对这些成果, Balce 和李志林[10]通过研究都证实了它们并不能产生可靠的精度预测, 后者在此基础上, 提出了更可靠的内插精度预测模型。他指出由于DEM 误差分布近似服从正态分布, 因而均值和方差仍然是DE M 精度描述的重要参数。
胡鹏[11]则强调采用 中误差 来评价内插误差前提并不充分, 他将DE M 内插误差归为逼近数值误差, 采用 逼近误差 概念, 针对具有明确理论背景和精度分析的两种Grid-DE M 生成方法:等高线DE M 上进行TI N 内插生成法和通过解析测量得到格网点数据后采, DE [7]
[8]
数字高程模型的误差处理与精度评估:杨晓云 顾利亚 岑敏仪
23
型。
事实上, DEM 内插精度的评估既可以通过实验的方式来建立, 也可以通过理论分析的方式进行推导。由于前者具有一定的局限性, 有时还根本不能实行, 因此以理论分析方式来建立DE M 的精度模型是进行DE M 精度分析的一个重要策略。
算法, 同样考虑了误差在空间自动相关的特性, 并应用于一个带有真实粗差的山区DE M 模型。2002年, L pez 对以往的试验进行了补充, 通过6种代表不同地形特征的DEM 模型, 验证了通过确定最大可疑点数(也可称为粗差) 可以提高DEM 精度的有效性。L pez 的算法思想已经通过软件DM4DEM 得以实现, 它面向最终用户, 适用于多种DE M 栅格源数据, 如直接的摄影测量量测、数字化等高线、地面量测等。
要有效地探测DE M 数据中存在的粗差, 必须在数据采集后形成的原始DEM 数据中进行。原始的DE M 数据结构有规则和不规则两类。从实用的角度来看, 在规则格网的DEM 数据中探测粗差相对简单一些, 因而研究成果也相对丰富。如果DE M 数据不规则, 检测坡度变化的一致性就会很难实现, 由此, 李志林博士提出一个类似Felic simo 的方法, 即基于点方式的不规则DE M 数据的粗差检测算法。它以检测点P 为中心, 首先确定一个选取数据点范围的窗口(设半径为R ) , 然后计算窗口范围内所有点高程的算术平均值(或加权平均值) 作为P 点的估值(或 真值 ) , 最后计算P 点高程值与估值的高程较差 如果 i 。i 大于另一计算出来的阈值, 则认为P 点含有粗差。该方法简单易行, 对于离散的粗差具有很好的探测效果, 然而一旦粗差呈簇群状分布, 检测效果明显下降。因此不得不考虑另一种情况 当窗口中每一点都包含较大粗差, 并且以一种排列紧凑、数量巨大的方式存在, 李志林博士对此作了进一步的改进:
(1) 首先, 将窗口中的第一点从窗口中移去, 以窗口中剩余的点计算新的 代表值 (即平均值) 。(2) 然后计算并记录这个平均值与移去的数据点的值之差。随后这个过程将用到窗口中的每一个数据点。假设在窗口中有M 个点, 那么通过下式可计算M 个差值:
V i =P i -P
其中, P i 是窗口中所有剩余数据点的平均值而不是第i 个点的高值, P 是窗口中所有数据点的平均值。(3) 余下的处理过程与第一类算法检测粗差的方法类似, 也是M 个值用来计算一个统计值, 并使用该统计值生成阈值。
(4) 最后, 就可对窗口中的每个数据值进行检测。如果一个数据点比如V i , 超过了这个阈值, 那么这个数据点将被认为含有粗差而需要将其剔除。
上文提到了两类DE M 粗差探测算法, 一种是基于规则格网DE M, 另一种是基于离散形式的DEM, 无论, 当
4 DEM 误差的管理
对DE M 中误差的管理通常采取的方法是采用一定规范来设定DE M 生产的标准, 从而为DE M 的质量控制提供可靠的保证。
在DE M 中, 这类的规范要求很多, 如限定点位精度最小值以及格网间距最大值等。以1 5万DE M 生产为例, 格网点的高程精度应符合表3的规定。
表3 1 50000DEM 生产中高程精度规范标准
地形基本等
地面坡度
类别高距/m平地丘陵地山地高山地
5102020
2 以下2 ~6 6 ~25 25 以上
高差/m 600
格网点高程DEM 内插点高
中误差/m 程中误差/m
471119
4 1. 27 1. 211 1. 219 1. 2
5 DEM 误差的削弱
误差的削弱主要是针对DE M 误差(特别是粗差) 设计一定的算法进行探测和剔除。国外许多学者早已
密切注意DE M 粗差探测的研究。Hannah [12]在早期的论文中提到过一种针对规则格网数据的粗差探测算法, 他以每个点与周围点之间的坡度值及其坡度变化值为限制条件来检测粗差。Qstman
[13]
指出并不存在
唯一的标准和量测方法来提高DE M 的质量, 他认为至少要考虑高程、坡度和曲率的正确性。Felic simo [14]假设DE M 数据误差服从高斯分布, 他以栅格数据中某点高程值与其内插估值(通过其周围的格网点内插) 之间的差值建立统计量, 用标准t 分布检验来分析判断该点是否为粗差。无论是Hannah 还是Felic simo 推导的算法, 其前提都是假设DE M 中粗差的大小和分布是独立的, 而事实上并非如此, 它们往往在空间上具有自动相关的特性。
L pez 提出一种基于主成分分析的方法, 采用了两种粗差模型:一种是空间上不相关的粗差(峰状粗差) 模型, 另一种是空间上微弱相关的粗差(金字塔状粗差) 模型。他将规则格网数据划分为一系列的带状区域, 并将它们看作多元数据序列来处理, 通过统计的方
24
铁 道 勘 察 2004年第5期
val. Photogrammetric Record, 14(79) :113-128
3 Thierry Touti n, 2002, Impact of terrai n slope and aspect on radargrammetric DEM accuracy. ISPRS J ournal of Photogrammetry &RemoteSensing, 57, 228-240
4 TANG Guoan, 2000, A Research on the Accuracy of Digital Elevation Mod -els. Science Press, Beiji ng, 2000
5 J. Gong, Z. Li et al, 2000, Effec ts of Various Fac tors on the Accuracy of
DEMs:An Intensive Experimental Inves ti gation. Photogra mmetric Engineeri ng &Remote Sensing, pp. 1113-1117
6 Ackerman. F. , 1979. The accuracy of digital terrai n model. Proceedings of
37th Photogrammetric Week, Uni versity of Stuttgart. 113-143
7 Makarovic, B. , 1972. Informati on trans fer in cons truc tion of data from sam -pled poi nts. Photogra mmetria, 28(4):111-130
8 Kubic, K. and Botman, A. , 1976. Interpolation accuracy for topographic and
geol ogical surfaces. I TC Journal, 1976-2 236-274
9 Frederiksen, P. , 1981. Terrain analysis and accuracy prediction by means of
Fourier transpormation. Photogrammetria, 36 145-157
10 李志林, 朱庆. 数字高程模型. 武汉:武汉测绘科技大学出版社, 200011 胡鹏, 吴艳兰, 胡海. 数字高程模型精度评定的基本理论. 地理信息
科学, 2003(3) :64-69
12 Hannah M J. Error detection and correction in Digi tal Terrain Models. Pho -togrammetric Engi neering and Re mote Sensi ng. 1981, 47 63-69
13 Qstman A. Quali ty control of photogrammetrically sampled Di gital Elevati on
Models. Photogra mmetric Record. 1987. 12 333-341
14 Felic si mo A. Para metric s tatis tical method for error detecti on in digi tal ele -vation models. ISPRS J ournal of Photogrammetry and Remote Sensi ng. 1994, 49 29-33
然探测方法的自动化程度也是一个重要的指标。
6 结束语
本文系统地分析介绍了目前DE M 误差处理模型。这里需要指出的是, 该模型的前3个层次都是针对于DE M 生产者提出的, 也就是说, 在DEM 的生产过程中, 只要操作者遵循某些原则, 把握一定的尺度, 就可以较好地控制DEM 的质量, 从而提高其产品的最终精度。目前这一领域已得到了很好的研究, 成果也较为丰富。而最终用户由于无法接触到原始数据或是缺乏必要的设备, 他们通常无法控制数据的质量问题。因此, 假如某一应用对DE M 的精度非常敏感, 用户会因为缺乏探测可疑数据(粗差) 的工具或无法估计可靠值而显得束手无策。 误差的削弱 和 误差管理 就是针对上述问题提出的, 它们为DE M 的最终用户提供了控制数据质量的方法和手段, 这是一个值得进一步深入探讨的领域。
参 考 文 献
1 Li, Z. , and Chen, J. , 1999, Assess ment of the accuracy of Digital Terrain
Models (D TM) :theory and practice. In proceedings of the International Sym -posi um on Spatial Data Quali ty 99, Hong Kong, China(Hong Kong:The Hong Kong Polytechnic Uni versity) , pp. 202-209
2 Li, Z. , 1992. Variati on of the accuracy of di gi tal models with sampling inter -
(上接第19页)
本身, 数据的具体表现形式可利用样式表语言进行转换, 使地理信息能根据客户的配置动态地表现。 用XML 在现有的WEB 上传输GIS 数据具有可行性, 不需要改变网络基础, 利用原有的HTTP 协议, 成本低。
XML 具有开放的标准和众多软件公司的支持。由W3C 制订的XML1. 0版已经发布, 与处理XML 相关的语言、接口等部件也由W3C 统一提供标准。微软、网景和众多数据库软件国际企业已经并将继续为XML 提供支持和服务。OpenGIS 联盟(Open GI S Con -sortium, Inc. ) 于2000年5月制订发布了用于WebGIS 的一个基于XML 的语言GML(Geography Markup Lan -guage, 地理标志语言) , 其目的在叙述、说明地理资讯, 可以很容易的表现地理信息的结构及内容, 并能做开放式地理信息的交换及管理。美国ESRI 公司在新一代的互联网地图服务器(Internet Map Server) 上也运用了名为ArcXML(AXL)标志语言, 其主要用途是为了处理地理信息资料的叙述、表现、交换及管理, 并将地理
信息资料在不同的机器上进行通讯。
3 结束语
WEB GIS 发展的动力一方面来自于日益广泛的应
用领域对GI S 不断提高的要求; 另一方面, 计算机科学的飞速发展为W EBGIS 提供了先进的工具和手段。许多计算机领域的新技术, 如面向对象技术、三维技术、图像处理和人工智能技术都可直接应用到WEB GIS 中; 可以预见, 随着Internet 技术的发展, WebGIS 应用终将走上普通人的办公桌、走进千家万户的家用电脑, 与Internet 本身一样成为人们日常生活必不可少的实用工具。WebGI S 终将取代传统的GIS 。
参 考 文 献
1 宋关福, 钟耳顺, 王尔琪. WebGIS 基于Internet 的地理信息系统. 中
国图像图形学报, 1998(3)
2 郭杰华, 鲍远律, 胡玉锁等. 基于Internet 的地理信息系统的研究和开
发. 图形图像学报, 1999(1)
3 刘男, 刘仁义. Web GIS 原理及其应用. 北京:科学出版社, 20024 薛小峰, 汪晓程. WebGIS 处理模型研究[J]. 微型电脑应用, 2000(16)