2 降水空间插值技术的研究进展_何红艳
生态学杂志Chinese Journal of Ecolo gy 2005, 24(10) :1187~1191
降水空间插值技术的研究进展*
何红艳 郭志华
**
肖文发
(中国林业科学院森林生态环境与保护研究所, 北京100091)
摘 要 降水的空间分布信息在水资源管理、灾害预测预警和区域可持续发展研究等方面的地位已越
来越重要。然而, 空间降水插值却一直是个难题, 影响降水的因素很多, 如经度、纬度、高程、坡度、坡向、离水体的距离等, 建立一个通用的降水插值模型几乎是不可能的。空间降水插值方法很多, 优缺点和适用性不同。总体上, 降水的空间插值方法有3类:整体插值法(趋势面法和多元回归法等) 、局部插值法(泰森多边形法、反距离加权法、克里金插值法和样条法) 和混合插值法(整体插值法和局部插值法的综合) 。近年来, 随着应用数学和人工神经网络技术的发展, 很多新方法如BP 网络、径向基函数网络等逐渐应用到降水插值中。另外, 研究区域和时间尺度的不同决定了所选用的插值方法及模型不同; 即使是同一种插值方法, 应用于不同的研究区域, 所取得的结果也不同。因此, 应根据具体的研究区域的自然地理特征, 选择不同的插值方法建立不同的插值模型。在各种插值方法中, 兼具其它插值方法优点的混合插值法有利于提高降水插值的精度, 是未来降水插值研究的一个发展方向。关键词 降水, 空间分布, 插值
中图分类号 P468 文献标识码 A 文章编号 1000-4890(2005) 10-1187-05
Review on spatial interpolation techniques of rainfall . HE Hong yan , GU O Z hihua , XIAO Wenfa (Institute of Forest Ecology , Environment and Protection , Chinese Academy of Forestry , Beijing 100091, China ) . Chi -nese Journal of Ecology , 2005, 24(10) :1187~1191.
Rainfall spatial distribution is the important information in many fields , such as water resource management , droug ht and flood disaster predictio n , and regional sustainable development , but its interpolation has been a puzzle because there are many affecting elements , such as latitude , lo ngitude , eleva tio n , distance to w ater bod -ies , slope , etc . , especially in mountainous regions . It is difficult to build a general rainfall interpo lation model for different geographical regions . Several kinds o f rainfall interpola tio n methods were introduced in this paper , including global interpolation methods (trend surface and multiple regression ) , local interpola tio n metho ds (T hiessen polygons , inverse distance w eighting , kriging and splines ) , and mix ed methods (combined global and local methods ) . T heir advantages , disadv antages and applicability were discussed . Recently , with the devel -opment of applied mathematics and artificial neural netw orks (AN N ) , some new methods were put forward in the rainfall interpolation , especially the A NN technique , such as Back -Propagation neural netw orks (BP net -wo rk ) and Radial Basis Function netw orks (RBF N ) . Because of the uncertainty of rainfall , more detailed geo -g raphical and topog raphical characteristics are needed to improve the precision of predicted rainfall . Detailed topographical characteristics could be provided by a larg e scale DEM (digital elevation model ) or DT M (digital ter rain model ) , w hich plays an impo rtant role in rainfall interpolation . Different interpolation methods are re -quired in different space or time scales . Even the same rainfall interpolation might get different results in dif -ferent regio ns . T he mixed methods , combining the advantages of global and local interpolation methods , are useful for improving the interpolation precision , w hich would be o ne of the impo rtant research fields in the fu -ture .
Key words rainfall , spatial distribution , interpolation .
1 引 言
空间降水是气候的一个重要因素。空间降水信息对于区域水资源分析、旱涝灾旱的预测和管理以及生态环境治理都有相当重要的意义。降水的形成和分布是一个复杂的过程, 影响降水的因素很多, 准确获得某个区域的降水量, 无论从理论上还是实际上都不现实, 唯有对区域内有限的观测站点的降水随着全球变化研究的深入, 几乎所有的估算区域乃至全球的植被生产力和碳循环的生态模型(如CASA [9, 20]、TEM [19]、FOREST -BGC [3]) , 都需要空间化的降水数据。空间降水信息显得越来越重要, 空间降水插值的必要性日益彰显。
*国家自然科学基金重大研究计划项目(90211006) 、国家自然科学基金项目(30371141) 、国家重点基础研究发展规划项目(2002CB412508) 和国家林业局重点试验室开放基金资助项目。**通讯作者:- :2005--01
生态学杂志 第24卷 第10期 1188
影响空间降水的因素很多, 主要包括:气象站点的经纬度、站点高程、坡向、坡度、离水体的距离等。此外, 风速对降水也有一定的影响, 适当的风速有助于提高降水的强度; 在低海拔地区, 降水大致与高程和风速成正比; 当海拔增加到一定的高度, 降水会随着海拔的增加而降低。降水有时还呈现很强的季节变化, 这些都为准确的降水插值带来困难。由于日降水、月降水和年降水的时间尺度不同, 在考虑地形影响的情况下, 影响降水的变量参数随着时间尺度的增大而减少, 因而, 所采用的插值模型就应该存在差异[8]。但是, Jeffrey 等[14]在对日降水和月降水进行插值时, 忽略了一些短时间效应的微观变量对月降水插值的影响。
影响降水空间分布的因素不同, 所选择的空间降水插值方法和降水模型也不相同。对区域降水插值精度影响最大的是气象站点的数量及空间插值方法, 在站点数量不变的情况下, 影响区域降水空间插值精度的主要因素就是空间插值方法。
关于数据的空间插值方法很多, 有两种分类方法; 一种是归结为整体插值法(global methods ) 和局部插值法(local methods ) 两类; 另一种是将插值方法归结为整体插值法、局部插值法、地学统计法(statistical methods ) 和混合插值法(mixed methods ) 4类[21]。实际上, 地学统计法就是指克里金(krig -ing ) 插值法, 是局部插值法的一种; 而混合插值法则是指将整体插值法、局部插值法和地学统计法综合应用的一种方法。因此, 空间数据插值方法可以归结为3类:整体插值法、局部插值法和混合插值法。
[22]
[2]
[3, 22]
[5, 7, 17, 21]
数空间数据都可以用低次多项式来模拟; 但该方法在空间降水模拟方面的精度不高。
2. 1. 2 多元回归法 多元回归法主要是用数学表
达式来描述相关变量之间关系的一种插值方法。可以利用气象站点的地理坐标和高程数据, 结合其他的影响因子如坡向、坡度等, 建立回归模型。Eleanor 等在预测菲律宾地区血吸虫病的发生率时以Landsat 卫星遥感数据及各气象站点的气候变量(主要指气温和降水) 数据为基础, 运用多元回归法对气温和降水的空间分布进行插值, 获得了研究区域内任意点的气温和降水数据, 进而分析区域内任意点的血吸虫病发生率。气温和降水插值所用的回归模型, 提高了血吸虫病发生率的预测精度; 最重要的是该模型考虑了地形变量对气温和降水的影响。
Daly 等[5]建立了PRISM (parameter -elevation reg ressions on independent slopes model ) 插值模型, 该模型可对不同时间尺度的降水和温度进行插值分析, 属于多元回归法的一种。PRISM 模型假设在局部区域内, 高程是影响降水的主要因素; 模型以回归方程为基础, 利用气象站点数据、DEM (Digital Ele -vation Model ) 数据和其他的空间数据集, 对每个DEM 单元格计算其特殊的气象-高程线型回归函数。该模型适宜于地形起伏较大的地区。
Marqu íne 等为了将气象站点的降水数据反演到地形起伏较大的区域, 利用多元回归方法和GIS 技术, 分析了降水和一系列地形变量的关系, 并且指出最好的插值模型是将五个影响降水的地形变量因素(高程、坡度、坡向、离海岸线的距离和离相对西边的距离即任取研究区域西边的一条直线) 作为影响因子来考虑。M arqu íne 等[17]以西班牙南部的阿斯图里亚斯自治区为研究区域, 在分析月平均降水量时, 根据该区域极强的季节性降水, 将每年分为干、湿两季来进行分析。具体的分析方法是:①为了确定多项式函数, 按照一定的标准从原始数据中提取出最佳的分析数据; ②在那些有降水数据和无降水数据的站点之间建立了回归方程, 发现空间降水随高程的变化差异很大; ③根据大比例尺的DEM 数据提取出该区域的等高线和坡向信息, 同时计算出每个点到海岸线和到自定义西边的相对距离; ④利用这些数据来进行多元回归分析:将数据分成两部分, 一部分用于建立多元回归方程, 另一部分用于, [17][6]
2 空间降水插值方法
2. 1 整体插值法
2. 1. 1 趋势面法 趋势面法实际上是多项式回归法的一种。多项式回归的基本思想是用多项式表示的线或面、按最小二乘法原理对数据点进行拟合, 线或面多项式的选择取决于数据是一维还是二维或3维。多项式回归通过分析降水和气象站点的空间位置以及变量之间的线型和非线型关系, 构造不同维的趋势面, 建立不同的函数关系势面的数学模型为:
[21]
。例如, 三次趋
2
z =b 0+b 1x 1+b 2y +b 3x +b 4xy +b 5y +
b 6x 3+b 7x 2y +b 8xy 2+b 9y 3
式中, x 、y 是自变量, z 是因变量。
, 2
何红艳等:降水空间插值技术的研究进展
1189
合[8, 14, 16, 18]。普通克里金插值法不能考虑地形因素(如高程等) 等的影响, 而泛克里金法、协同克里金法等可以将高程因素考虑进去, 取得的插值效果也
比较好[8]。
2. 2. 4 样条法 另一种较常用的局部插值方法是样条法, 包括薄板滤波样条法、规则变形样条插值法、张力规则变形样条插值法等。这种方法是通过2个样本点之间的曲线变形达到最佳拟合的插值效果, 优点是该方法相对比较稳健, 并且不怎么依赖潜在的统计模型; 缺点是不能提供误差估计, 并要求研究区域是规则的[13]。
Hutchinson [11]用薄板滤波样条法(thin plate smoothing splines ) 分析空间降水插值时提出了五种不同参数设置下的样条模型, 参数的选择和设置不同, 所建的模型和维数也不同。在只考虑高程值对降水影响的情况下, 数学模型P =f (L , B , H ) (L 、B 、H 分别表示气象站点的经纬度和高程值) 适合月降水量的估测。Jeffrey 等就是利用三变量(经度、纬度和高程) 对气象数据如温度和降水进行了插值。运用薄板样条法进行插值分析, 涉及的参数不同, 所建立的数学模型也不同。因此, 在考虑降水时, 如涉及地形因素如坡向、坡度的影响, 可采用此方法[11]。2. 3 混合插值法
混合插值法是通过改正整体插值法中存在的残差来进一步提高插值精度的方法。该方法融合了整体插值法和局部插值法的优点, 是一种有效的插值手段。Serrano 等就是利用反距离插值法和样条法对整体插值后存在的残差(整体插值法是不精确的插值器, 所预测的站点数据必然和已知数据之间存在一个残差) 再次进行插值, 生成一个降水残差修正图, 最后将这个残差修正图与整体插值后的降水数据进行叠加。该方法一定程度上提高了数据插值精度。
[21]
[14]
[10~12, 21]
量之间的关系更趋向于四次方或立方关系, 而不是线性关系; ⑤最后, 利用前面的分析建立多元回归方程, 分别针对年平均降水、干季降水和湿季降水三种
不同的数据类型求出回归系数, 建立了插值估算模型。这种方法的优点在于:估算的降水量不依赖于估算点周围区域气象站点的密集程度, 可以直接根据地形参数求出降水量。因此, 地形相似的区域站点可以满足要求, 即使两者相距比较远。2. 2 局部插值法
2. 2. 1 泰森多边形法 最简单的局部插值法是泰森多边形法, 又叫最临近点插值法, 是一种近似估计方法[8, 11]。该方法假定所需要估算的降水数据与最临近它的已知站点的降水数据相同。这种方法适用于站点密集的地区, 并且该地区的地形应该大致相同[8]。但是, 泰森多边形法对于逐渐变化的空间变量(如温度、降水) 的插值不太合适[4]。同时, 该方法忽略了高程的影响, 对于高程变化较大的区域, 用泰森多边形插值所得的插值数据的误差很大。2. 2. 2 反距离加权法 对于山区或者降水站点不是很密集的地区, 反距离加权法(IDW ) 有助于提高所预测数据的精度。反距离加权法估算降水量时是根据距离衰减规律, 对样本点的空间距离进行加权, 当权重等于1时, 是线性距离衰减插值; 当权重>1时, 是非线性距离衰减插值。这种方法的优点是可以通过权重调整空间插值等值线的结构, 缺点是该方法也没有考虑地形因素(如高程等) 对降水的影响[8]。
2. 2. 3 克里金插值法 克里金插值法又叫地学统计法, 该方法是以南美的一个采矿工程师的名字命名的, 应用相当广泛。克里金插值法充分吸收了空间统计的思想, 认为任何空间连续性变化的属性非常不规则, 不能用简单的平滑数学函数进行模拟, 但是可以用随机表面给予较恰当的描述。从数学角度抽象来说, 它是一种对空间分布数据求最优、线性、无偏内插的估计(Best Linear Unbiased Estimation , 简写为BLUE ) 方法。较常规方法而言, 它的优点在于不仅考虑了各已知数据点的空间相关性, 而且在给出待估计点的数值的同时, 还能给出表示估计精度的方差。经过多年的发展与完善, 克里金插值法已经有了好几个变种, 如普通克里金法(o rdinary kriging ) 、通用克里金法(universal kriging ) 、泛克里金法(kriging w ith extensive ) 、协同克里金法(cokrig -[21][5, 8, 10, 21]
[8]
3 空间降水插值的进展与展望
3. 1 空间降水插值的新进展
3. 1. 1 神经网络技术 由于人工神经网络不要求对事物机制有明确的了解, 系统的输出只取决于系
统输入和输出之间的连接权, 而这些连接权的数值则是通过训练样本的学习获得, 这种方式对解决机理尚不明确的问题特别有效[1], 因此也被用于降水[16, 22],
生态学杂志 第24卷 第10期 1190
析模型虽然无法被解译成具体的数学模型[22], 但在整个研究区域, 可以利用该方法来显著提高空间降水插值的精度。
Wong 等[22]提出的空间降水局部插值新方法就是将SOM (seft -o rganising map , SOM 是一种快速、简单、值得信赖的非监督分类方法) 、BP 神经网络和模糊逻辑(fuzzy logic ) 有机地结合起来。其具体步骤是:①利用SOM 将所有的空间数据进行分类, 使每一个子区域具有较强的统一性; ②用BP 网络训练每一个子类的数据, 将x 、y 坐标作为输入神经元, 降水量z 作为输出神经元, 预测那些只属于这个子类的数据。如果有n 个子类, 那么n 个BP 网络需要训练; ③由于BP 网络是从训练数据中总结概括的, 因而需要提取BP 网络所学到的知识, 故而需要从BP 网络中提取n 个模糊规则基准, 然后将这些模糊规则基准用于降水插值。该方法的优点在于:①充分利用了人工神经网络的稳健性和学习能力对训练数据进行分类和总结; ②模糊规则的使用, 使插值模型具有交互性和处理模糊数据的能力; 最重要的是, 提出了降水预测的自我学习能力和自我解译能力的新技术。
Lin 等[16]提出了一种名为改良型径向基函数网络(improved radial basis function network , IRBFN ) 的插值方法, 这种插值方法是将标准型径向基函数网络与半方差函数模型相结合而产生的。Lin 等还将I RBFN 运用于台湾南部的潭水河区域的空间降水插值分析, 并与标准型径向基函数网络及普通克里金插值方法进行了对比, 得出用IRBFN 插值所得估测数据的插值误差最小。
3. 1. 2 缩减规模插值 缩减规模插值也是一种有效的降水插值方法[10, 14, 15]。由于没有合适的方法直接对大区域降水进行插值, 因而只能通过分析非常有限空间尺度上的降水来获得大区域的降水信息。缩减规模插值就是将大的区域缩减成几个小区域, 即将一个大的区域分成几个小区域, 进行分区插值, 进而获得整个区域的降水量。由于缺乏有效的测量空间降水数据的方法以及相关的空间、时间数据, 缩减规模插值方法所建模型的有效性有待进一步提高。3. 2 展望
3. 2. 1 综合考虑影响降水因素有利于提高插值精度 在国内, 现有的降水插值模型, 考虑高程、坡度。[15]
[16]
站点的降水直接对整个区域进行插值, 没有考虑地形等因素的影响, 这样获得的降水数据的误差较大[2]。另外, 对于一个地区的降水, 它的历史降水与现在所研究的降水也有关系[8], 这种时间上的降水相关性会随着时间尺度的缩小而增大。如何将影响空间降水的时间因素和地形因素包涵在插值模型中, 以提高空间降水插值数据的准确度, 是今后空间降水插值问题研究的重点之一。
3. 2. 2 更详细的研究区域的地形特征可以提高降水插值精度 插值精度的提高, 需要更细致的了解研究区域的地形特征, 如坡度、坡向等, 因而需要较高分辨率的气象数据和相关的地形数据, 大比例尺的DEM (Digital Elevation Model ) 或DTM (Digital Terrain M odel ) 等采样密度高的数据可以为研究区域提供更详细的自然地理特征, 因而显得越来越重要。3. 2. 3 应用数学和人工神经网络等技术的发展为降水插值方法的研究提供了新方法 许多数学建模方法如多元回归法、多项式回归法和BP 网络、径向基函数网络等的应用已相当普遍, 随着应用数学和人工神经网络技术的发展, 很多学者也把它们引入到空间降水插值中, 以此为基础来建立插值模型[5, 16, 17, 22]。
总之, 应根据研究目的和研究区域的自然地理地形特征来选择合适的插值方法和参数。随着研究的日益深入和对数据精度要求的不断提高, 全面地考虑各种影响降水的因子势在必然。随着人工神经网络技术等的引入, 结合各种方法优点的混合插值法是未来插值方法研究的一个重要方向。参考文献
[1] 尤淑撑, 严泰来. 2000. 基于人工神经网络面插值的方法研究
[J ]. 测绘学报, 29(1) :30~34.
[2] 朱会义, 贾绍凤. 2004. 降雨信息空间插值的不确定性分析
[J ]. 地理科学进展, 23(2) :34~41.
[3] Band C . 1991. Forest ecosystem processes at the watershed scale :
Bas is for distributed simulation [J ]. Ecol . Model . , 56:171~196.
[4] Bu rrough PA , M cDonnel RA . 1998. Principles of Geographical
Information S ystems [M ]. Oxford :Oxford University Press .
[5] Dal y C , Helmer EH , Quiones M . 2003. M apping the climate of
Puerto Rico , Vieques and Culebra [J ]. Int . J . Climatol . , 23(11) :1359~1381.
[6] El eanor R , Cross M S , Rick Perrine BS . 1984. Predicting areas
endemic for schistos omiasis us ing weather variables and a l andsat data base [J ]. Mili . Medi . , 149(10) :542~545.
[7] Fedorovski A . 1998. Estimating areal average rainfall for an un -the r [. J . E -
何红艳等:降水空间插值技术的研究进展
drol . , 6:5~15. Goovaerts P . 2000. Geostatistical approaches for incorporating el -evation into the spatial interpolation of rainfall [J ]. J . Hydrol . , 228(1~2) :113~129.
Hanqin T , M elillo JM , Kicklibhter DW , et al . 1998. Effect of in -terannual climate variability on carbon storage in Amazonian e -cos ystems [J ]. Nature , 396(6712) :664~667. Hasenauer H , M erganicova K , Petritsch R , et a l . 2003. Valida -tion dail y climate interpol ations over complex terrain in Austria [J ]. Agr ic . For . Meteor . , 119(1~2) :87~107. Hutchins on M F . 1998. Interpol ation of rainfall data w ith thin plate s moothing splines -part I :Tw o dimensional s m oothing of da -ta w ith short range correlation [J ]. J . Geogr . In f . Decis . Anal . , 2(2) :139~151. Hutchinson M F . 1998. Interpolation of rainfall data with thin plate smoothing splines -part Ⅱ:Tw o dimensional s moothing of data w ith short range correlation [J ]. J . Ge ogr . Inf . Decis . Ana l . , 2(2) :152~167. Hutchinson M F . 1995. Interpolating mean rainfall us ing thin plate s moothing splines [J ]. Int . J . Ge ogr . In f . Sys . , 9:385~403.
Jeffrey S J , Carter JO , M oodie KB , et al . 2001. Us ing spatial in -terpolation to construct a comprehens ive archive of Australia cli -mate data [J ]. Environ . Model . Softw . , 16(4) :309~330. Lanza LG , Ram írez J A , Todini E . 2001. Stochastic rainfall inter -polation and dow nscaling [J ]. Hydro . Earth Sys . Sci . , 5(2) :139~143.
1191
[16] Lin GF , C hen LH . 2004. A spatial interpol ation method based on
radial basis function networks incorporating a semivariog ram m odel [J ]. J . Hydrol . , 288(3~4) :288~298.
[17] M arqu ínez J , Lastra J , Garc ía P . 2003. Estimation models for pre -cipitation in mountainous regions :T he us e of GIS and multivari -ate analys is [J ]. J . Hydrol . , 270(1~2) :1~11. [18] Prudhomme C , Duncan W R . 1999. M apping extreme rainfall in a
m ountainous region using geostatistical techniques :A case study in Scotland [J ]. Int . J . Climatol . , 19(12) :1337~1356.
[19] Sato YS , Yamashita F , Sugiura Y , et al . 2004. FIB -assisted
TEM study of an oxide array in the root of a friction stirw eided aluminum alloy [J ]. S cripta Mater . , 50(3) :365~369.
[20] Shaw M R , Zavaleta ES , C hiariello NR , et a l . 2002. Grassland re -sponses to global environmental changes suppress ed by el evated
CO 2[J ]. Science , 298(5600) :1987~1990. [21] Vicente -S errano SM , S az -S ánchez M A , Cuadrat JM . 2003. Com -parative analysis of interpol ation methods in the middle Ebro Val -ley (Spain ) :Application to annual precipitation and temperatu re [J ]. Clim . Res . , 24(2) :161~180.
[22] Wong KW , W ong PM , Gedeon TD , et al . 2003. Rainfal l predic -tion model using soft computing technique [J ]. S oft Com put . , 7
(6) :434~438.
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
作者简介 何红艳, 女, 1981年生, 硕士生。主要从事GIS 、RS 、G PS 等在生态学方面的应用研究。责任编辑 李凤芹