-
连续的空间数据(如气象数据、地质数据和空气污染数据等)是多种科学模型研究的基础[1]。通过建立高密度的空间数据观测站点,可以获得高分辨率空间插值数据。但是,由于地形条件、技术手段和经济水平等因素的限制,一些地点的空间数据仍然难以获取;此外,由于观测站检修等原因,可能造成观测数据的局部缺失。为了获取未采样区域的空间数据和缺失观测站点的补插数据,可以将统计学方法与地理空间信息分析方法相结合,利用已有空间数据观测站点的观测值对待求点处的空间数据进行空间插值估算,得到可供使用的高精度表面数据[2]。
近年来,国内外学者对空间插值方法进行了大量研究,针对各种应用需要发展了诸多空间插值方法[3-6],其中也有一些学者对经典空间插值方法进行了一系列优化改进[7-12]。各种不同空间插值方法具有各自的优势和劣势,适用的领域也不尽相同。现有大量空间插值方法中,还没有一种方法可在不同领域都获得最佳插值结果,并适用于所有领域[13-15]。因此,在实际应用中通常采用交叉验证模型[16]来评价不同空间插值方法在不同领域的插值结果。
对于反距离加权插值法(inverse-distance weighting,IDW),Chen等人利用其估计台湾中部降雨量分布情况,发现搜索半径为10~30 km、距离衰减参数为0~5时空间插值的结果最优[17];封志明等人采用反距离加权插值方法与梯度距离反比方法对甘肃省气象站点的多年平均降雨量和气温数据进行空间插值,并利用逐步迭代法对研究区域各月平均降雨量与温度的距离幂指数进行了筛选,得出当距离幂指数等于2时不一定能够获得最优空间插值结果的结论[18];Lu等人针对反距离加权插值方法中的距离衰减参数α进行改进,根据待求点邻域内样本点的空间分布模式确定距离衰减参数,提出了自适应IDW(adaptive IDW,AIDW)方法,实验结果表明可变的距离衰减参数得到的插值结果更准确[19]。
通过对上述反距离加权插值方法进行分析可以发现,现有方法主要存在两方面的不足:(1) 现有IDW插值法中的距离衰减参数α需要人为调节,不仅使得参数的调整较为繁琐,而且单一的距离衰减参数也使得算法对于空间分布不均匀的观测数据插值精度较低;(2) 现有方法只单纯考虑了采样点内部相关性对于空间插值的影响,没有综合考虑采样点内部相关性和其他外部多种因素对空间插值的影响,尤其是空间异质性的影响,如复杂地形情况下空间邻近的两个视测点属性值有可能相差较多。因此,针对现有反距离加权插值方法的局限性,本文提出了一种顾及多因素影响的自适应反距离加权插值算法(adaptive cluster gradient IDW,ACGIDW)。不同插值数据的影响因素并不完全一致,本文以气象要素数据为例,阐述对于气象要素数据的多因素影响分析,并使用ACGIDW对其进行插值分析与对比验证。
-
对于气象要素数据,ACGIDW插值方法首先顾及经纬度和高程对气象要素的影响,计算偏回归系数;然后考虑复杂地形因素的影响,对采样点进行聚类处理,进而确定距离衰减参数;最后根据偏回归系数和距离衰减参数,按照IDW方法计算待求点处的估值。算法流程如图 1所示。
-
为了顾及经纬度和高程对于气象要素插值的影响,ACGIDW将观测站点的经度X、纬度Y和高程U作为自变量,观测站气象观测数据Z作为因变量,将Xi、Yi、Ui、Zi作为样本进行多元线性回归分析,计算X、Y和U对气象数据Z的偏回归系数Cx、Cy、Cu。使用多元线性回归模型进行回归分析:
(1) 其中,ε~N(0,σ2)为服从正态分布的随机误差。使用最大似然法估计式(1)中的参数,即X、Y和U对气象数据Z的偏回归系数C。
-
对观测点进行聚类处理,将空间上邻近且属性值较为相似的采样点聚类成为一个簇。首先使用基于Delaunay三角网的自适应空间聚类算法(adaptive spatial clustering based on Delaunay triangulation,ASCDT)[20]进行聚类,施加距离全局约束和局部约束,然后使用基于双重距离的空间聚类算法(dual distance based spatial clustering,DDBSC)[21]施加专题属性约束,并将异常点剔除,减小其对于空间插值的极端影响。
聚类处理的具体思路为:首先,由所有采样点生成Delaunay三角网;然后,对Delaunay三角网的每条边施加全局距离约束,将全局三角网的长边打断;进而对进行全局距离约束后的三角网边施加局部距离约束,打断局部长边,将采样点聚类成若干个簇;最后,顾及要素点的专题属性约束,对空间聚类结果做进一步的属性聚类,将簇中的属性异常点剔除,得到最终的聚类结果。
-
聚类后根据待求点邻域内采样点的局部空间模式来确定反距离加权方法中的距离衰减参数α,并由此反映局部点分布情况的变化。对于待求点邻域内较为密集的模式,采用较小的距离衰减参数;而对于待求点邻域内相对分散的模式,则采用较大的距离衰减参数。对每个待求点计算距离最近的采样点,以待求点所在簇中距离其最近的n个采样点为局部邻域,在局部邻域内计算待求点的距离衰减参数。
首先,量化待求点局部邻域内的局部空间模式,本文采用局部最邻近指数[22]对待求点邻域内的采样点的局部空间模式进行量化。待求点邻域内最邻近距离的平均值可表达为:
(2) 已知的随机点模式的经验最邻近距离可表达为:
(3) 其中,
为第i个采样点与其最近邻要素点的距离; n为研究区域的点数;A为研究区的面积。点S0的局部最邻近指数R由观测的局部最邻近距离和经验最邻近距离计算,表达为:(4) 其中,R值越小,待求点局部邻域内相对越聚集;反之,值越大,待求点局部邻域内相对越分散。
利用这种派生出的局部最邻近指数不是为了测试点模式,而是提供了一个简单的局部点模式概括度量。理论上,R(S0)可以反映S0邻域的相对聚集或者分散。采用最邻近指数法对空间模式进行量化时通常会有两个问题:(1)仅采用一个距离的平均值概括所有的邻近距离可能会存在偏差;(2)最邻近指数会因为研究区域面积计算的方式不同而导致得到的结果不同。在本文的方法中,最邻近指数的计算只用于待求点及其邻域的n个点,因而不会存在明显的偏差。由于后文还需要对最邻近指数进行标准化,从而使得不同的研究区面积计算方式并不会对结果产生影响。
按照式(5)计算标准化局部最邻近指数μR,将局部最邻近指数R(S0) 标准化到[0, 1]范围内:
(5) 其中,
为R(S0)的经验最小值;Rmax为R(S0)的经验最大值;两者分别代表所有待求点局部最邻近指数中的最小值和最大值。与经典的标准线性标准化相比,这种模糊的标准化更加灵活,标准化局部最邻近指数与局部最邻近指数之间的关系如图 2所示。根据标准化最邻近指数μR计算距离衰减参数α的值。较小的标准化最邻近指数μR对应较小的距离衰减参数α;相反,较大的μR对应较大的α。考虑到一些不确定因素,本方法采用一种三角形隶属函数[23]确定α的取值,距离衰减参数由标准化的局部最邻近指数确定。
最后,按照式(6)的IDW进行插值计算:
(6) 其中,di是采样点到待求点的距离;αi为待求点对应的距离衰减参数。
-
本文针对现有空间插值方法对于影响空间插值(尤其是气象要素插值)的因素考虑不够全面等局限性,提出了一种顾及多因素影响的自适应反距离加权插值算法(ACGIDW)。该算法顾及经纬度和高程以及复杂地形因素对于空间插值的影响,自适应地调整了距离衰减参数α,从而提高了反距离插值算法的精度和自适应性。最后通过两组实际数据实验验证了本文所提出方法的优越性和可行性。考虑到经纬度和高程对于气象数据空间插值的影响,本文提出的方法适用于受经纬度和高程影响较为明显的气象数据等的空间插值。未来可以将各种影响因子参数化,找到一种适用于多种不同数据的空间插值方法,并可以将此插值方法顾及时间维进行时空插值。
An Adaptive Inverse-Distance Weighting Spatial Interpolation Method with the Consideration of Multiple Factors
-
摘要: 空间插值算法旨在利用离散的观测点测量数据估算同一区域中未采样点的估计值,进而生成连续的空间表面模型。为了获得高精度的缺失数据估计值和高分辨率空间表面模型,提出了一种顾及多因素影响的自适应反距离加权插值算法(adaptive cluster gradient inverse-distance weighting, ACGIDW)。该算法以气象数据为例,顾及复杂地形因素、经纬度和高程对空间插值的影响,并根据采样点的空间分布模式对反距离加权算法中的距离衰减参数α进行自适应调整,提高了空间插值算法的精度和自适应性。采用两组实际气温和降水数据,运用交叉验证模型,对ACGIDW方法、其他反距离加权方法、普通克立金方法进行实验对比分析,验证了ACGIDW方法的优越性和可行性。Abstract: Spatial interpolation is an approach to estimate data at an un-sampled points based on known observations at sampled stations and generate a continuous surface model. In order to obtain the estimated value for missing data and precise spatial surface models, it is necessary to develop a high-performance spatial interpolation method. Based on the typical adaptive inverse-distance weighting (AIDW) spatial interpolation method, a new method, called adaptive cluster gradient inverse-distance weighting (ACGIDW) is presented in this paper. Considering the effect of latitude, longitude, elevation and complex topography factors, this method offers a more accurate result, 1) it adjusts the distance-decay parameter in the IDW method to improve the adaptability of the ACGIDW according to the spatial distribution pattern of the stations; 2) it was tested by using two groups of different actual meteorological data. The experimental results demonstrate its superiority and feasibility.
-
Key words:
- inverse-distance weighting /
- distance-decay parameter /
- adaptation /
- multiple factors
-
[1] Li Jin, Heap A D. A Review of Comparative Studies of Spatial Interpolation Methods in Environmental Sciences:Performance and Impact Factors[J]. Ecological Informatics, 2011, 6:228-241 [2] De Smith M J, Goodchild M F, Longley P. Geospatial Analysis:A Comprehensive Guide to Principles, Techniques and Software Tools[M]. Matador:Troubador Publishing Ltd, 2007 [3] 储少林,周兆叶,袁雷,等.降水空间插值方法应用研究:以甘肃省为例[J].草业科学,2008,25(6):19-23 Chu Shaoling, Zhou Zhaoye, Yuan Lei, et al. Study on Spatial Precipitation Interpolation Methods:A Case of Gansu Province[J]. Pratacultural Science, 2008, 25(6):19-23 [4] Nalder I A, Wein R W. Spatial Interpolation of Climatic Normals:Test of a New Method in the Canadian Boreal Forest[J]. Agricultural and Forest Meteorology, 1998, 92(4):211-225 [5] Shiode N, Shiode S. Street-Level Spatial Interpolation Using Network-based IDW and Ordinary Kriging[J]. Transactions in GIS, 2011, 15(4):457-477 [6] Xu Chengdong, Wang Jinfeng, Hu Maogui, et al. Interpolation of Missing Temperature Data at Meteorological Stations Using P-BSHADE[J]. Climate, 2013, 26:7452-7463 [7] Simolo C, Brunetti M, Maugeri M, et al. Improving Estimation of Missing Values in Daily Precipitation Series by a Probability Density Function-Preserving Approach[J]. International Journal of Climatology, 2010, 30:1564-1576 [8] 刘志红,杨勤科,李锐,等.基于ANUSPLIN的时间序列气象要素空间插值[J].西北农林科技大学学报·自然科学版,2008,36(10):227-234 Liu Zhihong, Yang Qingke, Li Rui, et al. Interpolation for Time Series of Meterorological Variables Using ANUSPLIN[J]. Journal of Northwest A & F University, 2008, 36(10):227-234 [9] 易琳,袁林旺,罗文,等.顾及V-邻域结构的局部保形插值算法[J].武汉大学学报·信息科学版,2012,37(11):1285-1288 Yi Ling, Yuan Linwang, Luo Wen, et al. V-Neighbor Structure based Spatial Interpolation Algorithm[J]. Geomatics and Information Science of Wuhan University, 2012, 37(11):1285-1288 [10] 李莎,舒红,徐正全.利用时空Kriging进行气温插值研究[J].武汉大学学报·信息科学版,2012,37(2):237-241 Li Sha, Shu Hong, Xu Zhengquan. Interpolation of Temperature Based on Spatial-Temporal Kriging[J]. Geomatics and Information Science of Wuhan University, 2012, 37(2):237-241 [11] Zhang Jinming, You Xiong, Wan Gang. Effects of Interpolation Parameters in Multi-log Radial Basis Function on DEM Accuracy[J]. Geomatics and Information Science of Wuhan University, 2013, 38(5):608-612 张锦明,游雄,万刚.径向基函数算法中插值参数对DEM精度的影响[J].武汉大学学报·信息科学版,2013,38(5):608-612 [12] 董箭,彭认灿,郑义东.利用局部动态最优Delaunay三角网改进逐点内插算法[J]. 武汉大学学报·信息科学版,2013,38(5):613-617 Dong Jian, Peng Rencan, Zheng Yidong. An Improved Algorithm of Point-by-Point Interpolation by Using Local Dynamic Optimal Delaunay Triangulation Network[J]. Geomatics and Information Science of Wuhan University, 2013, 38(5):613-617 [13] 陈传法,岳天祥,张照杰.高精度曲面模型的解算[J].武汉大学学报·信息科学版,2010,35(3):365-368 Chen Chuanfa, Yue Tianxiang, Zhang Zhaojie. An Algorithm for Solving High Accuracy Surface Modeling[J]. Geomatics and Information Science of Wuhan University, 2010, 35(3):365-368 [14] 彭思岭.气象要素时空插值方法研究[D].长沙:中南大学,2010 Peng Siling. Developments of Spatio-Temporal Interpolation Methods for Meteorological Elements[D]. Changsha:Central South University, 2010 [15] Li Jin, Heap A D. Spatial Interpolation Methods Applied in the Environmental Sciences:A Review[J]. Environmental Modelling & Software, 2014, 53:173-189 [16] Efron B, Gong G. A Leisurely Look at the Bootstrap, the Jackknife, and Cross-Validation[J]. The American Statistician, 1983, 37(1):36-48 [17] Li Jin, Heap A D. Spatial Interpolation Methods Applied in the Environmental Sciences:A Review[J]. Environmental Modelling & Software, 2014, 53:173-189 [18] 封志明,杨艳昭,丁晓强,等.气象要素空间插值方法优化[J].地理研究,2004,23(3):357-364 Efron B, Gong G. A Leisurely Look at the Bootstrap, the Jackknife, and Cross-Validation[J]. The American Statistician, 1983, 37(1):36-48 [19] Lu G Y, Wong D W. An Adaptive Inverse-Distance Weighting Spatial Interpolation Technique[J]. Computers & Geosciences, 2008, 34(9):1044-1055 [20] Deng M, Liu Q, Cheng T, et al. An Adaptive Spatial Clustering Algorithm Based on Delaunay Triangulation[J]. Computers, Environment and Urban Systems, 2011, 35(4):320-332 [21] 李光强,邓敏,程涛,等.一种基于双重距离的空间聚类方法[J]. 测绘学报,2008,37(4):482-488 Li Guangqiang, Deng Min, Cheng Tao, et al. A Dual Distance based Spatial Clustering Method[J]. Acta Geodaetica et Cartographica Sinica, 2008, 37(4):482-488 [22] Clark P J, Evans F C. Distance to Nearest Neighbor as a Measure of Spatial Relationships in Populations[J]. Ecology, 1954,35(4):445-453 [23] Kantardzic M. Data Mining:Concepts, Models, Methods, and Algorithms[M]. Blackwell:John Wiley & Sons, 2011 [23] Kantardzic M. Data Mining: Concepts, Models, Methods, and Algorithms[M]. Blackwell: John Wiley & Sons, 2011 -