留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

地理加权回归分析技术综述

卢宾宾 葛咏 秦昆 郑江华

卢宾宾, 葛咏, 秦昆, 郑江华. 地理加权回归分析技术综述[J]. 武汉大学学报 ● 信息科学版, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
引用本文: 卢宾宾, 葛咏, 秦昆, 郑江华. 地理加权回归分析技术综述[J]. 武汉大学学报 ● 信息科学版, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
LU Binbin, GE Yong, QIN Kun, ZHENG Jianghua. A Review on Geographically Weighted Regression[J]. Geomatics and Information Science of Wuhan University, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
Citation: LU Binbin, GE Yong, QIN Kun, ZHENG Jianghua. A Review on Geographically Weighted Regression[J]. Geomatics and Information Science of Wuhan University, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346

地理加权回归分析技术综述

doi: 10.13203/j.whugis20190346
基金项目: 

国家自然科学基金 41725006

国家自然科学基金 41871287

国家自然科学基金 U1833201

详细信息
    作者简介:

    卢宾宾,博士,讲师,主要从事空间统计、地理加权回归分析、地理加权建模技术等方面的研究。binbinlu@whu.edu.cn

  • 中图分类号: P208

A Review on Geographically Weighted Regression

Funds: 

The National Natural Science Foundation of China 41725006

The National Natural Science Foundation of China 41871287

The National Natural Science Foundation of China U1833201

More Information
    Author Bio:

    LU Binbin, PhD, lecturer, specializes in spatial statistics, geographically weighted regression, geographically weighted models.E-mail: binbinlu@whu.edu.cn

  • 摘要: 空间数据关系中的异质性或非平稳性特征是近期空间统计或相关应用领域的研究热点之一,而局部空间统计分析技术的提出与发展是其关键环节。地理加权回归分析技术(geographically weighted regression,GWR)通过关于位置的局部加权回归分析模型求解,以随着空间位置不同而变化的参数估计结果,量化反映空间数据关系中的异质性或非平稳性特征。GWR技术已在众多领域内广泛应用,逐渐成为重要的空间关系异质性建模工具之一。针对GWR模型解算、结果解读、模型检验等基础技术环节进行了系统总结,分别分析回顾了其对应的相关研究进展以及应用过程中存在的问题。同时,系统梳理了近年来GWR技术的主要拓展与延伸,重点阐述了其在采用灵活的距离度量选择、参数的多尺度估计以及时空数据建模方面的GWR技术扩展研究。此外,还简要介绍了现有的主要GWR技术软件工具,以期为读者和用户提供相对全面的GWR技术信息参考与知识总结。
  • 图  1  每年发表GWR技术相关文章数量

    Figure  1.  Articles Published Annually on the GWR Technique

    图  2  GWR技术相关文章关键词统计分析

    Figure  2.  Statistics on the Keywords of GWR-Related Articles

    图  3  不同类型带宽作用示意图

    Figure  3.  Schematic Diagram of Different Types of Bandwidth Definitions

    表  1  GWR技术文章发表量英文和中文期刊(前10位)

    Table  1.   Publication Sources of GWR-Related Articles (Top 10)

    英文期刊 数量/篇 中文期刊 数量/篇
    Applied Geography 70 测绘科学 6
    Sustainability 40 农业工程学报 5
    Plos One 38 统计与信息论坛 5
    International Journal of Environmental Research and Public Health 34 测绘通报 4
    Remote Sensing 33 经济地理 4
    Science of the Total Environment 31 长江流域资源与环境 4
    ISPRS International Journal of Geo-information 29 测绘与空间地理信息 3
    Geographical Analysis 26 地理研究 3
    International Journal of Geographical Information Science 26 甘肃科学学报 3
    Journal of Transport Geography 26 国土与自然资源研究 3
    下载: 导出CSV
  • [1] Fotheringham A S, Brunsdon C. Local Forms of Spatial Analysis[J]. Geographical Analysis, 1999, 31(4): 340-358 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=10.1111/j.1538-4632.1999.tb00989.x
    [2] Goodchild M F. The Validity and Usefulness of Laws in Geographic Information Science and Geography[J]. Annals of the Association of American Geographers, 2004, 94(2): 300-303 doi:  10.1111/j.1467-8306.2004.09402008.x
    [3] Páez A. Local Analysis of Spatial Relationships: A Comparison of GWR and the Expansion Method[C]. The 5th International Conference on Computational Science and Its Applications, Singapore, 2005
    [4] Swamy P A V B, Conway R K, Leblanc M R. The Stochastic Coefficients Approach to Econometric Modeling, Part 1: A Critique of Fixed Coefficients Models[R]. US: Board of Governors of the Federal Reserve System, 1988
    [5] Gamerman D, Moreira A R B, Rue H.Space-Varying Regression Models: Specifications and Simulation[J]. Computational Statistics & Data Analysis, 2003, 42(3): 513-533 http://www.sciencedirect.com/science/article/pii/S0167947302002116
    [6] Cleveland W S. Robust Locally Weighted Regression and Smoothing Scatterplots[J]. Journal of the American Statistical Association, 1979, 74(368): 829-836 doi:  10.1080/01621459.1979.10481038
    [7] Brunsdon C, Fotheringham A S, Charlton M E. Geographically Weighted Regression: A Method for Exploring Spatial Nonstationarity[J]. Geographical Analysis, 1996, 28(4): 281-298
    [8] Páez A, Wheeler D. Geographically Weighted Regression[M]// Kitchin R, Thrift N. International Encyclopedia of Human Geography.Oxford: Elsevier, 2009: 407-414
    [9] Aria M, Cuccurullo C. Bibliometrix: An R-Tool for Comprehensive Science Mapping Analysis[J]. Journal of Informetrics, 2017, 11(4): 959-975 doi:  10.1016/j.joi.2017.08.007
    [10] 玄海燕, 李琪, 张运虎.基于地理加权回归的我国各市人口总数的空间特征分析[J].生物数学学报, 2016, 31(2): 223-228 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=swsxxb201602009

    Xuan Haiyan, Li Qi, Zhang Yunhu. Spatial Characteristics Analysis of Total Population in Various Cities Based on Geographically Weighted Regression[J]. Journal of Biomathematic, 2016, 31(2): 223-228 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=swsxxb201602009
    [11] 赵阳阳, 刘纪平, 张福浩, 等.贪心算法的地理加权回归特征变量选择方法[J].测绘科学, 2016, 41(7): 41-46 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=chkx201607009

    Zhao Yangyang, Liu Jiping, Zhang Fuhao, et al.An Approach of Characteristics Variable Selection of Geographically Weighted Regression Based on Greedy Algorithm[J]. Science of Surveying and Mapping, 2016, 41(7): 41-46 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=chkx201607009
    [12] Tobler W R. A Computer Movie Simulating Urban Growth in the Detroit Region[J]. Economic Geography, 1970, 46(2): 234-240 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=10.2307/143141
    [13] Fotheringham A S, Brunsdon C, Charlton M. Geographically Weighted Regression: The Analysis of Spatially Varying Relationships[M]. Chichester: Wiley, 2002
    [14] Cho S H, Lambert D M, Chen Z. Geographically Weighted Regression Bandwidth Selection and Spatial Autocorrelation: An Empirical Example Using Chinese Agriculture Data[J]. Applied Economics Letters, 2010, 17(8): 767 - 772 doi:  10.1080/13504850802314452
    [15] Cameron A C, Trivedi P K. Microeconometrics: Methods and Applications[M]. New York: Cambridge University Press, 2005
    [16] Farber S, Páez A. A Systematic Investigation of Cross-Validation in GWR Model Estimation:Empirical Analysis and Monte Carlo Simulations[J]. Journal of Geographical Systems, 2007, 9(4): 371-396 doi:  10.1007/s10109-007-0051-3
    [17] Akaike H. Information Theory and an Extension of the Maximum Likelihood Principle[C]. 2nd International Symposium on Information Theory. Tsahkadsor, Armenia, 1973
    [18] Mennis J. Mapping the Results of Geographically Weighted Regression[J]. The Cartographic Journal, 2006, 43(2): 171-179 doi:  10.1179/000870406X114658
    [19] Leung Y, Mei C L, Zhang W X. Testing for Spatial Autocorrelation Among the Residuals of the Geographically Weighted Regression[J]. Environment and Planning A, 2000, 32(5): 871-890 doi:  10.1068/a32117
    [20] Leung Y, Mei C L, Zhang W X. Statistical Tests for Spatial Nonstationarity Based on the Geographically Weighted Regression Model[J]. Environment and Planning A, 2000, 32(1): 9-32 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=10.1068/a3162
    [21] Comber A, Chi K, Huy M Q, et al. Distance Metric Choice Can Both Reduce and Induce Collinearity in Geographically Weighted Regression[J]. Environment and Planning B: Urban Analytics and City Science, 2018, DOI: 10.1177/2399808318784017
    [22] Griffith D A. Spatial-Filtering-Based Contributions to a Critique of Geographically Weighted Regression (GWR)[J]. Environment and Planning A, 2008, 40(11): 2 751-2 769 doi:  10.1068/a38218
    [23] Wheeler D, Tiefelsdorf M. Multicollinearity and Correlation Among Local Regression Coefficients in Geographically Weighted Regression[J]. Journal of Geographical Systems, 2005, 7(2): 161-187 doi:  10.1007/s10109-005-0155-6
    [24] Wheeler D C. Simultaneous Coefficient Penalization and Model Selection in Geographically Weighted Regression: The Geographically Weighted Lasso[J]. Environment and Planning A, 2009, 41(3): 722-742
    [25] Wheeler D C. Diagnostic Tools and a Remedial Method for Collinearity in Geographically Weighted Regression[J]. Environment and Planning A, 2007, 39(10): 2 464-2 481 doi:  10.1068/a38325
    [26] Gollini I, Lu B, Charlton M, et al. GWmodel: An R Package for Exploring Spatial Heterogeneity Using Geographically Weighted Models[J]. Journal of Statistical Software, 2015, 63(17): 1-50 http://www.researchgate.net/publication/237000443_GWmodel_an_R_Package_for_Exploring_Spatial_Heterogeneity_using_Geographically_Weighted_Models
    [27] Fotheringham A S, Oshan T M. Geographically Weighted Regression and Multicollinearity: Dispelling the Myth[J]. Journal of Geographical Systems, 2016, 18(4): 303-329 doi:  10.1007/s10109-016-0239-5
    [28] Jetz W, Rahbek C, Lichstein J W. Local and Global Approaches to Spatial Data Analysis in Ecology[J]. Global Ecology and Biogeography, 2005, 14(1): 97-98 doi:  10.1111/j.1466-822X.2004.00129.x
    [29] Wheeler D C, Páez A: Geographically Weighted Regression[M]. Fischer M M, Getis A. Handbook of Applied Spatial Analysis: Software Tools, Methods and Applications. Berlin, Heidelberg: Springer-Verlag, 2010: 461-486
    [30] Da Silva A R, Fotheringham A S. The Multiple Testing Issue in Geographically Weighted Regression[J]. Geographical Analysis, 2016, 48(3): 233-247 doi:  10.1111/gean.12084
    [31] Byrne G, Charlton M, Fotheringham S. Multiple Dependent Hypothesis Tests in Geographically Weighted Regression[C]. The 10th International Conference on Geocomputation, Sydney, Australia, 2009
    [32] Kitchin R. Space Ⅱ[M]//Kitchin R, Thrift N. International Encyclopedia of Human Geography. Oxford: Elsevier, 2009: 268-275
    [33] Lu B, Charlton M, Harris P, et al. Geographically Weighted Regression with a Non-Euclidean Distance Metric: A Case Study Using Hedonic House Price Data[J]. International Journal of Geographical Information Science, 2014, 28(4): 660-681 doi:  10.1080/13658816.2013.865739
    [34] Lu B, Charlton M, Brunsdon C, et al. The Minkowski Approach for Choosing the Distance Metric in Geographically Weighted Regression[J]. International Journal of Geographical Information Science, 2016, 30(2): 351-368 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=10.1080/13658816.2015.1087001
    [35] Fotheringham A S, Yang W, Kang W. Multiscale Geographically Weighted Regression (MGWR)[J]. Annals of the American Association of Geographers, 2017, 107(6): 1 247-1 265 doi:  10.1080/24694452.2017.1352480
    [36] Lu B, Brunsdon C, Charlton M, et al. A Response to 'A Comment on Geographically Weighted Regression with Parameter-Specific Distance Metrics'[J]. International Journal of Geographical Information Science, 2019, 33(7): 1 300-1 312 doi:  10.1080/13658816.2019.1585541
    [37] Brunsdon C, Fotheringham A S, Charlton M. Some Notes on Parametric Significance Tests for Geographically Weighted Regression[J]. Journal of Regional Science, 1999, 39(3): 497-524 doi:  10.1111/0022-4146.00146
    [38] 覃文忠, 王建梅, 刘妙龙.混合地理加权回归模型算法研究[J].武汉大学学报·信息科学版, 2007, 32(2): 115-119 http://ch.whu.edu.cn/article/id/1813

    Qin Wenzhong, Wang Jianmei, Liu Miaolong. Algorithm for Mixed Geographically Weighted Regression Mode[J]. Geomatics and Information Science of Wuhan University, 2007, 32(2): 115-119 http://ch.whu.edu.cn/article/id/1813
    [39] 玄海燕, 刘树群, 罗双华.混合地理加权回归模型的两种估计[J].兰州理工大学学报, 2007, 33(3): 142-144 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=gsgydx200703038

    Xuan Haiyan, Liu Shuqun, Luo Shuanghua. Two Kinds of Estimation of Mixed Geographically Weighted Regression Mode[J]. Journal of Lanzhou University of Technology, 2007, 33(3): 142-144 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=gsgydx200703038
    [40] 聂磊, 舒红, 刘艳.复杂地形地区月平均气温(混合)地理加权回归克里格插值[J].武汉大学学报·信息科学版, 2018, 43(10):1 553-1 559 doi:  10.13203/j.whugis20160433

    Nie Lei, Shu Hong, Liu Yan. Interpolation of Monthly Average Temperature by Using (Mixed) Geographically Weighted Regression Kriging in the Complex Terrain Region[J]. Geomatics and Information Science of Wuhan University, 2018, 43(10):1 553-1 559 doi:  10.13203/j.whugis20160433
    [41] Mei C L, Xu M, Wang N. A Bootstrap Test for Constant Coefficients in Geographically Weighted Regression Models[J]. International Journal of Geographical Information Science, 2016, 30(8): 1 622-1 643 doi:  10.1080/13658816.2016.1149181
    [42] Mei C L, Wang N, Zhang W X. Testing the Importance of the Explanatory Variables in a Mixed Geographically Weighted Regression Model[J]. Environment and Planning A, 2006, 38(3): 587-598 doi:  10.1068/a3768
    [43] Harris P, Brunsdon C, Lu B, et al. Introducing Bootstrap Methods to Investigate Coefficient Non-stationarity in Spatial Regression Models[J]. Spatial Statistics, 2017, 21: 241-261 doi:  10.1016/j.spasta.2017.07.006
    [44] Yang W, Fotheringham A S, Harris P. An Extension of Geographically Weighted Regression with Flexible Bandwidths[C]. GISRUK, Lancaster, UK, 2012
    [45] Yang W. An Extension of Geographically Weighted Regression with Flexible Bandwidths[D]. UK: Centre for GeoInformatics, University of St Andrews, 2014
    [46] Leong Y Y, Yue J C. A Modification to Geographically Weighted Regression[J]. International Journal of Health Geographics, 2017, 16(1): 11 doi:  10.1186/s12942-017-0085-9
    [47] Lu B, Brunsdon C, Charlton M, et al. Geographically Weighted Regression with Parameter-Specific Distance Metrics[J]. International Journal of Geographical Information Science, 2017, 31(5): 982-998 doi:  10.1080/13658816.2016.1263731
    [48] Lu B, Yang W, Ge Y, et al. Improvements to the Calibration of a Geographically Weighted Regression with Parameter-Specific Distance Metrics and Bandwidths[J]. Computers, Environment and Urban Systems, 2018, 71: 41-57 doi:  10.1016/j.compenvurbsys.2018.03.012
    [49] Ge Y, Jin Y, Stein A, et al. Principles and Methods of Scaling Geospatial Earth Science Data[J]. Earth-Science Reviews, 2019, 197: 102 897 doi:  10.1016/j.earscirev.2019.102897
    [50] Wolf L, Oshan T, Fotheringham A. Single and Multiscale Models of Process Spatial Heterogeneity[J]. Geographical Analysis, 2018, 50(3): 223-246 doi:  10.1111/gean.12147
    [51] Yu H, Fotheringham A S, Li Z, et al. Inference in Multiscale Geographically Weighted Regression[J]. Geographical Analysis, 2020, 52(1): 87-106 doi:  10.1111/gean.12189
    [52] Wu C, Ren F, Hu W, et al. Multiscale Geographically and Temporally Weighted Regression: Exploring the Spatiotemporal Determinants of Housing Prices[J]. International Journal of Geographical Information Science, 2019, 33(3): 489-511 doi:  10.1080/13658816.2018.1545158
    [53] Huang B, Wu B, Barry M. Geographically and Temporally Weighted Regression for Modeling Spatio-Temporal Variation in House Prices[J]. International Journal of Geographical Information Science, 2010, 24(3): 383-401 doi:  10.1080/13658810802672469
    [54] Fotheringham A S, Crespo R, Yao J. Geographical and Temporal Weighted Regression (GTWR)[J]. Geographical Analysis, 2015, 47(4): 431-452 doi:  10.1111/gean.12071
    [55] Wu B, Li R, Huang B. A Geographically and Temporally Weighted Autoregressive Model with Application to Housing Prices[J]. International Journal of Geographical Information Science, 2014, 28(5): 1 186-1 204 doi:  10.1080/13658816.2013.878463
    [56] Du Z, Wu S, Zhang F, et al. Extending Geographically and Temporally Weighted Regression to Account for Both Spatiotemporal Heterogeneity and Seasonal Variations in Coastal Seas[J]. Ecological Informatics, 2018, 43: 185-199 doi:  10.1016/j.ecoinf.2017.12.005
    [57] 赵阳阳, 张小璐, 张福浩, 等.一种局部多项式时空地理加权回归方法[J].测绘学报, 2018, 47(5): 663-671 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=chxb201805013

    Zhao Yangyang, Zhang Xiaolu, Zhang Fuhao, et al. A Local Polynomial Geographically and Temporally Weight Regression[J]. Acta Geodaetica et Cartographica Sinica, 2018, 47(5): 663-671 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=chxb201805013
    [58] Liu Y, Lam K, Wu J, et al. Geographically Weighted Temporally Correlated Logistic Regression Model[J]. Scientific Reports, 2018, 8(1): 1 417 doi:  10.1038/s41598-018-19772-6
    [59] Lesage J P. A Family of Geographically Weighted Regression Models[M]//Anselin L, Florax R J, Rey S J. Advances in Spatial Econometrics. Berlin, Heidelberg: Springer, 2002
    [60] Harris P, Fotheringham A S, Juggins S. Robust Geographically Weighted Regression: A Technique for Quantifying Spatial Relationships Between Freshwater Acidification Critical Loads and Catchment Attributes[J]. Annals of the Association of American Geographers, 2010, 100(2): 286-306 doi:  10.1080/00045600903550378
    [61] Wang N, Mei C L, Yan X D. Local Linear Estimation of Spatially Varying Coefficient Models: An Improvement on the Geographically Weighted Regression Technique[J]. Environment and Planning A, 2008, 40(4): 986-1 005 doi:  10.1068/a3941
    [62] Harris P, Juggins S. Estimating Freshwater Acidification Critical Load Exceedance Data for Great Britain Using Space-Varying Relationship Models[J]. Mathematical Geosciences, 2011, 43(3): 265-292 doi:  10.1007/s11004-011-9331-z
    [63] Nakaya T, Fotheringham A S, Brunsdon C, et al. Geographically Weighted Poisson Regression for Disease Association Mapping[J]. Statistics in Medicine, 2005, 24(17): 2 695-2 717 doi:  10.1002/sim.2129
    [64] Atkinson P M, German S E, Sear D A, et al. Exploring the Relations Between Riverbank Erosion and Geomorphological Controls Using Geographically Weighted Logistic Regression[J]. Geographical Analysis, 2003, 35(1): 58-82 doi:  10.1111/j.1538-4632.2003.tb01101.x
    [65] Harris R, Singleton A, Grose D, et al. Grid-Enabling Geographically Weighted Regression: A Case Study of Participation in Higher Education in England[J]. Transactions in GIS, 2010, 14(1): 43-61 doi:  10.1111/j.1467-9671.2009.01181.x
    [66] Dong G, Nakaya T, Brunsdon C. Geographically Weighted Regression Models for Ordinal Categorical Response Variables:An Application to Geo-referenced Life Satisfaction Data[J]. Computers, Environment and Urban Systems, 2018, 70: 35-42 doi:  10.1016/j.compenvurbsys.2018.01.012
    [67] Li Z, Fotheringham A S, Li W, et al. Fast Geographically Weighted Regression (FastGWR): A Scalable Algorithm to Investigate Spatial Process Heterogeneity in Millions of Observations[J]. International Journal of Geographical Information Science, 2019, 33(1): 155-175
    [68] Murakami D, Tsutsumida N, Yoshida T, et al. Scalable GWR: A Linear-Time Algorithm for Large-Scale Geographically Weighted Regression with Polynomial Kernels[OL]. https://arxiv.org/abs/1905.00266, 2019
    [69] Harris P.A Simulation Study on Specifying a Regression Model for Spatial Data: Choosing Between Autocorrelation and Heterogeneity Effects[J]. Geographical Analysis, 2019, 51(2): 151-181 doi:  10.1111/gean.12163
    [70] Charlton M, Fotheringham A, Brunsdon C. GWR 3: Software for Geographically Weighted Regression[OL]. http://www.uvm.edu/rsenr/gradgis/GWR3Manual.pdf, 2003
    [71] Nakaya T, Charlton M, Fotheringham S, et al. How to Use SGWRWIN (GWR4.0)[R]. Ireland: National Centre for Geocomputation, 2009
    [72] Oshan M T, Li Z, Kang W, et al. MGWR: A Python Implementation of Multiscale Geographically Weighted Regression for Investigating Process Spatial Heterogeneity and Scale[J]. ISPRS International Journal of Geo-Information, 2019, 8(6): 1-31 http://www.researchgate.net/publication/333694051_MGWR_A_Python_Implementation_of_Multiscale_Geographically_Weighted_Regression_for_Investigating_Process_Spatial_Heterogeneity_and_Scale
    [73] Lu B, Harris P, Charlton M, et al. The GWmodel R Package: Further Topics for Exploring Spatial Heterogeneity Using Geographically Weighted Models[J]. Geo-Spatial Information Science, 2014, 17(2): 85-101 http://d.wanfangdata.com.cn/periodical/dqkjxxkxxb-e201402002
    [74] Eddelbuettel D, Francois R. Rcpp: Seamless R and C++ Integration[J]. Journal of Statistical Software, 2011, 1(8): 1-19 http://www.researchgate.net/publication/227450960_Rcpp_Seamless_R_and_C_Integration
    [75] Wheeler D. GWRR: Fits Geographically Weighted Regression Models with Diagnostic Tools: R Package Version 0.2-1[OL]. https://CRAN.R-project.org/package=gwrr, 2013
  • 加载中
图(3) / 表(1)
计量
  • 文章访问数:  318
  • HTML全文浏览量:  52
  • PDF下载量:  88
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-09-17
  • 刊出日期:  2020-09-05

地理加权回归分析技术综述

doi: 10.13203/j.whugis20190346
    基金项目:

    国家自然科学基金 41725006

    国家自然科学基金 41871287

    国家自然科学基金 U1833201

    作者简介:

    卢宾宾,博士,讲师,主要从事空间统计、地理加权回归分析、地理加权建模技术等方面的研究。binbinlu@whu.edu.cn

  • 中图分类号: P208

摘要: 空间数据关系中的异质性或非平稳性特征是近期空间统计或相关应用领域的研究热点之一,而局部空间统计分析技术的提出与发展是其关键环节。地理加权回归分析技术(geographically weighted regression,GWR)通过关于位置的局部加权回归分析模型求解,以随着空间位置不同而变化的参数估计结果,量化反映空间数据关系中的异质性或非平稳性特征。GWR技术已在众多领域内广泛应用,逐渐成为重要的空间关系异质性建模工具之一。针对GWR模型解算、结果解读、模型检验等基础技术环节进行了系统总结,分别分析回顾了其对应的相关研究进展以及应用过程中存在的问题。同时,系统梳理了近年来GWR技术的主要拓展与延伸,重点阐述了其在采用灵活的距离度量选择、参数的多尺度估计以及时空数据建模方面的GWR技术扩展研究。此外,还简要介绍了现有的主要GWR技术软件工具,以期为读者和用户提供相对全面的GWR技术信息参考与知识总结。

English Abstract

卢宾宾, 葛咏, 秦昆, 郑江华. 地理加权回归分析技术综述[J]. 武汉大学学报 ● 信息科学版, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
引用本文: 卢宾宾, 葛咏, 秦昆, 郑江华. 地理加权回归分析技术综述[J]. 武汉大学学报 ● 信息科学版, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
LU Binbin, GE Yong, QIN Kun, ZHENG Jianghua. A Review on Geographically Weighted Regression[J]. Geomatics and Information Science of Wuhan University, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
Citation: LU Binbin, GE Yong, QIN Kun, ZHENG Jianghua. A Review on Geographically Weighted Regression[J]. Geomatics and Information Science of Wuhan University, 2020, 45(9): 1356-1366. doi: 10.13203/j.whugis20190346
  • 早期空间统计分析技术多从全局假设的角度出发,认为空间变量关系是固定的,不随空间位置的变化而改变[1]。这个前提假设明显违背了现实地理世界空间关系的异质性或非平稳性规律[2]。因此,区别于传统研究“单一普适”的空间关系统计分析方法,如何对空间异质性进行精确局部描述的空间分析方法越来越多地受到重视[3],如随机系数模型[4]、空间变参数回归分析模型[5]和局部加权回归分析模型[6]

    1996年,Brunsdon等提出地理加权回归分析(geographically weighted regression,GWR)[7]技术,提供了直观、实用的空间关系异质性和多相性分析手段[8],已发展成为局部空间统计分析的重要方法之一。本文以“Geographically Weighted Regression”和“地理加权回归分析”为主题关键词,通过Web of Science (WOS)核心合集(https://apps.webofknowledge.com/,检索时间:2019-07-19)和中国知网(China National Knowledge Infrastructure,CNKI)(http://www.cnki.net,检索时间:2019-07-21)对已发表的GWR技术相关文章进行搜索,分别得到了1 795篇和391篇文章记录。针对上述文献检索记录,本文通过R函数包Bibliometrix[9]中提供的文献分析工具进行了分析。图 1显示了每年发表的GWR技术相关文章数量,英文(来自WOS)和中文(来自CNKI)论文数量均呈现了明显的逐年上升趋势,尤其自2015年之后论文数量大幅提升。

    图  1  每年发表GWR技术相关文章数量

    Figure 1.  Articles Published Annually on the GWR Technique

    通过对两个记录中论文关键词进行统计分析,分别制作了关键词词云图(图 2)。如图 2(a)所示的WOS英文论文,学者们利用GWR技术在环境(如高频关键词“PM2.5”“PM10”“AIR QUALITY”)、健康(如高频关键词“MALARIA”“HEALTH”)、安全(如高频关键词“FIRE RISK”“FOREST FIRES”)、大数据分析(如高频词汇“BIG DATA”)、遥感(如高频词汇“REMOTE SENSING”“LiDAR”)等领域开展了深入和广泛的应用。值得注意的是,GWR技术也较多地应用于中国相关问题的研究(如高频词汇“CHINA”“BEIJING”)。如图 2(b)所示,CNKI所记录的中文论文主要集中于GWR技术的应用层面,如房地产市场(如高频词汇“房价”)、生态(如高频词汇“生物量”“耕地”)等领域。此外,本文分别统计了发表GWR技术相关文章的前10位英文和中文期刊,具体见表 1。排名前10位的期刊发文范围多为地理或综合应用类文章,可见GWR技术在相关领域的应用逐步扩大与深入,已发展成为局部空间统计分析最为重要的方法之一。

    图  2  GWR技术相关文章关键词统计分析

    Figure 2.  Statistics on the Keywords of GWR-Related Articles

    表 1  GWR技术文章发表量英文和中文期刊(前10位)

    Table 1.  Publication Sources of GWR-Related Articles (Top 10)

    英文期刊 数量/篇 中文期刊 数量/篇
    Applied Geography 70 测绘科学 6
    Sustainability 40 农业工程学报 5
    Plos One 38 统计与信息论坛 5
    International Journal of Environmental Research and Public Health 34 测绘通报 4
    Remote Sensing 33 经济地理 4
    Science of the Total Environment 31 长江流域资源与环境 4
    ISPRS International Journal of Geo-information 29 测绘与空间地理信息 3
    Geographical Analysis 26 地理研究 3
    International Journal of Geographical Information Science 26 甘肃科学学报 3
    Journal of Transport Geography 26 国土与自然资源研究 3

    值得注意的是,即使GWR技术被众多中国学者频繁采用与研究,但是发表的中文论文数量较少、刊源分散(如表 1所示)。而且在这些中文论文中出现了术语定义不一[10]、结果解释不清[11]甚至技术误用的现象。因此,本文将集中阐述GWR技术基础,回顾其发展历程与前沿扩展,以期为读者提供较为全面的GWR技术中文引导与资料参考汇总。

    • 1970年,Tobler提出了地理学第一定律“Everything is related to everything else, but near things are more related than distant things”[12],指出了地理空间对象及其属性特征在空间分布上的决定性特征,尤其随着空间距离增大,其关联作用程度衰减的规律。GWR技术将地理学第一定律深度融入局部空间统计方法,通过对独立抽样的分析点分别进行回归分析模型解算,得到与空间位置一一对应的空间回归系数,以随着空间位置不同而变化的参数估计量化表征空间关系异质性特征。基础GWR模型一般可表达如下:

      $${y_i} = {\beta _0}\left( {{u_i}, {v_i}} \right) + \mathop \sum \limits_{k = 1}^m {\beta _k}\left( {{u_i}, {v_i}} \right){x_{ik}} + {\varepsilon _i}$$ (1)

      式中,yi为在位置i处的因变量值;xik (k = 1,2…m)为位置i处的自变量值;(uivi)为回归分析点i的坐标;β0 (uivi)为截距项;βk(uivi)(k = 1,2…m)为回归分析系数。

    • 针对GWR模型(1),对每个回归分析点i分别采用加权线性最小二乘方法进行模型求解:

      $$ \mathit{\boldsymbol{\hat \beta }} \left( {{u_i},{v_i}} \right) = {\left( {{\mathit{\boldsymbol{X}}^{\text{T}}}\mathit{\boldsymbol{W}}\left( {{u_i},{v_i}} \right)\mathit{\boldsymbol{X}}} \right)^{ - 1}}{\mathit{\boldsymbol{X}}^{\text{T}}}\mathit{\boldsymbol{W}}\left( {{u_i},{v_i}} \right)\mathit{\boldsymbol{y}} $$ (2)

      式中,Χ为自变量抽样矩阵,其第一列取值为1,以估计截距项β0(uivi);y为因变量抽样值列向量;$\mathit{\boldsymbol{\hat \beta }}\left( {{u_i},{v_i}} \right) = {\left( {{\beta _0}\left( {{u_i},{v_i}} \right){\beta _1}\left( {{u_i},{v_i}} \right) \ldots {\beta _m}\left( {{u_i},{v_i}} \right)} \right)^{\rm{T}}}$为回归分析点(uivi)处的回归分析系数向量;W(uivi)为对角矩阵,其对角线元素值为每个数据点到回归分析点(uivi)的空间权重值:

      $${\mathit{\boldsymbol{W}}_i} = \left[ {\begin{array}{*{20}{c}} {{w_{i1}}}&0& \ldots &{}&0\\ 0&{{w_{i2}}}& \ldots &{}&0\\ \vdots &{}& \ddots &{}& \vdots \\ {}&{}&{}&{}&{}\\ 0&0& \ldots &{}&{{w_{in}}} \end{array}} \right]$$ (3)

      式中,对角线值wij (j = 1,2…n)表示第j个数据点到回归分析点i的权重值。根据地理学第一定律,GWR模型计算权重的基本原则为:距离越近,赋予的权重值越高;反之,权重值越低[13]。因此,可通过任意值域为[0, 1]、关于空间距离的单调减函数实现权重计算,称之为核函数(Kernel function)[14-15]。针对GWR模型求解,常用核函数包括高斯(Gaussian)函数(式(4))、指数(Exponential)函数(式(5))、盒状(Box-car)函数(式(6))、二次(Bi-square)函数(式(7))和立方体(Tri-cube)函数(式(8))。

      $${w_{ij}} = {{\rm{e}}^{\frac{{{{\left( {{d_{ij}}/b} \right)}^2}}}{2}}}$$ (4)
      $${w_{ij}} = {\rm{exp}}\left( { - \frac{{\left| {{d_{ij}}} \right|}}{b}} \right)$$ (5)
      $$ {w_{ij}} = \left\{ {\begin{array}{*{20}{l}} {1, {d_{ij}} \le b}\\ {0, {\rm{其他 }}} \end{array}} \right. $$ (6)
      $${w_{ij}} = \left\{ {\begin{array}{*{20}{l}} {{{\left( {1 - {{\left( {{d_{ij}}/b} \right)}^2}} \right)}^2}, {d_{ij}} \le b}\\ {0, 其他 } \end{array}} \right.$$ (7)
      $${w_{ij}} = \left\{ {\begin{array}{*{20}{l}} {{{\left( {1 - {{\left( {{d_{ij}}/b} \right)}^3}} \right)}^3}, {d_{ij}} \le b}\\ {0, 其他 } \end{array}} \right.$$ (8)

      式(4)~(8)中,dij表示位置i与位置j之间的空间距离或邻近度度量;b为带宽值。

      根据核函数的值域分布特征,可将其分为连续型(如Gaussian函数、Exponential函数)和截断型(Box-car函数、Bi-square函数和Tri-cube函数)两种。截断型核函数明确定义了GWR模型解算过程中所考量的局部范围(结合带宽值),相对更有利于模型结果的解读,但易造成ΧTW (uivi)Χ矩阵奇异,尤其当自变量样本值存在较多的“0”值时;而连续型核函数的特点则恰好相反。在GWR模型实际应用中,最常用的两种核函数为Gaussian函数和Bi-square函数。建议读者尝试不同类型的核函数,权衡利弊,以选择特定模型和数据条件下的最为合适的核函数。

      带宽是GWR模型权重计算的重要控制参数,可分为固定型和可变型带宽,如图 3所示。通过定义一个固定的距离阈值b,是最为直接的带宽定义方法,但当数据点分布疏密程度不均匀时,则可能造成参与局部模型解算的有效样本数不足(如图 3(a)示例中,右侧回归分析点模型求解时有效参与的样本点仅为2个);为了避免固定型带宽的这个缺点,可通过定义最近邻域个数N,将回归分析点与第N个最近邻域之间的距离作为对应模型解算的带宽值,因此其在每个回归分析点对应的带宽值可能是不同的,即可变型带宽。带宽大小直接决定了权重随距离增加而衰减的速率,带宽越大,权重衰减越快,反之越慢。而针对截断型核函数,距离回归分析点超过带宽的数据点对应权重值均为0,带宽的大小则直接决定了GWR模型解算过程中围绕每个回归分析点的有效数据点范围。同时,带宽过小可能导致局部模型过拟合,参数估计空间变化剧烈;带宽过大则可能导致GWR模型趋于全局化,参数估计趋于平滑。因此,选择合适的带宽是GWR模型解算的必要程序。针对特定GWR模型,可通过交叉验证(cross validation, CV)[16]或赤池信息量准则(Akaike information criterion,AIC)[17]对带宽值进行优选,表达式如下:

      $${\rm{CV}}\left( b \right) = \mathop \sum \limits_{i = 1}^n {[{y_i} - {\hat y_{ \ne i}}\left( b \right)]^2}$$ (9)
      $$\begin{array}{*{20}{l}} {{\rm{AI}}{{\rm{C}}_c}\left( b \right) = 2n{\rm{ln}}\mathop \sigma \limits^ \wedge + n{\rm{ln}}2{\rm{ \mathit{ π} }} + }\\ {n\left\{ {\frac{{n + {\rm{tr}}\left( \mathit{\boldsymbol{S}} \right)}}{{n - 2 - {\rm{tr}}\left( \mathit{\boldsymbol{S}} \right)}}} \right\}} \end{array}$$ (10)

      图  3  不同类型带宽作用示意图

      Figure 3.  Schematic Diagram of Different Types of Bandwidth Definitions

      式中,${\hat y_{ \ne i}}\left( b \right)$为在数据点i处,将其本身排除后进行模型求解所得到的因变量预测值;$\mathop \sigma \limits^ \wedge $为模型标准差估计;tr(S)为帽子矩阵S的迹;AICc表示校正AIC值(corrected AIC,AICc) [13]。通过最小化CV或AICc值,选取对应的“最优”带宽值。一般来说,AICc值相对于CV优化程度较好,但计算复杂度也更高,读者可酌情选择。

    • 在带宽优选的基础上即可实现GWR模型求解。而GWR模型结果的解读需要关注模型诊断信息和结果可视化分析两个环节。GWR模型诊断信息主要包括:①残差平方和(residual sum of squares,RSS),反映模型预测精度;②R2或其调整版本(Adjusted R2),反映模型拟合优度(goodness of fit, GoF);③AICc:综合反映GWR模型结果的GoF和模型复杂度。一般情况下,可将GWR模型的诊断统计量与对应一般线性回归分析结果进行横向对比,以观察GWR模型是否体现显著改进以及改进的程度。注意AICc值是针对特定建模过程的相对统计量,即针对同一套数据和同一个因变量,对应的AICc值才具有可比性。当AICc值变化大于3时,可认为模型结果之间具有显著不同[13]

      GWR模型是关于位置的解算,也决定了其最典型的特点:结果可便捷地进行地图可视化。如图 2所示,“SPATIALLY VARYING RELATIONSHIPS”“影响因子”等高频词汇的出现表示GWR技术作为解释性工具频繁应用,而利用地图对GWR模型结果的可视化解读是此类研究的关键,直观展示空间关系异质性特征[3, 18],对其空间变化结合地理含义进行准确解读。在目前GWR技术的应用过程中,多存在“重解算、轻解读”的问题,值得读者注意。

    • 作为一个特点鲜明的技术,GWR模型被广泛应用,但相对于一般线性回归分析而言,它是一种复杂度更高的技术。在建模过程中,采用GWR技术的一个重要假设就是“空间数据关系中存在显著的空间异质性或非平稳性特征”。因此,采用GWR技术对空间关系进行建模时,需要进行必要的模型关系异质性特征检验。

      早期Brunsdon等[7]提出了蒙特卡洛模拟方法,对GWR模型中的每一个自变量检验其是否具有显著的空间异质性特征。之后Leung等[19-20]提出了一系列的F检验方法,分别提出了对模型整体和单个自变量进行检验的F统计量。因此,在正式采用GWR技术对模型求解之前,有必要利用上述检验方法确认其空间异质性特征。

      类似于一般线性回归分析,GWR技术针对每一个回归分析点的局部模型求解也会输出对应的t检验结果,以判断对应参数估计的非零显著性特征。t检验结果可与GWR模型参数估计进行综合体现,如屏蔽掉不显著的参数估计值部分[21],以更加精确地呈现结果。

    • GWR技术的发展过程中,也因为一些问题而饱受诟病,如多重共线性问题[22-23]。多重共线性是回归分析技术中的常见问题,由于自变量之间存在较强相关关系,导致模型求解结果失真甚至非唯一解现象。而针对GWR模型,由于仅有部分样本有效参与到每个局部模型的求解,从而存在更高的多重共线性风险,即使某些变量在全局意义上线性无关,也可能存在较强的局部共线性[23]。Wheeler[24-25]提出了地理加权Lasso回归(geographically weighted Lasso, GWL)和地理加权岭回归分析(geographically weighted ridge regression, GWRR)方法,Gollini等[26]探讨了岭参数局部补偿地理加权回归分析技术,一定程度上缓解了GWR模型中潜在的共线性风险。Fotheringham和Oshan[27]利用一系列模拟实验尝试证明GWR技术对共线性风险是稳健的。而笔者认为多重共线性风险仍然是GWR技术的桎梏,除了以上针对性的技术扩展,全面细致的数据分析和变量选择是规避这种风险的有效途径。

      GWR技术所面临的另一问题是统计推断问题,围绕其相关的检验和推论能否成立一直存在较大的争议。如空间关系异质性检验的结果可能受到变量错误、多重共线性等方面的影响,甚至出现假象误导[28-29]。而前述GWR模型的t检验结果,因为带宽选择和模型参数估计的过程中样本不断被复用,也存在典型的多重依赖假设检验问题,针对这个问题,学者们也提出了多个t检验值纠正算法[30-31],值得研究者进一步探索与尝试。

    • 随着研究与应用的不断深入,GWR技术也不断得到扩展,以改善其求解精度、增强模型的适用性。本节将简要回顾GWR技术的主要扩展,并展望其未来发展方向。

    • 在GWR模型的传统解算过程中,人们往往将距离默认为欧氏距离度量,即直线距离。但是现实世界不仅仅是一个简单的几何容器,而是人们通过对复杂空间现象和关系的感知而建立的综合认知空间[32]。Lu等[33]尝试将非欧氏距离度量应用于GWR模型解算,并指出非欧氏距离度量能够提升模型求解精度的同时,更易于发现地理空间中非规则分布而造成的空间关系异质性特征,如采用道路网络距离和旅行时间发现河流在城市房价分布中发挥的天然屏障效果。此项研究说明任意合理定义的距离度量都可用于GWR模型求解,进而构成基于灵活距离度量选择的GWR建模技术,在此框架下,未来值得探索更加多样的距离度量,如空间语义、定性距离等。

      而针对距离度量未知的模型场景,Lu等[34]提出了Minkowski方法实现距离度量自动优选,采用Minkowski距离函数逼近潜在的“最优”距离度量。这个方法解决了针对未知GWR模型的度量优选问题,但算法复杂度较高,且一般选取的距离度量难以直观体现,不利于模型结果解读。因此,在GWR技术作为预测工具时可用性较强,而在关系解释方面的作用有待于进一步探索。

    • 基础GWR模型往往采用单一核函数和带宽计算权重,这也导致所有参数估计的空间变化呈现相同的尺度特征。因此,即使多元空间数据关系对应不同的变化尺度,基础GWR却忽略了这种差异并以空间关系的“最佳平均”尺度反映所有参数估计的空间变化。近几年,出现了GWR技术的一个重要分支——多尺度GWR技术(multiscale GWR)[35-36],反映多元GWR模型中变量估计的尺度差异性。

      Brunsdon等[37]提出了混合GWR模型,将模型参数分为全局和局部两种尺度特征,利用后向迭代算法对模型进行估计, 覃文忠等[38]和玄海燕等[39]、聂磊等[40]也曾对混合GWR模型的求解方法进行讨论。Mei等[41-42]、Harris等[43]利用Bootstrap方法对混合GWR模型参数估计的(全局或局部)尺度选择进行检验。

      混合GWR技术虽能够对GWR模型参数估计尺度进行差异化呈现,参与局部估计的参数对应同样的尺度特征,区分仍然相对单一,缺乏对细节差异的精准呈现。Yang等[44-45]开始尝试对多元GWR模型中不同参数分别采用对应的不同带宽对其进行求解,以准确呈现不同参数估计对应的异质性尺度特征。Brunsdon等[37]对此项技术进行综合描述,将其命名为多尺度GWR。同年,Leong和Yue [46]提出了类似的条件GWR技术。这些技术均采用与参数一一对应的差异化带宽值对GWR模型进行解算。

      综合在GWR模型中应用灵活的距离度量,Lu等[47]提出了采用各异的距离度量和优选带宽的方法对多元GWR模型不同参数进行解算,即距离-变量对应的地理加权回归分析(geographically weighted regression with parameter-specific distance metrics,PSDM GWR)。同时,Lu等[48]指出每个距离-变量对应的最优带宽值具有明显的不变特征,即针对模型中每一个特定的变量-度量组合对应的最优带宽值相对稳定不变,与其他变量的组合情况无关,也说明了GWR模型中的每个参数均对应着一个“最优”的表征尺度。

      在数据建模场景日趋多样的背景下,空间数据尺度日趋复杂[49],作为GWR技术的最新扩展,多尺度GWR技术更具鲁棒性和普适性[50],围绕其相关的研究也在不断拓展与深入,如空间推论[51]、时间维扩展[52]等。经历更多的实践应用与技术探索,多尺度GWR技术能够更加准确和全面地实现模型估计,进而成为多元GWR模型的默认技术入口,在空间数据关系异质性建模方面将发挥更大的作用。

    • Huang等[53]将时间维融入GWR技术,提出了时空地理加权回归分析技术(geographically and temporally weighted regression, GTWR),其模型表达式如下:

      $${y_i} = {\beta _0}\left( {{u_i}, {v_i}, {t_i}} \right) + \mathop \sum \limits_{k = 1}^n {\beta _k}\left( {{u_i}, {v_i}, {t_i}} \right){x_{ik}} + {\varepsilon _i}$$ (11)

      从式(11)可看出,GTWR模型估计是关于时空回归分析点(uiviti)的解算,即:

      $$\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \hat \beta \left( {{u_i}, {v_i}, {t_i}} \right) =\\ {\left( {{\mathit{\boldsymbol{X}}^{\rm{T}}}\mathit{\boldsymbol{W}}\left( {{u_i}, {v_i}, {t_i}} \right)\mathit{\boldsymbol{X}}} \right)^{ - 1}}{\mathit{\boldsymbol{X}}^{\rm{T}}}\mathit{\boldsymbol{W}}\left( {{u_i}, {v_i}, {t_i}} \right)\mathit{\boldsymbol{y}}$$ (12)

      其中针对权重矩阵W (uiviti)的计算,Huang等[53]提出了时空椭球坐标系,以计算时空距离:

      $$d_{ij}^{{\rm{ST}}} = \sqrt {\lambda \left[ {{{\left( {{u_i} - {u_j}} \right)}^2} + {{\left( {{v_i} - {v_j}} \right)}^2}} \right] + \mu {{\left( {{t_i} - {t_j}} \right)}^2}} $$ (13)

      其中,λµ为时间和空间距离的比例调整系数。这种距离定义可操作性较强,能够与基础GWR技术无缝结合,但调整系数相对难以确定,时空距离一定程度上较为抽象,会为结果解读带来一定困难。Fotheringham等[54]提出了另一版本的GTWR技术,在假设时间维和空间维相互独立的基础上,分别计算时间权重和空间权重,通过式(14)计算时空权重:

      $$w_{ij}^t = {K_S}\left( {{d_{{s_{ij}}}}, {b_S}} \right) \times {K_T}\left( {{d_{{t_{ij}}}}, {b_T}} \right)$$ (14)

      其中,KSKT分别表示空间权重、时间权重核函数;dsijdtij分别表示空间距离和时间距离;bSbT分别为对应的空间维带宽和时间维带宽。此算法保留了时间和空间距离的原始值特征,利于GTWR结果解读,但算法复杂度高,需要对两种带宽分别进行优选。

      经过GTWR技术的不断演化,Wu等[55]提出了时空地理加权自回归模型(geographically and temporally weighted autoregressive model);Du等[56]综合考量时间维度的周期性特征,提出了周期性时空地理加权回归分析技术(geographically and circle-temporally weighted regression);赵阳阳等[57]提出了一种基于局部多项式求解的GTWR分析方法;Liu等[58]提出了时空地理加权相关逻辑回归分析技术(geographically weighted temporally correlated logistic regression)。

      随着时空数据场景的不断涌现,GTWR技术应用范围日趋扩大,但它也面临较大的挑战:一方面时空数据一般体量较大,对模型解算能力和效率造成非常大的困难,已成为当前GTWR技术重要瓶颈之一;另一方面,GTWR模型是关于时间和空间维度的解算,参数估计结果的有效展示与分析异常困难。

    • 除了以上扩展,GWR技术在其他方面也在不断演化和改进,如考量异方差特征的GWR方法(heteroskedsatic GWR)[59],弱化异常值影响的鲁棒性地理加权回归分析(robust GWR)[60],将参数估计扩展为空间坐标的线性函数的基于局部线性估计的GWR技术(local linear estimation-based GWR)[61],以GWR技术作为预测工具(GWR as a predictor)[62],非高斯建模框架下的广义地理加权回归分析(如geographically weighted poisson regression[63]和geographically weighted logistic regression[64]),地理加权序数回归分析(geographically weighted ordinal regression)[65],用于海量数据GWR模型求解的高性能解决方案(如grid-based GWR[66]、fastGWR[67]和scalable GWR[68])等。多样的GWR技术扩展提供了适应异方差、异常值、共线性、空间自相关[69]等不同应用场景的技术,但需要在充分了解数据状况的基础上选取对应的技术,但篇幅有限,本文不再一一详述。

    • 随着GWR技术的不断发展,涌现了一系列GWR软件工具。Charlton等[70]采用FORTRAN语言开发了最早的GWR3.0软件,支持Windows操作系统,用户界面友好,在计算效率方面表现优异。但因为收费原因,用户受众相对有限。之后,Nakaya等[71]采用C++语言开发了全新版本的GWR软件,沿用版本号称之为GWR4.0。两个软件在功能和界面上均有很大区别,后者除了包含基础GWR技术之外,重点支持混合GWR模型和广义GWR模型的解算,而且因其是免费软件,用户量大幅增加。Oshan等[72]采用Python语言开发了MGWR软件,包含了与GWR4.0类似的功能,并将原有的混合GWR模型解算功能扩展为支持多尺度GWR模型解算,它同时对应了Python语言函数包PySAL的一个模块和一个GUI封装版本。此外,在ESRI公司推出的ArcGIS9.0以及之后的软件版本中(http://webhelp.esri.com/arcgisdesktop/9.3/index. cfm?TopicName=Interpreting_GWR_results),在空间统计工具箱中集成了独立的GWR工具,能够实现基础GWR模型求解。借助ArcGIS的强大功能,它在结果可视化方面优势明显,但缺少必要的模型诊断信息,功能更新远远落后于GWR技术的进化与扩展。

      近些年来,以R软件平台为基础,开发了多个GWR函数工具包。Bivand和Yu开发了spgwr(http://cran.r-project.org/web/packages/spgwr/index.html),包含了基础GWR和广义GWR模型的求解,是最早关于GWR技术的R函数包。Lu等[26, 73]开发了函数包GWmodel,基本囊括了本文所提及的基础GWR技术及其扩展模块。相对于其他软件工具,GWmodel具有以下典型的特点与优势:

      1)技术覆盖全面:除了GWR技术及其相关扩展模块外,还集成了地理加权汇总统计(geographically weighted summary statistics)、地理加权主成分分析(geographically weighted principal components analysis)和地理加权判别分析(geographically weighted discriminant analysis)技术模块。

      2)模型参数选项丰富:函数包提供了5种不同的核函数和灵活的距离度量控制参数进行权重计算;

      3)运行效率高:函数包中所有的核心函数均采用了C++语言和Rcpp[74]嵌套开发,大大提升了函数运行效率。

      此外,Wheeler[75]开发了函数包gwrr,提供了地理加权岭回归分析工具以应对GWR模型中共线性问题。Murakami等[68]开发了函数包scgwr,提供了GWR模型的高性能求解工具Scalable GWR,该工具也被包含在函数包GWmodel中。

    • 在过去的15 a中,GWR技术不断发展与演化,较好地解决了空间数据关系异质性或非平稳性特征的量化估计与表征问题,其在各个领域内的广泛应用及技术的持续发展也说明它已成为重要的空间计量建模工具之一。本文回顾了GWR模型解算、结果解读、模型检验等基础技术环节,并对其间存在的问题进行了剖析与总结,强调了GWR技术使用过程中可能存在的误区与注意事项。同时,本文梳理了GWR技术在距离度量、多尺度估计、时空综合等方面的扩展与延伸,介绍了现有的GWR软件工具,以期为读者和用户提供全面的信息参考与知识总结。

      GWR技术的算法与理论研究虽日趋丰富与完备,但仍存在一些问题待于深入探讨。本文对这些问题进行了总结与展望:

      1)GWR技术中存在的多重共线性问题和统计推论问题,需要读者在充分理解数据的基础上合理选择模型变量,而针对问题本身的分析与研究也是未来的研究点之一;

      2)新的GWR技术扩展不断出现,如多尺度GWR技术,而其模型诊断、统计推断、计算效率等问题也是未来研究的热点方向之一;

      3)随着数据量逐渐变大,尤其是时空大数据体量激增,GWR及其扩展GTWR等技术都面临着计算效率瓶颈问题,而针对于此问题的高性能解决方案也是未来有待于突破的方向之一。相信随着GWR技术研究不断深入及其应用场景的持续拓展,更多的问题会被发现进而被解决,形成较好的良性互动,不断推动GWR技术体系的发展与成熟。

参考文献 (75)

目录

    /

    返回文章
    返回