留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

多源数据支持下的城市生态环境评价及其与人类活动的关系

程朋根 岳琛

程朋根, 岳琛. 多源数据支持下的城市生态环境评价及其与人类活动的关系[J]. 武汉大学学报 ( 信息科学版), 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
引用本文: 程朋根, 岳琛. 多源数据支持下的城市生态环境评价及其与人类活动的关系[J]. 武汉大学学报 ( 信息科学版), 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
CHENG Penggen, YUE Chen. Evaluation of Urban Ecological Environment and Its Relationship with Human Activities with Multi-source Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
Citation: CHENG Penggen, YUE Chen. Evaluation of Urban Ecological Environment and Its Relationship with Human Activities with Multi-source Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382

多源数据支持下的城市生态环境评价及其与人类活动的关系

doi: 10.13203/j.whugis20200382
基金项目: 

国家自然科学基金 41861052

国家自然科学基金 41861062

国家重点研发计划 2017YFB0503704

详细信息
    作者简介:

    程朋根,博士,教授,主要从事地理信息系统理论与应用、城市生态环境综合评价研究。pgcheng1964@163.com

    通讯作者: 岳琛,硕士。872438008@qq.com
  • 中图分类号: P208

Evaluation of Urban Ecological Environment and Its Relationship with Human Activities with Multi-source Data

Funds: 

The National Natural Science Foundation of China 41861052

The National Natural Science Foundation of China 41861062

the National Key Research and Development Program of China 2017YFB0503704

More Information
    Author Bio:

    CHENG Penggen, PhD, professor, specializes in theory and application of geographic information system, urban ecological environment comprehensive evaluation. E-mail: pgcheng1964@163.com

    Corresponding author: YUE Chen, master. E-mail: 872438008@qq.com
  • 摘要: 探究城市生态环境与人类活动的关系,是目前城市化进程中的重要研究内容。结合多源数据,提出了采用兴趣点(point of interest,POI)、开放街道地图(OpenStreetMap,OSM)道路网、住宅区数据构建人类活动指标(住宅区可步行测度指数、街道活力指数、城市功能混合度指数)和利用遥感影像构建城市生态环境指标(遥感生态指数)的方法。并结合多项式回归(polynomial regression,PLR)、随机森林回归(random forest regression,RFR)、极限梯度提升回归(extreme gradient boosting regression,XGB)、支持向量回归机(support vector regression machine,SVR)等机器学习模型,对城市生态环境与人类活动指标进行回归分析。以中国江西省南昌市为例开展实例研究,结果显示:(1)人类活动的3项指标均呈现中心高,向四周逐渐递减的趋势,而城市生态环境指标则表现出相反的态势。(2)在探究城市生态环境与人类活动关系的研究中,XGB的效果最好。(3)街道活力指数、城市功能混合度指数与城市生态环境的相关性更强,住宅区可步行测度指数与城市生态环境的相关性更差。(4)在人类活动影响较小的区域,城市生态环境会受到其他因素的干扰导致预测结果精度不高,而在人类活动强烈的区域预测精度较高。
  • 图  1  研究区域及数据

    Figure  1.  Research Area and Data

    图  2  住宅区可步行测度指数

    Figure  2.  Pedestrian Measure Index of Residential Area

    图  3  街道活力指数

    Figure  3.  Street Vitality Index

    图  4  城市功能混合度指数

    Figure  4.  Index of Urban Function Mixing Degree

    图  5  各街道RSEI

    Figure  5.  RSEI of Various Streets

    表  1  住宅区周边配套设施分类表

    Table  1.   Supporting Facilities Around Residential Area

    一级指标 二级指标 三级指标
    公共管理与公共服务设施 教育培训 初中、小学、幼儿园
    医疗 医院、药店
    运动设施 健身中心、体育场馆、极限运动场所
    政府机构 公检法机构
    商业服务业设施 购物 商场、菜市场、超市、商铺
    美食 餐饮设施
    金融 银行、自动取款机、邮政储蓄
    通讯营业厅 电信、移动、联通营业网点
    市政公用设施 公交设施 停车场
    旅游景点 公园
    交通场站及社区服务设施 公交设施 轨道交通站点、公交车站
    便民服务设施 购物 便利店
    生活服务 物流公司、邮局
    休闲娱乐 电影院、歌舞厅、网吧、游戏场所、休闲广场
    下载: 导出CSV

    表  2  距离衰减规律表

    Table  2.   Distance Attenuation Rules

    到达距离/km 距离衰减规律 备注
    [0,0.4] $ y=1 $ 无衰减
    (0.4,1.6] $ y=-153.655\mathrm{ }8{x}^{3}+419.460\mathrm{ }4{x}^{2} $$ -395.970\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }6x+201.108\mathrm{ }6 $ 快速衰减,当到达1.6 km时,衰减到12%
    (1.6,2.4] $ y=-92.8{x}^{3}+566.6{x}^{2}-1\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }153.1x+786.6 $ 当到达2.4 km时,衰减为0
    $ > $2.4 0 2.4 km以外的设施对衰减无影响
    注:距离衰减函数虽是分段函数,但在分段处连续
    下载: 导出CSV

    表  3  道路交叉口密度和街区长度对可步行测度指数的衰减率表

    Table  3.   Attenuation Ratio of Road Intersection Density and Block Length to Walking Index

    交叉口密度/(个∙km-2 衰减率/% 街区长度/km 衰减率/%
    ≥200 0 (0,12] 0
    [150,200) 1 (12,15] 1
    [120,150) 2 (15,16.5] 2
    [90,120) 3 (16.5,18] 3
    [60,90) 4 (18,19.5] 4
    [0,60) 5 >19.5 5
    下载: 导出CSV

    表  4  街道活力指数评价指标

    Table  4.   Evaluation Index of Street Vitality Index

    一级指标 二级指标 备注
    空间句法结构 连接度
    控制值
    全局深度
    POI混合度 POI密度 街道两边POI的密度
    POI总量 街道两边POI的数量
    街道自身属性 长度 街道自身长度
    连接点密度 道路交叉口个数在一定范围里的密度
    公交车站个数 一条街道两边公交站点个数
    下载: 导出CSV

    表  5  南昌市各区县指标数值

    Table  5.   Index Values of Each District and County in Nanchang

    指标 湾里区 安义县 进贤县 南昌县 新建县 青山湖区 青云谱区 西湖区 东湖区
    住宅区可步行测度指数 0.055 0.094 0.113 0.117 0.120 0.136 0.173 0.397 0.409
    街道活力指数 0.132 0.149 0.147 0.099 0.089 0.200 0.265 0.276 0.319
    城市功能混合度指数 0.438 0.384 0.441 0.438 0.460 0.574 0.613 0.742 0.814
    城市生态环境指数 0.711 0.613 0.511 0.650 0.577 0.385 0.291 0.279 0.306
    下载: 导出CSV

    表  6  各回归模型的指标评价

    Table  6.   Index Evaluation of Each Regression Model

    回归模型 训练集R2 测试集R2 全部数据集R2 MSE MAE RMSE
    PLR 0.689 9 0.008 5 0.071 1 0.092 3
    RFR 0.700 2 0.695 5 0.667 7 0.009 0 0.072 8 0.095 6
    XGB 0.741 7 0.688 2 0.734 7 0.009 2 0.064 8 0.085 4
    SVR 0.676 0 0.663 7 0.672 4 0.009 0 0.073 8 0.094 9
    下载: 导出CSV

    表  7  各回归模型特征重要性

    Table  7.   Feature Importance of Each Regression Model

    回归模型 特征重要性
    街道活力指数 城市功能混合度指数 住宅区可步行测度指数
    RFR 0.147 4 0.380 9 0.471 6
    XGB 0.265 2 0.210 0 0.524 8
    下载: 导出CSV

    表  8  各模型预测结果的残差等级统计/%

    Table  8.   Residual Grade Statistics of Prediction Results of Each Model/%

    机器学习模型 残差等级
    一般
    PLR 0.9 12.3 43.4 43.4
    RFR 0.0 15.1 37.7 47.2
    XGB 0.9 12.3 39.6 47.2
    SVR 0.0 16.0 40.6 43.4
    下载: 导出CSV

    表  9  各回归模型预测值和残差等级空间分布

    Table  9.   The Predicted Value and Residual Grade Spatial Distribution of Each Regression Model

    回归模型 预测值$ \stackrel{\wedge }{y} $空间分布 残差等级分布
    二次多项式回归
    随机森林回归
    极限梯度提升回归
    支持向量回归机
    下载: 导出CSV
  • [1] 李德仁. 脑认知与空间认知: 论空间大数据与人工智能的集成[J]. 武汉大学学报∙信息科学版, 2018, 43(12): 1761-1767 doi:  10.13203/j.whugis20180411

    Li Deren. Brain Cognition and Spatial Cognition: On Integration of Geo-spatial Big Data and Artificial Intelligence[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 1761-1767 doi:  10.13203/j.whugis20180411
    [2] 邓敏, 蔡建南, 杨文涛, 等. 多模态地理大数据时空分析方法[J]. 地球信息科学学报, 2020, 22(1): 41-56 https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX202001007.htm

    Deng Min, Cai Jiannan, Yang Wentao, et al. Spatio-temporal Analysis Methods for Multi-modal Geographic Big Data[J]. Journal of Geo-information Science, 2020, 22(1): 41-56 https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX202001007.htm
    [3] 刘瑜, 詹朝晖, 朱递, 等. 集成多源地理大数据感知城市空间分异格局[J]. 武汉大学学报∙信息科学版, 2018, 43(3): 327-335 doi:  10.13203/j.whugis20170383

    Liu Yu, Zhan Zhaohui, Zhu Di, et al. Incorporating Multi-source Big Geo-data to Sense Spatial Heterogeneity Patterns in an Urban Space[J]. Geomatics and Information Science of Wuhan University, 2018, 43(3): 327-335 doi:  10.13203/j.whugis20170383
    [4] 刘瑜, 姚欣, 龚咏喜, 等. 大数据时代的空间交互分析方法和应用再论[J]. 地理学报, 2020, 75(7): 1523-1538 https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB202007015.htm

    Liu Yu, Yao Xin, Gong Yongxi, et al. Analytical Methods and Applications of Spatial Interactions in the Era of Big Data[J]. Acta Geographica Sinice, 2020, 75(7): 1523-1538 https://www.cnki.com.cn/Article/CJFDTOTAL-DLXB202007015.htm
    [5] 岳文泽, 章佳民, 刘勇, 等. 多源空间数据整合视角下的城市开发强度研究[J]. 生态学报, 2019, 39(21): 7914-7926 https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201921011.htm

    Yue Wenze, Zhang Jiamin, Liu Yong, et al. Measuring Urban Development Intensity Based on the Integration of Multi-source Spatial Data[J]. Acta Ecologica Sinica, 2019, 39(21): 7914-7926 https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201921011.htm
    [6] 海晓东, 刘云舒, 赵鹏军, 等. 基于手机信令数据的特大城市人口时空分布及其社会经济属性估测: 以北京市为例[J]. 北京大学学报(自然科学版), 2020, 56(3): 518-530 https://www.cnki.com.cn/Article/CJFDTOTAL-BJDZ202003014.htm

    Hai Xiaodong, Liu Yunshu, Zhao Pengjun, et al. Using Mobile Phone Data to Estimate the Temporal-Spatial Distribution and Socioeconomic Attributes of Population in Megacities: A Case Study of Beijing[J]. Acta Scientiarum Naturalium Universitatis Pekinensis, 2020, 56(3): 518-530 https://www.cnki.com.cn/Article/CJFDTOTAL-BJDZ202003014.htm
    [7] 谷岩岩, 焦利民, 董婷, 等. 基于多源数据的城市功能区识别及相互作用分析[J]. 武汉大学学报∙信息科学版, 2018, 43(7): 1113-1121 doi:  10.13203/j.whugis20160192

    Gu Yanyan, Jiao Limin, Dong Ting, et al. Spatial Distribution and Interaction Analysis of Urban Functional Areas Based on Multi-source Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(7): 1113-1121 doi:  10.13203/j.whugis20160192
    [8] 朱婷婷, 涂伟, 乐阳, 等. 利用地理标签数据感知城市活力[J]. 测绘学报, 2020, 49(3): 365-374 https://www.cnki.com.cn/Article/CJFDTOTAL-CHXB202003012.htm

    Zhu Tingting, Tu Wei, Yue Yang, et al. Sensing Urban Vibrancy Using Geo-tagged Data[J]. Acta Geodaetica et Cartographica Sinica, 2020, 49(3): 365-374 https://www.cnki.com.cn/Article/CJFDTOTAL-CHXB202003012.htm
    [9] 徐慧敏, 胡守庚. 夜光遥感视角下的中国城市规模的时空演变[J]. 武汉大学学报∙信息科学版, 2021, 46(1): 40-49 doi:  10.13203/j.whugis20190330

    Xu Huimin, Hu Shougeng. Chinese City Size Evolution Under Perspective of Nighttime Light Remote Sensing[J]. Geomatics and Information Science of Wuhan University, 2021, 46(1): 40-49 doi:  10.13203/j.whugis20190330
    [10] 陈逸敏, 黎夏. 机器学习在城市空间演化模拟中的应用与新趋势[J]. 武汉大学学报∙信息科学版, 2020, 45(12): 1884-1889 doi:  10.13203/j.whugis20200423

    Chen Yimin, Li Xia. Applications and New Trends of Machine Learning in Urban Simulation Research[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12): 1884-1889 doi:  10.13203/j.whugis20200423
    [11] 赵鹏军, 曹毓书. 基于多源地理大数据与机器学习的地铁乘客出行目的识别方法[J]. 地球信息科学学报, 2020, 22(9): 1753-1765 https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX202009002.htm

    Zhao Pengjun, Cao Yushu. Identifying Metro Trip Purpose Using Multi-source Geographic Big Data and Machine Learning Approach[J]. Journal of Geo-information Science, 2020, 22(9): 1753-1765 https://www.cnki.com.cn/Article/CJFDTOTAL-DQXX202009002.htm
    [12] 塔娜, 曾屿恬, 朱秋宇, 等. 基于大数据的上海中心城区建成环境与城市活力关系分析[J]. 地理科学, 2020, 40(1): 60-68 https://www.cnki.com.cn/Article/CJFDTOTAL-DLKX202001008.htm

    Ta Na, Zeng Yutian, Zhu Qiuyu, et al. Relationship Between Built Environment and Urban Vitality in Shanghai Downtown Area Based on Big Data[J]. Scientia Geographica Sinica, 2020, 40(1): 60-68 https://www.cnki.com.cn/Article/CJFDTOTAL-DLKX202001008.htm
    [13] 李智轩, 何仲禹, 张一鸣, 等. 绿色环境暴露对居民心理健康的影响研究: 以南京为例[J]. 地理科学进展, 2020, 39(5): 779-791 https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ202005007.htm

    Li Zhixuan, He Zhongyu, Zhang Yiming, et al. Impact of Greenspace Exposure on Residents􀆳 Mental Health: A Case Study of Nanjing City[J]. Progress in Geography, 2020, 39(5): 779-791 https://www.cnki.com.cn/Article/CJFDTOTAL-DLKJ202005007.htm
    [14] 翁敏, 李霖, 苏世亮. 空间数据分析案例式实验教程[M]. 北京: 科学出版社, 2019

    Weng Min, Li Lin, Su Shiliang. Spatial Data Analysis Case-Based Experimental Tutorial[M]. Beijing: Science Press, 2019
    [15] 中华人民共和国住房和城乡建设部. 城市居住区规划设计标准: GB50180—2018[S]. 北京: 中国建筑工业出版社, 2018

    Ministry of Housing and Urban-Rural Development of the People's Republic of China. Standards for Planning and Design of Urban Residential Areas: GB50180—2018[S]. Beijing: China Building Industry Press, 2018
    [16] 李苗裔, 马妍, 孙小明, 等. 基于多源数据时空熵的城市功能混合度识别评价[J]. 城市规划, 2018, 42(2): 97-103 https://www.cnki.com.cn/Article/CJFDTOTAL-CSGH201802017.htm

    Li Miaoyi, Ma Yan, Sun Xiaoming, et al. Application of Spatial and Temporal Entropy Based on Multi-source Data for Measuring the Mix Degree of Urban Functions[J]. City Planning Review, 2018, 42(2): 97-103 https://www.cnki.com.cn/Article/CJFDTOTAL-CSGH201802017.htm
    [17] 徐涵秋. 城市遥感生态指数的创建及其应用[J]. 生态学报, 2013, 33(24): 7853-7862 https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201324027.htm

    Xu Hanqiu. A Remote Sensing Urban Ecological Index and Its Application[J]. Acta Ecologica Sinica, 2013, 33(24): 7853-7862 https://www.cnki.com.cn/Article/CJFDTOTAL-STXB201324027.htm
    [18] Breiman L. Random Forests[J]. Machine Learning, 2001, 45(1): 5-32
    [19] Hu Lirong, He Shenjing, Han Zixuan, et al. Monitoring Housing Rental Prices Based on Social Media: An Integrated Approach of Machine Learning Algorithms and Hedonic Modeling to Inform Equitable Housing Policies[J]. Land Use Policy, 2019, 82: 657-673
  • [1] 覃星力, 杨杰, 李平湘, 赵伶俐, 孙开敏.  迁移学习用于多时相极化SAR影像的水体提取 . 武汉大学学报 ( 信息科学版), 2022, 47(7): 1093-1102. doi: 10.13203/j.whugis20200121
    [2] 张嘉琪, 杜开虎, 任书良, 王瑞凡, 关庆锋, 陈文辉, 姚尧.  多源空间大数据场景下的家装品牌线下广告选址 . 武汉大学学报 ( 信息科学版), 2022, 47(9): 1406-1415. doi: 10.13203/j.whugis20190468
    [3] 刘万科, 陶贤露, 张传明, 姚宜斌, 王甫红, 贾海禄, 楼益栋.  云-端协同的智能手机行人室内外无缝定位技术及其原型系统验证 . 武汉大学学报 ( 信息科学版), 2021, 46(12): 1808-1818. doi: 10.13203/j.whugis20210310
    [4] 陈逸敏, 黎夏.  机器学习在城市空间演化模拟中的应用与新趋势 . 武汉大学学报 ( 信息科学版), 2020, 45(12): 1884-1889. doi: 10.13203/j.whugis20200423
    [5] 杨腊梅, 贾永红.  利用多源数据确定季节性咸水湖湿地自然边界的方法 . 武汉大学学报 ( 信息科学版), 2020, 45(3): 419-425. doi: 10.13203/j.whugis20180207
    [6] 方志祥, 黄守倩, 苏荣祥, 肖和平.  高速公路多源数据融合下的层次拥堵区间探测方法 . 武汉大学学报 ( 信息科学版), 2020, 45(5): 682-690. doi: 10.13203/j.whugis20190117
    [7] 魏雪梅.  多源数据支持下的森林地上生物量估算方法 . 武汉大学学报 ( 信息科学版), 2019, 44(9): 1385-1390. doi: 10.13203/j.whugis20190149
    [8] 龚健雅.  人工智能时代测绘遥感技术的发展机遇与挑战 . 武汉大学学报 ( 信息科学版), 2018, 43(12): 1788-1796. doi: 10.13203/j.whugis20180082
    [9] 高云龙, 张帆, 屈孝志, 黄先锋, 崔婷婷.  结合样本自动选择与规则性约束的窗户提取方法 . 武汉大学学报 ( 信息科学版), 2018, 43(3): 436-443. doi: 10.13203/j.whugis20150225
    [10] 谷岩岩, 焦利民, 董婷, 王艳东, 许刚.  基于多源数据的城市功能区识别及相互作用分析 . 武汉大学学报 ( 信息科学版), 2018, 43(7): 1113-1121. doi: 10.13203/j.whugis20160192
    [11] 赵志远, 尹凌, 方志祥, 萧世伦, 杨喜平.  轨迹数据的时间采样间隔对停留识别和出行网络构建的影响 . 武汉大学学报 ( 信息科学版), 2018, 43(8): 1152-1158. doi: 10.13203/j.whugis20160303
    [12] 龚健雅, 季顺平.  从摄影测量到计算机视觉 . 武汉大学学报 ( 信息科学版), 2017, 42(11): 1518-1522, 1615. doi: 10.13203/j.whugis20170283
    [13] 张良培.  高光谱目标探测的进展与前沿问题 . 武汉大学学报 ( 信息科学版), 2014, 39(12): 1377-1394+1400.
    [14] 李宁, 张立华, 田震, 彭认灿.  一种基于多源数据的沿岸低潮面模型构建方法 . 武汉大学学报 ( 信息科学版), 2014, 39(5): 611-615. doi: 10.13203/j.whugis20120137
    [15] 李宁, 田震, 张立华, 彭认灿.  一种改进的潮滩数字高程模型构建方法 . 武汉大学学报 ( 信息科学版), 2013, 38(10): 1178-1183.
    [16] 武雪玲, 任福, 牛瑞卿.  多源数据支持下的三峡库区滑坡灾害空间智能预测 . 武汉大学学报 ( 信息科学版), 2013, 38(8): 963-968.
    [17] 罗云锋, 普杰, 贲可荣.  软件模块故障倾向预测方法研究 . 武汉大学学报 ( 信息科学版), 2010, 35(5): 562-565.
    [18] 李连营, 许小兰, 吴中恒, 周祖浩.  多源导航电子地图数据融合更新方法研究 . 武汉大学学报 ( 信息科学版), 2008, 33(4): 409-412.
    [19] 庞小平, 鄂栋臣, 王自磐, 孙芳蒂.  基于GIS的南极无冰区生态环境脆弱性评价 . 武汉大学学报 ( 信息科学版), 2008, 33(11): 1174-1177.
    [20] 李德仁, 王树良, 史文中, 王新洲.  论空间数据挖掘和知识发现 . 武汉大学学报 ( 信息科学版), 2001, 26(6): 491-499.
  • 加载中
图(5) / 表(9)
计量
  • 文章访问数:  768
  • HTML全文浏览量:  188
  • PDF下载量:  90
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-11-08
  • 刊出日期:  2022-11-05

多源数据支持下的城市生态环境评价及其与人类活动的关系

doi: 10.13203/j.whugis20200382
    基金项目:

    国家自然科学基金 41861052

    国家自然科学基金 41861062

    国家重点研发计划 2017YFB0503704

    作者简介:

    程朋根,博士,教授,主要从事地理信息系统理论与应用、城市生态环境综合评价研究。pgcheng1964@163.com

    通讯作者: 岳琛,硕士。872438008@qq.com
  • 中图分类号: P208

摘要: 探究城市生态环境与人类活动的关系,是目前城市化进程中的重要研究内容。结合多源数据,提出了采用兴趣点(point of interest,POI)、开放街道地图(OpenStreetMap,OSM)道路网、住宅区数据构建人类活动指标(住宅区可步行测度指数、街道活力指数、城市功能混合度指数)和利用遥感影像构建城市生态环境指标(遥感生态指数)的方法。并结合多项式回归(polynomial regression,PLR)、随机森林回归(random forest regression,RFR)、极限梯度提升回归(extreme gradient boosting regression,XGB)、支持向量回归机(support vector regression machine,SVR)等机器学习模型,对城市生态环境与人类活动指标进行回归分析。以中国江西省南昌市为例开展实例研究,结果显示:(1)人类活动的3项指标均呈现中心高,向四周逐渐递减的趋势,而城市生态环境指标则表现出相反的态势。(2)在探究城市生态环境与人类活动关系的研究中,XGB的效果最好。(3)街道活力指数、城市功能混合度指数与城市生态环境的相关性更强,住宅区可步行测度指数与城市生态环境的相关性更差。(4)在人类活动影响较小的区域,城市生态环境会受到其他因素的干扰导致预测结果精度不高,而在人类活动强烈的区域预测精度较高。

English Abstract

程朋根, 岳琛. 多源数据支持下的城市生态环境评价及其与人类活动的关系[J]. 武汉大学学报 ( 信息科学版), 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
引用本文: 程朋根, 岳琛. 多源数据支持下的城市生态环境评价及其与人类活动的关系[J]. 武汉大学学报 ( 信息科学版), 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
CHENG Penggen, YUE Chen. Evaluation of Urban Ecological Environment and Its Relationship with Human Activities with Multi-source Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
Citation: CHENG Penggen, YUE Chen. Evaluation of Urban Ecological Environment and Its Relationship with Human Activities with Multi-source Data[J]. Geomatics and Information Science of Wuhan University, 2022, 47(11): 1927-1937. doi: 10.13203/j.whugis20200382
  • 人类既是经济发展的既得利益者,也是城市生态环境质量优劣的直接感受者。在满足人民物质生活增长需求的同时,人类开始越来越注重对生态环境的保护。同时,随着科技水平的进步和环保理念的加深,人类活动在城市生态环境的发展中占据主导地位[1-2]。传统的城市研究由于缺乏多样化的数据获取手段和渠道,经常会因数据缺失、精度不高、数据量少等客观原因导致所得结果过于片面且粗糙[3]。大数据时代的深入发展,为城市生态环境精细化分析、结构化探索提供了有利的数据支撑。

    本文从“生态”与“人”两个视角切入,利用机器学习模型对城市生态环境与人类活动的关系进行分析,不仅可以挖掘出二者之间存在的关系,为人类社会的生存和发展提供更好的决策和建议,而且也是在国家城市发展战略下为城市生态环境建设提供重要的科学依据。

    相较于传统的数据获取方式,泛在于互联网中的多源大数据有助于对城市进行更加复杂的分析和多方面的评价[4-5]。例如,利用手机信令数据可以动态监测人口的时空分布特征[6];兴趣点(point of interest,POI)给城市功能区识别及城市活力评价提供了新的思路[7-8];夜间灯光数据在城市边界提取及其时空演变方面有着得天独厚的优势[9]。结合多源数据的特点,从不同角度刻画城市的特性成了目前城市问题研究的风向标。不仅如此,机器学习有别于传统的研究方法,其低成本、快速、高效的特点正好用来研究复杂的城市问题[10-12]。文献[6]利用朴素贝叶斯分类将居民属性和出行特征与手机信令数据进行识别,得到人口属性信息,但也存在数据分布不均匀导致预测准确率较低的问题;文献[8]利用回归模型分析城市活力和城市环境之间的关系,探索深圳市的活力分布模式,得到了较好的效果,不过因为缺乏多源数据的支撑,无法探究与经济社会的关系;文献[13]利用卷积神经网络算法识别街景图片绿视率,从而得出居民心里健康与绿视率的关系,但受制于数据获取的方式,无法判断不同时空状态下环境感知强度的差异。

    综上,现有研究已取得了较大程度的突破,但也存在一些问题,比如缺乏多源数据类型导致结论单一,缺乏模型之间的比较导致结论的可信度较低。本文利用POI、开放街道地图(OpenStreetMap,OSM)道路网、住宅区数据构建与人类活动紧密相关的住宅区可步行测度指数、街道活力指数和城市功能混合度指数,用遥感影像建立遥感生态指数作为城市生态环境指数,并结合4种典型的机器学习回归模型来揭示城市生态环境与人类活动之间的关系,以期能够为城市的发展与人类的生活提供更好的帮助。

    • 本文选取中国江西省南昌市作为研究区。近年来南昌市加大生态文明投资力度,致力于城市生态文明建设,分析其城市生态环境与人类活动之间的关系是城市生态文明大背景下的迫切需要。南昌市下辖47个镇、33个乡、29个街道,共109个街道区域。数据来源为:

      1)POI数据,共计16个行业分类,17万多个点(2019年11月),如图 1(a)所示。

      图  1  研究区域及数据

      Figure 1.  Research Area and Data

      2)住宅区数据,筛选出POI点中“住宅区”这一类,并进行数据清洗,如图 1(b)所示。

      3)OSM道路网数据(2019年),通过OSM开源网站下载,如图 1(c)所示。

      4)2019年9月份南昌市陆地卫星(Landsat 8)遥感影像,如图 1(d)所示。

      本文中地图的底图来源于全国地理信息资源目录服务系统提供的1∶100万公众版基础地理信息数据(2021)(https://www.webmap.cn/commres.do?method=result100W)。

    • 在评价人类活动的指标构建中,提出了采用住宅区可步行测度指数、街道活力指数和城市功能混合度指数3个指标对其进行构建。这3个指标不仅与人类活动息息相关,而且也可以较好地反映人类活动的状况。

    • 住宅区可步行测度指数是指将日常配套设施到达住宅区的步行距离通过步行衰减规律计算而得[14]。所谓步行衰减,是指人类步行所能到达的配套设施会随着距离的增加而减少。根据《城市居住区规划设计标准》规定[15],住宅区规划建设的周边主要包括5种配套设施,分别是公共管理与公共服务设施、商业服务业设施、市政公用设施、交通场站及社区服务设施、便民服务设施。将以上5种配套设施作为构建住宅区可步行测度指数的一级指标,并根据相应的POI总结出合理的二级指标和三级指标,如表 1所示。

      表 1  住宅区周边配套设施分类表

      Table 1.  Supporting Facilities Around Residential Area

      一级指标 二级指标 三级指标
      公共管理与公共服务设施 教育培训 初中、小学、幼儿园
      医疗 医院、药店
      运动设施 健身中心、体育场馆、极限运动场所
      政府机构 公检法机构
      商业服务业设施 购物 商场、菜市场、超市、商铺
      美食 餐饮设施
      金融 银行、自动取款机、邮政储蓄
      通讯营业厅 电信、移动、联通营业网点
      市政公用设施 公交设施 停车场
      旅游景点 公园
      交通场站及社区服务设施 公交设施 轨道交通站点、公交车站
      便民服务设施 购物 便利店
      生活服务 物流公司、邮局
      休闲娱乐 电影院、歌舞厅、网吧、游戏场所、休闲广场

      步行指数官网(walkscore.com)提供的可步行距离衰减规律如表 2所示。正常情况下,一个成年人标准步行速度为80 m/min,根据该速度5 min所到达的最远距离为0.4 km,在这期间不发生衰减;20 min所到达的最远距离为1.6 km,这个过程按照三次曲线函数迅速衰减,一直衰减到12%;30 min所到达的最远距离为2.4 km,将逐渐衰减到0。同时,不考虑2.4 km以外的配套设施的影响。表 2中,y表示距离衰减率,x为各配套设施到住宅区的距离。

      表 2  距离衰减规律表

      Table 2.  Distance Attenuation Rules

      到达距离/km 距离衰减规律 备注
      [0,0.4] $ y=1 $ 无衰减
      (0.4,1.6] $ y=-153.655\mathrm{ }8{x}^{3}+419.460\mathrm{ }4{x}^{2} $$ -395.970\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }6x+201.108\mathrm{ }6 $ 快速衰减,当到达1.6 km时,衰减到12%
      (1.6,2.4] $ y=-92.8{x}^{3}+566.6{x}^{2}-1\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }153.1x+786.6 $ 当到达2.4 km时,衰减为0
      $ > $2.4 0 2.4 km以外的设施对衰减无影响
      注:距离衰减函数虽是分段函数,但在分段处连续

      在实际的可步行指数构建中,除了要考虑住宅区周边的配套设施,还应考虑道路交叉口密度和街区长度带来的影响。道路交叉口密度越大,可供居民步行的道路就越多,街道活力越高。另外,通常认为短的街道比长的街道更具有交通上的优势。因此,考虑道路交叉口密度和街区长度对步行测度指数的影响是十分必要的。将这两个因素分为6个等级,按照不同的等级确定不同的衰减率,如表 3所示。

      表 3  道路交叉口密度和街区长度对可步行测度指数的衰减率表

      Table 3.  Attenuation Ratio of Road Intersection Density and Block Length to Walking Index

      交叉口密度/(个∙km-2 衰减率/% 街区长度/km 衰减率/%
      ≥200 0 (0,12] 0
      [150,200) 1 (12,15] 1
      [120,150) 2 (15,16.5] 2
      [90,120) 3 (16.5,18] 3
      [60,90) 4 (18,19.5] 4
      [0,60) 5 >19.5 5

      利用网络分析建立起讫点成本距离,首先分别按照住宅区和表 1中的数据作为起点和终点计算它们之间的距离;然后代入表 2的衰减规律函数,计算每个配套设施的距离衰减率;再统计出每个住宅区的基础可步行测度指数;筛选出2.4 km内每个住宅区包含的道路交叉口个数,进而得到道路交叉口密度。将街道与住宅区进行空间链接,即可获得每个住宅区的街区长度。计算最终的住宅区可步行测度指数,即:

      $$ \begin{array}{l} \;\;\;\;最终的住宅区可步行测度指数 = 基础可步\\ 行测度指数 \times \left( {1 - 道路交叉口密度衰减率} \right) \times \\ \;\;\;\;\;\;\;\;\;\;\;\;\left( {1 - 街区长度衰减率} \right) \end{array} $$
    • 街道活力是城市发展规划的核心因素,街道活力越高,说明城市空间越具有活力,人类活动就越丰富和频繁。因此,街道活力是人类活动强度的重要组成部分。与其他社交媒体和手机信令数据不同,本文按照街道自身属性以及量化影响其活力的诸多因素,构建了3个一级指标和8个二级指标[14],如表 4所示。

      表 4  街道活力指数评价指标

      Table 4.  Evaluation Index of Street Vitality Index

      一级指标 二级指标 备注
      空间句法结构 连接度
      控制值
      全局深度
      POI混合度 POI密度 街道两边POI的密度
      POI总量 街道两边POI的数量
      街道自身属性 长度 街道自身长度
      连接点密度 道路交叉口个数在一定范围里的密度
      公交车站个数 一条街道两边公交站点个数

      计算方法为:首先对二级指标标准化,去除纲量不一致的影响,然后利用熵权法确定权重得到各二级指标的权重,再次利用同样的方法确定各一级指标的权重,最后确定每条街道的活力指数。

    • 城市功能混合度指数是指一定范围内的城市各种配套设施种类越多,城市功能就越复杂,则混合度就越高[16]。所用到的主要方法是信息熵,信息熵是在信息发生之前对信息发生之后所产生的信息量的一种期望,通常用来度量一个系统的复杂度。如果系统中情况越复杂,那么它的信息熵也就越大,如果一个系统越单一,则信息熵也就越少。其计算公式为:

      $$ {H}_{\left(X\right)}=-\sum\limits_{i=1}^{n}p\left({x}_{i}\right)lo{g}_{2}p\left({x}_{i}\right) $$ (1)

      式中,HX为信息熵;pxi)为事件xi所发生的概率。

      将南昌市划分成500 m×500 m的格网,然后将POI与格网进行空间连接,使得所有POI与格网相对应,从而得到每个格网下各种POI的数量,利用式(1)计算格网的信息熵。

    • 经众多学者的应用和分析,遥感生态指数(remote sensing based ecological index,RSEI)是目前常用的评价生态环境的遥感分析手段。城市的生态环境质量受人类活动影响剧烈,要想得到城市生态环境质量,就要选择与人类生产活动密切相关的指标进行分析。RSEI所选择的4个指标分量(绿度、湿度、热度、干度)都是目前人类可以直观察觉生态环境质量优劣的重要因素[17],其表达式为:

      $$ R=f({x}_{\mathrm{N}\mathrm{D}\mathrm{V}\mathrm{I}}, {x}_{\mathrm{W}\mathrm{e}\mathrm{t}}, {x}_{\mathrm{L}\mathrm{S}\mathrm{T}}, {x}_{\mathrm{N}\mathrm{D}\mathrm{B}\mathrm{S}\mathrm{I}}) $$ (2)

      式中,R表示RSEI;$ {x}_{\mathrm{N}\mathrm{D}\mathrm{V}\mathrm{I}} $作为植被指数,表示绿度分量;$ {x}_{\mathrm{W}\mathrm{e}\mathrm{t}} $表示湿度分量;$ {x}_{\mathrm{L}\mathrm{S}\mathrm{T}} $表示地表温度分量;$ {x}_{\mathrm{N}\mathrm{D}\mathrm{B}\mathrm{S}\mathrm{I}} $作为不透水面和地表裸土指数,表示干度分量。

      利用主成分分析,通过空间坐标旋转的方式将主要的特征信息集中到一至两个主成分上,用贡献值高的主成分计算初始的遥感生态指数R0

      $$ {R}_{0}=1-\left[{P}_{k}\left({x}_{\mathrm{N}\mathrm{D}\mathrm{V}\mathrm{I}}, {x}_{\mathrm{W}\mathrm{e}\mathrm{t}}, {x}_{\mathrm{L}\mathrm{S}\mathrm{T}}, {x}_{\mathrm{N}\mathrm{D}\mathrm{B}\mathrm{S}\mathrm{I}}\right)\right] $$ (3)

      式中,Pk表示通过主成分分析降维之后的特征。将R0进行正规化即可得到遥感生态指数R,即

      $$ R=\frac{{R}_{0}-{R}_{0\_\mathrm{m}\mathrm{i}\mathrm{n}}}{{R}_{0\_\mathrm{m}\mathrm{a}\mathrm{x}}-{R}_{0\_\mathrm{m}\mathrm{i}\mathrm{n}}} $$ (4)

      式中,$ {R}_{0\_\mathrm{m}\mathrm{a}\mathrm{x}} $、$ {R}_{0\_\mathrm{m}\mathrm{i}\mathrm{n}} $分别为R0的最大值、最小值。R值介于[0, 1]之间,其值越高表示生态质量越好。

    • 为了探究城市生态环境与人类活动各指标之间的关系,本文选取了4种典型的机器学习回归模型,分别是多项式回归(polynomial regression,PLR)、随机森林回归(random forest regression,RFR)、极限梯度提升回归(extreme gradient boosting regression,XGB)和支持向量回归机(support vector regression machine,SVR)[18-19]

      PLR本质上是线性回归的一种升维展示,通过设定自变量的系数将原有的数据映射到高维空间,再在高维空间中利用线性回归的方式得到回归结果。本文采用二次多项式回归方程,其公式为:

      $$ \begin{array}{l}\widehat{y}={k}_{0}+{w}_{1}{x}_{1}+{w}_{2}{x}_{2}+{w}_{3}{x}_{3}+{w}_{4}{x}_{1}^{2}+\\ {w}_{5}{x}_{2}^{2}+{w}_{6}{x}_{3}^{2}+{w}_{7}{x}_{1}{x}_{2}+{w}_{8}{x}_{1}{x}_{3}+{w}_{9}{x}_{2}{x}_{3}\end{array} $$ (5)

      式中,$ \widehat{y} $为样本数据的预测值;k0为截距;w1w2w9为系数;x1为住宅区可步行测度指数;x2为街道活力指数;x3为城市功能混合度指数。

      RFR的核心是通过建立一系列回归决策树,并计算其均值作为回归结果,其计算公式为:

      $$ \left\{s\left(\mathit{x}, {\theta }_{t}\right), t=\mathrm{1, 2}\cdots T\right\} $$ (6)
      $$ \stackrel{-}{s}\left(\mathit{x}\right)=\frac{1}{T}\sum\limits_{t=1}^{T}\left\{s\left(\mathit{x}, {\theta }_{t}\right)\right\} $$ (7)

      式中,x为特征向量;T为决策树个数;θ表示随机变量;s为所构建的回归决策树;$ \stackrel{-}{s}\left(\mathit{x}\right) $为所建立的T个决策树回归结果的均值。

      XGB作为梯度提升树的改进算法,每个叶子结点上都会产生一个预测分数,也就是叶子节点的权重。这个权重是所有落在该节点上的样本在回归树上的回归结果,用fkxi)表示。假设XGB需要建立K棵回归树,则整个模型在样本i上的预测结果为:

      $$ {\widehat{y}}_{i}^{\left(k\right)}=\sum\limits_{k}^{K}{f}_{k}\left({\mathit{x}}_{\mathit{i}}\right) $$ (8)

      式中,$ {\widehat{y}}_{i}^{\left(k\right)} $表示样本i的预测结果;fk表示第k棵回归树;xi表示样本i对应的特征向量。

      SVR是将在低维空间中无法分离的数据集通过升维转化到高维空间中,利用更高维的优势确立一个超平面,寻求所有样本点距离超平面最小,从而达到回归的效果。对于训练样本数据集D,使得预测值fx)与真实值y的误差尽可能地小。数据集D的表达式为:

      $$ D=\left\{\left({x}_{1}, {y}_{1}\right), \left({x}_{2}, {y}_{2}\right)\cdots \left({x}_{m}, {y}_{m}\right)\right\} $$ (9)

      对于一个样本空间,其划分出来的超平面的线性方程表达式为:

      $$ f\left(x\right)={\mathit{w}}^{\mathrm{T}}\phi \left(\mathit{x}\right)+\mathit{b} $$ (10)

      式中,w为超平面的法向量,决定超平面的方向;φ($ \mathit{x} $)为样本x在高维空间的映射;b为位移。

      4种回归模型中,PLR便于理解,建模迅速,是许多强大的非线性回归模型的基础,可解释性强。RFR的优点在于随机采样样本特征,泛化能力强,不易过拟合,通过均值计算得到最优结果。XGB能够突破提升树自身的局限性,从而达到运算速度快、计算性能强的目的,同时可有效防止过拟合,而且损失函数结果更加准确,可以做到并行优化。SVR的优点是使用广泛,鲁棒性强,少数支持向量就可以决定结果,可以剔除数据中的大量冗余,简化回归问题。4个模型是在Python语言下scikit-learn包中实现,通过绘制学习曲线获得最优超参数,并得出各回归评价标准。

    • 南昌市中部地区的住宅区可步行测度指数明显优于边缘地区。整体的住宅区可步行测度指数呈环状由中间向四周散射发展,如图 2所示。南昌市一环内的街道活力指数最高;二环内开始减弱;三环内普遍较低。整体的街道活力在空间上分布不均匀,呈现出赣江东部地区较高、西部较低的趋势,如图 3所示。南昌市城市功能混合度指数以二环内为最好,二环和三环之间部分地区表现较好,三环以外的大部分地区城市功能混合度指数过于单一,如图 4所示。南昌市城市生态环境指数呈城市中心低、向四周逐渐升高分布,如图 5所示。整体上,人类活动的3项指标均呈现出中心高、向四周逐渐递减的趋势,而城市生态环境指标则表现出相反的态势。

      图  2  住宅区可步行测度指数

      Figure 2.  Pedestrian Measure Index of Residential Area

      图  3  街道活力指数

      Figure 3.  Street Vitality Index

      图  4  城市功能混合度指数

      Figure 4.  Index of Urban Function Mixing Degree

      图  5  各街道RSEI

      Figure 5.  RSEI of Various Streets

      南昌市各区县指标数值情况分析如表 5所示。住宅区可步行测度指数、街道活力指数、城市功能混合度指数的分布可分为高数值区域和低数值区域。高数值区域包括青云谱区、西湖区和东湖区;低数值区域有湾里区、安义县、进贤县、南昌县和新建县。高数值区域分布在中心城区,无论是教育机构、城市建设、医疗卫生还是文化事业都高度聚集,且人口密集,交通通达,城市景观丰富,人类活动强度大。低数值区域分布在中心城区外围,其经济发展、产业结构、居民数量以及生活服务都无法满足城市高速发展的要求,所以人类活动强度较小。而城市生态环境指数的分布情况正好相反,除中心城区外,南昌市大部分区域以山地、林地和湿地为主,地形复杂、交通不便,相应的生活服务和公共设施较为匮乏,无法支撑人口必要的生活服务,生态环境质量较好;而作为市中心的东湖区和西湖区表现较差。

      表 5  南昌市各区县指标数值

      Table 5.  Index Values of Each District and County in Nanchang

      指标 湾里区 安义县 进贤县 南昌县 新建县 青山湖区 青云谱区 西湖区 东湖区
      住宅区可步行测度指数 0.055 0.094 0.113 0.117 0.120 0.136 0.173 0.397 0.409
      街道活力指数 0.132 0.149 0.147 0.099 0.089 0.200 0.265 0.276 0.319
      城市功能混合度指数 0.438 0.384 0.441 0.438 0.460 0.574 0.613 0.742 0.814
      城市生态环境指数 0.711 0.613 0.511 0.650 0.577 0.385 0.291 0.279 0.306
    • 将人类活动指标数据作为特征向量X,城市生态环境指标作为目标向量Y。按照街道尺度提取各个指标在该街道的均值,结合机器学习回归模型,得到如下结论。

      通过对数据集进行调参,减小模型的泛化误差,得到最终的回归结果,如表 6所示。从总体上分析,4个模型在本数据集上的表现相似,都达到了较好的回归效果。对于在全部数据集上的回归系数(R2)、平均绝对误差(mean absolute error,MAE)和均方根误差(root mean square error,RMSE)的表现,XGB要优于其他3个模型;而在均方误差(mean square error,MSE)的表现中,PLR的结果略强于其他3个模型。因此,对本数据集回归效果最好的模型是XGB,其次是PLR。

      表 6  各回归模型的指标评价

      Table 6.  Index Evaluation of Each Regression Model

      回归模型 训练集R2 测试集R2 全部数据集R2 MSE MAE RMSE
      PLR 0.689 9 0.008 5 0.071 1 0.092 3
      RFR 0.700 2 0.695 5 0.667 7 0.009 0 0.072 8 0.095 6
      XGB 0.741 7 0.688 2 0.734 7 0.009 2 0.064 8 0.085 4
      SVR 0.676 0 0.663 7 0.672 4 0.009 0 0.073 8 0.094 9

      从多项式回归系数(如式(11)所示)可以看出,对城市生态环境影响最强的负相关特征是x1x3,其回归系数是-3.878 8;影响最强的正相关特征是x12,其回归系数为4.186 8。另外,对城市生态环境指数起负相关作用的特征变量有x1x3x1x3x22x1x2;起正相关作用的特征变量有x12x2x3x32x2x1为街道活力指数,x2为城市功能混合度指数,x3为住宅区可步行测度指数)。

      $$ y=4.186\mathrm{ }8{x}_{1}^{2}-0.717\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }7{x}_{2}^{2}+0.557\mathrm{ }3{x}_{3}^{2}-\\ \ \ \ \ \ \ \ \ 0.073\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }2{x}_{1}{x}_{2}-3.878\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }8{x}_{1}{x}_{3}+\\ \ \ \ \ \ \ \ \ 2.268\mathrm{ }4{x}_{2}{x}_{3}-1.542\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }8{x}_{1}+0.188\mathrm{ }1{x}_{2}-\\ \ \ \ \ \ \ \ \ 0.909\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }\mathrm{ }4{x}_{3}+0.694\mathrm{ }7 $$ (11)

      特征重要性是指在给某个特征随机加入噪声之后,若该特征对数据的结果影响很大,说明其重要性较高,反之则较低。在RFR中,特征重要性最大的是住宅区可步行测度指数,有0.471 6,最小的是街道活力指数,只有0.147 4;在XGB中,特征重要性最大的也是住宅区可步行测度指数,有0.524 8,街道活力指数和城市功能混合度指数相差不大,如表 7所示。因此,在城市生态环境指数与人类活动的各项指标回归分析中,街道活力指数、城市功能混合度指数与城市生态环境指数的相关性更强一点;住宅区可步行测度指数与城市生态环境指数的相关性更差一点。

      表 7  各回归模型特征重要性

      Table 7.  Feature Importance of Each Regression Model

      回归模型 特征重要性
      街道活力指数 城市功能混合度指数 住宅区可步行测度指数
      RFR 0.147 4 0.380 9 0.471 6
      XGB 0.265 2 0.210 0 0.524 8

      按照标准化残差(standardized residuals,Std)的分布情况,分别用差(Std≥2.5或Std≤-2.5)、一般(1.5≤Std < 2.5或-2.5 < Std≤-1.5)、良(0.5≤Std < 1.5或-1.5 < Std≤-0.5)和优(-0.5 < Std < 0.5)来表示,通过统计各残差等级所占比例发现:PLR和XGB在等级为优、良的比例相同且高于RFR和SVR;RFR和XGB在等级为优上的占比比PLR和SVR高3.8%;PLR等级为良的占比最高,如表 8所示。因此得出XGB和PLR的预测结果要优于RFR和SVR。

      表 8  各模型预测结果的残差等级统计/%

      Table 8.  Residual Grade Statistics of Prediction Results of Each Model/%

      机器学习模型 残差等级
      一般
      PLR 0.9 12.3 43.4 43.4
      RFR 0.0 15.1 37.7 47.2
      XGB 0.9 12.3 39.6 47.2
      SVR 0.0 16.0 40.6 43.4

      将各回归模型的预测值和标准化残差做成空间分布图,如表 9所示。4个模型都能较好地预测出城市生态环境的分布情况,即中心城区低、向四周环状递增。

      表 9  各回归模型预测值和残差等级空间分布

      Table 9.  The Predicted Value and Residual Grade Spatial Distribution of Each Regression Model

      回归模型 预测值$ \stackrel{\wedge }{y} $空间分布 残差等级分布
      二次多项式回归
      随机森林回归
      极限梯度提升回归
      支持向量回归机

      从残差等级分布上看,4个模型均在赣江入鄱阳湖的整片区域以及湾里区、厚田乡地区的预测结果较差;在中心城区以及部分人类活动频繁的区域(安义县、南昌县中部和南部、进贤县东部和南部)预测结果较好。因此,在人类活动影响较小的区域,城市生态环境会受到其他因素的干扰导致预测结果精度不高,而在人类活动强烈的区域预测精度较高。

    • 本文以南昌市为研究区域,充分利用泛在于互联网的多源数据,建立指标体系获得城市生态环境指数和影响人类活动的指标数据,利用多种机器学习模型对二者进行回归分析。结果表明:

      1)整体上,受人口分布、资源配置和地形因素的影响,人类活动的3项指标均呈现出中心高、向四周逐渐递减的趋势,而城市生态环境指标则表现出相反的态势。

      2)通过对比4个回归模型在本文数据集中的结果,XGB较其他模型更具有优势。

      3)通过比较回归分析中各指标对城市生态环境的特征重要性,发现街道活力指数、城市功能混合度指数与城市生态环境的相关性更强,住宅区可步行测度指数与城市生态环境的相关性更差。

      4)就南昌市整体而言,在人类活动影响较小的区域,城市生态环境会受到其他因素的干扰导致预测结果精度不高,而在人类活动强烈的区域预测精度较高。

      综合考虑多源数据的优势和特点,建立与人类活动紧密相关的住宅区可步行测度指数、街道活力指数和城市功能混合度指数以及城市生态环境指数,并利用回归模型对其进行建模,为城市生态环境与人类活动关系的研究提供了重要的研究思路和参考价值。机器学习模型与多源数据的结合验证了城市生态环境与人类活动之间较强的负相关关系。随着传感器的持续发展,数据的获取更加多样和详实,加强人类活动方面的管控可助力城市生态环境质量的提升,继而更好地服务于城市生态环境的保护。

      在今后的研究中,将会结合具有时空属性的多源数据对城市生态环境进行研究,以期可以为城市生态环境的向好发展提供更多的科学参考和依据。

参考文献 (19)

目录

    /

    返回文章
    返回