留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于建筑物信息的城市街道尺度人口估算

孟瑶 李锐 蒋捷 王顺利 吴华意

孟瑶, 李锐, 蒋捷, 王顺利, 吴华意. 基于建筑物信息的城市街道尺度人口估算[J]. 武汉大学学报 ● 信息科学版, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343
引用本文: 孟瑶, 李锐, 蒋捷, 王顺利, 吴华意. 基于建筑物信息的城市街道尺度人口估算[J]. 武汉大学学报 ● 信息科学版, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343
MENG Yao, LI Rui, JIANG Jie, WANG Shunli, WU Huayi. Urban Street Scale Population Estimation Based on Building Information[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343
Citation: MENG Yao, LI Rui, JIANG Jie, WANG Shunli, WU Huayi. Urban Street Scale Population Estimation Based on Building Information[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343

基于建筑物信息的城市街道尺度人口估算

doi: 10.13203/j.whugis20190343
基金项目: 

国家重点研发计划 2016YFB0502301

国家自然科学基金 41771426

详细信息

Urban Street Scale Population Estimation Based on Building Information

Funds: 

The National Key Research and Development Program of China 2016YFB0502301

the National Natural Science Foundation of China 41771426

More Information
  • 摘要: 随着城镇化进程的加快与城市人口的迅速膨胀,街道尺度的人口数据在城市经济、社会、资源与环境发展等方面都发挥着愈发重要的作用。研究如何利用高分辨率遥感影像进行城市街道尺度上的人口估算,对促进城市可持续发展具有十分重要的理论意义与实际价值。利用遥感影像建筑物信息与人口普查数据,分析街道建筑物信息与人口数量之间的关联性,提出基于建筑物信息的城市街道尺度人口估算模型,通过多元逐步回归法与赤池信息准则确定建筑物显著特征变量,建立了建筑物数量、几何特征与人口数量的估算模型。实验证明,提出的人口估算模型能够以较高的精度估算街道尺度的人口数量。
  • 图  1  模型残差标准差

    Figure  1.  Model Residual Standard Deviations

    表  1  建筑物特征总量间相关系数

    Table  1.   Correlation Coefficients Between Total Number of Building Features

    变量 相关系数
    NT AT CT FT
    NT 1.00 0.98 0.99 0.86
    AT 0.98 1.00 1.00 0.86
    CT 0.99 1.00 1.00 0.86
    FT 0.86 0.86 0.86 1.00
    下载: 导出CSV

    表  2  建筑物分类特征变量间相关系数

    Table  2.   Correlation Coefficients Between Classified Building Features

    变量 相关系数
    $ {N}_{L} $ $ {A}_{L} $ $ {C}_{L} $ $ {F}_{L} $ $ {N}_{M} $ $ {A}_{M} $ $ {C}_{M} $ $ {F}_{M} $ $ {N}_{H} $ $ {A}_{H} $ $ {C}_{H} $ $ {F}_{H} $
    $ {N}_{L} $ 1.00 0.97 0.99 0.98 0.30 0.39 0.35 0.18 0.29 0.28 0.30 0.24
    $ {A}_{L} $ 0.97 1.00 0.99 0.94 0.26 0.37 0.32 0.14 0.26 0.25 0.26 0.20
    $ {C}_{L} $ 0.99 0.99 1.00 0.96 0.28 0.37 0.33 0.15 0.27 0.26 0.27 0.21
    $ {F}_{L} $ 0.98 0.94 0.96 1.00 0.36 0.44 0.40 0.23 0.36 0.35 0.37 0.30
    $ {N}_{M} $ 0.30 0.26 0.28 0.36 1.00 0.97 0.98 0.96 0.55 0.52 0.54 0.47
    $ {A}_{M} $ 0.39 0.37 0.37 0.44 0.97 1.00 0.99 0.92 0.54 0.51 0.53 0.45
    $ {C}_{M} $ 0.35 0.32 0.33 0.40 0.98 0.99 1.00 0.94 0.54 0.51 0.53 0.45
    $ {F}_{M} $ 0.18 0.14 0.15 0.23 0.96 0.92 0.94 1.00 0.52 0.49 0.51 0.43
    $ {N}_{H} $ 0.29 0.26 0.27 0.36 0.55 0.54 0.54 0.52 1.00 0.99 1.00 0.98
    $ {A}_{H} $ 0.28 0.25 0.26 0.35 0.52 0.51 0.51 0.49 0.99 1.00 1.00 0.97
    $ {C}_{H} $ 0.30 0.26 0.27 0.37 0.54 0.53 0.53 0.51 1.00 1.00 1.00 0.97
    $ {F}_{H} $ 0.24 0.20 0.21 0.30 0.47 0.45 0.45 0.43 0.98 0.97 0.97 1.00
    下载: 导出CSV

    表  3  全变量与人口数量的相关系数

    Table  3.   Correlation Coefficients Between Each Building Feature and Population

    变量 相关系数 变量 相关系数 变量 相关系数 变量 相关系数
    $ {N}_{L} $ 0.12 $ {A}_{L} $ 0.09 $ {C}_{L} $ 0.10 $ {F}_{L} $ 0.18
    $ {N}_{M} $ 0.76 $ {A}_{M} $ 0.74 $ {C}_{M} $ 0.76 $ {F}_{M} $ 0.82
    $ {N}_{H} $ 0.52 $ {A}_{H} $ 0.50 $ {C}_{H} $ 0.52 $ {F}_{H} $ 0.48
    $ {N}_{T} $ 0.57 $ {A}_{T} $ 0.60 $ {C}_{T} $ 0.60 $ {F}_{T} $ 0.79
    下载: 导出CSV

    表  4  模型表达式

    Table  4.   Model Expressions

    模型 模型表达式
    1a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(46\mathrm{ }332.554+19.365{N}_{T}) $
    1b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(36\mathrm{ }110.249-8.712{N}_{L}+40.910{N}_{M}-58.469{N}_{H}) $
    2a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(43\mathrm{ }580+0.052{A}_{T}) $
    2b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(36\mathrm{ }430-0.041{A}_{L}+0.099{A}_{M}+0.108{A}_{H}) $
    3a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(43\mathrm{ }260+0.233{C}_{T}) $
    3b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(34\mathrm{ }980-0.149{C}_{L}+0.453{C}_{M}+0.561{C}_{H}) $
    4a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(33\mathrm{ }140+5.587{F}_{T}) $
    4b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(33\mathrm{ }710-1.414{F}_{L}+7.660{F}_{M}+3.250{F}_{H}) $
    5a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(31\mathrm{ }280-74.36{N}_{T}-0.19{A}_{T}+1.525{C}_{T}+7.996{F}_{T}) $
    5b $ \begin{array}{l}\widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(30\mathrm{ }070-96.94{N}_{M}-0.175{A}_{M}+1.602{C}_{M}+\ 11.71{F}_{M}-219.4{N}_{H}+16.10{F}_{H})\end{array} $
    下载: 导出CSV

    表  5  模型决定系数与残差标准差

    Table  5.   Model Determination Coefficients and Residual Standard Deviations

    模型 决定系数 残差标准差/人 模型 决定系数 残差标准差/人
    1a 0.321 25 860 3b 0.631 19 170
    1b 0.606 19 810 4a 0.626 19 180
    2a 0.355 25 210 4b 0.699 17 300
    2b 0.613 19 650 5a 0.711 17 020
    3a 0.354 25 210 5b 0.757 15 680
    下载: 导出CSV

    表  6  长沙市人口估算相对误差/%

    Table  6.   Relative Errors of Population Estimation in Changsha City/%

    街道 模型4b 模型5a 模型5b
    岳麓 7.630 20.500 0.734
    左家塘 19.526 15.766 16.065
    新开铺 2.794 17.918 0.039
    洪山 33.202 61.525 48.245
    湘龙 24.686 7.233 15.354
    观沙岭 40.268 65.476 43.693
    雨花亭 1.157 15.550 13.307
    青园 61.982 89.814 29.040
    下载: 导出CSV
  • [1] 丁成日, 石晓冬, 牛毅, 等. 城市人口预测及其城市规划意义——以北京为例[J]. 城市规划, 2018(9): 21-27 https://www.cnki.com.cn/Article/CJFDTOTAL-CSGH201809004.htm

    Ding Chengri, Shi Xiaodong, Niu Yi, et al. Urban Population Prediction and Its Significance to Urban Planning: A Case Study of Beijing[J]. City Planning Review, 2018(9): 21-27 https://www.cnki.com.cn/Article/CJFDTOTAL-CSGH201809004.htm
    [2] 冯甜甜. 基于高分辨率遥感数据的城市精细尺度人口估算研究[D]. 武汉: 武汉大学, 2010

    Feng Tiantian. Urban Small Area Population Estimation Based on High-Resolution Remote Sensing Data[D]. Wuhan: Wuhan University, 2010
    [3] 闫庆武, 卞正富, 王红. 利用泰森多边形和格网平滑的人口密度空间化研究: 以徐州市为例[J]. 武汉大学学报·信息科学版, 2011, 36(8): 987-990 http://ch.whu.edu.cn/article/id/624

    Yan Qingwu, Bian Zhengfu, Wang Hong. Census Spatialization Based on Thiessen Polygons and Grids Smoothing: A Case Study in Xuzhou[J]. Geomatics and Information Science of Wuhan University, 2011, 36(8): 987-990 http://ch.whu.edu.cn/article/id/624
    [4] Azar D, Graesser J, Engstrom R, et al. Spatial Refinement of Census Population Distribution Using Remotely Sensed Estimates of Impervious Surfaces in Haiti[J]. International Journal of Remote Sensing, 2010, 31(21): 5 635-5 655
    [5] Chen K. An Approach to Linking Remotely Sensed Data and Areal Census Data[J]. International Journal of Remote Sensing, 2002, 23(1): 37-48 doi:  10.1080/01431160010014297
    [6] 匡文慧, 张树文, 张养贞. 基于遥感影像的长春城市用地建筑面积估算[J]. 重庆建筑大学学报, 2007, 29(1): 18-21 https://www.cnki.com.cn/Article/CJFDTOTAL-JIAN200701004.htm

    Kuang Wenhui, Zhang Shuwen, Zhang Yangzhen. Research on Estimating Urban Land Use Floor Area in Changchun Based on High-Resolution Satellite Images[J]. Journal of Chongqing Jianzhu University, 2007, 29(1): 18-21 https://www.cnki.com.cn/Article/CJFDTOTAL-JIAN200701004.htm
    [7] 杨存建, 白忠, 贾月江, 等. 基于多源遥感的聚落与多级人口统计数据的关系分析[J]. 地理研究, 2009, 28(1): 19-26 https://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ200901003.htm

    Yang Cunjian, Bai Zhong, Jia Yuejiang, et al. Study on the Relationship Between Residential Area from Multi-source Remote Sensing Images and Multi-level Population Data[J]. Geographical Research, 2009, 28(1): 19-26 https://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ200901003.htm
    [8] Hardin P J, Jackson M W, Jensen R R. Modelling Housing Unit Density from Land Cover Metrics: A Midwestern US Example[J]. Geocarto International, 2008, 23(5): 393-411 doi:  10.1080/10106040801950344
    [9] 毛莹莹. 城市人口数据空间化研究——以福州市中心城区为例[D]. 福州: 福建师范大学, 2016

    Mao Yingying. Study on Urban Population Data Spatialization in City: A Case Study in Downtown Fuzhou[D]. Fuzhou: Fujian Normal University, 2016
    [10] Zhang Baoguang. Application of Remote Sensing Technology to Population Estimation[J]. Chinese Geographical Science, 2003, 13(3): 267-271 doi:  10.1007/s11769-003-0029-0
    [11] 郭洪旭, 黄莹, 赵黛青. 城市居住人口空间分布的模拟研究——以广州市天河区为例[J]. 热带地理, 2013, 33(1): 81-87 https://www.cnki.com.cn/Article/CJFDTOTAL-RDDD201301016.htm

    Guo Hongxu, Huang Ying, Zhao Daiqing. Modeling of Spatial Distribution of Urban Population Density: A Case Study of Tianhe District, Guangzhou[J]. Tropical Geography, 2013, 33(1): 81-87 https://www.cnki.com.cn/Article/CJFDTOTAL-RDDD201301016.htm
    [12] Harvey J. Small Area Population Estimation Using Satellite Imagery[J]. Statistics in Transition, 2000, 4(4): 611-633
    [13] Liu X, Clarke K, Herold M. Population Density and Image Texture: A Comparison Study[J]. Photogrammetric Engineering and Remote Sensing, 2006, 72(2): 187-196 doi:  10.14358/PERS.72.2.187
    [14] Wu Shuosheng, Wang Le, Qiu Xiaomin. Incorporating GIS Building Data and Census Housing Statistics for Sub-Block Population Estimation[J]. Professional Geographer, 2008, 60: 121-135 doi:  10.1080/00330120701724251
    [15] 鹿琳琳, 郭华东. 利用遥感影像自动估算深圳福田城市人口[J]. 遥感信息, 2008(2): 64-68 doi:  10.3969/j.issn.1000-3177.2008.02.014

    Lu Linlin, Guo Huadong. Automatic Estimation of Urban Population with Remote Sensing Imagery Based on ArcGIS[J]. Remote Sensing Information, 2008(2): 64-68 doi:  10.3969/j.issn.1000-3177.2008.02.014
    [16] Lwin K K, Murayama Y. A GIS Approach to Estimation of Building Population for Micro-spatial Analysis[J]. Transactions in GIS, 2009, 13(4): 401-414 doi:  10.1111/j.1467-9671.2009.01171.x
    [17] 冯甜甜, 龚健雅. 基于建筑物提取的精细尺度人口估算研究[J]. 遥感技术与应用, 2010 (3): 323-327 https://www.cnki.com.cn/Article/CJFDTOTAL-YGJS201003004.htm

    Feng Tiantian, Gong Jianya. Investigation on Small-Area Population Estimation Based on Building Extraction[J]. Remote Sensing Technology and Application, 2010 (3): 323-327 https://www.cnki.com.cn/Article/CJFDTOTAL-YGJS201003004.htm
    [18] Ural S, Hussain E, Shan J. Building Population Mapping with Aerial Imagery and GIS Data[J]. International Journal of Applied Earth Observation and Geoinformation, 2011, 13(6): 841-852 doi:  10.1016/j.jag.2011.06.004
    [19] 封静. 基于高分辨率遥感影像的城市精细尺度人口估算[D]. 上海: 华东师范大学, 2012

    Feng Jing. Urban Small Area Population Estimation Based on High-Resolution Remote Sensing Data[D]. Shanghai: East China Normal University, 2012
    [20] 冷建飞, 高旭, 朱嘉平. 多元线性回归统计预测模型的应用[J]. 统计与决策, 2016(7): 82-85 https://www.cnki.com.cn/Article/CJFDTOTAL-TJJC201607023.htm

    Leng Jianfei, Gao Xu, Zhu Jiaping. Application of Multiple Linear Regression Statistical Prediction Model[J]. Statistics and Decision, 2016(7): 82-85 https://www.cnki.com.cn/Article/CJFDTOTAL-TJJC201607023.htm
    [21] 杨仁, 王冬根. 近代回归分析在交通调查分析建模中的应用[J]. 武汉测绘科技大学学报, 1990, 15(3): 77-83 https://www.cnki.com.cn/Article/CJFDTOTAL-WHCH199003009.htm

    Yang Ren, Wang Donggen. Studies on the Prediction Model of People Trip Flow in Urban Aera[J]. Journal of Wuhan Technical University of Surveying and Mapping, 1990, 15(3): 77-83 https://www.cnki.com.cn/Article/CJFDTOTAL-WHCH199003009.htm
    [22] 洪宇. 基于信息论的贝叶斯网络结构学习算法研究[D]. 上海: 东华大学, 2016

    Hong Yu. Research of Structure Learning Algorithm for Bayesian Network Based on Information Theory[D]. Shanghai: Donghua University, 2016
    [23] 王亚荣. 广义线性模型下ERIC方法的调节参数选择[D]. 兰州: 兰州财经大学, 2018

    Wang Yarong. Tuning Parameter Selection Using ERIC Criterion in the Generalized Linear Model[D]. Lanzhou: Lanzhou University of Finance and Economics, 2018
    [24] 孙立琴, 张福浩, 杨树文, 等. 逐步回归的时空地理加权变量选取方法[J]. 测绘科学, 2019, 44(1): 73-78 https://www.cnki.com.cn/Article/CJFDTOTAL-CHKD201901014.htm

    Sun Liqin, Zhang Fuhao, Yang Shuwen, et al. The Method of Selecting Geographically and Temporally Weight Regression Variable Based on Stepwise Regression[J]. Science of Surveying and Mapping, 2019, 44(1): 73-78 https://www.cnki.com.cn/Article/CJFDTOTAL-CHKD201901014.htm
  • [1] 眭海刚, 冯文卿, 李文卓, 孙开敏, 徐川.  多时相遥感影像变化检测方法综述 . 武汉大学学报 ● 信息科学版, 2018, 43(12): 1885-1898. doi: 10.13203/j.whugis20180251
    [2] 卓国浩, 吴波, 朱欣然.  一种自适应三维核回归的遥感时空融合方法 . 武汉大学学报 ● 信息科学版, 2018, 43(4): 563-570. doi: 10.13203/j.whugis20160141
    [3] 吴学伟, 徐亚明, 龚文峰.  城市热岛空间格局及其变化的图形信息特征分析 . 武汉大学学报 ● 信息科学版, 2017, 42(12): 1711-1718. doi: 10.13203/j.whugis20150588
    [4] 刘辉.  基于改进阴影指数的福州市主城区建筑容积率提取 . 武汉大学学报 ● 信息科学版, 2014, 39(10): 1241-1247.
    [5] 魏立飞, 钟燕飞, 张良培, 李平湘.  多波段信息融合的遥感影像变化检测 . 武汉大学学报 ● 信息科学版, 2014, 39(1): 8-11.
    [6] 叶沅鑫, 单杰, 熊金鑫, 董来根.  一种结合SIFT和边缘信息的多源遥感影像匹配方法 . 武汉大学学报 ● 信息科学版, 2013, 38(10): 1148-1151.
    [7] 高光大, 任娜, 王永志, 朱长青.  利用影像重定位和遍历检测的遥感影像水印算法 . 武汉大学学报 ● 信息科学版, 2012, 37(10): 1229-1231.
    [8] 王连备, 贲进.  基于SOA的遥感影像共享架构研究 . 武汉大学学报 ● 信息科学版, 2010, 35(11): 1314-1317.
    [9] 刘进, 孙婧, 徐正全, 姚晔.  面向遥感影像内容的多级安全授权方法 . 武汉大学学报 ● 信息科学版, 2010, 35(9): 1096-1099.
    [10] 陶建斌, 舒宁, 沈照庆.  利用互信息改进遥感影像朴素贝叶斯网络分类器 . 武汉大学学报 ● 信息科学版, 2010, 35(2): 228-232.
    [11] 温兴平, 胡光道, 杨晓峰.  基于准不变目标物下CBERS-02星CCD图像的交叉定标 . 武汉大学学报 ● 信息科学版, 2009, 34(4): 409-413.
    [12] 刘小利, 朱国宾, 李清泉, 贾治革.  基于并行Tabu搜索和空间信息约束的遥感影像模糊聚类 . 武汉大学学报 ● 信息科学版, 2009, 34(5): 527-530.
    [13] 饶雄, 张景雄, 丁翼星.  基于多项Logit模型的土地覆被分层分类方法研究 . 武汉大学学报 ● 信息科学版, 2008, 33(11): 1166-1169.
    [14] 廖明生, 江利明, 林珲, 杨立民.  基于CART集成学习的城市不透水层百分比遥感估算 . 武汉大学学报 ● 信息科学版, 2007, 32(12): 1099-1102.
    [15] 张剑清, 张勇, 郑顺义, 张宏伟.  高分辨率遥感影像的精纠正 . 武汉大学学报 ● 信息科学版, 2004, 29(11): 994-998.
    [16] 关泽群, 王贤敏, 孙家抦.  一种实用的遥感影像二维信息隐藏盲算法 . 武汉大学学报 ● 信息科学版, 2004, 29(4): 296-301.
    [17] 林宗坚, 刘政荣.  从遥感影像提取道路信息的方法评述 . 武汉大学学报 ● 信息科学版, 2003, 28(1): 90-93.
    [18] 熊兴华, 李新涛.  面向对象的遥感影像模糊增强 . 武汉大学学报 ● 信息科学版, 2002, 27(5): 516-521,542.
    [19] 张景雄.  遥感影像的全模糊监督分类 . 武汉大学学报 ● 信息科学版, 1998, 23(3): 211-214.
    [20] 吴子安.  大坝变形监测数据回归分析中的因子选择 . 武汉大学学报 ● 信息科学版, 1993, 18(1): 20-26.
  • 加载中
图(1) / 表(6)
计量
  • 文章访问数:  451
  • HTML全文浏览量:  190
  • PDF下载量:  86
  • 被引次数: 0
出版历程
  • 收稿日期:  2020-05-27
  • 刊出日期:  2021-08-05

基于建筑物信息的城市街道尺度人口估算

doi: 10.13203/j.whugis20190343
    基金项目:

    国家重点研发计划 2016YFB0502301

    国家自然科学基金 41771426

    作者简介:

    孟瑶,硕士,主要研究方向为时空计算与数据挖掘。yao.meng@whu.edu.cn

    通讯作者: 蒋捷,博士,教授。E-mail: jiangjie@bucea.edu.cn
  • 中图分类号: P208

摘要: 随着城镇化进程的加快与城市人口的迅速膨胀,街道尺度的人口数据在城市经济、社会、资源与环境发展等方面都发挥着愈发重要的作用。研究如何利用高分辨率遥感影像进行城市街道尺度上的人口估算,对促进城市可持续发展具有十分重要的理论意义与实际价值。利用遥感影像建筑物信息与人口普查数据,分析街道建筑物信息与人口数量之间的关联性,提出基于建筑物信息的城市街道尺度人口估算模型,通过多元逐步回归法与赤池信息准则确定建筑物显著特征变量,建立了建筑物数量、几何特征与人口数量的估算模型。实验证明,提出的人口估算模型能够以较高的精度估算街道尺度的人口数量。

English Abstract

孟瑶, 李锐, 蒋捷, 王顺利, 吴华意. 基于建筑物信息的城市街道尺度人口估算[J]. 武汉大学学报 ● 信息科学版, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343
引用本文: 孟瑶, 李锐, 蒋捷, 王顺利, 吴华意. 基于建筑物信息的城市街道尺度人口估算[J]. 武汉大学学报 ● 信息科学版, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343
MENG Yao, LI Rui, JIANG Jie, WANG Shunli, WU Huayi. Urban Street Scale Population Estimation Based on Building Information[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343
Citation: MENG Yao, LI Rui, JIANG Jie, WANG Shunli, WU Huayi. Urban Street Scale Population Estimation Based on Building Information[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1194-1200. doi: 10.13203/j.whugis20190343
  • 城市人口是城市国土空间规划基本且重要的内容之一,人口数据是城市应急响应、城市承载功能设计、城市资源开发与分配、城市产业结构调整、城市交通规划设计等方面着重考虑的基础信息要素,对促进城市经济社会的全面协调可持续发展具有十分重要的意义[1]。人口普查是现今世界各国广泛采用的获取人口资料的方法,其数据真实、准确、完整,但人口普查成本高、工作量大,且普查周期为10年,无法提供普查间隔内的人口资料[2]。因此,人口普查数据在时间分辨率上的天然缺陷使其不能满足许多与人口相关研究与应用的需要,如在研究人口目标区域上更短时间内的人口变化、解决人口目标区域与人口普查区边界不一致的问题及对更小空间尺度上人口数据的需求等[3]

    随着摄影测量与遥感技术的迅速发展,利用影像进行地表信息的快速采集与更新逐渐成为重要方法之一。摄影测量数据与遥感影像在数据获取方式及时空分辨率上的优势使其成为新型人口调查的重要辅助数据[4-5]。半个多世纪以来,国内外学者提出了许多基于遥感影像和地理信息系统(geographic information system,GIS)辅助的人口估算方法。利用遥感影像进行人口估算研究的基本思想如下: 首先,从遥感影像中获取各类与人口数量可能相关的信息; 然后,利用先验知识与数学方法建立人口数量与所获取信息的数学模型,从而实现人口数量估算,这是交叉学科的应用之一。从影像中获取的信息通常包括城市面积[6-7]、土地利用类型[8-9]、居住单元[10-11]、影像的光谱反射值或纹理[12-13]。多数人口估算研究集中在城市面积估算法与图像像元特征估算法上,方法较为成熟,但中等分辨率遥感影像的低空间分辨率缺陷使其在城市街道尺度的人口估算研究上具有不适用性。

    建筑物相关信息与城市人口数据联系十分紧密,亦有许多学者从高分辨率遥感影像中提取建筑物轮廓、高度等信息。Wu等[14]将人口普查区域依照建筑物体积进行分块,使用总建筑体积与住房建筑物面积对人口数量进行回归分析,结果表明,子块区域越小,人口估算的精度越高。鹿琳琳等[15]根据深圳市福田区的建设情况把住宅类型依据楼层分为3类,基于遥感与GIS辅助数据对研究区域内各居委会的人口数量进行估算。Lwin等[16]讨论了基于人口普查区和建筑物足迹数据集估算建筑物人口的GIS方法,并通过目视判读、空间统计分析等手段评估估算结果。冯甜甜等[17]针对美国居住人口的分布特点将建筑物分为单居民住宅区、多居民住宅区与非居民区建筑,建立居民建筑与人口数量的线性关系,实现美国城市人口估算。Ural等[18]利用航空影像和其他地理数据提出一种改进的建筑物人口估算模型,考虑了不同类型住宅建筑对人口数量的影响。封静[19]通过实地调查获取楼层与家庭人口信息,从遥感影像中提取建筑物面积与高度信息,并将建筑物依据高度进行分类,在估算建筑物面积后除以人均居住面积,实现对上海松江新城17个居委会的人口估算。利用高分辨率遥感影像的建筑物信息可以有效地估算街道尺度人口数量。在数学模型的应用上,各类回归模型被用于建立估算模型,但对较为经典的逐步回归分析法的使用较少,且变量选择主要依靠经验值,极少进行统计检验。

    本文通过从高分辨率遥感影像中获得的城市街道建筑物的数量与几何特征,分析人口数量和街道建筑物特征变量之间的数学关系,提出基于街道建筑物信息的城市街道尺度人口估算模型,从而实现对城市街道尺度人口数量的估算。

    • 本文采用2010年全国第六次人口普查数据、2017年全国乡镇/街道行政边界与2018年第1季度遥感影像数据为本文研究的基础数据。利用软件GlobalMapper提取全国范围内24个主要城市,共287条街道的建筑物数量与几何特征,其中,几何特征包括建筑物的占地面积、周长与楼层信息。

      数据预处理。首先,筛选街道建筑物,剔除占地面积超过1 500 m2的非居民地建筑物; 然后,筛选街道,剔除人均建筑面积大于120 m2的非居民地建筑物占比显著的街道; 最后,对保留的232条样本街道,共计348 403条建筑物数据进行分类,划分为层数≤2的低层建筑物、2 < 层数≤10的中层建筑物、层数 > 10的高层建筑物3类。以2层作为低层与中层分类的依据是: 不高于两层的建筑物,包括一层与两层,通常为城市边缘地区如村镇等人口的主要居住建筑,多为独户家庭居住环境,具有较为特殊的人口密度; 以10层作为中层与高层分类的依据为采取城市中心地区建筑物楼层分类的经验值。

    • 本文选取街道建筑物信息中与人口数量分布存在相关性的建筑物特征变量,对各建筑物特征变量间进行关联性分析。根据居住单元估算法,人口数量与建筑物数量之间存在密切相关关系,由此选取街道总建筑物数量NT,由于不同高度的建筑物人均占有面积不同,因此,选取将街道建筑物依据楼层分类后的低层建筑物数量NL、中层建筑物数量NM与高层建筑物数量NH。仅利用建筑物数量信息无法刻画建筑物的几何特征,因此,增加选取建筑物面积、周长与楼层,同理,增加选取特征变量ATALAMAHCTCLCMCHFTFLFMFH。本文共选取16个建筑物特征变量,分别是HTHLHMHHATALAMAHCTCLCMCHFTFLFMFH,即街道建筑物数量、面积、周长、楼层和经建筑物分类后的各对应变量。

      由于选取的变量之间可能存在一定的相关性,完全无关的变量没有共同建模的必要,同时,要求各变量间存在较小的共线性,从而提高建模效果,因此,需要对各变量进行关联性分析。对街道建筑物总数量、总面积、总周长、总楼层4个特征变量进行的关联性分析如表 1所示。

      表 1  建筑物特征总量间相关系数

      Table 1.  Correlation Coefficients Between Total Number of Building Features

      变量 相关系数
      NT AT CT FT
      NT 1.00 0.98 0.99 0.86
      AT 0.98 1.00 1.00 0.86
      CT 0.99 1.00 1.00 0.86
      FT 0.86 0.86 0.86 1.00

      表 1显示$ {N}_{T} $、$ {A}_{T} $和$ {C}_{T} $三者之间具有非常强的两两相关性,由于大样本建筑物占地面积平均值趋于定值,且建筑物的形状大多为规则几何形状,因此,在大样本数据统计结果中,这三者呈现非常强的正线性相关关系。$ {N}_{T} $、$ {A}_{T} $、$ {C}_{T} $和$ {F}_{T} $之间的相关性相对弱于前三者之间的相关性,主要是现代城市建设更多地向三维空间扩展,与建筑物平均占地面积相比,建筑物的平均高度更具差异性,导致$ {F}_{T} $与前三者之间的相关性相对较弱,但仍处于0.86的较高水平。预期仅使用街道建筑物特征变量总数会较大地削弱建筑物信息对人口数量的估算能力,同时,也掩盖了不同街道建筑物的特性,从第1个方面支持了对街道建筑物分类的必要性。

      街道建筑物数量、面积、周长、楼层经过建筑物分类后得到的12个变量的关联性统计结果如表 2所示。

      表 2  建筑物分类特征变量间相关系数

      Table 2.  Correlation Coefficients Between Classified Building Features

      变量 相关系数
      $ {N}_{L} $ $ {A}_{L} $ $ {C}_{L} $ $ {F}_{L} $ $ {N}_{M} $ $ {A}_{M} $ $ {C}_{M} $ $ {F}_{M} $ $ {N}_{H} $ $ {A}_{H} $ $ {C}_{H} $ $ {F}_{H} $
      $ {N}_{L} $ 1.00 0.97 0.99 0.98 0.30 0.39 0.35 0.18 0.29 0.28 0.30 0.24
      $ {A}_{L} $ 0.97 1.00 0.99 0.94 0.26 0.37 0.32 0.14 0.26 0.25 0.26 0.20
      $ {C}_{L} $ 0.99 0.99 1.00 0.96 0.28 0.37 0.33 0.15 0.27 0.26 0.27 0.21
      $ {F}_{L} $ 0.98 0.94 0.96 1.00 0.36 0.44 0.40 0.23 0.36 0.35 0.37 0.30
      $ {N}_{M} $ 0.30 0.26 0.28 0.36 1.00 0.97 0.98 0.96 0.55 0.52 0.54 0.47
      $ {A}_{M} $ 0.39 0.37 0.37 0.44 0.97 1.00 0.99 0.92 0.54 0.51 0.53 0.45
      $ {C}_{M} $ 0.35 0.32 0.33 0.40 0.98 0.99 1.00 0.94 0.54 0.51 0.53 0.45
      $ {F}_{M} $ 0.18 0.14 0.15 0.23 0.96 0.92 0.94 1.00 0.52 0.49 0.51 0.43
      $ {N}_{H} $ 0.29 0.26 0.27 0.36 0.55 0.54 0.54 0.52 1.00 0.99 1.00 0.98
      $ {A}_{H} $ 0.28 0.25 0.26 0.35 0.52 0.51 0.51 0.49 0.99 1.00 1.00 0.97
      $ {C}_{H} $ 0.30 0.26 0.27 0.37 0.54 0.53 0.53 0.51 1.00 1.00 1.00 0.97
      $ {F}_{H} $ 0.24 0.20 0.21 0.30 0.47 0.45 0.45 0.43 0.98 0.97 0.97 1.00

      表 2中,在低层、中层与高层建筑物的跨建筑物类型中,各特征变量之间的相关性大幅度减弱,显著增强了街道建筑物信息对人口数量的可描述性,从第2个方面支持了对街道建筑物分类的必要性。

      本文分析了街道建筑物特征变量与城市街道人口数量之间的相关性,表 3为16个变量与人口数量的相关系数。

      表 3  全变量与人口数量的相关系数

      Table 3.  Correlation Coefficients Between Each Building Feature and Population

      变量 相关系数 变量 相关系数 变量 相关系数 变量 相关系数
      $ {N}_{L} $ 0.12 $ {A}_{L} $ 0.09 $ {C}_{L} $ 0.10 $ {F}_{L} $ 0.18
      $ {N}_{M} $ 0.76 $ {A}_{M} $ 0.74 $ {C}_{M} $ 0.76 $ {F}_{M} $ 0.82
      $ {N}_{H} $ 0.52 $ {A}_{H} $ 0.50 $ {C}_{H} $ 0.52 $ {F}_{H} $ 0.48
      $ {N}_{T} $ 0.57 $ {A}_{T} $ 0.60 $ {C}_{T} $ 0.60 $ {F}_{T} $ 0.79

      表 3显示$ {N}_{T} $、$ {A}_{T} $、$ {C}_{T} $、$ {F}_{T} $和人口数量之间的相关性均弱于对应中层建筑物特征变量与人口数量之间的相关性,预期利用4个特征总量建立模型的估算效果弱于分类后的模型。另外,中层建筑物特征变量和人口数量之间的相关性明显突出,高层建筑物特征变量与人口数量之间的相关性明显强于低层建筑物特征变量与人口数量之间的相关性。这是由于在当前城市街道建筑物体系中,中层建筑物占有相当大的比例,而且在相同数量的低层与高层建筑物中,高层建筑物的人口容纳量远高于低层建筑物的人口容纳量。预期对于城市街道尺度人口数量的描述,主要依赖于中层与高层建筑物的数量与几何特征,低层建筑物的数量与几何特征起辅助补充作用,从第3个方面支持了对街道建筑物分类的必要性。

    • 依据对城市街道建筑物信息与人口数量的关联性分析,利用街道建筑物总数量$ {N}_{T} $建立线性回归模型1a。由于不同高度街道建筑物人均占有面积不同,在回归模型中表现为系数的不同,因此,在模型1a的基础上,利用分类后的建筑物数量$ {N}_{L} $、$ {N}_{M} $与$ {N}_{H} $建立模型1b。同理,利用建筑物面积、周长与楼层总量建立模型2a、3a、‍4a,利用各分类后的特征变量建立模型2b、3b、4b。

      模型1~模型4均利用街道建筑物单一几何特性进行人口估算,变量数量较少,方法简单,计算简便。以此为基础,本文综合构建上述模型的所有变量,利用逐步线性回归法挑选街道建筑物显著特征变量,建立线性回归综合模型5a与模型‍5b。利用变量$ {N}_{T} $、$ {A}_{T} $、$ {C}_{T} $、$ {F}_{T} $建立模型5a,利用变量$ {N}_{L} $、$ {N}_{M} $、$ {N}_{H} $、$ {A}_{L} $、$ {A}_{M} $、$ {A}_{H} $、$ {C}_{L} $、$ {C}_{M} $、$ {C}_{H} $、$ {F}_{L} $、$ {F}_{M} $、$ {F}_{H} $建立模型5b。模型表达式如表 4所示。

      表 4  模型表达式

      Table 4.  Model Expressions

      模型 模型表达式
      1a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(46\mathrm{ }332.554+19.365{N}_{T}) $
      1b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(36\mathrm{ }110.249-8.712{N}_{L}+40.910{N}_{M}-58.469{N}_{H}) $
      2a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(43\mathrm{ }580+0.052{A}_{T}) $
      2b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(36\mathrm{ }430-0.041{A}_{L}+0.099{A}_{M}+0.108{A}_{H}) $
      3a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(43\mathrm{ }260+0.233{C}_{T}) $
      3b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(34\mathrm{ }980-0.149{C}_{L}+0.453{C}_{M}+0.561{C}_{H}) $
      4a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(33\mathrm{ }140+5.587{F}_{T}) $
      4b $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(33\mathrm{ }710-1.414{F}_{L}+7.660{F}_{M}+3.250{F}_{H}) $
      5a $ \widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(31\mathrm{ }280-74.36{N}_{T}-0.19{A}_{T}+1.525{C}_{T}+7.996{F}_{T}) $
      5b $ \begin{array}{l}\widehat{P}=\mathrm{f}\mathrm{l}\mathrm{o}\mathrm{o}\mathrm{r}(30\mathrm{ }070-96.94{N}_{M}-0.175{A}_{M}+1.602{C}_{M}+\ 11.71{F}_{M}-219.4{N}_{H}+16.10{F}_{H})\end{array} $
    • 模型1~模型4均采用多元线性回归法构建,在回归人口数与实际人口数残差平方和最小的前提下,利用最小二乘法求解模型的回归系数[20]

      模型5a与模型5b利用赤池信息准则(Akaike information criterion,AIC)进行向后逐步回归挑选最佳模型[21]。AIC由日本统计学家赤池弘次[22-23]提出,用于衡量给定数据集中不同统计模型的相对质量。向后逐步回归的主要思想是:依次排除模型变量后,对模型进行检验,从而确定剔除变量,直到没有满足继续剔除条件的变量为止,确定最优模型[24]。具体步骤为:(1)构建全变量回归方程,计算方程AIC值。(2)逐次建立某一变量系数为0的回归方程,计算该方程AIC值并检验变量显著性。(3)根据新的AIC值与统计检验值判断是否剔除该变量,若无需要剔除的变量,则向后逐步回归过程结束;若需要剔除某一变量,则将该变量剔除,进入下一步。(4)建立剩余变量的回归方程,计算AIC值,返回步骤(2)。选定用于建立模型的街道建筑物显著特征变量后,利用多元线性回归构建回归方程,此即候选模型集合中的最优模型。模型5b最终保留的街道建筑物显著特征变量为中层建筑物的总数量、总面积、总周长、总楼层与高层建筑物的总数量、总楼层。低层建筑物数量与几何特征全部被剔除,中层建筑物数量与几何特征全部被保留,高层建筑物保留数量与楼层特征与关联性分析预期的结果一致。

    • 基于街道建筑物数据与人口普查数据建立模型,统计各模型决定系数与残差标准差如表 5图 1所示。

      表 5  模型决定系数与残差标准差

      Table 5.  Model Determination Coefficients and Residual Standard Deviations

      模型 决定系数 残差标准差/人 模型 决定系数 残差标准差/人
      1a 0.321 25 860 3b 0.631 19 170
      1b 0.606 19 810 4a 0.626 19 180
      2a 0.355 25 210 4b 0.699 17 300
      2b 0.613 19 650 5a 0.711 17 020
      3a 0.354 25 210 5b 0.757 15 680

      图  1  模型残差标准差

      Figure 1.  Model Residual Standard Deviations

      表 5图 1表明,在对街道建筑物进行低层、中层与高层建筑物分类后,模型的估算效果具有显著提升。模型1b、2b、3b的决定系数与残差标准差非常接近,这与关联性分析中建筑物总数量、总面积与总周长的极强相关性相符合。而模型1a、2a、3a的决定系数与残差标准差均远差于模型1b、2b、3b的,证明了考虑楼层信息对街道建筑物进行分类的有效性。模型4a的各项统计量与模型1b~模型3b相当,这是由于在统计总楼层时同样考虑了高度信息,而模型4b将高度信息进一步细化分类,模型估算效果明显优于模型4a,再次证明了对街道建筑物分类的必要性。在利用单一街道建筑物特征变量建立的模型1~模型4中,利用楼层数建立的模型4估算效果显著优于利用数量、面积与周长特征变量建立的模型1、模型2、模型3,这是因为在现代城市建筑中,高度空间的利用越发重要,事实上楼层信息才更加细致地刻画了人群居住空间的特点。

      采用向后逐步回归法建立的模型5a与模型‍4b的估算效果相当,与模型4a相比,在性能上存在显著的提升,说明街道建筑物数量、面积与周长3类特征信息对于人口数量估算具有明显的辅助作用,这一点从模型5b与模型4b的比较中亦能得到印证。模型5b在统计上具有最优精度,决定系数为0.757,残差标准差为15 680人。这是由于该模型对街道建筑物特征信息进行了最充分的利用,在模型4b的基础上,加入了其他街道建筑物特征辅助信息;在模型5a的基础上,增加了依据楼层对街道建筑物的分类。

      各模型的估算精度表明,在实际进行城市街道尺度人口估算时,街道建筑物楼层或高度信息是必要的,一方面可以直接将楼层数据应用于估算模型,另一方面楼层数据亦是对街道建筑物进行分类的依据;将街道建筑物按照层数分为低层、中层与高层建筑物,可以显著提高模型的人口估算效果;模型5b在人口估算整体上具有最佳性能,但当街道建筑物数据种类有限时,采用模型4b与模型5a同样可以得到较好的估算效果。

    • 由于模型1a~模型4a与模型1b~模型3b的精度均较低,估算偏差较大,因此,在后续研究中,仅对模型4b、模型5a与模型5b进行讨论。为验证模型的有效性与适用性,以长沙市为例,对长沙市进行街道尺度的人口数量估算。首先,基于深度学习中Robosat工具从高分二号遥感影像中提取街道建筑物轮廓信息;然后,从网上公开的长沙市建筑物数据提取街道建筑物高度信息,匹配给从影像中提取的相应街道建筑物。经数据预处理后,保留8条测试街道,共计19 126条街道建筑物数据,代入模型4b、模型5a与模型5b,各模型人口估算相对误差如表 6所示。

      表 6  长沙市人口估算相对误差/%

      Table 6.  Relative Errors of Population Estimation in Changsha City/%

      街道 模型4b 模型5a 模型5b
      岳麓 7.630 20.500 0.734
      左家塘 19.526 15.766 16.065
      新开铺 2.794 17.918 0.039
      洪山 33.202 61.525 48.245
      湘龙 24.686 7.233 15.354
      观沙岭 40.268 65.476 43.693
      雨花亭 1.157 15.550 13.307
      青园 61.982 89.814 29.040

      表 6可知,本文提出的模型4b、模型5a与模型5b均取得良好的估算效果,其中,模型5b的综合估算精度最佳,模型4b次之,模型5a估算效果略差。模型4b与模型5b对岳麓街道与新开铺街道的估算精度最佳,这是由于两条街道低中高层建筑物数量比例约为3∶4∶1,是较为标准的街道规模,同样也是样本街道的主要规模,因此,估算效果非常理想。当街道人口数在12万人左右时,模型5b能够对模型4b的估算效果进行有效的修正,这是由于模型5b在模型4b仅利用建筑物楼层信息估算人口的基础上考虑到建筑物数量、面积和周长特征对人口数量的影响,如左家塘街道与湘龙街道,前者的相对误差由20%降低至16%,后者由25%降低至15%,此时的街道规模依然在模型5b能够精细刻画的范围内。但对街道人口数为17万人的雨花亭街道,模型5b的估算效果远低于模型4b,这是由于此时的街道规模已经超出模型5b能够修正的范围,对人口数量更为精细的描述反而会造成更大的精度损失。

    • 本文依据城市街道尺度人口数量与街道建筑物分布呈现密切相关的特点,对基于高分辨率遥感影像建筑物信息估算城市街道尺度人口数量进行了研究。通过对街道建筑物数量、面积、周长与楼层各变量之间,以及各变量与人口数量之间的关联性分析,提出了基于街道建筑物信息的城市街道尺度人口估算模型,其中,模型5b具有综合最佳性能,并证明了本文提出的街道建筑物分类方法能够显著提高模型估算精度。以长沙市为例对模型进行了验证,实验结果表明,本文提出的模型能够有效地估算城市街道尺度人口数量。

      受研究主题及篇幅限制,本文采用的数据为行政区划中的街道尺度数据,但实际上提出模型的估算范围并不局限于此,理论上在跨街道区域的人口估算应用中同样有效,这一点有待在后续研究中进行验证。

参考文献 (24)

目录

    /

    返回文章
    返回