利用多源空间数据的城中村空间层次化识别方法

陈栋胜, 李清泉, 涂伟, 曹瑞, 黄正东, 贺彪, 高文秀

陈栋胜, 李清泉, 涂伟, 曹瑞, 黄正东, 贺彪, 高文秀. 利用多源空间数据的城中村空间层次化识别方法[J]. 武汉大学学报 ( 信息科学版), 2023, 48(5): 784-792. DOI: 10.13203/j.whugis20200691
引用本文: 陈栋胜, 李清泉, 涂伟, 曹瑞, 黄正东, 贺彪, 高文秀. 利用多源空间数据的城中村空间层次化识别方法[J]. 武汉大学学报 ( 信息科学版), 2023, 48(5): 784-792. DOI: 10.13203/j.whugis20200691
CHEN Dongsheng, LI Qingquan, TU Wei, CAO Rui, HUANG Zhengdong, HE Biao, GAO Wenxiu. Hierarchical Spatial Recognition Method for Urban Villages by Integrating Multi-source Geospatial Data[J]. Geomatics and Information Science of Wuhan University, 2023, 48(5): 784-792. DOI: 10.13203/j.whugis20200691
Citation: CHEN Dongsheng, LI Qingquan, TU Wei, CAO Rui, HUANG Zhengdong, HE Biao, GAO Wenxiu. Hierarchical Spatial Recognition Method for Urban Villages by Integrating Multi-source Geospatial Data[J]. Geomatics and Information Science of Wuhan University, 2023, 48(5): 784-792. DOI: 10.13203/j.whugis20200691

利用多源空间数据的城中村空间层次化识别方法

基金项目: 

国家自然科学基金 42071360

深圳市基础研究重点项目 JCYJ20220818100200001

详细信息
    作者简介:

    陈栋胜,硕士, 研究方向为城市感知、多源时空大数据。dontsingchen@whu.edu.cn

    通讯作者:

    涂伟,博士,副教授。tuwei@szu.edu.cn

  • 中图分类号: TU984; P208

Hierarchical Spatial Recognition Method for Urban Villages by Integrating Multi-source Geospatial Data

  • 摘要: 城中村的精细空间分布是城市规划与城市更新的重要参考。由于城中村具有语义高级和遥感影像特征辨识度不足的特点,使用传统的场景识别方法难以从高密度城市中获得精度良好的城中村精细空间分布。针对城中村的精细识别问题,提出了一种新颖的融合遥感影像和社会感知的层次化识别方法。该方法在特征上融合了遥感图像和社会感知数据的优点,其层次化结构同时考虑了大范围的上下文信息和小范围的局部信息,为在精细尺度全面理解城中村提供了一个新思路。基于该方法对深圳市的城中村进行了空间识别,获得了2.5 m空间分辨率的精细城中村分布。精度验证表明,该结果的总体精度和Kappa系数分别达到98.68%和0.807,说明该方法具有优秀的表现。此外,还通过对照实验分别证明了层次化识别框架、融合遥感影像和社会感知数据的增益效果。结果表明,层次化框架和多源空间数据都能有效提高城中村识别方法的精度。
    Abstract:
      Objectives  The fine spatial distribution of urban villages is important for urban planning and urban renewal. However, since urban villages are high-level semantic geo-objects and have obscure remote sensing characteristics, it is difficult to obtain fine spatial distribution with good precision from high-density cities using traditional methods.
      Methods  We propose a novel hierarchical recognition method for urban villages that fuses remote sensing images and social sensing data to finely recognize the urban villages. The method combines the advantages of remote sensing images and social perception data in features. Large- and small-scale information are both considered into the process by using the hierarchical framework.
      Results  The method provides a new idea for a comprehensive understanding of urban villages at a fine scale. A case study has been implemented in Shenzhen. An urban village distribution with a spatial resolution of 2.5 m is obtained. The accuracy assessment shows that the overall accuracy and Kappa coefficient reach 98.68% and 0.807, respectively, indicating the excellent performance of the method. In addition, the gain effects of the hierarchical framework and the fusion of remote sensing images and social perception data are demonstrated, respectively.
      Conclusions  The results show that both the hierarchical framework and the multi-source spatial data are effective in improving the accuracy of the urban village recognition method.
  • 当代城市化进程不可避免地带来大量的非正式居住地[1-2]。而在中国,随着近30年来的快速城镇化发展,大型城市内衍生了很多城中村用地[3]。城中村的狭义定义是指在城市建成区内仍然实行村民自治和农村集体所有制的村庄[4],而广义概念则泛指由于缺乏统一规划的有效开发而具有内部建筑物小而拥挤、基础设施缺乏、治安隐患难以消除等问题,游离于现代城市管理之外、生活水平低下的居民区[5]。近年来,中国城市发展的主旨从增量开发转变为存量优化,城中村的精细空间分布成为城市更新和城中村改造的重要关注内容[6]。由于大型城市发展日新月异,城市用地快速更新,传统的土地实地调查方法已经不适用[7]。因此,发展在空间中高效识别出城中村精细空间分布的方法至关重要。

    然而,城中村的概念是人类基于生活经验总结得出的高级语义概念,具有遥感影像特征辨识度不够的特性,目前仍未有有效的指标能明确判断城中村[8-9]。融合遥感图像和社会感知数据为进一步判断城中村提供了思路。社会感知数据是指通过智能手机、物联网等技术捕获的具备人类活动特征的感知数据[10]。对比遥感图像,社会感知数据一方面具有丰富的人类活动、出行轨迹甚至人类情感信息,另一方面具有时间高动态性,能反映人类在不同时间对城市空间的偏好选择[11]。因此社会感知数据被认为是遥感数据的有效补充[12-14]。直觉上,城中村的人类社会特征与其他类型的居民居住区通常具有一定的差异。例如,城中村内往往分布着大量的生活类和餐饮类兴趣点(point of interest,POI)[12, 15-16]和频率较低的早出晚归型的出租车活动特征[16-18]。因此,在遥感影像特征基础上融合人类社会特征能为城中村识别方法提供更多参考证据。

    目前,基于大范围上下文信息的影像分类方法是最常用的遥感图像分类和识别方法[8-9]。基于大范围上下文信息的分类方法将整个区域而非区域中的某一个细节视作一个目标对象,如场景理解[19]、面向区域对象[20]。因此,实际上该方法将主要地物及其周边的地物(即上下文信息)一同转换为特征,并将其输入到分类器以提高分类的鲁棒性[7, 19, 21-22]。这些分类方法通常直接使用遥感影像特征区分各种地理区域,并能得到优秀的分类结果。近年的研究主要是在较粗的尺度下基于场景理解的方法实现城中村识别[7-8, 22]。由于城中村存在遥感影像特征辨识度不够的问题,机器需要足够宽阔的视角捕获足够多的上下文信息才能作出准确判断。因此,基于小范围信息的方法通常难以获得准确度较高的城中村识别结果,如超像素分类[23]、像素级分类[20]等方法。这意味着识别结果的空间精细度受到限制,即难以获取精细的城中村空间分布。因此核心问题在于,在面对城中村的遥感影像特征辨识度不够的背景下,如何获得城中村的精细空间分布。

    通过尺度效应带来的地理层次关系可以进一步挖掘城中村的精细识别的可能性。地理现象具有随着空间尺度的变化而变化的层次特性[24-25],这意味着不同空间尺度的地理现象在另一种空间尺度上可能会表现为另一种现象。从地理对象的角度,城中村地区在粗尺度的视角下一般表现为连绵成片的居住区,而在精细尺度的视角下则通常表现为密集的小型建筑楼,城中村在两层尺度下的表现差异映射了尺度效应带来的地理层次关系[26-27]。在城中村识别领域,可以通过两层视角的信息差异来表达地理层次关系。在粗尺度下的大范围视角能显示更多的邻域地物,进而捕获丰富的上下文信息,而在精细尺度下的小范围视角则专注于城中村内部密集分布的建筑物信息和少量的植被、不透水面信息,两种信息以层次的结构整合,以反映城中村在不同尺度之间的地理层次关系[28]。表达城中村的地理层次关系,能为机器分类提供不同空间尺度下的不同参考信息以理解城中村[15, 21],从而探索实现识别城中村的精细分布。

    据此,本研究提出了一个基于多源空间数据的城中村精细空间分布的层次化识别方法。首先从遥感图像和社会感知数据中提取出多源空间特征;然后在粗尺度下基于大范围的上下文信息对城市环境进行粗识别,获得潜在城中村区域;最后在精细尺度下基于小范围的局部信息对潜在城中村区域进行精细识别,从而获得城中村的精细空间分布。该方法在特征上融合了遥感图像和社会感知数据的优点,其层次化结构能同时考虑上下文信息和局部信息。基于该方法获得的城中村空间分布具有精细的空间分辨率和优秀的准确度,能为城市功能划分、城中村改造等城市更新研究提供参考。

    本文研究区域是深圳市,位于中国南部珠三角北部(113°46′E~114°37′E,22°27′N~22°52′N),见图 1。深圳市总面积为1 996.850 km2,下辖10个行政区。其中,福田区、罗湖区属于深圳市“关内”经济特区的两个县级行政区,是深圳市经济发展水平最高的两个区域,在2018年,两者的国内生产总值(gross domestic product,GDP)之和占深圳市总GDP的25.89%(http://tjj.sz.gov.cn/)。深圳市是世界级城市群——粤港澳大湾区的核心城市之一,拥有超过1 300万的人口、复杂的城市土地利用格局、日新月异的城市更新速度,而城中村及其带来的影响是深圳市存在已久的社会问题[5]。在本文中,专家参考《深圳市城市更新“十三五”规划》等城市规划资料、遥感图像和街景地图,通过目视解译手动划定城中村的参考区域。

    图  1  深圳市福田-罗湖中心城区图
    Figure  1.  Downtown Area Map of Futian-Luohu District in Shenzhen

    本文使用的多源空间数据主要包括遥感影像和社会感知数据两大类,其中社会感知数据包含POI和时序出租车轨迹数据。

    1)本文使用的遥感图像由多张多光谱和全色SPOT-5图像拼接合成,覆盖了深圳市福田区、罗湖区的一个11 km×11 km的实验区域(图 1)。SPOT-5图像于2013年11月30日采集,合成后图像的空间分辨率为每像素2.5 m和37 368×19 440像素,具有蓝、绿、红、近红外4个光谱通道。

    2)POI是记录了在实际地理空间的地理信息点数据。本文所使用的POI数据来源于高德地图(map.amap.com)。通过网络爬虫和地图网站的网络应用程序开发端口,本文抓取了深圳市2015年的211 076条POI数据。

    3)出租车轨迹数据源自深圳市交通运输局,能有效反映城市居民的出租车出行活动规律[16, 29]。本文使用深圳市2016-01-01—2016-06-30共181日的出租车轨迹数据(总共35 546 005条记录)来提取研究区域的居民出租车出行的历史时空规律。

    本文提出的基于多源空间数据的层次化识别城中村区域方法的具体流程如图 2所示。首先,对多源空间数据进行预处理,获得多源空间特征,以多维度地表征城中村;然后,在粗尺度下基于大范围的上下文信息对城市环境进行粗识别,获得潜在城中村区域;最后,在精细尺度下基于小范围的局部信息对潜在城中村区域进行精细识别,从而获得城中村的精细空间分布。

    图  2  基于多源空间数据的城中村层次化识别方法流程图
    Figure  2.  Flowchart of Hierarchical Spatial Recognition Method by Integrating Multi-source Geospatial Data

    对多源空间数据进行预处理,为后续两步提供多个角度,以全面描述城中村。本文分别从遥感图像和社会感知数据中提取遥感影像特征和社会感知特征。

    1)遥感图像。遥感基本影像特征包括光谱特征、纹理特征和结构特征,是遥感图像分类和识别的基本特征,被广泛应用于地物分类和识别研究。

    光谱特征:假定一幅遥感图像包含n个通道,计算其光谱特征,包括均值和标准差,那么光谱特征可以表示为$ [{a}_{1}, {b}_{1}, {a}_{2}, {b}_{2}, \dots , {a}_{n}, {b}_{n}] $,本文使用的遥感图像包含4个通道,因此光谱特征共8维。

    纹理特征:本文使用灰度共生矩阵(gray-level co-occurrence matrix,GLCM)来表述纹理特征。计算每一个像素的4种GLCM统计值:contrast,energy,correlation和homogeneity。纹理特征表示为[$ {c}_{1}, {d}_{1}, {e}_{1}, {f}_{1}, $$ {c}_{2}, {d}_{2}, {e}_{2}, {f}_{2}, $…$ , {c}_{n}, {d}_{n}, {e}_{n}, {f}_{n} $],共有16维。

    结构特征:尺度不变特征变换(scale-invariant feature transform,SIFT)特征被广泛运用于表述图像的结构特征。利用SIFT算法可识别图像中的结构关键点,并生成128维特征向量。而Dense-SIFT则是将目标图像分成相同大小的矩形块,再计算每个小块的SIFT特征,并对小块进行采样,提取出像素级特征。本文基于Dense-SIFT方法提取结构特征,并将其表达为$ [{g}_{1}, {g}_{2}, \dots , {g}_{128}] $。

    另外,深度卷积特征在图像理解中的有效性已被证明。而VGG-Net(visual geometry group very deep convolutional networks)具有简洁、实用的结构,在图像分类和目标检测任务中都有非常好的表现,是比较通用的卷积神经网络。而预训练的VGG-Net可被直接用于图像特征提取,用于进一步的机器学习。为了提取遥感图像中的深度卷积特征,本文使用预训练后的VGG16模型处理遥感图像。VGG16具有16层结构,包括13个卷积层和3个全连接层。利用13个卷积层提取图像特征,并经过全局池化,最终提取出512维特征,因此在本文中遥感图像的深度卷积特征可表达为$ [{h}_{1}, {h}_{2}, \dots , {h}_{512}] $。

    2)POI数据。POI反映了一个区域的各种城市功能设施,通过不同功能的POI组合能有效地推理区域的城市功能属性[12, 15-16]。城中村低廉的铺租往往能吸引大量的小商铺和低收入人群,因此城中村通常分布着大量生活类和餐饮类的POI[30]。将这些信息分类合并成20类,对每一类POI进行空间点密度分析,得到任意一个地方的区域功能组合序列$ [{i}_{1}, {i}_{2}, \dots , {i}_{20}] $,共20维。

    3)出租车轨迹数据。出租车轨迹数据反映了居民乘坐出租车出行的时间规律,常被应用于城市功能区识别的研究[16-18]。城中村是居住区的特殊类别,此地的居民乘坐出租车出行的活动特征通常也跟其他居民区具有差异。住在城中村的大部分居民会在早高峰出发上班,晚高峰回家,但他们的收入水平通常更低,所以他们可能会更多地选择拼车或者其他更便宜的公共交通。因此,城中村往往具有频率较低的早出晚归型的出租车活动特征[16, 27, 30]。首先,从出租车轨迹中提取出起讫点(origin-destination,OD),并在时间上按照工作日和休息日将OD点分成两组;然后,按照OD点的时间戳以1 h为间隔进行分组,叠置成24 h的$ O $图层和$ D $图层,接着在空间上对OD图层进行点密度分析,获得OD点密度像素图层;最终得到工作日和休息日$ O $点和$ D $点的日均密度时间序列[Ow1Ow2,…,Ow24,…,Or1Or2,…,Or24]、[Dw1Dw2,…,Dw24,…,Dr1Dr2,…,Dr24],共96维。

    基于上述特征,根据识别尺度的需要,分别设置区域对象图层/滑动窗口,以提取该对象/像素对应的特征。针对粗尺度识别,特征提取将在区域分割的面向对象图层内进行。以一个区域对象内的遥感图像为一个整体,计算其整体的光谱、纹理和深度卷积特征。而对于Dense-SIFT图层、POI点密度图层和出租车OD点密度图层等像素图层,本文通过计算均值的方法提取出区域对象的遥感图像结构特征、区域功能组合特征和出租车出行活动特征;对于精细尺度识别,特征提取则在滑动窗口内进行。同样,以滑动窗口内的遥感图像为整体,计算光谱、纹理和深度卷积特征,通过计算均值的方法提取遥感图像结构特征、区域功能组合特征和出租车出行活动特征,并将上述特征赋到滑动窗口的中心像素。

    本文使用基于遥感影像的多尺度分割方法进行区域分割。该算法是一种被广泛应用于遥感图像分割领域的经典分割算法[31]。多尺度分割方法保证图像对象的异质性最小,异质性由对象的颜色和形状决定。其公式如下:

    $$ f={w}_{\mathrm{c}\mathrm{o}\mathrm{l}\mathrm{o}\mathrm{r}}\mathrm{\Delta }{h}_{\mathrm{c}\mathrm{o}\mathrm{l}\mathrm{o}\mathrm{r}}+{w}_{\mathrm{s}\mathrm{h}\mathrm{a}\mathrm{p}\mathrm{e}}\mathrm{\Delta }{h}_{\mathrm{s}\mathrm{h}\mathrm{a}\mathrm{p}\mathrm{e}} $$ (1)

    式中,$ \mathrm{\Delta }{h}_{\mathrm{c}\mathrm{o}\mathrm{l}\mathrm{o}\mathrm{r}} $和$ \mathrm{\Delta }{h}_{\mathrm{s}\mathrm{h}\mathrm{a}\mathrm{p}\mathrm{e}} $分别为对象之间的光谱异质性差和形状异质性差;$ {w}_{\mathrm{c}\mathrm{o}\mathrm{l}\mathrm{o}\mathrm{r}} $和$ {w}_{\mathrm{s}\mathrm{h}\mathrm{a}\mathrm{p}\mathrm{e}} $分别代表光谱异质性和形状异质性的权重,两者相加为1。基于多尺度分割方法,本文获取面向对象图层,并提取其对应的区域多源地理空间特征。

    接下来,基于区域分割得出的对象进行潜在城中村区域识别。首先要对包含大量维度的特征进行降维,例如128维的SIFT特征、96维的出租车活动特征和512维的深度卷积特征。根据前人研究和本文实验,使用CFS(correlation-based feature subset selection)算法进行特征降维处理[32]。CFS算法通过考虑每个特征的个体预测能力以及它们之间的冗余度来评估属性子集的值,被广泛应用于降维处理[32-33]。使用随机森林分类器进行潜在城中村区域分类。前人研究表明,随机森林分类器是避免过度拟合并解决非线性高维问题的最佳分类器[34],因此被广泛应用于土地利用分类、城市功能区识别等研究领域[7]

    本文基于精细尺度的局部信息,通过像素级分类的方式识别城中村像素。首先提取精细尺度局部信息的特征。使用§2.1中的滑动窗口方法提取窗口的局部多源地理空间特征,并将特征赋值给中心像素。然后同样使用CFS算法对多源空间特征进行降维,最后使用随机森林方法对像素进行分类,以判断每个像素是否属于城中村像素。

    像素级分类容易得到带有椒盐噪声和不规则边缘的分类结果,不符合形状规则具有参考价值的城中村地块的需求。因此,本文使用数学形态学方法对提取的城中村像素结果进行修饰,将城中村像素(点)优化成城中村区域(面)。数学形态学方法主要被用于获取目标对象最为本质的形状特征[35]。本文使用的数学形态学方法有开运算、闭运算。其中,开运算可以消除小尺寸的目标和细小的突出部分,从而分离出目标区域;闭运算可以填补目标区域内部的小尺寸孔洞和细窄的缺口,从而使目标区域变得连通。公式如下:

    $$ I\circ {S}_{E}=\left(I \circleddash {S}_{E}\right) \oplus{S}_{E} $$ (2)
    $$ I·{S}_{E}=\left(I \oplus{S}_{E}\right)\circleddash {S}_{E} $$ (3)

    式中,I和$ {S}_{E} $分别代表二值图像、形态学结构元素;$ ·\mathrm{、}\circ \mathrm{、}\circleddash \mathrm{、}\oplus $分别代表闭运算操作、开运算操作、腐蚀操作和膨胀操作。

    本文使用总体精度、Kappa系数、错判误差、漏判误差进行精度评估。假定$ {T}_{P} $、$ {T}_{N} $、$ {F}_{P} $、$ {F}_{N} $分别代表混淆矩阵中真正例、真负例、假正例、假负例的数量,$ n\mathrm{、}N $分别代表类的数量和样本总数量。那么总体精度可表示为:

    $$ {p}_{0}={T}_{P}/N $$ (4)

    Kappa系数可表示为:

    $$ K=\frac{{p}_{0}-{p}_{e}}{1-{p}_{e}} $$ (5)

    式中,

    $$ {p}_{e}=\frac{({T}_{P}+{T}_{N})({T}_{P}+{F}_{N})+({F}_{N}+{T}_{N})({F}_{P}+{T}_{N})}{{N}^{2}} $$

    错判误差可表示为:

    $$ {O}_{m}=1-\frac{{T}_{P}}{{T}_{P}+{F}_{P}} $$ (6)

    漏判误差可表示为:

    $$ {C}_{m}=1-\frac{{T}_{P}}{{T}_{P}+{F}_{N}} $$ (7)

    本文通过C++实现城中村识别方法,通过PyTorch框架实现VGG-Net深度卷积特征的识别。根据经验实验,使用150×150的矩形窗口对POI数据、出租车OD数据进行点密度分析,基于150×150的滑动窗口提取像素级局部空间特征。另外,受限于VGG-Net模型对输入图像大小的要求,设置64×64的滑动窗口来提取深度卷积特征。实验区域为11 km× 11 km的矩形典型区域,区域内的参考城中村区域由专家基于遥感图像、实地调查和街景图像通过目视解译手动划分得出。本文通过分层随机抽样方法选取训练样本,而测试样本则根据城中村的参考区域进行划分。在粗识别步骤,选取覆盖90%以上城中村土地的对象为正城中村样本,不包含任何城中村土地的对象为非城中村样本。在精细识别步骤,选择纯净像元作为训练样本。各步骤的样本设置如表 1所示。

    表  1  样本设置
    Table  1.  Configuration of Samples
    步骤 城中村 非城中村
    训练对象数量 测试对象数量 训练对象数量 测试对象数量
    粗识别 50 211 50 600
    精细识别 6 194 800 850 5 879 20 841 992
    下载: 导出CSV 
    | 显示表格

    在实验区域中,应用本文方法识别出的城中村的整体结果如图 3所示。精度评估指标表明,该方法具有优秀的表现,其中,Kappa系数达到0.807,总体精度达到98.68%。另外,错判误差较低,只有0.161,但漏判误差达到0.210。结合空间分布图可以发现,该方法在大片城中村区域的识别中表现较好,但在一些较小的城中村区域的识别中容易出现漏判的情况。总体来看,该方法在高密度城市中识别语义高级、边界模糊的城中村地物时具有优秀的表现。

    图  3  城中村识别总体结果
    Figure  3.  Overall Result of Urban Village Recognition in the Study Area

    通过设置基准实验探索本文方法的表现。分别在粗识别和精细识别的过程中设置了两组基准方法作为对照组,包括基于多源空间特征的支持向量机(support vector machine,SVM)模型、基于常用遥感特征的随机森林模型。SVM作为最优秀的二分机器学习模型之一,和随机森林分类器一样被广泛应用于分类、识别等任务。在传统的遥感分类研究中,遥感影像的光谱特征、纹理特征和SIFT特征是常用的遥感特征,被广泛应用于土地利用分类和城市功能区识别任务。

    表 2对比了使用不同方法得到的结果的精度。在粗识别步骤中,本文方法的Kappa系数和总体精度比基于多源空间特征的SVM模型的精度分别提高了0.017和0.86%,比基于常用遥感特征的随机森林模型的精度分别提高了0.074和1.39%。在精细识别步骤中,本文方法的Kappa系数和总体精度比基于多源空间特征的SVM模型的精度分别提高了0.020和0.17%,比基于常用遥感特征的随机森林模型的精度分别提高了0.077和0.47%。无论在面向对象分类还是像素级分类,SVM的分类表现很优秀,但随机森林的表现略胜一筹。而多源空间特征的效果则比常用遥感特征优秀不少。

    表  2  基于多源空间特征的随机森林方法与基准方法的精度统计
    Table  2.  Accuracy Statistics of the Results Obtained by the Hierarchical Spatial Recognition Method Integrated Multi-source Geospatial Data and Baseline Methods
    步骤 方法 Kappa系数 总体精度/%
    粗识别 基于常用遥感特征的随机森林模型 0.784 93.43
    基于多源空间特征的SVM模型 0.841 93.96
    本文方法 0.858 94.82
    精细识别 基于常用遥感特征的随机森林模型 0.730 98.21
    基于多源空间特征的SVM模型 0.787 98.51
    本文方法 0.807 98.68
    下载: 导出CSV 
    | 显示表格

    本文使用“层次化”框架有机地结合目标识别中的自上而下和自下而上两种识别思路,考虑由粗尺度到精尺度的不同信息,以改进城中村识别效果。受到尺度效应的影响,地物在不同尺度下表征的特征不同。而层次化框架是一种模拟人类层次认知目标过程的框架。由粗尺度到精细尺度探索城中村的特性,符合人类认知城中村的过程。本文设置了一组对照实验,在相同的输入特征条件下,一组使用的是基于层次化框架的两步识别方法,另一组使用的是基于随机森林的像素级一步分类方法,分别计算其精度。

    表 3表明,结合了自上而下和自下而上信息的层次化识别方法有效提高了城中村识别的精度。本文方法的Kappa系数和总体精度分别提高了0.122和1.22%。另外,错判误差降低了0.249,说明粗识别有效地排除了大部分干扰地物,精细识别能专注于区分城中村及其周边地物,从而具有更低的错判误差。

    表  3  使用层次化识别框架与否的识别精度统计
    Table  3.  Accuracy Statistics of the Methods Using Hierarchical Identification Framework or Not
    指标 本文方法 通用像素级分类
    Kappa系数 0.807 0.685
    总体精度/% 98.68 97.46
    漏判误差 0.210 0.147
    错判误差 0.161 0.410
    下载: 导出CSV 
    | 显示表格

    本文粗识别步骤、精细识别步骤各设置了3组实验:第一组为遥感影像特征,包括基于遥感图像的光谱、纹理、结构特征和基于VGG-Net的深度卷积特征;第二组为基于社会感知数据的人类活动特征,包括POI数据的地方语义特征和出租车轨迹数据的出租车出行活动特征;第三组为融合遥感影像数据和社会感知数据的多源空间特征。

    本文对不同类型的数据特征进行分组并计算其结果的精度(表 4)。在粗识别步骤,只使用人类感知特征的Kappa系数和总体精度都低于只使用遥感图像特征,说明城中村的遥感特征比人类感知特征更具辨识度。但是集合了遥感图像特征和人类活动特征的结果则优于只使用遥感图像特征的结果。

    表  4  不同输入特征的识别精度统计
    Table  4.  Recognition Accuracy Statistics of the Results Produced by Different Input Features
    步骤 指标 遥感图像特征 人类活动特征 多源空间特征
    粗识别 Kappa系数 0.814 0.765 0.858
    总体精度/% 93.22 90.63 94.83
    精细识别 Kappa系数 0.769 0.593 0.807
    总体精度/% 98.45 96.85 98.68
    下载: 导出CSV 
    | 显示表格

    在精细识别步骤中,只使用人类活动特征的实验组具有最低的精度。只使用遥感图像特征的结果很优秀,Kappa系数和总体精度分别达到0.769和98.45%,仅与使用多源空间特征的结果相差0.038和0.23%。因此,遥感图像特征在像素级分类中具有更优秀的表现,第三组基于多源空间特征的结果精度最高。

    城中村已成为城市更新的重要研究内容。近年来,基于遥感图像的大范围上下文信息的城中村场景识别方法取得了一定的进展。然而,城中村的遥感影像特征辨识度不够的问题使得该方法无法被应用于大尺度的精细空间分布识别。基于多源空间数据和地理层次关系,本文提出了一种城中村精细分布的识别方法。这种方法代表了一种新的尝试,它可以充分组合不同尺度、不同维度的信息,更全面地描述城中村这一高级语义地物。在深圳市实验区域进行的实验表明,该方法行之有效,Kappa系数达到0.807。这张空间分辨率为2.5 m的城中村分布图可以为城市规划研究者提供更全面和更多细节信息,并为未来的城市更新决策提供有用的参考。

    未来,本文将进一步改进研究方法,以取得更好的应用,例如,尝试在世界其他类型的非正式居住地中应用该方法,并对比其效果,如印度、巴西的贫民窟。受限于研究区的数据,本文只讨论了该方法在深圳市福田-罗湖中心城区的城中村类型识别效果,未来将收集更多数据以探索更多类型的非正式居住地识别方法的差异。

    总的来说,本文提出了一种基于多源空间数据的层次化的识别城中村区域新方法。后续将更多地考虑添加更多尺度的地物信息和多源空间数据融合的模型,以进一步完善层次化的识别框架,同时将在更多应用场景中测试这种方法的可行性和优势。

  • 图  1   深圳市福田-罗湖中心城区图

    Figure  1.   Downtown Area Map of Futian-Luohu District in Shenzhen

    图  2   基于多源空间数据的城中村层次化识别方法流程图

    Figure  2.   Flowchart of Hierarchical Spatial Recognition Method by Integrating Multi-source Geospatial Data

    图  3   城中村识别总体结果

    Figure  3.   Overall Result of Urban Village Recognition in the Study Area

    表  1   样本设置

    Table  1   Configuration of Samples

    步骤 城中村 非城中村
    训练对象数量 测试对象数量 训练对象数量 测试对象数量
    粗识别 50 211 50 600
    精细识别 6 194 800 850 5 879 20 841 992
    下载: 导出CSV

    表  2   基于多源空间特征的随机森林方法与基准方法的精度统计

    Table  2   Accuracy Statistics of the Results Obtained by the Hierarchical Spatial Recognition Method Integrated Multi-source Geospatial Data and Baseline Methods

    步骤 方法 Kappa系数 总体精度/%
    粗识别 基于常用遥感特征的随机森林模型 0.784 93.43
    基于多源空间特征的SVM模型 0.841 93.96
    本文方法 0.858 94.82
    精细识别 基于常用遥感特征的随机森林模型 0.730 98.21
    基于多源空间特征的SVM模型 0.787 98.51
    本文方法 0.807 98.68
    下载: 导出CSV

    表  3   使用层次化识别框架与否的识别精度统计

    Table  3   Accuracy Statistics of the Methods Using Hierarchical Identification Framework or Not

    指标 本文方法 通用像素级分类
    Kappa系数 0.807 0.685
    总体精度/% 98.68 97.46
    漏判误差 0.210 0.147
    错判误差 0.161 0.410
    下载: 导出CSV

    表  4   不同输入特征的识别精度统计

    Table  4   Recognition Accuracy Statistics of the Results Produced by Different Input Features

    步骤 指标 遥感图像特征 人类活动特征 多源空间特征
    粗识别 Kappa系数 0.814 0.765 0.858
    总体精度/% 93.22 90.63 94.83
    精细识别 Kappa系数 0.769 0.593 0.807
    总体精度/% 98.45 96.85 98.68
    下载: 导出CSV
  • [1] 赵静, 薛德升, 闫小培. 国外非正规聚落的改造模式与借鉴[J]. 规划师, 2009, 25(1): 80-84. https://www.cnki.com.cn/Article/CJFDTOTAL-GHSI200901026.htm

    Zhao Jing, Xue Desheng, Yan Xiaopei. The Models of Informal Settlements Upgrading Abroad and Implications for China[J]. Planners, 2009, 25(1): 80-84 https://www.cnki.com.cn/Article/CJFDTOTAL-GHSI200901026.htm

    [2]

    Gallaher C M, Kerr J M, Njenga M, et al. Urban Agriculture, Social Capital, and Food Security in the Kibera Slums of Nairobi, Kenya[J]. Agriculture and Human Values, 2013, 30(3): 389-404. doi: 10.1007/s10460-013-9425-y

    [3]

    Li Z G, Wu F L. Residential Satisfaction in China's Informal Settlements: A Case Study of Beijing, Shanghai, and Guangzhou[J]. Urban Geography, 2013, 34(7): 923-949. doi: 10.1080/02723638.2013.778694

    [4] 李培林. 巨变: 村落的终结: 都市里的村庄研究[J]. 中国社会科学, 2002(1): 168-179. https://www.cnki.com.cn/Article/CJFDTOTAL-ZSHK200201015.htm

    Li Peilin. Tremendous Changes: The End of Villages: A Study of Villages in the Center of Guangzhou City[J]. Social Sciences in China, 2002(1): 168-179 https://www.cnki.com.cn/Article/CJFDTOTAL-ZSHK200201015.htm

    [5] 仝德, 冯长春. 国内外城中村研究进展及展望[J]. 人文地理, 2009, 24(6): 29-35. doi: 10.13959/j.issn.1003-2398.2009.06.009

    Tong De, Feng Changchun. Review and Progress of the Research on Urban Villages[J]. Human Geography, 2009, 24(6): 29-35 doi: 10.13959/j.issn.1003-2398.2009.06.009

    [6] 魏立华, 闫小培. "城中村": 存续前提下的转型: 兼论"城中村"改造的可行性模式[J]. 城市规划, 2005, 29(7): 9-13. doi: 10.3321/j.issn:1002-1329.2005.07.002

    Wei Lihua, Yan Xiaopei. Transformation of "Urban Village" and Feasible Mode[J]. City Planning Review, 2005, 29(7): 9-13 doi: 10.3321/j.issn:1002-1329.2005.07.002

    [7]

    Huang X, Liu H, Zhang L. Spatiotemporal Detection and Analysis of Urban Villages in Mega City Regions of China Using High-Resolution Remotely Sensed Imagery [J]. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(7): 3639-3657. doi: 10.1109/TGRS.2014.2380779

    [8]

    Mahabir R, Croitoru A, Crooks A, et al. A Critical Review of High and very High-Resolution Remote Sensing Approaches for Detecting and Mapping Slums: Trends, Challenges and Emerging Opportunities[J]. Urban Science, 2018, 2(1): 8. doi: 10.3390/urbansci2010008

    [9]

    Kuffer M, Pfeffer K, Sliuzas R. Slums from Space: 15 Years of Slum Mapping Using Remote Sensing[J]. Remote Sensing, 2016, 8(6): 455. doi: 10.3390/rs8060455

    [10]

    Liu Y, Liu X, Gao S, et al. Social Sensing: A New Approach to Understanding our Socioeconomic Environments[J]. Annals of the Association of American Geographers, 2015, 105(3): 512-530. doi: 10.1080/00045608.2015.1018773

    [11] 刘瑜, 詹朝晖, 朱递, 等. 集成多源地理大数据感知城市空间分异格局[J]. 武汉大学学报(信息科学版), 2018, 43(3): 327-335. doi: 10.13203/j.whugis20170383

    Liu Yu, Zhan Zhaohui, Zhu Di, et al. Incorporating Multi-source Big Geo-Data to Sense Spatial Heterogeneity Patterns in an Urban Space[J]. Geomatics and Information Science of Wuhan University, 2018, 43(3): 327-335 doi: 10.13203/j.whugis20170383

    [12] 涂伟, 曹劲舟, 高琦丽, 等. 融合多源时空大数据感知城市动态[J]. 武汉大学学报(信息科学版), 2020, 45(12): 1875-1883. doi: 10.13203/j.whugis20200535

    Tu Wei, Cao Jinzhou, Gao Qili, et al. Sensing Urban Dynamics by Fusing Multi-sourced Spatiotemporal Big Data[J]. Geomatics and Information Science of Wuhan University, 2020, 45(12): 1875-1883 doi: 10.13203/j.whugis20200535

    [13]

    Cao R, Tu W, Yang C, et al. Deep Learning-Based Remote and Social Sensing Data Fusion for Urban Region Function Recognition[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 163: 82-97. doi: 10.1016/j.isprsjprs.2020.02.014

    [14]

    Chen Y, Liu X, Gao W, et al. Emerging Social Media Data on Measuring Urban Park Use[J]. Urban Forestry & Urban Greening, 2018, 31: 130-141.

    [15]

    Zhang X, Du S, Wang Q. Hierarchical Semantic Cognition for Urban Functional Zones with VHR Satellite Images and POI Data[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 132: 170-184. doi: 10.1016/j.isprsjprs.2017.09.007

    [16]

    Mou X, Cai F, Zhang X, et al. Urban Function Identification Based on POI and Taxi Trajectory Data[C]// The 3rd International Conference on Big Data Research, Cergy-Pontoise, France, 2019.

    [17]

    Chen Y, Liu X, Li X, et al. Delineating Urban Functional Areas with Building-Level Social Media Data: A Dynamic Time Warping (DTW) Distance Based k-Medoids Method[J]. Landscape and Urban Planning, 2017, 160: 48-60. doi: 10.1016/j.landurbplan.2016.12.001

    [18]

    Mao F, Ji M, Liu T. Mining Spatiotemporal Patterns of Urban Dwellers from Taxi Trajectory Data[J]. Frontiers of Earth Science, 2016, 10(2): 205-221. doi: 10.1007/s11707-015-0525-4

    [19]

    Chaib S, Liu H, Gu Y, et al. Deep Feature Fusion for VHR Remote Sensing Scene Classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(8): 4775-4784. doi: 10.1109/TGRS.2017.2700322

    [20]

    Belgiu M, Csillik O. Sentinel-2 Cropland Mapping Using Pixel-Based and Object-Based Time-Weighted Dynamic Time Warping Analysis[J]. Remote Sensing of Environment, 2018, 204: 509-523. doi: 10.1016/j.rse.2017.10.005

    [21]

    Farabet C, Couprie C, Najman L, et al. Learning Hierarchical Features for Scene Labeling[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(8): 1915-1929. doi: 10.1109/TPAMI.2012.231

    [22]

    Li Y, Huang X, Liu H. Unsupervised Deep Feature Learning for Urban Village Detection from High-Resolution Remote Sensing Images[J]. Photogrammetric Engineering & Remote Sensing, 2017, 83(8): 567-579.

    [23]

    Fang L, Li S, Kang X, et al. Spectral-Spatial Classification of Hyperspectral Images with a Superpixel-Based Discriminative Sparse Model[J]. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(8): 4186-4201. doi: 10.1109/TGRS.2015.2392755

    [24]

    Tu W, Zhang Y, Li Q, et al. Scale Effect on Fusing Remote Sensing and Human Sensing to Portray Urban Functions[J]. IEEE Geoscience and Remote Sensing Letters, 2021, 18(1): 38-42. doi: 10.1109/LGRS.2020.2965247

    [25] 李双成, 蔡运龙. 地理尺度转换若干问题的初步探讨[J]. 地理研究, 2005, 24(1): 11-18. https://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ200501001.htm

    Li Shuangcheng, Cai Yunlong. Some Scaling Issues of Geography[J]. Geographical Research, 2005, 24(1): 11-18 https://www.cnki.com.cn/Article/CJFDTOTAL-DLYJ200501001.htm

    [26] 张秀红, 陈迪, 刘纪平, 等. 结构化居民地群的多层次识别方法[J]. 武汉大学学报(信息科学版), 2018, 43(8): 1144-1151. doi: 10.13203/j.whugis20160239

    Zhang Xiuhong, Chen Di, Liu Jiping, et al. A Multilevel Identification Approach to Structured Building Clusters[J]. Geomatics and Information Science of Wuhan University, 2018, 43(8): 1144-1151 doi: 10.13203/j.whugis20160239

    [27] 姚尧, 张亚涛, 关庆锋, 等. 使用时序出租车轨迹识别多层次城市功能结构[J]. 武汉大学学报(信息科学版), 2019, 44(6): 875-884. doi: 10.13203/j.whugis20170111

    Yao Yao, Zhang Yatao, Guan Qingfeng, et al. Sensing Multi-level Urban Functional Structures by Using Time Series Taxi Trajectory Data[J]. Geomatics and Information Science of Wuhan University, 2019, 44(6): 875-884 doi: 10.13203/j.whugis20170111

    [28] 朱国宾. 面向多分辨率层次结构的遥感影像分析方法[J]. 武汉大学学报(信息科学版), 2003, 28(3): 315-320. http://ch.whu.edu.cn/article/id/4822

    Zhu Guobin. Remote Sensing Image Analysis Based on Hierarchical Multi-resolution Structures[J]. Geomatics and Information Science of Wuhan University, 2003, 28(3): 315-320 http://ch.whu.edu.cn/article/id/4822

    [29]

    Li Q, Tu W, Zhuo L. Reliable Rescue Routing Optimization for Urban Emergency Logistics Under Travel Time Uncertainty[J]. ISPRS International Journal of Geo-Information, 2018, 7(2): 77.

    [30] 谷岩岩, 焦利民, 董婷, 等. 基于多源数据的城市功能区识别及相互作用分析[J]. 武汉大学学报(信息科学版), 2018, 43(7): 1113-1121. doi: 10.13203/j.whugis20160192

    Gu Yanyan, Jiao Limin, Dong Ting, et al. Spatial Distribution and Interaction Analysis of Urban Functional Areas Based on Multi-source Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(7): 1113-1121 doi: 10.13203/j.whugis20160192

    [31]

    Chen Y, Chen Q, Jing C. Multi-resolution Segmentation Parameters Optimization and Evaluation for VHR Remote Sensing Image Based on mean NSQI and Discrepancy Measure[J]. Journal of Spatial Science, 2021, 66(2): 253-278.

    [32]

    Singh S, Singh A K. Correlation-Based Feature Subset Selection Technique for Web Spam Classification[J]. International Journal of Web Engineering and Technology, 2018, 13(4): 363–379.

    [33]

    Bunker R P, Thabtah F. A Machine Learning Framework for Sport Result Prediction[J]. Applied Computing and Informatics, 2019, 15(1): 27-33.

    [34]

    Delgado M F, Cernadas E, Barro S, et al. Do We Need Hundreds of Classifiers to Solve Real World Classification Problems?[J]. Journal of Machine Learning Research, 2014, 15(1): 3133-3181.

    [35]

    Gavankar N, Ghosh S. Automatic Building Footprint Extraction from High-Resolution Satellite Im‍age Us‍ing Mathematical Morphology [J]. European Journal of Remote Sensing, 2018, 51(1): 182-193.

  • 期刊类型引用(5)

    1. 关学勤,周大伟,陆烨,邓春林. 多源数据耦合下城中村用地空间识别研究. 特区经济. 2025(02): 34-38 . 百度学术
    2. 阚德广,赵盘山. 基于空间信息处理技术的多源城市规划数据融合与集成. 智能城市. 2024(07): 78-80 . 百度学术
    3. 贺力,王融,林泽正. 基于GIS空间数据和分析方法的城市更新研究:需求、现状与应用. 空间与社会评论. 2024(01): 242-263 . 百度学术
    4. 李杰文,康朝贵. 一种基于时空棱柱的乘车行程可拼性判断模型. 武汉大学学报(信息科学版). 2024(09): 1702-1711 . 百度学术
    5. 刘雪俊,蒋凤钗,胡晓彤. “以图驱动”思路下的自然资源数据治理与应用. 地理空间信息. 2022(08): 1-3 . 百度学术

    其他类型引用(4)

图(3)  /  表(4)
计量
  • 文章访问数:  626
  • HTML全文浏览量:  126
  • PDF下载量:  156
  • 被引次数: 9
出版历程
  • 收稿日期:  2021-03-02
  • 网络出版日期:  2023-05-23
  • 发布日期:  2023-05-04

目录

/

返回文章
返回