留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种高分影像建筑区分块表示与合并提取方法

陈一祥 秦昆 胡忠文 曾诚

陈一祥, 秦昆, 胡忠文, 曾诚. 一种高分影像建筑区分块表示与合并提取方法[J]. 武汉大学学报 ● 信息科学版, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293
引用本文: 陈一祥, 秦昆, 胡忠文, 曾诚. 一种高分影像建筑区分块表示与合并提取方法[J]. 武汉大学学报 ● 信息科学版, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293
CHEN Yixiang, QIN Kun, HU Zhongwen, ZENG Cheng. Built-Up Area Extraction Based on Patch Representation and Merging for High-Resolution Satellite Images[J]. Geomatics and Information Science of Wuhan University, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293
Citation: CHEN Yixiang, QIN Kun, HU Zhongwen, ZENG Cheng. Built-Up Area Extraction Based on Patch Representation and Merging for High-Resolution Satellite Images[J]. Geomatics and Information Science of Wuhan University, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293

一种高分影像建筑区分块表示与合并提取方法

doi: 10.13203/j.whugis20170293
基金项目: 

国家自然科学基金 41501378

江苏省自然科学基金 BK20150835

四川省测绘地理信息科技项目 J2017ZC06

南京邮电大学引进人才科研启动基金 NY214196

详细信息
    作者简介:

    陈一祥, 博士, 讲师, 主要从事遥感图像处理与信息提取研究。chenyixiang@njupt.edu.cn

    通讯作者: 秦昆, 博士, 教授。qink@whu.edu.cn
  • 中图分类号: P237

Built-Up Area Extraction Based on Patch Representation and Merging for High-Resolution Satellite Images

Funds: 

The National Natural Science Foundation of China 41501378

the Natural Science Foundation of Jiangsu Pro-vince of China BK20150835

Geographic Information Science and Technology Program of Sichuan Province J2017ZC06

NUPTSF NY214196

More Information
    Author Bio:

    CHEN Yixiang, PhD, lecturer, specializes in remote sensing image processing and information extraction. E-mail: chenyixiang@njupt.edu.cn

    Corresponding author: QIN Kun, PhD, professor. E-mail: qink@whu.edu.cn
图(5) / 表(1)
计量
  • 文章访问数:  710
  • HTML全文浏览量:  129
  • PDF下载量:  100
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-08-23
  • 刊出日期:  2019-06-05

一种高分影像建筑区分块表示与合并提取方法

doi: 10.13203/j.whugis20170293
    基金项目:

    国家自然科学基金 41501378

    江苏省自然科学基金 BK20150835

    四川省测绘地理信息科技项目 J2017ZC06

    南京邮电大学引进人才科研启动基金 NY214196

    作者简介:

    陈一祥, 博士, 讲师, 主要从事遥感图像处理与信息提取研究。chenyixiang@njupt.edu.cn

    通讯作者: 秦昆, 博士, 教授。qink@whu.edu.cn
  • 中图分类号: P237

摘要: 建筑区是一种重要的人工地理要素,利用高分辨率卫星影像可以在更精细的尺度上获取建筑区信息。针对建筑区这类结构复杂、面积相对较大的地物类,提出一种分块表示与合并提取方法。首先,通过角点上下文约束来划分图像,并将获得的图像块作为影像处理的基本单元;然后,利用空间变异函数来建模每个图像块并提取特征描述参数,进一步通过主成分变换实现建筑区图像块的结构特征表示;最后,根据图像块空间结构特征的相似性实现建筑区的判别。实验结果表明,该方法能够有效实现高分影像建筑区的提取,并且对不同分辨率的高分影像表现出良好的适应性。

English Abstract

陈一祥, 秦昆, 胡忠文, 曾诚. 一种高分影像建筑区分块表示与合并提取方法[J]. 武汉大学学报 ● 信息科学版, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293
引用本文: 陈一祥, 秦昆, 胡忠文, 曾诚. 一种高分影像建筑区分块表示与合并提取方法[J]. 武汉大学学报 ● 信息科学版, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293
CHEN Yixiang, QIN Kun, HU Zhongwen, ZENG Cheng. Built-Up Area Extraction Based on Patch Representation and Merging for High-Resolution Satellite Images[J]. Geomatics and Information Science of Wuhan University, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293
Citation: CHEN Yixiang, QIN Kun, HU Zhongwen, ZENG Cheng. Built-Up Area Extraction Based on Patch Representation and Merging for High-Resolution Satellite Images[J]. Geomatics and Information Science of Wuhan University, 2019, 44(6): 908-916. doi: 10.13203/j.whugis20170293
  • 建筑区是地表典型的人工地理要素,它是指被建筑物覆盖的区域。利用高空间分辨率(以下简称高分)影像可以在更精细的尺度上获取建筑区信息。由于高分影像的光谱异质性及其对地物表示的不确定性,现有的建筑区提取更多是利用其空间纹理和结构特征,主要方法可以分为基于纹理特征的方法和基于结构特征的方法。

    基于纹理特征的方法将建筑区看成是一个纹理区域,其关键是对建筑区纹理特征进行有效的建模和描述,可用的方法包括灰度共生矩阵[1]、Gabor变换[2]、小波分解[3-6]和空间统计[7]等。单纯基于纹理的方法比较适合米级(比如2 m)以及更低分辨率的影像。对于亚米级的影像,建筑区内单个建筑物的几何结构已十分明显,仍将其看成纹理区域而采用传统的纹理特征描述方法将变得较为困难。

    基于结构特征的方法根据建筑物局部的点、线、面等几何结构特征以及它们在空间的聚集分布实现建筑区的判别,比如基于Gabor特征点[8]、角点[9-10]以及直角点和直线边[11-12]的高分影像城市区/居民区/建筑区提取方法。该类方法一般是通过计算局部特征点、线或面的分布密度,利用设定的阈值来实现建筑区的分割。由于仅根据局部结构特征在空间的聚集分布性来判别建筑区,在特征(比如角点)出现误检、漏检或稀疏分布时,会降低对建筑区的判别能力甚至导致模型失效。因此,需要利用更有效的特征或模型才能提高该类方法的性能。

    在处理方式方面,无论是基于纹理还是结构特征,目前主要还是基于像素的方法,这不仅会导致大的计算量,而且还会使得提取结果比较破碎,“椒盐噪声”严重,不利于进一步的矢量化处理。针对像素方法的不足,面向对象[4, 13]和基于块(block)[14]的方法分别被提出,其影像处理的基本单元是通过图像分割获得的同质“对象”或通过格网划分获得的规则“子块”,其优点是可以充分利用建筑区的空间特征。由于高分影像图像分割相对困难,基于块的方法比面向对象的方法更便于建筑区的表示和提取,对于大范围的影像还便于进行并行处理,提高计算效率。

    基于以上分析,本文针对建筑区这类结构复杂、面积相对较大的地物类,提出一种分块表示与合并提取方法。该方法基于建筑区特有的空间结构特性,利用角点和空间变异函数实现建筑区的分块表示,并根据空间结构特征的相似性将具有一定结构关系的重叠子块合并成完整的建筑区目标,实验表明该方法对多种分辨率的高分影像都具有良好的性能。

    • 基于块的方法是一种相对简单又极为高效的影像处理策略,特别适合于建筑区这类空间上大范围的地理对象。但目前的分块方法一般是对影像进行网格划分,以这种方式获得的子块具有一定的随机性,忽略了子块与子块之间的空间结构关系,不利于将其组织成完整的建筑区目标。为避免这些不足,本文提出一种利用角点约束的高分影像建筑区分块策略,基于该方法获得的子块具有一定重叠性,能够实现对建筑区的密集覆盖。

      角点是图像重要的点特征,高分影像中的角点能够很好地定位和表征建筑物的存在性,并且在建筑区域具有聚集分布的特点[9-10]。本文以影像中的角点为中心,定义大小为S(S=2r+1,r为半径)的上下文矩形区域(即图像块)作为影像处理的基本单元,如图 1(a)所示。通过调节图像块大小可使不同图像块在空间上具有重叠性,从而实现对影像相应区域的密集覆盖。图 1(b)为建筑区提取所对应的最佳图像块分布。

      图  1  角点约束的图像块划分及其分布

      Figure 1.  Image Patches Defined by Corners and Their Spatial Distribution

      但是,以该方式定义的图像块并不都属于建筑区,如图 1中的道路、农田等也存在角点,因此需要进一步的特征进行判定。为此,本文提出利用空间变异函数来建模每个图像块的空间结构特征,实现建筑区图像块的判别。

    • 空间变异函数(也叫空间变差函数)源于空间统计学,是建模区域化随机变量空间结构的有效数学工具,方向空间变异函数的表达式为[15]:

      $$ \gamma(h)=\frac{1}{2 N(h)} \sum\limits_{i=1}^{\mathit{N}(h)}\left[z\left(s_{i}+h\right)-z\left(s_{i}\right)\right]^{2} $$ (1)

      式中,z(si)为区域化变量z在位置si处的观测值;h为空间滞后向量;N(h)为空间滞后等于h的成对的观测位置的数目,i=1, 2…N(h)。考虑到建筑区内建筑物空间排列的多方向性,对每个图像块,使用全方向的空间变异函数来建模其空间结构特征,同时为减少计算量,以东—西、南—北、东南—西北和西南—东北4个方位的变异函数的平均值来代替全方向的变异函数值,具体计算方法如式(2)所示,这里j=1,2,3,4代表这4个方位。

      $$ \gamma(h)=\frac{1}{4} \sum\limits_{j=1}^{4} \gamma^{j}(h) $$ (2)

      高分影像中不同地物由于空间结构的不同使其具有不同的空间变异函数曲线。相比于其他地物类,建筑区由于丰富的纹理结构和规则的空间布局,其变异函数曲线的幅度(即空间变异的程度)相对更大,曲线的第一个极大值点对应的滞后距离(即变程)更长,曲线达到极大值后的变化模式呈现一定的周期性。由于建筑区图像块与其他地物类的图像块空间结构不同,因此其变异函数曲线也就不同,这是区分建筑区图像块与其他非建筑区图像块的依据。

    • 对每个图像块,空间变异函数曲线描述了其空间结构特性。通过对变异函数曲线进行参数化描述,可以实现对图像块的空间结构特征表示。结合文献[15]的工作,本文引入以下特征参数来表征每个图像块的空间结构特征(见图 2)。

      图  2  变异函数曲线

      Figure 2.  Semivariogram Curve

      1) 方差与第一滞后变异函数值的比值:

      $$ P_{1}=\operatorname{Var} / \gamma_{1} $$ (3)

      式中,Var为图像块灰度的方差。

      2) 原点附近的一阶差分:

      $$ P_{2}=\gamma_{2}-\gamma_{1} $$ (4)

      该参数描述了变异函数在原点附近的变化率。

      3) 第一极大变异函数值对应的滞后值:

      $$ P_{3}=h_{\max_{-}1} $$ (5)

      对于递增型变异函数曲线,hmax_1=hn

      该参数是对变异函数变程的近似,反映了像元空间相关的距离,即当像元的空间距离不超过变程时,则认为它们具有空间相关性,反之则认为它们不具有空间相关性。因而,该参数能够反映影像中地物对象或同质区的平均尺寸(即粒度)及其空间分布模式。

      4) 第一滞后值与第一极大滞后值之间的变异函数平均值:

      $$ P_{4}=\frac{1}{\max_{-}1} \sum\limits_{i=1}^{\max_{-}1} \gamma_{i} $$ (6)

      该参数集成了变异函数的变程以及变程范围内的空间变异性,是对影像中变程粒度下地物对象平均相关性或变异性的度量。

      5) P4与第一滞后变异函数值的差值:

      $$ P_{5}=P_{4}-\gamma_{1} $$ (7)

      该参数反映了影像中地物对象在变程范围内平均空间变异性的幅度变化。

    • §2.2定义的5个特征参数能够从不同的角度描述空间变异函数的曲线形态,但特征之间可能具有相关性,为了综合利用各特征并降低它们之间的相关性,利用主成分分析(principal component analysis,PCA)对原始特征进行特征变换。经PCA变换后,原始特征的主要信息集中在前几个主成分上,本文选择前3个主成分(分别记为PC1、PC2和PC3)来表征每个图像块。

    • 本文的建筑区提取算法具体实现过程如下:

      1) 基于Harris算子提取影像中的角点,以角点为中心定义大小为S×S的上下文图像块,对影像进行分块处理;计算每个图像块包含的角点数目,并将具有最大角点数目的图像块设置为建筑区基准块或样本块。

      2) 利用全方向的空间变异函数对每个图像块进行建模,并按照式(3)~(7)提取结构特征描述参数,获得图像块的特征表示矩阵X =(fik)n×5,这里fik代表第i个图像块的第k个特征参数值,n为角点数目,i=1, 2…nk=1, 2, 3, 4, 5。

      3) 对原始特征矩阵X进行主成分变换,变换后的矩阵记为Y =(gik)n×5,这里gik代表第i个图像块的第k个主成分值,i=1, 2…nk=1, 2, 3, 4, 5。

      4) 利用变换后的前3个主成分特征,对每个图像块进行分类判别,将其标记为建筑区和非建筑区。判别规则如下:如果第i个图像块的第k个主成分特征值gik与建筑区基准块的第k个主成分特征值gk满足下面的特征相似性关系式:

      $$ \left|1-\frac{g_{i k}}{g_{k}}\right| < T $$ (8)

      则将第i个图像块标记为建筑区,否则将其标记为非建筑区。其中,T为阈值参数,用于控制两个图像块特征相似或一致的程度。

      5) 将所有标记为建筑区的图像块取并集,获得初始的建筑区目标。

      此时提取的建筑区周围有时还会存在稀疏分布的离散噪声区域,而在其内部还会存在孔洞现象,前者造成建筑区的伪检,而后者导致建筑区的漏检,为此本文引入两个简单的面积阈值参数T1T2,实现噪声区域(面积小于T1)的去除和孔洞区域(面积小于T2)的填充。

      在以上过程中,利用每个主成分特征都可以实现建筑区的提取。通过实验可以发现对图像块分类判别有用的信息主要集中在前3个主成分上,并且每个主成分的性能对不同的影像是不一样的。本文通过对每个主成分的提取结果进行精度评估来确定建筑区提取的最终结果。

    • 为验证方法的有效性,实验选择2.1 m的资源三号(ZY-3)和0.61 m的QuickBird(QB)两种高分影像数据集进行评估。该数据集包含了17幅不同场景的建筑区影像,其中8幅为ZY-3影像,9幅为QB影像。每种传感器的影像都包含了平原、丘陵和复杂山区等多种地理场景。

      实验参数主要包括图像块尺寸S(S=2r+1)、相似性阈值T以及后处理参数T1T2。图像块大小S与影像的分辨率以及建筑物的尺寸密切相关,通过实验发现,对于ZY-3影像,r=7或8即S=15或17时,大部分影像可以达到最优或近似最优结果。对于QB影像,r的最优或近似最优值为13或14,即S=27或29。相似性阈值T用于刻画每个图像块与建筑区基准块的特征相似性程度。通过实验发现T=0.5,可符合大部分数据的要求。参数T1T2也与影像的分辨率有关,其设置相对容易,不需要很精确,对于ZY-3影像,T1=900,T2=1 800;对于QB影像,T1=3 400,T2=6 800,则大部分实验图像可获得较好的结果,部分图像可做适当调整。

      实验结果的定量评价选用常用的F-Measure指标,它综合考虑了查准率(P)和查全率(R)两方面的性能,其计算公式为F=2PR/(P+R),其中,P=[TP/(TP+FP)]×100%,R=[TP/(TP+FN)]×100%。这里TPFP分别为提取的建筑区是真实建筑区和非建筑区的像元数目,FN为提取的非建筑区是建筑区的像元数目。

      在以上参数设置下,对5个主成分特征分别进行了实验,提取结果的F-Measure值如表 1所示(第2~6列)。通过表 1可以发现,前3个主成分均表现出了较为优越的性能,特别是第1主成分(PC1)和第3主成分(PC3)表现更佳,并且对实验的所有数据性能相对稳定,而第2主成分尽管对大部分数据表现较好,但对个别影像(如ZY-3_2,ZY-3_4和ZY-3_6)表现出较大的波动性。比起前3个主成分,后面两个主成分(PC4和PC5)整体表现较差,并且波动性较大,仅对部分数据有效。

      表 1  建筑区提取精度评价结果

      Table 1.  Evaluation Results of Built-Up Area Extraction

      数据集 使用不同主成分(PC)特征的F-Measure值 累计贡献率
      PC1 PC2 PC3 PC4 PC5 PC1-3 PC1 PC1-3
      ZY-3_1 0.945 5 0.941 4 0.949 4 0.892 1 0.269 8 0.949 4 0.872 6 0.990 3
      ZY-3_2 0.896 5 0.391 8 0.895 8 0.854 9 0.803 5 0.896 5 0.882 4 0.992 3
      ZY-3_3 0.925 4 0.892 6 0.937 6 0.935 9 0.117 7 0.937 6 0.887 2 0.994 0
      ZY-3_4 0.942 0 0.484 7 0.945 2 0.922 1 0.766 6 0.945 2 0.898 5 0.993 9
      ZY-3_5 0.647 8 0.774 2 0.784 8 0.649 1 0.104 8 0.784 8 0.830 9 0.993 9
      ZY-3_6 0.734 1 0.415 6 0.791 1 0.613 9 0.464 4 0.791 1 0.879 7 0.995 6
      ZY-3_7 0.819 2 0.867 7 0.890 7 0.849 7 0.218 5 0.890 7 0.888 2 0.995 5
      ZY-3_8 0.804 0 0.815 8 0.831 2 0.759 7 0.017 3 0.831 2 0.858 1 0.994 1
      QB1 0.910 4 0.900 7 0.901 0 0.906 3 0.845 8 0.910 4 0.947 0 0.994 2
      QB2 0.925 9 0.851 7 0.861 3 0.848 8 0.712 1 0.925 9 0.965 8 0.995 2
      QB3 0.883 1 0.890 1 0.875 3 0.514 4 0.510 9 0.890 1 0.963 6 0.997 3
      QB4 0.914 9 0.958 0 0.921 2 0.921 2 0.923 6 0.958 0 0.911 8 0.987 6
      QB5 0.823 6 0.905 1 0.835 1 0.174 6 0.790 1 0.905 1 0.939 9 0.991 7
      QB6 0.903 0 0.906 2 0.932 9 0.837 1 0.916 8 0.932 9 0.866 7 0.992 2
      QB7 0.695 8 0.570 7 0.761 2 0.139 7 0.602 5 0.761 2 0.977 3 0.998 3
      QB8 0.692 9 0.723 1 0.791 0 0.211 8 0.498 7 0.791 0 0.952 3 0.995 5
      QB9 0.792 3 0.763 1 0.904 2 0.835 4 0.790 3 0.904 2 0.932 7 0.994 1

      以上事实说明,通过主成分变换,对建筑区判别有用的特征信息主要集中在前3个主成分上。表 1的最后两列给出了第1主成分以及前3个主成分的累计贡献率,可以看出第1主成分占据的信息量超过85%,而前3个主成分的信息量已经达到98%以上,后面2个主成分上的信息量已经很少,本文将其忽略,并融合前3个主成分特征进行判别,将F-Measure值最大的主成分对应的结果作为建筑区提取的最终结果,此时的提取结果如图 3图 4所示。可以看出,对于ZY-3和QB这两种不同传感器、不同地理场景的高分影像,建筑区自动提取结果已非常接近实况数据,这也表明本文方法的有效性。

      图  3  ZY-3影像建筑区提取实验结果

      Figure 3.  Built-Up Extraction Results for ZY-3 Images

      图  4  QuickBird影像建筑区提取实验结果

      Figure 4.  Built-Up Extraction Results for QuickBird Images

      为进一步评估本文方法的性能,在该数据集上将其与当前比较有代表性的建筑区提取方法进行了比较,包括文献[8]提出的利用局部特征点和空间投票的方法、文献[6]提出的BASI方法以及文献[14]提出的基于块的尺度空间表示法。F-Measure值比较结果如图 5中的柱状图所示,使用这些方法的建筑区提取结果如图 3图 4所示。

      图  5  本文方法与其他方法的F-Measure值比较

      Figure 5.  Comparison of F-Measure Values of Our Proposed Method with Others

      图 5(a)表明,本文的方法比文献[8]方法获得了更好的表现,特别是对ZY-3影像,本文的方法表现更为优越。主要原因在于文献[8]方法仅根据局部特征点的空间分布来对建筑区像素进行判别,对于分辨率相对较低的ZY-3影像,Gabor滤波器并不能有效获得建筑区特征点,最终导致建筑区的伪检或漏检。图 5(b)表明,对于ZY-3影像,本文的方法与文献[6]的BASI法具有十分接近的性能,但对于分辨率更高的QB影像,其表现不如本文方法,主要原因在于BASI算法在建模建筑区显著性时仅利用了纹理特征,并且采用的是基于像素的方法,对于2.1 m分辨率的ZY-3影像,建筑区可看成一个纹理对象,利用NSCT(nonsubsampled contourlet transform)可以有效实现建筑区的描述,但对于亚米级的影像(如QuickBird),建筑区内单个建筑物的几何结构已十分明显,基于像素的纹理的方法对建筑区的判别能力会随着分辨率的提高而降低。

      图 5(c)是本文方法与文献[14]方法的比较。文献[14]方法采用了基于块的多尺度表示,并且利用了纹理和结构特征,表现出了优越的性能。与本文方法相比,在ZY-3影像上,两者性能比较接近,但在QuickBird影像上(特别是山区),本文的方法仍然表现出相对更优的性能。主要原因在于尽管两者都利用了基于块的表示,但本文图像划分的重叠子块能更好地表征块与块之间的结构关系(即上下文信息),并且引入了基于变异函数的空间结构特征,提高了算法对影像分辨率变化以及场景复杂性的适应能力。

    • 本文提出一种利用空间结构特征的高分影像建筑区分块表示与合并提取方法,主要研究结论如下:

      1) 以角点为中心来划分图像块并将其作为影像处理的基本单元,便于建筑区的空间定位和特征表示,能够避免面向对象分割的困难以及基于像素方法的不足,并且通过调整块的大小,可以适应影像分辨率的变化,提高了算法的性能。

      2) 高分影像中建筑区具有特殊的空间结构特性,其空间变异函数曲线与其他地物类的具有不同的形态,通过对变异函数曲线进行参数化的描述并结合PCA变换,可以有效实现建筑区影像块空间结构的多特征集成和表示。

      但本文的方法也存在一些不足,需要进一步完善。

      1) 该方法中的参数图像块尺寸S(S=2r+1)与影像分辨率密切相关,对每种传感器的影像数据,本文通过实验获得了参数的最优或近似最优值,并将其作为经验值应用到其他数据,虽然对大部分数据总体上获得了较好的效果,但对一些建筑尺寸较大(如工业厂房)的区域,在该参数下效果可能并不理想。因此在考虑影像分辨率的同时顾及建筑对象尺寸的大小来自适应地调整参数是本文进一步要研究的问题。

      2) 由于影像处理的基本单元是利用角点划分的图像块,提取的建筑区边界可能会存在锯齿现象,通过进一步的平滑技术(如形态学开闭运算),轮廓边界还可以更精确。

参考文献 (15)

目录

    /

    返回文章
    返回