-
建筑物信息在地理信息系统数据更新、城市规划和数字城市建设等方面有着重要作用,研究快速、准确、自动化程度高的建筑物提取算法具有重要的意义。随着遥感影像分辨率的提高,地物细节得到清晰的描述,建筑物的结构越来越复杂,形状各式各样,建筑物所处的背景环境复杂多变,原有的利用单一特征或者多种特征融合的提取方法无法满足当前的需要。本文根据特征的属性,将遥感影像多尺度特性与地物特征相对应,研究多层次特征的建筑物提取方法。许多学者针对高分辨率遥感影像的建筑物提取,提出了各自的方法与模型,这些方法可归纳为3类:第一类方法基于建筑物矩形几何特点,此类方法容易受到影像边缘提取精度的影响;第二类方法是基于激光探测与测量 (light detection and ranging,LiDAR) 点云数据和遥感影像数据的方法,此类方法中的高程信息是提取建筑物的关键信息,但LiDAR数据不易获取,限制了该方法的应用;第三类方法是基于像斑的方法,该方法是目前常用的方法,但该方法存在“最优尺度”选择问题。如何选取“最优尺度”目前研究得还不多,这对提取像斑特征和建筑物提取精度有重要影响,成为此类方法发展的一个瓶颈[1-3]。
建筑物提取与模式识别领域中人脸、行人识别具有一定的相似性,本文根据模式识别领域中“输入样本-特征提取-特征训练-目标识别”的思想,寻求一种新型的高分辨率影像复杂建筑物提取方法,该提取思想避免了“最优尺度”选择问题。但是,模式识别中的目标识别与遥感影像中的建筑物提取具有一定的差异性,主要表现为两点:(1) 模式识别中训练样本是含有目标的图片,而遥感影像建筑物提取中的训练样本是像斑 (以面向对象方法为例),像斑具有同质性。而本文提出的方法采用的训练样本是图片,训练样本中除了含有目标外,还包含其他地物,则传统的多种特征融合方法在训练样本中提取的特征并不能真实表达出目标特征,所以需要根据目标特征的属性进行拆分使用。高分辨率遥感影像在不同尺度下表现出不同的特征,本文将特征分为大尺度特征和小尺度特征。(2) 高分遥感影像中建筑物的结构具有多样性,所处环境复杂多变。人脸识别中的人脸和行人识别中的行人,目标结构固定唯一,所以只要利用一种可以有效描述目标形状的特征就能取得良好的提取效果,而高分遥感影像中的建筑物结构多变、形状各异,绿地和道路在光谱、纹理、形状等特征上与某些建筑物具有一定的形似性,这些给建筑物提取带来很大的挑战和干扰,所以依靠单一的特征提取高分遥感影像中的建筑物效果不佳。
在以上研究基础上,本文结合语义网中父子节点自上而下的思想[4-5],提出了一种利用多层次特征的建筑物提取算法。本文算法分为建筑物识别和建筑物边缘提取两个阶段,本文的研究重点是建筑物识别方法,建筑物边缘提取不详细叙述。
-
本文算法首先利用大尺度特征——方向梯度直方图 (histograms of oriented gradient,HOG) 在大尺度范围下提取建筑物,但在获得结果中含有其他地物,然后利用小尺度特征——纹理光谱融合特征将获取提取结果中的其他非建筑物地物剔除掉,最后结合影像分割结果,利用区域合并的方法提取出建筑物边缘信息。建筑物提取流程图如图 1所示。
-
HOG特征可以用来提取图像或者视频中的行人[6-8],也有学者通过使用HOG特征检测出遥感影像中的民航飞机[9]。HOG特征的基本思想是目标地物的边缘信息能够被光强梯度或者边缘方向的分布所描述,将整幅图像分割成小的连接区域 (被称为cells),每一个cell生成一个方向梯度直方图或者是cell中像素的边缘方向,将所有的cell生成的直方图组合就可以作为目标地物的描述子。在现实中,影像存在着几何和光照形变,针对这种情况,局部直方图通过计算图像中一个较大区域 (被称为block) 中的光强度,并利用光强度进行block内归一化处理,归一化后的HOG特征具有阴影不变性。该算法中cell与block值由人为设定,block的长宽值分别是cell长宽值的整数倍, 该算法的参数可参考文献[10]。其算法流程如下。
1) 对各个颜色通道采用Gamma压缩,并计算其平方根。
2) 计算一阶图像梯度。这一操作也可以进一步减少光照变化的影像。
3) 对局部图像区域进行编码。在这一阶段,对细胞单元内的所有像素梯度或边缘方向的局部一维直方图进行累积。这些组合的一维直方图组成了方向直方图。细胞单元的梯度方向被分成m个方向块,m是每个方向直方图预先确定的数值组数。细胞单元中像素点的梯度大小作为方向直方图中的权值。
4) 归一化。归一化能够减少光照变化、阴影和边缘对比变化带来的影响。对区间内的局部直方图的累积进行归一化。
5) 收集所有区间的HOG特征,并将它们结合形成一个特征向量。用于影像分类。
-
§1.1是从大尺度角度,利用HOG提取的是地物目标的整体结构特性,并利用规则建筑物边缘的相互平行与垂直关系识别建筑物。但由于影像分辨率提高,遥感影像中建筑物背景环境复杂多变,高分辨率遥感影像中一些绿地、道路边缘也存在着平行与垂直关系,所以在识别结果中也包含一些道路和绿地地物,如图 2(a)所示。针对这一情况,本文从小尺度角度,研究道路、绿地、建筑物3种地物的局部和内部细节信息,从而将这3种地物区分出来。在遥感影像中,纹理与光谱是重要的局部特征,它们描述的是地物内部属性特征,并且纹理特征是高分辨率遥感影像光谱信息的补充,对最终的地物提取和分类结果有重要影响[11]。因此,本文提出纹理和光谱融合特征T-B,在小尺度影像中提取地物目标的特征,并将识别结果中的非建筑物地物剔除,剔除结果如图 2(c)所示。
本文利用由文献[12]提出的灰度共生矩阵 (gray level co-occurrence matric, GLCM) 计算纹理特征信息[13],并选取对比度GCon、熵GEnt和相关性GCor构成纹理特征[14]。纹理特征T定义为:
$$ T=\left\{ {{G}_{\text{Con}}},{{G}_{\text{Ent}}},{{G}_{\text{Cor}}} \right\} $$ (1) 光谱响应曲线随着不同材料的光谱反射率的不同而不同。建筑物与非建筑物如绿地,在光谱特征上具有较大的区别。因此,本文定义了一个基于光谱的特征波段比值曲线 (band ratio curve, BRC),提取BRC特征计算方法如下。
1) 计算训练影像或被检测窗口影像中每个像素的R、G、B波段的比值。它们的定义为:
$$ {{R}_{\text{Ratio}}}=\frac{R}{R+G+B} $$ (2) $$ {{G}_{\text{Ratio}}}=\frac{G}{R+G+B} $$ (3) $$ {{B}_{\text{Ratio}}}=\frac{B}{R+G+B} $$ (4) 式中,R、G、B分别是R、G、B波段的值;RRatio、GRatio、BRatio分别是R、G、B波段比值。
2) 分别计算训练影像或被检测窗口影像中RRatio、GRatio和BRatio的平均值。它们的定义为:
$$ {{M}_{{{R}_{\text{Ratio}}}}}=\frac{1}{N}\sum\limits_{i=1}^{N}{{{R}_{\text{Rati}{{\text{o}}_{i}}}}} $$ (5) $$ {{M}_{{{G}_{\text{Ratio}}}}}=\frac{1}{N}\sum\limits_{i=1}^{N}{{{G}_{\text{Rati}{{\text{o}}_{i}}}}} $$ (6) $$ {{M}_{{{B}_{\text{Ratio}}}}}=\frac{1}{N}\sum\limits_{i=1}^{N}{{{B}_{\text{Rati}{{\text{o}}_{i}}}}} $$ (7) 式中,MRRatio、MGRatio、MBRatio分别代表的是检测窗口中RRatio、GRatio、BRatio的平均值;N是训练影像或者被检测窗口影像中的像素总数;i表示的是检测窗口内第i个像素。
3) BRC的定义为:
$$ \text{BRC=}\left\{ {{M}_{{{R}_{\text{Ratio}}}}},{{M}_{{{G}_{\text{Ratio}}}}},{{M}_{{{B}_{\text{Ratio}}}}} \right\} $$ (8) 纹理-光谱融合特征T-B定义为:
$$ T-B=\left\{ T,\text{BRC} \right\} $$ (9) -
本文采用两组实验影像进行实验。实验影像1是Niagara航空影像,其空间分辨率为0.25 m,影像大小为1 800×1 800像素。实验影像2是易康软件培训实验航空影像,分辨率为0.35 m,大小为1 800×1 800像素。两幅影像中包含各种形状、方向的建筑物,且影像中包含绿地、树木、裸土、道路等多种地物。
图 2是本文从Niagara实验影像中截取的512×512像素大小的影像。图 2(a)是利用HOG特征识别建筑物的结果。从图 2(a)中可以看出, HOG能够识别出建筑物的中心部分,而没有识别出建筑物的边缘部分。这是因为HOG特征是大尺度特征,是对建筑物的整体描述,需要大的识别窗口。对于建筑物边缘或者相邻建筑物边缘,由于其不能包含整个建筑物,所以该部分一般不会被识别出。图 2(b)是利用纹理-光谱融合特征识别建筑物的结果。从图 2(b)中可以看出,该特征能够识别出建筑物大部分区域,但是相邻建筑物之间的部分也被错误识别出,并且连接在一起。这是因为本文提出的纹理-光谱特征是小尺度特征,是对建筑物的局部描述,其需要的是小的识别窗口。那么在相邻建筑物之间,由于小的识别窗口内包含的地物绝大部分是建筑物,则在利用支持向量机 (support vector mochine, SVM) 判断时,可能会被错误地识别为建筑物。对比图 2(a)和图 2(b)可以看出,HOG特征识别结果中,建筑物与建筑物之间相互分离,而纹理-光谱特征识别结果中建筑物是连在一起的,这给后面提取建筑物的区域信息带来很大的问题。因此,本文提出先利用HOG特征识别建筑物,然后利用纹理-光谱特征将HOG识别结果的中非建筑物目标剔除掉。图 3(c)是本文提出的基于多层特征高分辨率影像建筑物的识别结果。从图 3(c)中可以看出,本文提出的纹理-光谱特征能够有效去除绿地对建筑物识别的干扰,同时部分去除道路对建筑物识别的干扰,识别结果能够覆盖到每一个建筑物,并且相邻建筑物的识别结果没有连接在一起,同时每个建筑物所包含的建筑物像素都聚集在一起,这些优势有利于建筑物边缘信息的提取。图 2(d)是建筑物边缘的提取结果。需要指出的是,在图 2(c)中左上角虽然有些道路仍没有被剔除掉,但在后面建筑物边缘提取过程中,本文利用一些阈值可以将其剔除掉,所以在图 2(d)中左上角道路边缘没有被提取出来。
依照图 1所示的流程图,利用本文中的训练样本集分别对两幅实验影像提取建筑物。实验影像1的提取结果如图 3(a)所示,实验影像2的提取结果如图 3(b)所示。本文采用了检出率和错检率来评价建筑物提取效果[15]。检出率DP表示检测出的实验影像中真实存在的建筑物的数目。错检率BF表示错误提取出的建筑物数目。DP越大,BF越小,则表示实验结果越好。两种评定方法为:
$$ {D_P} = {{{T_P}} \over {{T_P} + {T_N}}} \times 100\% $$ (10) $$ {B_F} = {{{F_P}} \over {{T_P} + {F_N}}} \times 100\% $$ (11) 式中,TP是人工和计算机自动提取都检测出的建筑物的数目,在图 3中由红色的边缘线或者红色区域表达;TN是仅由人工检测出的建筑物数目;FP是仅由计算机自动提取检测出的非建筑物的数目,在图 3中由黄色边缘线或者黄色区域表达。实验影像提取统计结果的精度评定如表 1所示。
表 1 本文算法建筑物提取结果精度
Table 1. Building Extraction Precision Using the Proposed Algorithm
影像 TP FP TN DP/% BF/% 实验影像1 103 13 5 97.2 11.3 实验影像2 127 20 6 95.5 13.6 -
本文提出了一种基于多层次特征的高分辨率影像建筑物提取算法。该算法根据语义网中父子节点间自上而下的关系,在分析了HOG特征、纹理-光谱特征 (T-B) 的特性后,提出了先用大尺度特征——HOG在大尺度范围上识别建筑物,然后利用本文提出的小尺度特征——T-B特征在小尺度范围内将HOG识别结果中的非建筑物地物剔除掉,最后利用区域合并的方法提取建筑物边缘信息。实验结果表明:(1) 基于模式识别和场景分析思想,利用HOG特征能够在大尺度范围内很好地识别出建筑物目标,但也带了一部分其他地物的干扰;(2) 本文提出的融合特征T-B能够在HOG识别结果中完全剔除掉绿地和大部分道路地物;(3) 本文利用多层次特征识别高分辨率遥感影的像建筑物的方法不仅能很好地识别出矩形形状建筑物,还能较好地识别出由矩形构成复杂形状的规则建筑物 (L、U形)。实验结果表明,本文提出的建筑物提取算法具有较高的提取精度和较低的错识别率。
但是,实验结果中存在一些非建筑物区域被提取出或一些建筑物只有部分区域被提取出的问题。该问题一方面与建筑物识别过程中的特征组合有关,另一方面与建筑物提取过程中的区域合并有关。因此,本文下一步的工作是改进现有的特征,更好地区分建筑物与非建筑物,同时改进区域合并的规则,获得更加完整的建筑物边缘信息。
Regular Building Extraction from High Resolution Image Based on Multilevel-Features
-
摘要: 高分辨率遥感影像在不同的尺度下表现出不同的特征,根据这一特性,提出了一种基于多层次特征的航空影像规则建筑物提取方法。该方法先利用大尺度特征——方向梯度直方图(histograms of oriented gradient,HOG)特征对建筑物进行识别,然后提出了一种小尺度特征——纹理和光谱融合特征,该特征能够有效地将HOG特征识别结果中的道路、草地等非建筑物剔除,最终获取建筑物边缘信息。实验结果表明,该方法不仅对矩形建筑物有较好的提取效果,对结构复杂的规则建筑物也有较好的提取效果。Abstract: High-resolution remote sensing images reveal dissimilar distinguishable features at different scales. Based on this characteristic of high-resolution remote sensing images, a new method of extracting buildings based on multilevel feature in aerial images was developed by associating scales with features. In the case of a large-scale feature, histograms of oriented gradient (HOG), were used to recognize rough buildings areas. The areas maybe include the grass, roads and some other non-building information. In order to remove these non-building surface features, fused spectral and texture features (T-B) is proposed at the small scale. The T-B feature is used to process the results of the first recognized HOG results. Experimental results demonstrate that the new feature has a good effect. Edge information of buildings was obtained and the results show that our proposed algorithm can extract both rectangular and complex buildings in different area remote sensing images well.
-
表 1 本文算法建筑物提取结果精度
Table 1. Building Extraction Precision Using the Proposed Algorithm
影像 TP FP TN DP/% BF/% 实验影像1 103 13 5 97.2 11.3 实验影像2 127 20 6 95.5 13.6 -
[1] Cha J, Cofer R H, Kozaitis S P. Extended Hough Transform for Linear Feature Detection[J]. Pattern Recognition, 2006, 39(6):1034-1043 doi: 10.1016/j.patcog.2005.05.014 [2] Chen Y, Su W, Li J, et al. Hierarchical Object Oriented Classification Using very High Resolution Imagery and LiDAR Data over Urban Areas[J]. Advances in Space Research, 2009, 43(7):1101-1110 doi: 10.1016/j.asr.2008.11.008 [3] 吴炜, 骆剑承, 沈占锋, 等.光谱和形状特征相结合的高分辨率遥感图像的建筑物提取方法[J].武汉大学学报·信息科学版, 2012, 37(7):800-805 http://ch.whu.edu.cn/CN/abstract/abstract255.shtml Wu Wei, Luo Jiancheng, Shen Zhanfeng, et al. Building Extraction from High Resolution Remote Sensing Imagery Based on Spatial-Spectral Method[J].Geomatics and Information Science of Wuhan University, 2012, 37(7):800-805 http://ch.whu.edu.cn/CN/abstract/abstract255.shtml [4] 舒宁.关于遥感影像处理智能系统的若干问题[J].武汉大学学报·信息科学版, 2011, 36(5):527-530 http://ch.whu.edu.cn/CN/abstract/abstract547.shtml Shu Ning. Some Aspects of Intelligent System for Remote Sensing Image Processing[J]. Geomatics and Information Science of Wuhan University, 2011, 36(5):527-530 http://ch.whu.edu.cn/CN/abstract/abstract547.shtml [5] Buckner J, Pahl M, Stahlhut O, et al. A Knowledge-Based System for Context Dependent Evaluation of Remote Sensing Data[M]. Switzerland:Springer, 2002 [6] Dalal N, Triggs B, Schmid C. Human Detection Using Oriented Histograms of Flow and Appearance:The 9th European Conference on Computer Vision, Graz, Austria, May 7-13, 2006[C]. Computer Vision-ECCV, New York, 2006 [7] Bertozzi M, Broggi A, Del Rose M, et al. A Pedestrian Detector Using Histograms of Oriented Gradients and a Support Vector Machine Classifier[C].The Intelligent Transportation Systems Conference, Seattle, W A, 2007 [8] Watanabe T, Ito S, Yokoi K. Co-occurrence Histograms of Oriented Gradients for Pedestrian Detection[C]. The Third Pacific Rim Symposium, Tokyo, Japan, 2009 [9] Cheng G, Han J, Guo L, et al. Object Detection in Remote Sensing Imagery Using a Discriminatively Trained Mixture Model[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2013, 85:32-43 doi: 10.1016/j.isprsjprs.2013.08.001 [10] Dalal N, Triggs B. Histograms of Oriented Gradients for Human Detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, San Diego, C A, USA, 2005 [11] 黄昕. 高分辨率遥感影像多尺度纹理、形状特征提取与面向对象分类研究[D]. 武汉: 武汉大学, 2009 Huang Xin. Multiscale Texture and Shape Feature Classification for Very High Resolution Remotely Sensed Imagery[D]. Wuhan:Wuhan University, 2009 [12] Haralick R M, Shanmugam K, Dinstein I H. Textural Features for Image Classification[J].IEEE Transactions on Systems, Man and Cybernetics, 1973, 3(6):610-621 https://www.researchgate.net/publication/311510540_Textural_features_for_image_classification [13] Clausi D A. Comparison and Fusion of Co-occurrence, Gabor and MRF Texture Features for Classification of SAR Sea-Ice Imagery[J]. Atmosphere-Ocean, 2001, 39(3):183-194 doi: 10.1080/07055900.2001.9649675 [14] Clausi D A, Deng H. Design-Based Texture Feature Fusion using Gabor Filters and Co-occurrence Probabilities[J]. IEEE Transactions on Image Processing, 2005, 14(7):925-936 doi: 10.1109/TIP.2005.849319 [15] Lin C, Nevatia R. Building Detection and Description from a Single Intensity Image[J]. Computer Vision and Image Understanding, 1998, 72(2):101-121 doi: 10.1006/cviu.1998.0724 -