Building Detection from High Resolution Remote Sensing Imagery Based on a Deformable Part Model
-
摘要: 高分辨率遥感影像具有场景复杂、目标种类多样、同一目标呈现多种形态等特点,给建筑物检测带来困难。近年来,可变形部件模型(deformable part model,DPM)被广泛应用到模式识别领域,并且在自然场景的目标识别方面取得很好的效果。结合可变形部件模型,提出一种针对高分辨率遥感影像中建筑物的检测方法,将建筑物看作可变形部件的组合,通过训练得到其对应的参数模板,并采用滑动窗口的方式遍历待检测的影像,判断其中是否存在建筑物目标。通过对分辨率为0.5 m的高分辨率遥感影像的实验证明了方法的有效性。Abstract: The characteristics of high resolution remote sensing imagery-complex scenes, diversity, various forms of one target, and so on-make automatic building detection difficult.. In recent years, the deformable part model (DPM) has become widely used in the field of pattern recognition, and effective for target recognition in natural scenes. In this paper, we propose a new method of building detection using high resolution remote sensing imagery, based on DPM. This method considers a building as a combination of deformable parts, obtains its template parameters by training, and traverses images with a sliding window to detect buildings. Experiments show the validity of the method.
-
利用全球导航卫星系统(global navigation satellite system, GNSS)层析技术反演水汽已经成为获取水汽空间分布信息的重要手段之一,其高精度、全天候、高时空分辨率的优点在对暴雨等天气的监测和预报过程中得到了广泛应用[1-3]。自Bevis等[2]证明可以利用地基全球定位系统(global positioning system, GPS)获取水汽后,GNSS气象学的发展在国内外取得了许多成果[4-17]。
Bevis等[2]首先利用倾斜路径湿延迟对对流层进行层析,并基于欧洲中期天气预报中心(European Centre for Medium Range Weather Forecasts, ECMWF)预报产品对层析结果进行验证;于胜杰等[6]分析了不同约束条件对水汽反演结果的影响,并证明层析结果受测站间高差和先验信息精度影响较大。叶世榕等[7]结合数值积分参数化思想,提出了一种适用于层析的三维分布数值积分方法,结果证明该方法能够明显提高层析结果垂直廓线的精度;刘志赵等[8]提出了合理选择层析区域垂直高度和整体移动层析区域以增加射线利用率的方法,但该方法对数据利用率的提高有很大的局限性。何林等[3]讨论了代数重构算法在水汽层析中的各种问题,并对松弛因子和迭代终止条件的确定做了详细研究。
上述研究都是利用完整穿过层析区域的射线信息建立观测方程。由于受接收机和卫星特定几何位置的影响,很多卫星射线不可避免会从研究区域侧面穿出,在传统层析观测方程构建过程中因无法利用而被剔除。针对该情况,本文提出了一种附加辅助层析区域提高射线利用率的方法,使得从研究区域侧面穿出的信号也可以被利用。
1 GNSS层析原理
1.1 层析观测方程
在水汽反演过程中,倾斜路径水汽含量(slant water vapor, SWV)是建立层析观测方程中最重要的输入量,定义为从卫星到接收机沿卫星信号传播路径上总的水汽含量[8],其表达式为:
$$ {\rm{SWV}} = {10^{-6}}\cdot{\smallint _s}\rho \left( s \right){\rm{d}}s $$ (1) 式中,ρ(s)表示水汽密度(g/m3);s表示卫星到接收机的信号传播路径长度,ds表示沿s路径上每段路径元素的长度;SWV表示信号传播路径上的水汽含量。层析技术将研究区域分成若干立体网格,并假定网格内的水汽密度为一常数,可将式(1) 写成下面离散化的形式:
$$ {\rm{SW}}{{\rm{V}}^s} = \sum\limits_{i = 1}^n {(a_{_i}^{^s}\cdot{\rho _i})} $$ (2) 式中,ais表示卫星信号s在第i个网格内的截距;ρi表示第i个网格内的水汽密度;n表示层析区域划分的立体网格总数。
利用层析区域内接收机所观测到的卫星信号可组成观测方程:
$$ {\mathit{\boldsymbol{S}}_{l \times 1}} = {\mathit{\boldsymbol{A}}_{l \times n}}\cdot{\mathit{\boldsymbol{x}}_{n \times 1}} $$ (3) 式中,S表示l个SWV观测值组成的列向量;l表示层析区域内所有测站SWV观测值的总个数;A表示网格截距组成的系数矩阵;x表示待求网格水汽密度组成的列向量。
1.2 约束方程建立
由于层析区域内接收机数目有限,导致在给定的层析时段内有射线穿过的网格数目有限,因此,式(3) 中A是维数较大的稀疏离散矩阵,不能完全求解出x中所有的待求水汽密度值[8]。为了克服该法方程秩亏问题,通常需要加入先验约束信息对网格内的水汽密度进行约束[16-18]。基于水汽在空间呈连续分布及网格距离与水汽密度相关性成正比的特点,本文采用水平平滑约束建立水平约束方程[3]。基于水汽密度随高度呈指数递减的特点,采用指数函数构建垂直约束方程[18]。此外,将垂直路径上的水汽信息也加入到层析模型中;附加上述约束后可以得到传统方法的层析模型:
$$ \left( {\begin{array}{*{20}{c}} {\mathit{\boldsymbol{A}}_{_{l \times n}}^{^{{\rm{slant}}}}}\\ {\mathit{\boldsymbol{A}}_{_{m \times n}}^{^{{\rm{zenith}}}}}\\ {{\mathit{\boldsymbol{H}}_{l \times n}}}\\ {{\mathit{\boldsymbol{V}}_{l \times n}}} \end{array}} \right) \cdot {\mathit{\boldsymbol{x}}_{n \times 1}} = \left( \begin{array}{*{20}{c}} {\mathit{\boldsymbol{S}}_{l \times 1}}\\ {\mathit{\boldsymbol{P}}_{m \times 1}}\\ {{\bf{0}}_{l \times 1}}\\ {{\bf{0}}_{l \times 1}} \end{array} \right) $$ (4) 式中,Al×nslant为斜方向投影函数;Am×nzenith为天顶方向投影函数;Pm×1为m个测站的天顶方向水汽含量组成的列向量;H和V分别表示水平约束和垂直约束的系数矩阵。基于联合代数重构算法(multiplicative algebraic reconstruction technique, MART)能够短时间内快速收敛的特点[17],对于式(4) 利用MART算法求解。
2 附加辅助层析区域反演水汽的方法
2.1 附加辅助层析区域反演水汽思想
受接收机和卫星星座特定几何位置分布的影响,层析区域内总有很多射线信号会从研究区域侧面穿出,被当作无效信息剔除。这不仅降低了观测数据的利用率,也会对反演结果造成一定的影响。
为了解决上述问题,本文提出了一种附加辅助层析区域反演水汽的方法。该方法的核心思想是在经度、纬度方向上对原有层析区域进行延伸,直至扩大后的层析区域能够确保原层析区域内所有测站一定高度截止角之内的卫星射线都能完整穿过扩大后的层析区域。对扩大后的层析区域进行水汽反演,可得到原层析区域内各网格的水汽密度初值。将此初值用于迭代并结合传统方法对层析区域的水汽进行再次反演,得到更高质量的层析结果。需要指出的是,于胜杰等[6]通过多次水汽层析实验证明,先验信息对不同GPS网中的作用差异较大。当层析区域内GPS测站间的相对高差较小时,其层析方程的系数矩阵奇异程度较为严重,因此初值信息对层析结果有很大影响;扩大层析区域范围后,扩大层析区域内的水汽参数也会增多,其水汽密度层析结果的精度和可靠性可以稍差,因为只将其结果作为初值进行下一步运算。
2.2 附加辅助层析区域具体实现过程
为了便于表达,将需要研究的层析区域(如图 1中较小的红色网格区域所示)在水平方向上经过一定的延伸形成的新区域称为辅助层析区域(如图 1中较大的绿色网格区域所示),其垂直高度保持不变。
本文提出的水汽反演方法实现过程如下。
1) 确定要延伸的水平距离,如图 1中d所示。根据层析区域的垂直高度和卫星截止高度角,以研究区域的边界为起点(假定右侧站在研究区域边界上)确定出在经度和纬度方向上要延伸的水平范围,以确保层析区域内所有测站在一定卫星高度截止角范围内的卫星射线都能够完整穿过该辅助研究区域。如图 2所示,假定进行水汽层析时利用的卫星截止高度角为α,层析区域的垂直高度为H(单位为km),在层析区域边界上有一测站P,其有一条α度角的边界射线信号S,则可以通过式(5) 计算出需要延伸的水平距离d:
$$ d = H/{\rm{tan}}\alpha $$ (5) 2) 利用原层析区域内所有测站观测到的卫星高度角大于α的射线信息建立辅助研究区域(如图 1中较大的绿色区域)的辅助观测方程,然后附加各种约束后得到辅助层析区域的层析模型。
3) 通过SVD全科分解法[20]对第2) 步建立的辅助层析模型求解,得到辅助层析区域内每个网格的水汽密度估值。然后只选取原层析区域网格(如图 1中较小的红色区域内的网格)所在位置的水汽密度估值作为初值用于下一步解算。
4) 基于传统方法利用完整穿过层析区域(如图 1中较小的红色区域)的信号射线建立观测方程,并附加约束条件得到研究区域的层析模型,如式(4) 所示。
5) 基于MART方法对层析区域的层析模型进行解算,将第3) 步中得到的水汽密度作为MART方法解算的初值进行一步修正,得到层析结果的最终解。
3 方法有效性检验
利用无线电探空仪获取的数据能够得到垂直方向上精确的水汽密度信息[3, 14],通常将其作为检验层析技术反演水汽结果的标准。本文将均方根误差(root mean square, RMS)、偏差(Bias)和平均绝对偏差(MAE)作为检验本文提出方法反演水汽精度的指标。
3.1 实验数据及层析策略
选取美国德克萨斯地区运行参考站(Continuously Operation Reference Stations, CORS)网中13个GPS测站(如图 3中▲所示)的观测数据进行层析实验,各测站具体站名和相关信息如表 1所示,选取时间为2015-05-10~2015-05-31共22 d,需要说明的是在此后的数据分析均是基于该数据进行的。其中,在层析区域有一个72 249探空站(radiosonde station),如图 3中·所示,该探空站每天在UTC 00:00和12:00发射探空气球获取数据,本文将该探空数据计算结果作为检核层析结果的标准。
表 1 美国得克萨斯州地区CORS网中使用的测站信息Table 1. Information of Stations Using CORS Network in Texas测站名 纬度/(°) 经度/(°) 高/km 接收机类型 TXCO 33.150 0 96.616 7 161.893 TRIMBLE NETR5 TXDA 32.783 3 96.666 7 160.642 TRIMBLE NETR9 TXDC 33.233 3 97.600 0 255.282 TRIMBLE NETR5 TXDE 33.200 0 97.150 0 178.789 TRIMBLE NETR5 TXES 32.366 7 96.850 0 163.749 TRIMBLE NETR9 TXGR 32.233 3 97.750 0 177.482 TRIMBLE NETR5 TXJA 33.183 3 98.133 3 326.043 TRIMBLE NETR5 TXKE 32.400 0 97.316 7 227.949 TRIMBLE NETR5 TXMW 32.800 0 98.133 3 246.447 TRIMBLE NETR5 TXSG 32.850 0 97.333 3 181.667 TRIMBLE NETR5 TXST 32.216 7 98.166 7 376.574 TRIMBLE NETR5 TXWE 32.750 0 97.816 7 337.386 TRIMBLE NETR9 ZFW1 32.816 7 97.050 0 155.193 NOV WAASGII 本文实验所选取的研究范围(如图 3中红色区域范围所示):纬度方向为32.1°N~33.3°N,分辨率为0.2°;经度方向为96.5°W~98.3°W,分辨率为0.3°;垂直方向为0~10 km,分辨率为1 km;研究区域共有6×6×10个网格。在进行层析时,选取的卫星截止高度角为10°,因此根据§2.2部分可以确定出辅助层析区域的范围(如图 3整个区域范围所示),以确保原层析区域内的13个接收机在10°~90°卫星截止高度角之间的所有射线信号都能完整穿过辅助研究区域;其具体范围:纬度31.7°N~33.7°N,经度96.2°W~98.6°W;辅助层析区域内网格个数为10×8×10。
实验中采用两种方法获取原层析区域内的水汽信息。
方法1 采用传统方法建立的层析模型反演水汽,即式(4) 建立的层析模型;
方法2 利用本文提出的层析方法反演水汽,即利用§2.2给出的解算步骤。
GAMIT (v10.5) 软件对GPS数据处理的天顶对流层延迟参数估计精度优于±1 cm[21],结合气象参数得到的PWV只有±1.5 mm,因此基于投影函数得到的SWV其精度足以满足水汽层析的需求。本文在利用GAMIT(v10.5) 软件[22]对实验数据进行处理时,为了消除局域网中各测站对流层参数相关性的影响,引入了INEG、NIST、NILB和PIE1 4个网外IGS辅助站参与解算[23]。
3.2 射线利用及射线穿过网格数分析
基于§3.1给出的两种方法,统计了层析时段内每天一次不同方法射线利用情况及与有射线穿过的网格个数(图 4);表 2给出了每天的平均统计信息。由图 4和表 2可以看出,方法2在射线使用条数和有射线穿过的网格数方面均大于方法1。通过计算,本文提出的方法使射线的平均利用率提高了18.94%。
表 2 两种方法射线利用情况及有射线穿过网格数统计信息Table 2. Statistical Information of the Number of Signal Used and Voxels Crossed by Rays方法 信号使用条数 信号穿过网格数 均值 最大值 最小值 均值 最大值 最小值 1 676 786 655 392 307 277 2 803 905 776 399 312 284 3.3 水汽反演精度检验
为了验证本文提出方法反演水汽结果的精度,对层析时段内每天两个观测历元(UTC 00:00和12:00) 不同方法反演的水汽结果进行对比。首先利用两种方法反演水汽得到探空站所在位置上相应历元的水汽密度估值,然后与探空站数据计算结果进行对比,统计得到每天的均方根误差、偏差和平均绝对误差(见图 5~图 7);表 3给出了每天的平均统计结果。
表 3 与探空数据对比22天的统计信息/(g·m-3)Table 3. Statistical Information Compared with Radiosonde Data for 22 Days/(g·m-3)方法 RMS Bias MAE 均值 最大值 最小值 均值 最大值 最小值 均值 最大值 最小值 1 1.78 2.93 0.54 0.11 1.58 -1.29 1.26 2.14 0.42 2 1.52 2.75 0.42 0.02 1.25 -1.27 1.04 1.97 0.34 由图 5~图 7可以看出,方法2的RMS、Bias和MAE均优于方法1;由表 3也可以看出,方法2的平均RMS、Bias和MAE均小于方法1。这说明,本文提出的利用辅助层析区域提高射线利用率反演水汽的方法其精度要优于传统方法。
3.4 水汽密度廓线对比
为了进一步分析本文提出的方法反演水汽密度在垂直方向上的分布情况,对层析时段内的层析结果进行统计,得到探空站所在位置上不同高度的平均水汽密度值,并与探空站计算的结果进行对比(图 8)。图 8(a)给出了两种方法与无线电探空仪对比水汽密度随高度的变化情况,图 8(b)给出了不同高度上的RMS。
由图 8(a)可以看出,方法2反演水汽密度得到的廓线信息在不同高度上与探空数据计算结果具有更好的一致性。由图 8(b)也可以看出,方法2反演水汽的精度其垂直分布也优于传统方法。这进一步说明,通过本文方法,实现了在研究区域侧面穿出的射线信息对层析区域水汽反演的贡献,提高了水汽反演结果的质量。
4 结语
传统层析方法中,从研究区域侧面穿出的射线信息因无法被使用而导致了观测数据的浪费。针对该情况,本文提出了一种附加辅助层析区域提高射线利用率的水汽反演方法。基于美国得克萨斯地区的CORS网2015-05-10~2015-05-31共22天的观测数据进行实验,验证了本文提出方法反演水汽的有效性及精度。
实验结果表明, 本文提出的方法能够充分利用从研究区域侧面穿出的射线信息,实现了这些射线信息对最终层析结果的贡献。通过与探空数据计算结果对比发现,利用本文提出的方法得到的水汽结果有很大的改善,其RMS的改善率为14.6%,Bias的改善率为27.3%,MAE的改善率为17.5%。这说明本文提出的方法反演的水汽密度信息在RMS、Bias和MAE等方面均优于传统方法。
-
[1] 侯蕾, 尹东, 尤晓建.一种遥感图像中建筑物的自动提取方法[J].计算机仿真, 2006, 23(4):184-187 http://www.cnki.com.cn/Article/CJFDTOTAL-JSJZ200604050.htm Hou Lei, Yin Dong, You Xiaojian. An Automatic Building Detection Method from Remote Sensing Images[J].Computer Simulation, 2006, 23(4):184-187 http://www.cnki.com.cn/Article/CJFDTOTAL-JSJZ200604050.htm
[2] Simonetto E, Oriot H, Garello R.Rectangular Building Extraction from Stereoscopic Airborne Radar Images[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(10):2386-2395 doi: 10.1109/TGRS.2005.853570
[3] Park D C, Woo D M, Kim C S. Clustering of 3D Line Segments Using Centroid Neural Network for Building Detection[J]. Journal of Circuits Systems & Computers, 2014, 23(5):291-299
[4] 安文, 杨俊峰, 赵羲, 等.高分辨率遥感影像的建筑物自动提取[J].测绘科学, 2014, 39(11):80-84 http://www.cnki.com.cn/Article/CJFDTOTAL-CHKD201411018.htm An Wen, Yang Junfeng, Zhao Xi, et al. Building Automatic Extraction from High Resolution RS Images[J].Science of Surveying and Mapping, 2014, 39(11):80-84 http://www.cnki.com.cn/Article/CJFDTOTAL-CHKD201411018.htm
[5] Aytekln O, Erener A, Ulusoy I, Duzgun S. Unsupervised Building Detection in Complex Urban Environments from Multispectral Satellite Imagery[J]. International Journal of Remote Sensing, 2012, 33(7):2152-2177 doi: 10.1080/01431161.2011.606852
[6] 陶超, 谭毅华, 蔡华杰, 等.面向对象的高分辨率遥感影像城区建筑物分级提取方法[J].测绘学报, 2010, 39(1):39-45 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB201001011.htm Tao Chao, Tan Yihua, Cai Huajie, et al. Object-oriented Method of Hierarchical Urban Building Extraction from High-resolution Remote-Sensing Imagery[J].Acta Geodaetica et Cartographica Sinica, 2010, 39(1):39-45 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB201001011.htm
[7] 周亚男, 沈占锋, 骆剑承, 等.阴影辅助下的面向对象城市建筑物提取[J].地理与地理信息科学, 2010, 26(3):37-40 http://www.cnki.com.cn/Article/CJFDTOTAL-DLGT201003010.htm Zhou Yanan, Shen Zhanfeng, Luo Jiancheng, et al. Shadow-Assisted Object-Oriented Extraction of Urban Buildings[J].Geography and Geo-Information Science, 2010, 26(3):37-40 http://www.cnki.com.cn/Article/CJFDTOTAL-DLGT201003010.htm
[8] Karantzalos K, Paragios N. Recognition-Driven Two-Dimensional Competing Priors Toward Automatic and Accurate Building Detection[J]. IEEE Transaction on Geoscience and Remote Sensing, 2009, 47(1):133-144 doi: 10.1109/TGRS.2008.2002027
[9] 吴炜, 洛剑承, 沈占锋, 等.光谱和形状特征相结合的高分辨率遥感图像的建筑物提取方法[J].武汉大学学报·信息科学版, 2012(7):800-805 http://ch.whu.edu.cn/CN/abstract/abstract255.shtml Wu Wei, Luo Jiancheng, Shen Zhanfeng, et al. Building Exaction from High Resolution Remote Sensing Imagery Based on Spatial-Spectral Method[J].Geomatics and Information Science of Wuhan University, 2012, 37(7):800-805 http://ch.whu.edu.cn/CN/abstract/abstract255.shtml
[10] Chen L, Zhao S, Han W, et al. Building Detection in an Urban Area Using LiDAR Data and QuickBird Imagery[J]. International Journal of Remote Sensing, 2012, 33(16):5135-5148 doi: 10.1080/01431161.2012.659355
[11] Qin R, Fang W. A Hierarchical Building Detection Method for Very High Resolution Remotely Sensed Images Combined with DSM Using Graph Cut Optimization[J].Photogrammetric Engineering and Remote Sensing, 2014, 80(9):873-883 doi: 10.14358/PERS.80.9.873
[12] Felzenszwalb P, McAllester D, Ramanan D. A Discriminatively Trained, Multiscale, Deformable Part Model[C]. IEEE Conference on Computer Vision and Pattern Recognition, Anchorage, USA, 2008
[13] Felzenszwalb P, Girshick R, McAllester D, et al. Object Detection with Discriminatively Trained Part-based Models[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9):1627-1645 doi: 10.1109/TPAMI.2009.167
[14] Felzenszwalb P, Girshick R, McAllester D. Cascade Object Detection with Deformable Part Models[J]. Communications of the Acm, 2013, 56(9):97-105 doi: 10.1145/2500468
[15] Dalal N, Triggs B. Histograms of Oriented Gradients for Human Detection[C]. IEEE Conference on Computer Vision and Pattern Recognition, San Diego, USA, 2005
[16] Desai C, Ramanan D, Fowlkes C. Discriminative Models for Multi-class Object Layout[J].International Journal of Computer Vision, 2011, 95(1):1-12 doi: 10.1007/s11263-011-0439-x
[17] Blaschko M, Lampert C. Learning to Localize Objects with Structured Output Regression[C]. European Conference on Computer Vision, Marseille, France, 2008
[18] Lampert C, Blaschko M, Hofmann T. Beyond Sliding Windows:Object Localization by Efficient Subwindow Search[C]. IEEE Conference on Computer Vision and Pattern Recognition, Anchorage, USA, 2008
[19] Pepik B, Stark M, Gehler P, et al. Teaching 3D Geometry to Deformable Part Models[C]. IEEE Conference on Computer Vision and Pattern Recognition, Providence, USA, 2012
[20] Hossein A, Ivan L. Object Detection Using Strongly-supervised Deformable Part Models[C]. European Conference on Computer Vision, Florence, Italy, 2012
[21] Hamed P, Deva R. Steerable Part Models[C]. IEEE Conference on Computer Vision and Pattern Recognition, Providence, USA, 2012
-
期刊类型引用(9)
1. 赵庆志,蒋朵朵,郭宏武,李祖锋,翟园,刘晨. 地基GNSS水汽层析研究进展与展望. 导航定位与授时. 2024(06): 71-83 . 百度学术
2. 张文渊,戚铭心,张书毕. 顾及水汽分布的非均匀离散化GNSS水汽层析精化方法. 测绘学报. 2024(12): 2282-2294 . 百度学术
3. 王勇,刘晓,刘严萍,占伟. CMONOC约束下的MODIS水汽分区域函数模型校正. 武汉大学学报(信息科学版). 2023(02): 224-231 . 百度学术
4. 姚宜斌,赵庆志. GNSS对流层水汽监测研究进展与展望. 测绘学报. 2022(06): 935-952 . 百度学术
5. 赵庆志,杜正,吴满意,姚宜斌,姚顽强. 利用多源数据构建PWV混合模型. 武汉大学学报(信息科学版). 2022(11): 1823-1831+1846 . 百度学术
6. 何秀凤,詹伟,施宏凯. 顾及边界信号及垂直约束的GNSS水汽层析方法. 测绘学报. 2021(07): 853-862 . 百度学术
7. 张文渊,张书毕,左都美,丁楠,刘鑫. GNSS水汽层析的自适应代数重构算法. 武汉大学学报(信息科学版). 2021(09): 1318-1327 . 百度学术
8. 张文渊,郑南山,张书毕,丁楠,戚铭心,王昊. 附加高水平分辨率PWV约束的GNSS水汽层析算法. 武汉大学学报(信息科学版). 2021(11): 1627-1635 . 百度学术
9. 胡鹏,黄观文,张勤,燕兴元,李哲. 顾及边界入射信号的多模水汽层析方法. 测绘学报. 2020(05): 557-568 . 百度学术
其他类型引用(9)