Spatial Seamless Data Organization of Large-scale Image Database
-
摘要: 分析了我国数字正射影像产品的空间参考特性和建立大型无缝影像数据库所带来的问题,在此基础上提出了海量影像数据管理中分带存储模式和跨带漫游算法,实践证明了用这种管理方式来建立省级或国家级无缝影像数据库的科学性、有效性和实用性。Abstract: At present,digital orthoimages and orthoimage mosaics are playing an increasingly important role throughout the entire geoinformation domain.Especially after the term of digital earth is put forward,digital orthoimages become the main content of digital earth.Orthoimages offer an ideal combination of high information density,broad area coverage,economical and quick acquisition and production.Because every orthoimage covers relatively small area,using it in broad area is inconvenient.Certainly,several orthoimages in which users are interested can be mosaiced into one big orthoimage,but it is still inconvenient for users to access and process.If digital orthoimages are efficiently managed by image database,it will be convenient for users.As China is a big country,the georeference of digital orthoimage is based on Gauss planar coordinate.As far as the image database of national or provincial level is concerned,the coordinate origin of digital orthoimage is different due to the belt-divided projection.Take Guangdong province of China as a sample,the whole province is divided into three projection belts,every belt has its own coordinate origin,the georeference is different and the distortion of neighbor map in two belt edge is very large.Thus it cause the problem of image data seamless organization.This paper analyzes the spatial reference characteristic of digital orthoimage and it causes the problems of the foundation of large-scale seamless image database.On the basis of that,belt-divided storage mode and over-belt algorithm is put forward in mass image data management.Through experiments,it proved the scientificity,validity and practicality in the image database of provincial or national level.
-
Keywords:
- image database /
- map projection /
- belt-divided /
- overbelt
-
桥梁作为重要的交通设施,其自动解译一直是SAR(synthetic aperture radar)影像目标解译的重要内容,在洪水、地震等自然灾害地区进行救灾路径的选择、自然灾害评估及地图数据的更新等具有重要的现实意义。SAR是一种主动式微波遥感成像系统,具有全天时、全天候等特点,在灾后响应、目标探测等领域有着广泛的应用[1]。
国内外的桥梁自动识别方法均采用大致相同的框架,即桥梁目标检测、桥梁场景提取和桥梁目标辨别。在桥梁目标检测中,Peng[2]、Zhang[3]通过边缘提取进行检测,通过判断水体区域间的距离提取桥梁[4]。在桥梁场景提取中,当前均采用强度影像进行提取,包括阈值分割法[4, 5]和纹理分类法[2, 6]。桥梁目标辨别则主要是利用桥梁在影像中的特征去除虚警[7, 8]。这些方法能够在特大型桥梁及场景较为简单时取得较好的结果;而在影像分辨率为分米级、桥梁场景复杂、桥梁目标较小的复杂情况下,其识别能力则有待提高。本文提出了适用于高分SAR影像的桥梁自动识别方法,并选取中国机载高分辨率XSAR(中国PolInSAR系统)数据和美国AIRSAR(美国喷气推进实验室多波段PolSAR系统)全极化数据进行实验,以解决上述复杂情况下的桥梁自动识别问题。
1 桥梁识别方法
1.1 桥梁目标检测
CFAR(constant false alarm rate)检测器由于其计算高效、自适应性强等优点,在目标检测领域具有广泛的应用。由于CFAR检测受影像分布模型的影响很大,故需研究适用于桥梁场景的影像分布模型,以取得较好的检测效果。
1.1.1 影像统计分布模型
针对高分SAR影像的统计特征,当前的研究多采用双参数的分布模型,如Weibull分布、Gamma分布。
Weibull分布能在较广的范围内与实验数据相匹配,拥有更好的适用范围,其概率密度函数如式(1),包含尺度参数B和形状参数C:
$$ p(x) = \left\{ \begin{array}{l} \frac{C}{B}{\left( {\frac{x}{B}} \right)^{C - 1}}\exp \left( { - {{\left( {\frac{x}{B}} \right)}^C}} \right),x \ge 0\\ 0,x < 0 \end{array} \right. $$ (1) Gamma分布是另一种常用的高分SAR影像分布模型,其概率密度函数为:
$$ p(x) = \left\{ \begin{array}{l} \frac{{{\beta ^v}{x^{v - 1}}{{\rm{e}}^{ - \beta x}}}}{{\mathit{\Gamma }\left( v \right)}},x \ge 0\\ 0,x < 0 \end{array} \right. $$ (2) 式中, v与β分别是函数的形状参数和尺度参数;Γ(v)为Gamma函数。
本文采用CVM(cramer von mises)检验比较这两种分布模型与影像数据的匹配程度,即分别计算这两种分布模型与影像经验分布之间的CVM距离,距离越小,则表明该分布模型与影像数据的匹配程度越高[9]。分布函数F(x)与影像经验分布FN(x)的CVM距离为:
$$ {W^2} = N\int_{ - \infty }^\infty {{{\left| {{F_N}\left( x \right) - F\left( x \right)} \right|}^2}{\rm{d}}\left( {F\left( x \right)} \right)} $$ (3) 式中,N代表同种分布的样本个数。式(3) 适合于连续数据的计算,因此对式(3) 进行积分求解,得到适用于离散数据集的CVM距离计算表达式:
$$ {W^2} = \frac{1}{{12N}} + {\sum\limits_{i = 1}^N {\left( {F\left( {{X_i}} \right) - \frac{{2i - 1}}{{2N}}} \right)} ^2} $$ (4) 式中,Xi代表数据集中第i阶像素值。该检验方法需要对分布函数F(x)进行参数估计,本文均选用最大似然估计法。
1.1.2 CFAR桥梁目标检测
桥梁属于强散射目标,并处于弱散射地物的场景中,因此利用CFAR算法可以在影像中有效地检测出桥梁目标。影像统计分布模型的实验结果表明,Weibull分布能较好地匹配高分SAR影像的统计特征,故本文采用基于Weibull分布的CFAR算法对桥梁进行检测。
CFAR检测器构造为方形中空的窗口,考虑影像的分辨率和桥梁大致的宽度,窗口设置为101×101像素大小,如图 1所示。窗口外侧5个像素宽度的区域作为背景区域,用于估计Weibull分布函数的参数;窗口中心5×5像素的方形区域作为目标区域,用于检测桥梁目标;背景区域与目标区域之间为保护区域,用于确保桥梁目标像素不参与参数估计[10]。由于桥梁是带状目标,检测过程中桥梁目标像素不可避免地落入背景区域,因而需要设定阈值去除亮度较大的像素,确保用于估计Weibull分布参数的像素中不含桥梁目标像素。
采用最大似然法对Weibull分布的参数C、B进行估算[11]:
$$ \frac{{\sum\limits_{i = 1}^n {X_i^{\hat C}\ln {X_i}} }}{{\sum\limits_{i = 1}^n {X_i^{\hat C}} }} - \frac{1}{\hat C} = \frac{{\sum\limits_{i = 1}^n {\ln {X_i}} }}{n},\hat B = {\left( {\frac{{\sum\limits_{i = 1}^n {X_i^{\hat C}} }}{n}} \right)^{1/\hat C}} $$ (5) 式中, Xi等同为背景区域像素的第i阶样本;参数C通过式(5) 运用牛顿迭代法进行计算。估算出Weibull分布参数之后,利用预先设置的恒虚警率fa(本文实验设置fa为0.05) 就可以求取检测窗口的自适应阈值:
$$ T = B{\left( { - \ln \left( {{f_a}} \right)} \right)^{1/C}} $$ (6) 当检测窗口移动到影像的某一位置,首先进行多像素CFAR检测[10]。对窗口目标区域内的像素进行平均,求取均值:
$$ {\mu _{{\rm{target}}}} = \sum\limits_{i = 1}^n {{t_k}} $$ (7) 将均值μtarget与求取的自适应阈值T进行比较,如果μtarget < T,说明该窗口位置的目标区域内不含有桥梁目标,窗口移动到下一位置,步长为5个像素;如果μtarget>T,说明目标区域中含有桥梁目标像素,需要对该窗口位置进行单像素CFAR检测。单像素CFAR检测对目标区域内的像素逐个进行判断,阈值为2T,以提取清晰的桥梁轮廓。整幅影像遍历检测完成后,得到CFAR桥梁目标检测结果,其结果为二值图像,桥梁目标像素位置标记为1,其余为0。
1.2 桥梁场景区域提取
在高分辨率SAR影像中,水体与道路、广场、裸土等地物的散射特性极为相似[12],当前针对高分辨率SAR影像的水体提取效果均不够理想。
本文首先利用WHA(Wishart-H-Alpha)分类提取影像中的弱散射类别;然后对弱散射类区域进行形态学处理,尽可能降低道路等弱散射地物带来的影响,进而提取出桥梁场景区域。
WHA分类是基于散射机理和Wishart距离判别的非监督分类算法[13]。该方法首先需要对极化SAR数据进行极化分解,获取极化熵(H)和极化各向异性角(Alpha)两个特征量,然后根据影像像素在H-Alpha平面中的分布来划分出8个初始化类别,聚类中心计算如下,
$$ {V_i} = \frac{1}{{{n_i}}}\sum\limits_{j = 1}^{{n_i}} {{{\left\langle T \right\rangle }_j}} $$ (8) 式中, ni代表第i类包含样本像素的个数, 然后计算影像中各像素与各个聚类中心的Wishart距离,并选择最小距离作为该像素的分类结果:
$$ \mathop {\min }\limits_{1 \le i \le 8} \left\{ {\ln \left| {{V_i}} \right| + {\rm{Tr}}\left( {V_i^{ - 1}\left\langle T \right\rangle } \right)} \right\} $$ (9) 在初始分类的基础上采用迭代的方法,不断更新每个类别的聚类中心,并不断对影像进行重新分类,直到取得满意的分类结果。
水体、道路、裸土等地物是镜面反射和Bragg散射的混合[12],属于低H、低Alpha角散射或中H、低Alpha角散射。Wishart分类器对散射功率具有一定的依赖性,这些地物由于散射强度较低,很容易被划分为同一类别[14],据此,本文选取分类结果中散射强度最低的一类作为弱散射类别提取结果。
对分类提取的弱散射类别进行形态学处理。首先对弱散射类区域进行闭运算,使得水体区域连通;然后进行开运算,去除细小的斑块,最终提取出连通的桥梁场景区域。
1.3 桥梁目标辨别
在SAR影像中进行目标检测往往会产生大量的虚警,桥梁检测的虚警主要出现在城区中,特别是处于植被环绕中的房屋;而桥梁场景区域的虚警目标比较少。据此,目标辨别步骤首先利用桥梁的场景特征,将桥梁场景区域与桥梁检测结果进行掩膜处理,消除陆地区域虚警。
桥梁场景区域的虚警目标主要是船只、小岛及系统斑块噪声,采用霍夫变换法结合桥梁特征判别的方式进行剔除。霍夫变换[15]通过对图像进行像素空间和坐标参数空间的转换提取出线状目标;利用桥梁在影像中的以下特征对霍夫变换的结果(线段目标)进行限定、辨别,并将符合条件的目标作为最终的桥梁识别结果。
(1) 依据公路工程技术标准(JTGB01-2003),大型及特大型桥梁的长度通常为100 m到3 200 m,以此限定霍夫变换提取线段的长度;
(2) 桥梁位于道路与河流的交叉点位置,而且属于强散射目标,因此在强度影像中桥梁目标的平均亮度Iwatear、桥梁一端陆地区域的平均亮度Iland和桥梁一侧水体区域的平均亮度Ibridge存在以下关系:
$$ {I_{{\rm{water}}}} < {I_{{\rm{land}}}} < {I_{{\rm{bridge}}}} $$ (3) 桥梁在水体上存在多条散射路径,可能会形成多个成像目标,仅保留其中一个作为识别结果。
2 实验与分析
2.1 实验数据
XSAR系统的空间分辨率为0.4 m,在X波段成像,工作频率为9.6 GHz,选取中国海南省陵水县的影像进行实验。AIRSAR系统的C波段影像的方位向分辨率为8.2 m,距离向为6.7 m,选取美国旧金山地区的影像进行实验。图 2显示了两个实验区的Pauli-RGB合成图,图 2(a)为XSAR图像,图像大小为2 300像素×2 100像素,桥梁目标为陵水县椰林大桥和陵水大桥,总长均小于300 m,属于大型桥梁中较小的类型;图 2(b)为AIRSAR图像,图像大小为902像素×960像素,桥梁目标为旧金山金门大桥,总长度为2 737 m,属于特大型桥梁。
2.2 影像统计分布模型验证
从图 2(a)的XSAR影像中分别选取水体和陆地两种地物覆盖的影像块进行验证。将两个影像块均分割成100个20×20像素的子块分别计算CVM距离,结果如图 3所示,横轴为影像块的编号,纵轴为相应影像块计算的CVM距离。统计两个影像块中计算的CVM距离,水体区域有38%、陆地影像块有28%的子块,Weibull分布的CVM距离大于Gamma分布,这表明Weibull分布模型比Gamma分布模型更接近高分辨率SAR影像的统计分布特征,适用于影像桥梁检测的应用。
2.3 桥梁识别结果与分析
图 4为采用SAR影像进行桥梁目标CFAR检测的结果。两幅影像中的桥梁目标均能够被检测出来,但由于两个实验区的情况差别较大,检测结果存在一定差别。首先,陵水县实验区的虚警目标远多于旧金山实验区,这是由于高分SAR影像中大量的小角反射器及硬目标散布在面状地物中,它们在影像中以亮斑的形式存在,容易被CFAR检测器检测出来;两实验区影像的空间分辨率相差20倍,虚警情况差别较大。其次,旧金山实验区桥梁部分呈现3条亮线,为同一桥梁的单次散射、偶次散射和三次散射成像;而陵水县实验区较为杂乱,由于陵水大桥相对于金门大桥要小近10倍,且桥身到水面的距离太短,三种散射路径长度差别不大,在影像中三种散射相互混叠。
图 5是利用WHA分类提取的弱散射类别。两个实验区的水体区域都能够被完整地提取出来,但由于小岛和噪声的影响,出现了一些空洞。陵水县实验区水体与道路、裸土等弱散射地物难以区分;而旧金山实验区影像分辨率较低,道路、裸土等地物在影像中不明显,提取结果较为准确。
图 6是将弱散射类区域进行形态学处理得到的结果,其中,桥梁场景区域被连通为一个整体,陆地区域一些较细小的斑块被剔除;然而在陵水县实验区,仍存在部分陆地区域。形态学处理仅能降低道路、裸土等弱散射地物对桥梁场景区域提取的影响,却不能完全将其去除;当前在高分影像中精确提取水体仍旧是个难点,因此桥梁目标识别方法需要考虑到这个因素,不能过于依赖桥梁场景区域提取的精度。
图 7是掩膜处理结果,两个实验区的桥梁目标像素都被保留下来,但是虚警去除的效果差别很大。旧金山实验区提取的桥梁场景区域较为准确,通过掩膜处理就能去除绝大部分的虚警;而陵水县实验区的桥梁场景区域提取并不准确,结果中仍存在一些点状的虚警目标。由此可以看出,桥梁场景区域的提取精度对掩膜的效果具有较大影响,而在当前提取精度不高的情况下,采用其他方法剔除虚警则是必要的。
经过霍夫变换和桥梁特征辨别,将最终识别结果用绿线显示在Pauli-RGB图像上,效果如图 8所示。陵水县实验区的两座桥梁的识别位置和长度都较为准确,影像下部的桥梁场景中存在较多的沙洲和滩涂,本文方法仍能将其完整地识别出来,表明本文方法能够适用于影像分辨率为分米级、桥梁场景复杂、桥梁目标较小的复杂情况。同时在空间分辨率为米级的旧金山实验区影像上,桥梁的识别结果也比较理想;综合这两种情况,表明本文算法对不同状况的影像具有较好的适应性。
3 结语
本文针对影像分辨率为分米级、桥梁场景复杂、桥梁目标较小的复杂情况,提出了一种新的桥梁自动识别方法;并采用XSAR和AIRSAR影像数据进行了实验验证,均取得了令人满意的结果,证明该方法具有较好的适应性。
然而,基于WHA分类和形态学处理的桥梁场景提取方法在复杂情况下的效果还不够理想,这是今后桥梁目标自动识别研究需要解决的问题。
-
期刊类型引用(19)
1. 钟丽娜,陈慧玲,刘潇,周文军. 面向新工科的高校物联网专业实践平台探索与构建. 高教学刊. 2025(04): 73-77 . 百度学术
2. 王志恒,徐彦彦. 室内定位隐私保护综述. 通信学报. 2023(09): 188-204 . 百度学术
3. 施闯,张雨露,辜声峰,景贵飞. 构建中国时空体系保障时空信息安全服务的探讨. 导航定位学报. 2023(06): 1-7 . 百度学术
4. 张雨露,范磊,刘江梅,李桢. 商业低轨通信星座纳入国家综合PNT体系的可行性分析. 导航定位学报. 2022(02): 26-36 . 百度学术
5. 邓玥,余江,郭文飞,陈起金,刘经南. 信号遮挡环境下融合TOA/AOD的5G/SINS组合导航算法模型与精度分析. 武汉大学学报(信息科学版). 2022(07): 1133-1139 . 百度学术
6. 胡青松,钱建生,李世银,孙彦景,张朕. 全源矿井定位:一种智能煤矿位置服务新范式. 工矿自动化. 2021(01): 1-8+14 . 百度学术
7. 张传明,杨玲玲,刘敏,李伟,贾海禄,蒋方胜,李成洲. 面向海量智能终端的云定位系统设计与实现. 武汉大学学报(信息科学版). 2021(12): 1872-1880 . 百度学术
8. 姜卫平,郭迟,左文炜. 我国导航与位置服务的进展及思考. 测绘通报. 2020(01): 7-10+25 . 百度学术
9. 胡宁松,方文涛,辜声峰,楼益栋. 大众智能手机精密定位与结果分析. 测绘通报. 2020(01): 11-15 . 百度学术
10. 景贵飞. 片上时空系统及综合时空网管发展分析. 全球定位系统. 2020(02): 1-6 . 百度学术
11. 桑玲玲,周同,谢彧,章远钰. 农田建设现场调查技术分析及云平台构建. 中国农业信息. 2020(01): 30-38 . 百度学术
12. 景贵飞. 综合时空体系网络管理系统内涵及框架分析. 测绘地理信息. 2020(06): 1-6 . 百度学术
13. 景贵飞. 北斗三号系统全球导航与位置服务技术创新的分析. 卫星与网络. 2020(07): 54-59 . 百度学术
14. 王毅鹏,张永志,赵超英,李宇磊,张腾飞. 云计算技术下的滑坡监测云平台设计——以陕西泾阳为例. 测绘通报. 2019(03): 128-132+136 . 百度学术
15. 施闯,辜声峰,景贵飞,耿江辉,楼益栋,唐卫明. 雾定位及其应用研究. 全球定位系统. 2019(05): 1-9 . 百度学术
16. 沈磊贤,庞佳逸,张卿云,徐鹤. 基于北斗导航的定位服务平台设计与实现. 计算机技术与发展. 2019(01): 173-177 . 百度学术
17. 李靖平. 一种基于公共地标配置的云数据定位算法. 佛山科学技术学院学报(自然科学版). 2018(04): 20-23+28 . 百度学术
18. 刘文建,邓思胜,丁华祥,陈敬,贺喜. 基于CORS位置云服务的高并发技术研究. 全球定位系统. 2018(04): 67-72 . 百度学术
19. 李林阳,吕志平,崔阳,王宇谱,周海涛. 海量GNSS小文件云存储优化方法研究. 武汉大学学报(信息科学版). 2017(08): 1068-1074 . 百度学术
其他类型引用(5)
计量
- 文章访问数: 844
- HTML全文浏览量: 73
- PDF下载量: 225
- 被引次数: 24