快速检索        
  武汉大学学报·信息科学版  2016, Vol. 41 Issue (2): 190-195

文章信息

殷亚秋, 李家国, 余涛, 鞠颂, 米晓飞, 侯海倩
YIN Yaqiu, LI Jiaguo, YU Tao, JU Song, MI Xiaofei, HOU Haiqian
结合正则化最小二乘进行高空间分辨率四波段相机云识别
Cloud Recognition for Four Bands Cameras of High Spatial Resolution Combined with the Regularized Least Squares Algorithm
武汉大学学报·信息科学版, 2016, 41(2): 190-195
Geomatics and Information Science of Wuhan University, 2016, 41(2): 190-195
http://dx.doi.org/10.13203/j.whugis20140208

文章历史

收稿日期: 2014-12-17

结合正则化最小二乘进行高空间分辨率四波段相机云识别
殷亚秋1,2, 李家国2 , 余涛2, 鞠颂2, 米晓飞2, 侯海倩2    
1. 中国国土资源航空物探遥感中心, 北京, 100083;
2. 中国科学院遥感与数字地球研究所, 北京, 100101
摘要: 针对资源三号(ZY-3)多光谱影像的特点,提出一种结合最小二乘原理与阈值法的云检测方法。在阈值法进行初始云提取的基础上,利用正则化最小二乘进行云像元的再次提取,克服了高分辨率遥感影像上云与道路、房屋等地物容易混淆的问题。与现有云检测方法进行对比,利用阈值法与正则化最小二乘进行云检测的整体精度和Kappa系数明显高于阈值法、阈值与K均值聚类相结合的方法,达到了支持向量机云检测方法相同的精度水平,但是效率明显高于后者。将该方法应用于不同时相和场景的遥感影像,算法云像元提取的整体精度在97%以上,Kappa系数在0.9以上。分析表明,该算法能够对不同下垫面情况下的云像元进行有效地识别。
关键词: 云检测     正则化最小二乘     高空间分辨率     ZY-3多光谱影像    
Cloud Recognition for Four Bands Cameras of High Spatial Resolution Combined with the Regularized Least Squares Algorithm
YIN Yaqiu1,2, LI Jiaguo2 , YU Tao2, JU Song2, MI Xiaofei2, HOU Haiqian2    
1. China Aero Geophysical Survey & Remote Seusing Ceater for Land and Resources, Beijing 100083, China;
2. Institute of Remote Sensing and Digital Earth, Chinese Academy of Sciences, Beijing 100101, China
First author: YIN Yaqiu, master, specializes in the object recognition and data assimilation of high spatial resolution remote sensing image. E-mail: yinyaqiu@126.com
Corresponding author: LI Jiaguo,PhD, associate professor. E-mail: jacoli@126.com
Foundation support: The National Natural Science Foundation of China, No. 41301388.
Abstract: This article presents a new cloud detection method combining regularized least squares algorithm and threshold method based on the characteristics of Chinese ZY-3 multispectral imagses. In the process of the new method, second extraction of clouds using a regularized least squares algorithm is done based on a first extraction of clouds using the threshold method, which overcomes confusion of clouds, roads, and buildings. Compared to existing cloud detection methods, the accuracy of the new method is subjectively visibly higher than the threshold method and the K-means clustering combined with threshold method, achieving the same level of accuracy as a support vector machine combined with the threshold method for higher efficiency. Using the new method on different scenes collected at different time, the overall accuracy of the proposed cloud detection method is higher than 97% and the Kappa coefficient is higher than 0.9. These results show that the new method can detect cloud effectively in the case of different underlying surfaces. It is anticipated that this method will be popularized and further applied to imagery from other satellite systems.
Key words: cloud recognition     regularized least squares algorithm     high spatial resolution     ZY-3/MUX image    

资源三号(ZY-3)卫星是我国2012年1月9日发射的第一颗自主的民用高分辨率立体测绘卫星。在该卫星影像应用中,如何准确地进行云检测,实现云与晴空的分离是影像预处理工作的重要环节。

目前,国内外具有代表性的云检测算法有各种光谱综合的阈值方法、统计分析方法、BP神经网络法以及支持向量机方法。阈值法主要是对像元不同通道的反射率、亮温以及亮温差与设定阈值的比较来判断云像元,如ISCCP[1, 2](International Satellite Cloud Climatology Project)方法、APOLLO[3](The AVHRR Processing Scheme Over Cloud Land and Ocean)方法、MODIS[4, 5, 6]云检测算法等。另一类比较成熟的遥感图像分类方法是统计模式识别方法,如刘志刚和李云祥利用动态聚类的方法进行MODIS云检测[7]。Clark等[8]对AVHRR数据进行分析,采用神经网络方法进行航迹云的识别,取得了比传统的边缘检测算法更好的效果。但是,BP神经网络的结构难以确定,容易陷入局部极小值。针对此问题,Chen Gang等[9]利用支持向量机对冰雪覆盖区域的ASTER数据进行了云提取,取得了良好的效果。

上述算法立足于云与非云像元在多个波段的成像特征差异,依赖于波段的选择。将这些方法直接应用到资源三号卫星上,并不能达到很好的效果。结合资源三号影像的特点,本文提出一种新的结合光谱阈值和正则化最小二乘(regularized least squares,RLS)的云检测方法,并将其与已有方法进行对比分析和评价。

1 实验数据

资源三号卫星的多光谱相机有4个波段,分别为0.45~0.52 μm、0.52~0.59 μm、0.63~0.69 μm和0.77~0.89 μm,分辨率均为6 m。本文选择2013年8月31日成像的山西省神池县附近区域2 500×2 500大小影像作为典型区域,对阈值与正则化最小二乘相结合的云检测算法与现有算法进行对比评价。选择10幅大小为1 000×1 000的不同时相、不同场景的资源三号影像对新方法的普适性进行验证评价。

2 正则化最小二乘原理

正则化最小二乘是在再生核希尔伯特空间H中,寻找函数f,使得在训练样本S={(x1,y1),…,(xn,yn)}范围内式(1)最小化。

式中,xn×d的输入向量,{x1T,…xnT}⊂Rdyn×1的类别标记向量,{y1,…,yn}⊂Rn为输入的样本点数据的个数;d为样本点数据维数。这里引入半正定核函数Kij=k(xi,xj),根据表现定理,f(xi)的表达形式可为:

fH2k(·,xj)是再生核希尔伯特空间中的函数,因此满足∀xj,<f,k(·,xj)> H=f(xj)成立。对‖fH2进行推导,最终可得到式(3)形式,带入到式(1)中,并对未知量cλ求导,得到式(4):

最终,寻找函数f∈H的问题转化为了求解cλ的问题。正则化最小二乘利用“留一法”交叉验证来确定λ。对于训练样本中的每个点xi,利用其他n-1个点来建立分类器,利用第i个点来进行验证,计算分类器的误差,不断调整λ的值直到分类器的误差为最小。利用误差最小情况下的分类模型来对测试样本进行预测。

3 结合正则化最小二乘与阈值法的云检测

基于阈值与正则化最小二乘的云检测算法通过多光谱阈值法得到云像元的初始提取结果,利用该结果对初始分类的影像进行掩膜。运用正则化最小二乘方法对掩膜后影像进行云与道路、房屋、基岩裸地的区分。最后进行噪声的去除,得到最终的云提取结果。技术流程如图 1所示。

图 1 基于正则化最小二乘与阈值法的云检测流程图 Fig. 1 Flowchart of Cloud Detection Based on RLS Algorithm and Threshold Method
3.1 动态阈值法初始云提取

云在可见光波段的反射率高于植被、土壤、水体等下垫面,在近红外通道也具有较高的反射率,且与可见光通道的反射率差异不大,但是植被的差异很大,这是云的典型光谱特征[10, 11, 12]图 2为研究区不同地物与云的光谱比对。在可见光波段,云的反射率相比较于植被、水体、农田、房屋a较高。在近红光波段云和一些岩石裸地、植被、道路和房屋都具有较高的反射率,因此难以单独利用该波段进行云提取。而云在近红外波段与红波段的差异比植被的要小而比道路、房屋和岩石裸地的大。利用阈值法进行初始云识别算法为:

式中,a、bc1c2为云识别的阈值参数。阈值参数受到成像时的光照和大气等特征影响,存在一定的波动性。阈值范围过窄只能识别厚云中心;阈值范围过宽识别结果通常会受到其它高亮地物的干扰。范围较宽的阈值包含较完整的云信息,且可通过进一步处理对识别结果进行非云去除。

图 2 实验区典型地物平均光谱反射率曲线 Fig. 2 Average Spectral Reflectance of the Typical Object in the Study Area

熊显明等[13]利用IKONOS影像进行白泡云光谱进行分析,得出在谱段0.45~0.52 μm处,云的反射率在0.25以上;程天海等[14]通过对CBERS-02B星的CCD数据进行光谱统计分析得出在0.63~0.69 μm波段处,晴空数据地物的反射率在0~0.3之间,云的反射率明显高于下垫面,因此本文选择a=0.25,b=0.3。另外,研究发现,利用ρ0.86/ρ0.645可以判断云边缘和云阴影像素,值在0.8~1.6的像素可以判断为云,本文选择c1=0.8,c2=1.6。

利用阈值法在提取云的同时把部分房屋a、道路和岩石裸地也提取了出来,需要进一步对非云像元进行去除。利用初步提取的云图对多光谱影像进行掩膜,使非云区域的值为0,被初步识别的云区域数值保持不变,以便后文利用正则化最小二乘方法进行云与房屋、道路以及岩石裸地的区分。

3.2 正则化最小二乘方法应用

本文采用的正则化最小二乘算法来自于Andrea Tacchetti等人开发的基于正则化最小二乘损失函数回归和分类软件库。选用GURLS软件进行监督分类,选择四个波段的反射率作为特征向量,实现过程分为以下步骤。

1) 选择训练样本。将影像分为伪云,云和背景。背景点是掩膜掉的区域,4个波段的值都为0。本文选择130个样本点。

2) 将选择的训练样本数据和测试数据转换成GURLS软件采用的统一格式。

3) 选择输入参数。本文利用高斯核函数进行实验,选择输入参数如表 1所示。

表 1 GURLS软件参数输入 Tab. 1 Input Parameters of GURLS
参数选择项所选参数
模型参数λσ
核函数高斯核函数
正则化最小二乘
优化方法
对偶优化方法
预测核心矩阵训练点和测试点之
间核心矩阵
类别预测方法对偶优化方法
预测精度计算方法计算每类别平均分
类精度

所选高斯核函数为:

对于λσ的确定,首先计算训练样本点之间的距离并进行升序排序,取第前1%处的距离为σ的最小值,取距离最大值为σ的最大值,插值得到25个σ值。将每个σ对应的一个确定的核函数矩阵K代入式(4)中,利用留一法求得每个σ对应的一组λ值和每个λ对应的所有类别的精度。其中λ值的取值范围根据经验进行选择,同样插值得到20个λ。计算不同σλ情况下训练样本中所有类别的精度和,取最高精度和对应的σλ为最终模型参数。

4) 执行分类。根据选择的输入参数对输入样本进行训练,得到分类器模型,进行测试数据的预测。

5) 分类结果输出。GURLS对进行预测的分类结果转换为图像形式进行输出。

对以上步骤得到的分类结果采用开-闭滤波来实现图像的平滑去噪,得到最终云检测结果。

3.3 结果比对与分析

本文选择三种现存的具有代表性的方法进行对比分析,三种现存方法分别为阈值法、阈值与K均值聚类相结合的云检测方法、阈值与支持向量机相结合的云检测方法。

3.3.1 精度分析

为了对现有方法和本文提出的方法进行比对分析和精度验证,本文借助于Google Earth工具利用原始的多光谱影像和全色影像对实验区进行人工目视解译,将解译结果作为精度评价本底参考图像,所得四种方法的精度评价结果如表 2所示。

表 2 4种方法云检测精度 Tab. 2 Cloud Detection Accuracy of the Four Methods
阈值法 阈值+K均值聚类 阈值+SVM 阈值+RLS
PA/% 99.14 90.39 98.94 98.09
UA/% 78.88 81.54 98.48 99.63
OA/% 99.45 99.39 99.95 99.95
Kappa 0.89 0.85 0.99 0.99

利用阈值法进行云检测,在保证云边缘、薄云以及半透明云能够识别出的同时也把与云光谱相似的地物一起提取出来了。利用阈值+K均值聚类进行云检测并没有取得像MODIS数据一样好的效果,这是因为聚类算法很大程度上依赖于输入的特征向量。MODIS传感器光谱波段远大于资源三号影像,且具有能够有效对房屋和道路进行识别的红外波段。阈值+SVM与阈值+RLS两种方法进行云检测取得了很好的效果,城市区域被误判的房屋、道路和岩石裸地大部分被准确地进行了判别。云检测的产品精度(PA)、用户精度(UA)和整体精度(OA)达到了98%以上,Kappa系数达到0.99。

3.3.2 资源消耗分析

支持向量机方法虽然能够得到很好的云检测效果,但是算法复杂。求解支持向量机模型需要求解二次凸优问题,算法的时间复杂度为O(N3)(N为输入的训练样本数量),算法的复杂度随着样本集合的增大而迅速增加,效率和速度直接影响着对于资源三号影像的适用性。与支持向量机不同,正则化最小二乘方法将求解一个凸二次规划过程转化为求解一组线性方程的过程,算法的时间复杂度由O(N3)降为O(N2)。

实际运算中,对于2 500×2 500的实验区域影像,样本点为130个,利用支持向量机方法对测试数据集进行分类,算法运算时间为33 s。而在相同的硬件环境下,正则化最小二乘方法运算时间可控制在2 s以内。综合算法的精度和运算效率,正则化最小二乘和阈值法相结合进行云检测方法更适用于资源三号高分辨率影像。

3.3.3 不同时相场景云检测结果与分析

本文选择10幅不同时相、不同场景的遥感影像,如表 3所示。图 3图 5为10幅影像真彩色合成图,图 4图 6为利用阈值与正则化最小二乘相结合进行云检测结果,图中影像按照从左到右递增的编号顺序,表 4为10景影像的云检测精度。对于下垫面比较复杂的1号、2号和4号影像,阈值与正则化最小二乘相结合的算法能够很好的将云与建筑物、道路、侵蚀岗地进行区分,只有1号影像中少量的半透明云没有被识别出。对于下垫面单一的3号、5号和6号影像,算法不仅能够识别出厚云,对于薄云与半透明云也能够完整地识别出。对于7号和8号影像,算法能够有效地将云与岩石裸地进行区分,只有对与岩石裸地相重叠的少量半透明云无法进行识别。9号与10号影像的下垫面主要为与云像元极难进行区分的雪。从结果看,9号影像检测效果较好。这是因为9号影像为薄雪,而10号影像为块状积雪和裸露岩石。从图 6中可以看出,10号影像中部分容易与雪和裸露岩石相混淆的薄云没有检测出来。因此,表 4中10号影像云检测的精度与其它影像比相对较低。整体来看,对于不同时相不同场景的影像,阈值法与正则化最小二乘相结合的算法的整体精度在97%以上,Kappa系数在0.9以上,该算法能够有效地识别云像元。

表 3 不同时相场景影像信息 Tab. 3 Information of Different Scenes with Different Time
编号 下垫面主要地物 获取时间 影像轨道号
1 建筑物、道路、植被 20130729 P=889,R=142
2 建筑物、道路、裸土、水体 20130502 P=883,R=111
3 植被、道路 20130614 P=895,R=91
4 侵蚀岗地、裸土、水体、植被 20130502 P=883,R=111
5 海面 20131218 P=891,R=127
6 海面 20131119 P=886,R=128
7 植被、裸露岩石 20130716 P=28,R=141
8 植被、裸露岩石 20130716 P=28,R=141
9 雪、裸土、植被 20131027 P=31,R=150
10 雪、裸露岩石、裸土 20120321 P=871,R=118
图 3 第1~5号遥感影像真彩色合成图像 Fig. 3 True Color Images of Number 1 to 5 Remote Sensing Images
图 4 第1~5号遥感影像结合正则最小二乘云检测结果图 Fig. 4 Cloud Detection Result of Number 1 to 5 Remote Sensing Images
图 5 第6~10号遥感影像真彩色合成图像 Fig. 5 True Color Images of Number 6 to 10 Remote Sensing Images
图 6 第6~10号遥感影像结合正则最小二乘云检测结果 Fig. 6 Cloud Detection Result of Number 6 to 10 Remote Sensing Images
表 4 不同时相场景影像云检测精度 Tab. 4 Cloud Detection Accuracy of Different Scenes
编号 PA/% UA/% OA/% Kappa
1 96.06 99.73 99.59 0.98
2 98.75 99.40 99.84 0.99
3 99.44 99.70 99.81 0.99
4 98.15 99.84 99.89 0.99
5 99.22 99.95 99.78 0.99
6 99.66 99.92 99.90 0.99
7 97.31 99.93 99.81 0.99
8 97.34 99.87 99.86 0.99
9 97.23 91.46 98.61 0.93
10 85.51 98.73 97.61 0.92
4 结 语

本文提出了一种结合最小二乘原理与阈值法的新的云检测方法。首先,利用阈值法进行初始云提取,对提取后的多光谱影像进行云掩膜;然后,利用正则化最小二乘进行云与房屋、道路、岩石裸地的区分,实现云像元的再次提取;最后,对提取的结果进行形态学原理的噪声去除,得到最终的云检测结果。

选取典型的研究区域,将该方法与现存的云检测方法——阈值法、阈值与K均值聚类相结合的方法、阈值与支持向量机相结合的方法进行对比。综合云检测的精度和算法的效率,结合最小二乘原理与阈值法的云检测方法在资源三号影像应用上具有更好的效果和更大的优势。利用该算法对不同时相不同场景的遥感影像进行云检测,云像元提取的整体精度在97%以上,Kappa系数在0.9以上。该算法能够很好地识别下垫面地物类型复杂的云像元,值得在国产遥感数据云检测中推广应用。

参考文献
[1] Schiffer R A, Rossow W B. The International Satellite Cloud Climatology Project(ISCCP):The First Project of the World Climate Research Program[J]. Bulletin of the American Meteorological Society, 1983, 66:1498-1505
[2] Rossow W B, Garder L C. Cloud Detection Using Measurements of Infrared and Visible Radiance for ISCCP[J]. Journal of Climate, 1993, 6:2341-2369
[3] Saunders R W, Kliebel K T. An Improved Method of Detecting Clear Sky and Cloudy Radiances from AVHRR Data[J]. International Journal of Remote Sensing, 1998, 9:123-150
[4] Li Wei, Fang Shenghui, Dian Yuanyong, et al. Cloud Detection in MODIS Data Based on Spectrum Analysis[J]. Geomatics and Information Science of Wuhan University, 2005, 30(5):435-443(李微, 方圣辉, 佃袁勇,等. 基于光谱分析的MODIS云检测算法研究[J]. 武汉大学学报·信息科学版, 2005, 30(5):435-443)
[5] Wang Jiacheng, Yang Shizhi, Ma Jinji, et al. Automatic Cloud Detection Applied to MODIS Image in the Southeast of China[J]. Geomatics and Information Science of Wuhan University, 2006, 31(3):270-273(王家成, 杨世植, 麻金继,等. 东南沿海MODIS图像自动云检测的实现[J]. 武汉大学学报·信息科学版, 2006, 31(3):270-273)
[6] Sang S P, Jhoon K, Jaehwa L, et al. Combined Dust Detection Algorithm by Using MODIS Infrared Channels Over East Asia[J]. Remote Sensing of Environment, 2014, 141:24-39
[7] Liu Zhigang, Li Yuanxiang, Huang Feng. Cloud Detection of MODIS Satellite Images Based on Dynamical Cluster[J]. Remote Sensing Information, 2007, 4:33-35(刘志刚,李元祥,黄峰. 基于动态聚类的MODIS云检测算法[J]. 遥感信息, 2007, 4:33-35)
[8] Clark C, Boyce J. The Detection of Ship Trail Clouds By Artificial Neural Network[J]. International Journal of Remote Sensing, 1999, 20(4):711-726
[9] Chen Gang, E Dongchen. Support Vector Machines for Cloud Detection over Ice-Snow Areas[J]. Geo-spatial Information Science, 2007, 10(2):117-120
[10] Yang P, Baum B A. Satellite Remote Sensing. Cloud Properties[M]. London:Academic Press Inc, 2003
[11] Quan Junhe. A Daytime Cloud Detection Algorithm for FY-3A/VIRR Data[J]. International Journal of Remote Sensing, 32(21):6811-6822
[12] Quan Junhe. Night-time Cloud Detection for FY-3A/VIRR Using Multispectral Thresholds[J]. International Journal of Remote Sensing, 34(8):2874-2887
[13] Xiong Xianming, Chang Junfang, Teng Huizhong. Research on Identification of Whitecaps and Bubble Clouds in IKONOS Images[J]. Remote Sensing Information, 2010, (2):69-72(熊显明, 常俊芳, 滕惠忠. IKONOS影像白泡云识别方法研究[J]. 遥感信息, 2010, (2):69-72)
[14] Cheng Tianhai, Li Li, Gu Xingfa, et al. Cloud Detection Based on CBERS-02B/CCD data[OL]. http://www.cresda.com/n16/n1115/n1522/n2149,2010(程天海, 李丽, 顾行发等. 基于CBERS-02B星CCD数据的云识别[OL]. http://www.cresda.com/n16/n1115/n1522/n2149,2010)