文章信息
- 王云艳, 何楚, 涂峰, 陈东, 廖明生
- WANG Yunyan, HE Chu, TU Feng, CHEN Dong, LIAO Mingsheng
- 特征选择双层SVM的融合算法用于极化SAR图像分类
- PolSAR Image Classification Using Feature Fusion Algorithm Based on Feature Selection and Bilayer SVM
- 武汉大学学报·信息科学版, 2015, 40(9): 1157-1162
- Geomatics and Information Science of Wuhan University, 2015, 40(9): 1157-1162
- http://dx.doi.org/10.13203/j.whugis20140351
-
文章历史
- 收稿日期:2014-04-30
2. 湖北工业大学电气与电子工程学院, 湖北 武汉, 430068;
3. 武汉大学电子信息学院, 湖北 武汉, 430072;
4. 国防科技大学, 湖南 长沙, 410073
2. School of Electrical and Electronic Engineering, Hubei University of Technology, Wuhan 430068, China;
3. Electronic and Information School, Wuhan University, Wuhan 430072, China;
4. National University of Defense Technology, Changsha 410073, China
合成孔径雷达(synthetic aperture radar,SAR)[1]是一种主动微波成像雷达,不仅能全天候、全天时获取数据,而且能穿透云雾、烟尘并大面积获取地表图像信息,尤其适用于传统光学传感器成像困难的地区。传统的单极化SAR仅能获得某种极化状态下的目标散射信息,而全极化SAR图像能提取不同极化状态下的目标极化散射特性,其突出特点是获取的目标信息更丰富,这为信息挖掘提供了可能。因此,在目标识别、分类等领域极化SAR比普通SAR更具有优势。
随着极化SAR图像自动目标识别技术的快速发展,用于极化SAR图像分类的特征及变换方法也不断涌现,主要包括:(1)视觉特征,常见的有点特征、线特征、区域特征和纹理特征,如文献[2]提出采用灰度共生矩阵(gray level co-occurrence matrix,GLCM)的纹理特征对高分辨率SAR图像建筑区进行提取,而文献[3]则提出将图像的灰度和纹理特征、空域和频域特征结合起来用于SAR图像的分类;(2)电磁特征,较为常见的有散射中心特征、极化特征,早在1999年文献[4, 5]就开始利用极化分解特征进行SAR图像的分类,文献[6]在Freeman三分量散射模型的基础上又增加了螺旋散射分量,提出了一种基于四分量散射模型的多极化SAR图像分类;(3)特征变换,在SAR图像解译中常见的特征变换有傅里叶变换、小波变换、主成分分析及核主成分分析等。 如文献[7]提出了一种基于小波变换和马尔科夫随机场的极化SAR图像自动分类方法,而文献[8]则提出了一种基于学习的特征变换算法来进行极化SAR图像分类。
然而,单一特征对SAR图像的描述能力有限,如果图像的类间变化较小,而类内变化较大,若只使用一种类型的特征,则可能出现个别类识别准确率较低的现象。
针对上述问题,目前主要有两种解决方法:(1)通过多特征组合提高平均识别率。例如,文献[9]使用6种特征识别Caltech-101数据集;(2)采用特征融合[10]算法充分利用特征间的完备性和互异性,以形成更有效的特征组合,如多核学习和线性规划增强。
虽然这些方法能够部分解决单一特征在图像分类中的局限性,但还存在以下问题:(1)所有特征都送到一个处理中心进行分类和组合,需要同时学习特征权向量和分类器,经常会出现因数据量过大而引起的内存溢出、学习时间过长等问题;(2)各类特征的融合必定导致冗余,从而可能产生过度拟合的现象。
基于上述问题[11],本文提出了一种基于特征选择[12]双层支持向量机的融合算法(feature selection-bilayer-support vector machine,FS-BSVM),主要从两个方面论述:(1)针对不同类别进行特征选择,这样,在第1层支持向量机(support vecter machine,SVM)中,特定类别可以利用不同的特征子集而获得较高的分类准确率,避免了各类特征的简单组合导致的特征冗余和过度拟合现象。(2)由于单层SVM模型对训练样本选择要求严格,且易造成错分现象,因此引入多层的思想,构造双层SVM分类模型,对单层类别概率进行优化和再处理。
1 特征提取与最小冗余最大关联特征选择算法 1.1 特征提取为充分提取极化SAR图像信息,本文提取了4种类型的特征,分别为:(1)极化分解特征[6](31维),如表 1所示;(2)高斯马尔科夫随机场特征[13](Gaussian Markov random fields,GMRF)(6维);(3)灰度共生矩阵特征(gray level co-occurrence matrix,GLCM)[2](8维);(4)基于测量数据的极化特征(6维)。特征总维数为51维[14]。
特征描述 | 维数 | ||
Pauli | 3 | ||
相干分解 | Krogager SDH | 3 | |
Cameron | 3 | ||
Huynen | 3 | ||
极化SAR | Barnes | 3 | |
非相干分解 | Four-Component | 4 | |
Freeman | 3 | ||
Holm | 3 | ||
Cloud | 3 | ||
OEC | 3 |
特征向量内不同特征分量的幅度变化较大,而且不同特征向量的物理意义也不同,相似距离的可比性差。因此,在利用多种类型特征进行图像分类时,不仅要对特征向量内部的特征分量进行归一化处理,还需要对不同特征向量再进行归一化,这样才能保证不同特征在同一准则下进行选择。本文所使用的4种特征都经过归一化处理,并依次串接起来作为图像数据的新特征,便于下一步处理。
1.2 最小冗余最大关联特征选择最小冗余最大关联(minimum redundancy and maximum relevance,mRMR)[15]利用互信息衡量不同特征的相关性和冗余度,并根据信息差和信息熵这两个代价函数来寻找特征子集,使得选出的特征与目标类别之间具有最大相关性,且互相之间具有最小冗余度。该算法省去了分类器的训练步骤,可以快速去除大量不相关和冗余的特征,且算法复杂性低,因此可作为特征的预筛选器。
最大相关和最小冗余分别定义为:
式中,Sm为已选的特征集合;m为特征个数;c为目标类别;H(fi|c)表示特征fi在目标类别下的信息熵;H(fi)表示j特征fi的信息熵;I(fi,c)为特征fi与目标类别之间的互信息; I(fi,fj)为特征fi与fj之间的互信息。因此,假定已确定特征集Sm,下一步从{S-Sm}中选择第m+1个特征的公式为:
假设训练数据集为D,全部特征集为S,则mRMR算法的执行过程为:(1)进行初始化操作,S={f1,f2,…,fn},Sm=Ø;(2)对于任意两个输入S的特征fi和fj,计算I(fi,fj)和I(fi,c);(3)根据式(3)可选出特征fl,则Sm=Sm∪{fl},S=S\fl;然后,跳到步骤(2)继续执行,直至选出最优特征子集。
2 基于特征选择双层SVM的特征融合 2.1 双层SVM单层SVM算法可通过非线性变换将低维的特征空间映射到高维特征空间,并通过构建判别函数实现对图像的分类。但单层次分类仅仅通过单方面的计算,得到每个像素属于每种类别的概率,然后取其中概率最大的类别,实现对图像的分类。这种分类方法一次性将像素归为具体的类别,对训练样本的选择有很高的要求,而且容易造成错分现象。
本文引用多层的思想,多层分类可以在不同的层次中,使用不同的信息对数据进行处理,分层解决不同的分类需求,对于单层的错分现象也可以进行相应的改善。双层SVM流程图如图 1所示,具体步骤为:(1)针对每个类别分别进行特征选择,选择出最适合把该类识别出来的最优特征子集;(2) 构造线性判别函数和超平面,将每种类别的最优特征子集分别通过第1层SVM分类器,得到每个像元属于类A、类B…的概率,假设一共有n个类,则每个像元有n个概率α1,α2,…,αn;(3)将每个像素的n个概率作为像素的特征,重新导入第2层SVM分类器中进行训练;(4)根据训练参数,结合概率特征对图像进行分类,得到最终的分类结果。
2.2 FS-BSVM算法基于FS-BSVM算法的极化SAR图像分类框架如图 2所示。首先,针对单一特征表示图像不能满足分类需要的问题,多种类型的特征被引入到了本文模型中。在本文算法中分别提取了4类特征,分别为:(1)极化分解特征;(2)GMRF;(3)GLCM;(4)基于测量数据的极化特征。由于不同特征的物理意义不同,若基于某个特征计算两图像间的相似距离,其范围的差别比较大,相似距离之间的可比性差。因此,在利用综合特征进行图像检索时,需要对不同特征向量进行归一化处理,以保证不同的特征向量在同一准则下进行选择,以期在进行分类时具有相同的作用。
其次,利用空间金字塔[16]将图像的全局特征和局部特征进行组合并分类。由于空间金字塔分块可以得到不同尺度的图像区域信息,因而具有更好的鲁棒性。本文算法采用3层空间金字塔,在第i层上(i=1,2,3)原始图像被划分为2(i-1)×2(i-1)个子块。分别计算每个子块特征向量的均值,则3层的金字塔共得到1+4+16=21维的特征均值向量。假如输入图像的特征向量维数为D,则输出的特征向量维数将变为D×21。
再次,为了不同的特征子集在特定类别中获得较高的分类准确率,采用mRMR方法进行特征选择,从特征空间中寻找与对应类别有最大相关性且相互之间具有最小冗余性的特征。
最后,将不同类别的最优特征子集导入双层SVM。将第1层中得到的每个像素属于各个类别的概率重新串接,作为图像的特征输入到第2层中,得到最终的分类结果。
3 实验与分析 3.1 实验数据本文的实验数据为旧金山海湾地区的AIRSAR图像,如图 3(a)所示,图像大小为900像素×1 024像素。该地区地物地貌类型丰富,包括山地、海洋、湖泊、草坪、建筑等。本文将地物类型设置为山地、水体、建筑和绿地4类,Ground Truth为ARCGIS软件针对同一时期的旧金山地区的真实地表进行的人工判读和标注,如图 3(b)所示。
本文在实验数据的每一类中分别选取10%作为训练数据,另外90%作为测试数据。
3.2 实验设置特征选择的维数设置对分类精度有较大影响。特征维数的增加虽能在一定程度上提高分类精度,但计算代价更高。本文经过空间金字塔后的特征总维数为51×21=1 071维,通过综合考虑实验精度和计算复杂度并反复实验,最终将实验数据中每种类别的最优特征子集维数设置为200维。
为了验证该算法在极化SAR图像分类中的有效性,设置对比实验1为基于极化分解特征和单层SVM 的分类,对比实验2为基于极化分解特征和特征选择双层SVM的分类,对比实验3为基于特征融合和单层SVM的分类。通过不同组实验结果的相互比较,可分别验证特征融合方法相比于单个类型的特征、双层SVM相比于单层SVM的优越性。
3.3 实验结果本文通过分析实验数据中建筑、绿地、水体、山地的分类准确率来评价对比算法及FS_BSVM算法的分类精度,如图 3和表 2所示。
地物 | 极化分解 特征+单层 SVM | 极化分解特征 +特征选择 双层SVM | 特征融 合+单层 SVM | FS_ BSVM |
建筑 | 99.70% | 99.71% | 99.75% | 99.73% |
绿地 | 48.52% | 49.81% | 74.38% | 95.57% |
水体 | 97.11% | 97.10% | 97.98% | 99.17% |
山地 | 64.78% | 72.23% | 83.89% | 99.82% |
加权 平均 | 77.89% | 83.98% | 92.78% | 98.87% |
1) 对比实验1中,绿地很大一部分被错分到了建筑中,准确率仅为48.52%,而山地也有一部分被错分为建筑,因而加权平均准确率最低。
2) 对比实验2和3中,绿地和山地的分类准确率相比于实验1逐渐改善,但仍明显低于FS_BSVM。
3) FS_BSVM的分类结果中,除了建筑区域0.02%的差距,其余类别的分类准确度均优于对比实验。
3.4 实验分析对本文提出的方案和对比实验方案的结果进行分析: (1) 对比实验1是建立在问题的复杂度和结构风险最小原理基础上的,提取的特征比较单一,而本文的样本的数目相对越小,因此导致较低的分类准确率。(2) 对比实验3融合了SAR图像的4种类型的特征,能更全面地描述图像,因此分类准确率较对比实验1明显提高。(3) 对比实验2和FS_BSVM算法是分别在对比实验1、3的基础上由单层SVM变为双层SVM,从实验结果可看出,双层SVM比单层SVM的分类准确率要高,表明双层SVM确实能提高图像的分类准确率。(4) 本文所提出的基于特征选择双层SVM的分类方法,综合了各类特征,同时针对每个类别选取最优特征子集,确保不同的特征子集在特定类别中获得较高的分类准确率,最后双层SVM引入了多层的思想,能够对SAR图像实现较精确的分类。从图 3可明显看出FS_BSVM算法的优越性。
4 结语本文提出了一种基于特征选择双层SVM的特征融合算法,通过mRMR方法能对不同目标类别选取最优的特征子集,且充分利用空间金字塔中不同尺度下的特征,并构建了一个双层SVM模型实现极化SAR图像的分类。相比于单一特征和单层SVM,该算法可极大程度地利用极化SAR图像中的有用信息,而且稳定性较高。实验结果验证了该算法的优越性。下一步的研究方向将考虑此算法效率的优化。
[1] | Oliver C, Quegan S. Understanding Synthetic Aperture Radar Images[M]. Ding Chibiao, Chen Jie, He Guojin. Beijing: Publishing House of Electronics Industry, 2009(Oliver C, Quegan S. 合成孔径雷达图像理解[M]. 丁赤飚, 陈杰, 何国金.北京: 电子工业出版社, 2009) |
[2] | Zhao Lingjun, Qin Yuliang, Gao Gui, et al. Detection of Build-up Areas from High-resolution SAR Images Using the GLCM Textural Analysis[J]. Journal of Remote Sensing, 2009, 13(3): 475-482 |
[3] | Hu Fuyuan, Zhang Yanning, Xue Xiaorong, et al. A Classification Method for SAR Image Based on Tree Wavelet and Gray-Level Co-occurrence Matrix[J]. Systems Engineering and Electronics, 2003, 10(25): 1 286-1 288(胡伏原, 张艳宁, 薛笑荣, 等. 基于树形小波和灰度共生矩阵的SAR图像分类[J]. 系统工程与电子技术, 2003, 10(25): 1 286-1 288) |
[4] | Lee J S, Grunes M R, Ainsworth T L, et al. Unsupervised Classification Using Polarimetric Decomposition and the Complex Wishart Classifier[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(5): 2 249-2 258 |
[5] | Lee J S,Grunes M R, Pottier E, et al. Unsupervised Terrain Classification Preserving Polarimetric Scattering Characteristics[J]. IEEE Transactions on Geoscience and Remote Sensing, 2004, 42(4): 722-731 |
[6] | Zhang Haijian, Yang Wen, Zou Tongyuan, et al. Classification of Polarimetric SAR Image Based on Four-Component Scattering Model[J]. Geomatics and Information Science of Wuhan University, 2009, 34(1): 122-125(张海剑, 杨文, 邹同元, 等. 基于四分量散射模型的多极化SAR图像分类[J]. 武汉大学学报·信息科学版, 2009, 34(1): 122-125) |
[7] | Liu Guoqing, Xiong Hong, Huang Shunji. Automatic Multiresolution Classification of Polarimetric SAR Image with Wavelet Transform and Markov Random Field[J]. Journal of Electronics, 2000, 22(3): 359-365 (刘国庆, 熊红, 黄顺吉. 基于小波变换和马尔科夫随机场的极化SAR图像自动分类[J]. 电子科学学刊, 2000, 22(3): 359-365) |
[8] | He Chu, Liu Ming, Liao Zixian, et al. A Learning-Based Target Decomposition Method Using Kernel KSVD for Polarimetric SAR Image Classification[J]. EURASIP Journal on Advances in Signal Processing, 2012, DOI:10.1186/1687-6180-2012-159 |
[9] | Varma M, Ray D. Learning the Discriminative Power-Invariance Trade-Off[C]. The 11th IEEE International Conference on Computer Vision, Rio de Janeiro, 2007 |
[10] | Gehler P, Nowozin S. On Feature Combination for Multiclass Object Classification[C]. The 12th IEEE International Conference on Computer Vision, Kyoto, 2009 |
[11] | Salehi M, Sahebi M R, Maghsoudi Y. Improving the Accuracy of Urban Land Cover Classification Using Radarsat-2 POLSAR Data[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(4): 1 394-1 401 |
[12] | Sun Z H,Bebis G,Miller R.Object Detection Using Feature Subset Selection[J].Pattern Recognition, 2004, 37(11): 2 165-2 176 |
[13] | Descombes X, Sigelle M, Preteux F. Estimating Gaussian Markov Random Field Parameters in A Nonstationary Framework: Application to Remote Sensing Imaging[J]. IEEE Transactions on Image Processing, 1999, 8(4): 490-503 |
[14] | Wang Chao, Zhang Hong, Chen Xi, et al. Image Processing of Fully Polarimetric Synthetic Aperature Radar[M]. Beijing: Science Press, 2007(王超, 张红, 陈曦,等. 全极化合成孔径雷达图像处理[M]. 北京:科学出版社, 2007) |
[15] | Zhang Lei, Ma Jun.Image Annotation by Incorporation Word Correlation into Multi-class SVM[J]. Soft Computing, 2011, 15(5): 917-927 |
[16] | Lazebnik S, Schmid C, Ponce J. Beyond Bag of Features: Spatial Pyramid Matching for Recognizing Natural Scene Categories[C]. IEEE Conference on Computer Vision and Pattern Recognition, New York, 2006 |