文章信息
- 王凯, 舒宁, 孔祥兵, 李亮
- WANG Kai, SHU Ning, KONG Xiangbing, LI Liang
- 一种多特征转换的高光谱影像自适应分类方法
- A Multi-feature Conversion Adaptive Classification of Hyperspectral Image
- 武汉大学学报·信息科学版, 2015, 40(5): 612-616
- Geomatics and Information Science of Wuhan University, 2015, 40(5): 612-616
- http://dx.doi.org/10.13203/j.whugis20130384
-
文章历史
- 收稿日期:2013-08-06
2. 长江勘测规划设计研究院, 湖北 武汉, 430010;
3. 黄河水利科学研究院, 河南 郑州, 450003
2. Changjiang Institute of Survey, Planning, Design amd Research, Wuhan 430010, China;
3. Yellow River Institute of Hydraulic Research, Zhengzhou 450003, China
光谱匹配技术是高光谱影像地物识别的关键技术之一[1],常用于高光谱影像的精细分类。所谓光谱匹配分类,就是利用光谱相似性测度值来判断地物光谱的类别属性。光谱相似性测度可用来衡量两条像元光谱曲线的相似程度。以光谱角匹配(spectral angel match,SAM)[2]为例,相似度值域从0(相似)到1(不相似),可以设定一个相似度静态阈值,小于此阈值则表明两条光谱曲线相似。但是,确定这个静态阈值往往需要大量的专家经验。近年来,许多国内外学者针对传统的光谱相似性测度只考虑像元光谱单一特征的不足,提出了一些新的测度,取得了很好的效果[3, 4]。在这些研究的基础上,本文提出了一种多特征转换的高光谱影像自适应分类方法,通过这些光谱相似性测度值作为度量并引入分类器进行辅助,用分类器自适应确定光谱相似性测度超平面,既综合考虑了光谱的多种特征,又避免了一些光谱匹配分类方法中阈值确定对分类结果造成的影响,提高了高光谱影像分类的准确率。
1 光谱特征转换的自适应分类 1.1 常用的光谱相似性测度
光谱相似性测度通常可以分为确定性测度和随机性测度两类[3]。其中,确定性测度主要包含光谱角匹配(SAM)、欧氏距离(ED)和光谱相关系数测度(SCM)[2, 5] 等,随机性测度包括光谱信息散度(SID)[2]、正交投影散度(OPD)[5]和光谱泛相似性测度(SPM)[3]等。相关研究表明,利用单一的光谱特征往往无法全面反映两条光谱曲线之间的相关性[3, 4],因此,本文综合考虑光谱矢量、形状、信息量和投影残差等特征,将多种光谱测度应用于高光谱影像分类。
1.2 基于全光谱域的光谱特征自适应分类
基于全光谱域的光谱特征自适应分类(multi-feature conversion applied on full hyperspectral space,MFCFHS)方法通过以上多元光谱相似性测度和支持向量机(support vector machine,SVM)[6]分类器的有效结合,实现高光谱影像的精细分类,主要分为光谱特征平滑、多特征光谱相似性测度矩阵构建、自适应超平面三个步骤。
首先进行光谱特征平滑。该步骤通过均值滤波最小化光谱特征矩阵的随机噪声,将影像通过滤波器,计算在特定正方形窗口下的均值作为窗口中心点的值,则该中值滤波的计算公式为:
式中,Sj表示真实的光谱;Ej为经过平滑后的光谱;设固定窗口的宽度为w,则m=(w-1)/2,m表示周围像元离窗口中心像元的距离;n为影像的波段数。将原始影像进行固定窗口的光谱特征平滑,可以有效去除影像中少数点由于某些因素造成的光谱值偏离正常值而产生的随机噪声。本文的固定窗口宽度为3。
然后构建多特征光谱相似性测度矩阵。该部分主要分为计算类别均值向量、多特征光谱相似性测度计算、构建矩阵三个内容。
1)计算类别均值向量。每一类的均值向量定义为:
其中,Eji为训练样本集类别C中第j个波段经过中值滤波后的估计值;k为类别C的样本数;n为高光谱数据波段数。
2)计算光谱相似性测度。通过构建光谱相似性测度模型,计算影像每个像元与类别均值向量的光谱相似性测度。本文综合考虑光谱矢量、形状、信息量和投影残差等特征,使用了 SAM、SCM、ED、SID、OPD和SPM等6种光谱相似性测度。选择这些光谱相似性测度既能有效涵盖众多光谱特征,又能避免由于选择了过多的光谱相似性测度而导致计算量过大。
3)构建矩阵。根据以上6种光谱相似性测度计算光谱特征向量与类别均值向量的测度值,得到的相似性测度值组成一组向量,构建模型,多特征光谱相似性测度矩阵定义为:
式中,p表示样本数;q为类别数×光谱相似性测度数。本文中含有6组光谱相似性测度、9个类别,则构建6×9即由54维的相似性测度值组成的矩阵。矩阵中的每一个列向量表示样本中所有像元与某一类别均值C在某一组光谱相似性测度下的测量值。
最后,通过 SVM进行自适应超平面。引入SVM分类器进行监督分类,利用SVM分类器进行自适应相似度阈值选择。传统的SVM面对的 是二分类问题,基于结构风险最小化原则,通过间隔最大化分析,在高维空间中求出一个最优超平面,将数据一分为二。本文将SVM分类器作为自适应阈值的工具,将多元高光谱测度进行自适应判定,实现多种光谱特征融合的光谱匹配分类。
1.3 基于高光谱影像波段子空间的光谱特征自适应分类
基于高光谱影像波段子空间的光谱特征自适应分类方法(multi-feature conversion applied on hyperspectral subspace,MFCHS)将高光谱的整个波段分为不同的子空间分别进行处理,这种处理被称为高光谱影像空间分解。将高光谱的光谱范围分为蓝波段(400~499 nm)、绿波段(500~570 nm)、红波段(650~750 nm)、水汽吸收波段(900~1 000 nm)、红外波段(1 350~2 400 nm)等几个空间。其余步骤与MFCFHS方法类似,每一个类别C中的p个样本,都有270个不同的相似性测度值(9个类别×6个不同的光谱测度×5个不同的光谱范围)。每一个训练样本和测试样本都将通过这种方式构建一组含有270维不同相似性测度值的向量,建立分类模型,利用SVM分类器进行自适应,实现影像地物的分类。
2 实验与分析 2.1 AVIRIS数据集
实验数据为AVIRIS传感器获取的美国印第安纳州西北部农田和森林混合地区的数据,其拍摄于1992年,包括220个波段,去掉一些信噪比比较低的波段104~108和152~161后,保留了205个波段。
原始影像和实际地物分布图见图 1,影像中一共含有17个类别,根据文献[5]的分析,为了研究地物精细分类的需要,本文从中选取了9类较难区分的地物进行精细分类。其中,未耕玉米、疏耕玉米、未耕大豆、清除大豆的光谱特征用SAM或SID等光谱测度值衡量时非常相似,湿草地与干草、苜蓿、树林的光谱曲线也难以区分,影像中疏耕大豆区域为高度混合区域。因此,选择的这些类别比较适合进行高光谱影像的精细分类实验。训练样本数和测试样本数分别为1 938和3 359,如表 1所示。
未耕玉米 | 疏耕玉米 | 湿草地 | 苜蓿 | 干草 | 未耕大豆 | 疏耕大豆 | 清除大豆 | 树林 | 总计 | |
训练 | 196 | 255 | 105 | 219 | 255 | 143 | 316 | 137 | 312 | 1 938 |
测试 | 256 | 368 | 266 | 366 | 370 | 471 | 484 | 329 | 449 | 3 359 |
实验方法设计为:① 比较不同类型SVM分类器对本文方法实验结果的影响;② 将本文方法与传统的SVM高光谱影像分类方法、最大似然分类法(maximum likelihood classification,MLC)和最小距离法(minimum distance,MD)进行比较分析。
本文提出了MFCFHS和MFCHS两种自适应光谱特征匹配分类方法。实验环境为Matlab,版本为R2010b,使用LibSVM工具箱[6]的多类SVM分类器,SVM分类器的核函数选择和参数设置参考相关文献[7, 8, 9]。
2.3 结果分析 2.3.1 多类SVM分类器类型分析
表 2为不同类型SVM分类器对分类结果的影响。LibSVM算法进行多类分类时有两种策略:① 一对多(one against all,OvA),分类时依次把某个类别归为一类,其他剩下的类别归为另一类,这样,含有K类地物的样本集就需要构建K个分类器;② 一对一(one against one,OvO),是将任意两类样本间构建一个分类器,这样,含有K类地物的样本集需要设计K(K-1)/2个分类器。从表 2中可以发现,OvO的SVM分类结果优于OvA的SVM分类结果。这是由于SVM是一种二分类,OvA是将某一类作为一类,其他类作为一类进行二分类识别。这种分类方式不太适合精细分类,当类别较多时,有时无法区分一类和其他类的细微差别,因而不能有效识别类别之间的细微差异,造成OvA的分类结果较差。OvO优于OvA是因为只采用两类的训练样本,能较好区分类与类之间的差别,因而具有较高的精细分类精度。
分类结果通过总体精度、Kappa系数、单类别使用者精度进行评价。表 3为各分类方法的总体精度和Kappa系数,可以看出,传统的固定阈值光谱匹配分类方法(如最小距离法(MD))相比于SVM的分类精度而言,下降了20.37%。这是由于MD方法只考虑了光谱曲线的单一特征,如果设置阈值则阈值需要人工调节,这类算法虽然快速、简单,但它对不同程度变化的光谱响应不敏感,忽略了影像光谱中蕴含的其他有用信息,因而分类结果在几种实验方法中精度最差。
MD | SVM | MLC | MFCFHS | MFCHS | |
总体精度/% | 51.65 | 72.02 | 76.93 | 78.27 | 80.74 |
Kappa系数 | 0.532 8 | 0.714 1 | 0.737 5 | 0.778 9 | 0.804 1 |
表 4是单类别使用者精度。分析不同算法的单类别使用者精度,可以发现MLC作为一种经典的分类方法,对于某些类别(如苜蓿、干草、未耕玉米等)的使用者精度较高,这是因为这些类别与其他类别光谱特征差异比较明显,而对于湿草地、未耕大豆、清除大豆等光谱特征相似的类别,最大似然法的分类精度较差。因此,本文认为MLC不太适用于类别光谱差异较小的高光谱影像精细分类。
未耕玉米 | 疏耕玉米 | 湿草地 | 苜蓿 | 干草 | 未耕大豆 | 疏耕大豆 | 清除大豆 | 树林 | |
MD | 51.17 | 32.88 | 25.57 | 46.17 | 60.27 | 31.42 | 77.06 | 36.60 | 81.73 |
SVM | 53.13 | 63.04 | 77.07 | 59.84 | 68.92 | 51.80 | 100 | 69.00 | 92.87 |
MLC | 92.35 | 80.43 | 45.49 | 99.73 | 100 | 32.27 | 98.55 | 38.91 | 99.78 |
MFCFHS | 73.47 | 67.39 | 83.46 | 82.51 | 84.32 | 59.87 | 88.84 | 78.82 | 95.76 |
MFCHS | 78.06 | 68.75 | 86.47 | 84.70 | 81.08 | 65.82 | 98.14 | 79.94 | 93.10 |
MFCFHS 方法和MFCHS方法相比于SVM方法在分类的总体精度上提高了6.25%和8.72%,因为它们通过使用6种不同的光谱相似性测度,有效集合了光谱中各类有用信息精细分类,各种光谱相似性测度组成的向量能通过SVM对难以区分的小类进行精细区分。MFCHS方法在高光谱影像的精细分类中的精度最高,是因为其通过高光谱波段子空间分解和多元光谱相似性测度结合的方式,能最大程度上体现不同地物类别在光谱域的细微差别,增加了SVM对高度混合类别的区分能力。除此之外,MFCHS方法的分类精度优于MFCFHS方法,其主要原因是:MFCFHS方法将光谱分为几个子空间,能最大化每个子空间内不同地物之间的信息差异,亦可最小化光谱范围过大而造成的对光谱信息统计独立性的影响,可以充分利用像元的光谱信息和波段间的细微差别。 3 结 语
本文设计了多特征转换的高光谱影像自适应分类方法,使用多种光谱相似性测度作为评价相似度的模型,引入一个分类器作为确定分类超平面的自适应工具。本文设计了两种实验方法,实验结果表明本文提出的方法相比于SVM方法在分类的总体精度上提高了6.25%和8.72%,适应性更强。使用简单的可学习的光谱相似性测度进行高光谱影像精细分类,还可以有效避免一部分传统光谱匹配分类中需要专家经验确定分类阈值的复杂过程。
[1] | Zhang Liangpei, Zhang Lifu. Hyperspectral Remote Sensing[M]. Wuhan:Wuhan University Press, 2005(张良培,张立福. 高光谱遥感[M],武汉:武汉大学出版社,2005) |
[2] | van der Meer F. The Effectiveness of Spectral Similarity Measures for the Anaysis of Hyperspectral Imagery[J].Int J Appl Earth Obs,2006, 8(1):3-17 |
[3] | Kong Xiangbing, Shu Ning, Tao Jianbin, et al. A New Spectral Similarity Measure Based on Multiple Features Intergration[J]. Spectroscopy and Spectral Analysis, 2011,31(8):2 166-2 170(孔祥兵,舒宁,陶建斌,等.一种基于多特征融合的新型光谱相似性测度[J].光谱学与光谱分析, 2011,31(8):2 166-2 170) |
[4] | Hosseini R S, Homayouni S, Safari R. Modified Algorithm Based on Support Vector Machines for Cclassification of Hyperspectral Images in a Similarity Space[J].Journal of Applied Remote Sensing, 2012(6):3 115-3 123 |
[5] | Wu C, Chang C. Soft Decision-Made Hyperspectral Measures for Target Discrimination and Classfication[J]. Proc Soc Photo Opt Instrum Eng, 2009(1):7 457 |
[6] | Chang C C, Lin C J. LIBSVM: A Library for Support Vector Machines, 2012[EB/OL]. http://www.csie.ntu.edu.tw/-cjlin/libsvm/,2012 |
[7] | Shen Zhaoqing, Shu Ning, Tao Jianbin. An Algorithm of Weightd "1Vm" SVM Multi-classification for Hyperspectral Remote Sensing Image with NPA[J]. Geomatics and Information Science of Wuhan University, 2009, 34(12):1 444-1 447(沈照庆,舒宁,陶建斌.一种基于NPA的加权1VmSVM高光谱影像分类算法[J].武汉大学学报·信息科学版, 2009,34(12):1 444-1 447) |
[8] | Tan Kun, Du Peijun, Wang Xiaomei. Multi-Class Support Vector Machine Classifier Based on Separability Measure for Hyperspectral Remote Sensing Image Classification[J]. Geomatics and Information Science of Wuhan University, 2011,36(2):171-175(谭琨,杜培军,王小美.利用分离性测度多类支持向量机进行高光谱遥感影像分类[J].武汉大学学报·信息科学版,2011,36(2):171-175) |
[9] | Shen Zhaoqing,Shu Ning,Tao Jianbin.On SVM Classification Algorithm of Hyperspectral RS Imagery Without Penalty Coefficient[J].Bulletin of Surveying and Mapping,2009(6):22-25 (沈照庆,舒宁,陶建斌.无惩罚系数SVM高光谱影像分类算法研究[J].测绘通报, 2009(6):22-25) |