留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

利用稀疏自表达实现高光谱影像波段选择

孙伟伟 蒋曼 李巍岳

孙伟伟, 蒋曼, 李巍岳. 利用稀疏自表达实现高光谱影像波段选择[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
引用本文: 孙伟伟, 蒋曼, 李巍岳. 利用稀疏自表达实现高光谱影像波段选择[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
SUN Weiwei, JIANG Man, LI Weiyue. Band Selection Using Sparse Self-representation for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
Citation: SUN Weiwei, JIANG Man, LI Weiyue. Band Selection Using Sparse Self-representation for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052

利用稀疏自表达实现高光谱影像波段选择

doi: 10.13203/j.whugis20150052
基金项目: 

国家自然科学基金 Nos. 41671342, 41401389

航空遥感技术国家测绘地理信息局重点实验室经费资助课题 No. 2015B12

中国博士后科学基金 Nos. 2016T90732, 2015M570668

浙江省科技厅公益项目 No. 2016C33021

详细信息
    作者简介:

    孙伟伟,副教授,主要从事地理信息系统和遥感理论和方法及“3S”技术在海岸带资源管理与环境变化监测中的应用研究。sunweiwei@nbu.edu.cn

    通讯作者: 李巍岳,博士。 E-mail:lwy_326@126.com
  • 中图分类号: P237

Band Selection Using Sparse Self-representation for Hyperspectral Imagery

Funds: 

The National Natural Science Foundation of China Nos. 41671342, 41401389

the Key Laboratory for Aerial Remote Sensing Technology of National Administration of Surveying, Mapping and Geoinformation (NASMG) No. 2015B12

the Chinese Postdoctoral Science Foundation Nos. 2016T90732, 2015M570668

Public Projects of Zhejiang Province No. 2016C33021

More Information
    Author Bio:

    SUN weiwei, PhD, associate professor, specializes in the theory and techniques of GIS and remote sensing, and “3S” applications in Coastal resources management and monitoring. E-mail:sunweiwei@nbu.edu.cn

    Corresponding author: LI Weiyue, PhD. E-mail:lwy_326@126.com
  • 摘要: 提出一种稀疏自表达方法来研究高光谱影像分类中的波段选择问题。该方法利用字典矩阵等于测量矩阵的条件来改进多观测向量的稀疏表达模型,将波段子集看作高光谱影像波段集合中的代表子集。稀疏自表达方法将波段选择转换为寻求多观测向量中稀疏系数矩阵的非零行向量问题,通过引入混合范数来限定非零元素行向量的个数,利用快速交替方向乘子方法求解稀疏系数矩阵,并聚类非零行向量,实现波段的有效选择。基于两个公开高光谱影像数据集并对比其他4种波段选取方法来验稀疏自表达方法。实验结果证明,稀疏自表达方法能够在计算效率明显优于基于波段相关性的线性限制最小方差方法的同时,取得与该方法和非负稀疏矩阵分解方法相匹甚至略高的总体分类精度。
  • 图  1  高光谱影像数据和地物真实样本分布

    Figure  1.  Two Hyperspectral Datasets and Their Ground Truth Information

    图  2  Urban和 PaviaU数据中不同波段选择方法得到的总体分类精度

    Figure  2.  The Curves of OCA from all Five Band Selection Methods on Urban and PaviaU Dataset

    图  3  Urban和PaviaU数据中平衡参数λ对SSR波段子集的总体分类精度OCA的影响

    Figure  3.  Effect from the Balance Parameter λ on OCA Results of the SSR Band Subset for Urban and PaviaU Datasets

    表  1  Urban数据的训练和测试样本信息

    Table  1.   Training and Testing Samples of Urban Dataset

    类别 样本
    类号 类名 训练 测试
    1 AsphaltDrk 17 68
    2 AsphaltLgt 12 45
    3 Concrete01 25 99
    4 VegPasture 47 189
    5 VegGrass 25 102
    6 VegTrees01 53 210
    7 Soil01 23 90
    8 Soil02 11 42
    9 Soil03Drk 12 47
    10 Roof01Wal 24 94
    11 Roof02A 18 73
    12 Roof02BGvl 8 31
    13 Roof03LgtGray 7 28
    14 Roof04DrkBrn 17 67
    15 Roof05AChurch 18 67
    16 Roof06School 13 51
    17 Roof07Bright 15 59
    18 Roof08BlueGrn 9 36
    19 TennisCrt 19 77
    20 ShadedVeg 8 32
    21 ShadedPav 13 51
    22 VegTrees01 52 210
    下载: 导出CSV

    表  2  PaviaU数据的训练和测试样本信息

    Table  2.   Training and Testing Samples of PaviaU Dataset

    类别 样本
    类号 类名 训练 测试
    1 Asphalt 839 3 356
    2 Meadows 437 1 748
    3 Gravel 420 1 679
    4 Trees 310 1 240
    5 Painted metal sheets 269 1 076
    6 Bare Soil 1 006 4 023
    7 Bitumen 266 1 064
    8 Self-Blocking Bricks 469 1 878
    9 Shadows 186 743
    下载: 导出CSV

    表  3  Urban和PaviaU数据中5种波段选取方法的计算时间对比

    Table  3.   Contrast in Computational Times Among all Five Band Selection Methods on Urban and PaviaUDatasets

    数据集 波段数k 不同方法的计算时间/min
    SSR LCMV-BCC MVPCA SpaBS SNMF
    Urban
    数据
    k=10 75.158 1 123.124 18.241 1 512.036 21.743
    k=20 123.928 1 574.263 23.256 1 727.641 30.471
    k=30 171.568 1 607.272 31.382 1 906.576 48.262
    k=40 202.489 1 772.241 45.582 2 035.429 52.803
    k=50 223.472 1 807.454 58.483 2 106.553 74.425
    PaviaU
    数据
    k=10 104.689 1 515.092 27.526 1 728.659 32.592
    k=20 193.446 2 076.524 43.137 2 237.461 51.677
    k=30 233.156 2 917.889 59.205 3 141.394 70.224
    k=40 276.946 4 052.803 81.732 4 277.556 89.539
    k=50 300.457 5 044.261 102.422 5 429.083 121.773
    下载: 导出CSV
  • [1] Hsu Paihui. Feature Extraction of Hyperspectral Images Using Wavelet and Matching Pursuit[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2007, 62(2):78-92 http://adsabs.harvard.edu/abs/2007JPRS...62...78H
    [2] Sun Weiwei, Halevy A, Benedetto J J, et al. UL-Isomap Based Nonlinear Dimensionality Reduction for Hyperspectral Imagery Classification[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2014, 89:25-36
    [3] Divekar A. Theory and Applications of Compressive Sensing[D]. Indiana,USA:Purdue University, 2010
    [4] 刘帅, 朱亚杰, 薛磊. 一种结合稀疏表示和纹理分块的遥感影像超分辨率方法[J]. 武汉大学学报·信息科学版, 2015, 40(5):578-582 http://ch.whu.edu.cn/CN/abstract/abstract3248.shtml

    Liu Shuai,Zhu Yajie,Xue Lei. Remote Sensing Image Super-resolution Method Using Sparse Representation and Classified Texture Patches[J]. Geomatics and Information of Wuhan University, 2015, 40(5):578-582 http://ch.whu.edu.cn/CN/abstract/abstract3248.shtml
    [5] 黄远程, 钟燕飞, 赵野鹤,等. 联合盲分解与稀疏表达的高光谱图像异常目标检测[J]. 武汉大学学报·信息科学版, 2015, 40(9):1 144-1 150 http://ch.whu.edu.cn/CN/abstract/abstract3312.shtml

    Huang Yuancheng, Zhong Yanfei, Zhao Yehe, et al. Joint Blind Unmixing and Sparse Representation for Anomaly Detection in Hyperspectral Image[J]. Geomatics and Information Science of Wuhan University, 2015, 40(9):1 144-1 150 http://ch.whu.edu.cn/CN/abstract/abstract3312.shtml
    [6] Sun Weiwei, Liu Chun, Li Jialin, et al. Low-rank and Sparse Matrix Decomposition-based Anomaly Detection for Hyperspectral Imagery[J]. Journal of Applied Remote Sensing, 2014, 8(1):083 641 doi:  10.1117/1.JRS.8.083641
    [7] Li Shuangjiang, Qi Hairong. Sparse Representation Based Band Selection for Hyperspectral Images[C]. 18th IEEE International Conference on Image Processing (ICIP), Brussels, Belgium, 2011
    [8] Li Jiming, Qian Yuntao. Clustering-based Hyperspectral Band Selection Using Sparse Nonnegative Matrix Factorization[J]. Journal of Zhejiang University Science C, 2011, 12(7):542-549 doi:  10.1631/jzus.C1000304
    [9] 施蓓琦, 刘春,孙伟伟,等. 应用稀疏非负矩阵分解聚类实现高光谱影像波段的优化选择[J]. 测绘学报, 2014, 42(3):351-357 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB201303008.htm

    Shi Beiqi, Liu Chun, Sun Weiwei, et al.Sparse Nonnegative Matrix Factorization for Hypespectral Optimal Band Selection[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(3):351-357 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB201303008.htm
    [10] Du Qian, Bioucas-Dias J M, Plaza A. Hyperspectral Band Selection Using a Collaborative Sparse Model[C]. IEEE International Geoscience and Remote Sensing Symposium (IGARSS), Munich, Germany, 2012
    [11] Chepushtanova S, Gittins C, Kirby M. Band Selection in Hyperspectral Imagery Using Sparse Support Vector Machines[C]. SPIE Defense+ Security Conference, Baltimore, Maryland, USA, 2014
    [12] Sun Weiwei, Zhang Liangpei, Li Weiyue, et al. Band Selection Using Improved Sparse Subspace Clustering for Hyperspectral Imagery Classification[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(6):2 784-2 797 doi:  10.1109/JSTARS.2015.2462792
    [13] Chen Jie, Huo Xiaoming. Sparse Representations for Multiple Measurement Vectors (MMV) in an Over-Complete Dictionary[C]. IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP'05), Philadelphia, Pennsylvania, USA, 2005
    [14] Van Den B E, Friedlander M P. Theoretical and Empirical Results for Recovery from Multiple Measurements[J]. IEEE Transactions on Information Theory, 2010, 56(5):2 516-2 527 doi:  10.1109/TIT.2010.2043876
    [15] Feng J M, Lee C H. Generalized Subspace Pursuit for Signal Recovery from Multiple -Measurement Vectors[C]. IEEE Wireless Communications and Networking Conference (WCNC), Shanghai, China, 2013
    [16] Elhamifar E, Sapiro G, Vidal R. See all by Looking at a few:Sparse Modeling for Finding Representative Objects[C]. IEEE Conference on Computer Vision and Pattern Recognition (CVPR), Providence, Rhode Island, USA,2012
    [17] Boyd S, Parikh N, Chu E, et al. Distributed Optimization and Statistical Learning via the Alternating Direction Method of Multipliers[J]. Foundations and Trends® in Machine Learning, 2011, 3(1):1-122 http://meeting.xidian.edu.cn/workshop/miis2012/uploads/files/20120824/20120824095907.pdf
    [18] Yang J, Zhang Y, Yin W. A Fast Alternating Direction Method for TVL1-L2 Signal Reconstruction from Partial Fourier Data[J]. IEEE Journal of Selected Topics in Signal Processing, 2010, 4(2):288-297 doi:  10.1109/JSTSP.2010.2042333
    [19] Chang C I, Wang S. Constrained Band Selection for Hyperspectral Imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(6):1 575-1 585 doi:  10.1109/TGRS.2006.864389
    [20] Chang C I, Du Q, Sun T L, et al. A Joint Band Prioritization and Band-Decorrelation Approach to Band Selection for Hyperspectral Image Classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(6):2 631-2 641 doi:  10.1109/36.803411
  • [1] 杨刚, 孙伟伟, 张殿发.  利用可分离非负矩阵分解实现高光谱波段选择 . 武汉大学学报 ● 信息科学版, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
    [2] 赵波, 苏红军, 蔡悦.  一种切空间协同表示的高光谱遥感影像分类方法 . 武汉大学学报 ● 信息科学版, 2018, 43(4): 555-562, 604. doi: 10.13203/j.whugis20150579
    [3] 鲍蕊, 薛朝辉, 张像源, 苏红军, 杜培军.  综合聚类和上下文特征的高光谱影像分类 . 武汉大学学报 ● 信息科学版, 2017, 42(7): 890-896. doi: 10.13203/j.whugis20150043
    [4] 白璘, 刘盼芝, 惠萌.  利用小波核最小噪声分离进行高光谱影像SVM分类 . 武汉大学学报 ● 信息科学版, 2016, 41(5): 624-628,644. doi: 10.13203/j.whugis20140209
    [5] 岳冲, 刘昌军, 王晓芳.  基于多尺度维度特征和SVM的高陡边坡点云数据分类算法研究 . 武汉大学学报 ● 信息科学版, 2016, 41(7): 882-888. doi: 10.13203/j.whugis20140335
    [6] 王凯, 舒宁, 孔祥兵, 李亮.  一种多特征转换的高光谱影像自适应分类方法 . 武汉大学学报 ● 信息科学版, 2015, 40(5): 612-616. doi: 10.13203/j.whugis20130384
    [7] 孙杰, 赖祖龙.  利用随机森林的城区机载LiDAR数据特征选择与分类 . 武汉大学学报 ● 信息科学版, 2014, 39(11): 1310-1313.
    [8] 姚娜, 林宗坚, 张景雄, 任超锋.  遥感影像分类后处理的地统计方法 . 武汉大学学报 ● 信息科学版, 2013, 38(1): 15-18.
    [9] 张晓贺, 翟亮, 张继贤, 杨享兵.  AdaTree算法在遥感影像分类中的应用 . 武汉大学学报 ● 信息科学版, 2013, 38(12): 1460-1464.
    [10] 王凯, 舒宁, 李亮, 龚龑.  利用ICA正交子空间投影加权的高光谱影像目标探测算法 . 武汉大学学报 ● 信息科学版, 2013, 38(4): 440-444.
    [11] 郑文武, 曾永年.  利用多分类器集成进行遥感影像分类 . 武汉大学学报 ● 信息科学版, 2011, 36(11): 1290-1293.
    [12] 谭琨, 杜培军, 王小美.  利用分离性测度多类支持向量机进行高光谱遥感影像分类 . 武汉大学学报 ● 信息科学版, 2011, 36(2): 171-175.
    [13] 黄远程, 李平湘, 张良培.  基于交互最小二乘优化的高光谱影像端元光谱分析 . 武汉大学学报 ● 信息科学版, 2010, 35(10): 1217-1221.
    [14] 薄树奎, 韩新超, 丁琳.  面向对象影像分类中分割参数的选择 . 武汉大学学报 ● 信息科学版, 2009, 34(5): 514-517.
    [15] 宋杨, 万幼川, 申绍洪, 陈鹏.  基于傅立叶变换的混合分类模型用于NDVI时序影像分析 . 武汉大学学报 ● 信息科学版, 2007, 32(5): 406-409.
    [16] 黄昕, 张良培.  基于光谱变换与融合的IKONOS多光谱影像分类 . 武汉大学学报 ● 信息科学版, 2007, 32(6): 502-505.
    [17] 方圣辉, 龚浩.  动态调整权重的光谱匹配测度法分类的研究 . 武汉大学学报 ● 信息科学版, 2006, 31(12): 1044-1046.
    [18] 哈斯巴干, 马建文, 李启青, 戴芹.  多波段遥感数据的自组织神经网络降维分类研究 . 武汉大学学报 ● 信息科学版, 2004, 29(5): 461-465. doi: 10.13203/j.whugis2004.05.019
    [19] 舒宁.  关于多光谱和高光谱影像的纹理问题 . 武汉大学学报 ● 信息科学版, 2004, 29(4): 292-295.
    [20] 贾永红, 李德仁.  多源遥感影像像素级融合分类与决策级分类融合法的研究 . 武汉大学学报 ● 信息科学版, 2001, 26(5): 430-434.
  • 加载中
图(3) / 表(3)
计量
  • 文章访问数:  1351
  • HTML全文浏览量:  58
  • PDF下载量:  512
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-01-30
  • 刊出日期:  2017-04-05

利用稀疏自表达实现高光谱影像波段选择

doi: 10.13203/j.whugis20150052
    基金项目:

    国家自然科学基金 Nos. 41671342, 41401389

    航空遥感技术国家测绘地理信息局重点实验室经费资助课题 No. 2015B12

    中国博士后科学基金 Nos. 2016T90732, 2015M570668

    浙江省科技厅公益项目 No. 2016C33021

    作者简介:

    孙伟伟,副教授,主要从事地理信息系统和遥感理论和方法及“3S”技术在海岸带资源管理与环境变化监测中的应用研究。sunweiwei@nbu.edu.cn

    通讯作者: 李巍岳,博士。 E-mail:lwy_326@126.com
  • 中图分类号: P237

摘要: 提出一种稀疏自表达方法来研究高光谱影像分类中的波段选择问题。该方法利用字典矩阵等于测量矩阵的条件来改进多观测向量的稀疏表达模型,将波段子集看作高光谱影像波段集合中的代表子集。稀疏自表达方法将波段选择转换为寻求多观测向量中稀疏系数矩阵的非零行向量问题,通过引入混合范数来限定非零元素行向量的个数,利用快速交替方向乘子方法求解稀疏系数矩阵,并聚类非零行向量,实现波段的有效选择。基于两个公开高光谱影像数据集并对比其他4种波段选取方法来验稀疏自表达方法。实验结果证明,稀疏自表达方法能够在计算效率明显优于基于波段相关性的线性限制最小方差方法的同时,取得与该方法和非负稀疏矩阵分解方法相匹甚至略高的总体分类精度。

English Abstract

孙伟伟, 蒋曼, 李巍岳. 利用稀疏自表达实现高光谱影像波段选择[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
引用本文: 孙伟伟, 蒋曼, 李巍岳. 利用稀疏自表达实现高光谱影像波段选择[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
SUN Weiwei, JIANG Man, LI Weiyue. Band Selection Using Sparse Self-representation for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
Citation: SUN Weiwei, JIANG Man, LI Weiyue. Band Selection Using Sparse Self-representation for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
  • 高光谱影像利用成像光谱仪,收集可见光至近红外的几十至数百个波段的光谱响应信息,通过分类技术可以实现地物之间的细微差异区分。高光谱影像分类已广泛应用于植被覆盖制图、海洋环境监测、矿区制图和军事目标识别等领域。然而,由于高光谱影像的光谱波段众多且相关性强导致高光谱影像处理的计算量较大,加之野外实际样本采集难度较大,导致高光谱影像存在严重的“维数灾难”现象[1]。因此,通常先对高光谱影像进行波段选择的降维处理,降低高光谱影像的数据量和波段相关性,然后进行后续的高光谱影像分类[2]

    近年来,稀疏表达理论的出现和兴起,为高光谱影像波段选择提供了新的研究思路和方法。稀疏表达理论认为一个正常信号投影至特定的变换空间(变化基)能够变为一个稀疏信号,其中的少数非零元素能够很好地继承原始信号的特性[3]。稀疏表达理论与压缩感知技术关系密切,是压缩感知技术的重要理论基础,能够减少数据采集量并采用复杂的重构算法来恢复原始信号,目前广泛应用于高光谱影像的混合像元分解、特征提取[4]、异常探测[5, 6]等众多领域。理论证明,波段的稀疏系数向量能够凸显原始高光谱影像中的一些潜在结构信息,利用这些潜在信息可以实现波段的选取。如Li和Qi基于稀疏表达理论,分析稀疏系数矩阵的直方图分布来确定波段的重要性,选取最佳的波段组合[7]。Li[8]和施蓓琦[9]等分析稀疏系数矩阵的聚类结构特征,利用欧氏距离度量和相对熵距离度量约束将高光谱数据矩阵分解为低阶字典矩阵和稀疏系数矩阵,根据稀疏系数矩阵中对应的系数权重大小确定该波段的聚类,最终实现波段的有效选取。Du等基于协同稀疏模型,利用稀疏回归系数来改善光谱影像的波段选取效果[10]。Chepushtanova等提出稀疏支持向量机模型,利用L1范数正则化约束的二值分类器来获取稀疏系数向量,进而选取有效波段组合[11]。近期,孙伟伟等提出采用稀疏子空间的思想,利用波段相关性和L2范数约束来聚类并选取高光谱影像的有效波段[12]的方法。

    不同于当前研究,本文利用字典矩阵等于观测矩阵来改进多观测向量的稀疏表达理论,采用稀疏系数矩阵的L1, 2混合范数来限定非零行向量的个数,提出稀疏自表达(sparse self-representation,SSR)的高光谱影像波段选择方法。

    • 单观测向量的稀疏表达模型认为,一组L维的高光谱向量(光谱向量或波段向量)yRL×1在某组特定变换基{ai}i=1M(aiM维列向量)下展开,即式(1):

      (1)

      式中,A=[a1 a2aL]∈RL×M为字典矩阵(满足AAT=ATA=I), R为实数符号;系数向量x=[θ1 θ2θM]Tk-稀疏的,即非零系数的个数k远小于Mθi为系数向量中任一元素;e为高光谱影像采集过程中存在的随机噪声。假设高光谱数据集Y=[y1 y2yN]包含N远大于L个向量元素,将每一维向量yi按列方向排列,式(1)转换为多观测向量的稀疏表达模型[13]

      (2)

      式中,X=[x1 x2xN]是稀疏向量矩阵,其中任一高光谱向量yj=Yxj+ej;E=[e1 e2eN]为误差项矩阵。式(2)的求解可以转换为目标优化问题:

      (3)

      式中,‖xi0表示稀疏系数列向量xi中非零元素的个数。考虑到其中每一列的稀疏性导致系数矩阵X的整体稀疏性,式(3)的目标函数优化问题可以近似转换为求解X的L0范数问题:

      (4)

      式中,为稀疏矩阵X的L0范数;σ为设定的逼近误差。式(4)的最优解为找寻X中非零元素的个数|S|:=supp(X):={1≤im:xi0}。考虑到L0范数问题的非凸性和较高的计算复杂度,通常将式(4)的L0范数优化问题,松弛为L1L2范数的求解问题来进行求解,如利用L1, 2范数约束的SPG算法[14],基于L2范数约束的普化子空间追踪算法[15]

    • 多观测向量稀疏表达模型认为,高光谱影像数据集Y=[y1 y2yN]∈RL×N可以在字典矩阵A=[a1 a2aM]∈RL×M构成的特征空间中近似展开为稀疏系数矩阵X=[x1xjxN]∈RM×N,其中L为高光谱影像的像素个数,N为波段数,M为字典矩阵中变换基的个数。波段选择中,波段子集可认为是高光谱影像中的代表波段的集合,因此任一波段可以由波段子集对应的波段向量来线性组合表示。进一步,任一波段可以在高光谱影像数据中所有波段向量构建的特征空间内来进行稀疏展开,得到的稀疏系数向量中非零元素的位置指向波段子集,即波段子集中的各波段对应的重构系数非0,非波段子集对应的重构系数为0。因此,式(2)的稀疏表达模型中,字典矩阵A可转换为A=Y,得到高光谱影像的稀疏自表达模型[16]

      (5)

      式中,每一列为高光谱的波段向量yj=Yxj+ejxjj=0,‖xj0p;E为随机噪声矩阵;X≥0是为了满足高光谱影像的光谱响应的非负特性;diag(X)=0是指稀疏系数矩阵X的对角元素都为0,为了避免任意波段yi只被自身的波段向量所表示。yj=Yxj+ej的物理意义为每一个波段向量yj可以在所有波段向量构成的特征空间中稀疏展开,其对应的稀疏向量xj中非零元素代表波段子集对该波段重构的贡献大小。式(5)的求解可以转换为类似于式(4)的最小化重构误差的范数求解问题:

      (6)

      式中,‖xj0p是指每一列的系数向量为p-稀疏。式(6)中系数矩阵X的稀疏特性限制可以近似转换为其行方向的稀疏限制条件,即:

      (7)

      式中,,其中xi是系数矩阵X中第i行的系数向量,I(·)是指示函数。即‖X0, 2p限制系数矩阵向量X中非零行向量的个数。进一步,考虑到稀疏矩阵的全局不变性和L0, q范数的计算复杂性,式(7)可以通过L1范数松弛,转换为以下优化问题:

      (8)

      式中,X中每一行向量xiL2范数之和;t为设定范数限制大小。

    • 利用拉格朗日乘法原理,式(8)的目标优化问题可以转换为:

      (9)

      式中,λ>0为平衡参数,用来控制‖X1, 2对整个目标函数的影响。式(9)可以采用类似于多观测向量模型求解的方法来进行求解,如SPGL1方法、交替方向乘子法和正交匹配追踪方法等。相比其他方法,交替方向乘子法充分利用目标优化函数的可分离性,利用拉格朗日方程将式(9)的目标优化问题分解为若干个更容易得到全局解的交替的极小化子问题进行分析,通过各子问题的全局优化来得到原始问题(9)的最优解[17]。考虑到交替方向乘子法的收敛效率较低,本文采用快速交替方向乘子法[18]来求解式(9)的问题,得到满足最优的稀疏系数矩阵

      可以看出,中非零行向量中系数的数量和大小代表着其对应的Y中的波段向量用来重构原始的高光谱波段数据集中其他波段向量的权重大小。即中非零行向量的范数大小代表其对原始高光谱波段数据集的贡献大小。因此,理论上可以通过选择稀疏系数矩阵对应的非零行向量对应的波段序号来确定波段子集。然而,由于高光谱影像中相邻波段相关性太强,可能导致相邻两个或数个波段在稀疏系数矩阵中具有相近的非零行向量。因此,本文采用K-均值聚类方法,聚类稀疏系数矩阵中非零行向量至k个类别中,通过选取距离其类中心最近的非零行向量对应的波段作为代表波段来构成最终波段子集。

    • 稀疏自表达模型SSR用于高光谱影像波段选择的流程如下。

      1) 将三维的高光谱影像立方体转换为二维波段向量数据集Y,以二维矩阵形式表示,其中波段数为Y对应的矩阵的列数,高光谱影像中像素个数为Y的行数;

      2) 利用式(5)构建高光谱影像波段数据集的稀疏自表达模型;

      3) 将式(5)的稀疏自表达模型求解问题转换为式(8)的目标方程优化问题,利用拉格朗日方程展开为式(9)并采用快速交替方向乘子法来求解,得到满足条件的稀疏系数矩阵

      4)利用K-均值方法来聚类稀疏系数矩阵中的非零行向量,选取距离各类中心最近的非零行向量对应的波段构成最终的波段子集。

    • Urban数据为从美国陆军地理空间中心获取的HYDICE高光谱影像数据。数据采集于1995年10月,空间分辨率为2 m,光谱分辨率为10 nm。影像大小为307像素×307像素,覆盖美国德克萨斯州科帕拉斯区域(靠近胡德堡),如图 1(a)所示。对原始的210波段数据进行预处理,移除低噪比波段,剩余162波段,包含22种主要地物,各地物样本的真实空间分布和训练及测试样本信息如图 1(b)表 1所示。表 1中训练样本总数为446,测试样本总数为1 708。PaviaU数据来自西班牙巴斯克大学计算智能课题组,影像覆盖帕维亚大学区域,共103波段,空间分辨率为1.3 m,如图 1(c)所示。影像为较大数据集中的一部分,包含350像素×340像素,波段数为103,包含9类地物(包括阴影)。数据中各地物样本的真实空间分布和训练及测试样本的信息如图 1(d)表 2所示。表 2中训练样本总数为4 202,测试样本总数为16 087。

      图  1  高光谱影像数据和地物真实样本分布

      Figure 1.  Two Hyperspectral Datasets and Their Ground Truth Information

      表 1  Urban数据的训练和测试样本信息

      Table 1.  Training and Testing Samples of Urban Dataset

      类别 样本
      类号 类名 训练 测试
      1 AsphaltDrk 17 68
      2 AsphaltLgt 12 45
      3 Concrete01 25 99
      4 VegPasture 47 189
      5 VegGrass 25 102
      6 VegTrees01 53 210
      7 Soil01 23 90
      8 Soil02 11 42
      9 Soil03Drk 12 47
      10 Roof01Wal 24 94
      11 Roof02A 18 73
      12 Roof02BGvl 8 31
      13 Roof03LgtGray 7 28
      14 Roof04DrkBrn 17 67
      15 Roof05AChurch 18 67
      16 Roof06School 13 51
      17 Roof07Bright 15 59
      18 Roof08BlueGrn 9 36
      19 TennisCrt 19 77
      20 ShadedVeg 8 32
      21 ShadedPav 13 51
      22 VegTrees01 52 210

      表 2  PaviaU数据的训练和测试样本信息

      Table 2.  Training and Testing Samples of PaviaU Dataset

      类别 样本
      类号 类名 训练 测试
      1 Asphalt 839 3 356
      2 Meadows 437 1 748
      3 Gravel 420 1 679
      4 Trees 310 1 240
      5 Painted metal sheets 269 1 076
      6 Bare Soil 1 006 4 023
      7 Bitumen 266 1 064
      8 Self-Blocking Bricks 469 1 878
      9 Shadows 186 743
    • 本节利用提出的SSR波段选择模型来实现Urban和PaviaU数据的分类,验证提出的SSR模型的有效性。采用的对比波段选择方法有基于波段相关性的线性限制最小方差方法(linear constrained minimum variance-based band correlation constraint, LCMV-BCC)[19],最大方差主成分分析法(maximum-variance principal component analysis, MVPCA)[20],基于稀疏的波段选择法(sparse based band selection, SpaBS)[7]和稀疏矩阵分解的波段选择法(SNMF)[8]。对比实验中采用支持向量机法(support vector machine, SVM)作为分类器,采用总体分类精度(overall classification accuracy, OCA)作为分类精度评价指标。其中SVM分类器中采用径向基核函数,其方差和惩罚因子通过交叉验证获得。从每个数据集的训练和测试样本中随机抽取10次进行实验,以下实验结果是10次独立实验的平均结果。

    • 实验对比分析不同波段数下的SSR方法和LCMV-BCC、MVPCA、SpaBS及SNMF方法的SVM分类结果。Urban和PaviaU数据集中波段数的选择区间都为2~50;SpaBS方法的迭代次数都设置为5次。利用交叉验证方法,Urban和PaviaU数据集中,SSR方法的平衡参数λ分别设置为80和95;Urban数据集中,SNMF方法中正则化因子α和β分别设定为3.5和0.01;PaviaU数据集中,SNMF方法的正则化因子α和β分别设定为4.0和0.001。

      图 2列出SSR和其他4种波段选择方法利用Urban和PaviaU数据集上得到的不同波段数目条件下的总体分类精度OCA结果。从图 2(a)可以看出,当波段数k取2时,5种方法得到的分类精度都较低;随着波段数k的增加,5种方法对应的OCA曲线都逐步上升,在k=10附近达到一个较高值;随着波段数k的持续增加,OCA曲线都增长缓慢并呈现波动状态。同时,可以看出,在波段数k≥10(地物类别个数=9)时,SpaBS的总体分类精度OCA整体最低;MVPCA曲线的OCA结果总体高于SpaBS;SSR的总体分类精度OCA结果和LCMV-BCC和SNFM方法较为接近,甚至一定程度上稍优于LCMV-BCC和SNMF。同样地,从图 2(b)可以看出,随着波段数k的增加,SSR和其他4种方法的OCA曲线逐步上升;在k>22(地物类别个数=22)时,5种方法的OCA曲线增长都开始趋于缓慢,个别曲线的增幅伴随着一定波动来实现。同时,SSR的总体分类精度OCA曲线与SNMF和LCMV-BCC方法的曲线较为接近,而且OCA结果稍微优于这两种方法;SpaBS方法和MVPCA方法的OCA结果低于SSR、SNMF和LCMV-BCC方法,尤其SpaBS方法的OCA曲线整体结果最差。因此,SSR波段选择方法的总体分类结果优于SpaBS和MVPCA方法,而且在波段数目大于地物类别个数时,能够得到相匹甚至稍优于SNMF和LCMV-BCC的总体分类精度。

      图  2  Urban和 PaviaU数据中不同波段选择方法得到的总体分类精度

      Figure 2.  The Curves of OCA from all Five Band Selection Methods on Urban and PaviaU Dataset

    • 在对比5种波段选择方法的分类性能的基础时,表 3列出SSR和其他4种波段选择方法对Urban和PaviaU数据集进行波段选择的计算时间。5种波段选择算法都通过MATLAB 2014a编程实现,运算环境为联想i5-4570四核处理器,8 GB内存和Windows7操作系统。Urban数据和PaviaU数据的5种波段选取方法的参数设置同实验1)保持一致。

      表 3可以看出,随着波段数k的增大,SSR和其他4种波段选择方法的计算时间持续增长。4种波段选择方法中,MVPCA方法的计算效率最高,所消耗的计算时间最短;SNMF方法的计算时间稍高于MVPCA方法,但计算效率明显高于SSR、LCMV-BCC和SpaBS方法。LCMV-BCC和SpaBS的计算效率最低,明显低于SSR和其他两种方法;尤其是SpaBS方法的计算效率在5种方法中最低,所需要的计算时间最长。实验中,MVPCA计算效率最高是因为该方法依赖的主成分分析算法具有较低的计算复杂度[20];SpaBS的高计算时间是因为其利用计算复杂度较高的奇异值分解算法来求解字典矩阵[7]。因此,5种波段选取的计算效率从高至低依次为MVPCA、SNMF、SSR、LCMV-BCC和SpaBS。

      表 3  Urban和PaviaU数据中5种波段选取方法的计算时间对比

      Table 3.  Contrast in Computational Times Among all Five Band Selection Methods on Urban and PaviaUDatasets

      数据集 波段数k 不同方法的计算时间/min
      SSR LCMV-BCC MVPCA SpaBS SNMF
      Urban
      数据
      k=10 75.158 1 123.124 18.241 1 512.036 21.743
      k=20 123.928 1 574.263 23.256 1 727.641 30.471
      k=30 171.568 1 607.272 31.382 1 906.576 48.262
      k=40 202.489 1 772.241 45.582 2 035.429 52.803
      k=50 223.472 1 807.454 58.483 2 106.553 74.425
      PaviaU
      数据
      k=10 104.689 1 515.092 27.526 1 728.659 32.592
      k=20 193.446 2 076.524 43.137 2 237.461 51.677
      k=30 233.156 2 917.889 59.205 3 141.394 70.224
      k=40 276.946 4 052.803 81.732 4 277.556 89.539
      k=50 300.457 5 044.261 102.422 5 429.083 121.773
    • 从式(8)中可看出,平衡参数λ和拉格朗日方程优化问题的目标解的关系显著,其取值大小能够改变稀疏系数矩阵的非零行的个数来影响SSR的波段选择结果。因此,对比分析不同λ对Urban数据和PaviaU数据的SSR波段子集的SVM分类结果的影响。我们认为,用于分类的波段数应至少大于地物实际类别的个数,因此Urban和PaviaU数据集中波段数分别选择为23和10。Urban数据集中,SSR方法的λ的选择区间分别为20~150,步长为5;PaviaU数据集中SSR方法的平衡参数λ的选择区间分别为5~150,步长为5。Urban和PaviaU数据中其他未提及的SSR的参数设置与§3.2.1及§3.2.2保持一致。

      图 3列出Urban和PaviaU数据中不同取值对SSR的总体分类精度OCA的影响。从图 3(a)的Urban数据中可以看出,当λ具有较小值时,SSR得到的OCA分类精度较低;随着λ的持续增加,OCA曲线逐步上升,在一个明显“拐点”处达到一一个较高值;随着λ的持续增加,OCA曲线增长开始缓慢并呈现波动状态。而且,可以看出,Urban数据的OCA曲线的拐点在λ=45左右,即拐点λ稍大于Urban数据中地物类别个数的2倍。同样地,由图 3(b)的PaviaU数据可以看出,SSR的OCA结果随着λ的增加而持续增加,在λ=20(即稍大于地物类别个数的2倍)左右达到一个较高值;然后随着λ的继续增加,OCA曲线开始波动并缓慢上升。因此,较小的平衡参数λ对SSR的波段子集用于分类的精度结果影响显著,在平衡参数λ大于地物类别个数2倍取值时,能够实现SSR的波段选择结果,得到较高的总体分类精度。

      图  3  Urban和PaviaU数据中平衡参数λ对SSR波段子集的总体分类精度OCA的影响

      Figure 3.  Effect from the Balance Parameter λ on OCA Results of the SSR Band Subset for Urban and PaviaU Datasets

    • 本文提出SSR波段选择方法用于研究高光谱影像分类过程中的波段选择问题。SSR方法基于字典矩阵等于测量向量的多观测向量的稀疏表达理论,将波段选择转换为多观测向量模型中稀疏系数矩阵的求解问题,引入稀疏系数矩阵的L1, 2混合范数来限定非零元素行的个数,利用凸优化方法求解稀疏系数矩阵的非零行向量来帮助实现波段的有效选择。利用Urban和PaviaU两个高光谱影像数据并对比4种典型的波段选取方法(LCMV-BCC、MVPCA、SpaBS和SNMF)来证明SSR波段选取方法的有效性。实验结果表明,SSR方法的总体分类结果优于SpaBS和MVPCA方法,而且在波段数目大于地物类别个数时,能够类似于或稍优于SNMF和LCMV-BCC的总体分类精度。SSR方法的计算效率在5种波段选择方法中处于中等地位,计算速度明显优于MVPCA和SpaBS方法,却低于MVPCA和SNMF。同时,研究发现,SSR中平衡参数λ对波段子集用于分类的精度结果影响较为明显,在实际中应选择大于地物类别个数2倍的λ值来保证SSR得到较高的分类结果。

      本文的研究结果需要下一步的工作来进一步完善。首先,本文没有考虑最佳波段个数的参数选择问题,只是对比不同方法在一定波段数量区间范围内的分类性能。其次,本文采用K-均值聚类方法来消除相邻波段的强相关性, 会导致SSR模型选取相邻几个近似波段作为波段子集的元素。而波段相关性能够利用波段的相关系数矩阵或各波段构成的相似性矩阵来度量,并可以作为先验信息纳入到SSR模型中,进而实现波段的有效和自适应选取。

参考文献 (20)

目录

    /

    返回文章
    返回