留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

利用可分离非负矩阵分解实现高光谱波段选择

杨刚 孙伟伟 张殿发

杨刚, 孙伟伟, 张殿发. 利用可分离非负矩阵分解实现高光谱波段选择[J]. 武汉大学学报 ● 信息科学版, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
引用本文: 杨刚, 孙伟伟, 张殿发. 利用可分离非负矩阵分解实现高光谱波段选择[J]. 武汉大学学报 ● 信息科学版, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
YANG Gang, SUN Weiwei, ZHANG Dianfa. Separable Nonnegative Matrix Factorization Based Band Selection for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
Citation: YANG Gang, SUN Weiwei, ZHANG Dianfa. Separable Nonnegative Matrix Factorization Based Band Selection for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174

利用可分离非负矩阵分解实现高光谱波段选择

doi: 10.13203/j.whugis20170174
基金项目: 

国家自然科学基金 41671342

国家自然科学基金 41801256

浙江省自然科学基金 LR19D010001

浙江省自然科学基金 LQ18D010001

地球观测与时空信息科学国家测绘地理信息局重点实验室开放基金 201804

测绘遥感信息工程国家重点实验室开放基金 18R05

详细信息
    作者简介:

    杨刚, 博士, 讲师, 从事遥感影像数据质量改善与信息提取理论和方法、遥感滨海健康监测技术与应用研究。yanggang@nbu.edu.cn

    通讯作者: 孙伟伟, 博士, 副教授。sunweiwei@nbu.edu.cn
  • 中图分类号: P237;TP751

Separable Nonnegative Matrix Factorization Based Band Selection for Hyperspectral Imagery

Funds: 

National Natural Science Foundation of China 41671342

National Natural Science Foundation of China 41801256

Natural Science Foundation of Zhejiang Province LR19D010001

Natural Science Foundation of Zhejiang Province LQ18D010001

Open Fund of Key Laboratory of Earth Observation and Geospatial Information Science of NASG 201804

Open Fund of State Laboratory of Information Engineering in Surveying, Mapping and Remote Sensing, Wuhan University 18R05

More Information
    Author Bio:

    YANG Gang, PhD, lecturer, specializes in quality improvement of remote sensing and information extraction, and coastal health monitoring techniques and application of remote sensing. E-mail: yanggang@nbu.edu.cn

    Corresponding author: SUN Weiwei, PhD, associate professor. E-mail: sunweiwei@nbu.edu.cn
  • 摘要: 高光谱影像波段众多且相关性强,导致分类存在信息冗余且计算量较大。提出了可分离非负矩阵分解方法来选取高光谱影像的代表性波段子集,在保证分类精度的同时降低计算量。该方法假设高光谱影像的波段集合具有可分离特性,改进传统非负矩阵分解模型,将波段选择转换为可分离非负矩阵分解问题,采用迭代投影方法来依次选取能够非负线性表达其他波段的代表性波段。在此基础上,利用两个公开高光谱数据集对比几种主流方法,采用定量评价和分类精度指标来综合评价所提的波段选择方法的效果。实验结果表明,可分离非负矩阵分解方法的分类精度高于其他几种方法,而且计算效率排名第2,能够选取合适的波段子集以满足高光谱遥感的应用需求。
  • 图  1  SepNMF用于波段选择的流程

    Figure  1.  Process of SepNMF for Band Selection

    图  2  印第安纳派恩斯市影像

    Figure  2.  Image of Indian Pines Data

    图  3  某城市影像

    Figure  3.  Image of Urban Data

    图  4  不同方法的OCA曲线

    Figure  4.  OCA Curves of Different Band Selection Methods on Two Datasets

    图  5  不同波段选择方法的派恩斯市数据的SVM分类结果

    Figure  5.  SVM Classification Maps of Different Band Selection Methods on Indian Pines Dataset

    图  6  不同波段选择方法的某城市数据的SVM分类结果

    Figure  6.  SVM Classification Maps of Different BandSelection Methods on Urban Dataset

    图  7  不同训练样本大小下的各种波段选择方法的OCA曲线

    Figure  7.  OCA Curves of Different Band Selection Methods with Different Sizes of Training Samples per Class

    表  1  印第安纳派恩斯市数据的地面地物样本信息

    Table  1.   Ground Truth of All Classes of Ground Objects on Indian Pines Dataset

    类号 类名 样本数
    1 苜蓿 46
    2 非耕犁玉米 1 428
    3 玉米幼苗 830
    4 玉米 237
    5 草地/牧场 483
    6 草地/树木 730
    7 收割的草地/牧场 28
    8 打包的干草 478
    9 燕麦 20
    10 非耕犁大豆 972
    11 大豆幼苗 2 455
    12 清洁的大豆 593
    13 小麦 205
    14 树林 1 265
    15 建筑物-草地-树木驱动器 386
    16 石铁塔 93
    样本总数 10 249
    下载: 导出CSV

    表  2  某城市数据的地面地物样本信息

    Table  2.   Samples of Ground Objects in Each Class for Urban Dataset

    类号 类名 样本数
    1 深色沥青 85
    2 浅色沥青 58
    3 混凝土01 124
    4 牧草 236
    5 草地 127
    6 树木01 263
    7 土壤01 113
    8 土壤02 53
    9 深色土壤03 59
    10 墙面屋顶01 118
    11 屋顶02A 91
    12 屋顶02B 39
    13 浅灰屋顶03 35
    14 深色琉璃屋顶04 84
    15 教堂屋顶05A 85
    16 学校屋顶06 64
    17 明亮屋顶07 72
    18 蓝绿屋顶08 45
    19 网球场 96
    20 阴影植被 40
    21 阴影地面 64
    22 树木02 261
    样本总数 2 212
    下载: 导出CSV

    表  3  不同波段选择方法的定量评价结果

    Table  3.   Results of Quantitative Evaluations from Different Methods on Two Datasets

    数据 评价因子 MVPCA SpaBS SNMF FDPC SepNMF
    印第安纳派恩斯市 AIE 10.635 10.434 10.584 10.993 11.478
    ACC 0.606 0.576 0.226 0.320 0.201
    ARE 14.828 18.161 19.552 32.184 30.810
    某城市 AIE 7.702 7.521 7.438 7.296 7.997
    ACC 0.841 0.904 0.664 0.738 0.562
    ARE 1.007 1.422 16.356 16.217 17.606
    下载: 导出CSV

    表  4  不同波段选择方法的计算时间对比

    Table  4.   Contrast in Computational Time of Different Methods on Two Hyperspectral Datasets

    影像 k 计算时间/s
    MVPCA SpaBS SNMF FDPC SepNMF
    印第安纳派恩斯市 10 0.062 90.72 2.28 3.45 0.07
    20 0.062 97.24 3.09 3.56 0.12
    30 0.063 101.13 5.78 3.64 0.19
    40 0.063 106.89 6.56 3.76 0.28
    50 0.063 112.19 15.24 3.84 0.41
    某城市 10 0.161 742.32 12.579 3.37 0.16
    20 0.171 1013.57 21.35 3.37 0.28
    30 0.182 1377.42 51.77 3.41 0.43
    40 0.187 1423.55 135.06 3.51 0.61
    50 0.194 1513.20 291.75 3.75 0.84
    下载: 导出CSV
  • [1] 童庆禧, 张兵, 张立福.中国高光谱遥感的前沿进展[J].遥感学报, 2016, 20(5):689-707 http://d.old.wanfangdata.com.cn/Periodical/ygxb201605002

    Tong Qingxi, Zhang Bing, Zhang Lifu.Current Progress of Hyperspectral Remote Sensing in China[J].Journal of Remote Sensing, 2016, 20(5):689-707 http://d.old.wanfangdata.com.cn/Periodical/ygxb201605002
    [2] 张良培, 李家艺.高光谱图像稀疏信息处理综述与展望[J].遥感学报, 2016, 20(5):1091-1101 http://d.old.wanfangdata.com.cn/Periodical/ygxb201605032

    Zhang Liangpei, Li Jiayi.Development and Prospect of Sparse Representation-based Hyperspectral Image Processing and Analysis[J].Journal of Remote Sensing, 2016, 20(5):1091-1101 http://d.old.wanfangdata.com.cn/Periodical/ygxb201605032
    [3] 张兵.高光谱图像处理与信息提取前沿[J].遥感学报, 2016, 20(5):1062-1090 http://d.old.wanfangdata.com.cn/Periodical/ygxb201605031

    Zhang Bing.Advancement of Hyperspectral Image Processing and Information Extraction[J].Journal of Remote Sensing, 2016, 20(5):1062-1090 http://d.old.wanfangdata.com.cn/Periodical/ygxb201605031
    [4] 刘帅, 朱亚杰, 薛磊.一种结合稀疏表示和纹理分块的遥感影像超分辨率方法[J].武汉大学学报∙信息科学版, 2015, 40(5):578-582 http://ch.whu.edu.cn/CN/abstract/abstract3248.shtml

    Liu Shuai, Zhu Yajie, Xue Lei.Remote Sensing Image Super-Resolution Method Using Sparse Representation and Classified Texture Patches[J].Geomatics and Information Science of Wuhan University, 2015, 40(5):578-582 http://ch.whu.edu.cn/CN/abstract/abstract3248.shtml
    [5] 黄远程, 钟燕飞, 赵野鹤, 等.联合盲分解与稀疏表达的高光谱图像异常目标检测[J].武汉大学学报∙信息科学版, 2015, 40(9):1144-1150 http://ch.whu.edu.cn/CN/abstract/abstract3312.shtml

    Huang Yuancheng, Zhong Yanfei, Zhao Yehe, et al.Joint Blind Unmixing and Sparse Representation for Anomaly Detection in Hyperspectral Image[J].Geomatics and Information Science of Wuhan University, 2015, 40(9):1144-1150 http://ch.whu.edu.cn/CN/abstract/abstract3312.shtml
    [6] Sun W, Zhang L, Du B, et al.Band Selection Using Improved Sparse Subspace Clustering for Hyperspectral Imagery Classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(6):2784-2797 doi:  10.1109/JSTARS.2015.2417156
    [7] Pal M, Foody G M.Feature Selection for Classification of Hyperspectral Data by SVM[J].IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(5):2297-2307 doi:  10.1109/TGRS.2009.2039484
    [8] Sun W W, Zhang L P, Zhang L F, et al.A Dissimilarity-Weighted Sparse Self-Representation Method for Band Selection in Hyperspectral Imagery Classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2016, 9(9):1-15 doi:  10.1109/JSTARS.2016.2610587
    [9] Chang C I, Du Q, Sun T L, et al.A Joint Band Prioritization and Band-Decorrelation Approach to Band Selection for Hyperspectral Image Classification[J].IEEE Transactions on Geoscience and Remote Sensing, 1999, 37(6):2631-2641 doi:  10.1109/36.803411
    [10] Chang C I, Wang S.Constrained Band Selection for Hyperspectral Imagery[J].IEEE Transactions on Geoscience and Remote Sensing, 2006, 44(6):1575-1585 doi:  10.1109/TGRS.2006.864389
    [11] Martínez-Usómartinez-Uso A, Pla F, Sotoca J M, et al.Clustering-Based Hyperspectral Band Selection Using Information Measures[J].IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(12):4158-4171 doi:  10.1109/TGRS.2007.904951
    [12] Qian Y, Yao F, Jia S.Band Selection for Hyperspectral Imagery Using Affinity Propagation[J].IET Computer Vision, 2009, 3(4):213-222 doi:  10.1049/iet-cvi.2009.0034
    [13] Du Q, Yang H.Similarity-Based Unsupervised Band Selection for Hyperspectral Image Analysis[J].IEEE Geoscience & Remote Sensing Letters, 2008, 5(4):564-568 http://cn.bing.com/academic/profile?id=24b44d39933248806cfd30f829bc9a91&encoded=0&v=paper_preview&mkt=zh-cn
    [14] Su H, Du Q, Chen G, et al.Optimized Hyperspectral Band Selection Using Particle Swarm Optimization[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2014, 7(6):2659-2670 doi:  10.1109/JSTARS.2014.2312539
    [15] Li J M, Qian Y T.Clustering-Based Hyperspectral Band Selection Using Sparse Nonnegative Matrix Factorization[J].Journal of Zhejiang University SCIENCE C, 2011, 12(7):542-549 doi:  10.1631/jzus.C1000304
    [16] Chepushtanova S, Gittins C, Kirby M.Band Selection in Hyperspectral Imagery Using Sparse Support Vector Machines[C].SPIE Conference in Algorithms and Technologies for Multispectral, Hyperspectral, and Ultraspectral Imagery XX, Baltimore, Maryland, USA, 2014
    [17] Yuan Y, Zhu G, Wang Q.Hyperspectral Band Selection by Multitask Sparsity Pursuit[J].IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(2):631-644 doi:  10.1109/TGRS.2014.2326655
    [18] Feng Y, Yuan Y, Lu X.A Non-negative Low-rank Representation for Hyperspectral Band Selection[J].International Journal of Remote Sensing, 2016, 37(19):4590-4609 doi:  10.1080/01431161.2016.1214299
    [19] Sun W, Li W, Li J, et al.Band Selection Using Sparse Nonnegative Matrix Factorization with the Thresholded Earth's Mover Distance for Hyperspectral Imagery Classification[J].Earth Science Informatics, 2015, 8(4):907-918 doi:  10.1007/s12145-014-0201-3
    [20] Lu X, Wu H, Yuan Y, et al.Manifold Regularized Sparse NMF for Hyperspectral Unmixing[J].IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(5):2815-2826 doi:  10.1109/TGRS.2012.2213825
    [21] Donoho D L, Stodden V.When Does Non-negative Matrix Factorization Give a Correct Decomposition into Parts?[C].The 2003 Conference in Advances in Neural Information Processing Systems, Whistler, British Columbia, Canada, 2003
    [22] Gillis N.Robustness Analysis of Hottopixx, a Linear Programming Model for Factoring Nonnegative Matrices[J].SIAM Journal on Matrix Analysis and Applications, 2013, 34(3):1189-1212 doi:  10.1137/120900629
    [23] Kumar A, Sindhwani V, Kambadur P.Fast Conical Hull Algorithms for Near-Separable Non-negative Matrix Factorization[C].The 30th International Conference on Machine Learning, Atlanta, USA, 2013
    [24] Gillis N, Vavasis S A.Fast and Robust Recursive Algorithms for Separable Nonnegative Matrix Factorization[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(4):698-714 doi:  10.1109/TPAMI.2013.226
    [25] Li Shuangjiang, Qi Hairong.Sparse Representation Based Band Selection for Hyperspectral Images[C].The 18th IEEE International Conference on Image Processing, Brussels, Belgium, 2011
    [26] Jia S, Tang G, Zhu J, et al.A Novel Ranking-Based Clustering Approach for Hyperspectral Band Selection[J].IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(1):88-102 doi:  10.1109/TGRS.2015.2450759
  • [1] 董燕妮, 杜博, 张乐飞, 张良培.  基于局域自适应信息理论测度学习的高光谱目标探测方法 . 武汉大学学报 ● 信息科学版, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
    [2] 赵波, 苏红军, 蔡悦.  一种切空间协同表示的高光谱遥感影像分类方法 . 武汉大学学报 ● 信息科学版, 2018, 43(4): 555-562, 604. doi: 10.13203/j.whugis20150579
    [3] 鲍蕊, 薛朝辉, 张像源, 苏红军, 杜培军.  综合聚类和上下文特征的高光谱影像分类 . 武汉大学学报 ● 信息科学版, 2017, 42(7): 890-896. doi: 10.13203/j.whugis20150043
    [4] 孙伟伟, 蒋曼, 李巍岳.  利用稀疏自表达实现高光谱影像波段选择 . 武汉大学学报 ● 信息科学版, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
    [5] 白璘, 刘盼芝, 惠萌.  利用小波核最小噪声分离进行高光谱影像SVM分类 . 武汉大学学报 ● 信息科学版, 2016, 41(5): 624-628,644. doi: 10.13203/j.whugis20140209
    [6] 王凯, 舒宁, 孔祥兵, 李亮.  一种多特征转换的高光谱影像自适应分类方法 . 武汉大学学报 ● 信息科学版, 2015, 40(5): 612-616. doi: 10.13203/j.whugis20130384
    [7] 林娜, 杨武年, 王斌.  高光谱遥感影像核最小噪声分离变换特征提取 . 武汉大学学报 ● 信息科学版, 2013, 38(8): 988-992.
    [8] 孙伟伟, 刘春, 施蓓琦, 李巍岳.  等距映射降维用于高光谱影像低维流形特征提取 . 武汉大学学报 ● 信息科学版, 2013, 38(6): 642-647.
    [9] 王凯, 舒宁, 李亮, 龚龑.  利用ICA正交子空间投影加权的高光谱影像目标探测算法 . 武汉大学学报 ● 信息科学版, 2013, 38(4): 440-444.
    [10] 高建, 张飞艳, 谢伟, 秦前清.  利用能量变分方法进行高光谱数据去噪处理 . 武汉大学学报 ● 信息科学版, 2012, 37(3): 322-325.
    [11] 苏红军, 盛业华.  高光谱影像的改进K-均值监督式聚类分析方法 . 武汉大学学报 ● 信息科学版, 2012, 37(6): 640-643.
    [12] 谭琨, 杜培军, 王小美.  利用分离性测度多类支持向量机进行高光谱遥感影像分类 . 武汉大学学报 ● 信息科学版, 2011, 36(2): 171-175.
    [13] 黄远程, 李平湘, 张良培.  基于交互最小二乘优化的高光谱影像端元光谱分析 . 武汉大学学报 ● 信息科学版, 2010, 35(10): 1217-1221.
    [14] 舒宁, 苏俊英.  高光谱影像纹理特征编码分形特征研究 . 武汉大学学报 ● 信息科学版, 2009, 34(4): 379-382.
    [15] 吴波, 张良培, 李平湘.  基于支撑向量机概率输出的高光谱影像混合像元分解 . 武汉大学学报 ● 信息科学版, 2006, 31(1): 51-54.
    [16] 杜辉强, 舒宁.  高光谱影像能量边缘提取 . 武汉大学学报 ● 信息科学版, 2006, 31(2): 132-135.
    [17] 陈蜜, 易尧华, 李德仁, 秦前清.  基于动力演化算法的投影寻踪在高光谱影像异常目标检测中的应用 . 武汉大学学报 ● 信息科学版, 2006, 31(1): 55-58.
    [18] 刘楠, 舒宁.  基于光谱空间密度分析的边缘提取 . 武汉大学学报 ● 信息科学版, 2004, 29(12): 1093-1096.
    [19] 舒宁.  关于多光谱和高光谱影像的纹理问题 . 武汉大学学报 ● 信息科学版, 2004, 29(4): 292-295.
    [20] 张世强, 卢健, 刘时银.  利用TM高光谱图像提取青藏高原喀喇昆仑山区现代冰川边界 . 武汉大学学报 ● 信息科学版, 2001, 26(5): 435-440.
  • 加载中
图(7) / 表(4)
计量
  • 文章访问数:  676
  • HTML全文浏览量:  18
  • PDF下载量:  97
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-04-17
  • 刊出日期:  2019-05-05

利用可分离非负矩阵分解实现高光谱波段选择

doi: 10.13203/j.whugis20170174
    基金项目:

    国家自然科学基金 41671342

    国家自然科学基金 41801256

    浙江省自然科学基金 LR19D010001

    浙江省自然科学基金 LQ18D010001

    地球观测与时空信息科学国家测绘地理信息局重点实验室开放基金 201804

    测绘遥感信息工程国家重点实验室开放基金 18R05

    作者简介:

    杨刚, 博士, 讲师, 从事遥感影像数据质量改善与信息提取理论和方法、遥感滨海健康监测技术与应用研究。yanggang@nbu.edu.cn

    通讯作者: 孙伟伟, 博士, 副教授。sunweiwei@nbu.edu.cn
  • 中图分类号: P237;TP751

摘要: 高光谱影像波段众多且相关性强,导致分类存在信息冗余且计算量较大。提出了可分离非负矩阵分解方法来选取高光谱影像的代表性波段子集,在保证分类精度的同时降低计算量。该方法假设高光谱影像的波段集合具有可分离特性,改进传统非负矩阵分解模型,将波段选择转换为可分离非负矩阵分解问题,采用迭代投影方法来依次选取能够非负线性表达其他波段的代表性波段。在此基础上,利用两个公开高光谱数据集对比几种主流方法,采用定量评价和分类精度指标来综合评价所提的波段选择方法的效果。实验结果表明,可分离非负矩阵分解方法的分类精度高于其他几种方法,而且计算效率排名第2,能够选取合适的波段子集以满足高光谱遥感的应用需求。

English Abstract

杨刚, 孙伟伟, 张殿发. 利用可分离非负矩阵分解实现高光谱波段选择[J]. 武汉大学学报 ● 信息科学版, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
引用本文: 杨刚, 孙伟伟, 张殿发. 利用可分离非负矩阵分解实现高光谱波段选择[J]. 武汉大学学报 ● 信息科学版, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
YANG Gang, SUN Weiwei, ZHANG Dianfa. Separable Nonnegative Matrix Factorization Based Band Selection for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
Citation: YANG Gang, SUN Weiwei, ZHANG Dianfa. Separable Nonnegative Matrix Factorization Based Band Selection for Hyperspectral Imagery[J]. Geomatics and Information Science of Wuhan University, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
  • 高光谱遥感利用数百个波段采集地表地物从可见光至近红外的光谱响应信息,能够利用分类区分具有细微光谱特征差异的地物[1-3],分类结果对植被覆盖制图和海岸带监测等应用影响重大[4-5]。但是,高光谱波段众多且相关性强,导致分类时存在明显的信息冗余且计算量较大[6]。此外,高光谱分类存在维数灾难问题,需要巨大的训练样本来得到高精度的结果[7]。因此,可以采用波段选择来选取波段子集,降低原始数据计算量并得到较高精度[3, 8]

    国内外学者针对高光谱波段选择提出了许多方法,包括基于排序策略的最大方差主成分分析(maximum variance principal component analysis, MVPCA)[9]与限制能量最小的限制波段选择方法[10],基于聚类策略的层次聚类法[11]与仿射传播法[12],以及基于搜索策略的线性预测搜索法[13]与粒子群优化搜索法[14]等。其后,矩阵计算策略逐渐被用于解决高光谱波段选择问题,充分考虑高光谱数据的潜在结构(如稀疏、低秩和非负等),将波段选择转换为矩阵分解的目标优化问题来求解。目前有学者在该方面进行了研究,如稀疏非负矩阵分解(sparse nonnegative matrix factorization, SNMF)将高光谱波段矩阵分解为字典和稀疏系数矩阵,利用聚类稀疏系数的列向量来选择最佳波段[15];稀疏支持向量机方法基于二值分类器得到各个波段对应的权重系数,利用权重系数差异来选取重要波段[16];改进的稀疏子空间聚类方法通过整合稀疏表达和子空间聚类方法,利用稀疏系数向量来构建相似性矩阵,采用谱聚类方法来得到合适波段[6];多任务稀疏追踪将波段选择转换为多任务稀疏追踪学习问题,采用进化策略来选取波段[17];差异加权自表达考虑波段的差异信息来构建差异性正则项,改进自表达模型来选取较大差异的波段[8];低阶表达方法利用排序波段的表达系数来选取合适波段以满足分类需求[18]

    不同于上述方法,本文提出了可分离非负矩阵分解(separable nonnegative matrix factorization, SepNMF)方法来研究高光谱影像的波段选择问题。利用美国印第安纳派恩斯市和某城市共两个数据集进行实验分析,验证提出的SepNMF方法的有效性。

    • 假设高光谱波段矩阵为$\mathit{\boldsymbol{Y}} = [{\mathit{\boldsymbol{y}}_i}]_{i = 1}^N \in {{\bf{R}}^{D \times N}}$,其中D为像素个数,N为波段数,yi为任一波段对应的向量。非负矩阵分解模型为:

      $$\mathit{\boldsymbol{Y}} = \mathit{\boldsymbol{WH}} $$ (1)

      该模型将高光谱波段矩阵Y分解为非负字典矩阵WRD×r和非负系数矩阵HRr×N的乘积,以逼近原始的影像数据[19-20],其中rWH的秩,且rN < D。非负矩阵分解具有许多特性,如聚类、稀疏和低秩等,然而WH未知,导致上述问题非凸而较难得到全局最优解。

      可分离特性能够解决上述病态问题[21]。可分离特性认为[22]:假如存在一个基数为r的高维数据Y的索引子集k满足Y=Y(:, ki)H,那么Yr分离的。其中,“:”表示选中矩阵中某列全部元素,Y(:, ki)为水平排列的索引子集k的原始波段矩阵Y的子集,$\forall {k_i} \in \left[{1, 2 \cdots N} \right]$且|k|0=r

      将可分离特性应用到Y中,假设W=Y(:,ki),高光谱的可分离非负矩阵分解模型可表达为:

      $$\begin{array}{*{20}{c}} {\mathit{\boldsymbol{Y}} = \mathit{\boldsymbol{WH}}, \forall {k_i} \in \left[ {1, 2 \cdots N} \right], }\\ {\quad {\rm{}}{{\left| k \right|}_0} = r{\rm{}}{\rm{}}r \ll {\rm{min}}\left( {D, N} \right)} \end{array} $$ (2)

      式中,k为波段的索引子集且数量为r。可分离特性能够保证高光谱波段矩阵Y估计得到唯一的波段子集Y(, :, ki),且剩余的波段能够被Y(:, ki)进行非负线性表达。可分离矩阵分解求解解释为寻找包围其对应高维数据点的凸圆锥体的极端射线[23]

    • 式(2)中,假如将高光谱波段矩阵Y的每一列进行归一化处理,则可以得到:

      $$\mathit{\boldsymbol{Y}} = \mathit{\boldsymbol{WH}} \equiv \mathit{\boldsymbol{YD}}_\mathit{\boldsymbol{Y}}^{ - 1} = \mathit{\boldsymbol{WD}}_\mathit{\boldsymbol{W}}^{ - 1}\left( {{\mathit{\boldsymbol{D}}_\mathit{\boldsymbol{W}}}\mathit{\boldsymbol{HD}}_\mathit{\boldsymbol{W}}^{ - 1}} \right) $$ (3)

      式中,

      $$\begin{array}{*{20}{c}} {{{({\mathit{\boldsymbol{D}}_\mathit{\boldsymbol{X}}})}_{i, j}} = \left\{ {\begin{array}{*{20}{l}} ‖{{\mathit{\boldsymbol{X}}_{:, j}}‖_1, {\rm{如果}}i = j, {\mathit{\boldsymbol{X}}_{:, j}} \ne 0}\\ {1, {\rm{如果}}i = j, {\mathit{\boldsymbol{X}}_{:, j}} = 0}\\ {0, {\rm{其他}}} \end{array}} \right.}\\ {\mathit{\boldsymbol{X}} = \mathit{\boldsymbol{W}}{\rm{或}}\mathit{\boldsymbol{Y}}} \end{array} $$

      可以看出,DY-1WDW-1每一列元素和为1。同时,由可分离特性可知,高光谱的波段矩阵可以通过优化排列,使得前r列分别对应于W的列,即Y=WH=W[IrH′]T,其中Ir为大小为r的单位矩阵,H′R(N-rr为系数矩阵,其每一列所有元素和小于等于1。考虑到采集误差,假设Y′=Y+E,其中E为误差项,Y满足可分离特性且每一列元素和为1。

      文献[24]证明,如果索引i使得Y′(:,i)满足条件argmax‖Y′(:,i)‖2,则存在jk使得W(:,j)满足:

      $$\begin{array}{*{20}{c}} {\mathit{\boldsymbol{Y}}{\rm{'}}\left( {:, i} \right) - \mathit{\boldsymbol{W}}{{\left( {:, j} \right)}_2} \le O\left( {\frac{L}{\mu }\frac{\varepsilon }{{\sigma _r^2\left( \mathit{\boldsymbol{W}} \right)}}} \right), }\\ {1 \le i \le N, {\rm{}}1 \le j \le r} \end{array} $$ (4)

      式中,μL分别为函数f=‖·‖2的凸参数和利普希茨连续梯度常数;‖·‖2的全局最小值为f(0)=0;ε为误差项的二阶范数阈值,即‖E(:,i)‖≤εσr(W)为矩阵W的第r个奇异值,O(·)表示和括号里的参数成比例的一个数值。本文采用迭代优化策略,假定第t次迭代中Y′的残差矩阵R(t)= [W′(t)Q]H+E(t),其中QRD×(r-t),可分离非负矩阵分解模型式(2)可转换为优化问题式(5):

      $${i^{\rm{*}}} = {\rm{argmax}}\left\| {{\mathit{\boldsymbol{R}}^{\left( t \right)}}{{\left( {:, i} \right)}_2}} \right\|, 0 \le t \le r $$ (5)

      可以看出,在第t次迭代中,argmax‖R(t)(:,i)‖2能够保证找到jκ来满足式(4)的条件。本文采用迭代投影算法[18]来求解目标优化问题,即式(5)。该方法利用R(0)=Y′来初始化残差矩阵R(0),采用W(:,t)=Y′(:,i*)来更新波段子集,并通过${\mathit{\boldsymbol{R}}^{\left({t + 1} \right)}} = \left({\mathit{\boldsymbol{I}} - \frac{{\mathit{\boldsymbol{R}}\left({:, {i^{\rm{*}}}} \right)\mathit{\boldsymbol{R}}{{(:, {i^{\rm{*}}})}^{\rm{T}}}}}{{\mathit{\boldsymbol{R}}\left({:, {i^{\rm{*}}}} \right)_2^2}}} \right){\mathit{\boldsymbol{R}}^{\left(t \right)}}$来迭代更新下一步的残差矩阵。在迭代次数t=r后,可估计得到合适的波段子集W=Y′(:,k),从而进一步优化求解目标函数式(6)来估计得到系数矩阵Ĥ

      $$\mathit{\boldsymbol{\hat H}} = \mathop {{\rm{argmin}}}\limits_{\mathit{\boldsymbol{H}} > 0} \left\| {\mathit{\boldsymbol{Y}} - \mathit{\boldsymbol{WH}}} \right\|_\mathit{\boldsymbol{F}}^2 $$ (6)
    • 利用可分离非负矩阵分解方法SepNMF实现高光谱波段选择的流程如图 1所示,包含以下步骤:

      图  1  SepNMF用于波段选择的流程

      Figure 1.  Process of SepNMF for Band Selection

      1)将三维高光谱影像立方体转换为二维矩阵Y′,其中DY′的矩阵列数,NY′的矩阵行数。

      2)利用式(2)构建高光谱影像的可分离非负稀疏矩阵分解模型,并将式(2)转换为寻找最大化残差矩阵列的目标优化问题,即式(5)。

      3)利用迭代投影算法依次更新误差矩阵R(t+1)W(:,t)。在迭代次数t=r时,估计得到合适的波段子集W=Y′(:,k)。

      4)求解目标函数式(6)得到系数矩阵的最优值Ĥ

    • 美国印第安纳派恩斯市影像来自美国普渡大学遥感应用实验室。影像由美国喷气推进实验室成像光谱仪于1992年6月12日采集得到,空间分辨率为20 m,光谱分辨率为10 nm,光谱区间为200~2 400 nm,预处理后波段数为200个。图 2为覆盖美国印第安纳州西拉法叶地区西部8 km(派恩斯市)的一小块区域,包含145×145像素。图 2中共包含16类主要地物,其地物分布的样本信息见表 1

      图  2  印第安纳派恩斯市影像

      Figure 2.  Image of Indian Pines Data

      表 1  印第安纳派恩斯市数据的地面地物样本信息

      Table 1.  Ground Truth of All Classes of Ground Objects on Indian Pines Dataset

      类号 类名 样本数
      1 苜蓿 46
      2 非耕犁玉米 1 428
      3 玉米幼苗 830
      4 玉米 237
      5 草地/牧场 483
      6 草地/树木 730
      7 收割的草地/牧场 28
      8 打包的干草 478
      9 燕麦 20
      10 非耕犁大豆 972
      11 大豆幼苗 2 455
      12 清洁的大豆 593
      13 小麦 205
      14 树林 1 265
      15 建筑物-草地-树木驱动器 386
      16 石铁塔 93
      样本总数 10 249

      美国某城市高光谱影像为从美国陆军地理空间中心获取的HYDICE影像。影像采集于1995年10月,空间分辨率为2 m,光谱分辨率为10 nm。影像大小为307×307像素,覆盖美国德克萨斯州科帕拉斯区域(靠近胡德堡),如图 3所示。对原始的210个波段数据进行预处理,移除低噪比波段,剩余162个波段,包含22类主要地物,各地物的真实分布样本信息如表 2所示。

      图  3  某城市影像

      Figure 3.  Image of Urban Data

      表 2  某城市数据的地面地物样本信息

      Table 2.  Samples of Ground Objects in Each Class for Urban Dataset

      类号 类名 样本数
      1 深色沥青 85
      2 浅色沥青 58
      3 混凝土01 124
      4 牧草 236
      5 草地 127
      6 树木01 263
      7 土壤01 113
      8 土壤02 53
      9 深色土壤03 59
      10 墙面屋顶01 118
      11 屋顶02A 91
      12 屋顶02B 39
      13 浅灰屋顶03 35
      14 深色琉璃屋顶04 84
      15 教堂屋顶05A 85
      16 学校屋顶06 64
      17 明亮屋顶07 72
      18 蓝绿屋顶08 45
      19 网球场 96
      20 阴影植被 40
      21 阴影地面 64
      22 树木02 261
      样本总数 2 212
    • 利用公开高光谱影像(印第安纳派恩斯市和某城市)设计实验来验证SepNMF波段选择的效果。实验采用支持向量机(support vector machine, SVM)分类器和k-近邻(k-nearest neighbor, kNN)分类器来分类波段子集,利用总体分类精度(overall classification accuracy, OCA)来评价分类效果。SVM采用径向基核函数,其方差和惩罚因子通过交叉验证获得,kNN分类器的邻域大小为1。对比方法包括MVPCA [9]、基于稀疏的波段选择法(sparse based band selection, SpaBS)[25]、SNMF[15]和基于快速密度峰值聚类法(fast density-peak based clustering, FDPC)[26]

    • 本实验对比不同波段选择方法得到的波段子集的定量评价结果。参照文献[6],实验采用平均信息熵(average information entropy, AIE)来定量评价波段子集的信息量及光谱信息的丰富程度,采用平均相关系数(average correlation coefficient, ACC)来定量评价各波段的相关关系,采用平均相对熵(average relative entropy, ARE)来定量评价各个波段的差异及用于分类的可分性。印第安纳派恩斯市和某城市数据中,k的大小分别选取为30和40,SpaBS的迭代次数设置为5次。印第安纳派恩斯市数据中,SNMF的正则化因子分别设定为3.0和0.1;某城市数据中,SNMF方法中正则化因子分别设定为3.5和0.05。

      表 3对比了不同波段方法的定量评价结果。SepNMF波段子集的AIE最高,ACC最低,说明波段信息量最大、相关性最小。SepNMF的ARE表现较好,在印第安纳派恩斯市数据中略低于FDPC,但优于其他4种方法。SNMF和FDPC方法的定量评价结果总体较为接近,MVPCA和SpaBS方法的定量评价结果低于其他3种方法,在5种方法中表现欠佳。

      表 3  不同波段选择方法的定量评价结果

      Table 3.  Results of Quantitative Evaluations from Different Methods on Two Datasets

      数据 评价因子 MVPCA SpaBS SNMF FDPC SepNMF
      印第安纳派恩斯市 AIE 10.635 10.434 10.584 10.993 11.478
      ACC 0.606 0.576 0.226 0.320 0.201
      ARE 14.828 18.161 19.552 32.184 30.810
      某城市 AIE 7.702 7.521 7.438 7.296 7.997
      ACC 0.841 0.904 0.664 0.738 0.562
      ARE 1.007 1.422 16.356 16.217 17.606
    • 对比分析不同波段子集大小条件下SepNMF和其他几种方法在印第安纳派恩斯市和某城市数据集的分类性能。实验中,印第安纳派恩斯市影像中波段数的选择区间为2~44,步长为2;某城市影像中波段数的选择区间为2~50,步长为2。实验选定每一类地物中20%的真实样本作为训练样本来进行分类实验,其余地物样本作为测试样本。

      图 4为在不同子集大小条件下,各种波段选择方法在印第安纳派恩斯市和某城市影像集上得到的OCA曲线图。可以看出,随着波段数量的增加,所有方法的OCA整体上升。SepNMF方法得到的OCA曲线结果最优,分类精度整体优于其他几种方法。相比而言,SpaBS的OCA曲线整体低于MVPCA和其他几种方法(SNMF、FDPC和SepNMF)。FDPC的OCA曲线与SNMF较为接近或略低,但优于MVPCA和SpaBS方法。图 5图 6展示了以上方法在选定波段子集数量条件下的SVM分类结果。其中,印第安纳派恩斯市数据和某城市数据中,波段子集k的大小分别为30和40。可以看出,SepNMF的分类图结果优于其他方法,进一步验证了图 4的结论。因此,在不同波段数量条件下,SepNMF的OCA最高,优于其他几种波段选择方法。

      图  4  不同方法的OCA曲线

      Figure 4.  OCA Curves of Different Band Selection Methods on Two Datasets

      图  5  不同波段选择方法的派恩斯市数据的SVM分类结果

      Figure 5.  SVM Classification Maps of Different Band Selection Methods on Indian Pines Dataset

      图  6  不同波段选择方法的某城市数据的SVM分类结果

      Figure 6.  SVM Classification Maps of Different BandSelection Methods on Urban Dataset

    • 此实验对比分析不同训练样本大小条件下SepNMF和其他4种对比方法(MVPCA、SpaBS、SNMF和FDPC)的分类结果。其中,印第安纳派恩斯市和某城市影像的训练样本随机采样于地面地物样本集,采样比率的选择集合为为{0.05, 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5}。印第安纳派恩斯市影像中,波段数量k设定为30;某城市影像中,波段数量k设定为40。

      图 7为在不同地物训练样本大小条件下,SepNMF和其他几种方法在印第安纳派恩斯市和某城市影像中得到的OCA曲线图。可以看出,随着单一地物训练样本数量的增加,不同波段选择方法的OCA明显提升。其中,SepNMF方法得到的OCA曲线最优,在印第安纳派恩斯市和某城市影像中均优于其他方法的OCA曲线。SNMF和FDPC的OCA曲线结果较为接近;当训练样本较大时,SNMF的OCA结果优于FDPC。MVPCA的OCA曲线低于SNMF、FDPC和SepNMF,但明显优于SpaBS。因此,SepNMF在不同训练样本条件下得到的OCA结果优于其他几种波段选择方法。

      图  7  不同训练样本大小下的各种波段选择方法的OCA曲线

      Figure 7.  OCA Curves of Different Band Selection Methods with Different Sizes of Training Samples per Class

    • 此实验对比SepNMF和其他4种方法在不同波段数量条件下的计算效率。表 4为不同波段数量条件下,5种波段选择方法在印第安纳派恩斯市和某城市影像集上得到的计算时间。实验环境为戴尔Win10台式计算机,主要配置为Inter Core (TM) i7-6700 CPU 3.40 GHz和32 GB内存,所有对比方法的代码执行环境为Matlab 2016a。可以看出,随着波段数量的增加,各种方法的计算时间呈上升趋势。与SNMF和SpaBS相比,FDPC、SepNMF和MVPCA的计算时间随波段数量的增加上升幅度较小。这5种方法中,SpaBS计算效率最低,计算时间最长。SNMF的计算速度优于SpaBS,但低于其他方法。FDPC的计算速度低于SepNMF和MVPCA,MVPCA的计算速度最快。因此,5种方法的计算效率排名为:MVPCA > SepNMF > FDPC > SNMF > SpaBS。

      表 4  不同波段选择方法的计算时间对比

      Table 4.  Contrast in Computational Time of Different Methods on Two Hyperspectral Datasets

      影像 k 计算时间/s
      MVPCA SpaBS SNMF FDPC SepNMF
      印第安纳派恩斯市 10 0.062 90.72 2.28 3.45 0.07
      20 0.062 97.24 3.09 3.56 0.12
      30 0.063 101.13 5.78 3.64 0.19
      40 0.063 106.89 6.56 3.76 0.28
      50 0.063 112.19 15.24 3.84 0.41
      某城市 10 0.161 742.32 12.579 3.37 0.16
      20 0.171 1013.57 21.35 3.37 0.28
      30 0.182 1377.42 51.77 3.41 0.43
      40 0.187 1423.55 135.06 3.51 0.61
      50 0.194 1513.20 291.75 3.75 0.84
    • 本文提出利用SepNMF方法来解决高光谱波段选择问题,假设波段集合具有可分离结构,将波段选择转换为寻找非负线性表达其他波段的代表列,采用迭代投影方法来选取适合的波段子集。实验表明,SepNMF方法在不同波段数量和不同训练样本条件下的OCA优于其他4种方法,能够得到更好的分类结果。同时计算效率较好,在5种波段选择方法中排列第2。然而,本文没有考虑波段间的细微差异可能对结果产生的影响,在后续的研究中,将考虑波段差异信息权重矩阵,细致分析噪声和异常值对波段选择的影响。

参考文献 (26)

目录

    /

    返回文章
    返回