留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于局域自适应信息理论测度学习的高光谱目标探测方法

董燕妮 杜博 张乐飞 张良培

董燕妮, 杜博, 张乐飞, 张良培. 基于局域自适应信息理论测度学习的高光谱目标探测方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
引用本文: 董燕妮, 杜博, 张乐飞, 张良培. 基于局域自适应信息理论测度学习的高光谱目标探测方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
DONG Yanni, DU Bo, ZHANG Lefei, ZHANG Liangpei. Hyperspectral Target Detection Based on Locally Adaptive Information-Theoretic Metric Learning Method[J]. Geomatics and Information Science of Wuhan University, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
Citation: DONG Yanni, DU Bo, ZHANG Lefei, ZHANG Liangpei. Hyperspectral Target Detection Based on Locally Adaptive Information-Theoretic Metric Learning Method[J]. Geomatics and Information Science of Wuhan University, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504

基于局域自适应信息理论测度学习的高光谱目标探测方法

doi: 10.13203/j.whugis20150504
基金项目: 

国家重点基础研究发展规划项目 2012CB719905

国家自然科学基金 61471274

国家自然科学基金 41431175

湖北省自然科学基金 2014CFB193

中央高校基本科研业务费专项资金 CUG 170687

详细信息
    作者简介:

    董燕妮, 博士, 副教授, 主要从事高光谱遥感影像处理、测度学习方面的研究。dongyanni@cug.edu.cn

    通讯作者: 杜博, 博士, 教授。gunspace@163.com
  • 中图分类号: P237

Hyperspectral Target Detection Based on Locally Adaptive Information-Theoretic Metric Learning Method

Funds: 

The National Basic Research Program 2012CB719905

the National Natural Science Foundation of China 61471274

the National Natural Science Foundation of China 41431175

the Natural Science Foundation of Hubei Province 2014CFB193

the Fundamental Research Funds for the Central Universities, China University of Geosciences (Wuhan) CUG 170687

More Information
    Author Bio:

    DONG Yanni, PhD, associate professor, specializes in hyperspectral image processing and metric learning. E-mail: dongyanni@cug.edu.cn

    Corresponding author: DU Bo, PhD, professor. E-mail:gunspace@163.com
  • 摘要: 传统基于信号检测的目标探测方法需要依赖特定的统计假设,只有在符合条件的情况下才能取得较好的目标探测结果。为了克服这一缺陷,提出了一种基于局域自适应的信息理论测度学习方法。首先将信息理论测度学习方法作为目标主函数,然后加以局域自适应决策法则进行约束,自适应地减小相似样本对距离,增大不相似样本对距离,使得在考虑阈值的同时兼顾测度学习前后距离的改变情况来进行目标探测决策,从而更好地实现目标探测。实验证明,该方法与其他经典目标探测方法或测度学习方法相比,可以更好地实现目标与背景分离,能够更有效地对高光谱影像数据进行目标探测。
  • 图  1  月形火山坑区域高光谱数据

    Figure  1.  Hyperspectral Dataset of Lunar Crater Volcanic Field

    图  2  目标探测结果

    Figure  2.  Target Detection Performance

    图  3  目标探测结果影像图和探测统计值域图

    Figure  3.  Images of Target Detection Results and Maps of Detection Statistics

    图  4  AVIRIS高光谱数据

    Figure  4.  AVIRIS Hyperspectral Dataset

    图  5  AVIRIS数据光谱信息

    Figure  5.  Spectral Signatures in the AVIRIS Dataset

    图  6  AVIRIS数据的ROC曲线

    Figure  6.  ROC Curves of AVIRIS Dataset

    图  7  目标探测结果

    Figure  7.  Results of Target Detection

    表  1  LCVF数据的植入目标详细情况

    Table  1.   Details of the Implanted Target Panels

    图 1(b)颜色 列号 行号 比例/%
    50 (75, 76) (100, 101) (125, 126) 10
    75 (75, 76) (100, 101) (125, 126) 20
    100 (75, 76) (100, 101) (125, 126) 30
    125 (75, 76) (100, 101) (125, 126) 40
    150 (75, 76) (100, 101) (125, 126) 50
    下载: 导出CSV
  • [1] Manolakis D, Shaw G. Detection Algorithms for Hyperspectral Imaging Applications[J]. IEEE Signal Processing Magazine, 2002, 19(1):29-43 doi:  10.1109/79.974724
    [2] Du B, Zhang L P. Target Detection Based on a Dynamic Subspace[J]. Pattern Recognition, 2014, 47(1):344-358 doi:  10.1016/j.patcog.2013.07.005
    [3] Harsanyi J C. Detection and Classification of Subpixel Spectral Signatures in Hyperspectral Image Sequences[D]. Baltimore: University of Maryland Baltimore County, 1993
    [4] Kraut S, Scharf L L, McWhorter L T. AdaptiveSubspace Detectors[J]. IEEE Transactions on Signal Processing, 2001, 49(1):1-16 doi:  10.1109/78.890324
    [5] Kraut S, Scharf L L. The CFAR Adaptive Subspace Detector is a Scale-Invariant GLRT[J]. IEEE Transactions on Signal Processing, 1999, 47(9):2538-2541 doi:  10.1109/78.782198
    [6] 陈勇, 杜博, 张乐飞.一种融合光谱匹配和张量分析的高分辨率遥感影像目标探测器[J].武汉大学学报·信息科学版, 2013, 38(3):274-277 http://ch.whu.edu.cn/CN/Y2013/V38/I3/274

    Chen Yong, Du Bo, Zhang Lefei. A Hybrid Detector for High Resolution Remote Sensing Image Based on Spectral Matching and Tensor Analysis[J]. Geomatics and Information Science of Wuhan University, 2013, 38(3):274-277 http://ch.whu.edu.cn/CN/Y2013/V38/I3/274
    [7] Xiang S M, Nie F P, Zhang C S. Learning a Maha-lanobis Distance Metric for Data Clustering and Classification[J]. Pattern Recognition, 2008, 41(12):3600-3612 doi:  10.1016/j.patcog.2008.05.018
    [8] Plaza A, Martínez P, Plaza J, et al. DimensionalityReduction and Classification of Hyperspectral Image Data Using Sequences of Extended Morphological Transformations[J]. IEEE Transactions on Geoscience and Remote Sensing, 2005, 43(3):466-479 doi:  10.1109/TGRS.2004.841417
    [9] Capobianco L, Garzelli A, Camps-Valls G. Target Detection with Semisupervised Kernel Orthogonal Subspace Projection[J]. IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(11):3822-3833 doi:  10.1109/TGRS.2009.2020910
    [10] Chen Y, Nasrabadi N M, Tran T D. Sparse Representation for Target Detection in Hyperspectral Imagery[J]. IEEE Journal of Selected Topics in Signal Processing, 2011, 5(3):629-640 doi:  10.1109/JSTSP.2011.2113170
    [11] Dong Y N, Zhang L P, Zhang L F, et al. Maximum Margin Metric Learning Based Target Detection for Hyperspectral Images[J]. ISPRS Journal of Photogrammetry Remote Sensing, 2015, 108:138-150 doi:  10.1016/j.isprsjprs.2015.07.003
    [12] Du B, Zhang L P. A Discriminative Metric Learning Based Anomaly Detection Method[J]. IEEE Tran-sactions on Geoscience and Remote Sensing, 2014, 52(11):6844-6857 doi:  10.1109/TGRS.2014.2303895
    [13] Xing E P, Ng A Y, Jordan M I, et al. Distance Metric Learning, with Application to Clustering with Side-information[C]. Advances in Neural Information Processing Systems, Vancouver, Canada, 2002
    [14] Tao D, Li X, Wu X, et al. General Tensor Discri-minant Analysis and Gabor Features for Gait Recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(10):1700-1715 doi:  10.1109/TPAMI.2007.1096
    [15] Davis J, Kulis V B, Jain P, et al. Information-Theoretic Metric Learning[C]. The 24th International Conference on Machine Learning, Corvallis, USA, 2007
    [16] Davis J V, Dhillon I S. Differential Entropic Clustering of Multivariate Gaussians[C]. The 19th Annual Conference on Neural Information Processing Systems, Vancouver, Canada, 2006
    [17] Li Z, Chang S Y, Liang F, et al. Learning Locally-Adaptive Decision Functions for Person Verification[C]. 2013 IEEE Conference on Computer Vision and Pattern Reognition, Portland, USA, 2013
    [18] Tao D, Tang X, Li X, et al. Asymmetric Bagging and Random Subspace for Support Vector Machines-Based Relevance Feedback in Image Retrieval[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(7):1088-1099 doi:  10.1109/TPAMI.2006.134
    [19] Tao D, Li X, Wu X, et al. Geometric Mean for Subspace Selection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(2):260-274 doi:  10.1109/TPAMI.2008.70
    [20] Goldberger J, Hinton G, Roweis S, et al. Neighbourhood Components Analysis[C]. Advances in Neural Information Processing Systems, Cambridge, United Kingdom, 2005
    [21] Dong Y N, Du B, Zhang L P. Target Detection Based on Random Forest Metric Learning[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(4):1830-1838 doi:  10.1109/JSTARS.2015.2416255
    [22] Dong Y N, Du B, Zhang L F, et al. Dimensionality Reduction and Classification of Hyperspectral Images Using Ensemble Discriminative Local Metric Learning[J]. IEEE Transactions on Geoscience and Remote Sensing, 2017, 55(5):2509-2524 doi:  10.1109/TGRS.2016.2645703
  • [1] 杨刚, 孙伟伟, 张殿发.  利用可分离非负矩阵分解实现高光谱波段选择 . 武汉大学学报 ● 信息科学版, 2019, 44(5): 737-744. doi: 10.13203/j.whugis20170174
    [2] 赵波, 苏红军, 蔡悦.  一种切空间协同表示的高光谱遥感影像分类方法 . 武汉大学学报 ● 信息科学版, 2018, 43(4): 555-562, 604. doi: 10.13203/j.whugis20150579
    [3] 鲍蕊, 薛朝辉, 张像源, 苏红军, 杜培军.  综合聚类和上下文特征的高光谱影像分类 . 武汉大学学报 ● 信息科学版, 2017, 42(7): 890-896. doi: 10.13203/j.whugis20150043
    [4] 孙伟伟, 蒋曼, 李巍岳.  利用稀疏自表达实现高光谱影像波段选择 . 武汉大学学报 ● 信息科学版, 2017, 42(4): 441-448. doi: 10.13203/j.whugis20150052
    [5] 白璘, 刘盼芝, 惠萌.  利用小波核最小噪声分离进行高光谱影像SVM分类 . 武汉大学学报 ● 信息科学版, 2016, 41(5): 624-628,644. doi: 10.13203/j.whugis20140209
    [6] 王凯, 舒宁, 孔祥兵, 李亮.  一种多特征转换的高光谱影像自适应分类方法 . 武汉大学学报 ● 信息科学版, 2015, 40(5): 612-616. doi: 10.13203/j.whugis20130384
    [7] 张良培.  高光谱目标探测的进展与前沿问题 . 武汉大学学报 ● 信息科学版, 2014, 39(12): 1377-1394+1400.
    [8] 孙伟伟, 刘春, 施蓓琦, 李巍岳.  等距映射降维用于高光谱影像低维流形特征提取 . 武汉大学学报 ● 信息科学版, 2013, 38(6): 642-647.
    [9] 陈 勇, 杜 博, 张乐飞, 张良培.  一种融合光谱匹配和张量分析的高分辨率遥感影像目标探测器 . 武汉大学学报 ● 信息科学版, 2013, 38(3): 274-277.
    [10] 王凯, 舒宁, 李亮, 龚龑.  利用ICA正交子空间投影加权的高光谱影像目标探测算法 . 武汉大学学报 ● 信息科学版, 2013, 38(4): 440-444.
    [11] 王挺, 杜博, 张良培.  顾及局域信息的核化正交子空间投影目标探测方法 . 武汉大学学报 ● 信息科学版, 2013, 38(2): 200-203,239.
    [12] 高建, 张飞艳, 谢伟, 秦前清.  利用能量变分方法进行高光谱数据去噪处理 . 武汉大学学报 ● 信息科学版, 2012, 37(3): 322-325.
    [13] 苏红军, 盛业华.  高光谱影像的改进K-均值监督式聚类分析方法 . 武汉大学学报 ● 信息科学版, 2012, 37(6): 640-643.
    [14] 黄远程, 李平湘, 张良培.  基于交互最小二乘优化的高光谱影像端元光谱分析 . 武汉大学学报 ● 信息科学版, 2010, 35(10): 1217-1221.
    [15] 舒宁, 苏俊英.  高光谱影像纹理特征编码分形特征研究 . 武汉大学学报 ● 信息科学版, 2009, 34(4): 379-382.
    [16] 杜辉强, 舒宁.  高光谱影像能量边缘提取 . 武汉大学学报 ● 信息科学版, 2006, 31(2): 132-135.
    [17] 陈蜜, 易尧华, 李德仁, 秦前清.  基于动力演化算法的投影寻踪在高光谱影像异常目标检测中的应用 . 武汉大学学报 ● 信息科学版, 2006, 31(1): 55-58.
    [18] 舒宁.  关于多光谱和高光谱影像的纹理问题 . 武汉大学学报 ● 信息科学版, 2004, 29(4): 292-295.
    [19] 张世强, 卢健, 刘时银.  利用TM高光谱图像提取青藏高原喀喇昆仑山区现代冰川边界 . 武汉大学学报 ● 信息科学版, 2001, 26(5): 435-440.
    [20] 李建松.  工业物体表面三维视觉量测的关键技术研究 . 武汉大学学报 ● 信息科学版, 2001, 26(4): 337-342.
  • 加载中
图(7) / 表(1)
计量
  • 文章访问数:  1191
  • HTML全文浏览量:  34
  • PDF下载量:  278
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-09-19
  • 刊出日期:  2018-08-05

基于局域自适应信息理论测度学习的高光谱目标探测方法

doi: 10.13203/j.whugis20150504
    基金项目:

    国家重点基础研究发展规划项目 2012CB719905

    国家自然科学基金 61471274

    国家自然科学基金 41431175

    湖北省自然科学基金 2014CFB193

    中央高校基本科研业务费专项资金 CUG 170687

    作者简介:

    董燕妮, 博士, 副教授, 主要从事高光谱遥感影像处理、测度学习方面的研究。dongyanni@cug.edu.cn

    通讯作者: 杜博, 博士, 教授。gunspace@163.com
  • 中图分类号: P237

摘要: 传统基于信号检测的目标探测方法需要依赖特定的统计假设,只有在符合条件的情况下才能取得较好的目标探测结果。为了克服这一缺陷,提出了一种基于局域自适应的信息理论测度学习方法。首先将信息理论测度学习方法作为目标主函数,然后加以局域自适应决策法则进行约束,自适应地减小相似样本对距离,增大不相似样本对距离,使得在考虑阈值的同时兼顾测度学习前后距离的改变情况来进行目标探测决策,从而更好地实现目标探测。实验证明,该方法与其他经典目标探测方法或测度学习方法相比,可以更好地实现目标与背景分离,能够更有效地对高光谱影像数据进行目标探测。

English Abstract

董燕妮, 杜博, 张乐飞, 张良培. 基于局域自适应信息理论测度学习的高光谱目标探测方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
引用本文: 董燕妮, 杜博, 张乐飞, 张良培. 基于局域自适应信息理论测度学习的高光谱目标探测方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
DONG Yanni, DU Bo, ZHANG Lefei, ZHANG Liangpei. Hyperspectral Target Detection Based on Locally Adaptive Information-Theoretic Metric Learning Method[J]. Geomatics and Information Science of Wuhan University, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
Citation: DONG Yanni, DU Bo, ZHANG Lefei, ZHANG Liangpei. Hyperspectral Target Detection Based on Locally Adaptive Information-Theoretic Metric Learning Method[J]. Geomatics and Information Science of Wuhan University, 2018, 43(8): 1271-1277. doi: 10.13203/j.whugis20150504
  • 高光谱遥感影像承载了丰富的可用于区分不同地物的诊断性光谱信息,已经广泛应用于军事、农业和自然灾害评估等领域[1-2]。目标探测是高光谱遥感影像处理的难点之一。目标探测主要是利用一定的先验信息将目标地物从背景地物中区分开来。目前,学者们已经提出了许多高光谱目标探测方法,如基于正交子空间投影(orthogonal subspace projection,OSP)的探测方法[3]和基于统计理论的自适应余弦估计(adaptive cosine estimator,ACE)探测器[4-6]。但此类算法大多基于一定的统计假设,只能在符合条件的情况下取得较好的目标探测效果。

    近年来,高光谱遥感影像处理领域出现了许多机器学习方法, 在分类、降维等领域取得很好的效果[7-8],目标探测领域中也出现了如基于核方法[9]、基于稀疏学习[10]等的目标探测方法,但是基于测度学习的高光谱目标探测研究较少。测度学习通过找到高光谱特征空间的距离测度,可以实现目标和背景样本最大程度的分离[11], 但是将测度学习应用于目标探测中并不一定能取得好的效果。这是因为观测到的目标往往是混合像元,其光谱可能会与背景很相似,当目标像元过少,背景像元几乎占据整个影像时,可能出现过学习现象。因此,本文提出一种适应性更广、不需要假设信息的基于局域自适应的信息理论测度学习(locally adaptive information-theoretic metric lear-ning,LA-ITML)的高光谱目标探测方法。

    • 假设给定样本训练集{x1, x2xnRL×n,其中n是训练样本数目,L是样本的特征维数。用zij∈(+1, -1)表示训练样本xixj间的相关关系,根据同类或不同类样本类别,相似的样本对集合S与不相似样本对集合D满足:

      $$ \left\{ \begin{array}{l} S:\forall \left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in S,{\mathit{\boldsymbol{x}}_i}\;和\;{\mathit{\boldsymbol{x}}_j}\;相似,{z_{ij}} = 1\\ D:\forall \left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in D,{\mathit{\boldsymbol{x}}_i}\;和\;{\mathit{\boldsymbol{x}}_j}\;不相似,{z_{ij}} = - 1 \end{array} \right. $$ (1)

      测度学习是指找到描述任意两个样本之间的马氏距离测度DM(xi, xj)[12-14]:

      $$ {D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) = \sqrt {{{\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right)}^{\rm{T}}}\mathit{\boldsymbol{M}}\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right)} $$ (2)

      为了保证DM(xi, xj)是有意义的距离测度,MRL×L必须是对称、半正定(positive semi-definite,PSD)方差矩阵。测度学习的主要目的是找到矩阵M和相关阈值b,使得S小于该阈值,D大于该阈值:

      $$ \left\{ \begin{array}{l} {D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \le b,\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in S\\ {D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \ge b,\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in D \end{array} \right. $$ (3)

      为了不同的应用目的,学者们提出了不同的测度学习方法。Davis等[15]提出的基于信息理论的测度学习方法(information-theoretic metric learning, ITML)是通过最小化两个多元高斯分布间的微分相对熵,将马氏测度学习转化为求解布雷格曼优化问题。其假设对于给定的马氏距离测度矩阵M, 每类样本的分布为均值为μ的多维高斯分布:

      $$ p\left( {\mathit{\boldsymbol{x}};\mathit{\boldsymbol{M}}} \right) = \frac{1}{Z}\exp \left( { - \frac{1}{2}{D_\mathit{\boldsymbol{M}}}\left( {\mathit{\boldsymbol{x}},\mu } \right)} \right) $$ (4)

      式中,Z是归一化常数;M-1是分布的协方差矩阵。则分别以M0M为参数的马氏距离可以用其相应的多维高斯分布的给定测度矩阵之间的相对熵KL离散度来衡量:

      $$ \begin{array}{*{20}{c}} {{\rm{KL}}\left( {p\left( {\mathit{\boldsymbol{x}};{\mathit{\boldsymbol{M}}_0}} \right)\left\| {p\left( {\mathit{\boldsymbol{x}};\mathit{\boldsymbol{M}}} \right)} \right.} \right) = }\\ {\int {p\left( {\mathit{\boldsymbol{x}};{\mathit{\boldsymbol{M}}_0}} \right){{\log }_2}\frac{{p\left( {\mathit{\boldsymbol{x}};{\mathit{\boldsymbol{M}}_0}} \right)}}{{p\left( {\mathit{\boldsymbol{x}};\mathit{\boldsymbol{M}}} \right)}}{\rm{d}}x} } \end{array} $$ (5)

      M0为给定的距离测度矩阵,如单位矩阵时,距离测度学习问题可以归纳为下列最优化问题:

      $$ \mathop {\min }\limits_\mathit{\boldsymbol{M}} KL\left( {p\left( {\mathit{\boldsymbol{x}};{\mathit{\boldsymbol{M}}_0}} \right)\left\| {p\left( {\mathit{\boldsymbol{x}};\mathit{\boldsymbol{M}}} \right)} \right.} \right) $$

      使得:

      $$ \left\{ \begin{array}{l} {D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \le {b_1},\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in S\\ {D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \ge {b_2},\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in D \end{array} \right. $$ (6)

      式中,b1b2分别为相应的阈值界限。而两个多元高斯分布间的KL离散度等价于其协方差矩阵间的LogDet距离DLogDet[16],即:

      $$ {\rm{KL}}\left( {p\left( {\mathit{\boldsymbol{x}};{\mathit{\boldsymbol{M}}_0}} \right)\left\| {p\left( {\mathit{\boldsymbol{x}};\mathit{\boldsymbol{M}}} \right)} \right.} \right) = \frac{1}{2}{D_{{\rm{LogDet}}}}\left( {\mathit{\boldsymbol{M}},{\mathit{\boldsymbol{M}}_0}} \right) $$ (7)

      根据式(7),并考虑到式(6)并不一定都有可行解,将式(6)添加松弛变量ξ表示训练错误数的上限,确保测度矩阵M存在,可以表示为:

      $$ \begin{array}{*{20}{c}} {\mathop {\min }\limits_{\mathit{\boldsymbol{M}} \ge 0,\mathit{\boldsymbol{\xi }}} {D_{{\rm{LogDet}}}}\left( {\mathit{\boldsymbol{M}},{\mathit{\boldsymbol{M}}_0}} \right) + }\\ {\gamma {D_{{\rm{LogDet}}}}\left( {{\rm{diag}}\left( \mathit{\boldsymbol{\xi }} \right),{\rm{diag}}\left( {{\mathit{\boldsymbol{\xi }}_0}} \right)} \right)} \end{array} $$

      使得:

      $$ \left\{ \begin{array}{l} {\rm{tr}}\left( {\mathit{\boldsymbol{M}}\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right){{\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right)}^{\rm{T}}}} \right) \le {\mathit{\boldsymbol{\xi }}_c}\left( {i,j} \right) \cdot \\ \;\;\;\;\;\;\;\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right) \in S\\ {\rm{tr}}\left( {\mathit{\boldsymbol{M}}\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right){{\left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right)}^{\rm{T}}}} \right) \ge \\ \;\;\;\;\;\;\;\;{\mathit{\boldsymbol{\xi }}_c}\left( {i,j} \right) \cdot \left( {{\mathit{\boldsymbol{x}}_i} - {\mathit{\boldsymbol{x}}_j}} \right) \in D \end{array} \right. $$ (8)

      式中,ξ0表示初始化松弛变量;ξc(i, j)表示相应的松弛变量;γ是权衡参数,用来控制满足约束条件的权衡并最小化DLogDet

    • ITML方法采用固定阈值进行学习,对于复杂分布的数据比较难处理。本文采用局域决策法则来自适应地调整阈值边界[17],主要方法是设计局域决策函数f(Dij),其中Dij是样本对点(xi, xj)的距离,且当(xi, xj)∈S距离越大时,f(Dij)收缩越快;当(xi, xj)∈D距离越小时,f(Dij)膨胀越快, 从而保证更好的局域决策, 得到更合适的测度矩阵,并通过局域决策测度学习前后变化情况,将目标和背景更大程度地区分开来[18-19]。结合式(3),可以得到调整阈值边界的局域决策法则为:

      $$ \left\{ \begin{array}{l} {f_s}\left( {{D_{ij}}} \right) = {D_{ij}} - \left( {D_{ij}^{\left( {1/{N_S}} \right)}/{D_c}} \right),\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in S\\ {f_d}\left( {{D_{ij}}} \right) = {D_{ij}} + \left( {{D_c}/D_{ij}^{\left( {1/{N_d}} \right)}} \right),\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in D \end{array} \right. $$ (9)

      式中,Ns≥1,Nd≥1是控制局域决策的系数;Dc≥1是常数。定义Ns=1, 确保fs(Dij)尽可能快地收缩,Nd=1/log2(Dc/(Dc-2)), 保证fd(Dij)膨胀快速,而Dc=DmaxDmax是所有样本对间的最大距离。

      用上述局域决策法将ITML方法的固定边界阈值转换为具有自适应阈值的ITML方法,通过考虑测度学习方法前后的距离变化,有效地区分相似样本对和不相似样本对,得到LA-ITML算法。即:

      $$ \begin{array}{*{20}{c}} {\mathop {\min }\limits_{\mathit{\boldsymbol{M}} \ge 0,\mathit{\boldsymbol{\xi }}} {D_{{\rm{LogDet}}}}\left( {\mathit{\boldsymbol{M}},{\mathit{\boldsymbol{M}}_0}} \right) + }\\ {\gamma {D_{{\rm{LogDet}}}}\left( {{\rm{diag}}\left( \mathit{\boldsymbol{\xi }} \right),{\rm{diag}}\left( {{\mathit{\boldsymbol{\xi }}_0}} \right)} \right)} \end{array} $$

      使得:

      $$ \left\{ \begin{array}{l} {D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \le {f_s}\left( {{D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right)} \right) + \\ \;\;\;\;\;\;{\mathit{\boldsymbol{\xi }}_c}\left( {i,j} \right) \cdot \left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in S\\ {D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \ge {f_d}\left( {{D_\mathit{\boldsymbol{M}}}\left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right)} \right) + \\ \;\;\;\;\;\;\;{\mathit{\boldsymbol{\xi }}_c}\left( {i,j} \right) \cdot \left( {{\mathit{\boldsymbol{x}}_i},{\mathit{\boldsymbol{x}}_j}} \right) \in D\\ \;\;\;\;\;\;\;{\mathit{\boldsymbol{\xi }}_c} \ge 0,\forall \left( {i,j} \right),\mathit{\boldsymbol{M}} \ge {\bf{0}} \end{array} \right. $$ (10)

      得到测度矩阵M之后,采用光谱分解将M映射到PSD锥中,对其进行特征分解。最优解问题是特征值分解问题中最小的m个特征值对应的相关特征向量的组合,将负特征值λ设置为0,然后用与之相关的特征向量v进行特征分解。即:

      $$ \mathit{\boldsymbol{M}} = \sum\limits_{i = 1}^m {{\lambda _i}\mathit{\boldsymbol{v}}_i^{\rm{T}}{\mathit{\boldsymbol{v}}_i}} $$ (11)

      利用学习得到的测度矩阵M和ACE探测器,对于每一个输入向量xi,利用x ′= MΤx在最终的测度空间中计算特征表达,即将数据从原始特征空间转换到新的测度特征空间中。对于新的测度空间,应用ACE探测器得到探测结果。

    • 本文模拟数据实验使用机载可见光/红外成像光谱仪(airborne visible/infrared imaging spectrometer,AVIRIS)采集自美国内华达州的月形火山坑区域(lunar crater volcanic field,LCVF)的224个波段高光谱遥感影像。如图 1(a)所示,该影像合成了145、76、30 3个波段,光谱覆盖范围是0.4~2.5 μm,光谱分辨率为9.72 nm,空间分辨率为20 m,影像大小为200×200像元。影像的主要背景地物包括红色氧化玄武岩、流纹岩、干盐湖和植被等。

      图  1  月形火山坑区域高光谱数据

      Figure 1.  Hyperspectral Dataset of Lunar Crater Volcanic Field

      从美国地质勘探局矿物光谱库中选取矿物明矾石的光谱作为感兴趣目标光谱,一共植入15处目标(目标位置如图 1(b)所示),每处植入2个像元的目标,植入目标详细情况见表 1。如图 1(c)所示,植入的目标光谱为红色曲线,其他颜色的光谱曲线ABH分别表示本次实验用到的代表性背景地物光谱,相对应的背景像元位置如图 1(d)所示。

      表 1  LCVF数据的植入目标详细情况

      Table 1.  Details of the Implanted Target Panels

      图 1(b)颜色 列号 行号 比例/%
      50 (75, 76) (100, 101) (125, 126) 10
      75 (75, 76) (100, 101) (125, 126) 20
      100 (75, 76) (100, 101) (125, 126) 30
      125 (75, 76) (100, 101) (125, 126) 40
      150 (75, 76) (100, 101) (125, 126) 50

      利用线性混合模型,混合光谱x由纯净目标光谱(只包括目标地物的像元所形成的光谱)t和植入目标处原始像元光谱b组成:

      $$ x = pt + \left( {1 - p} \right)b $$ (12)

      式中,p是植入目标光谱数据的比例。

      本文采用经典的目标探测方法ACE、OSP,3种有代表性的测度学习方法(大间隔最近邻(large margin nearest neighbor,LMNN)分类器、近邻成分分析(neighborhood component analysis,NCA)[20]和ITML方法)作为对比方法,验证所提出算法的性能。ACE只需要输入明矾石目标光谱,OSP和其他测度学习方法中不仅有正样本的输入,还从影像中选定了8个背景像元作为负样本输入(图 1(d))。对于LMNN、NCA和ITML来说,实验中给出的成对约束的数目为300,且LMNN和NCA最近邻窗口大小均设置为3。

      用受试者操作特征(receiver operation cha-racteristic,ROC)曲线,目标探测结果如图 2(a)所示。ROC曲线利用探测率(给定阈值下算法探测出来的真实目标像元数与影像中的真实目标像元数的比值)和虚警率(错误探测为目标的背景像元数目与影像中所有像元数目的比值)作为纵轴和横轴,提供一个不需要阈值的探测结果图,反映多个探测器对于同一组影像数据探测能力的差异,广泛应用于评价高光谱目标探测领域中。通常ROC曲线对应的最左上方的探测器性能最优,即同虚警率条件下能获得更高的探测效果,或同等探测率条件下能达到更低的虚警率的探测器。

      图  2  目标探测结果

      Figure 2.  Target Detection Performance

      对探测率达到100%时的虚警率加以分析,在模拟数据实验中,LA-ITML方法都优于其他的方法。ITML和LA-ITML方法在图 2(a)所示的ROC曲线中区分不够明显,主要原因是该影像为模拟影像,相对实际影像来说比较简单,易于探测,使得两者都能在很小的虚警率下取得较好的探测效果(100%)。但是通过图 2(b)可以看出,当探测率达到100%时,ITML的虚警率为2.5×10-5,大于LA-ITML的虚警率。进一步给出各算法的探测结果灰度图和探测统计值域图,如图 3所示。从图 3中可以看出,虽然ITML也探测出了绝大多数目标,但是出现了不少的虚警影像,主要表现为非目标的背景像元高亮显示。其他对比算法探测得到的目标数目更少,虚警更多。但是LA-ITML算法背景得到很好的抑制,且目标和背景的分离度非常高。

      图  3  目标探测结果影像图和探测统计值域图

      Figure 3.  Images of Target Detection Results and Maps of Detection Statistics

    • 本文真实数据是AVIRIS传感器采集到的美国洛杉矶圣地亚哥飞机场高光谱影像(图 4(a)),影像大小为100×100像元,空间分辨率为3.5 m, 光谱分辨率为10 nm,共有224个波段,本文合成了28、19、103个波段,光谱覆盖范围是0.4~2.5 μm,空间分辨率为20 m。影像的主要地物有停机坪、跑道、房屋、裸地、草地及飞机[21-22]。其中,3架飞机是感兴趣的目标,共计58个目标像元,如图 4(b)所示。它们的光谱特征曲线及平均光谱特征曲线分别如图 5(a)中灰色和红色曲线所示。在本次目标探测实验中,以图 5(a)中红色平均光谱曲线作为目标的先验光谱特征。图 5(b)显示了本次实验随机选取的10个背景地物像元的光谱特征,这些光谱作为所需的负样本输入,相对应的位置如图 5(c)所示。图 6为所有算法的探测结果ROC曲线。从图 6中可以看出,LA-ITML算法在虚警率为1×10-3时,探测率可以达到80%,明显优于其他算法。由于不同探测器的ROC曲线交汇到一起,需要ROC曲线下面积图(area under the curves,AUCs)辅助比较探测器的优劣,AUCs可以用ROC曲线到虚警率轴的积分值进行计算。从图 7可以看出LA-ITML算法对比其他算法的优势。

      图  4  AVIRIS高光谱数据

      Figure 4.  AVIRIS Hyperspectral Dataset

      图  5  AVIRIS数据光谱信息

      Figure 5.  Spectral Signatures in the AVIRIS Dataset

      图  6  AVIRIS数据的ROC曲线

      Figure 6.  ROC Curves of AVIRIS Dataset

      图  7  目标探测结果

      Figure 7.  Results of Target Detection

    • 本文针对高光谱分辨率遥感影像目标探测问题,提出了一种基于局域自适应信息理论测度学习目标探测器,在线性混合模拟数据实验和真实高光谱影像场景中,均能有效地探测出目标。实验证明,在抑制背景信息、分离目标和背景等方面,本文所提出的方法比传统的目标探测方法及测度学习方法效果更好。由于本文方法为基于局域信息的探测方法,运算速率较其他部分算法慢,未来会考虑通过优化局域决策约束来进一步提高运算速率,或通过与更合适的测度学习方法相结合来进一步提高速率。此外,本文采用的负样本信息不够少,因此,如何提高本方法的运算效率和用更少的样本得到更好的效果是下一步研究的重点。

参考文献 (22)

目录

    /

    返回文章
    返回