留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

面向卫星云图云分类的自适应模糊支持向量机

田文哲 符冉迪 金炜 刘箴 尹曹谦

田文哲, 符冉迪, 金炜, 刘箴, 尹曹谦. 面向卫星云图云分类的自适应模糊支持向量机[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734
引用本文: 田文哲, 符冉迪, 金炜, 刘箴, 尹曹谦. 面向卫星云图云分类的自适应模糊支持向量机[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734
TIAN Wenzhe, FU Randi, JIN Wei, LIU Zhen, YIN Caoqian. Adaptive Fuzzy Support Vector Machine for Classification of Clouds in Satellite Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734
Citation: TIAN Wenzhe, FU Randi, JIN Wei, LIU Zhen, YIN Caoqian. Adaptive Fuzzy Support Vector Machine for Classification of Clouds in Satellite Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734

面向卫星云图云分类的自适应模糊支持向量机

doi: 10.13203/j.whugis20140734
基金项目: 

国家自然科学基金 Nos. 61271399, 61471212

宁波市国际合作项目 No. 2013D10011

宁波市自然科学基金 Nos. 2011A610192, 2013A610055

浙江省信息与通信工程重中之重学科项目  Nos. XKXL1425,XKXL1306

详细信息
    作者简介:

    田文哲,硕士生,研究方向为支持向量机和数字图像处理。tianwenzhe00@163.com

    通讯作者: 符冉迪,副教授。 E-mail:furandi@nbu.edu.cn
  • 中图分类号: P231

Adaptive Fuzzy Support Vector Machine for Classification of Clouds in Satellite Imagery

Funds: 

The National Natural Science Foundation of China Nos. 61271399, 61471212

the Ningbo International Project No. 2013D10011

the Ningbo Natural Science Foundation Nos. 2011A610192, 2013A610055

the Zhejiang Information and Communication Engineering foremost Academic Discipline Project  Nos. XKXL1425,XKXL1306

More Information
    Author Bio:

    TIAN Wenzhe, postgraduate, specializes in SVM and digital image processing. E-mail:tianwenzhe00@163.com

    Corresponding author: FU Randi, associate professor. E-mail:furandi@nbu.edu.cn
  • 摘要: 云类识别是实现卫星云图自动分析的基础,针对卫星云图易受噪声干扰且不同云系往往相互交叠的特点,构造一种面向云类识别的自适应模糊支持向量机。该方法不仅改进了隶属度函数的表现形式,而且通过定义控制临界隶属度和隶属度衰减趋势的参数,使隶属度能根据不同云系样本的具体分布特性自适应调整,解决了传统模糊支持向量机的隶属度函数难以反映样本分布的问题。在MTSAT卫星云图上的实验结果表明,通过提取云图可见光通道的反照率、红外通道的亮温及三种亮温差作为云图的光谱特征,并结合统计纹理特征,所构造的自适应模糊支持向量机分类器能有效区分晴空区、低云、中云、高云及直展云;云类识别准确率优于标准支持向量机和传统模糊支持向量机,且具有更强的稳定性和自适应性。
  • 图  1  两类样本的紧密度情况

    Figure  1.  Affinity Among Samples of Two Classes

    图  2  不同超球半径R对应式(5)的隶属度函数曲线

    Figure  2.  Membership Function Curve of Formula (5) Corresponding to Different R

    图  3  最小超球位置对比

    Figure  3.  Contrast of Smallest Hyper-sphere Position

    图  4  不同超球半径R对应式(7)的隶属度函数曲线

    Figure  4.  Membership Function Curve of Formula (7) Corresponding to Different R

    图  5  两类超球内样本的分布情况

    Figure  5.  Samples Distribution in Hyperspheres of Two Classes

    图  6  两类超球外样本的分布情况

    Figure  6.  Samples Distribution out of Hyperspheres of Two Classes

    图  7  μid(xi)的变化情况

    Figure  7.  Change of μi with d(xi)

    图  8  具有不同最小超球半径的两类样本集的分布情况

    Figure  8.  Samples Distribution of Two Classes with Different R

    图  9  云系分类算法流程图

    Figure  9.  Algorithm Flowchart of Cloud Classification

    图  10  原IR1通道云图及专家云系标定图

    Figure  10.  Original Cloud Image (IR1) and Cloud Types Labeled Image

    图  11  各种SVM方法云类识别结果

    Figure  11.  Cloud Recognition Results Based on Different SVM Methods

    表  1  5类云系样本在不同特征维数时R大小

    Table  1.   Different Feature Dimension Numbers

    特征维数 云类型
    晴空 低云 中云 高云 直展云
    5 0.821 1.285 0.978 1.058 0.770
    8 1.121 1.493 1.263 1.372 1.372
    14 1.334 2.011 1.795 1.911 1.625
    下载: 导出CSV

    表  2  2013年10月6日各种云系识别准确率

    Table  2.   Recognition Accuracy Rates of Different Cloud Types in October 6th, 2013

    云类型 分类结果
    晴空 低云 中云 高云 直展云
    晴空 192 8 0 0 0
    低云 0 186 7 7 0
    中云 0 3 168 21 8
    高云 0 0 30 170 0
    直展云 0 0 6 5 189
    准确率/% 96.0 93.0 84.0 85.0 94.5
    平均准确率/% 90.5
    下载: 导出CSV

    表  3  2013年10月6日各种云分类方法识别准确率/%

    Table  3.   Recognition Accuracy Rates of Different Methods in October 6th, 2013/%

    分类方法 准确率 平均
    准确率
    晴空 低云 中云 高云 直展云
    BP 99.5 59.5 73.5 27.5 30.5 58.1
    SOM 96.0 70.5 66.5 55.0 77.5 72.9
    LVQ 95.5 92.0 84.5 19.5 97.0 77.7
    标准 SVM 97.0 70.0 83.5 52.0 93.0 79.1
    线性 FSVM 96.0 72.0 79.5 84.0 95.5 85.4
    S型 FSVM 95.5 70.5 77.5 81.0 96.0 84.1
    紧密度 FSVM 96.0 76.5 85.0 79.5 95.5 86.5
    本文AFSVM 96.0 93.0 84.0 85.0 94.5 90.5
    下载: 导出CSV

    表  4  2013年10月7日各种云系识别准确率

    Table  4.   Recognition Accuracy Rates of Different Cloud Types in October 7th, 2013

    云类型 分类结果
    晴空 低云 中云 高云 直展云
    晴空 188 12 8 0 0
    低云 2 181 11 6 0
    中云 0 5 161 23 11
    高云 0 1 29 169 1
    直展云 0 1 0 16 183
    准确率/% 94.0 90.5 80.5 84.5 91.5
    平均准确率/% 88.2
    下载: 导出CSV

    表  5  2013年10月7日各种云分类方法识别准确率/%

    Table  5.   Recognition Accuracy Rates of Different Methods in October 7th, 2013/%

    分类方法 准确率 平均
    准确率
    晴空 低云 中云 高云 直展云
    BP 94.5 40.0 61.0 22.5 19.0 47.4
    SOM 98.5 62.0 41.5 67.0 90.0 71.8
    LVQ 92.5 78.0 78.5 3.5 94.0 69.3
    标准 SVM 94.0 62.5 78.0 67.0 97.0 79.7
    线性 FSVM 93.5 61.0 77.0 88.0 90.5 82.0
    S型 FSVM 91.5 61.0 72.5 88.5 91.0 80.9
    紧密度 FSVM 93.5 61.5 80.5 85.0 94.0 82.9
    本文AFSVM 94.0 90.5 80.5 84.5 91.5 88.2
    下载: 导出CSV
  • [1] Tapakis R, Charalambides A G. Equipment and Methodologies for Cloud Detection and Classification:A Review[J]. Solar Energy, 2013, 95(5):392-430 https://www.researchgate.net/publication/271618117_Equipment_and_methodologies_for_cloud_detection_and_classification_A_review
    [2] Thomas F, Remy R. An Algorithm for the Detection and Tracking of Tropical Mesoscale Convective Systems Using Infrared Images from Geostationary Satellite[J]. IEEE Transactions on Geoscience and Remote Sensing, 2013, 7 (51):4 302-4 315 https://www.researchgate.net/publication/260623068_An_Algorithm_for_the_Detection_and_Tracking_of_Tropical_Mesoscale_Convective_Systems_Using_Infrared_Images_From_Geostationary_Satellite
    [3] Kazantzidis A, Tzoumanikas P, Bais A F, et al. Cloud Detection and Classification with the Use of Whole-sky Ground-based Images[J]. Atmospheric Research, 2012, 113(1):80-88 http://adsabs.harvard.edu/abs/2012AtmRe.113...80K
    [4] Ameur Z, Ameur S, Adane A, et.al. Cloud Classification Using the Textural Features of Meteosat images[J]. International Journal of Remote Sensing, 2004, 25(21):4 491-4 503 doi:  10.1080/01431160410001735120
    [5] Merchant C J, Harris A R, Maturi E, et al. Probabilistic Physically Based Cloud Screening of Satellite Infrared Imagery for Operational Sea Surface Temperature Retrieval[J]. Quarterly Journal of the Royal Meteorological Society, 2005, 131(611):2 735-2 755 doi:  10.1256/qj.05.15
    [6] Liu Y, Xia J, Shi C X,et al, An Improved Cloud Classification Algorithm for China's FY-2C Multi-Channel Images Using Artificial Neural Network[J]. Sensors, 2009, 9(7):5 558-5 579 doi:  10.3390/s90705558
    [7] 陈刚,鄂栋臣. 基于纹理分析和支持向量机的极地冰雪覆盖区的云层检测[J]. 武汉大学学报·信息科学版,2006, 31(5):403-406 http://ch.whu.edu.cn/CN/abstract/abstract2454.shtml

    Chen Gang, E Dongchen. Cloud Detection Based on Texture Analysis and SVM over Ice-snow Covered Area[J].Geomatics and Information Science of Wuhan University, 2006, 31(5):403-406 http://ch.whu.edu.cn/CN/abstract/abstract2454.shtml
    [8] Luis G C, Gustavo C V, Lorenzo B, et al. Mean Map Kernel Methods for Semisupervised Cloud Classification[J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(1):207-220 doi:  10.1109/TGRS.2009.2026425
    [9] Lin C F, Wang S D. Fuzzy Support Vector Machines[J]. IEEE Transactions on Neural Networks, 2002, 13(2):464-471 doi:  10.1109/72.991432
    [10] 张翔, 肖小玲, 徐光祐. 模糊支持向量机中隶属度的确定与分析[J]. 中国图象图形学报, 2006, 11(8):1 188-1 192 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB200608021.htm

    Zhang Xiang, Xiao Xiaoling, Xu Guangyou. Determination and Analysis of Fuzzy Membership for SVM[J].Journal of Image and Graphics, 2006, 11(8):1 188-1 192 http://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB200608021.htm
    [11] 张翔, 肖小玲, 徐光祐. 基于样本之间紧密度的模糊支持向量机方法[J]. 软件学报, 2006, 17(5):951-958 doi:  10.1360/jos170951

    Zhang Xiang, Xiao Xiaoling, Xu Guangyou. Fuzzy Support Vector Machine Based on Affinity Among Samples[J].Journal of Software, 2006, 17(5):951-958 doi:  10.1360/jos170951
    [12] An W J, Liang M G. Fuzzy Support Vector Machine Based on Within-class Scatter for Classification Problems with Outliers or Noises[J]. Neurocomputing, 2013,110(13):101-110 https://www.researchgate.net/publication/257352426_Fuzzy_support_vector_machine_based_on_within-class_scatter_for_classification_problems_with_outliers_or_noises
    [13] 艾青, 秦玉平, 方辉,等. 一种扩展的紧密度模糊支持向量机及其在文本分类中应用[J]. 计算机应用与软件, 2010, 27(4):45-47 http://www.cnki.com.cn/Article/CJFDTOTAL-JYRJ201004016.htm

    Ai Qing, Qin Yuping, Fang Hui, et al. An Extended Affinity Fuzzy Support Vector Machine and Its Application in Text Classification[J]. Computer Application and Software. 2010, 27(4):45-47 http://www.cnki.com.cn/Article/CJFDTOTAL-JYRJ201004016.htm
    [14] Lior W, Tal H, Yaniv T. Descriptor Based Methods in the Wild[J]. Workshop on Faces in‘Real-Life’ Images:Detection, Alignment, and Recognition, 2008,6(10):12-18 http://www.openu.ac.il/home/hassner/projects/Patchlbp/WolfHassnerTaigman_ECCVW08.pdf
    [15] Salim L, Mounir B. Comparison of ANFIS and SVM for the Classification of Brain MRI Pathologies[C]. 2011 IEEE 54th International Midwest Symposium on Circuits and Systems, Seoul, Korea, 2011
    [16] Tax D, Duin R. SupportVector Data Description[J]. Machine Learning, 2004, 54(1):45-66 doi:  10.1023/B:MACH.0000008084.60811.49
  • [1] 鲍蕊, 薛朝辉, 张像源, 苏红军, 杜培军.  综合聚类和上下文特征的高光谱影像分类 . 武汉大学学报 ● 信息科学版, 2017, 42(7): 890-896. doi: 10.13203/j.whugis20150043
    [2] 李春鑫, 彭认灿, 高占胜, 王海波.  一种改进的三维流场数据可视化方法 . 武汉大学学报 ● 信息科学版, 2017, 42(6): 744-748. doi: 10.13203/j.whugis20141000
    [3] 李粉玲, 常庆瑞, 刘佳岐, 刘京.  基于多纹理和支持向量机的ZY-102C星HR数据分类 . 武汉大学学报 ● 信息科学版, 2016, 41(4): 455-461,486. doi: 10.13203/j.whugis20140356
    [4] 郑肇葆, 潘励, 郑宏.  应用模糊逻辑图像分割方法的分析与研究 . 武汉大学学报 ● 信息科学版, 2014, 39(4): 397-400. doi: 10.13203/j.whugis20120209
    [5] 林娜, 杨武年, 王斌.  高光谱遥感影像核最小噪声分离变换特征提取 . 武汉大学学报 ● 信息科学版, 2013, 38(8): 988-992.
    [6] 林怡, 刘冰, 陈映鹰, 潘琛.  多特征差分核支持向量机遥感影像变化检测方法 . 武汉大学学报 ● 信息科学版, 2013, 38(8): 978-982.
    [7] 谭琨, 杜培军, 王小美.  利用分离性测度多类支持向量机进行高光谱遥感影像分类 . 武汉大学学报 ● 信息科学版, 2011, 36(2): 171-175.
    [8] 杨学斌, 秦其明, 姚云军, 赵少华.  PDI与MPDI在内蒙古干旱监测中的应用和比较 . 武汉大学学报 ● 信息科学版, 2011, 36(2): 195-198.
    [9] 黄贤源, 翟国君, 隋立芬, 黄谟涛.  最小二乘支持向量机在海洋测深异常值探测中的应用 . 武汉大学学报 ● 信息科学版, 2010, 35(10): 1188-1191.
    [10] 朱先强, 邵振峰, 李德仁.  利用无参数统计特征进行旋转不变纹理图像渐进检索 . 武汉大学学报 ● 信息科学版, 2010, 35(11): 1279-1282.
    [11] 舒宁, 苏俊英.  高光谱影像纹理特征编码分形特征研究 . 武汉大学学报 ● 信息科学版, 2009, 34(4): 379-382.
    [12] 邓兴升, 花向红.  动态最小二乘支持向量机学习算法 . 武汉大学学报 ● 信息科学版, 2008, 33(11): 1122-1125.
    [13] 陈刚, 鄂栋臣.  基于纹理分析和支持向量机的极地冰雪覆盖区的云层检测 . 武汉大学学报 ● 信息科学版, 2006, 31(5): 403-406.
    [14] 何挺, 王静, 林宗坚, 程烨.  土壤有机质光谱特征研究 . 武汉大学学报 ● 信息科学版, 2006, 31(11): 975-979.
    [15] 徐芳, 梅文胜, 张志华.  航空影像分割的最小二乘支持向量机方法 . 武汉大学学报 ● 信息科学版, 2005, 30(8): 694-698.
    [16] 刘楠, 舒宁.  多光谱影像纹理特征编码的算法研究 . 武汉大学学报 ● 信息科学版, 2005, 30(1): 15-18.
    [17] 马洪超, 郭丽艳.  人工神经网络信息融合及其在机场识别中的应用研究 . 武汉大学学报 ● 信息科学版, 2005, 30(8): 682-684.
    [18] 刘志刚, 李德仁, 秦前清, 史文中.  基于特征空间中类间可分性的层次型多类支撑向量机 . 武汉大学学报 ● 信息科学版, 2004, 29(4): 324-328.
    [19] 潘励, 郑宏, 张祖勋, 张剑清.  集成高度和彩色纹理特征的影像目标模糊聚类识别方法 . 武汉大学学报 ● 信息科学版, 2004, 29(4): 311-314.
    [20] 徐芳, 燕琴.  基于支持向量机的航空影像纹理分类研究 . 武汉大学学报 ● 信息科学版, 2003, 28(5): 517-520.
  • 加载中
图(11) / 表(5)
计量
  • 文章访问数:  1118
  • HTML全文浏览量:  58
  • PDF下载量:  364
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-03-20
  • 刊出日期:  2017-04-05

面向卫星云图云分类的自适应模糊支持向量机

doi: 10.13203/j.whugis20140734
    基金项目:

    国家自然科学基金 Nos. 61271399, 61471212

    宁波市国际合作项目 No. 2013D10011

    宁波市自然科学基金 Nos. 2011A610192, 2013A610055

    浙江省信息与通信工程重中之重学科项目  Nos. XKXL1425,XKXL1306

    作者简介:

    田文哲,硕士生,研究方向为支持向量机和数字图像处理。tianwenzhe00@163.com

    通讯作者: 符冉迪,副教授。 E-mail:furandi@nbu.edu.cn
  • 中图分类号: P231

摘要: 云类识别是实现卫星云图自动分析的基础,针对卫星云图易受噪声干扰且不同云系往往相互交叠的特点,构造一种面向云类识别的自适应模糊支持向量机。该方法不仅改进了隶属度函数的表现形式,而且通过定义控制临界隶属度和隶属度衰减趋势的参数,使隶属度能根据不同云系样本的具体分布特性自适应调整,解决了传统模糊支持向量机的隶属度函数难以反映样本分布的问题。在MTSAT卫星云图上的实验结果表明,通过提取云图可见光通道的反照率、红外通道的亮温及三种亮温差作为云图的光谱特征,并结合统计纹理特征,所构造的自适应模糊支持向量机分类器能有效区分晴空区、低云、中云、高云及直展云;云类识别准确率优于标准支持向量机和传统模糊支持向量机,且具有更强的稳定性和自适应性。

English Abstract

田文哲, 符冉迪, 金炜, 刘箴, 尹曹谦. 面向卫星云图云分类的自适应模糊支持向量机[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734
引用本文: 田文哲, 符冉迪, 金炜, 刘箴, 尹曹谦. 面向卫星云图云分类的自适应模糊支持向量机[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734
TIAN Wenzhe, FU Randi, JIN Wei, LIU Zhen, YIN Caoqian. Adaptive Fuzzy Support Vector Machine for Classification of Clouds in Satellite Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734
Citation: TIAN Wenzhe, FU Randi, JIN Wei, LIU Zhen, YIN Caoqian. Adaptive Fuzzy Support Vector Machine for Classification of Clouds in Satellite Imagery[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 488-495. doi: 10.13203/j.whugis20140734
  • 利用卫星云图进行云类识别对天气预报具有重要意义。目前,常用的云类识别方法[1]可分为简单法、统计法和人工智能法三类。简单法如阈值法[2]、K近邻法[3]等利用较简单线性函数实现分类。统计法主要有K均值法[4]、贝叶斯法[5]等。人工智能法有神经网络[6]、支持向量机[7, 8]等。Liu等[6]运用多种神经网络方法实现云类识别。陈刚等[7]运用支持向量机方法检测极地冰雪覆盖区的云层。Luis等[8]训练半监督支持向量机,提高云系分类效果。人工智能法效仿人脑训练决策方略,分类准确率普遍高于前两种方法。但神经网络以经验风险最小化为基础,需要大量样本。支持向量机(support vector machine, SVM)建立在VC维理论与结构风险最小化原理上,泛化能力优于前者。卫星数据中存在诸多模糊不确定情况,如数据获取时受大气湍流的不均匀性影响形成噪声污染、云系边缘相互重叠、云系之间相互演变等。所以云类识别面临的是信息不确定和界线不明确的对象。然而标准SVM对野值等不确定数据敏感。模糊支持向量机(fuzzy support vector machine, FSVM)通过引入模糊隶属度,可以较好地处理这种模糊现象。Lin等[9]将隶属度视为样本到类中心距离的线性函数。文献[10]介绍了S型隶属度函数,使隶属度与样本特点更加匹配。但这两种方法仍不能对非有效样本很好地区分。文献[11, 12]应用基于紧密度FSVM,较好地实现了有效样本与非有效样本的区分。但基于紧密度的隶属度函数并非与实际完全相符,且参数固定,灵活性较低。艾青等[13]利用交叉验证方法对文献[11]中的临界隶属度进行寻优,消耗大量时间。

    针对云图易受噪声影响、灰度不均匀等特点,本文将FSVM用于云类识别,改进并确定隶属度函数中衰减参数及临界隶属度的表达式,提出一种基于自适应模糊支持向量机(adaptive fuzzy support vector machine, AFSVM)的云类识别方法。

    • 根据云底高度,国际上通常将云系分为高云、中云、低云三族[1]。但目前的分类标准并不唯一。积雨云云顶可延伸至中云甚至高云的范围,其出现往往伴随雷电、台风等自然灾害。所以,将积雨云作为直展云单独分类对气象服务意义重大。鉴于此,参照国际分类方法及气象业务的需求,本文将云分类体系划分为晴空区、低云、中云、高云及直展云5大类。

      本文主要以MTSAT卫星为研究对象,其扫描辐射仪包括可见光通道(VIS)、红外窗通道(IR1、IR2、IR4)、水汽通道(IR3)共5个通道。不同的通道云图特性不同。可见光云图可用于区分海洋、陆地和云,但卷云等薄云反照率较低。云的观测值在红外分裂窗通道具有很强的相关性,与其他目标物分离较明显。水汽通道可以有效检测高云。通道亮温差可进一步发掘云系间的不同特性。IR1-IR2主要体现卷云与积雨云的特征,IR1-IR3、IR2-IR3可进一步体现不同高度的云特征[6]。综合利用多通道及通道差数据,可以有效提高云类识别率。云系纹理属于自然纹理,具有随机性和多样性。三模块局部二元模式(three-patch local binary patter,TPLBP)[14]考虑圆形邻域模块LBP间的相互关系,增加LBP处理噪声的能力,对提取自然纹理具有很好的效果。本文利用TPLBP提取IR1云图的纹理特征,首先对IR1通道云图的亮温数据进行TPLBP变换,得到二维码图;然后统计所得码图的6维直方图特征(均值、标准偏差、平滑度、三阶矩、一致性、熵)[15] 作为6维纹理特征。本文结合光谱特征与纹理特征,进行云类识别。

    • FSVM通过引入模糊隶属度μi表示样本xi属于该类的不同可能性。对于样本集{xi, yi, μi}i=1l(l为样本数目)和核函数K(xi, xj),类别标签yi∈{-1, +1},隶属度μi∈(0, 1],FSVM优化问题和约束条件如下:

      (1)

      式中,w为权重向量;b为偏置;ξi为松弛变量;C为惩罚因子。将式(1)转化为其对偶问题:

      (2)

      求得拉格朗日乘子αi和偏置b,得到最优分类超平面的决策函数:

      (3)
    • 线性和S型隶属度并未对有效样本与非有效样本进行有效区分。图 1(a)图 1(b)中样本x到各自类中心的距离相等,若仅据此判断,则两类中样本x的隶属度相同。但由样本分布情况可知,图 1(b)中样本x更可能为野值,因此图 1(b)x的隶属度应较小。

      图  1  两类样本的紧密度情况

      Figure 1.  Affinity Among Samples of Two Classes

      对于该问题,文献[11, 12]提出基于紧密度的隶属度确定方法,即通过利用支持向量数据描述 (support vector data description,SVDD)[16],找到包围有效样本的最小超球半径R来度量样本间紧密度:

      (4)

      式中,R为最小超球半径;O为球心;D>0为惩罚因子,用来控制球的体积与球外面样本个数间的折衷;ζi为松弛变量。然后用式(5)计算各样本的隶属度:

      (5)

      式中,d(xi)为样本xi到所在类中心O的欧氏距离:

      (6)

      d(xi)R时,说明xi属于该类的可能性大,赋予较大隶属度;反之,说明xi属于非有效样本的可能性大,赋予较小的隶属度。这样能较好地区分有效样本与非有效样本。为了分析传统紧密度隶属度函数中R与隶属度间的关系,图 2给出对应不同R时,式(5)所确定的隶属度函数曲线。

      图  2  不同超球半径R对应式(5)的隶属度函数曲线

      Figure 2.  Membership Function Curve of Formula (5) Corresponding to Different R

      图 2显示,通过对超球内、外样本运用不同的隶属度公式,可以找到超球内、外样本隶属度的分界点(μi=0.4时)。随着R增加,超球外样本的隶属度(5条曲线的μi <0.4部分)衰减速度不断加快,超球内样本的隶属度(5条曲线的μi >0.4部分)衰减速度不断减缓;但当R<3时,超球外样本的隶属度变化趋势比超球内平缓,这与实际要求不符。要实现有效样本与非有效样本的区分,应尽量保持有效样本的隶属度,减小非有效样本的隶属度,则要求超球外样本比超球内样本具有更快的隶属度衰减速率。在实际中,为了削除光谱特征与纹理特征间量纲的差异,要进行归一化处理。本文中,5类云系样本集的特征归一化后,在不同特征维数(5表示5通道亮温特征;8表示再加上3维亮温差特征;14表示再加上6维纹理特征)时R大小见表 1。可以看出,R随着特征维数的增加而逐渐增大,但仍一直偏小,低于3。所以式(5)隶属度函数虽然在一定程度上实现了有效样本与非有效样本的区分,但隶属度的变化趋势与实际并不完全相符。

      表 1  5类云系样本在不同特征维数时R大小

      Table 1.  Different Feature Dimension Numbers

      特征维数 云类型
      晴空 低云 中云 高云 直展云
      5 0.821 1.285 0.978 1.058 0.770
      8 1.121 1.493 1.263 1.372 1.372
      14 1.334 2.011 1.795 1.911 1.625

      图  3  最小超球位置对比

      Figure 3.  Contrast of Smallest Hyper-sphere Position

      此外,由式(5)和图 2看出,临界隶属度固定为0.4。但事实上,不同云系特征纷繁多样,分布特性不同。同时,SVDD方法所确定的最小超球会向野值方向偏斜。如图 3所示,所得的最小超球并不能完全准确地表示有效样本与非有效样本的分界。所以要根据云系的不同分布特性及超球半径R,自适应调整临界隶属度。

      综上分析,针对传统基于紧密度隶属度函数变化趋势与事实不符的情况,同时考虑临界隶属度固定的不足,需要改进隶属度函数,并且根据不同云系样本的具体分布特性,自适应地调整隶属度衰减情况和临界隶属度。

    • 为了使隶属度的衰减趋势与实际相一致,并且自适应调整隶属度变化,本文引入参数σI(0<σI<1),σo (σo>1),μ# (0<μ#≤1),分别控制超球内、外样本的隶属度衰减速度,以及临界隶属度,得到隶属度函数:

      (7)

      分别取σI =0.5, σo=10,μ#=0.4,式(7)隶属度函数曲线如图 4所示。可以看出, 该隶属度函数不仅继承了基于紧密度隶属度的优点, 通过确定最小超球获得有效样本与非有效样本的分界;而且具有S型隶属度函数的长处, 有效样本衰减速度慢,非有效样本衰减速度快,使隶属度变化情况与实际更好地吻合。

      图  4  不同超球半径R对应式(7)的隶属度函数曲线

      Figure 4.  Membership Function Curve of Formula (7) Corresponding to Different R

    • 1) 确定超球内、外样本隶属度变化率σI、σo

      图 5中,超球内样本x到各自类中心的距离相等,如果用相同的σI来规定隶属度的变化趋势,则两者的隶属度相同。但这种规定没有考虑图 5(b)中样本的整体分布比图 5(a)更靠近球面的事实。事实上,图 5(b)中样本x的隶属度应大于图 5(a)x的隶属度。所以在确定隶属度时,其变化参数不能为一定值,与超球内样本的整体分布情况有关。整体分布越靠近球面,则隶属度衰减越慢;反之,越快。

      图  5  两类超球内样本的分布情况

      Figure 5.  Samples Distribution in Hyperspheres of Two Classes

      同样,在图 6中,样本x到各自类中心的距离相等,若用相同的σo来规定隶属度的变化趋势,而忽略球外样本的整体分布情况,则样本x的隶属度相同。然而图 6(a)中样本的整体分布比图 6(b)更靠近球面,图 6(a)中样本x的隶属度应大于图 6(b)x的隶属度。所以,球外样本的整体分布越靠近球面,则属于该类的可能性越大,隶属度衰减越慢;反之,则越快。

      图  6  两类超球外样本的分布情况

      Figure 6.  Samples Distribution out of Hyperspheres of Two Classes

      根据以上分析,定义超球内、外样本距中心的平均距离分别为dI (dIR)和do (do >R),以此表示超球内、外样本的整体分布情况。dI越大,表示球内样本的整体分布越接近球面;do越小,表示球样本的整体分布越接近球面。

      (8)
      (9)

      式中,nI、no分别表示超球内、外样本的数目。根据超球内、外样本整体分布情况与隶属度变化趋势之间的关系,定义:

      (10)
      (11)

      对于不同dI、do,超球内、外样本隶属度μI(i)μo(i)变化情况分别如图 7(a)7(b)所示。

      图  7  μid(xi)的变化情况

      Figure 7.  Change of μi with d(xi)

      2) 确定临界隶属度μ#

      临界隶属度表示超球内样本的最小隶属度,超球外样本的最大隶属度。由图 6可知, 当超球外样本的整体分布越靠近球面时,超球外样本属于该类的可能性越大,则超球外样本的最大隶属度应越大,即临界隶属度μ#越大,反之越小。在图 8中,两类样本的球外样本分布相同,但图 8(b)中的R大于图 8(a),则图 8(b)中的球外样本x更接近球面,其隶属度大于图 8(a)中的x。所以若R越大,说明球内、外样本的差别越小,超球外的样本越靠近球面,则μ#越大。

      图  8  具有不同最小超球半径的两类样本集的分布情况

      Figure 8.  Samples Distribution of Two Classes with Different R

      综上可得, μ#do成反比,与R成正比。由此,定义临界隶属度:

      (12)

      图 7(a)可以看出,dI越大,μI(i)的衰减速度越慢。由图 7(b)可以看出,do越大,μo(i)的衰减速度越快。图 7(c)显示, 当R=2不变时,do=3、4、5对应的μ#分别为0.65、0.5、0.4,μ#随着do的增大而逐渐减小。在图 7(d)中,当do =4不变时,R=1.8、2、2.4对应的μ#分别为0.45、0.5、0.6,μ#随着R的增大而逐渐增大。

      最终可确定自适应隶属度函数为:

      (13)

      本文从训练云图中提取训练样本组成样本库。然后,利用式(13)确定各样本的隶属度,并采用一对一方法训练多类AFSVM分类器,最后利用所得分类器对测试云图进行云类识别。具体流程如图 9所示,实线表示训练过程,虚线表示测试过程。

      图  9  云系分类算法流程图

      Figure 9.  Algorithm Flowchart of Cloud Classification

    • 为了验证算法的有效性,在MATLAB(R2011b)编程环境下进行实验,实验平台为Windows 7, CPU为Intel(R) Core(TM) i3-2130 3.4 GHz, RAM为4 GB。实验采用MTSAT卫星2013年10月6日12:30和2013年10月7日12:30两时刻的IR1~VIS 5通道兰勃特投影云图。实验截取大小为512×512,覆盖中国东南沿海和太平洋部分区域的子图像作为测试图像,该区域包含两大超强台风, 台湾地区的23号台风“菲特”和太平洋的24号台风“丹娜丝”。10月6日的IR1通道云图及专家云系标定图如图 10所示。本文采用径向基核函数,并用K组交叉验证方法,确定各种SVM的最优参数。标准SVM方法C=11.31,g=1.41,传统紧密度FSVM方法C=8,g=1,AFSVM方法C=5,g=0.1。图 11分别显示了三种SVM对10月6日云系的识别结果。

      图  10  原IR1通道云图及专家云系标定图

      Figure 10.  Original Cloud Image (IR1) and Cloud Types Labeled Image

      图  11  各种SVM方法云类识别结果

      Figure 11.  Cloud Recognition Results Based on Different SVM Methods

      图 11显示,各种SVM所得的分类结果在大范围上与专家标定图都有较好的对应,但在细节上标准SVM、传统FSVM与AFSVM相比稍逊一筹。标准SVM将“菲特”台风尾部的大量高云错分为中云(如图 11(a)中标示位置),又将台风外围的大量低云错分为高云。传统FSVM提高了高云的识别性能,但对低云仍存在大量的错分现象(如图 11(b)中标记位置)。AFSVM则较好地识别了台风外围的云系,进一步提高了低云的识别性能。

      通过定量数据,进一步分析AFSVM的云类识别性能。每类提取200个样本作为测试集,AFSVM对10月6日各类云系的识别率见表 2。可以看出,5类样本的识别率都在80%以上,整体识别率高达90.5%,尤其是晴空区、低云、直展云识别率分别达到96.0%、93.0%和94.5%。对晴空区与有云区进行准确识别,为进一步的云分类奠定坚实基础。低云中浓积云与雨层云的出现常有连续性降水。积雨云出现多伴随暴雨、雷电等恶劣天气。中云与高识别准确率稍低一些,但也均在80%以上,分别为84%、85%。中云的高层云和高积云两者可相互演变,冬天高层云的出现会发生长期的降水或降雪。高云中卷云可向卷层云演化,在冬季预示着少量降雪。实现对各种云系的高识别率体现AFSVM在气象服务中的应用价值。

      表 2  2013年10月6日各种云系识别准确率

      Table 2.  Recognition Accuracy Rates of Different Cloud Types in October 6th, 2013

      云类型 分类结果
      晴空 低云 中云 高云 直展云
      晴空 192 8 0 0 0
      低云 0 186 7 7 0
      中云 0 3 168 21 8
      高云 0 0 30 170 0
      直展云 0 0 6 5 189
      准确率/% 96.0 93.0 84.0 85.0 94.5
      平均准确率/% 90.5

      为了进一步说明本文方法的云识别效果,分别与3种人工神经网络方法(反向传播网络(back-propagation, BP)、自组织映射(self-organizing map, SOM)、学习矢量量化(learning vector quantization, LVQ))和4种SVM方法(标准SVM、线性FSVM、S型FSVM、紧密度FSVM)的结果数据进行比较。表 3列出10月6日各种方法的识别准确率。

      表 3  2013年10月6日各种云分类方法识别准确率/%

      Table 3.  Recognition Accuracy Rates of Different Methods in October 6th, 2013/%

      分类方法 准确率 平均
      准确率
      晴空 低云 中云 高云 直展云
      BP 99.5 59.5 73.5 27.5 30.5 58.1
      SOM 96.0 70.5 66.5 55.0 77.5 72.9
      LVQ 95.5 92.0 84.5 19.5 97.0 77.7
      标准 SVM 97.0 70.0 83.5 52.0 93.0 79.1
      线性 FSVM 96.0 72.0 79.5 84.0 95.5 85.4
      S型 FSVM 95.5 70.5 77.5 81.0 96.0 84.1
      紧密度 FSVM 96.0 76.5 85.0 79.5 95.5 86.5
      本文AFSVM 96.0 93.0 84.0 85.0 94.5 90.5

      表 3可以看出,各方法对晴空区都有很好的识别效果。但BP网络和SOM网络对其他云系的识别效果普遍低于各种SVM。BP网络需要设置的参数过多,且缺乏有效的参数确定方法,且对样本依赖性强。SOM网络为自适应无监督分类方法。LVQ网络将自组织竞争思想与有监督学习相结合,对低云、中云、直展云都有较好的识别效果,但对高云的识别能力很差,只有19.5%。对比几种SVM,FSVM的云类识别率普遍高于标准SVM。除了中云,线性FSVM和S型FSVM的识别率略低于标准SVM,可见不合理隶属度会使FSVM的分类性能下降。5种SVM对晴空区和直展云都有很好的识别效果。但标准SVM对低云与高云识别较差,两类云系识别率分别为70%和52%。三种传统FSVM对低云的识别效果只是略有提高,而AFSVM将其识别率提高到93%。对于高云,FSVM与其他方法相比有较大提高,其中AFSVM达到最高为85%。并且AFSVM对各类云系的整体识别率高达90.5%,远高于其他方法。同时,AFSVM对各类云系的识别效果都比较稳定,识别率均为或接近最高值。综上分析,AFSVM的云分类识别性能优于标准SVM、传统FSVM以及神经网络,并且对各类云系具有更高的稳定性和适应性。

      对于2013年10月7日12:30时刻,表 4给出AFSVM所得的各类云系识别结果,表 5显示了各种分类方法的识别准确率。

      表 4  2013年10月7日各种云系识别准确率

      Table 4.  Recognition Accuracy Rates of Different Cloud Types in October 7th, 2013

      云类型 分类结果
      晴空 低云 中云 高云 直展云
      晴空 188 12 8 0 0
      低云 2 181 11 6 0
      中云 0 5 161 23 11
      高云 0 1 29 169 1
      直展云 0 1 0 16 183
      准确率/% 94.0 90.5 80.5 84.5 91.5
      平均准确率/% 88.2

      表 5  2013年10月7日各种云分类方法识别准确率/%

      Table 5.  Recognition Accuracy Rates of Different Methods in October 7th, 2013/%

      分类方法 准确率 平均
      准确率
      晴空 低云 中云 高云 直展云
      BP 94.5 40.0 61.0 22.5 19.0 47.4
      SOM 98.5 62.0 41.5 67.0 90.0 71.8
      LVQ 92.5 78.0 78.5 3.5 94.0 69.3
      标准 SVM 94.0 62.5 78.0 67.0 97.0 79.7
      线性 FSVM 93.5 61.0 77.0 88.0 90.5 82.0
      S型 FSVM 91.5 61.0 72.5 88.5 91.0 80.9
      紧密度 FSVM 93.5 61.5 80.5 85.0 94.0 82.9
      本文AFSVM 94.0 90.5 80.5 84.5 91.5 88.2

      表 4可以看出, AFSVM对各云系保持着较好的识别能力。晴空、低云、直展云的识别率仍在90%以上,中云、高云的识别率也保持在80%以上,平均识别率达到88.2%。表 5显示,神经网络的平均识别率仍普遍较低,标准SVM的平均识别率低于其他FSVM。对比表 3,线性FSVM、S型FSVM、紧密度FSVM对高云的识别能力虽有所提高,但低云识别较差,平均识别率都有较大降低。AFSVM的平均识别率为88.2%, 仍明显高于其他传统FSVM, 这说明AFSVM具有更优的泛化性能。

      为了更好地说明AFSVM算法的性能,本文对运算复杂度进行分析,用求均值的方法分别统计了标准SVM、传统紧密度FSVM和AFSVM的训练时间和测试时间:标准SVM(0.104 s, 0.033 s), 传统紧密度FSVM(1.344 s, 0.024 s), AFSVM(1.324s, 0.022 s),可以看出,两种FSVM均以增加训练时间为代价提高分类准确率。但训练阶段只在后台进行,更重要的是利用训练好的模型去测试图像的时间。两种FSVM的测试时间均低于标准SVM,有利于测试过程的进行。进一步对比两种FSVM,可以发现, AFSVM虽然增加了参数自适应环节,但通过简化模糊隶属度函数的表达式,以及隶属度对样本更优的处理,降低了训练时间和测试时间,在云图的训练和测试中具有更好的应用。

    • 本文针对传统FSVM中隶属度函数与实际不符且灵活性较差的不足,构造了一种可以根据不同云系样本特点,自适应调整隶属度衰减参数及临界隶属度的AFSVM分类器。结合光谱特征与纹理特征,对MTSAT卫星数据,运用AFSVM进行云类识别实验。实验结果表明,AFSVM具有良好的云系识别性能,识别效果明显优于标准SVM和传统FSVM,对不同云系具有更好的稳定性和适应性。

参考文献 (16)

目录

    /

    返回文章
    返回