留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

适用于遥感分类的多邻域粗糙集加权特征提取方法

陈铁桥 柳稼航 朱锋 王一豪 刘佳 陈杰

陈铁桥, 柳稼航, 朱锋, 王一豪, 刘佳, 陈杰. 适用于遥感分类的多邻域粗糙集加权特征提取方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290
引用本文: 陈铁桥, 柳稼航, 朱锋, 王一豪, 刘佳, 陈杰. 适用于遥感分类的多邻域粗糙集加权特征提取方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290
CHEN Tieqiao, LIU Jiahang, ZHU Feng, WANG Yihao, LIU Jia, CHEN Jie. A Novel Multi-radius Neighborhood Rough Set Weighted Feature Extraction Method for Remote Sensing Image Classification[J]. Geomatics and Information Science of Wuhan University, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290
Citation: CHEN Tieqiao, LIU Jiahang, ZHU Feng, WANG Yihao, LIU Jia, CHEN Jie. A Novel Multi-radius Neighborhood Rough Set Weighted Feature Extraction Method for Remote Sensing Image Classification[J]. Geomatics and Information Science of Wuhan University, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290

适用于遥感分类的多邻域粗糙集加权特征提取方法

doi: 10.13203/j.whugis20150290
基金项目: 

国家重点研发计划 2016YFF0103604

西部青-学者计划A类 XAB2015A07

国家重点基础研究发展计划(973计划) 2012CB719906

详细信息
    作者简介:

    陈铁桥, 博士生, 助理研究员, 主要从事遥感影像处理的理论与方法研究。chentieqiao@opt.ac.cn

    通讯作者: 柳稼航, 博士, 研究员。jhliu@opt.cn
  • 中图分类号: P237

A Novel Multi-radius Neighborhood Rough Set Weighted Feature Extraction Method for Remote Sensing Image Classification

Funds: 

The National Key Research and Development Program of China 2016YFF0103604

the Western Youth Scholars Program XAB2015A07

the Major State Basic Research Development Programme of China (973 Programme) 2012CB719906

More Information
    Author Bio:

    CHEN Tieqiao, PhD candidate, specializes in remote sensing image processing. E-mail: chentieqiao@opt.ac.cn

    Corresponding author: LIU Jiahang, PhD, professor. E-mail: jhliu@opt.cn
图(5) / 表(3)
计量
  • 文章访问数:  861
  • HTML全文浏览量:  43
  • PDF下载量:  306
  • 被引次数: 0
出版历程
  • 收稿日期:  2017-09-05
  • 刊出日期:  2018-02-05

适用于遥感分类的多邻域粗糙集加权特征提取方法

doi: 10.13203/j.whugis20150290
    基金项目:

    国家重点研发计划 2016YFF0103604

    西部青-学者计划A类 XAB2015A07

    国家重点基础研究发展计划(973计划) 2012CB719906

    作者简介:

    陈铁桥, 博士生, 助理研究员, 主要从事遥感影像处理的理论与方法研究。chentieqiao@opt.ac.cn

    通讯作者: 柳稼航, 博士, 研究员。jhliu@opt.cn
  • 中图分类号: P237

摘要: 邻域粗糙集是一种有效的影像特征提取方法,邻域粗糙集模型存在稳定性不高和邻域半径需要反复调整的不足,难以实现地物特征的自动化提取。提出一种多邻域粗糙集加权特征提取方法用于高分辨率遥感影像特征提取。该方法首先利用不同半径的邻域粗糙集对影像的光谱和纹理特征进行提取,求得不同邻域半径下的有效特征子集;然后统计所有邻域半径下各个特征出现的概率,将概率作为权重与特征进行加权得到最终地物特征。QucikBird影像上分类试验表明本文算法优于传统邻域粗糙集特征提取方法,分类总精度平均提高3.88%,Kappa系数平均提高5.16%。在GeoEye-1影像上的分类试验同样证明了本文方法的有效性。

English Abstract

陈铁桥, 柳稼航, 朱锋, 王一豪, 刘佳, 陈杰. 适用于遥感分类的多邻域粗糙集加权特征提取方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290
引用本文: 陈铁桥, 柳稼航, 朱锋, 王一豪, 刘佳, 陈杰. 适用于遥感分类的多邻域粗糙集加权特征提取方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290
CHEN Tieqiao, LIU Jiahang, ZHU Feng, WANG Yihao, LIU Jia, CHEN Jie. A Novel Multi-radius Neighborhood Rough Set Weighted Feature Extraction Method for Remote Sensing Image Classification[J]. Geomatics and Information Science of Wuhan University, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290
Citation: CHEN Tieqiao, LIU Jiahang, ZHU Feng, WANG Yihao, LIU Jia, CHEN Jie. A Novel Multi-radius Neighborhood Rough Set Weighted Feature Extraction Method for Remote Sensing Image Classification[J]. Geomatics and Information Science of Wuhan University, 2018, 43(2): 311-317. doi: 10.13203/j.whugis20150290
  • 随着QuickBird、GeoEye、Ikonos等高分辨率遥感影像的出现,传统基于像元的地物提取方法面临着巨大的挑战[1]。在同一区域范围内,较中低分辨率遥感影像而言,高分辨率遥感影像的空间纹理信息明显增加;而受到成像技术的限制,影像的波段数量明显减少[2]。分辨率越高,“同谱异物,同物异谱”现象越明显,导致面向像元的地物分类结果可靠性不高[3]。面向对象的分析方法是高分辨率遥感影像分类的有效解决方法[4],而对象特征的精确描述是地物分类的研究重点和难点[5]。由于区分不同类型地物所需特征不同,特征的重要性也存在差异[6],传统的利用单一特征或将多种特征进行组合对地物进行描述的方法精度不高。因此,需要有效的地物特征提取算法,从大量的原始特征中获取更精确的地物描述特征。

    粗糙集作为知识获取的智能手段已应用于模式识别、图像处理和数据分析等诸多研究领域,在影像分类、特征选择与降维[7]等遥感影像处理方面也取得了较好效果。经典粗糙集[8]是一种建立在等价类基础上的粒度计算模型,其对于数值型特征进行处理通常需要进行离散化处理,但不可避免地带来信息的损失,导致其对数值型数据处理的适用性不好。鉴于此,文献[9]将邻域模型与粗糙集理论结合提出邻域粗糙集模型,该模型能够直接对数值型数据进行处理而无需离散化过程,处理数值型数据效果较好。随后很多研究者对邻域粗糙集进行研究,并提出一些改进算法[10-11]。但这些方法提取特征的有效性受邻域半径影响较大,需要反复调整邻域半径才能得到有效的特征, 导致特征提取的自动化程度不同。相对于其他数值型数据,遥感影像的特征更加复杂,且不同区域影像地物特征差异明显,利用邻域粗糙集进行特征提取时邻域半径的设置是一个急需解决的难题。

    为此,本文从邻域半径的变化对特征提取的影响进行分析,提出一种多邻域粗糙集加权特征提取方法用于高分辨率遥感影像特征提取。该方法将不同邻域半径下特征出现的概率作为权重对特征进行加权得到新的地物描述特征,能够有效提升特征的自动化程度,且获得的新特征在地物分类中效果更好。

    • 传统的粗糙集建立在离散化空间之上,对数值型数据进行处理必然会导致个别特征值数据过拟合[9]。而邻域系统通过定义样本点的邻域,在无需离散化处理情况下实现了论域空间粒化。通过对邻域系统和邻域算子进行研究,文献[9]将邻域模型和粗糙集进行结合提出了邻域粗糙集模型,该模型无需对论域空间进行粒化,且在合适的邻域半径下能提取有效特征。下面将以邻域的定义为基础逐步导出特征重要度指标,并构建邻域粗糙集特征提取算法。

      邻域  实数空间上的有限集合U={x1, x2, ..., xn},对于U上的任意对象xi,其ε范围内的邻域定义为:ε(xi)={x|d(x, xi)<ε, xU}。其中,ε(xi)表示对象xi的邻域;d(x, xi)表示对象xix的空间距离。

      邻域决策系统  给定的样本集合U={x1, x2, ..., xn},A是描述U特征的集合,aU的一个属性,D是决策属性可以将U划分为多个等价类,如果A生成论域上的一族邻域关系,则将S=<U, A, D>称作一个邻域决策系统。

      近似集  S=<U, A, D>中,DU划分得到N个等价类:X1, X2, ..., XN,∀AsubAD关于条件属性Asub的下近似和上近似定义如下:$ \underline {{N_{{A_{{\rm{sub}}}}}}} D = \bigcup\limits_{i = 1}^N {\underline {{N_{{A_{{\rm{sub}}}}}}} {X_i}}, \overline {{N_{{A_{{\rm{sub}}}}}}} D = \bigcup\limits_{i = 1}^N {\overline {{N_{{A_{{\rm{sub}}}}}}} {X_i}} $。其中,$ \underline {{N_{{A_{{\rm{sub}}}}}}} X = \left\{ {{x_i}|{\varepsilon _{{A_{{\rm{sub}}}}}}\left( {{x_i}} \right) \subseteq X, {x_i} \in U} \right\}, $$ \overline {{N_{{A_{{\rm{sub}}}}}}} X = \left\{ {{x_i}|{\varepsilon _{{A_{{\rm{sub}}}}}}\left( {{x_i}} \right) \cap X \ne \emptyset, {x_i} \in U} \right\} $。决策的边界定义为$ BN\left( D \right) = \overline {{N_{{A_{{\rm{sub}}}}}}} D - \underline {{N_{{A_{{\rm{sub}}}}}}} D $。

      图 1给出了二维空间中的两类分类示意图,其中小矩形表示第一类样本,小圆点表示第二类样本。图中以x1为中心的邻域全部为第一类样本,是第一类样本的下近似;以x2为中心的邻域表示第二类样本,是第二类样本的下近似;以x3为中心的邻域是第一类和第二类样本的混合,是样本的边界。在实数空间中,下近似包含样本数越多,样本边界包含样本数越少,样本的可分性越高。

      图  1  实数空间的邻域关系

      Figure 1.  Neighborhood Relationship in Real Spaces

      属性依耐度  决策D的下近似也被称为决策的正域,正域越大,各个类别间混合的部分越少,各类别可分程度越高[10]。因此,将决策D对条件属性Asub的依耐度定义为$ {R_{{A_{{\rm{sub}}}}}}\left( D \right) = {\rm{num}}\left( {\underline {{N_{{A_{{\rm{sub}}}}}}} D} \right)/{\rm{num}}\left( U \right) $。其中,num(*)表示对象的个数,RAsub(D)表示样本集合根据条件属性Asub的描述能够正确分类的比率,0≤RAsub(D)≤1,$ \left( {\underline {{N_{{A_{{\rm{sub}}}}}}} D} \right) $越大,决策D对条件属性Asub的依耐度越高。

      系统决策核  决策系统S=<U, A, D>,Asub_1, Asub_2, ...Asub_m是系统特征简约的全部集合,那么$ C = \bigcap\limits_{i = 1}^m {{A_{sub\_i}}} $为系统决策核。

      属性重要度指标  对于一个决策系统S=<U, A, D>,AsubAaAAsub,定义属性a相对于条件属性Asub的重要度定义为SIG(a, Asub, D)=RAsuba(D)-RAsub(D)。

      以属性的重要度指标为基础构建的邻域粗糙集特征提取算法[10]应用广泛。该算法以空集为起点,每次计算剩余属性重要度,将属性重要度指标最大的属性加入到简约集合中,直到剩余属性的重要程度小于一个极小的条件阈值,此时得到的特征集合即为最终的特征集。

      利用邻域粗糙集特征提取算法进行地物特征提取时,邻域半径是一个关键的参数,其值的大小将直接影响特征提取的结果。邻域半径值设置过大,会导致过多的样本被划分到同一邻域范围内,从而导致决策对属性的依赖度变小,难以对样本进行区分。邻域半径值设置过小,使得连续型的粗糙集趋向于经典的粗糙集,失去对连续数据处理的能力,无法提取有效的特征。

    • 高分辨率遥感影像极其复杂,不同区域、不同时相的数据特征分布差异明显,利用邻域粗糙集进行特征提取时,需要反复调整以获取有效的邻域半径, 导致自动化程度不高。且不同特征对地物描述的重要性存在差异,直接利用固定半径邻域模型提取特征无法对各特征的重要性程度进行区分。

    • 为了探究邻域半径与特征提取的关系,对遥感影像数据在不同半径邻域粗糙集提取特征的个数、特征依赖度进行分析。研究数据为2004年东莞某区域QuickBird影像,包括红、绿、蓝3个可见光波段,图像大小为400×400像元,空间分辨率为0.61 m。研究区域内主要包括房屋、林地、耕地、水体和阴影等地物(见图 2(a))。

      图  2  实数空间的邻域关系

      Figure 2.  Neighborhood Relationship in Real Spaces

      首先,求QuickBird影像的3个波段的均值得到灰度影像,在此基础上进行标记分水岭变换实现影像分割,具体步骤如下。

      1) 求取梯度影像的局部最小值区域,利用阈值为平均梯度值1/3的最小扩展变换[12],消除无意义的局部最小区域,保留有意义的局部最小区域;

      2) 采用强制最小技术对梯度影像的局部极小值区域进行修改,删除无意义的局部最小区域;

      3) 对重建后的梯度影像进行快速分水岭变换[12-13],得到影像对象总计798个,分割结果如图 2(b)所示。

      然后,提取初始特征,利用Gabor滤波器对灰度影像进行6个尺度下6个方向的滤波得到每个像元的36维纹理特征分量[14],求取各影像对象内像元的3维光谱和36维纹理的方差和均值,得到所有影像对象的78个特征属性值。其中1~3号特征分别为红、绿、蓝3个波段光谱的方差,4~39号特征为Gabor纹理的方差,40~42号特征分别为红绿蓝3个波段光谱的均值,43~78号特征为Gabor纹理的均值。得到所有影像对象的初始特征之后,对其特征属性值进行归一化处理,使各属性值都保持在0~1之间[5]。然后选择如图 2(c)所示的4类地物总计274个样本,其中耕地样本79个,水体和阴影样本12个,林地样本81个,房屋样本102个。

      在获得地物样本后,使用不同半径的邻域粗糙集进行特征提取,其中邻域半径的初始值设为0.01,半径递增步长为0.01,直至半径递增使得特征依赖度为零时为止。如图 3所示,随着邻域半径从小到大逐渐变化,特征依赖度随之逐渐变小直至为零。邻域半径较小时,样本可区分程度高,但获取的特征数目过少无法准确描述地物;邻域半径较大时,又导致样本无法区分。提取的特征个数随邻域半径扩大,整体呈现先增加后减少的趋势,在有效邻域半径[0.1, 0.3][10],特征个数曲线波动明显。因此,难以确定一个合适的邻域半径进行特征提取。

      图  3  邻域大小对特征依赖度和特征数的影响

      Figure 3.  The Influence of Neighborhood Size on Feature Dependence and Feature Number

    • 对各邻域半径的特征进行统计发现,某些特征出现的频率较高,而另外一些特征却极少出现,有些特征出现概率为零。表 1为不同邻域半径下提取的概率排名前5的特征,其中3号和41号特征出现的概率最高为78.18%,且概率排前5的特征出现的概率均高于70%。对所有特征的概率进行统计,发现有20个特征出现的概率为零。

      表 1  部分特征出现的概率

      Table 1.  The Probability of Some Features

      特征编号 3 41 40 2 4
      特征概率/% 78.18 78.18 76.32 74.55 72.73

      分析发现,出现频率较高的特征在各邻域半径下都能较好地进行地物区分,地物描述能力较强;出现概率较低的特征虽然也能在一定程度上描述地物,但地物描述能力较弱;出现概率为零的特征,无法对地物类别进行区分。

      地物描述能力的强弱是衡量特征有效性的重要标准。因此,从原始特征集合中提取有效的特征集合应考虑区分特征的重要性程度和剔除无效特征两个方面。为此,本文将特征出现概率作为特征的权重,提出一种多邻域粗糙集加权特征提取方法,首先,对邻域半径由小变大的过程中特征出现的概率进行计算;然后,利用特征出现的概率对特征进行加权求得最终特征。这样无需反复调整邻域半径值,且能够去除无效特征,同时概率加权也能够对特征的重要性进行区分。其具体计算步骤如下。

      1) 设置邻域半径的最小值εmin和半径递增的步长εstep;初始化特征简约次数i=1。

      2) 利用邻域粗糙集特征提取算法对邻域半径为εmin+(i-1)εstep的情况进行计算得到特征集Aselected_i

      3) 统计特征集Aselected_i中特征的个数num(Aselected_i),若num(Aselected_i)不为零,i=i+1,转到步骤2;若num(Aselected_i)等于零,继续下一步。

      4) 计算Aselected_1, Aselected_2, ..., Aselected_i中各个特征出现的概率$ {\omega _j} = {\rm{num}}\left( {{a_j}} \right)/\sum\limits_{k = 1}^{T\;{\rm{num}}} {{\rm{num}}\left( {{a_k}} \right)} $,其中, T_num表示特征数,num(*)对象个数,aj为编号为j的特征。

      5) 利用特征的概率加权求取最终特征A'=(ω1·a1, ω2·a2, ..., ωT_num·aT_num)。

    • 为了验证多邻域粗糙集加权特征提取方法提取遥感影像特征的有效性,本文通过高分辨率遥感影像面向对象分类试验进行验证。具体试验分为3步:①影像分割与初始特征提取;②多邻域粗糙集加权特征提取;③支持向量机分类。

    • 在对图 1中的QuickBird影像进行分割和初始特征的提取后,使用多邻域粗糙集加权特征提取算法提取样本地物的有效特征,其中最小邻域半径εmin=0.01,半径递增步长εstep=0.01,这样设置主要是能够更加精确地统计特征概率,同时又不使计算量过大。

      为了验证多邻域粗糙集加权特征提取方法的有效性,本文利用不同特征的地物分类精度来进行衡量。支持向量机是一种建立在统计学习理论上以结构风险最小化原则为基础的机器学习方法[15],大量的遥感影像分类试验表明支持向量机分类方法稳定性好且精度高[16]。本文使用的分类器是一个支持向量机软件包(a library for support vector machines,LIBSVM)[17]。文中对以下3种情况下特征的属性值进行了分类试验:①全部特征;②多邻域粗糙集加权特征;③不同邻域半径的粗糙集提取的特征。图 4(a)为全部特征分类结果,4(b)为加权特征分类结果,4(c)为邻域半径为0.15的分类结果。分类结果中红色区域代表房屋、淡蓝色区域代表水域和阴影、蓝色区域代表林地、绿色区域代表耕地。

      图  4  地物分类结果

      Figure 4.  Classification Results

      图 4分类结果目视对比可知,4(b)的分类精度明显高于4(a)和4(c)的分类精度。局部细节对比发现:在椭圆区域1中,4(b)的分类结果完全正确,4(c)中少量耕地被误判为林地和建筑,而4(a)中大量耕地被误判为林地;椭圆区域2中,4(b)耕地分类精度明显高于4(a)和4(c);椭圆区域3中,4(a)和4(c)的少量建筑被误判为耕地,而4(b)中分类结果准确。整体上,地物分类结果4(b)较4(a)和4(c)的精度高,这表明多邻域粗糙集加权特征能够更有效地描述地物。

      为了定量描述不同特征下的分类精度,本文通过人工解译的方法获得图 2(a)的参考图,使用总精度和Kappa系数对分类结果进行评价。

      表 2列出了所有特征属性值的分类精度、加权特征属性值的分类精度和不同邻域半径特征属性值分类精度的均值(邻域半径范围为0.1~0.3,以0.01为间隔,该范围内提取特征的有效性高[10])。分析表中结果可以看出,使用加权特征的分类精度最高,本文方法提取的特征对地物的描述更加精确。

      表 2  QuickBird影像试验中分类精度统计

      Table 2.  Accuracy Statistics for Classification of QuickBird Imagery

      特征集 所有特征 加权特征 不同邻域半径特征
      总精度/% 86.43 91.77 87.89
      Kappa系数/% 81.34 88.42 83.26
    • 为了进一步证明本文方法的有效性和对不同传感器数据的鲁棒性和适用性。选用2009年6月拍摄于伊朗某区域的GeoEye-1数据进行分类试验,数据包括红、绿、蓝3个可见光波段,图像大小为400×400像元,空间分辨率为0.5 m,如图 5(a)所示。分割采用高斯滤波器参数为7×7窗口,方差sig=2。然后,求取影像3个波段的均值得到灰度影像,利用Sobel算子对灰度影像进行计算得到图像的梯度。在此基础上进行标记分水岭变换实现影像分割[13],得到影像对象总计1 572个。

      图  5  加权特征与所有特征分类结果比较

      Figure 5.  Comparison of Extracted Features and all Features for Image Classification

      图 5(b)图 5(c)分别表示加权特征分类结果和所有特征分类结果,其中红色区域代表房屋,绿色区域代表树木,蓝色区域代表空地,淡蓝色区域代表阴影。目视判别可知,图 5(b)在房屋区域和空地区域分类精度明显高于图 5(c)。由表 3精度评价结果可以看出,使用本文算法提取的加权特征在分类中较原始特征分类的精度高,是一种有效的特征提取算法,对不同传感器的高分辨率影像具有良好的适应性和鲁棒性。

      表 3  GeoEye-1影像试验中分类精度统计

      Table 3.  Accuracy Statistics for Classification of GeoEye-1 Iamgery

      特征集 加权特征 所有特征
      总精度/% 90.53 85.43
      Kappa系数/% 87.67 81.66
    • 针对邻域粗糙集模型在遥感影像特征提取中存在的稳定性和自动化程度不高的缺点,本文提出一种多邻域粗糙集加权特征提取算法以获得有效的地物描述特征。试验结果表明本文方法有如下优势:①利用本文算法提取的特征进行地物分类能够获得较高的精度,且稳定性较高;②解决了反复调试邻域半径的难题,提升了特征提取的自动化程度。但本文方法也存在需要改进的地方,如粗糙集在多邻域半径下进行特征提取会导致计算量增加。下一步将对如何提高计算效率进行深入研究。

参考文献 (17)

目录

    /

    返回文章
    返回