留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

图像纹理基元分类的马尔柯夫随机场方法

郑肇葆 潘励 郑宏

郑肇葆, 潘励, 郑宏. 图像纹理基元分类的马尔柯夫随机场方法[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615
引用本文: 郑肇葆, 潘励, 郑宏. 图像纹理基元分类的马尔柯夫随机场方法[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615
ZHENG Zhaobao, PAN Li, ZHENG Hong. A Method of Image Texture Texton Classification with Markov Random Field[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615
Citation: ZHENG Zhaobao, PAN Li, ZHENG Hong. A Method of Image Texture Texton Classification with Markov Random Field[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615

图像纹理基元分类的马尔柯夫随机场方法

doi: 10.13203/j.whugis20150615
基金项目: 

国家973计划 No.2012CB719905

详细信息
    作者简介:

    郑肇葆,教授,博士生导师,主要从亊摄影测量与遥感、图像分析与解译及进化计算应用研究。zhengzb@whu.edu.cn

  • 中图分类号: P231

A Method of Image Texture Texton Classification with Markov Random Field

Funds: 

The Major State Basic Research Development Program of China No.2012CB719905

More Information
    Author Bio:

    ZHENG Zhaobao, professor, PhD supervisor, specializes in photogrammetry and remote sensing, image analysis and interpretation,and the application of evolutionary computation . E-mail:zhengzb@whu.edu.cn

图(2) / 表(4)
计量
  • 文章访问数:  872
  • HTML全文浏览量:  48
  • PDF下载量:  397
  • 被引次数: 0
出版历程
  • 收稿日期:  2016-09-26
  • 刊出日期:  2017-04-05

图像纹理基元分类的马尔柯夫随机场方法

doi: 10.13203/j.whugis20150615
    基金项目:

    国家973计划 No.2012CB719905

    作者简介:

    郑肇葆,教授,博士生导师,主要从亊摄影测量与遥感、图像分析与解译及进化计算应用研究。zhengzb@whu.edu.cn

  • 中图分类号: P231

摘要: 提出基于马尔柯夫随机场(MRF)的图像纹理基元分类新方法。利用MRF里中心像元特征值与邻近像元特征值之间的约束关系,反映图像纹理基元的特征以及不同的MRF参数。根据由同一类别的图像求得的MRF参数计算出的标准差最小这一性质来进行图像纹理的分类。通过不同实验方案的对比,以及与不同分类方法的比较,证实提出的图像纹理基元分类方法具有一定的优势。

English Abstract

郑肇葆, 潘励, 郑宏. 图像纹理基元分类的马尔柯夫随机场方法[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615
引用本文: 郑肇葆, 潘励, 郑宏. 图像纹理基元分类的马尔柯夫随机场方法[J]. 武汉大学学报 ● 信息科学版, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615
ZHENG Zhaobao, PAN Li, ZHENG Hong. A Method of Image Texture Texton Classification with Markov Random Field[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615
Citation: ZHENG Zhaobao, PAN Li, ZHENG Hong. A Method of Image Texture Texton Classification with Markov Random Field[J]. Geomatics and Information Science of Wuhan University, 2017, 42(4): 463-467. doi: 10.13203/j.whugis20150615
  • 图像纹理分类是图像识别与自动解译的关键技术。近几年来提出的图像纹理分类的方法主要是基于纹理基元的图像纹理分类方法。其中有的方法采用纹理基元编码,通过纹理基元字典的学习,解决图像纹理分类问题[1]。有的方法采用图像块与滤波器做卷积建立纹理基元字典,解决纹理分类问题[2]。Manik等提出纹理分类是否一定要用滤波器库的疑问,并提出是否可以使用马尔柯夫随机场(MRF)[3]来进行图像纹理分类。因为影像的纹理是由不同类型和数量的基元按照一定的空间规则排列而成,每个像元即是纹理基元。不同基元的统计规律反映出不同的纹理特征,这种特征可以通过MRF的特征参数来描述,从而解决图像纹理分类问题[4]。因此,可以认为MRF是个解决纹理分类的好办法.

    基于此,本文设计了一种图像纹理基元分类的MRF方法,并通过与其他分类方法对比,证明了该方法的优越性。

    • 本文采用一个5×5像元的窗口,如图 1所示,其中S为中心像元,其余24个像元,即图中赋给≤5的24个像元,就是中心像元S的五阶MRF。类似地,图 1中“≤4”的20个像元为中心像元S的四阶MRF, “≤3”的12个像元为中心像元S的三阶MRF,“≤2”的8个像元为中心像元S的二阶MRF,“L=1”的4个像元是中心像元S的一阶MRF。

      图  1  五阶MRF

      Figure 1.  Five Order MRF

      选用五阶MRF来研究中心像元S与邻近像元的关系,但是没有全部使用,而是选用12个近邻像元,如图 2n, g, m, u, w1, h, h1, w, u1, m1, g1, n1所示。

      图  2  五阶MRF略图

      Figure 2.  Thumbnail of Five Order MRF

      按照马尔柯夫随机场理论,中心像元S的特征值与12个近邻像元的特征值之间存在以下的约束关系[4]

      (1)

      式中,b1\~b12为待定的MRF参数;S为中心像元;n、g、m、…、g1n1为中心像元的12个邻近的特征值;v(S)为中心像元特征值噪声(即误差)。

    • 根据§1.1的中心像元S的特征值与12个近邻像元特征值的约束关系式(1),将其写成误差方程式的形式:

      (2)

      按最小二乘法原理,由[vv]=min(符号[]表示总和),可求得式中b1~b12的12个参数。这样的参数能够反映出该幅图像的纹理特征,不同类别的图像可以求得不同的特征参数组(由12个参数组成)。反之,同一类别的不同图像求得的特征参数值相同或接近。根据最小二乘法求解原理,将按最小二乘法求得的特征参数代入式(2),求得的∑v(S)2误差平方和最小,即用误差平方和求得的标准差为最小。相反地,用其他类别的12个特征参数代入式(2)求得误差v(S),计算出的标准差σ不是最小。因此将相同类别的标准差最小作为纹理分类的准则。

    • 1) 将每幅图像的像元特征值(灰度值或能量[5]或分形维[6]等)变换为标准化数据,即[0, 1]区间内的数据。这项工作是借助每幅图像像元特征值除以该幅图像的像元的最大特征值实现的。

      2) 以5×5像元大小窗口,先行后列依次扫遍一幅图像,相邻窗口之间仅有一个像元相同的边线重叠,对于100×100像元大小的图像,上述5×5像元窗口共有289个。每个窗口可以列出一个类似式(2)的误差方程式,用矩阵形式表示为:

      (3)

      式中,A1=[n g m n w1 h h1 w u1 m1 g1 n1]; X=[b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12]T;X为由12个MRF未知参数组成的列矩阵; A1为由窗口中心像元S对应的12个近邻像元(如图 2所示)的未知数组成的行矩阵;l1为窗口中心像元S的特征值。

      3) 假定在一幅图像中有n个5×5像元窗口,则可建立n个误差方程式(3)。按最小二乘法原理,即误差平方和最小原则,由误差方程式可以建立法方程式:

      (4)

      由式(4),得到一幅图像的12个MRF参数X

      (5)

      X代入误差方程式(3)中,求得每个窗口中的误差vi。利用所有误差vi的平方(以下用符号[vi vi]表示),计算该幅图像相应于求得MRF参数的标准差σ:

      (6)

      式中, n为误差方程式的个数。

      4) 由式(6)求得该幅图像的标准差σ,其数值最小,即如果用另一幅不同类型图像的12个MRF参数计算上述图像的标准差σ,其数值就不是最小。因此应利用标准差σ最小原则来进行图像纹理基元的分类。

    • 在图像纹理基元分类的MRF方法中,以所求得分类图像的标准σ最小作为准则进行分类。标准差σ是由许多像元的特征值组成的误差方程式,通过建立起来的法方程式求得12个MRF参数,再由式(3)和式(6)求得我们需要的标准差σ。本文使用的原始数据,无论是灰度值或能量值或分形维,都存在误差。经过一系列计算求得的标准差σ肯定也会有误差。用含有误差的标准差σ作为分类依据时,实际处理中就会出现以下情况。

      已知居民地、水田、灌木三类地物图像的MRF参数(用§1方法求得),采用标准差最小原则,对三幅图像进行识别,得到一组数据列在表 1中.

      表 1  三幅图像的标准差σ

      Table 1.  The Standard Deviation of Three Images

      居民地/10-2 水田/10-2 灌木/10-2
      第一幅 6.652 6.680 7.602
      第二幅 6.673 6.662 7.501
      第三幅 7.128 6.553 7.929

      表 1中列出用居民地、水田、灌木三类地物图像的MRF参数计算出来的三幅待识别图像的标准差σ,第一行为第一幅待识别图像的标准差σ,第二、三行分别为另两幅图像的相应标准差σ

      按照标准差σ最小原则,第一幅图像最小标准差σ=6.652×10-2是由居民地的MRF参数计算出来的,该幅图像应为“居民地”。第二、三幅图像最小标准差分别为σ=6.662×10-2σ=6.553×10-2,它们都是由水田的MRF参数计算出来的,第二、三幅图像应属于“水田”。实际上这三幅图像的属性是已知的,都是居民地。出现这种情况的原因可能有两个,一是使用的识别方法不能给出正确的识别;另一个原因是求得的标准差σ含有误差。

      如何求得标准差σ的“误差”, 这个问题至今还未解决,然而误差是存在的。经过多次试验,得到的数据是标准差σ含有5%的误差,即对于σ=6.673×10-2的误差为(6.673×10-2)×0.05=0.334×10-2,那么该σ下限为6.673×10-2~0.334×10-2=6.339×10-2表 1中第二幅图像(属于水田)的最小σ=6.662×10-2,大于计算出的σ下限值6.339×10-2。因此,以第二幅图像属于“居民地”的σ下限值为标准,仍然应当归属于居民地。

      现在看第三幅图像的情况是否也满足第二幅图像。以表 1中第二幅图像相应于居民地的σ=7.128×10-2,相应的5%的误差为0.356×10-2,那么相应的下限为6.772×10-2,该下限值大于第三幅图像属于“水田”的σ=6.553×10-2,即考虑到下限值情况下,第三幅图像属于“水田”的σ仍然是最小,第三幅图像应归属于水田,即对第三幅图像没有给出正确的识别。

      通过以上分析,对表 1中三副图像的识别结果如下:第一,第二幅图像是居民地,第三幅图像是水田。在下一节实验中采用包含5%误差的原则进行图像分类试验。

    • 实验中使用了居民地(21幅)、水田(13幅)、山地(20幅)、河流(35幅)以及灌木(52幅)5种不同类别的航空影像,像幅大小均为100像元×100像元。对上述每幅图像用本文提出的MRF方法求得各自的MRF参数,为了确定每个类别图像的样本数,采用以下措施。

      1) 求得每一类别图像的MRF参数均值,如灌木有52幅MRF参数的均值。

      2) 在每一类别中,对每幅图像中计算出每幅图像的MRF参数与该类别MRF参数均值之差Δij,用这些差值计算出MRF参数的标准差σij,在这里i为像幅的编号,j为12个MRF参数的编号,j=1, 2, …, 12.

      (3) 计算|Δij|>2σij的像幅,该像幅的MRF参数不参加求MRF参数均值计算。即σij=abs(|Δij|-2σij),σij>0的像幅不参加MRF参数均值计算。

      按这个原则,在实验中每个类别计算MRF参数均值,使用的样本参数称之为第一方案,列在表 2中.

      表 2  5类不同地物采用的样本数/幅

      Table 2.  Five Kinds of Objects with Different Samples\

      居民地 水田 山地 河流 灌木
      第一方案 17 13 16 30 46
      第二方案 11 7 11 18 26

      将5种不同类别的图像中每个类别图像的一半作为样本,就是实验中采用样本数的第二方案,如表 2中第二行数据所示。

    • 在图像分类试验中,要得到好的分类结果,需选择合理的组合。本文试验结果得到以下4个组合,每个组合由3个不同的地物组成,即第一组合由居民地、水田、山地组成,用于水田和山地的分类;第二组合由居民地、山地、河流组成,用于居民地的分类;第三组合由河流、山地、灌木组成,用于河流的分类;第四个组合由居民地、水田、灌木组成,用于灌木的分类。分类的结果列在表 3中。在表 3中,分母表示该类别图像的总数,分子表示能正确识别该类图像数。

      表 3  两个不同样本方案分类的结果

      Table 3.  Two Different Sample Classification Results

      第一组合 第二组合 第三组合 第四组合
      第一方案 第二方案 第一方案 第二方案 第一方案 第二方案 第一方案 第二方案
      水田 山地 水田 山地 居民地 居民地 河流 河流 灌木 灌木
      13/13=1 20/20=1 13/13=1 19/20=0.95 18/21=0.86 18/21=0.86 35/35=1 33/35=0.94 52/52=1 52/52=1

      1) 在同一组合中,第一方案的分类结果优于第二方案,因为第一方案中每个类别样本数多于第二方案的样本数。这告诉我们在实际工作中,待分类的图像较多时,已识别图像可以纳入到相应类别的样本图像中,可以获得合理的分类结果。

      2) 表 3的4个组合表明,每个组合由3个不同类别的样本组成,每个组合并不能对组合中3类图像给予合理的分类,有的组合只能对组合中两类图像给出合理分类,如第一组合;而其余三个组合只能识别一类图像。这表明要得到合理的分类,需要选择合理的图像组合。

    • 本文提出图像纹理基元分类MRF方法与几种优化“Tuned”模板图像分类结果相比都有一定的优势。从表 4最后一行数据可以看出,除了居民地之外,其余4种地物用本文方法均能做到全部正确分类。实验结果表明, 基于MRF的图像纹理基元分类方法具有一定的优势和潜力。

      表 4  图像纹理基元分类MRF方法与其他方法图像分类结果比较

      Table 4.  Comparing the Results of Image Texture Element Classification Method MRF and Other Method

      居民地 水田 山地 河流 灌木
      GA能量模板[5] 0.82 0.85 0.76 0.84
      BN+ANT模板[7] 1.00 0.85 0.90 1.00
      王后模板[8] 1.00 0.77 0.95 0.94 0.89
      本文MRF方法 0.86 1.00 1.00 1.00 1.00
    • 本文提出了基于马尔柯夫随机场(MRF)的图像纹理基元分类新方法。利用MRF中心像元特征值与邻近像元特征值之间的约束关系,反映图像纹理基元的特征以及不同的MRF参数。由同一类别的图像求得的MRF参数计算出的标准差最小,这一性质来进行图像纹理的分类。通过不同实验方案的对比,以及与不同分类方法的比较,证实提出的图像纹理基元分类方法具有一定的优势,是一种图像分类的好方法。

参考文献 (8)

目录

    /

    返回文章
    返回