留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

测量数据不确定性度量的最小模糊熵算法

魏冠军 党亚民 章传银

魏冠军, 党亚民, 章传银. 测量数据不确定性度量的最小模糊熵算法[J]. 武汉大学学报 ● 信息科学版, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770
引用本文: 魏冠军, 党亚民, 章传银. 测量数据不确定性度量的最小模糊熵算法[J]. 武汉大学学报 ● 信息科学版, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770
WEI Guanjun, DANG Yamin, ZHANG Chuanyin. Using Minimum Fuzzy Entropy Algorithm to Measure Uncertainty of Geodetic Data[J]. Geomatics and Information Science of Wuhan University, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770
Citation: WEI Guanjun, DANG Yamin, ZHANG Chuanyin. Using Minimum Fuzzy Entropy Algorithm to Measure Uncertainty of Geodetic Data[J]. Geomatics and Information Science of Wuhan University, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770

测量数据不确定性度量的最小模糊熵算法

doi: 10.13203/j.whugis20140770
基金项目: 

国家自然科学基金 41201004,41364001

甘肃省自然科学基金 1508RJZA065

兰州交通大学科技支撑计划 ZC2014002

2014甘肃省高等学校科研项目 2014B-040

详细信息
    作者简介:

    魏冠军, 博士, 副教授。主要从事测量数据处理的理论与算法研究。E-mail:wchampion@sina.com

    通讯作者: 党亚民, 博士, 研究员。E-mail:dangym@casm.ac.cn
  • 中图分类号: P207

Using Minimum Fuzzy Entropy Algorithm to Measure Uncertainty of Geodetic Data

Funds: Foundation of Gansu Province,No. 1508RJZA065; Science and Technology Support Program of Lanzhou Jiaotong University,No.ZC2014002; Higher Education Research Project of Gansu Province,No.2014B-040
More Information
    Author Bio:

    WEI Guanjun,PhD,associate professor,specializes in geodetic data processing.E-mail:wchampion@sina.com

    Corresponding author: DANG Yamin,PhD,professor.E-mail:dangym@casm.ac.cn
图(3) / 表(3)
计量
  • 文章访问数:  1103
  • HTML全文浏览量:  37
  • PDF下载量:  292
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-09-07
  • 刊出日期:  2016-12-05

测量数据不确定性度量的最小模糊熵算法

doi: 10.13203/j.whugis20140770
    基金项目:

    国家自然科学基金 41201004,41364001

    甘肃省自然科学基金 1508RJZA065

    兰州交通大学科技支撑计划 ZC2014002

    2014甘肃省高等学校科研项目 2014B-040

    作者简介:

    魏冠军, 博士, 副教授。主要从事测量数据处理的理论与算法研究。E-mail:wchampion@sina.com

    通讯作者: 党亚民, 博士, 研究员。E-mail:dangym@casm.ac.cn
  • 中图分类号: P207

摘要: 测量数据的质量及可靠性取决于测量数据不确定性的大小。从如何评价测量数据的不确定性入手,以测量不确定度理论与模糊数学为基础,构建以测量不确定度为未知参数的测量数据不确定性评价的函数模型,提出“模糊熵测度”作为函数模型求解的最优准则并建立相应的算法,应用高程监测网数据进行解算并与最小二乘估计结果进行比较,结果证明了该方法的可行性。

English Abstract

魏冠军, 党亚民, 章传银. 测量数据不确定性度量的最小模糊熵算法[J]. 武汉大学学报 ● 信息科学版, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770
引用本文: 魏冠军, 党亚民, 章传银. 测量数据不确定性度量的最小模糊熵算法[J]. 武汉大学学报 ● 信息科学版, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770
WEI Guanjun, DANG Yamin, ZHANG Chuanyin. Using Minimum Fuzzy Entropy Algorithm to Measure Uncertainty of Geodetic Data[J]. Geomatics and Information Science of Wuhan University, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770
Citation: WEI Guanjun, DANG Yamin, ZHANG Chuanyin. Using Minimum Fuzzy Entropy Algorithm to Measure Uncertainty of Geodetic Data[J]. Geomatics and Information Science of Wuhan University, 2016, 41(12): 1677-1682. doi: 10.13203/j.whugis20140770
  • 测量数据质量及可靠性取决于测量数据不确定性的大小。经典的测量平差理论是基于“观测值的不确定性就是随机性”的假设。Helmert、Tienstra、Baarda等学者将测量数据的不确定性分为偶然误差、系统误差和粗差三种类型[1]。标准差(σ)在一定程度上反映了随机不确定性,也是以2σ或3σ作为观测限差的理论基础[2]。随着测量数据获取手段的更新,异常值、有色噪声、不完备信息等新的误差不断产生,测量数据的不确定性并非仅由随机误差组成,而是多种不确定性因素的综合影响,既有可以数值化的不确定性因素(误差、噪声),也有无法数值化、参数化的不确定性因素[3]。1993年国际标准化组织(International organization for Standardization,ISO)等7个组织引入“测量不确定度”概念,公布了《Guide to the Expression of Uncertainty in Measurement》[4]。测量不确定度是对测量结果不确定性的定量表征,决定了测量结果质量及可靠性。文献[5, 6]基于模糊数学,建立以不确定度作为参数的测量数据质量评价模型;文献[7-11]从不同的角度对测量不确定度理论进行研究。随着测量数据不确定性研究的深入,文献[12-16]将熵理论应用到空间数据不确定性研究之中,信息熵作为信源平均不确定性的度量指标,具有不受置信概率选取时的主观因素影响的优点,还可以简化某些不确定性问题的数学处理方法。 但已有研究大多关注测量数据的随机性,而测量数据的不确定性是随机性、模糊性及不完备性等多种因素的综合。针对此, 本文在前人研究的基础上,运用信息熵、测量不确定度及现代优化算法等理论和方法来构建测量数据不确定性度量的模糊熵算法,并开展应用实例计算及对比分析。

    • 观测量的真值(设为Ym)总是客观、唯一存在的,设测量值为yi(i=1,2,…,n),若定义精确集合:A={Ym},则测量值yi和集合A可由特征函数GA(y)来刻画:

      (1)

      式(1) 表明,观测值要么属于集合A,要么不属于集合A。

      由于误差、认识水平等原因,把任何一个测量值判断为真值或者非真值都非常不现实。根据模糊理论,可以把观测值yi(i=1,2,…,n)处理成其真值的一个模糊集,模糊集可根据隶属函数唯一定义:

      (2)

      测量值yi(i=1,2,…,n)与模糊集$\tilde{A}$的关系可通过隶属函数$\mu \tilde{A}$(y)来描述[17],$\mu \tilde{A}$(y)作为测量值yi(i=1,2,…,n)与真值的隶属度,把“观测值yi(i=1,2,…,n)是其真值的可能性”用模糊分布μy来表示。如图 1所示,模糊集的隶属函数可用左L(·)、右R(·)参照函数表示。

      (3)

      式中,Ym表示真值;r为核半经;clcr表示单调参照函数的参数;cl+cr的值定量描述了真值的不确定性区间。

      图  1  隶属函数与α-截集

      Figure 1.  Membership Function and Its α-cut

      若取α∈[0,1],α为置信水平,用α表示α-截集下的模糊集,如图 1所示。若α,r表示模糊区间半径(即一定置信水平下不确定区间的半宽),则有:

      (4)

      (5)

      考虑到观测值yi(i=1,2,…,n)在其真值Ym两侧出现的可能性相等,以真值为中心,则观测值是对称模糊数,若用I=(Ym,δ)L表示对称模糊数I,其隶属函数可表示为:

      (6)

      式中,L(z)为参照函数;z=y-YmδyYm为观测值的真值;δy为模糊幅度,描述观测值波动范围。

      测量不确定度用于表征合理地赋予被测量值的分散性,在测量结果中用来说明测量值变化范围的参数;当观测值用式(6) 的对称模糊数表示时,模糊幅度δy是描述观测值变化范围的参数。因此,文献[18]提出用模糊幅度来衡量测量结果的不确定度,测量数据的不确定性越大,其模糊幅度也就越大。

    • 在经典平差或近代平差中,一般均采用高斯-马尔柯夫模型(G-M模型)来进行测量数据处理,对于该模型的解算,一般采用MA、MV、LS、Bayes或L估计,这些方法主要根据含有随机误差的观测值来确定未知参数的最佳估值[19]。由于观测量子样容量限制,不完全符合概率统计理论,而是有一定的模糊性(式(6) )。当观测向量Y和未知参数向量X均为模糊数时,G-M模型为:

      (7)

      式中,A为n×t设计矩阵,

      X=(x1 x2 … xt)T=(($\hat{x}$1,c1)L ($\hat{x}$2,c2)L … ($\hat{x}$t,ct)L)T; Y=(y1y2yt)T=((${\hat{y}}$1,δy1)L (${\hat{y}}$2,δy2)L … (${\hat{y}}$t,δyt)L)T,其中${\hat{y}}$iδyi分别表示观测值的真值及其测量不确定度;${\hat{x}}$ici分别表示参数的真值及其测量不确定度。

    • 为了估计式(7) 中的未知参数向量X,必须事先确定最优估计准则。从信息论的角度分析,信息熵是信源不确定性的唯一度量,模糊熵测度是模糊集合理论中度量模糊子集不确定性的测度之一。第一个与概率无关,能正确地描述模糊集模糊程度的信息量是文献[20]提出的模糊熵eLT(A),即

      (8)

      对每一个观测值而言,观测值yi越接近真值${\hat{y}}$i,“yi是${\hat{y}}$i”的可能性越大,其模糊隶属度$\mu \tilde{A}$(yi)增大(图 2) ,模糊性减少,相应的模糊熵减少。当所有观测值最接于真值时,即n个“yi是${\hat{y}}$i”的可能性都达到最大时,模糊隶属度达到最大,模糊不确定程度就最小,所对应的模糊熵最小,即模糊熵最小。

      图  2  观测值的三角模糊数

      Figure 2.  Triangular Fuzzy Number Observed Value

      若取k=1,由式(8) 可得到最小模糊熵准则:

      (9)

      对于${\hat{y}}$i、μ${\hat{y}}$i(yi)及δyi的计算,根据式(7) ,由对称模糊数的运算性质可得:

      (10)

      根据式(6) 与式(10) ,每一个观测值yi对于其对称中心(真值)${\hat{y}}$i的隶属度为:

      (11)
    • 根据式(9) 的模糊熵准则,对以模糊数表示的G-M模型式(7) 进行求解时,还应满足两个条件: ① δyi>0,i=1,2,…n,即测量不确定度恒为正值; ② viδyi,即观测值的改正数v的绝对值应小于等于该观测值的不确定度δyi。在实际计算中,结合式(10) ,观测数改正数的计算采用 :

      (12)

      综上所述,测量数据不确定性评估的最小模糊熵估计(least fuzzy entropy estimation,LFEE)如式(13) 所示:

      (13)

      在式(13) 中,将未知参数X和观测值的测量不确定度δyi均视为参数一并求解,该模型的参数估计可以转换为非线性规划问题进行求解。

      从式(13) 可以看出,最小模糊熵估计随观测值隶属函数μ${\hat{y}}$i(yi)的不同而不同。因此,最小模糊熵估计不是一个估计,而是一类估计。对于不同的参照函数,根据式(11) ,可以计算出观测值的隶属函数不同,观测值的三角模糊隶属数为:

      (14)

      观测值的抛物线模糊隶属数为:

      (15)

      观测值的高斯模糊隶属数为:

      (16)

      如果将观测值的不同隶属函数(式(14) 、式(15) 、式(16) )代入最小模糊熵估计(式(13) ),得到基于三角模糊数的最小模糊熵估计:

      (17)

      基于抛物线模糊数的最小模糊熵估计:

      (18)

      基于高斯模糊数的最小模糊熵估计:

      (19)
    • 为验证本文提出的最小模糊熵估计应用于测量数据不确定性评估的可行性,以文献[21]中的某高程监测网数据为例,A、B、C、D为基准点(图 3) ,其高程分别为41.431 m、38.744 m、58.732 m、62.160 m,BM1、BM2、BM3为工作基点,各测段水准路线的长度及某期的高差观测值均列于表 1

      图  3  高程监测网

      Figure 3.  Elevation Monitoring Network

      表 1  高差观测值

      Table 1.  Elevation Difference Observations

      水准路线长度L/km高差观测值h/m
      Z1 2.04 +13.019
      Z2 1.88 +3.092
      Z3 2.30 +2.175
      Z4 1.95 -6.949
      Z5 1.61 +7.251
      Z6 2.32 +5.255
      Z7 1.71 -8.238

      设待定点HBM1HBM2HBM3的高程为未知参数${\hat{x}}$1、${\hat{x}}$2,${\hat{x}}$3、,用${\hat{y}}$i表示高差观测值hi的真值(i=1,2,…,7) ,将未知参数和观测值均看成对称的模糊数,根据水准测量原理建立如G-M模型:

      (20)

      根据式(10) ,有式(21) 、式(22) 成立,即

      (21)

      (22)

      对式(20) 建立的G-M模型,待定点的高程${\hat{x}}$i和高差观测值的不确定度δyi均视作未知参数,总共10个参数,分别按基于不同模糊数的最小模糊熵估计公式(式(17) ~(19) ),利用遗传算法进行优化计算,计算结果分别见表 2表 3

      通过比较,从表 2可以看出,参数的最小模糊熵估计结果与最小二乘估计结果基本一致,特别是基于高斯模糊数的最小模糊熵估计与最小二乘估计结果最为接近;从表 3计算的观测值不确定性度量方面来看,最小二乘估计采用3σ计算的结果均高于30 mm,而最小模糊熵估计计算的结果有大有小,更符合观测值的随机波动规律。

      表 2  不同参数估计方法的结果比较

      Table 2.  Comparison Results of Different Estimation Methods

      参数最小二乘估计(LSE)/m 最小模糊熵估计(LFEE)/mLFEE与LSE参数估计之差/mm
      三角抛物线高斯三角抛物线高斯
      X151.769 1 51.773 4 51.767 9 51.765 3 4.3 -1.2 -3.8
      X2 48.679 1 48.682 1 48.680 3 48.679 1 3.0 1.2 0
      X3 53.932 2 53.926 3 53.935 7 53.932 2 -5.9 3.5 0

      表 3  两种估计方法计算的观测量平差值结果比较

      Table 3.  Comparison of Different Methods of Estimation Results

      观测量 观测值的平差值/m观测值的不确定性/mm
      最小二乘估计 最小模糊熵估计 中误差(3σ) 测量不确定度/mm
      三角抛物线高斯 三角抛物线高斯
      h1 13.025 1 13.029 4 13.023 9 13.021 3 33.7 48.8 42.0 19.7
      h2 3.090 0 3.091 3 3.087 6 3.084 1 32.4 23.3 39.1 26.3
      h3 2.163 1 2.152 9 2.167 8 2.166 9 36.0 22.1 38.8 46.4
      h3 -6.963 0 -6.958 6 -6.964 1 -6.966 7 33.1 47.4 43.8 47.4
      h5 7.248 1 7.251 1 7.249 3 7.250 2 30.1 32.2 38.2 10.6
      h6 5.253 1 5.244 2 5.255 4 5.251 0 36.0 46.2 39.1 31.6
      h7 -8.227 8 -8.233 7 -8.224 3 -8.227 8 31.0 37.9 43.3 30.7
    • 本文以如何评价测量数据的不确定性为突破口,以测量不确定度理论和模糊数学为基础,提出了最小模糊熵估计理论。该估计是以“测量不确定度”为指标对测量数据不确定性进行直接评估的新的估计类,未知参数和观测值的测量不确定度作为参数同时进行估计,较为完整地实现了观测数据不确定性建模及数据质量评定的问题。本文研究工作仅仅是初步,关于模糊数的选择、不同精度的观测数据定权以及参数的不确定性等问题还需要进一步的深入研究。

参考文献 (21)

目录

    /

    返回文章
    返回