留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于半参数平差模型的粗差定位与定值研究

潘雄 吕玉婷 汪耀 罗静 徐景田

潘雄, 吕玉婷, 汪耀, 罗静, 徐景田. 基于半参数平差模型的粗差定位与定值研究[J]. 武汉大学学报 ● 信息科学版, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493
引用本文: 潘雄, 吕玉婷, 汪耀, 罗静, 徐景田. 基于半参数平差模型的粗差定位与定值研究[J]. 武汉大学学报 ● 信息科学版, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493
PAN Xiong, LV Yuting, WANG Yao, LUO Jing, XU Jingtian. Research of the Location and Valuation of Gross Error Based on Semi-parametric Adjustment Model[J]. Geomatics and Information Science of Wuhan University, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493
Citation: PAN Xiong, LV Yuting, WANG Yao, LUO Jing, XU Jingtian. Research of the Location and Valuation of Gross Error Based on Semi-parametric Adjustment Model[J]. Geomatics and Information Science of Wuhan University, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493

基于半参数平差模型的粗差定位与定值研究

doi: 10.13203/j.whugis20140493
基金项目: 

国家自然科学基金 41374017

国家自然科学基金 11471105

国家自然科学基金 40974002

详细信息
    作者简介:

    潘雄, 博士, 教授, 主要从事数据处理与应用方面的研究。pxjlh@163.com

    通讯作者: 徐景田, 博士, 副教授。512150811@qq.com
  • 中图分类号: P207

Research of the Location and Valuation of Gross Error Based on Semi-parametric Adjustment Model

Funds: 

The National Natural Science Foundation of China 41374017

The National Natural Science Foundation of China 11471105

The National Natural Science Foundation of China 40974002

More Information
    Author Bio:

    PAN Xiong, PhD, professor, specializes in surveying data processing. E-mail: pxjlh@163.com

    Corresponding author: XU Jingtian, PhD, associate professor. E-mail: 512150811@qq.com
  • 摘要: 对于包含系统误差和粗差的观测数据,本文将混合Cook距离引入到半参数模型中,实现了粗差的定值定位。首先,构造补偿最小二乘函数,利用泰勒展式,根据均值漂移模型与删失模型的等价性,导出了观测数据中剔除第i个观测数据前后参数分量和非参数分量相应估计值之间的关系式,为粗差的定位分析奠定了基础。其次,将混合Cook距离作为诊断统计量,进行粗差定位分析,得到了参数分量和非参数分量的诊断统计量的简洁计算公式,为了提高粗差定位的准确性,给出了混合Cook距离参数 QC的一些常用形式,通过合理选择相应参数,计算参数分量和非参数分量的距离函数,实现粗差的定位,并将系统误差和粗差从观测数据中区别开来。最后通过模拟算例和实测数据验证了本文方法的正确性。
  • 图  1  四等GPS网网型简图

    Figure  1.  Fourth GPS Network Grid Diagram

    图  2  混合距离

    Figure  2.  Mixed-distance

    图  3  参数分量Cook距离

    Figure  3.  Cook Distance of Parameter

    表  1  Cook距离

    Table  1.   Cook Distance

    点号 Di Di(X)
    20 0.682 1 0.272 3
    21 0.006 2 0.002 7
    22 0.074 0 0.029 9
    23 0.004 3 0.001 3
    24 0.000 3 0.000 1
    25 0.006 5 0.001 6
    26 0.001 2 0.000 4
    27 0.004 9 0.002 2
    28 0.033 1 0.015 2
    29 0.011 7 0.004 6
    30 0.770 2 0.194 9
    31 0.001 6 0.000 2
    32 0.046 6 0.009 6
    33 0.054 4 0.017 9
    34 0.049 2 0.019 3
    35 0.182 4 0.067 8
    36 0.000 1 0.000 0
    37 0.005 7 0.000 5
    38 0.023 3 0.000 8
    39 0.000 2 0.000 1
    40 0.690 9 0.242 2
    41 0.016 20 0.006 5
    42 0.017 67 0.006 2
    43 0.004 86 0.000 9
    44 0.003 99 0.000 2
    45 0.024 93 0.002 3
    46 0.011 09 0.003 1
    47 0.016 98 0.006 6
    48 0.002 48 0.001 0
    49 0.000 0 0.000 0
    50 0.615 68 0.140 2
    51 0.023 3 0.003 7
    52 0.005 9 0.001 5
    53 0.044 8 0.017 7
    54 0.045 7 0.021 3
    55 0.008 2 0.003 7
    56 0.004 8 0.001 8
    57 0.019 2 0.004 9
    58 0.001 3 0.000 3
    59 0.008 8 0.002 9
    60 0.446 1 0.189 5
    61 0.037 7 0.017 1
    下载: 导出CSV

    表  2  混合Cook距离

    Table  2.   Mixed Cook Distance

    点号 Q=Z, C= Q=FTF, C= Q=I, C= Q=[diag(Z-1)]-1, C=
    2 0.149 7 0.128 2 0.307 8 2.369 9
    9 0.110 8 0.093 6 0.095 1 0.835 9
    20 12.268 3 0.636 4 2.547 9 24.299 2
    30 1.938 9 0.708 4 2.698 2 28.328 2
    33 0.058 7 0.049 2 0.022 3 0.177 5
    40 7.391 4 0.601 3 15.532 2 180.588 7
    44 0.004 0 0.003 2 0.004 1 0.051 8
    50 3.814 3 0.553 8 1.631 2 14.156 7
    56 0.004 8 0.004 5 0.007 2 0.073 9
    60 1.094 2 0.419 4 0.339 5 2.710 8
    65 0.008 9 0.007 8 0.007 1 0.062 3
    77 0.009 7 0.009 1 0.016 2 0.115 8
    下载: 导出CSV

    表  3  参数部分Cook距离

    Table  3.   Cook Distance of Parameters

    点号 Q=Z, C= Q=FTF, C= Q=I, C= Q=[diag(Z-1)]-1, C=
    2 0.038 7 2.164 3×10-17 0.004 2 4.824 5×10-4
    9 0.029 5 9.050 0×10-18 0.003 1 3.130 0×10-4
    20 4.897 5 1.431 2×10-16 0.558 4 0.060 2
    30 0.490 5 1.159 1×10-16 0.060 5 0.006 9
    33 0.019 4 8.691 2×10-18 0.002 2 2.308 0×10-6
    40 2.590 8 8.417 4×10-20 0.274 4 0.027 6
    44 0.001 9.537 4×10-20 1.747 9×10-5 1.991 0×10-6
    50 0.868 8 7.999 4×10-17 0.105 3 0.001 9
    56 0.001 8 1.012 1×10-18 1.981 2×10-4 2.2028×10-6
    60 0.464 9 9.344 3×10-17 0.055 4 0.006 0
    65 0.001 5 9.551 5×10-19 1.681 2×10-4 1.948 6×10-6
    下载: 导出CSV
  • [1] 孙海燕, 潘雄.正规化矩阵正定时半参数估计量的统计性质[J].测绘学报, 2004, 33(3):228-232 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB200403008.htm

    Sun Haiyan, Pan Xiong. The Statistical Property of Semiparametric Estimators with Positively Definite Regular Matrix[J]. Acta Geodaetica et Cartographica Sinica, 2004, 33(3):228-232 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB200403008.htm
    [2] Häggström J. Bandwidth Selection for Backfitting Estimation of Semiparametric Additive Models:A Simulation Study[J]. Computational Statistics and Data Analysis, 2013, 62:136-148 doi:  10.1016/j.csda.2013.01.010
    [3] 潘雄, 孙海燕.半参数p-范极大似然回归[J].测绘学报, 2005, 34(1):30-34 http://www.wenkuxiazai.com/doc/86f294d033d4b14e85246879.html

    Pan Xiong, Sun Haiyan. Semiparametric p-norm Maximum Likeli Hood Regression[J]. Acta Geodaetica et Cartographica Sinica, 2005, 34(1):30-34. http://www.wenkuxiazai.com/doc/86f294d033d4b14e85246879.html
    [4] Ruppert D, Wand M P, Caroll R J. Semiparametric Regression[M]. Cambridge:Cambridge University Press, 2003.
    [5] 潘雄.半参数模型的估计理论及应用[D].武汉:武汉大学, 2005

    Pan Xiong. Theory and Application Research in Semiparametric Model[D]. Wuhan:Wuhan University, 2005
    [6] Gui Qingming, Li Xiaolo, Gong Y. A Bayesian Unmasking Method for Locating Multiple Gross Errors Based on Posterior Probabilities of Classification Variables[J].Journal of Geodesy, 2011, 85(4):191-203 doi:  10.1007/s00190-010-0429-8
    [7] 欧吉坤.粗差的拟准检定方法(QUAD法)[J].测绘学报, 1999, 28(1):15-20 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB901.003.htm

    Ou Jikun. Quasi-accurate Detection of Gross Errors (QUAD)[J].Acta Geodaetica et Cartographica Sinica, 1999, 28(1):15-20 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB901.003.htm
    [8] 於宗俦, 李明峰.对LEGE法性质的进一步讨论及其改进搜索方法[J].武汉测绘科技大学学报, 1998, 23(3):238-243 http://www.cnki.com.cn/Article/CJFDTOTAL-WHCH803.012.htm

    Yu Zongchou, Li Mingfeng. A Further Discussion on the Nature of the LEGE Method and Its Improved Seaching Method[J]. Journal of Wuhan Technical University of Surveying and Mapping, 1998, 23(3):238-243 http://www.cnki.com.cn/Article/CJFDTOTAL-WHCH803.012.htm
    [9] 张正禄, 张松林, 罗年学, 等.多维粗差定位与定值的算法研究[J].武汉大学学报·信息科学版, 2003, 28(4):400-404 http://ch.whu.edu.cn/CN/abstract/abstract4772.shtml

    Zhang Zhenglu, Zhang Songlin, Luo Nianxue, et al. Algorithm of Simultaneous Location and Evaluation of Multi-Dimensional Gross Errors and Its Implementation[J]. Geomatics and Information Science of Wuhan University, 2003, 28(4):400-404 http://ch.whu.edu.cn/CN/abstract/abstract4772.shtml
    [10] 宋力杰, 杨元喜.均值漂移粗差探测法与LEGE的比较[J].测绘学报, 1999, 28(4):295-300 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB199904004.htm

    Song Lijie, Yang Yuanxi. Comparison Between Data Snooping and LEGE[J]. Acta Geodaetica et Cartographica Sinica, 1999, 28(4):295-300 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB199904004.htm
    [11] 王海涛, 欧吉坤, 袁运斌, 等.估计观测值粗差三种方法的等价性讨论[J].武汉大学学报·信息科学版, 2013, 38(2):162-166 http://www.cnki.com.cn/Article/CJFDTOTAL-WHCH201302009.htm

    Wang Haitao, Ou Jikun, Yuan Yunbin, et al. On Equivalence of Three Estimators for Outliers in Linear Model[J]. Geomatics and Information Science of Wuhan University, 2013, 38(2):162-166 http://www.cnki.com.cn/Article/CJFDTOTAL-WHCH201302009.htm
    [12] 朱仲义, 韦博成.半参数非线性模型的统计诊断与影响分析[J].应用数学学报, 2001, 24(4):568-581 http://www.cnki.com.cn/Article/CJFDTOTAL-YYSU200104012.htm

    Zhu Zhongyi, Wei Bocheng. Diagnostic and Influence Analysis for Semiparametric Nonlinear Model[J]. Acta Mathematicae Applicatae Sinica, 2001, 24(4):568-581 http://www.cnki.com.cn/Article/CJFDTOTAL-YYSU200104012.htm
    [13] 曾林蕊.半参数广义线性模型若干问题的研究[D].上海:华东师范大学, 2004 http://cdmd.cnki.com.cn/article/cdmd-10269-2004087225.htm

    Zeng Linrui. Some Studies on the Semiparametric Generalized Linear Model[D]. Shanghai:East China Normal University, 2004 http://cdmd.cnki.com.cn/article/cdmd-10269-2004087225.htm
    [14] Cook R D.Weisberg S. Residual and Influence in Regression[M]. New York:Chapman and Hall, 1982
  • [1] 赵祥鸿, 暴景阳, 欧阳永忠, 黄贤源, 黄辰虎, 陆秀平.  利用BP神经网络剔除多波束测深数据粗差 . 武汉大学学报 ● 信息科学版, 2019, 44(4): 518-524. doi: 10.13203/j.whugis20160336
    [2] 舒红, 史文中.  浅谈测量平差到空间数据分析的可靠性理论延伸 . 武汉大学学报 ● 信息科学版, 2018, 43(12): 1979-1985, 1993. doi: 10.13203/j.whugis20180339
    [3] 赵俊, 郭飞霄.  利用L1范数和中位数选取拟准观测值 . 武汉大学学报 ● 信息科学版, 2018, 43(8): 1242-1248. doi: 10.13203/j.whugis20160156
    [4] 岳庆兴, 高小明, 唐新明.  基于半全局优化的资源三号卫星影像DSM提取方法 . 武汉大学学报 ● 信息科学版, 2016, 41(10): 1279-1285. doi: 10.13203/j.whugis20140730
    [5] 张凯, 赵建虎, 张红梅.  一种基于M估计的水下地形抗差匹配算法 . 武汉大学学报 ● 信息科学版, 2015, 40(4): 558-562. doi: 10.13203/j.whugis20130011
    [6] 丁士俊, 姜卫平.  线性半参数模型非参数假设检验理论和方法 . 武汉大学学报 ● 信息科学版, 2014, 39(12): 1467-1471.
    [7] 赵建虎, 柯灏, 张红梅.  长期验潮站潮位观测误差的综合探测及修复方法研究 . 武汉大学学报 ● 信息科学版, 2011, 36(12): 1490-1494.
    [8] 蒋庆仙, 王成宾, 马小辉, 陈晓璧.  利用中位数进行光纤陀螺信号抗差估计 . 武汉大学学报 ● 信息科学版, 2011, 36(6): 656-659.
    [9] 王振杰, 卢秀山.  利用半参数模型分离GPS基线中的系统误差 . 武汉大学学报 ● 信息科学版, 2007, 32(4): 316-318.
    [10] 王振杰, 欧吉坤, 曲国庆, 韩保民.  L-曲线法确定半参数模型中的平滑因子 . 武汉大学学报 ● 信息科学版, 2004, 29(7): 651-653.
    [11] 孙海燕.  测量平差函数模型的若干讨论 . 武汉大学学报 ● 信息科学版, 2003, 28(S1): 62-64.
    [12] 韩保民, 欧吉坤, 柴艳菊.  用拟准检定法探测和修复GPS数据中的粗差和周跳 . 武汉大学学报 ● 信息科学版, 2002, 27(3): 246-250.
    [13] 朱庆, 李德仁.  多波束测深数据的误差分析与处理 . 武汉大学学报 ● 信息科学版, 1998, 23(1): 1-4,46.
    [14] 王新洲.  顾及模糊逻辑关系的稳健估计 . 武汉大学学报 ● 信息科学版, 1996, 21(4): 338-343.
    [15] 李明峰, 於宗俦, 李延兴, 于正林.  动态平差概括模型与假设检验 . 武汉大学学报 ● 信息科学版, 1995, 20(3): 234-239.
    [16] 王金岭, 陈永奇.  粗差数学期望平移模型的理论研究 . 武汉大学学报 ● 信息科学版, 1995, 20(2): 146-150.
    [17] 李明峰, 於宗俦, 于正林.  动态平差模型下形变与粗差的可区分性研究 . 武汉大学学报 ● 信息科学版, 1995, 20(1): 51-56.
    [18] 郑肇葆, 谭春健, 张润根.  按残差绝对值和最小原理的光束法区域网平差 . 武汉大学学报 ● 信息科学版, 1990, 15(2): 34-40.
    [19] 金新祥.  观测值残差和未知参数一次范数最小平差 . 武汉大学学报 ● 信息科学版, 1989, 14(3): 59-67.
    [20] 张方仁, 王勇.  主成份检验和粗差定位 . 武汉大学学报 ● 信息科学版, 1986, 11(4): 44-56.
  • 加载中
图(3) / 表(3)
计量
  • 文章访问数:  1081
  • HTML全文浏览量:  40
  • PDF下载量:  446
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-05-18
  • 刊出日期:  2016-11-05

基于半参数平差模型的粗差定位与定值研究

doi: 10.13203/j.whugis20140493
    基金项目:

    国家自然科学基金 41374017

    国家自然科学基金 11471105

    国家自然科学基金 40974002

    作者简介:

    潘雄, 博士, 教授, 主要从事数据处理与应用方面的研究。pxjlh@163.com

    通讯作者: 徐景田, 博士, 副教授。512150811@qq.com
  • 中图分类号: P207

摘要: 对于包含系统误差和粗差的观测数据,本文将混合Cook距离引入到半参数模型中,实现了粗差的定值定位。首先,构造补偿最小二乘函数,利用泰勒展式,根据均值漂移模型与删失模型的等价性,导出了观测数据中剔除第i个观测数据前后参数分量和非参数分量相应估计值之间的关系式,为粗差的定位分析奠定了基础。其次,将混合Cook距离作为诊断统计量,进行粗差定位分析,得到了参数分量和非参数分量的诊断统计量的简洁计算公式,为了提高粗差定位的准确性,给出了混合Cook距离参数 QC的一些常用形式,通过合理选择相应参数,计算参数分量和非参数分量的距离函数,实现粗差的定位,并将系统误差和粗差从观测数据中区别开来。最后通过模拟算例和实测数据验证了本文方法的正确性。

English Abstract

潘雄, 吕玉婷, 汪耀, 罗静, 徐景田. 基于半参数平差模型的粗差定位与定值研究[J]. 武汉大学学报 ● 信息科学版, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493
引用本文: 潘雄, 吕玉婷, 汪耀, 罗静, 徐景田. 基于半参数平差模型的粗差定位与定值研究[J]. 武汉大学学报 ● 信息科学版, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493
PAN Xiong, LV Yuting, WANG Yao, LUO Jing, XU Jingtian. Research of the Location and Valuation of Gross Error Based on Semi-parametric Adjustment Model[J]. Geomatics and Information Science of Wuhan University, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493
Citation: PAN Xiong, LV Yuting, WANG Yao, LUO Jing, XU Jingtian. Research of the Location and Valuation of Gross Error Based on Semi-parametric Adjustment Model[J]. Geomatics and Information Science of Wuhan University, 2016, 41(11): 1421-1426. doi: 10.13203/j.whugis20140493
  • 随着观测手段的不断进步,观测数据中出现粗差和系统误差的概率增大,使得参数估计的精度受到严重的影响。在观测数据包含系统误差时,半参数模型能较好地将系统误差分离出来,得到较高精度的参数估计结果[1-5],当观测数据包含粗差时,由于最小二乘平差具有配赋作用,无法简单地从平差结果中确定粗差的数量、位置和大小,因此,观测粗差的探测、识别与处理一直是测绘数据处理的重点和难点。近年来,国内外学者对粗差的处理进行了大量研究,形成了将粗差归入函数模型的均值漂移模型和将粗差归入随机模型的抗差估计方法两种主要的粗差处理形式,获得了大量的研究成果[6-11]。常用的方法有拟准检定法、抗差估计方法、数据探测法、部分最小二乘原理等, 这些研究成果有许多是在观测数据不含系统误差的情况下得到的。但在数据处理过程中,观测数据中的系统误差和粗差经常是同时存在、共同影响的,能否将系统误差和粗差同时考虑,在分离系统误差的同时也剔除粗差,得到较高精度的参数估计值,是一个值得研究的内容。

    由于半参数均值漂移模型与删失模型是等价的[12-13],因此,本文提出了基于半参数均值漂移模型的误差检测方法,利用泰勒公式详细推导了剔除某一观测值之前后参数分量和非参数分量的估计公式。然后引入混合Cook距离,得到了一些估计量的诊断统计量的计算公式,给出了参数QC的一些常用形式,通过选取不同的参数,实现多个粗差的定位,克服了Cook距离阈值无法确定的影响,得到了高精度的参数估计值,利用算例验证了相应的结论。本文的符号若无特别说明,将与文献[1]一致。

    • 设有n维观测向量L和非参数分量S组成的半参数模型[1]如下:

      (1)

      式中, L=[L1, L2, …, Ln]T为观测值向量; B=(b1, b2, …, bn)T为观测值与未知参数之间的系数; X=(X1, X2, …, Xt)Tt×1阶的未知参数向量; S=[s1, s2, …, sn]T为n×1阶的非参数分量,si表示第i个未知的系统误差; Δ为观测值的真误差,在补偿最小二乘准则下,此时,模型(1)中的参数分量和非参数分量的估计值为,相应残差为

      若第i组观测数据中包含粗差γ,按照补偿最小二乘原理, 不妨设,则有:

      (2)

      为了与包含粗差的估计值区别开来,记参数分量、非参数分量、粗差和残差的估计值分别为,由,得到粗差的估计值为:

      (3)

      由于为式(2)的极值解,则=0,将此式在()处展开得:

      (4)

      由式(2)计算得到:

      (5a)
      (5b)

      结合φ()的含义,将式(5a)化简为:

      (6)

      式中, di为第i行元素为1,其余元素为0的n维列向量,将式(5b)、式(6)代入式(4),得到参数分量和非参数分量的估计公式:

      (7a)
      (7b)

      式中, M=(P+αR)-1P,由式(7a)、式(7b)得到残差估计值为:

      (8)

      将式(8)代入式(7a)式(7b),从而得到删除第i个观测数据前后参数分量与非参数分量估计值的关系如下:

      (9)

      式中,hii为帽子矩阵H(α)的对角线元素,可以看出,若观测数据与模型拟合较好,则去掉一个点后,参数估计值不会有较大的变化,若差异明显,则判断第i个观测数据可能含有粗差,根据其位置,将式(9)代入式(3),即可得到相应粗差。

    • 为了度量删除第i个观测数据前后参数分量、非参数分量估计值之间差值的大小,实现粗差的精确定位,通常定义如下影响函数:

      (10)

      该影响函数通过计算估计值的差值,确定第i个数据点对估计值的影响程度的大小,可以实现粗差的定位。如果差值越大,说明该点对估计结果影响越大,该点就可能含有粗差。为此,Cook等[14]提出了如下距离函数:

      (11)

      其中,Q是给定的正定或半正定权矩阵;C>0为给定的尺度因子,这个距离函数即为混合Cook距离。将式(9)代入式(11),得:

      (12)

      由式(12)可知,距离D依赖于QC的选择,可以通过选择合适的QC,使得距离D具有统计意义并与点的位置无关,实现粗差的定位。

    • 由式(12)可知,Di(Q, C)的大小由三部分组成,第一部分ri2表示在第i个数据点处拟合的好坏;第二部分与单位权中误差和C的选择有关,但是与点的位置无关;第三部分与Q的选择有关。一般情况下,可以选择合适的C,使为定值,这样Di(Q, C)的随机部分只取决于ri2部分。为了度量第i个观测值的存在对参数估计值的平差结果的影响,一般用代替,此时,其中表示预测学生化残差,k为一个已知正数。

    • 通过选择合理的C值后,距离值Di(Q, C)就只与ri*2Ψi(Q)有关。因此,在合理选择相应参数后,距离值较大的点就是包含粗差的观测值。Q常用的形式如下:

      1) Q=Z

      2) Q=FTF,其中F=(B I)为模型中参数分量与非参数分量的共有系数阵。

      3) Q=I,其中I表示(n+t)×(n+t)维的单位阵。

      4) Q=[diag(Z-1)]-1

      通过选择不同的CQ,由式(12)即可得到混合距离值Di(Q, C)。类似的,由式(10)、式(11)也可得到参数分量和非参数分量的距离值,根据求得的距离值判断第i个观测值对参数和非参数估计值的影响,进一步验证粗差定位判断的正确性。

    • 用一组模拟算例和一组实际算例来验证本文提出的方法的有效性。

      算例1

      观测值L=BX+S+Δ,其中B=(bij)80×2bi, 1=sin(ti),bi, 2=(sin(3ti))2si=5(i/35)2i=1, 2, …,nti=2(i-1)π/(n-1),n=80,X=[9, 9]TΔ~N(0, 1)。为了验证粗差定位和定值的效果,现分别在第20、30、40、50、60个观测数据点处加入适当的粗差,分别为8、10、9、9、6。

      利用经典平差方法,得到参数平差值为=[0.889 8 22.021 2]T, =7.747 4。得到的参数估值远远偏离其真值,估计精度较低。

      利用补偿最小二乘法,正则化矩阵利用自然样条法,平滑参数利用GCV法得α=5.66,计算得=[9.136 8 9.081 9]T=2.612 6,参数估值与真实值基本拟合。

      为了进一步确定哪些观测数据包含粗差,应用Cook距离进行粗差定位。选择Q=ZC=,由式(10)、式(11)计算部分数据点的参数分量、非参数分量的混合Cook距离Di和参数部分Cook距离Di(X)如表 1所示。

      表 1  Cook距离

      Table 1.  Cook Distance

      点号 Di Di(X)
      20 0.682 1 0.272 3
      21 0.006 2 0.002 7
      22 0.074 0 0.029 9
      23 0.004 3 0.001 3
      24 0.000 3 0.000 1
      25 0.006 5 0.001 6
      26 0.001 2 0.000 4
      27 0.004 9 0.002 2
      28 0.033 1 0.015 2
      29 0.011 7 0.004 6
      30 0.770 2 0.194 9
      31 0.001 6 0.000 2
      32 0.046 6 0.009 6
      33 0.054 4 0.017 9
      34 0.049 2 0.019 3
      35 0.182 4 0.067 8
      36 0.000 1 0.000 0
      37 0.005 7 0.000 5
      38 0.023 3 0.000 8
      39 0.000 2 0.000 1
      40 0.690 9 0.242 2
      41 0.016 20 0.006 5
      42 0.017 67 0.006 2
      43 0.004 86 0.000 9
      44 0.003 99 0.000 2
      45 0.024 93 0.002 3
      46 0.011 09 0.003 1
      47 0.016 98 0.006 6
      48 0.002 48 0.001 0
      49 0.000 0 0.000 0
      50 0.615 68 0.140 2
      51 0.023 3 0.003 7
      52 0.005 9 0.001 5
      53 0.044 8 0.017 7
      54 0.045 7 0.021 3
      55 0.008 2 0.003 7
      56 0.004 8 0.001 8
      57 0.019 2 0.004 9
      58 0.001 3 0.000 3
      59 0.008 8 0.002 9
      60 0.446 1 0.189 5
      61 0.037 7 0.017 1

      表 1可以明显看出,在第20、30、40、50、60号点处,无论是针对参数部分、非参数部分的混合Cook距离还是针对参数部分的Cook距离,都明显大于其他点。

      QC的其他情况下得到的结果如表 23所示。为节省篇幅,只给出少数数据点在QC相应组合下的距离值,其中,表 2为混合Cook距离,表 3为参数部分Cook距离。

      表 2  混合Cook距离

      Table 2.  Mixed Cook Distance

      点号 Q=Z, C= Q=FTF, C= Q=I, C= Q=[diag(Z-1)]-1, C=
      2 0.149 7 0.128 2 0.307 8 2.369 9
      9 0.110 8 0.093 6 0.095 1 0.835 9
      20 12.268 3 0.636 4 2.547 9 24.299 2
      30 1.938 9 0.708 4 2.698 2 28.328 2
      33 0.058 7 0.049 2 0.022 3 0.177 5
      40 7.391 4 0.601 3 15.532 2 180.588 7
      44 0.004 0 0.003 2 0.004 1 0.051 8
      50 3.814 3 0.553 8 1.631 2 14.156 7
      56 0.004 8 0.004 5 0.007 2 0.073 9
      60 1.094 2 0.419 4 0.339 5 2.710 8
      65 0.008 9 0.007 8 0.007 1 0.062 3
      77 0.009 7 0.009 1 0.016 2 0.115 8

      表 3  参数部分Cook距离

      Table 3.  Cook Distance of Parameters

      点号 Q=Z, C= Q=FTF, C= Q=I, C= Q=[diag(Z-1)]-1, C=
      2 0.038 7 2.164 3×10-17 0.004 2 4.824 5×10-4
      9 0.029 5 9.050 0×10-18 0.003 1 3.130 0×10-4
      20 4.897 5 1.431 2×10-16 0.558 4 0.060 2
      30 0.490 5 1.159 1×10-16 0.060 5 0.006 9
      33 0.019 4 8.691 2×10-18 0.002 2 2.308 0×10-6
      40 2.590 8 8.417 4×10-20 0.274 4 0.027 6
      44 0.001 9.537 4×10-20 1.747 9×10-5 1.991 0×10-6
      50 0.868 8 7.999 4×10-17 0.105 3 0.001 9
      56 0.001 8 1.012 1×10-18 1.981 2×10-4 2.2028×10-6
      60 0.464 9 9.344 3×10-17 0.055 4 0.006 0
      65 0.001 5 9.551 5×10-19 1.681 2×10-4 1.948 6×10-6

      通过表 2表 3的计算结果可以看出,粗差对参数部分和全部数据的影响程度是不一样的,包含粗差的数据点的混合Cook距离与参数部分Cook距离明显大于其他点。当Q=I, C=以及Q=[diag(Z-1)]-1, C=时,其计算的混合Cook距离只探测到20、30、40、50号点含有粗差,无法定位60号点,但其参数部分Cook距离都能定位所有粗差。当选择Q=Z, C=以及Q=FTF, C=时,其计算的混合Cook距离和参数部分的Cook距离能够探测所有的粗差。通过以上多种组合计算结果可以看出,第20、30、40、50、60号点处含有粗差,经式(3)计算得到这几个点的粗差估值分别为8.036 9、9.942 4、8.737 2、9.029 7、6.343 2,与粗差真值基本相同。通过选择不同形式的QC,可以实现包含粗差的观测值定位,克服Cook距离阈值无法确定的影响。

      利用粗差定位结果及粗差估值对相应观测值进行改正,对改正后的观测数据进行重新平差,类似地,利用GCV法确定平滑因子α=2,平差后的参数估值为=[9.051 2 8.873 6]T,单位权中误差估值为=1.150 7,精度明显提高。

      算例2

      图 1为某工程四等GPS网的一部分,其中包括7个进行了三等水准联测的点,此7个GPS点的平面位置及正常高、大地高和高程异常观测数据见文献[5],根据已知数据求高程拟合函数中未知数。

      图  1  四等GPS网网型简图

      Figure 1.  Fourth GPS Network Grid Diagram

      当观测值不含粗差时,采用广义交叉核实法选择平滑因子α,得到α=0.2,求得高程拟合函数中未知数估值、系统误差估值分别为:

      若在第一个观测值(高程异常)中加入大小为7的粗差,利用GCV法,得到平滑因子α=0.000 2,此时未知参数估值与系统误差估值为:

      可见,包含粗差时,无论是参数估值还是系统误差估值都与不含粗差时相差较大。由式(10)、式(11),得到混合距离及参数分量的Cook距离如图 2图 3所示。

      图  2  混合距离

      Figure 2.  Mixed-distance

      图  3  参数分量Cook距离

      Figure 3.  Cook Distance of Parameter

      图 2可以看出,1、2号点的距离值明显大于其他点,初步认为1号点含粗差,2号点可能含有粗差,从图 3可以看出,只有第1个点对参数分量影响最大,因此,判断只有1号点包含粗差,根据式(3)可以求得粗差估计值为6.983,与粗差真实值7接近。利用粗差估计值进行粗差改正后,重新进行平差,得到的参数估计值结果为=[-21.681-6.622×10-6 3.655×10-5]T,与不含粗差时得到的结果几乎一致,根据该实例也说明本文提出的方法的有效性。

    • 1) 本文利用泰勒公式和混合Cook距离,建立了基于半参数的粗差分离模型,本文提出的理论能对多个粗差进行准确定位并求得粗差估计值,且粗差估计值与真实值相差很小。用求得的粗差估计值去修正相应的观测值,最终得到不含粗差的观测值,未弃用含有粗差的观测值,从而使得已获取的信息可以得到充分利用。

      2) 在实际过程中,系统误差和粗差是相互影响、相互依存的,有些对参数有影响,有些对非参数分量有影响,有些对两者都有影响,根据各估计值的Cook距离值的明显分群现象,通过计算各数据点对模型参数或非参数分量估计值的影响大小,作为粗差探测的条件。扩充了半参数平差模型的估计理论,为进一步提高参数估计量的精度,具有较大的理论意义和一定的实用价值;

      3) 从模拟算例可以看出,不同的Cook距离函数,对粗差的定位效果是不一样的,有些能够定位全部粗差,有些只能定位部分粗差,通过选取不同形式的QC综合考虑,能够克服Cook距离阈值的影响,实现粗差的全部定位。该方法的适应性及QC的合理选择需要进一步研究,还需进一步进行粗差对参数分量的影响性分析,进一步完善该理论。

参考文献 (14)

目录

    /

    返回文章
    返回