-
摘要: 当线性回归模型的设计矩阵病态时,最小二乘(least square,LS)估值方差大且不稳定,已不是一种优良估计。为了减弱病态性,许多有偏估计法如岭估计、主成分估计、Liu估计等被提出。基于Liu估计,引入迭代的思想,提出了一种新的有偏估计法—迭代估计法。借助对称正定矩阵的谱分解,将迭代公式转化为便于解算的解析表达式,并证明迭代公式在修正因子d∈[-1,1]是收敛的。基于Liu估计中修正因子d的确定方法,在均方误差最小的情况下给出最优修正因子d的确定公式。最后,分别利用LS估计、岭估计、Liu估计和提出的迭代估计对两个算例进行计算并给出实验结果。在第一个算例中,对观测向量添加不同的扰动,结果表明迭代估计法具有更强的抗干扰能力;第二个算例的结果表明,迭代估计法所得结果更接近于真值,即迭代估计法在均方误差意义下优于LS估计、岭估计和Liu估计。Abstract: In the presence of the design matrix's collinearity (which is equivalent to ill-conditioning) in the linear regression model, the least squares (LS) estimator has large variances and its solution is rather unstable, so the LS estimator is not the precise estimation any more. In order to weaken the ill-conditioning, many biased estimator methods are introduced, such as ridge estimator, the principal components estimator, the Liuestimator and so on. In this paper, based on the famous Liuestimator, we present a new biased estimator which is called a biased iterative estimator method. With the aid of spectral decomposition of the symmetric and positive matrix, the iterative formula is converted to a simple analytical expression conveniently for calculating. And the iterative formula is proved to be convergent in the condition of modified parameterd∈[-1, 1]. Following the deter mination method of modified parameter in the Liuestimator, we give a formula of the optimal modified parameter to minimize the mean squared error (MSE). Finally, we use the proposed biased iterative estimator, LS estimator, ridge estimator and the Liuestimator to calculate two numerical examples and give their experimental results. In the first example, we respectively add different perturbations to the observation vector. The simulation results show that compared with other three methods, the biased iterative estimator is more stable under the perturbation. Comparison results of the second example show that our new biased iterative estimator is more closed to the real value, that is superior, in the mean squared error sense, to the LS estimator, ridge estimator and the Liuestimator.
-
Keywords:
- multicollinearity /
- condition number /
- Liu estimator /
- ridge estimator /
- mean squared error
-
海洋面积占全球总面积约71%,确定精细的海底地形图对海洋资源开采、水下导航、海底构造运动和海洋环流等研究具有重要意义。船载声呐探测技术是目前获取深海海底地形的主要手段。然而,该方法成本高、耗时长。有学者估计,要完成全球深海的船载测深工作大约需要200年,且耗资数十亿美元[1]。随着卫星测高技术的发展,通过其海面高数据反演的海洋重力场已具有较高的分辨率和精度,且能实现全球海域的均匀覆盖。当前,卫星测高海面重力异常的解算精度已达2~3 mGal[2]。海底洋壳与海水层间存在密度差,海底地形变化势必引起海洋重力场的扰动。因此,若能构建出海面重力异常和海底地形间的数学关系,就能实现海底地形的反演。目前已有许多海底地形反演方法被提出,主要包括线性回归法[3]、导纳函数法[4]、最小二乘配置法[5]、重力地质法(gravity-geologic method,GGM)[6-12]和模拟退火法[13]等。其中,GGM简单高效,能够满足大范围水深反演的需要[12]。
GGM起初可以通过观测重力异常和少量钻孔资料预测沉积基底深度[14]。由于沉积层密度的垂向变化较大,其效果欠佳。受益于海底洋壳与海水层的密度差几乎不随深度变化,GGM被广泛用于海底地形反演[6-7, 15]。GGM通过船测水深控制点从观测重力异常中分离长波重力异常和短波重力异常,并利用短波重力异常反演海底地形。许多学者对GGM中密度差的确定和长波重力异常的构建进行了相关研究。文献[7]采用迭代法确定密度差的经验值;文献[8]提出确定密度差的向下延拓法;文献[9]采用改进的重力地质方法(improved gravity-geologic method,iGGM)来逼近长波重力异常,有效改善了由不均匀控制点构建长波重力异常的精度;文献[16]将iGGM法应用于几内亚湾海底地形绘制,取得了较好效果,并指出对于山区反演,应采用更多的船测点及不同的最佳密度差;文献[10]考虑地形因素的影响,提出了一种基于普通克里金的地形约束因子权重优化方法来构建区域重力异常。
短波重力异常是除密度差和长波重力异常外影响GGM反演质量的另一重要因素。传统GGM使用布格板公式计算由海底地形起伏引起的短波重力异常,这是一种线性近似处理,势必会造成信息的遗漏[4]。文献[17]提出在计算短波重力异常时顾及局部地形改正,大大提高了海底地形的反演精度;文献[11]在构造短波重力异常时,采用三维直角棱柱代替布格板公式,并在西菲律宾盆地验证其方法的有效性。上述研究采用空间域积分解算地形重力效应,计算效率低,在一定程度上与GGM计算速度快且适用于大范围海域等优点相悖。此外,传统GGM利用短波重力异常恢复海底地形时,同样基于布格板公式解算,仅能恢复海底地形的线性信息。
基于上述问题,本文提出了一种改进的GGM,利用频率域重力正演和迭代反演方法恢复海底地形的非线性项,选择中国南海作为研究区,构建空间分辨率为1'×1'海底地形模型,并详细分析了影响模型精度的各种因素。
1 原理与方法
1.1 传统GGM原理
海面观测重力异常可看作两部分之和,由海底地形起伏引起的短波重力异常和由深部密度不均引起的长波重力异常,其表达式为:
$$ {g}_{\mathrm{o}\mathrm{b}\mathrm{s}}\left(i\right)={g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(i\right)+{g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}}\left(i\right) $$ (1) 式中,$ i $表示对应于观测重力异常格网点的位置;$ {g}_{\mathrm{o}\mathrm{b}\mathrm{s}} $、$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}} $和$ {g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}} $分别表示观测重力异常、短波重力异常和长波重力异常。
已知水深控制点处的$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right) $可以通过布格板公式近似计算,计算式为:
$$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right)=2\mathrm{\pi }G\Delta \rho \left(E\left(j\right)-D\right) $$ (2) 式中,$ G $是万有引力常量;$ j $表示已知水深控制点的位置;$ E\left(j\right) $为已知控制点水深;$ D $为参考深度,通常取测深点的最大深度;$ \Delta \rho $为海底洋壳与海水间的密度差。由式(1)和式(2)可得:
$$ {g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}}\left(j\right)={g}_{\mathrm{o}\mathrm{b}\mathrm{s}}\left(j\right)-{g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right) $$ (3) 式中,$ {g}_{\mathrm{o}\mathrm{b}\mathrm{s}}\left(j\right) $为控制点处的观测重力异常,可由实际观测重力异常数据插值得到;$ {g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}}\left(j\right) $为控制点处的长波重力异常,经格网化处理后可获得任意格网点上的长波重力异常$ {g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}}\left(i\right) $;根据式(1)可计算出格网点上的$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(i\right) $,应用布格板公式将$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(i\right) $转换为海底地形起伏,再添加参考深度,可获得水深格网模型$ E\left(i\right) $:
$$ E\left(i\right)=\frac{{g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(i\right)}{2\mathrm{\pi }G\Delta \rho }+D $$ (4) 在GGM计算过程中,共涉及$ \Delta \rho $和$ D $两个参数。其中,反演结果几乎不受$ D $取值的影响,但对$ \Delta \rho $的变化十分敏感。$ \Delta \rho $的理论值为1.67 g/cm3,等于海底基岩密度2.70 g/cm3与海水密度1.03 g/cm3之差[6]。大量实践表明,GGM中$ \Delta \rho $通常远偏离于理论值,因而不具备实际物理意义,仅为经验参数[7-8, 12]。常用的$ \Delta \rho $确定方法主要有向下延拓法和迭代法[7-8]。本文采用迭代法,按一定的步长改变$ \Delta \rho $,并反演对应的水深模型。通过计算反演模型与船测水深值间的相关系数及标准差(standard deviation,STD),选取最小STD及最大相关系数对应的$ \Delta \rho $为最优密度差。
1.2 短波重力异常计算
观测重力异常的精度、水深控制点分布、所采用的插值/格网化方法、海底地形起伏状况等因素均会影响GGM的模型构建精度。传统GGM通常在平坦地形区具有较高的精度,而在复杂地形区精度较低。该现象一定程度上归咎于传统GGM仅考虑海底地形的线性项,而忽略非线性项。在式(2)中,若设定$ D=0 $,则$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right) $与海底地形间通过布格板项$ 2\mathrm{\pi }G\Delta \rho E\left(j\right) $表示为一一对应的线性关系,而实际上海面重力异常与海底地形间应为非线性关系[11]。文献[17]将$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right) $表示为局部地形改正项$ \mathtt{δ}{g}_{\mathrm{T}\mathrm{C}} $和布格板项之和,计算式为:
$$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right)=2\mathrm{\pi }G\Delta \rho E\left(j\right)+\mathtt{δ}{g}_{\mathrm{T}\mathrm{C}} $$ (5) 传统GGM仅考虑式(5)中的线性部分,而忽略非线性项$ \mathtt{δ}{g}_{\mathrm{T}\mathrm{C}} $。这在平坦地形区是可行的,然而在复杂地形区,忽略非线性项会引入系统误差,从而降低反演精度[17]。$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right) $除了按式(5)表示外,亦可直接表示为:
$$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right)=\Delta g\left(x, y, z, E, \Delta \rho \right) $$ (6) 式中,$ (x, y, z) $为计算点三维坐标;$ E $为海底深度。
为了兼顾精度与计算效率,本文采用文献[18]的Parker公式计算短波重力异常,公式为:
$$ F\left(\Delta g\right(i\left)\right)=2\mathrm{\pi }G\Delta \rho {\mathrm{e}}^{-\left|\overrightarrow{k}\right|d}\sum\limits_{n=1}^{{\infty }}\frac{{\left|\overrightarrow{k}\right|}^{n-1}}{n!}F\left({E}^{n}\right(i\left)\right) $$ (7) 式中,$ F $表示二维傅里叶变换;$ \overrightarrow{k} $为圆波数;$ \Delta g\left(i\right) $为海底地形产生的重力异常;$ d $是海底地形的平均深度;$ n $是级数展开阶数。
该方法可借助快速傅里叶变换(fast Fourier transform,FFT)技术在频率域中解算,因而十分高效。式(7)仅能计算与$ i $位置对应的格网点重力值,无法直接计算离散控制点$ j $处的重力值。为此,本文按1'的格网分辨率计算落入同一格网单元内控制点的平均值,以此作为新的控制点。新控制点位置$ j\in i $,从而可从$ \Delta g\left(i\right) $中直接提取$ \Delta g\left(j\right) $,即为控制点上的$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right) $。
1.3 海底地形反演
传统GGM利用式(5)反演海底地形时,同样未顾及非线性项,仅利用布格板公式将短波重力异常转换为水深值。尽管经由一系列处理得到的短波重力异常与海底地形间存在强线性关系,但其非线性部分仍具有一定贡献[4, 13, 19]。本文采用一种迭代技术来恢复海底地形的非线性项,计算式为:
$$ {E}^{k}={E}^{k-1}+\frac{\Delta {g}_{\mathrm{r}\mathrm{e}\mathrm{s}}\left({E}^{k-1}\right)}{2\mathrm{\pi }G\Delta \rho } $$ (8) $$ \Delta {g}_{\mathrm{r}\mathrm{e}\mathrm{s}}\left({E}^{k-1}\right)={g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}-{g}_{\mathrm{c}\mathrm{a}\mathrm{l}}\left({E}^{k-1}\right) $$ (9) 式中,$ k=\mathrm{1, 2}, \dots , N $为迭代次数;$ {E}^{k} $为第$ k $次迭代解算的海底地形模型,$ {E}^{0} $由式(4)计算获得;$ \Delta {g}_{\mathrm{r}\mathrm{e}\mathrm{s}} $表示残余重力异常;$ {g}_{\mathrm{c}\mathrm{a}\mathrm{l}} $表示海底地形模型正演重力异常,由式(7)计算。
上述方法利用迭代线性缩放来估计非线性项,计算简单,无需大规模矩阵运算。迭代停止条件可设定为$ \Delta {g}_{\mathrm{r}\mathrm{e}\mathrm{s}} $的均方根(root mean square,RMS)小于海面重力异常观测精度或进行了若干次迭代。决定式(8)能否准确收敛的关键是重力正演计算的精度[20]。
综上所述,本文所提的改进GGM计算步骤如下:
1)将离散的船测水深控制点按1'格网分辨率,通过块平均值操作生成新的控制点。
2)新控制点格网化或采用现有模型填充,生成初始海底地形模型。
3)利用式(7)和初始模型正演控制点处的短波重力异常$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(j\right) $。
4)将观测重力异常插值到控制点上获得$ {g}_{\mathrm{o}\mathrm{b}\mathrm{s}}\left(j\right) $,并根据式(3)计算控制点上的长波重力异常$ {g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}}\left(j\right) $。
5)控制点$ {g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}}\left(j\right) $格网化生成长波重力异常格网$ {g}_{\mathrm{l}\mathrm{o}\mathrm{n}\mathrm{g}}\left(i\right) $,并从观测重力异常中扣除,从而获得短波重力异常格网$ {g}_{\mathrm{s}\mathrm{h}\mathrm{o}\mathrm{r}\mathrm{t}}\left(i\right) $。
6)利用式(8)迭代估计海底地形模型$ {E}^{k}\left(i\right) $。
2 数值实验与分析
2.1 实验数据
本文选择中国南海112°E~119°E、12°N~20°N范围为研究区,为避免频率域计算的边缘效应,研究区沿四周外扩5'。实验使用的数据包括:
1)海底地形模型。SRTM15+V2.4为美国斯克里普斯海洋研究所(Scripps Institution of Oceanography,SIO)发布的15″分辨率全球水深地形模型,在本文中用于船测水深数据的粗差剔除[21]。SIO V23.1为SIO发布的全球海底地形模型,空间分辨率1'[3]。ETOPO1为美国国家地球物理数据中心(National Geophysical Data Center,NGDC)在2008年发布的1'全球地形模型[22]。上述模型已被广泛使用,其精度反映了当前海底地形反演技术水平,在本文中用于验证反演方法的有效性。
2)船测水深数据。由NGDC提供研究区内合计136 028个测深点。由于船测水深数据时间跨度大,观测质量参差不齐,因而存在较多粗差数据。本文以SRTM15+V2.4模型为基础,将模型水深插值到船测点上,并剔除两者差异大于两倍中误差的数据点。共剔除粗差点4 531个,保留数据点131 497个,数据剔除率3.33%。考虑到同一测线上船测水深的相关性,若按随机或每隔3个控制点选一个检核点的方法,可能导致插值模型的检核精度虚高。本文以SO49和V3604两条航迹线上的测深点作为检核点,其余数据作为控制点。研究区船测点分布见图 1,其中黑色线为控制点,共105 512个,红色线为检核点,共25 985个,检核点与控制点数量比例约为1∶4,背景水深为SRTM15+V2.4模型。
3)测高重力异常数据。采用SIO最新发布的1'空间分辨率海面重力异常模型grav_31.1,如图 2所示。
2.2 密度差确定
图 3是采用不同密度差获取的GGM反演结果与检核点水深差异的STD和相关系数。根据图 3(a),传统GGM反演结果与检核点水深较差的最小STD及最大相关系数对应的$ \Delta \rho =0.9\mathrm{ }\mathrm{g}/\mathrm{c}{\mathrm{m}}^{3} $,后文涉及传统GGM的计算均使用该密度差。根据图 3(b),改进GGM确定的最优$ \Delta \rho =1.1\mathrm{ }\mathrm{g}/\mathrm{c}{\mathrm{m}}^{3} $。对比图 3(a)、图 3(b)可知,两种方法对应的最优密度差略有差异,原因在于两种方法处理海底地形和重力间的关系时采用不同的假设。
2.3 海底地形反演
在GGM反演过程中,所构建的短波重力异常精度直接影响最终模型的精度。因此,定量分析海底地形非线性项对短波重力异常的贡献尤为重要。首先,将图 1所示的离散水深控制点在$ 1{'}\times 1{'} $的格网中求平均值,获得新的控制点。然后,利用GMT的surface模块,采用0.55张力的样条函数将新控制点格网化获得整个研究区的海底地形模型[23],下文称为SG模型,如图 4所示。由图 4可以看出,控制点直接网格化结果能反映研究区整体的地形变化,但在西北部大陆架和中沙群岛等地,由于船测数据稀缺,其地形十分粗糙且存在明显错误。
考虑到船测资料分布不均,本文采用SIO V23.1模型填充除控制点以外的格网值来构建初始模型,用于评估海底地形非线性项。图 5为利用布格板公式、Parker公式(式(7)中$ n=4 $[4],$ d=3\mathrm{ }164 $ m)正演初始模型获得的海面重力异常及二者差异。由图 5(a)、5(b)可以看出,受局部地形的影响,Parker公式计算结果相比布格板公式更为平滑。由图 5(c)可以看出,在平坦地区,非线性项影响接近于零,而在诸如海山链、岛屿和海盆边缘,非线性项的影响最高超过50 mGal。
在获得控制点处的短波重力异常之后,首先采用三次卷积算法将测高重力异常格网插值到控制点上,计算控制点上的长波重力异常;然后,利用带张力的样条函数将长波重力异常格网化;最后,将测高重力异常格网减去长波重力异常格网获得用于海底地形反演的短波重力异常格网。进一步利用短波重力异常反演海底地形,采用改进GGM迭代反演过程如图 6所示。图 6(a)、6(b)和6(c)分别为初始模型、第一次迭代后和第二次迭代后的重力异常残差,计算其RMS分别为4.19 mGal、1.42 mGal和0.78 mGal。对应的深度残差分别如图 6(d)、6(e)和6(f)所示,计算其RMS分别为90.9 m、30.8 m和16.9 m。
由图 6(a)可知,仅考虑线性项会产生最大为40 mGal的重力残差,对应最大为1 000 m的深度残差(图 6(d))。第二次迭代后(图 6(b)),重力残差及深度残差均显著降低,重力残差RMS降至1.42 mGal,已低于测高重力异常的精度水平(2~3 mGal),反演模型与检核点间的RMS下降(图 6(g))。进一步迭代后(图 6(c)),虽然重力残差及深度残差仍在降低,最大深度残差降至100 m以下,但模型反演精度不降反升(图 6(g))。说明经过两次迭代后,重力残差已降至观测精度以下,在随后的迭代中,更多是将重力观测值噪声直接转化为水深,因而模型精度降低。综上所述,以重力观测值的精度水平作为迭代收敛条件较为合理。
由图 5可知,在利用Parker公式计算短波重力异常时,受周围地形引力的影响,控制点处的高频信息被平滑。为恢复控制点水深,计算反演模型与控制点水深的残差并将其格网化,再重新添加到重力反演模型中得到最终模型。为方便论述,后续将传统GGM反演结果称为GGM1模型,将改进GGM反演结果称为GGM2模型。
4种海底地形模型如图 7所示。由图 7可以看出,4种海底地形模型的整体趋势相同,南海海盆内除中部海山链外,以海底平原为主,地形平缓,水深在3 500~5 000 m。西北大陆架及中沙群岛附近的区域,地貌复杂,地形坡度大,水深在0~3 000 m范围内变化。对比ETOPO1模型及其他模型可以看出,ETOPO1模型的精细程度明显低于其他模型。GGM1模型与GGM2模型在形态上无明显区别,在研究区西部及西北部(113°E,17°N)附近,GGM类模型的精细程度不如SIO V23.1模型,主要原因是此处的船测水深数据分布稀疏。
图 8为GGM2模型与其他模型的差异。由图 8(a)、图 7(a)和7(d)可以看出,GGM2模型与ETOPO1存在明显差异,主要位于海山链、岛屿群和地形变化梯度带上,其主要源于GGM2模型精细度的提高。由图 8(b)可以看出,GGM2模型与SG(Savitzky-Golay)模型的差异集中于中沙群岛及其西部,归因于船测资料匮乏。由图 8(c)可以看出,GGM2模型与SIO V23.1模型间的差异多数沿船测线分布,这主要与所采用的船测数据质量、处理及融合技术不同有关。由图 8(d)可以看出,GGM2与GGM1模型整体差异不大,中沙群岛处的明显差异源于GGM2使用了SIO V23.1模型作为填充,其余差异多集中于局部地形起伏较大的地区,反映了海底地形的非线性项信息。
2.4 模型精度分析
利用检核点评估各海底地形模型的精度,结果如表 1所示。表 1中的相对误差被定义为模型在所有检核点上的水深偏差与相应检核点水深之比的绝对值取平均值[24]。由表 1可以看出,SG模型精度最低,其RMS为255.4 m,相对误差高达6.24%,平均偏差为-26.0 m,表明其与检核点间存在系统偏差。ETOPO1模型的精度亦明显低于SIO V23.1模型、GGM1模型和GGM2模型,其RMS为167.5 m,同样存在较大的系统偏差。SIO V23.1、GGM1和GGM2模型精度相当,GGM2模型精度略优于GGM1模型,精度提升2.8 m,且平均偏差最小,为-2.9 m。从相对误差分析,SIO V23.1模型最优,仅为3.09%;其次是GGM2模型,为3.83%,略优于GGM1模型。
表 1 各海底地形模型与检核点差异Table 1. Deviations Between Various Seafloor Topography Models and Check Points模型 最大值/m 最小值/m 平均值/m 标准差/m RMS/m 相对误差/% ETOPO1 1 056.8 -1 537.4 -21.48 166.1 167.5 4.39 SIO V23.1 1 354.1 -1 169.1 14.4 143.4 144.1 3.09 SG 1 095.0 -2 816.5 —26.0 254.1 255.4 6.24 GGM1 1 118.6 -1 698.6 -4.3 133.2 133.2 3.90 GGM2 1 110.0 -1 526.4 -2.9 130.4 130.4 3.83 图 9(a)为GGM2模型水深差异直方图,条块宽度为50 m。由图 9(a)可以看出,大多数水深差异集中在±100 m范围内,与正态分布相比,具有更尖锐的“山峰”和更长的“尾部”。图 9(b)为各模型水深差异的累积分布。ETOPO1、SIO V23.1、GGM1和GGM2模型水深差异绝对值在100 m以内的检核点数占比分别为70.2%、80.0%、77.7%和77.1%。
为了进一步考察各模型在不同波长上的表现,计算各模型的径向功率谱密度,结果如图 10所示。其中,纵轴进行了10lg缩放。由图 10可知,波长小于20 km时,SIO V23.1模型具有最高的能量,且明显优于其他模型。随后,GGM2模型的能量略高于SG和GGM1模型。ETOPO1模型在短波长中的能量远低于其他模型。出现上述现象的主要原因是,在小于20 km波段内,测高重力异常的信噪比较低,海底地形与重力异常间的相干性不高[3],因而该波段海底地形信号主要来源于船测水深。最新的SIO V23.1模型所基于的船测数据质量可能更优,从而使其具有更高的能量;SG、GGM1和GGM2模型采用相同的船测水深控制点,因而具有相同的能谱;ETOPO1模型于2008年发布,其融合的船测资料最小,所以表现最差。在20~130 km的中长波段内,除SG模型曲线明显偏低外,其他模型表现较为接近。该波段是重力数据的主要贡献区间[3],未使用重力数据的SG模型应具有最低的能量。值得注意的是,在大于80 km波段内,GGM1模型的能谱略高于其他模型,其原因有待进一步研究。
为分析各模型精度与水深之间的关系,统计不同水深范围内各模型与检核点差异的RMS,见表 2。由表 2可知,在深度小于1 000 m的浅水区,SIO V23.1模型精度优于GGM1和GGM2模型,3种模型的RMS分别为61.1 m、117.6 m和119.9 m,表明GGM法反演浅水区海底地形并无优势。GGM法的优势水深区间位于[1 000,2 000)m、[3 000,4 000)m及≥4 000 m的深水区,在上述区间内,GGM1和GGM2模型精度均显著优于SIO V23.1模型。此外,GGM2相比与GGM1模型在1 000~4 000 m区间内精度更高,提升了5~10 m。
表 2 各海底地形模型与检核点差异的RMSTable 2. RMS of Deviation Between Various Seafloor Topography Models and Check Points水深区间/m 检核点数量/个 RMS/m SIO V23.1 GGM1 GGM2 < 1 000 2 170 61.1 117.6 119.9 [1 000, 2 000) 2 135 230.1 175.7 166.1 [2 000~3 000) 2 454 167.7 194.3 191.3 [3 000~4 000) 8 150 173.1 160.9 155.9 ≥4 000 11 076 97.3 74.5 75.9 许多研究表明,应用GGM反演大范围复杂地区的海底地形时,有必要按地质条件区分各子区以采用不同的密度差进行反演[16, 24]。为了客观分析GGM2模型在复杂地形区的性能,本文分别反演了区域A(116°E~119°E,14.5°N~17.5°N)和区域B(112°E~116°E,15°N~17°N)的海底地形,并计算了不同密度差反演结果与检核点水深差异的STD和相关系数,结果如图 11所示。各模型在2个区域与检核点的比较统计见表 3。
表 3 不同海底地形模型与A、B区域检核点比较Table 3. Comparison Between Various Seafloor Topography Models and Check Points in Areas A and B区域 检核点数量/个 模型 最大值/m 最小值/m 平均值/m 标准差/m RMS/m 相对误差/% A 3 767 ETOPO1 1 020.7 -1 537.4 -15.6 213.2 213.7 4.40 SIO V23.1 853.2 -584.0 12.0 106.1 106.8 2.11 GGM1 1 125.7 -1 680.6 -11.0 151.5 151.8 3.00 GGM2 947.9 -1 461.0 -8.9 140.7 141.0 2.91 B 5 511 ETOPO1 644.1 -1 053.3 -53.6 202.9 209.9 5.95 SIO V23.1 1 354.1 -868.1 47.1 219.7 224.7 4.54 GGM1 522.0 -937.9 -31.2 151.8 154.9 4.20 GGM2 509.4 -908.3 -25.1 148.1 150.2 4.14 区域A内包含黄岩海山链及众多海丘,地形变化复杂,但具有均匀分布的船测水深数据。由图 11(a)可知,区域A确定的$ \Delta \rho =0.9\mathrm{ }\mathrm{g}/\mathrm{c}{\mathrm{m}}^{3} $;由表 3可知,区域A中SIO V23.1模型具有最高精度,其RMS为106.8 m;ETOPO1模型精度最差,GGM类模型精度远优于ETOPO1模型,不如SIO V23.1模型。GGM2模型的RMS为141.0 m,相比GGM1模型精度提升了10.8 m,该结果表明,在复杂地形区GGM反演中,考虑地形非线性项能有效提高模型精度。
区域B中部为中沙群岛,西部为西沙群岛东侧,存在众多岛礁和海沟、海槽,东部向南海海盆过渡,地形坡度大。此外,该区域的船测数据匮乏,会影响海底地形反演的质量。由图 11(b)可知,区域B确定的$ \Delta \rho =0.9\mathrm{ }\mathrm{g}/\mathrm{c}{\mathrm{m}}^{3} $;从表 3可知,区域B中GGM2模型具有最高的精度,其RMS为150.2 m,相对误差4.14%,相比GGM1模型精度提升了4.7 m;SIO V23.1模型的RMS最大,ETOPO1模型的相对误差最高。
3 结语
针对传统GGM方法仅顾及地形线性部分而忽略非线性项的问题,本文利用频率域重力正演方法和迭代缩放技术来恢复海底地形的非线性信息,生成了中国南海1'×1'海底地形模型,并对模型的精度水平进行了综合评估。结果表明:
1)仅使用简单布格板公式计算的短波重力异常与四阶Parker公式计算结果相比会引起超过50 mGal的偏差,尤其是在地形起伏较大的地区。
2)应用迭代缩放技术并以观测重力异常的精度水平作为收敛条件,能改善从短波重力异常中所恢复海底地形的质量。
3)与ETOPO1和SIO V23.1模型相比,由改进GGM反演得到的GGM2模型在研究区中具有最高的精度,它与检核点差异的RMS为130.4 m;平均值为-2.9 m;相对误差等于3.83%。GGM2模型相对于由传统GGM获得的GGM1模型,精度提升2.8 m,主要获得改善的水深区间为1 000~4 000 m。
4)分区反演结果表明,改进GGM相比传统GGM在黄岩海山链附近改善效果较好,精度提高了10.8 m;在中沙群岛附近精度提高了4.7 m。
-
表 1 ε=0.1时不同方法所得结果
Table 1 Results of Different Methods when ε=0.1
较值 真值 LS估计 岭估计 Liu估计 本文方法 1 1.606 5 1.489 1 1.050 6 1.050 6 1 -16.160 0 -5.304 3 1.053 7 1.053 9 1 69.522 0 12.243 6 1.050 9 1.050 2 1 294.290 0 12.176 4 1.049 1 1.046 1 $\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$ 1 -2 082.400 0 -6.846 8 1.021 0 1.042 3 1 3 765.700 0 -19.525 6 1.077 7 1.039 1 1 -1 717.100 0 -16.402 1 1.018 6 1.036 2 1 -1 428.500 0 2.268 8 1.019 1 1.033 8 1 1 128.000 0 32.849 2 1.043 2 1.031 6 ‖Δ$\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$‖ 0 4.986 9×103 45.749 3 0.139 6 0.129 9 MSE($\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$) 0 2.486 9×107 20.930 0.019 48 0.016 8 表 2 ε=0.01时不同方法所得结果
Table 2 Results of Different Methods when ε=0.01
较值 真值 LS估计 岭估计 Liu估计 本文方法 1 1.060 7 1.048 9 1.005 1 1.005 1 1 -7.160 3 -3.695 7 1.005 4 1.005 4 1 7.852 2 2.124 4 1.005 1 1.005 0 1 30.329 0 2.117 6 1.004 9 1.004 6 $\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$ 1 -207.340 0 2.153 2 1.002 1 1.004 2 1 377.470 0 -1.052 6 1.007 8 1.003 9 1 -170.810 0 -7.402 1 1.001 9 1.003 6 1 -141.950 0 1.126 9 1.001 9 1.003 4 1 113.700 0 4.184 9 1.004 3 1.003 2 ‖Δ$\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$‖ 0 4.986 9×102 4.574 9 0.013 97 0.012 99 MSE($\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$) 0 2.486 9×105 2.093 0 1.951 1×10-4 1.686 8×10-4 表 3 ε=0.001时不同方法所得结果
Table 3 Results of Different Methods when ε=0.001
较值 真值 LS估计 岭估计 Liu估计 本文方法 1 1.006 1 1.004 9 1.000 5 1.000 5 1 -0.828 4 0.936 9 1.000 5 1.000 5 1 1.685 2 1.002 4 1.000 5 1.000 5 1 3.932 9 1.111 8 1.000 5 1.000 5 $\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$ 1 -1.983 4 0.921 5 1.000 2 1.000 4 1 3.864 7 0.794 7 1.000 8 1.000 4 1 -1.618 1 0.825 9 1.000 2 1.000 4 1 -1.329 5 1.012 7 1.000 2 1.000 3 1 1.227 0 1.318 5 1.000 4 1.000 3 ‖Δ$\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$‖ 0 4.986 9 0.457 5 1.406 5×10-3 1.298 8×10-3 MSE($\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$) 0 2.486 9×103 0.209 30 1.978 2×10-6 1.686 8×10-6 表 4 控制点的坐标和观测距离
Table 4 Coordinate and Observation Distance of Control Points
点号 坐标/m 观测距离/m x y z di, 10 di, 11 P1 23.000 10.000 0.010 25.078 69 16.765 17 P2 10.000 9.990 0.000 14.134 51 17.719 65 P3 35.000 10.010 -0.010 36.415 88 28.442 94 P4 100.000 19.990 0.005 101.479 43 93.168 39 P5 -36.000 10.005 0.000 37.364 22 43.299 05 P6 0.000 10.010 -0.005 10.010 04 8.600 60 P7 56.000 9.995 0.010 56.996 06 49.256 18 P8 -15.000 10.105 -0.010 18.035 90 22.559 66 P9 -1.7000 10.008 -0.015 10.150 63 10.043 82 表 5 LS估计、岭估计、Liu估计以及本文方法的结果比较
Table 5 Comparison of the Results Among LS Estimator、Ridge Estimator、Liu Estimator and Our Method
较值 真值 LS估计 岭估计 Liu估计 本文方法 0 -0.036 8 -0.041 1 -0.038 0 -0.038 4 0 0.051 8 0.027 5 0.022 7 0.022 0 0 9.363 1 0.086 0 0.375 9 0.055 9 $\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$ 7 7.048 8 6.974 6 6.975 9 6.973 3 10 5.596 3 10.036 3 9.866 2 10.019 6 -5 -4.648 2 -4.873 5 -4.904 4 -4.911 7 参数 0 0 0.482 7 0.137 5 0.137 5 ‖Δ$\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$‖ 0 10.353 3 0.166 7 0.214 2 0.118 3 MSE($\mathit{\boldsymbol{\overset{\lower0.5em\hbox{$\smash{\scriptscriptstyle\frown}$}}{X}}}$) 0 18.281 3 0.219 6 0.170 9 0.014 0 -
[1] Stein C. Inadmissibility of the Usual Estimator for Mean of Multivariate Normal Distribution[C]. 3th Berkley Symposium on Mathematical and Statistics Probability, Berkley, 1956
[2] Malthouse E C. Shrinkage Estimation and Direct Marketing Scoring Model[J]. Journal of Interactive Marketing, 1999, 13(4):10-23 doi: 10.1002/(SICI)1520-6653(199923)13:4<10::AID-DIR2>3.0.CO;2-3
[3] Massy W F. Principal Components Regression in Exploratory Statistical Research[J]. Journal of the American Statistical Association, 1965, 60(309):234-266 doi: 10.1080/01621459.1965.10480787
[4] Hoerl A E, Kennard R W. Ridge Regression:Biased Estimation for Non-Orthogonal Problems[J]. Technometrics, 1970, 12(1):55-67 doi: 10.1080/00401706.1970.10488634
[5] Hoerl A E, Kennard R W. Ridge Regression:Application for Non-Orthogonal Problems[J]. Technometrics, 1970, 12(1):69-82 doi: 10.1080/00401706.1970.10488635
[6] 郭杰, 归庆明, 郭淑妹, 等.利用复共线性诊断确定偏差矫正项的截断型岭估计[J].武汉大学学报·信息科学版, 2015, 40(6):785-789 http://ch.whu.edu.cn/CN/abstract/abstract3277.shtml Guo Jie, Gui Qingming, Guo Shumei, et al. Truncation Ridge Estimation Based on the Biased Corrected Theory by Multicollinearity Diagnosis[J].Geomatics and Information Science of Wuhan University, 2015, 40(6):785-789 http://ch.whu.edu.cn/CN/abstract/abstract3277.shtml
[7] Liu Kejian. A New Class of Biased Estimate in Linear Regression[J].Communications in Statistics-Theory and Methods, 1993, 22(2):393-402 doi: 10.1080/03610929308831027
[8] Liu Kejian. Using Liu-Type Estimator to Combat Collinearity[J].Communications in Statistics-Theory and Methods, 2003, 32(5):1009-1020 doi: 10.1081/STA-120019959
[9] Mansson K. Developing a Liu Estimator for the Negative Binomial Regression Model:Method and Application[J].Journal of Statistical Computation and Simulation, 2013, 83(9):1773-1780 doi: 10.1080/00949655.2012.673127
[10] 王新洲, 刘丁酉, 张前勇, 等.谱修正迭代法及其在测量数据处理中的应用[J].黑龙江工程学院学报, 2001, 15(2):3-6 http://www.cnki.com.cn/Article/CJFDTOTAL-JTGZ200102000.htm Wang Xinzhou, Liu Dingyou, Zhang Qianyong, et al. The Iteration by Correcting Characteristic Value and Its Application in Surveying Data Processing[J]. Journal of Heilongjiang Institute of Technology, 2001, 15(2):3-6 http://www.cnki.com.cn/Article/CJFDTOTAL-JTGZ200102000.htm
[11] 刘斌, 龚健雅, 江万寿, 等.基于岭参数的谱修正迭代法及其在有理多项式参数求解中的应用[J].武汉大学学报·信息科学版, 2012, 37(4):399-402 http://ch.whu.edu.cn/CN/abstract/abstract176.shtml Liu Bin, Gong Jianya, Jiang Wanshou, et al. Improvement of the Iteration by Correcting Characteristic Value Based on Ridge Estimation and Its Application in RPC Calculating[J]. Geomatics and Information Science of Wuhan University, 2012, 37(4):399-402 http://ch.whu.edu.cn/CN/abstract/abstract176.shtml
[12] 郭秋英, 胡振琪.遗传算法在GPS快速定位病态方程解算中的应用[J].武汉大学学报·信息科学版, 2009, 34(2):240-243 http://ch.whu.edu.cn/CN/abstract/abstract1181.shtml Guo Qiuying, Hu Zhenqi. Application of Genetic Algorithm to Solve Ill-Conditioned Equations for GPS Rapid Positioning[J].Geomatics and Information Science of Wuhan University, 2009, 34(2):240-243 http://ch.whu.edu.cn/CN/abstract/abstract1181.shtml
[13] 陈希孺, 王松桂.近代回归分析:原理方法及应用[M].合肥:安徽教育出版社, 1987 Chen Xiru, Wang Guisong. Modern Regression Analysis:Theory and Application[M]. Hefei:Anhui Education Press, 1987
[14] Hansen P C, O'Leary D P. The Use of the L-Curve in the Regularization of Discrete Ill-Posed Problems[J]. SIAM Journal on Scientific Computing, 1993, 14(6):1487-1503 doi: 10.1137/0914086
[15] 王振杰, 欧吉坤.用L-曲线法确定岭估计中的岭参数[J].武汉大学学报·信息科学版, 2004, 29(3):235-238 http://ch.whu.edu.cn/CN/abstract/abstract4657.shtml Wang Zhenjie, Ou Jikun. Determining the Ridge Parameter in a Ridge Estimation Using L-Curve Method[J]. Geomatics and Information Science of Wuhan University, 2004, 29(3):235-238 http://ch.whu.edu.cn/CN/abstract/abstract4657.shtml
[16] 王家映.地球物理反演理论[M].北京:高等教育出版社, 2002 Wang Jiaying. Inverse Theory in Geophysics[M]. Beijing:Higher Education Press, 2002
[17] 黄维彬.近代平差理论及其应用[M].北京:解放军出版社, 1992 Huang Weibin. Modern Adjustment Theory and Its Application[M]. Beijing:People's Liberation Army Press, 1992
[18] Sakallioglu S, Kaciranlar S. A New Biased Estimator Basedon Ridge Estimation[J].Statistics Papers, 2008, 49:669-689 doi: 10.1007/s00362-006-0037-0
[19] Sakallioglu S, Kaciranlar S, Akdeniz F. Mean Squared Error Comparisons of Some Biased Regression Estimators[J].Communications in Statistics:Theory and Methods, 2001, 30(2):347-361 doi: 10.1081/STA-100002036
[20] 刘丁酉.矩阵分析[M].武汉:武汉大学出版社, 2006 Liu Dingyou. Matrix Analysis[M]. Wuhan:Wuhan University Press, 2006
[21] Golam K B M. Applications of Some Improved Estimators in Linear Regression[J].Journal of Modern Applied Statistical Methods, 2006, 5(2):367-380 http://digitalcommons.wayne.edu/cgi/viewcontent.cgi?article=1198&context=jmasm
[22] 郭建峰. 测量平差系统病态性的诊断与处理[D]. 郑州: 信息工程大学, 2002 Guo Jianfeng. Diagnostics and Processing of Ill-Posed in Surveying Adjustment System[D].Zhengzhou:Information Engineering University, 2002
-
期刊类型引用(3)
1. 欧阳明达,翟振和,牛向华,管斌,张鹏飞,付永健. 基于神经网络的船测稀疏海域地形反演改进算法. 中国惯性技术学报. 2025(01): 64-69 . 百度学术
2. 公维梁,屠泽杰,孙月文,邢赛,赵福玺,阳凡林. 一种基于重力正演理论的海底地形反演迭代算法. 山东科技大学学报(自然科学版). 2024(03): 64-74 . 百度学术
3. 杜斌,范雕,胡兴猛,谭勖立,万宏发,裴宪勇. 基于重力异常数据构建海陆交界区域海底地形模型. 大地测量与地球动力学. 2024(08): 873-880 . 百度学术
其他类型引用(4)
计量
- 文章访问数: 2334
- HTML全文浏览量: 134
- PDF下载量: 359
- 被引次数: 7