拟牛顿修正法解算不等式约束加权总体最小二乘问题

王乐洋; 李海燕; 陈晓勇

doi:10.13203/j.whugis20150333

拟牛顿修正法解算不等式约束加权总体最小二乘问题

王乐洋^{1, 2, 3,},
李海燕¹,
陈晓勇^{1, 2, 3}

1.
东华理工大学测绘工程学院, 江西南昌, 330013
2.
东华理工大学流域生态与地理环境监测国家测绘地理信息局重点实验室, 江西南昌, 330013
3.
东华理工大学江西省数字国土重点实验室, 江西南昌, 330013

基金项目:

国家自然科学基金 41204003

江西省杰出青-人才资助计划 20162BCB23050

测绘地理信息公益性行业科研专项 201512026

江西省教育厅科技项目 GJJ150595

详细信息

作者简介:
王乐洋, 博士, 副教授, 主要研究方向为大地测量反演及大地测量数据处理。wleyang@163.com

中图分类号: P207
计量
- 文章访问数: 2040
- HTML全文浏览量: 154
- PDF下载量: 391
出版历程
- 收稿日期: 2016-08-18
- 发布日期: 2018-01-04

A Quasi Newtonian Correction Algorithm for Weighted Total Least Squares Problem with Inequality Constraints

WANG Leyang^{1, 2, 3,},
LI Haiyan¹,
CHEN Xiaoyong^{1, 2, 3}

1.
Faculty of Geomatics, East China Institute of Technology, Nanchang 330013, China
2.
Key Laboratory of Watershed Ecology and Geographical Environment Monitoring, NASG, East China Institute of Technology, Nanchang 330013, China
3.
Jiangxi Province Key Lab for Digital Land, East China University of Technology Nanchang 330013, China

Funds:

The National Natural Science Foundation of China 41204003

Outstanding Youth Talents in Jiangxi Province 20162BCB23050

National Department Public Benefit Research Foundation (Surveying, Mapping and Geoinformation) 201512026

Science and Technology Project of the Education Department of Jiangxi Province GJJ150595

More Information

Author Bio:
WANG Leyang, PhD, associate professor, specializes in geodetic inversion and geodetic data processing. E-mail: wleyang@163.com

摘要

摘要: 根据总体最小二乘准则，可以将附有不等式约束的变量误差（errors-in-variables，EIV）模型转化为标准最优化问题，并运用有效集法、序列二次规划法等优化方法求解。已有算法在涉及计算目标函数的Hesse矩阵（二阶导数）时，存在计算量较大的缺陷。针对上述问题，利用基于拟牛顿法修正Hesse矩阵的序列二次规划算法解算附有不等式约束加权总体最小二乘问题，新算法减小了计算量，可以提高收敛速度。通过实例，证明了该算法具有很好的适用性和计算效率。
- 总体最小二乘 /
- 不等式约束 /
- EIV模型 /
- 序列二次规划 /
- Hesse矩阵
Abstract: The errors-in-variables (EIV)model with inequality constraints is transformed into a standard nonlinear optimization program, which can be solved by existing optimization methods such as the active set method or sequential quadratic programming(SQP). Since weighted total least squares with inequality constraints (ICWTLS) is limited by the complexity of a Hessian matrix, which is the second partial derivative of objective function. In this paper, the Hessian matrix in SQP is replaced by an approximation based on Quasi-Newtonian method.The algorithm we propose can deal with the ICWTLS problem with a general weight matrix, and has the ability to handle large-scale problems. Eexamples illustrate that this new algorithm is efficient.
- total least square /
- inequality constraints /
- errors-in-variables model /
- sequential quadratic programming /
- Hesse matrix

HTML全文

总体最小二乘(total least squares，TLS)是同时顾及观测向量和系数矩阵误差的数据处理方法^[1]，作为变量误差(errors-in-variables，EIV)模型的严密处理方法，近年来在大地测量等领域得到了广泛应用^[2-11]。大地测量领域中参数估计往往伴随先验信息，此时EIV模型就扩展为附有约束的EIV模型^[12]。参数的先验信息为等式形式时，即为附有等式约束的EIV模型(equality-constrained EIV，ECEIV)，文献[13-17]对ECEIV模型进行了详细的研究；若附加不等式约束条件，就构成附有不等式约束的EIV模型(inequality -constrained EIV，ICEIV)。国内外有关附有不等式约束的EIV模型的文献不多，文献[18]首次把ICEIV问题转化为基于组合方法求解的线性互补问题；文献[19]提出基于穷举法的ICTLS算法，将不等式约束转化为等式约束，计算所有可能的附有等式约束组合的总体最小二乘解，将最优解作为ICTLS问题的参数解。上述两种算法存在计算效率较低的问题，穷举算法的迭代次数与不等式方程个数成指数关系，如模型共有N个不等式方程，则需迭代2^N次，这种算法理论上可以求得最优解，但显然不适合解算大规模的附不等式约束问题；且两种算法都不能解算观测向量和系数矩阵元素不等精度或相关性的情况。文献[20]提出附有不等式约束的加权总体最小二乘(inequality-constrained weighted TLS，ICWTLS)算法，将ICEIV模型转化为非线性最优化问题，给出了ICWTLS最优化的充分必要条件，并通过常见的有效集法和序列二次规划法(sequential quadratic programming，SQP)等最优化方法^{[21, 22]}求解；ICWTLS算法能够解决观测量间精度不等和观测量相关的问题，且不受约束方程个数限制。文献[20]给出了目标函数的一阶梯度和Hesse矩阵(二阶导数)的计算公式，然而求解Hesse矩阵的公式复杂、计算量大，对于大规模的参数估计问题，需要考虑算法的计算能力，参数个数较多、观测数据量大时，将大大增加SQP算法的计算量；另外，每次迭代所求的Hesse矩阵往往出现非正定的情况，此时不能保证计算所得的方向为对应点处的下降方向，使算法的计算效率降低。文献[12]提出了基于Partial EIV模型^[23]的ICWTLS算法，Partial EIV模型顾及了系数矩阵中随机元素和非随机元素同时存在的情况，将系数矩阵中的随机元素和非随机元素分离，把随机元素作为未知参数和模型参数一同求解。文献[24]则提出了Partial EIV模型中未知参数和系数矩阵元素都附有不等式约束时的ICWTLS算法。

本文以ICEIV模型为基础，针对文献[20]中目标函数的Hesse矩阵计算量大、容易出现非正定的问题，利用拟牛顿校正公式得到Hesse的近似矩阵，研究了利用拟牛顿校正法解算ICWTLS的问题。本文算法可以解算观测量和系数矩阵元素的权阵为一般正定对称权阵的情况，同时避免了求解复杂的Hesse矩阵，而且每次迭代过程近似矩阵都是对称正定的，保证了算法的收敛速度，对于涉及大规模的附不等式约束问题时更有效。

1 附有不等式约束的EIV模型

附有不等式约束的总体最小二乘模型^[20]：

$$ \left\{ \begin{array}{l} \mathit{\boldsymbol{y}} - {\mathit{\boldsymbol{e}}_\mathit{\boldsymbol{y}}} = \left( {\mathit{\boldsymbol{A}} - {\mathit{\boldsymbol{E}}_A}} \right)\mathit{\boldsymbol{\xi }}\\ \mathit{\boldsymbol{C\xi }} - \mathit{\boldsymbol{w}} \ge 0 \end{array} \right. $$

(1)

$$ \mathit{\boldsymbol{e}}: = \left[ \begin{array}{l} {\rm{vec}}\left( {{\mathit{\boldsymbol{E}}_A}} \right)\\ {\mathit{\boldsymbol{e}}_\mathit{\boldsymbol{y}}} \end{array} \right] = \left[ {\begin{array}{*{20}{c}} {{\mathit{\boldsymbol{e}}_A}}\\ {{\mathit{\boldsymbol{e}}_y}} \end{array}} \right] \sim \left( {\left[ {\begin{array}{*{20}{c}} 0\\ 0 \end{array}} \right],\sigma _0^2{\mathit{\boldsymbol{Q}}_{ll}} = \sigma _0^2{\mathit{\boldsymbol{P}}^{ - 1}}} \right) $$

(2)

式中，y ∈R^n×1为观测向量; e_y∈R^n×1表示观测向量的随机误差向量; E_A∈R^n×u表示系数矩阵A ∈R^n×u的随机误差矩阵；ξ ∈R^u×1为未知参数向量；C ∈R^m×u、w ∈R^m×1分别表示不等式组的系数矩阵和常数向量；符号vec(·)表示矩阵的每一列拉直成列向量的运算符号；其中l =vec(A, Y])∈R^n(u+1)×1;e∈R^n(u+1)×1表示扩展向量l的误差向量；e_A=vec(E_A)∈R^n(u×1)；σ₀²为单位权方差；矩阵Q_ll及其逆矩阵P分别表示l的协因数阵和权阵(Q_ll的详细形式参见文献[20])。

上述模型中的Q_ll和P为一般的正定对称矩阵，故可用于解决普通的附不等式约束的加权总体最小二乘问题。

2 ICWTLS问题的拟牛顿修正算法及收敛性分析

2.1 ICWTLS问题的拟牛顿修正算法

根据总体最小二乘准则

$$ \begin{array}{l} \min :{\mathit{\boldsymbol{e}}^{\rm{T}}}\mathit{\boldsymbol{Pe}}\\ {\rm{s}}{\rm{.t}}{\rm{.:}}\;\;\;\mathit{\boldsymbol{y}} - {\mathit{\boldsymbol{e}}_\mathit{\boldsymbol{y}}} = \left( {\mathit{\boldsymbol{A}} - {\mathit{\boldsymbol{E}}_A}} \right)\mathit{\boldsymbol{\xi }} \end{array} $$

(3)

构造拉格朗日目标函数

$$ \begin{array}{l} \mathit{\boldsymbol{ \boldsymbol{\varPhi} }}\left( {\mathit{\boldsymbol{e}},\mathit{\boldsymbol{\mu }},\mathit{\boldsymbol{\xi }}} \right) = {\mathit{\boldsymbol{e}}^{\rm{T}}}\mathit{\boldsymbol{Pe}} + \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;2{\mathit{\boldsymbol{\mu }}^{\rm{T}}}\left( {\mathit{\boldsymbol{y}} - {\mathit{\boldsymbol{e}}_y} - \mathit{\boldsymbol{A\xi }} + {\mathit{\boldsymbol{E}}_A}\mathit{\boldsymbol{\xi }}} \right) \end{array} $$

(4)

式中，μ ∈R^n×1表示拉格朗日乘子。

对式(4)分别求关于e、ξ、μ的偏导数，且令偏导数等于零，最终得到如下的形式^[6]：

$$ {{\mathit{\boldsymbol{\hat e}}}^{\rm{T}}}\mathit{\boldsymbol{P\hat e}} = {\left( {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{A\hat \xi }}} \right)^{\rm{T}}}{\left( {\mathit{\boldsymbol{\hat B}}{\mathit{\boldsymbol{Q}}_{ll}}{{\mathit{\boldsymbol{\hat B}}}^{\rm{T}}}} \right)^{ - 1}}\left( {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{A\hat \xi }}} \right) $$

(5)

式中，B = [ξ^T⊗I_n, －I_n]∈R^n×n(u+1)，且为行满秩矩阵。

则ICWTLS模型最终转化为普通附有不等式约束的最优化问题^[20]

$$ \begin{array}{l} \min :\;\;\;\left. {\mathit{\boldsymbol{f}}\left( {\mathit{\boldsymbol{\hat \xi }}} \right)} \right) = {\left( {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{A\xi }}} \right)^{\rm{T}}}{\left( {\mathit{\boldsymbol{\hat B}}{\mathit{\boldsymbol{Q}}_{ll}}{{\mathit{\boldsymbol{\hat B}}}^{\rm{T}}}} \right)^{ - 1}} \cdot \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\left( {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{A\xi }}} \right)\mathit{\boldsymbol{C\hat \xi }} - \mathit{\boldsymbol{w}} \ge 0 \end{array} $$

(6)

将附不等式约束的加权总体最小二乘问题转化为最优化问题，避免了运用类似穷举法^[19]需要顾及不等式方程个数对计算效率的影响。对上述最优化问题，本文仍基于SQP法来求解, 基本思想是通过求解二次规划子问题确定搜索的下降方向，以减小选取的罚函数来取得步长，重复解算直到获得最优解。由于二次规划子问题中的Hesse矩阵存在计算量大等不足，本文算法每次迭代时通过拟牛顿修正法得到近似的对称正定矩阵代替原有Hesse矩阵。构造拉格朗日函数：

$$ \mathit{\boldsymbol{L}}\left( {\mathit{\boldsymbol{\hat \xi }},\mathit{\boldsymbol{\lambda }}} \right) = \mathit{\boldsymbol{f}}\left( {\mathit{\boldsymbol{\hat \xi }}} \right) - {\mathit{\boldsymbol{\lambda }}^{\rm{T}}}\left( {\mathit{\boldsymbol{C\hat \xi }} - \mathit{\boldsymbol{w}}} \right) $$

(7)

根据文献[21]可知，存在互补条件或松弛条件，有$ {\mathit{\boldsymbol{\hat \lambda }}_{ki}} \ge 0 $且$ {\mathit{\boldsymbol{\hat \lambda }}_{ki}} $(C_iξ－ w_i)=0(i=1, 2, …，m)，其中，C_i为C的第i行；w_i为w的第i个元素；λ_{k i}表示乘子向量λ_k的第i个元素。在给定未知参数$ {\mathit{\boldsymbol{\hat \xi }}_k} $及乘子向量λ_k处，将拉格朗日函数进行二次多项式近似并把不等式约束函数线性化，得到二次规划子问题：

$$ \begin{array}{l} \min :\;\;\;\frac{1}{2}\mathit{\boldsymbol{d}}_k^{\rm{T}}\mathit{\boldsymbol{H}}\left( {{{\mathit{\boldsymbol{\hat \xi }}}_k}} \right){\mathit{\boldsymbol{d}}_k} + \nabla \mathit{\boldsymbol{f}}{\left( {{{\mathit{\boldsymbol{\hat \xi }}}_k}} \right)^{\rm{T}}}{\mathit{\boldsymbol{d}}_k}\\ \;\;\;\;\;\;\;\;\;\;\;\;\mathit{\boldsymbol{C\hat \xi }} + \mathit{\boldsymbol{C}}{\mathit{\boldsymbol{d}}_k} \ge 0 \end{array} $$

(8)

式中，$ \nabla \mathit{\boldsymbol{f}}\left( {{{\mathit{\boldsymbol{\hat \xi }}}_k}} \right) $是目标函数$ f\left( {\mathit{\boldsymbol{\hat \xi }}} \right) $的一阶梯度；$ \mathit{\boldsymbol{H}}\left( {{{\mathit{\boldsymbol{\hat \xi }}}_k}} \right) $是$ f\left( {\mathit{\boldsymbol{\hat \xi }}} \right) $的Hesse矩阵。

用B_k近似代替$ \mathit{\boldsymbol{H}}\left( {{{\mathit{\boldsymbol{\hat \xi }}}_k}} \right) $，B_k具备几个特点^[22]：

① 一定意义上$ {\mathit{\boldsymbol{B}}_k} \approx \mathit{\boldsymbol{H}}\left( {{{\mathit{\boldsymbol{\hat \xi }}}_k}} \right) $；使得算法产生的d_k方向近似于牛顿方向；

② 所有的B_k对称正定，确保d_k方向为目标函数$ f\left( {\mathit{\boldsymbol{\hat \xi }}} \right) $的下降方向；

③ 矩阵的校正规则相对简单。

BFGS^[21]校正公式是目前最有效的拟牛顿校正，校正过程为：

令$ {\mathit{\boldsymbol{s}}_k} = {{\mathit{\boldsymbol{\hat \xi }}}_{k + 1}} - {{\mathit{\boldsymbol{\hat \xi }}}_k} $

$$ {\mathit{\boldsymbol{y}}_k} = {\nabla _x}\mathit{\boldsymbol{L}}\left( {{{\mathit{\boldsymbol{\hat \xi }}}_{k + 1}},{{\mathit{\boldsymbol{\hat \lambda }}}_{k + 1}}} \right) - {\nabla _x}\mathit{\boldsymbol{L}}\left( {{{\mathit{\boldsymbol{\hat \xi }}}_k},{{\mathit{\boldsymbol{\hat \lambda }}}_k}} \right) $$

(9)

为满足校正矩阵正定性，需要s_k^Ty_k＞0，但式(9)很难满足此条件，Powell^[22]给出了y_k的修正公式，令

$$ {\mathit{\boldsymbol{z}}_k} = {\mathit{\boldsymbol{\theta }}_k}{\mathit{\boldsymbol{y}}_k} + \left( {1 - {\mathit{\boldsymbol{\theta }}_k}} \right){\mathit{\boldsymbol{B}}_k}{\mathit{\boldsymbol{s}}_k} $$

(10)

式中，

$$ {\mathit{\boldsymbol{\theta }}_k} = \left\{ \begin{array}{l} 1,\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{y}}_k} \ge 0.2\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{B}}_k}{\mathit{\boldsymbol{s}}_k}\\ \frac{{0.8\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{B}}_k}{\mathit{\boldsymbol{s}}_k}}}{{\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{B}}_k}{\mathit{\boldsymbol{s}}_k}}},\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{y}}_k} < 0.2\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{B}}_k}{\mathit{\boldsymbol{s}}_k} \end{array} \right. $$

(11)

因此，得到B_k的校正公式为：

$$ {\mathit{\boldsymbol{B}}_{k + 1}} = {\mathit{\boldsymbol{B}}_k} - \frac{{{\mathit{\boldsymbol{B}}_k}{\mathit{\boldsymbol{s}}_k}\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{B}}_k}}}{{\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{B}}_k}{\mathit{\boldsymbol{s}}_k}}} + \frac{{{\mathit{\boldsymbol{z}}_k}\mathit{\boldsymbol{z}}_k^{\rm{T}}}}{{\mathit{\boldsymbol{s}}_k^{\rm{T}}{\mathit{\boldsymbol{z}}_k}}} $$

(12)

可以验证s_k^Tz_k≥0.2 s_k^TB_ks_k＞0，这样就确保了当B_k为正定矩阵时，B_k+1也为正定矩阵。

为取得下降方向的步长，借助罚函数P (ξ, σ)：

$$ \mathit{\boldsymbol{P}}\left( {\mathit{\boldsymbol{\xi }},\sigma } \right) = \mathit{\boldsymbol{f}}\left( \mathit{\boldsymbol{\xi }} \right) + {\sigma ^{ - 1}}{\left\| {{\mathit{\boldsymbol{g}}_i}\left( \mathit{\boldsymbol{\xi }} \right)} \right\|_1} $$

(13)

式中，σ表示罚参数(σ＞0)；g_i(ξ)=max{0, C_iξ － w_i}(i=1, 2, …, m)；上述的搜索方向d_k是罚函数P(ξ, σ)在(ξ_k, σ_k)处的下降方向，这是d_k的一个很好的性质。另外，在每次迭代中，需要更新罚参数，更新规则可为：

$$ {\sigma _{k + 1}} = \left\{ \begin{array}{l} {\sigma _k},\sigma _k^{ - 1} \ge \tau + \delta ,\\ \left( {\tau + 2\delta } \right) - 1,\sigma _k^{ - 1} < \tau + \delta \end{array} \right. $$

(14)

式中，τ=‖ λ_k‖，δ为任意大于零的常数。按某种线性搜索规则确定步长α_k，得到优化参数$ {{\mathit{\boldsymbol{\hat \xi }}}_{k + 1}} $及拉格朗日乘子$ {{\mathit{\boldsymbol{\hat \lambda }}}_{k + 1}} $；若满足条件，即为对应的ICWTLS问题的最优解，否则通过(Broyden、Fletcher、Goldfarb、Sharno, BFGS)公式校正矩阵B_k为B_k+1，继续求解二次规划子问题，直到得到最优解。

本文拟牛顿修正法的计算步骤如下。

步骤1 给定初始点ξ₀, λ₀；ξ₀可以取不考虑不等式约束时的TLS参数解。初始正定对称矩阵B₀(如B₀为单位矩阵)。不等式方程的Jacobi矩阵A₀=▽C(ξ₀)^T。参数η∈(0, 1/2)，ρ∈(0, 1)，容许误差ε，令k=0。

步骤2 求解子问题式(8)，得到最优解d_k。

步骤3 对于罚函数P (ξ, σ)，根据式(14)更新罚参数(取常数σ₀＞0)，保证d_k是P (ξ_k, σ_k)处的下降方向。

步骤4 按照Armijo非精确线搜索技术确定步长，即求解满足下列不等式成立的最小正数m_k：

$$ \begin{array}{l} \mathit{\boldsymbol{P}}\left( {{\mathit{\boldsymbol{\xi }}_k} + {\rho ^m}{\mathit{\boldsymbol{d}}_k},{\sigma _k}} \right) - \mathit{\boldsymbol{P}}\left( {{\mathit{\boldsymbol{\xi }}_k},{\sigma _k}} \right)\\ \;\;\;\;\;\;\;\;\;\;\; \le \eta {\rho ^m}\mathit{\boldsymbol{P'}}\left( {{\mathit{\boldsymbol{\xi }}_k},{\sigma _k},{\mathit{\boldsymbol{d}}_k}} \right) \end{array} $$

(15)

式中，P (ξ_k, σ_k, d_k)为P(ξ_k, σ_k)的方向导数，令α_k=ρ^m_k，得ξ_k+1=ξ_k+α_k d_k；‖ d_k‖/‖ξ_k+1‖≤ε则停止迭代，ξ_k+1即为参数最优值；否则，转步骤5。

步骤5 计算A_k+1=▽ C(ξ_k+1)^T及最小二乘乘子λ_k+1= A_k+1 A_k+1^T]^－1 A_k+1▽ f_k+1。

步骤6 校正矩阵B_k为B_k+1；令k=k+1，转至步骤2，直到取得满足条件的最优解。

2.2 拟牛顿修正算法的收敛性分析

本文利用拟牛顿算法的迭代公式来代替Hesse矩阵，是对Hesse矩阵的近似处理，使得替代矩阵B_k满足拟牛顿方程(条件)：B_k+1 s_k= y_k。对于任意函数f(x)，BFGS迭代公式产生的序列{ x_k}全局收敛到f(x)的极小点x^*，需满足两个条件^[22]：①函数f (x)是二阶连续可微的；②水平集Τ(x)={x∈Rⁿ| f (x)≤f(x₀) }是凸集，并且函数f(x)在T(x)上一致凸，即满足d^TG(x)d＞0。本文讨论的ICWTLS问题，目标函数f(ξ)在可行区域内二阶连续可微，满足条件①；对于条件②，一般情况下，d^TG(x)d＞0在可行方向上也成立，即使G(x)为非正定矩阵时，也有d^TG(x)d＞0成立^[20]。因此，对于满足上述两个条件的ICWTLS问题，采用B_k代替Hesse矩阵可以收敛到最优极值点。

3 拟牛顿修正算法验证与分析

为了验证本文拟牛顿修正算法及其计算效率，运用文献[25]设计的算例进行了分析计算，并与已有的ICWTLS算法估计结果进行了比较。主要讨论了两种情况，一是验证本文算法的适用性，不考虑系数矩阵和观测量的元素的精度及相关性，即Q(或P)矩阵为单位矩阵；二是考虑系数矩阵和观测量元素的权阵，即Q(或P)矩阵为一般对称正定矩阵。

3.1 系数矩阵与观测向量元素精度相同且不相关的情况

$$ \begin{array}{l} \mathit{\boldsymbol{A}} = \\ \left\{ {\begin{array}{*{20}{c}} {0.9501}&{0.7620}&{0.6153}&{0.4057}\\ {0.2311}&{0.4564}&{0.7919}&{0.9354}\\ {0.6068}&{0.0185}&{0.9218}&{0.9169}\\ {0.4859}&{0.8214}&{0.7382}&{0.4102}\\ {0.8912}&{0.4447}&{0.1762}&{0.8936} \end{array}} \right\},\mathit{\boldsymbol{y}} = \left\{ {\begin{array}{*{20}{c}} {0.0578}\\ {0.3528}\\ {0.8131}\\ {0.0098}\\ {0.1388} \end{array}} \right\} \end{array} $$

$$ \mathit{\boldsymbol{C}} = \left\{ {\begin{array}{*{20}{c}} { - 0.2027}&{ - 0.2721}&{ - 0.7467}&{ - 0.4659}\\ { - 0.1987}&{ - 0.1988}&{ - 0.4450}&{ - 0.4186}\\ { - 0.6037}&{ - 0.0152}&{ - 0.9318}&{ - 0.8462} \end{array}} \right\} $$

$$ \mathit{\boldsymbol{w}} = \left\{ {\begin{array}{*{20}{c}} { - 0.5251}\\ { - 0.2026}\\ { - 0.6721} \end{array}} \right\}, - 0.1 \le {\mathit{\boldsymbol{\xi }}_i} \le 2\left( {i = 1,2,3,4} \right) $$

系数矩阵A ∈R^5×4，模型参数ξ∈R^4×1，观测向量y ∈R^5×1；A和y所有元素为等精度且不相关；共11个不等式约束方程，参数区间－0.1≤ξ_i≤2(i=1, 2, 3, 4)表示为(I₄⊗[1, -1]^T)ξ≥(l₄^T⊗[-0.1, -2]^T)(I₄表示4阶单位矩阵；l₄^T表示4×1阶元素为1的矩阵)。

ICWTLS算法的结果见表 1，本文同时计算了不考虑约束时的总体最小二乘解$ {{\mathit{\boldsymbol{\hat \xi }}}_{{\rm{TLS}}}} $，并作为计算ICWTLS解的初始值。

表 1 单位权阵下的计算结果

Table 1. Estimation Results of Unit Weight Condition

参数	$ {{\mathit{\boldsymbol{\hat \xi }}}_{{\rm{本文}}}} $	$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICWTLS}}}^{\left[{20} \right]} $	$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICTLS}}}^{\left[{19} \right]} $	$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{TLS}}}^{} $
$ {{\mathit{\boldsymbol{\hat \xi }}}_1} $	-0.100 000 0	-0.100 000 2	-0.100 0	0.188 8
$ {{\mathit{\boldsymbol{\hat \xi }}}_2} $	-0.100 000 0	-0.100 000 0	-0.100 0	-0.716 7
$ {{\mathit{\boldsymbol{\hat \xi }}}_3} $	0.168 547 2	0.168 547 2	0.168 5	0.560 5
$ {{\mathit{\boldsymbol{\hat \xi }}}_4} $	0.399 776 6	0.399 776 8	0.399 8	0.210 6
k	8	4	204 8	-
注：k为迭代次数

下载: 导出CSV

| 显示表格

(1) 本文的计算结果与文献[20]的结果$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICWTLS}}}^{\left[{20} \right]} $及文献[19]采用穷举法的结果$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICTLS}}}^{\left[{19} \right]} $几乎一致，说明算法迭代中用近似矩阵代替Hesse矩阵并不影响参数估计结果；不等式$ \mathit{\boldsymbol{C\hat \xi }} - \mathit{\boldsymbol{w}} $=[0.260 5, 0, 0.238 6, 0, 2.100 0, 0, 2.100 0, 0.268 5, 1831 5, 0.499 8, 1.600 2]^T≥0；全部满足不等式约束条件方程。本文算法与文献[20]的算法迭代次数明显少于采用穷举法的迭代次数；说明两者在本算例中都是适用的且有很好的运算效率。

(2) 本文算法迭代次数为8次，多于文献[20]的次数(4次)，这是由于本文算法是通过近似矩阵代替目标函数的Hesse矩阵，可以大大减少计算量和存储量，但迭代过程中是近似牛顿型搜索，而直接运用Hesse矩阵的文献[20]算法是牛顿型搜索，因此，当迭代过程中Hesse矩阵是对称正定矩阵时，后者收敛迭代次数会更少；算例一可以验证算法的有效性，但观测数据量有限，因此，本文算法在计算量和存储量方面的优势没有很好体现。

3.2 系数矩阵与观测向量元素精度不相同且相关的情况

当考虑系数矩阵元素和观测向量的元素精度不相同且相关时，则对应的Q矩阵为非单位阵，为一般正定对称矩阵；在文献[20]中，由于矩阵Q的复杂性，将直接导致Hesse的计算量增大；用Toeplitz矩阵来构造Q矩阵，且矩阵元素为q_ij=1－|i－j|/25(1≤i, j≤25)。计算结果见表 2。

表 2 精度不相同且相关情况下的计算结果

Table 2. Estimation Results of Unequal Precision and Relative Condition

参数	$ {{\mathit{\boldsymbol{\hat \xi }}}_1} $	$ {{\mathit{\boldsymbol{\hat \xi }}}_2} $	$ {{\mathit{\boldsymbol{\hat \xi }}}_3} $	$ {{\mathit{\boldsymbol{\hat \xi }}}_4} $	k	T/s
$ {{\mathit{\boldsymbol{\hat \xi }}}_{{\rm{本文}}}} $	-0.014 929 32	-0.100 000 00	-0.081 021 650	0.624 401 911	9	1.0
$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICWTLS}}}^{\left[{20} \right]} $	-0.014 929 34	-0.100 000 00	-0.081 021 650	0.624 401 912	127	11.5
注：k为迭代次数，T为迭代时间

下载: 导出CSV

| 显示表格

由表 2，两种算法都适用解决加权的ICTLS问题，所得参数解几乎完全一致；同样全部满足不等式约束方程；但本文的计算效率明显高于文献[20]的ICWTLS算法，本文算法迭代次数为9次，而后者迭代了127次；算法收敛时间T分别约为1.0 s和11.5 s，避免了直接计算Hesse矩阵，大大减少了计算量。迭代过程发现，目标函数的Hesse矩阵出现非正定的情况，导致文献[20]的算法不能保证每次搜索方向都是下降方向，这将影响其收敛速度；本文算法每次迭代近似矩阵都是正定矩阵，每次的搜索方向都是下降的，因此，本文算法的收敛速度比文献[20]算法快。

4 结语

当模型参数存在先验信息时，需要结合这些先验信息来求解参数，如用大地测量方法反演地震断层模型参数^[26]，根据先验信息可以判断断层参数在某个区间范围或边界条件内取得，因此，在估计模型参数时充分考虑先验信息的约束可以得到更合理的结果。

本文通过研究附有约束的EIV模型，利用拟牛顿修正法来解算ICWTLS问题。本文算法可以解决观测向量和系数矩阵元素精度不相同且相关的情况；针对文献[20]的算法对于大规模参数估计存在计算量大且复杂的问题，本文通过拟牛顿法校正得到的近似矩阵来代替Hesse矩阵，使得ICWTLS算法的计算量大大减少，更适合解决参数估计中观测数据量较大，模型参数较多的问题；本文校正矩阵在每次迭代中都确保其为对称正定矩阵，这就使得算法具有较好的收敛速度；本文分析了关于拟牛顿修正矩阵在解决ICWTLS问题的严密性。值得注意的是，当ICEIV模型系数矩阵同时存在随机和非随机元素时，可以通过文献[27]中提出的5条定权准则来确定权矩阵，此时附不等式约束问题加权总体最小二乘问题的拟牛顿修正算法仍然适用；也可以将模型转化为PEIV模型^[28]，运用本文算法进行求解。

表 1 单位权阵下的计算结果

Table 1 Estimation Results of Unit Weight Condition

参数	$ {{\mathit{\boldsymbol{\hat \xi }}}_{{\rm{本文}}}} $	$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICWTLS}}}^{\left[{20} \right]} $	$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICTLS}}}^{\left[{19} \right]} $	$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{TLS}}}^{} $
$ {{\mathit{\boldsymbol{\hat \xi }}}_1} $	-0.100 000 0	-0.100 000 2	-0.100 0	0.188 8
$ {{\mathit{\boldsymbol{\hat \xi }}}_2} $	-0.100 000 0	-0.100 000 0	-0.100 0	-0.716 7
$ {{\mathit{\boldsymbol{\hat \xi }}}_3} $	0.168 547 2	0.168 547 2	0.168 5	0.560 5
$ {{\mathit{\boldsymbol{\hat \xi }}}_4} $	0.399 776 6	0.399 776 8	0.399 8	0.210 6
k	8	4	204 8	-
注：k为迭代次数

下载: 导出CSV

表 2 精度不相同且相关情况下的计算结果

Table 2 Estimation Results of Unequal Precision and Relative Condition

参数	$ {{\mathit{\boldsymbol{\hat \xi }}}_1} $	$ {{\mathit{\boldsymbol{\hat \xi }}}_2} $	$ {{\mathit{\boldsymbol{\hat \xi }}}_3} $	$ {{\mathit{\boldsymbol{\hat \xi }}}_4} $	k	T/s
$ {{\mathit{\boldsymbol{\hat \xi }}}_{{\rm{本文}}}} $	-0.014 929 32	-0.100 000 00	-0.081 021 650	0.624 401 911	9	1.0
$ \mathit{\boldsymbol{\hat \xi }}_{{\rm{ICWTLS}}}^{\left[{20} \right]} $	-0.014 929 34	-0.100 000 00	-0.081 021 650	0.624 401 912	127	11.5
注：k为迭代次数，T为迭代时间

下载: 导出CSV

参考文献(28)

[1]	王乐洋.基于总体最小二乘的大地测量反演理论及其应用研究[J].测绘学报, 2012, 41(4):629 http://d.wanfangdata.com.cn/Periodical_chxb201204028.aspx Wang Leyang. Research on Theory and Application of Total Least Squares in Geodetic Inversion[J]. Acta Geodaetica et Cartographica Sinica, 2012, 41(4):629 http://d.wanfangdata.com.cn/Periodical_chxb201204028.aspx
[2]	Schaffrin B, Wieser A. On Weighted Total Least Squares Adjustment for Linear Regression[J]. Journal of Geodesy, 2008, 82(7):415-421 doi: 10.1007/s00190-007-0190-9
[3]	Shen Yunzhong, Li Bofeng, Chen Yi. An Iterative Solution of Weighted Total Least-Squares Adjusment[J]. Journal of Geodesy, 2010, 85(4):229-238 http://d.wanfangdata.com.cn/Periodical_chxb201204028.aspx
[4]	Mahboub V. On Weighted Total Least-Squares for Geodetic Transformation[J]. Journal of Geodesy, 2012, 86(5):359-367 doi: 10.1007/s00190-011-0524-5
[5]	Fang Xing. Weighted Total Least Squares Solutions for Applications in Geodesy[D]. Germany: Leibniz University Hannover, 2011
[6]	Fang Xing. Weighted Total Least Squares:Necessary and Sufficient Conditions, Fixed and Random Parameters[J]. Journal of Geodesy, 2013, 87(8):733-749 doi: 10.1007/s00190-013-0643-2
[7]	王乐洋, 于冬冬.病态总体最小二乘问题的虚拟观测解法[J].测绘学报, 2014, 43(6):575-581 http://or.nsfc.gov.cn/handle/00001903-5/264987 Wang Leyang, Yu Dongdong. Virtual Observation Method to Ill-posed Total Least Squares Problem[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(6):575-581 http://or.nsfc.gov.cn/handle/00001903-5/264987
[8]	王乐洋, 许光煜.加权总体最小二乘平差随机模型的验后估计[J].武汉大学学报·信息科学版, 2016, 41(2):255-261 http://ch.whu.edu.cn/CN/abstract/abstract3464.shtml Wang Leyang, Xu Guangyu. Application of Posteriori Estimation of Stochastic Model on the Weighted Total Least Squares Problem[J]. Geomatics and Information Science of Wuhan University, 2016, 41(2):255-261 http://ch.whu.edu.cn/CN/abstract/abstract3464.shtml
[9]	王乐洋, 许才军.总体最小二乘研究进展[J].武汉大学学报·信息科学版, 2013, 38(7):850-856 http://ch.whu.edu.cn/CN/abstract/abstract2703.shtml Wang Leyang, Xu Caijun. Progress in Total Least Squares[J]. Geomatics and Information Science of Wuhan University, 2013, 38(7):850-856 http://ch.whu.edu.cn/CN/abstract/abstract2703.shtml
[10]	王乐洋, 许才军.附有相对权比的总体最小二乘平差[J].武汉大学学报·信息科学版, 2011, 36(8):887-890 http://ch.whu.edu.cn/CN/abstract/abstract629.shtml Wang Leyang, Xu Caijun. Total Least Squres Adjustment with Weight Scaling Factor[J]. Geomatics and Information Science of Wuhan University, 2011, 36(8):887-890 http://ch.whu.edu.cn/CN/abstract/abstract629.shtml
[11]	王乐洋, 许才军, 鲁铁定.边长变化反演应变参数的总体最小二乘方法[J].武汉大学学报·信息科学版, 2010, 35(2):181-184 http://ch.whu.edu.cn/CN/abstract/abstract844.shtml Wang Leyang, Xu Caijun, Lu Tieding. Inversion of Strain Parameter Using Distance Changes Based on Total Least Squares[J]. Geomatics and Information Science of Wuhan University, 2010, 35(2):181-184 http://ch.whu.edu.cn/CN/abstract/abstract844.shtml
[12]	曾文宪, 方兴, 刘经南, 等.附有不等式约束的加权整体最小二乘算法[J].测绘学报, 2014, 43(10):1013-1018 https://www.wenkuxiazai.com/doc/a4ba2f6c52d380eb63946d4b-2.html Zeng Wenxian, Fang Xing, Liu Jingnan, et al. Weighted Total Least Squares Algorithm with Inequality Constraints[J]. Acta Geodaetica et Cartographica Sinica, 2014, 43(10):1013-1018 https://www.wenkuxiazai.com/doc/a4ba2f6c52d380eb63946d4b-2.html
[13]	Sima D M, Van H S, Golub G H. Regularized Total Least Squares Based on Quadratic Eigenvalue Problem Solvers[J]. BIT Numerical Mathematics, 2004, 44(4):793-812 doi: 10.1007/s10543-004-6024-8
[14]	Schaffrin B, Felus Y A. On Total Least-Squares Adjustment with Constraints[J]. IAG-Symp, 2005, 128:417-421 doi: 10.1007%2F3-540-27432-4_71
[15]	Schaffrin B, Felus Y A. An Algorithmic Approach to the Total Least-Squares Problem with Linear and Quadratic Constraints[J]. Studia Geophysica et Geodaetica, 2009, 53(1):1-16 doi: 10.1007/s11200-009-0001-2
[16]	Fang Xing. A Structured and Constrained Total Least-Squares Solution with Cross-Covariances[J]. Studia Geophysica et Geodaetia, 2014, 58(1):1-16 doi: 10.1007/s11200-012-0671-z
[17]	Mahboub V, Sharifi M A. On Weighted Total Least Squares with Linear and Quadratic Constraints[J]. Journal of Geodesy, 2013, 87(3):607-608 doi: 10.1007/s00190-012-0598-8
[18]	De Moor B. Total Linear Least Squares with Inequality Constraints[R]. ESAT-SISTA Report 1990-02, Department of Electrical Engineering, Katholieke Universiteit Leuven, Belgium, 1990
[19]	Zhang Songlin, Tong Xiaohua, Zhang Kun. A Solution to EIV Model with Inequality Constraints and Its Geodetic Applications[J].Journal of Geodesy, 2013, 87(1):89-99 doi: 10.1007/s00190-012-0590-3
[20]	Fang Xing. On Non-combinatorial Weighted Total Least Squares with Inequality Constraints[J]. Journal of Geodesy, 2014, 88(8):805-816 doi: 10.1007/s00190-014-0723-y
[21]	Nocedal J, Wright S J. Numerical Optimization[M]. Berlin, Germany:Springer, 2006.
[22]	马昌凤.最优化方法及其MATLAB程序设计[M].北京:科学出版社, 2010 Ma Changfeng. Optimization Method and the MATLAB Programming[M].Beijing:Science Press, 2010
[23]	Xu Peiliang, Liu Jingnan, Shi Chuang. Total Least Squares Adjustment in Partial Errors-in-variables Models:Algorithm and Statistical Analysis[J]. Journal of Geodesy, 2012, 86(8):661-675 doi: 10.1007/s00190-012-0552-9
[24]	Zeng Wenxian, Liu Jingnan, Yao Yibin. On Partial Errors-in-variables Models with Inequality Constraints of Parameters and Variables[J]. Journal of Geodesy, 2015, 89(2):111-119 doi: 10.1007/s00190-014-0775-z
[25]	Peng Junhuan, Guo Chunxi, Zhang Hongping, et al. An Aggregate Constraint Method for Inequality-Constrained Least Squares Problem[J]. Journal of Geodesy, 2006, 79(12):705-713 doi: 10.1007/s00190-006-0026-z
[26]	王乐洋, 许才军, 温扬茂.利用STLN和InSAR数据反演2008年大柴旦Mw6.3级地震断层参数[J].测绘学报, 2013, 42(2):168-176 http://www.cnki.com.cn/Article/CJFDTotal-CHXB201511006.htm Wang Leyang, Xu Caijun, Wen Yangmao. Fault Parameters of 2008 Qinhai Dacaidan Mw 6.3 Earthquake from STLN Inversion and InSAR Data[J]. Acta Geodaetica et Cartographica Sinica, 2013, 42(2):168-176 http://www.cnki.com.cn/Article/CJFDTotal-CHXB201511006.htm
[27]	Mahboub V. On Weighted Total Least-Squares with Linear and Quadratic Constraints[J]. Journal of Geodesy, 2013, 87(3):279-286 doi: 10.1007/s00190-012-0598-8
[28]	Wang Leyang, Xu Guangyu. Variance Component Estimamation for Partial Errors-in-variables Model[J]. Studia Geophysical et Geodaetia, 2016, 60(1):35-55 doi: 10.1007/s11200-014-0975-2

施引文献(11)

期刊类型引用(5)

1.	王乐洋，韩澍豪. 不等式约束下加乘性混合误差模型的简单迭代解法. 武汉大学学报(信息科学版). 2024(06): 996-1004 . 百度学术
2.	陆荣秀，黄学文，杨辉，张智军. 求解时变非线性不等式的新型动态学习网络. 控制工程. 2022(03): 404-412 . 百度学术
3.	王乐洋，邹传义. PEIV模型参数估计理论及其应用研究进展. 武汉大学学报(信息科学版). 2021(09): 1273-1283+1297 . 百度学术
4.	王乐洋，邹传义，吴璐璐. 不等式约束Partial EIV模型的WHP拟牛顿修正解法及其精度评定的SUT法. 大地测量与地球动力学. 2019(06): 648-653 . 百度学术
5.	张波，潘双彦. 含不等式约束的总体最小二乘算法在矿山测量数据处理中的应用研究. 决策探索(中). 2018(05): 18-19 . 百度学术