-
星载原子钟是卫星导航系统中导航信号形成和系统核心荷载的重要组成部分,其性能直接决定着系统的导航、定位和授时的质量[1-2]。卫星钟差数据的质量直接影响星载原子钟性能分析结果的可靠性和钟差预报的精度[3]。实际上,由于星地时间观测受大气层和地球表面环境影响,时间观测序列容易出现粗差[4]。北斗卫星导航系统(BeiDou navigation satellite system,BDS)正式提供服务以来,早期在轨的星载原子钟的稳定度和精度不及GPS[2],随着BDS全球系统建设的快速推进,钟差数据的质量稳步提升,但由于系统星座设计和数据解算的差异,BDS的卫星钟差包含一定量的异常值。为保证钟差预报的质量和星载原子钟性能分析的可靠性,需要对异常值进行处理。
目前,国内外对卫星钟差异常值处理的研究还不够深入,主要针对GPS钟差数据进行,作为钟差预报和性能分析的部分内容[5-8]。对钟差异常值处理的方法主要有中位数法及相应的改进算法[1, 9]、Allan方差法[10-11]、χ2检验法[2, 12]、小波分析方法[13]和贝叶斯估计方法[4, 14]等。上述方法主要存在两方面的不足:(1)算法结构简单,如中位数法,对异常值的大小不敏感,易出现漏判或错判的问题,依赖人工设定阈值,且难以准确区分异常值的类型,处理不当会引入新的异常值;(2)算法结构复杂,如贝叶斯估计方法,虽有效地提升了处理质量,但算法复杂、过程繁琐,需经过多次迭代运算,增加了探测结果的不确定性。
钟差异常值处理主要包括异常值类型识别和异常值修复,其中,异常值类型识别是异常值处理的核心和关键。如郭海荣[1]针对不同类型的钟差异常值提出了不同的修复方法,具备较强的实用性,如对于粗差问题,一般采用剔除的方法修复;跳变问题可进一步分为相位跳变和频率跳变,相位跳变一般通过剔除相位跳变点修复,频率跳变一般通过将跳变前后数据分段处理进行修复;对于数据间断问题,数据间隔较小的可以通过数据内插进行处理,而间隔较大的一般进行分段处理,所以钟差异常值有效处理的关键是异常值类型的快速准确识别。目前,现有方法对异常值类型识别问题的研究不足,尤其是针对BDS钟差数据质量的研究。为此,本文提出一种面向BDS钟差的异常值类型识别方法,实现BDS钟差异常值的准确识别。
本文首先提出了一种通过判断钟差数据图形化特征差异来识别异常值的策略,基于图像识别的原理,将具备不同图形化特征的异常值进行分类,使异常值类型的判断更符合人类的认知习惯;然后设计了一种基于卷积神经网络(convolutional neural network,CNN)模型的BDS钟差异常值类型识别方法,采用监督学习工作模式,制作模型训练集,通过不断优化模型参数,生成性能稳定的钟差异常值类型识别模型。
-
国际卫星导航系统服务(International GNSS Service,IGS)公开提供的BDS精密钟差数据存在不同类型的异常值,在利用BDS钟差数据进行钟差预报和性能分析之前,必须对异常值进行处理,建立一个钟差异常值处理模型,将影响钟差预报和性能分析的异常值准确识别出来并修复。本文基于图像识别的原理,利用钟差数据的图形化特征差异进行异常值类型的识别,主要包含两个步骤:(1)比较BDS数值型钟差数据与图形化钟差数据在特征表达方面的优劣,结果表明图形化钟差数据更适合进行异常值识别;(2)按照异常值的图形化特征差异,将异常值进行分类,建立异常值特征分类模型。
-
钟差的测量数据包含相位数据和频率数据两种类型。其中,相位数据是基础表征,频率数据是描述频率源内部参数的观测量[15],一般通过对相位数据进行一次差分获得,也可称为钟差一次差分数据。在对钟差数据进行分析时,由于相位数据的有效位比较多,不利于异常值的发现和剔除,而频率数据对异常值更加敏感,所以,本文拟采用两种类型数据进行分析。
常用的钟差异常值分析方法是图形化分析,通过可视化方法可以粗略判断异常值情况[3]。本文选取C01和C13两颗BDS卫星在2018-12-02—2018-12-31期间的精密钟差数据(采样间隔为30 s)进行数据特征分析。BDS钟差数据存在一定数量的粗差、数据间断、跳变等异常情况[16],如图 1所示。C01星的相位数据存在数据间断点,伴随有相位跳变,数据连续性较差(见图 1(a)),对应的频率数据中存在同样的情况(见图 1(b));C13星的相位数据整体上连续性较好,跳变点和间断点较少(见图 1(c)),但其对应的频率数据存在明显的跳变点,而且存在大量的微小跳变点(见图 1(d)),其他的BDS卫星均存在上述问题。
综上,BDS钟差数据有以下3个特点:
1)数据的连续性较差,存在一定数量的间断点;
2)连续的数据也存在一定数量的粗差;
3)数据的异常情况复杂,存在部分复合型异常值。
由于钟差数据处理的关键是异常值类型的准确识别,传统方法通过人为设置约束性条件、遍历数据集来识别异常值,不仅容易遗漏异常值,而且无法准确识别异常值的类型,进而影响异常值的修复,因此,本文将数值型的钟差数据转换为图像格式,对钟差异常值的图像特征判断更符合人类的认知习惯。通过判断钟差数据的图形化特征识别异常值的类型,可以有效规避传统方法的弊端,是一种识别异常值数量和类型的有效方法。
-
本文通过训练神经网络模型实现异常值类型的识别,而异常值的合理分类决定模型的健壮度。钟差从数据质量的角度可以简单地分为“正常”和“异常”两类。对于正常数据,由于卫星之间星载原子钟特性、轨道参数等方面的差异,导致不同卫星钟差的正常数据图形特征存在差异,总体上表现为在同一时间段内,正常数据存在单调增大和单调减小两种图形特征,而异常数据的图形特征更为复杂,加之不同类型的异常值需有不同的修复策略,所以需要科学合理地对钟差数据进行分类,尤其是对异常值分类,进而建立钟差异常值分类模型。
本文按照钟差异常值的图形特征差异分别对相位数据和频率数据进行分类与编码,按照层次递进思路进行分类,直到特征具备高度的一致性为止。从图 2可以看出,相位数据和频率数据的分类树状模型具有鲜明的层次性特点。
相位数据分为正常数据和异常数据,对于正常数据,根据相位数据的单调变化趋势,可继续分为趋势递增和趋势递减,并将这两类特征分别编码为A-0和A-1。对于异常数据,按照图形特征差异可分为相位粗差、相位跳变、相位间断和异常波动,按照层次递进的思路,上述4类异常可进一步细分为15种异常类型,分别编码为A-2~A-16,最终形成17种基本的相位数据特征类型,如图 2(a)所示。同理,对频率数据进行特征分类与编码,形成7种基本的频率数据特征类型,如图 2(b)所示。通过上述处理,构建了钟差数据异常值分类模型,对于每一种钟差特征都有对应的类别范畴。这使得在训练集制作过程中,人工对数据特征进行分类有了明确的执行标准。
-
卷积神经网络在处理图像数据集分类的问题上具有突出优势,应用广泛[16]。本文通过对数值型钟差数据进行图形化转换,将钟差异常值识别问题转换为图像识别问题,包括训练集制作和异常值识别模型构建。
-
训练集是模型输入端的输入数据,训练集包含样本集和标签集。对于监督学习,样本集需要人工标定,对于非监督学习,则无需人工标定。本文采用监督学习的方式,需要对样本集中钟差的图形特征类型进行人工标定。
钟差的相位数据和频率数据的图形化特征明显,为尽可能减少单张图片在训练时所占用的计算资源,本文在将数值型的钟差数据转换为彩色图像格式后,进一步转换为灰度二值图,位深度为8(默认为32),降低了单张图片占用的内存空间。本文利用IGS中心提供的14颗BDS卫星在2018-09-01—2018-12-31期间的精密钟差数据,采样间隔为30 s,训练集中每张图片包含100个采样点,共计生成15 000张有效图片(数据间断产生的无效图片和部分特征高度相似的冗余图片不加入训练集)。将上述图片按照图 2所示的分类模型进行分类,形成样本集,采用“图片编号-特征编码”的格式,人工标定每张图片的标签,形成标签集。
-
CNN作为一种受到生物学研究启发的经验方法,主要用于图像特征的提取与分类,自从Lecun等[17]提出的LeNet-5模型成功应用于手写数字识别等简单图像分类问题后,CNN的研究不断深入,并成功应用于人脸识别[18]、语音识别[19]、物体检测[20]、行人检测[21]、行为识别[22-23]、人体姿势识别[24]、自然语言处理[25-26]等诸多领域。图 3为典型的CNN的结构示意图,主要由输入层、卷积层、池化层、全连接层和输出层组成。
设$ X $为输入层输入的原始图像,i为卷积层数,$ {T}_{i} $表示第$ i $层的特征图,其中$ {T}_{0}=X $。$ {T}_{i} $的计算式为:
$$ {T}_{i}=f({T}_{i-1}\otimes {{\mathit{\boldsymbol{W}}}}_{i}+{{\mathit{\boldsymbol{b}}}}_{i}) $$ (1) 式中,$ f $表示激励函数;$ {{\mathit{\boldsymbol{W}}}}_{i} $表示第$ i $层卷积核的权值向量;运算符$ \otimes $表示卷积核与第$ i-1 $层图像或者特征图进行卷积操作;$ {{\mathit{\boldsymbol{b}}}}_{i} $表示第$ i $层的偏移向量。
池化层是卷积层的下一层,在尽可能保持特征表达一致性的前提下,对特征图进行降维,减少采样点的数量。首先经过多次卷积层和池化层特征的交叉传递,然后通过一个全连接层对特征进行分类,得到特征概率分布结果$ Y $,计算式为:
$$ {Y}_{j}=P\left(L\right({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}})={l}_{j}|{T}_{0}({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}})) $$ (2) 式中,$ {l}_{j} $表示第j个标签类别;$ L({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}}) $为最小化网络损失函数。设样本数据为$ N $,常用的损失函数有均方根误差(root mean squared error,RMSE)和负对数似然(negative log likelihood,NLL)[27],计算式分别为:
$$ \mathrm{R}\mathrm{M}\mathrm{S}\mathrm{E}=\frac{1}{N}\sum\limits_{j=1}^{N}({Y}_{j}-{\widehat{Y}}_{j}{)}^{2} $$ (3) $$ \mathrm{N}\mathrm{L}\mathrm{L}=-\sum\limits_{j=1}^{N}\mathrm{l}\mathrm{n}{Y}_{j} $$ (4) 为减小过拟合问题的影响,一般通过设置参数$ \lambda $控制过拟合的强度,计算式为:
$$ E({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}})=L({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}})+\frac{\lambda }{2}{{\mathit{\boldsymbol{W}}}}^{\mathrm{T}}{\mathit{\boldsymbol{W}}} $$ (5) 式中,$ E({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}}) $表示最终的损失函数。为控制参数更新的强度,设置学习速率$ \eta $,则$ {{\mathit{\boldsymbol{W}}}}_{j}\mathrm{、}{{\mathit{\boldsymbol{b}}}}_{j} $的计算式为:
$$ {{\mathit{\boldsymbol{W}}}}_{j}={{\mathit{\boldsymbol{W}}}}_{j}-\eta \frac{\partial E({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}})}{\partial {{\mathit{\boldsymbol{W}}}}_{j}} $$ (6) $$ {{\mathit{\boldsymbol{b}}}}_{j}={{\mathit{\boldsymbol{b}}}}_{j}-\eta \frac{\partial E({\mathit{\boldsymbol{W}}}, {\mathit{\boldsymbol{b}}})}{\partial {{\mathit{\boldsymbol{b}}}}_{j}} $$ (7) CNN也广泛应用于图像识别领域,不同于传统的图像识别方法,它无需领域专家手工设计特征,直接利用神经网络模型自动识别图像特征,极大地减少了模型设计阶段的工作量。基于上述特点,本文直接将CNN模型引入钟差异常值类型特征识别,提出了BDS卫星钟差数据异常值识别的CNN方法,主要过程如下:
1)通过将数值型的钟差原始数据(相位数据和频率数据)进行图形化转换,并对其进行压缩,转化为低位深度的灰度二值图;
2)利用异常值分类模型对格式转换后的图像进行人工分类,并生成对应的标签集;
3)利用CNN对训练集进行训练,通过多次迭代和参数自动优化,得到持久化的异常值特征识别模型,并可以通过更新训练集,不断增强模型的健壮度;
4)利用真实数据生成模型的测试集,测试模型识别的准确率。
-
本文采用IGS数据中心公开提供的BDS精密钟差数据分别制作了相位数据和频率数据的训练集(2018-09-01—2018-12-31)和测试集(2018-08-01—2018-08-15)。表 1为实验数据的基本情况,为保证实验数据条件的一致性,相位数据与频率数据的训练集样本数量一致,均为15 000个,测试集样本数量也是一致的,均为4 000个。为减少实验结果的随机性,将测试集分为测试集T1和T2,样本数量分别为1 000个和3 000个。
表 1 实验数据的基本情况
Table 1. Basic Information of Experimental Data
数据集 样本数量 相位数据 频率数据 训练集 15 000 15 000 测试集 T1 1 000 1 000 T2 3 000 3 000 本文的实验平台基于Google第二代深度学习框架TensorFlow(1.0),利用GitHub上丰富的模型库,搭建实验平台,训练识别模型。
-
TensorFlow提供了其框架下定义经典的CNN模型文件(LeNet-5模型),以及控制模型训练和测试的参数文件。本文已按照§2.1中的方法制作了训练集,并修改了LeNet-5模型数据输入端的接口参数和在模型训练中需要优化调整的LeNet-5模型的超参(在训练之前设置参数)。相位数据识别模型(相位模型)和频率数据识别模型(频率模型)的超参配置见表 2。
表 2 相位模型和频率模型的超参配置
Table 2. Hyper-Parameters Configuration of Phase Model and Frequency Model
参数 相位模型 频率模型 输入节点/个 2 400 2 400 输出节点/个 17 7 批处理数量/个 500 500 学习率 0.8 0.8 衰减率 0.99 0.99 正则化系数 0.000 1 0.000 1 训练轮数/次 3 000 3 000 表 2中的输入节点是指模型输入层的节点数,对于图像格式的数据就是指图片的像素数,本文样本图片像素数为60×40=2 400;输出节点是指输出层的节点数,具体是指特征类型的数量,本文将相位数据特征类型(包含正常数据和异常数据)分为17类,将频率数据特征类型(包含正常数据和异常数据)分为7类;批处理数量是指一个训练批次中训练数据的个数,一般取经验值,本文经过多次实验,确定批处理数量的取值为500个;学习率决定了参数更新的速度,一般取经验值,TensorFlow提供了一种更加灵活的学习率设置方法,首先通过设定较大的基础学习率来快速达到最优解,然后设置衰减率逐步迭代减小学习率,这样可以使得模型训练后期容易稳定,本文通过多次实验,确定相位模型和频率模型的基础学习率的取值为0.8,衰减率取值为0.99;正则化系数是描述模型复杂度的正则化项在损失函数中的系数,主要是为了克服模型过拟合的问题,经多次实验,确定相位模型和频率模型的正则化系数的取值为0.000 1;训练轮数是指模型迭代训练的次数,取值一般通过具体实验效果确定,当模型的损失值达到最小值且变化趋于稳定,准确值达到最大值且变化趋于稳定时,确定相位模型和频率模型的训练轮数均为3 000次。
本文利用训练集数据,按照表 2中的超参配置,分别对相位模型和频率模型进行训练,通过计算训练过程中的损失值和准确率,判断训练效果。图 4、图 5分别为相位模型和频率模型训练时损失值和准确率的变化曲线,测试集T1参与计算了模型训练过程中准确率的变化,为提高计算效率,每10次迭代训练进行一次采样,通过3 000次的迭代训练,相位模型和频率模型的损失值和准确率曲线均显示较好的收敛效果,其中相位模型的损失值和准确率分别收敛于0.216 083和99.8%,模型训练时间为314 s,频率模型的损失值和准确率分别收敛于0.223 511和99.6%,模型训练时间为307 s。
-
虽然相位模型和频率模型的训练准确率分别达到了99.8%和99.6%,反映出模型在正确识别上达到了很好的效果,但测试集数据存在随机性。为进一步验证模型的有效性,本文利用测试集T1和T2对模型的正确识别能力进行测试,结果见表 3、表 4。可见相位模型和频率模型对两组测试集识别的平均准确率均高于99.6%,实验结果进一步证明了模型的有效性。
表 3 相位模型测试结果
Table 3. Test Results of Phase Model
测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% 测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% T1 A-0 260 260 100 99.8 T2 A-0 760 760 100 99.7 A-1 290 290 100 A-1 870 870 100 A-2 11 11 100 A-2 45 45 100 A-3 4 4 100 A-3 30 30 100 A-4 4 4 100 A-4 6 6 100 A-5 3 3 100 A-5 9 9 100 A-6 65 65 100 A-6 255 255 100 A-7 10 10 100 A-7 30 30 100 A-8 23 23 100 A-8 100 97 97.0 A-9 20 19 95.0 A-9 80 77 96.2 A-10 10 10 100 A-10 50 50 100 A-11 15 15 100 A-11 45 45 100 A-12 4 4 100 A-12 10 10 100 A-13 2 2 100 A-13 15 15 100 A-14 49 49 100 A-14 200 198 99.0 A-15 30 29 96.6 A-15 100 99 99.0 A-16 200 200 100 A-16 395 395 100 表 4 频率模型测试结果
Table 4. Test Results of Frequency Model
测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% 测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% T1 B-0 400 397 99.2 99.6 T2 B-0 900 894 99.3 99.8 B-1 176 176 100 B-1 450 450 100 B-2 159 159 100 B-2 680 680 100 B-3 75 75 100 B-3 230 230 100 B-4 55 54 98.1 B-4 220 220 100 B-5 74 74 100 B-5 265 265 100 B-6 61 61 100 B-6 255 255 100 为进一步分析模型的特征识别效果,分别将两次实验中相位模型和频率模型识别错误的样本进行了对比分析,模型识别错误统计见表 5,模型识别错误结果图如图 6所示。
表 5 模型识别错误结果统计
Table 5. Statistical Results of Identification Errors of Two Models
位置编号 测试集 识别类型 真实类型 位置编号 测试集 识别类型 真实类型 位置编号 测试集 识别类型 真实类型 (1, 1) T1 A-9 A-15 (2, 1) T2 A-7 A-8 (3, 1) T1 B-1 B-0 (1, 2) T1 A-6 A-9 (2, 2) T2 A-15 A-9 (3, 2) T2 B-4 B-0 (1, 3) T2 A-7 A-9 (2, 3) T2 A-8 A-14 (3, 3) T2 B-4 B-0 (1, 4) T2 A-9 A-15 (2, 4) T2 A-6 A-8 (3, 4) T2 B-4 B-0 (1, 5) T2 A-6 A-9 (2, 5) T1 B-0 B-4 (3, 5) T2 B-4 B-0 (1, 6) T2 A-6 A-14 (2, 6) T1 B-2 B-0 (3, 6) T2 B-2 B-0 (1, 7) T2 A-7 A-8 (2, 7) T1 B-2 B-0 (3, 7) T2 B-2 B-0 由表 5和图 6可知,相位模型的测试结果中有11个错误识别((1,1)、(1,2)、(1,3)、(1,4)、(1,5)、(1,6)、(1,7)、(2,1)、(2,2)、(2,3)、(2,4)),其中真实类型为A-9的图片出现了4次错误识别。
(1,2)和(1,5)将A-9识别为A-6,(1,3)将A-9识别为A-7,这3次模型识别错误都是因为模型无法准确判断大幅跳变和小幅跳变。本文在进行特征分类时,将相位跳变进一步分为大幅跳变和小幅跳变(见图 2),但两者缺乏清晰的特征差异边界,特征相似度较高,导致一些图片识别错误的概率较大。另外,(2,2)将A-9识别为A-15,这是因为模型无法准确判断相位跳变和异常波动。该图片具有复合型异常值特征,即图片中存在一次特征不明显的小幅跳变,但随后出现小幅异常波动,总体上相位跳变是主要特征。本文在对异常值进行分类时暂未考虑复合型异常值,导致模型在识别复合型异常值时存在错误的可能性。相位模型中其他错误识别结果的原因也主要集中在上述两点。
频率模型的测试结果共出现10个错误识别((2,5)、(2,6)、(2,7)、(3,1)、(3,2)、(3,3)、(3,4)、(3,5)、(3,6)、(3,7)),其中真实类型为B-0共出现9次错误识别。(2,6)、(2,7)、(3,6)和(3,7)将类型为B-0的图片识别为B-2,(3,2)、(3,3)、(3,4)和(3,5)将类型为B-0的图片识别为B-4,(3,1)将类型为B-0的图片识别为B-1,上述9次错误的识别结果都是模型无法准确判断正常数据和频率粗差导致的,正常的频率数据存在无规律的随机波动,由于受到多种因素的影响,频率数据会随机地出现个别波动较大的值,属于正常的数据波动,但由于正常数据中波动值的图形特征与频率粗差中异常值波动的图形特征具备一定相似性,导致模型存在一定的概率出现错误识别。对于(2,5),模型将类型为B-4的图片识别为B-0,这同样是模型无法准确判断正常数据和频率粗差导致的,由于图片出现多次均匀波动特征,与正常数据特征相似度较高,故出现错误识别结果,但实际上该图片在后半段是平稳数据,说明前半段的波动异常属于频率粗差类别。
基于上述分析可知,相位模型和频率模型出现识别错误的原因主要有3点:(1)钟差数据某些类型的特征边界不够清晰;(2)未充分考虑存在的复合型特征类型;(3)个别频率数据波动特征随机性较大。
-
本文通过对BDS钟差数据异常值类型识别方法进行分析,提出了一种通过识别钟差数据的图形化特征来识别钟差异常值类型的思路,并利用CNN的基本原理,设计了钟差异常值类型识别模型。实验验证本文方法取得了较好的实验效果。所提方法的优点如下:
1)传统方法依赖人工设置参数门限搜索异常值,不仅搜索效率不高,更难以准确识别异常值的类型,利用钟差数据的图形化特征来识别钟差异常值类型的方法有效规避了传统方法在效率和准确率方面的弊端;
2)充分利用CNN在图像识别方面的独特优势,在实现钟差异常值准确识别的同时,CNN模型可以通过增加训练样本,不断增强模型的强壮度和持久性,具备较长的生命周期,模型的维护成本较低;
3)本文方法对钟差异常值的准确识别为异常值修复提供了有效的分类指导,有利于进一步提高钟差异常值处理的质量和效率。
值得注意的是,本文方法仍存在一些需要进一步深入研究和改进的方面:
1)本文对钟差特征分类结果的合理性有待进一步提高,下一步需综合考虑异常值的图形特征和修复方法,面向异常值预处理结果,对钟差特征的分类结果进一步优化;
2)本文模型成长处于早期,需要进一步增加训练样本数量,提高模型的强壮度;
3)模型实现了异常值的准确识别,需进一步整合异常值识别与修复过程的关联性,进而实现钟差数据预处理的智能化。
-
摘要: 北斗卫星导航系统(BeiDou navigation satellite system,BDS)卫星钟差数据中存在多种不同类型的异常值,直接影响钟差预报的质量和性能分析的可靠性。钟差数据预处理是进行钟差预报和分析的前提条件,其中,对异常值的识别是钟差数据预处理的关键。提出一种面向BDS卫星钟差数据异常值识别的卷积神经网络方法。首先将数值型钟差数据转换为灰度二值图格式的数据;然后根据钟差的图形化特征差异进行分类,制作异常值识别的训练集和测试集;最后利用卷积神经网络方法训练钟差数据异常值识别模型,实现钟差数据异常值的精确识别。利用BDS钟差数据进行实验验证,结果表明,所提方法能够精确高效地识别BDS钟差各种类型的异常值,提高了BDS钟差数据预处理的质量和效率。Abstract:
Objectives There are many different types of outliers in the satellite clock bias of BeiDou satellite navigation system(BDS), and these outliers directly affect the prediction quality of clock bias and the reliability of performance analysis. The preprocessing of clock bias is the precondition for the prediction and analysis of clock bias, and the recognition of outliers is the key to the preprocessing. Methods This paper proposes a convolutional neural network(CNN)-based recognition method for outliers of BDS satellite clock bias. Firstly, a strategy is proposed to identify outliers by graphical feature differences of clock bias. Based on the principle of image recognition, outliers with different graphic features are classified to make the judgment of outliers more consistent with human cognitive habits. Then, a CNN-based recognition method for BDS clock bias is designed. Finally, by optimizing the model parameters, the accuracy of model recognition is improved continuously. Results By using the BDS satellite clock data publicly provided by the International GNSS Service (IGS) data center, a training set and two test sets containing both phase data and frequency data are made. Under the same experimental conditions, the accuracy of phase model and frequency model in these two test sets are more than 99.6%. Conclusions The proposed method can accurately identify the types of outliers and improve the quality of the pretreatment of clock bias. -
表 1 实验数据的基本情况
Table 1. Basic Information of Experimental Data
数据集 样本数量 相位数据 频率数据 训练集 15 000 15 000 测试集 T1 1 000 1 000 T2 3 000 3 000 表 2 相位模型和频率模型的超参配置
Table 2. Hyper-Parameters Configuration of Phase Model and Frequency Model
参数 相位模型 频率模型 输入节点/个 2 400 2 400 输出节点/个 17 7 批处理数量/个 500 500 学习率 0.8 0.8 衰减率 0.99 0.99 正则化系数 0.000 1 0.000 1 训练轮数/次 3 000 3 000 表 3 相位模型测试结果
Table 3. Test Results of Phase Model
测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% 测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% T1 A-0 260 260 100 99.8 T2 A-0 760 760 100 99.7 A-1 290 290 100 A-1 870 870 100 A-2 11 11 100 A-2 45 45 100 A-3 4 4 100 A-3 30 30 100 A-4 4 4 100 A-4 6 6 100 A-5 3 3 100 A-5 9 9 100 A-6 65 65 100 A-6 255 255 100 A-7 10 10 100 A-7 30 30 100 A-8 23 23 100 A-8 100 97 97.0 A-9 20 19 95.0 A-9 80 77 96.2 A-10 10 10 100 A-10 50 50 100 A-11 15 15 100 A-11 45 45 100 A-12 4 4 100 A-12 10 10 100 A-13 2 2 100 A-13 15 15 100 A-14 49 49 100 A-14 200 198 99.0 A-15 30 29 96.6 A-15 100 99 99.0 A-16 200 200 100 A-16 395 395 100 表 4 频率模型测试结果
Table 4. Test Results of Frequency Model
测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% 测试集 特征类型 测试数/个 正确数/个 准确率/% 平均准确率/% T1 B-0 400 397 99.2 99.6 T2 B-0 900 894 99.3 99.8 B-1 176 176 100 B-1 450 450 100 B-2 159 159 100 B-2 680 680 100 B-3 75 75 100 B-3 230 230 100 B-4 55 54 98.1 B-4 220 220 100 B-5 74 74 100 B-5 265 265 100 B-6 61 61 100 B-6 255 255 100 表 5 模型识别错误结果统计
Table 5. Statistical Results of Identification Errors of Two Models
位置编号 测试集 识别类型 真实类型 位置编号 测试集 识别类型 真实类型 位置编号 测试集 识别类型 真实类型 (1, 1) T1 A-9 A-15 (2, 1) T2 A-7 A-8 (3, 1) T1 B-1 B-0 (1, 2) T1 A-6 A-9 (2, 2) T2 A-15 A-9 (3, 2) T2 B-4 B-0 (1, 3) T2 A-7 A-9 (2, 3) T2 A-8 A-14 (3, 3) T2 B-4 B-0 (1, 4) T2 A-9 A-15 (2, 4) T2 A-6 A-8 (3, 4) T2 B-4 B-0 (1, 5) T2 A-6 A-9 (2, 5) T1 B-0 B-4 (3, 5) T2 B-4 B-0 (1, 6) T2 A-6 A-14 (2, 6) T1 B-2 B-0 (3, 6) T2 B-2 B-0 (1, 7) T2 A-7 A-8 (2, 7) T1 B-2 B-0 (3, 7) T2 B-2 B-0 -
[1] 郭海荣. 导航卫星原子钟时频特性分析理论与方法研究[D]. 郑州: 信息工程大学, 2006 Guo Hairong. Study on the Analysis Theories and Algorithms of the Time and Frequency Characterization for Atomic Clocks of Navigation Satellites[D]. Zhengzhou: Information Engineering University, 2006 [2] 黄观文. GNSS星载原子钟质量评价及精密钟差算法研究[D]. 西安: 长安大学, 2012 Huang Guanwen. Research on Algorithms of Precise Clock Offset and Quality Evaluation of GNSS Satellite Clock[D]. Xi'an: Chang'an University, 2012 [3] 王宁. BDS星载原子钟钟差数据预处理与钟性能分析研究[D]. 郑州: 信息工程大学, 2017 Wang Ning. Study on the Methods of Clock Bias Data Preprocessing and Performance Analysis for On-Board Atomic Clocks of BDS[D]. Zhengzhou: Information Engineering University, 2017 [4] 张倩倩, 韩松辉, 杜兰, 等. 星地时间同步钟差异常处理的Bayesian方法[J]. 武汉大学学报·信息科学版, 2016, 41(6): 772-777 doi: 10.13203/j.whugis20140666 Zhang Qianqian, Han Songhui, Du Lan, et al. Bayesian Methods for Outliers Detection and Estimation in Clock Offset Measurements of Satellite-Ground Time Transfer[J]. Geomatics and Information Science of Wuhan University, 2016, 41(6): 772-777 doi: 10.13203/j.whugis20140666 [5] 郑作亚, 党亚民, 卢秀山, 等. 附有周期项的预报模型及其在GPS卫星钟差预报中的应用研究[J]. 天文学报, 2010, 51(1): 95-102 https://www.cnki.com.cn/Article/CJFDTOTAL-TWXB201001012.htm Zheng Zuoya, Dang Yamin, Lu Xiushan, et al. Prediction Model with Periodic Item and Its Application to the Prediction of GPS Satellite Clock Bias[J]. Acta Astronomica Sinica, 2010, 51(1): 95-102 https://www.cnki.com.cn/Article/CJFDTOTAL-TWXB201001012.htm [6] Heo Y J, Cho J, Heo M B. Improving Prediction Accuracy of GPS Satellite Clocks with Periodic Variation Behaviour[J]. Measurement Science and Technology, 2010, 21(7): 073001 doi: 10.1088/0957-0233/21/7/073001 [7] 雷雨, 赵丹宁. 基于经验模式分解和最小二乘支持向量机的卫星钟差预报[J]. 天文学报, 2014, 55(3): 216-227 https://www.cnki.com.cn/Article/CJFDTOTAL-TWXB201403004.htm Lei Yu, Zhao Danning. The Satellite Clock Bias Forecast Based on Empirical Mode Decomposition and Least Squares Support Vector Machines[J]. Acta Astronomica Sinica, 2014, 55(3): 216-227 https://www.cnki.com.cn/Article/CJFDTOTAL-TWXB201403004.htm [8] 王宇谱, 吕志平, 陈正生, 等. 一种新的钟差预处理方法及在WNN钟差中长期预报中的应用[J]. 武汉大学学报·信息科学版, 2016, 41(3): 373-379 doi: 10.13203/j.whugis20140216 Wang Yupu, Lü Zhiping, Chen Zhengsheng, et al. A New Data Preprocessing Method for Satellite Clock Bias and Its Application in WNN to Predict Medium-Term and Long-Term Clock Bias[J]. Geomatics and Information Science of Wuhan University, 2016, 41(3): 373-379 doi: 10.13203/j.whugis20140216 [9] Riley W J. Handbook of Frequency Stability Analysis[M].Gaithersburg, MD: National Institute of Standards and Technology, 2007 [10] 杨剑, 王泽民, 王贵文, 等. GPS接收机钟跳的研究[J]. 大地测量与地球动力学, 2007, 27(3): 123-127 https://www.cnki.com.cn/Article/CJFDTOTAL-DKXB200703025.htm Yang Jian, Wang Zemin, Wang Guiwen, et al. On Clock Jumps of GPS Receiver[J]. Journal of Geodesy and Geodynamics, 2007, 27(3): 123-127 https://www.cnki.com.cn/Article/CJFDTOTAL-DKXB200703025.htm [11] 牛飞, 韩春好, 张义生, 等. 导航卫星星载原子钟异常监测分析[J]. 武汉大学学报·信息科学版, 2009, 34(5): 585-588 http://ch.whu.edu.cn/article/id/1261 Niu Fei, Han Chunhao, Zhang Yisheng, et al. Analysis and Detection on Atomic Clock Anomaly of Navigation Satellites[J]. Geomatics and Information Science of Wuhan University, 2009, 34(5): 585-588 http://ch.whu.edu.cn/article/id/1261 [12] 黄新明, 龚航, 朱祥维, 等. 基于Kalman滤波器的卫星钟实时异常监测算法[J]. 宇航计测技术, 2011, 31(5): 6-11 doi: 10.3969/j.issn.1000-7202.2011.05.002 Huang Xinming, Gong Hang, Zhu Xiangwei, et al. A Real-Time Anomaly Monitoring Algorithm for Satellite Clock Based on Kalman Filter[J]. Journal of Astronautic Metrology and Measurement, 2011, 31(5): 6-11 doi: 10.3969/j.issn.1000-7202.2011.05.002 [13] 冯遂亮. 原子钟数据预处理与钟性能分析方法研究[D]. 郑州: 信息工程大学, 2009 Feng Suiliang. Study on the Methods of Data Preprocessing and Performance Analysis for Atomic Clocks[D]. Zhengzhou: Information Engineering University, 2009 [14] Zhang G C, Gui Q M, Han S H, et al. A Bayesian Method of GNSS Cycle Slips Detection Based on ARMA Model[C]//2017 Forum on Cooperative Positioning and Service (CPGPS), Harbin, China, 2017 [15] 李斌, 杨富春, 江峻毅. 星载原子钟数据预处理的方法研究[J]. 宇航计测技术, 2015, 35(1): 44-48 doi: 10.3969/j.issn.1000-7202.2015.01.009 Li Bin, Yang Fuchun, Jiang Junyi. Research on the Methods of Preprocessing the Satellite-Borne Atomic Clocks Data[J]. Journal of Astronautic Metrology and Measurement, 2015, 35(1): 44-48 doi: 10.3969/j.issn.1000-7202.2015.01.009 [16] 李彦冬, 郝宗波, 雷航. 卷积神经网络研究综述[J]. 计算机应用, 2016, 36(9): 2 508-2 515 https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY201609029.htm Li Yandong, Hao Zongbo, Lei Hang. Survey of Convolutional Neural Network[J]. Journal of Computer Applications, 2016, 36(9): 2 508-2 515 https://www.cnki.com.cn/Article/CJFDTOTAL-JSJY201609029.htm [17] Lecun Y, Bottou L, Bengio Y, et al. Gradient-Based Learning Applied to Document Recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2 278-2 324 doi: 10.1109/5.726791 [18] Lawrence S, Giles C L, Tsoi A C, et al. Face Recognition: A Convolutional Neural-Network Approach[J]. IEEE Transactions on Neural Networks, 1997, 8(1): 98-113 doi: 10.1109/72.554195 [19] Waibel A, Hanazawa T, Hinton G, et al. Phoneme Recognition Using Time-Delay Neural Networks[J]. IEEE Transactions on Acoustics, Speech, and Signal Processing, 1989, 37(3): 328-339 doi: 10.1109/29.21701 [20] Vaillant R, Monrocq C, Lecun Y. An Original Approach for the Localization of Objects in Images[J]. IEEE Proceedings-Vision, Image and Signal Processing, 1994, 141(4) : 245-250 doi: 10.1049/ip-vis:19941301 [21] Sermanet P, Kavukcuoglu K, Chintala S, et al. Pedestrian Detection with Unsupervised Multi-Stage Feature Learning[C]//2013 IEEE Conference on Computer Vision and Pattern Recognition, Portland, OR, USA, 2013 [22] Ji S W, Xu W, Yang M, et al. 3D Convolutional Neural Networks for Human Action Recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(1): 221-231 doi: 10.1109/TPAMI.2012.59 [23] Karpathy A, Toderici G, Shetty S, et al. Large-Scale Video Classification with Convolutional Neural Networks[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, USA, 2014 [24] Toshev A, Szegedy C. DeepPose: Human Pose Estimation via Deep Neural Networks[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition, Columbus, OH, USA, 2014 [25] Kalchbrenner N, Grefenstette E, Blunsom P. A Convolutional Neural Network for Modelling Sentences[EB/OL]. [26] Kim Y. Convolutional Neural Networks for Sentence Classification[EB/OL]. [27] Murphy K P. Machine Learning: A Probabilistic Perspective[M].Cambridge, MA: MIT Press, 2012 -