一种海上非作战目标实时清洗方法

林雪原, 李雪腾, 潘新龙, 李敏波, 陈祥光

林雪原, 李雪腾, 潘新龙, 李敏波, 陈祥光. 一种海上非作战目标实时清洗方法[J]. 武汉大学学报 ( 信息科学版), 2021, 46(9): 1378-1385. DOI: 10.13203/j.whugis20190274
引用本文: 林雪原, 李雪腾, 潘新龙, 李敏波, 陈祥光. 一种海上非作战目标实时清洗方法[J]. 武汉大学学报 ( 信息科学版), 2021, 46(9): 1378-1385. DOI: 10.13203/j.whugis20190274
LIN Xue-yuan, LI Xue-teng, PAN Xin-long, LI Min-bo, CHEN Xiang-guang. A Real-Time Cleaning Method for Marine Non-Combat Targets[J]. Geomatics and Information Science of Wuhan University, 2021, 46(9): 1378-1385. DOI: 10.13203/j.whugis20190274
Citation: LIN Xue-yuan, LI Xue-teng, PAN Xin-long, LI Min-bo, CHEN Xiang-guang. A Real-Time Cleaning Method for Marine Non-Combat Targets[J]. Geomatics and Information Science of Wuhan University, 2021, 46(9): 1378-1385. DOI: 10.13203/j.whugis20190274

一种海上非作战目标实时清洗方法

基金项目: 

国家自然科学基金 91538201

国家自然科学基金 61671157

烟台市“双百计划”人才项目 YT201803

详细信息
    作者简介:

    林雪原, 博士, 教授, 主要从事信息融合与组合导航工作。linxy_ytcn@126.com

    通讯作者:

    李雪腾,硕士,助理工程师。574862300@qq.com

  • 中图分类号: P208; TP274.2

A Real-Time Cleaning Method for Marine Non-Combat Targets

Funds: 

The National Natural Science Foundation of China 91538201

The National Natural Science Foundation of China 61671157

Double Hundred Plan Talent Project of Yantai City YT201803

More Information
    Author Bio:

    LIN Xue-yuan: LIN Xueyuan, PhD, professor, specializes in information fusion and integrated navigation. E⁃mail: linxy_ytcn@126.com

    Corresponding author:

    LI Xue-teng: LI Xueteng, master, assistant engineer. E-mail: 574862300@qq.com

  • 摘要: 在进行海上作战态势分析时, 通常需要剔除目标海域内对态势分析影响较小的非作战目标, 只保留参考价值较高、作战相关的目标航迹数据。现有的行为规律挖掘方法大多是基于聚类的思想, 作用于非作战目标清洗问题时工作步骤较为复杂、效果较差。结合态势分析需求, 基于相似重复记录检测的思想, 通过定义多维度记录匹配相似度(multi-dimension record similarity, MDRS), 提出了一种海上非作战目标实时清洗方法。通过对多维航迹数据的相似重复检测, 实现对非作战目标的实时清洗。在仿真军事场景上进行实验分析, 结果表明所提方法能够实时、有效地检测出海上非作战目标。
    Abstract:
      Objectives  It is usually necessary to eliminate non-combat targets for conducting marine combat situation analysis. Because non-combat targets have little impacts on situational analysis and the retained combat-correlated targets have high reference value. Most of the existing behavior mining methods, which are based on the idea of clustering, are complicated and ineffective in cleaning of non-combat targets.
      Methods  Therefore, this paper defines multi-dimension record similarity(MDRS) and proposes a real-time cleaning method for marine non-combat targets(MNCT-RTCM). The proposed method realizes the real-time cleaning of non-combat targets by similar duplicate record detection of multi-dimensional track data.
      Results  The experiments are carried out on simulated military scenarios, and the results are evaluated and analyzed by calculating the recall rate and the precision rate.
      Conclusions  The results show that the MNCT-RTCM method can effectively detect non-combat targets and achieve real-time cleaning of noncombat targets in the marine combat environment.
  • 目前,大多数轨迹数据挖掘技术都是通过聚类算法实现的,但实际应用于干扰因素多、数据量大的海战场环境时,该算法存在以下弊端:(1)聚类算法大多是将空间位置相近的轨迹聚为一类,极少考虑战场态势分析所需的目标位置、速度、航向、属性和类型等多维特征;(2)海战场环境下数据量较大,聚类算法复杂的工作过程大大降低了运行速率;(3)海战场环境下的目标航迹复杂多变,面对不同类型的目标,聚类算法的参数设置很难统一;(4)采用聚类算法时,经常分离出一些不属于任何类的噪声点,而在海战场环境下,这些噪声点很可能是具有单元素的特殊群,若将这些特殊群当作噪声点处理,会对战场态势分析结果产生较大的影响。

    本文参考数据预处理技术中的重复数据清洗技术[1],将每条目标航迹数据看作一条记录[2]。在处理航迹数据时,可将两条行为规律相似(空间位置相近、速度和航向相似、敌我属性相同、目标类型一致)的航迹看作相似记录,将复杂的目标航迹行为规律挖掘问题[3-4]转化为较简单的相似重复记录检测问题。并且,在传统的相似重复记录检测[5-6]中,多源数据通常是包含标识符的字符串数据,两个字符串是否相等不能仅通过算术得出,往往需要定义一组等价规则,使得重复记录的清洗变得非常复杂。但在海战场环境下,多源数据是经特殊编码后形成的报文数据,即用数值形式表示航迹中相应的属性信息,如目标的敌我属性,分别用“0”“1”“2”表示我方、敌方和中立方,因此,将相似重复记录检测技术应用于海战场数据处理过程,可大大降低计算记录间匹配相似度的复杂程度,有利于进行目标航迹行为规律挖掘。

    在构建数据库时,需要导入大量的多源数据并进行融合[7-8]。理想情况下,现实世界的每个实体在数据库中都会有唯一一条记录与之对应;而实际情况下,若不同数据源对同一实体的记录存在差异,系统不能有效识别、判定为同一实体,则合并后的数据库就会同时保留这两条记录。若数据库中的两条相似但不完全重复的记录代表同一实体,则称这两条记录为相似记录;若数据库中存在两条所有属性值都完全相同的记录,则称之为重复记录。通常把相似记录和重复记录统称为相似重复记录,即同一实体对应数据库中的多条记录。

    相似重复记录检测,就是从多源数据集中找出表达现实世界中同一实体的记录。判断两条记录是否相似重复,首先要比较记录的各对应属性,计算其字段相似度,再根据各属性的权重进行加权平均,得到记录相似度。若两条记录的相似度超过某一阈值,则认为这两条记录是匹配的、相似重复的,将二者合并或删除。

    在进行海上态势分析的过程中,目标航迹数据通常是由多维航迹数据点组成的多维序列[9],每个航迹数据点中包含时间、位置、速度、加速度、航向、敌我属性、类别等多维特征信息[10]。设目标海域内的全部航迹样本数据集为T,表达式为:

    $$ T=\left\{T_{1}, T_{2} \cdots T_{i} \cdots T_{n}\right\} $$ (1)

    式中,Ti为航迹样本;i∈[1, n]为样本编号;n为样本总数。每条航迹样本Ti中包含m个按时间顺序排列的多维数据点,表达式为:

    $$ T_{i}=\left\{T_{i}(1), T_{i}(2) \cdots T_{i}(j) \cdots T_{i}(m)\right\} $$ (2)

    式中,Ti(j)为第i条航迹样本中第j个多维航迹数据点;j∈[1, m]为航迹数据点编号;m为该航迹样本中的数据点总数。每个航迹数据点Ti(j)的表达式为:

    $$ \begin{aligned} &T_{i}(j)=\{\text { time, position, velocity, } \\ &\text { acceleration, course, attribute, type } \cdots\} \end{aligned} $$ (3)

    式中,time、position、velocity、acceleration、course、attribute和type分别表示时间、位置、速度、加速度、航向、敌我属性和类型等多维特征。

    本文基于相似重复记录检测的思想,将数据集T中的每条航迹样本Ti看作一条记录,则构成航迹样本Tim个数据点即为该记录的m个子记录,每个数据点Ti(j)中包含的时间、位置、速度、航向、敌我属性和类型等特征信息为该子记录的各字段。对于任意两条多维航迹T1T2T,二者的多维度记录匹配相似度(multi-dimension record similarity, MDRS)为SMDRS(T1, T2),其构造过程如下。

    1)比较记录的各对应属性。目标航迹数据中的属性较多,在进行记录匹配时需选择能代表记录特征的属性,这要求操作员对数据本身的含义有深入的了解,能够结合战场需求和专家经验选择合适的属性。

    2)计算字段相似度。字段匹配[11-12]是记录匹配的基础,是相似重复记录检测的核心问题。字段相似度Sf是根据字段信息计算出的表示两字段间相似程度的数值,0≤Sf≤1。Sf越大,两字段的相似程度越高;若Sf=1,则两字段为重复字段。针对海上作战环境下的数值型字段,设T1T2在同一时刻、针对同一属性x的字段值分别为x1x2,则有如下关系:

    $$ S_{f}\left(x_{1}, x_{2}\right)=\left[1-\frac{\left|x_{1}-x_{2}\right|}{\max \left(x_{1}-x_{2}\right)}\right] \times 100 \% $$ (4)

    3)属性权重分配和绝对权值优化。属性权重W表示了一个属性在决定两条记录相似性中的重要程度[13],属性越重要,分配到的权重就越大,所有属性权重的和为1。本文针对海上作战环境,提出绝对权值V的概念,用于综合权重的优化。设T1T2在同一时刻的位置、速度、航向特征都极为相近,但二者敌我属性不同,则T1T2不可能是相似重复记录。因此,只有两条记录的某些属性值完全匹配时,才能进行记录的比较,设该属性的权值V=1,称为绝对权值,绝对权值对应属性的字段相似度只能为0或1。该方法能够有效提高相似重复记录检测的准确率,减少字段匹配次数,缩短运行时间。在计算记录相似度时,绝对权值对应的属性值与传统属性权重对应的属性值取乘积。

    本文采用一种高效的、应用无关的Pair-wise比较算法[14-16]计算MDRS,其步骤如下:

    1)设每条记录Ti中有p+q个参与比较的属性字段f (1)、f (2)…f (p+q),其中有q个属性对应绝对权值,故各字段的属性权重分别为W (1)、W (2)…W (p)、V (1)、V (2)…V (q),上述权重满足$\sum\limits_{i=1}^{p} W(i)=1$, 且$V(j)=1, j=1, 2 \cdots q$。

    2)给定两条记录T1T2,其对应的子记录分别为T1(r)、T2(r), r∈[1, m],各字段相似度分别为Sf(1)、Sf(2)…Sf(i)…Sf(p+q), i∈[1, p+q]。设δ1为字段相似度阈值,若Sf(i) < δ1,则T1T2不是相似重复记录。

    3)根据字段相似度Sf(i), i∈[1, p+q]及相应的属性权重,进行加权平均,得到T1(r)、T2(r)的相似度Sr,计算式为:

    $$ \begin{aligned} &S_{r}\left(T_{1}(r), T_{2}(r)\right)= \\ &\frac{\sum\limits_{i=1}^{p} W(i) \cdot S_{f}(i)}{\sum\limits_{i=1}^{p} W(i)} \cdot\left[\prod\limits_{j=1}^{q} V(j) \cdot S_{f}(j)\right] \end{aligned} $$ (5)

    4)对所有m个子记录的记录相似度求平均,可得T1T2的MDRS,计算式为:

    $$ S_{\mathrm{MDRS}}\left(T_{1}, T_{2}\right)=\sum\limits_{r=1}^{m} S_{r}\left(T_{1}(r), T_{2}(r)\right) / m $$ (6)

    δ2为记录相似度阈值,若SMDRS(T1, T2) > δ2,则认为T1T2是相似重复记录。

    本文提出了一种海上非作战目标实时清洗方法(real-time cleaning method for marine non-combat targets, MNCT-RTCM),基本流程如图 1所示。

    图  1  海上非作战目标实时清洗方法流程
    Figure  1.  Flowchart of Real-Time Cleaning Method for Marine Non-combat Targets

    MNCT-RTCM方法的主要步骤包括:(1)对历史数据库中的历史航迹数据进行处理,挖掘历史目标航迹的行为规律;(2)筛选出目标海域内的固定目标(如岛屿、漂浮物)和规律航行的目标(包括规律航行的军用船只和民用船只),对其进行分类存储;(3)将筛选出的历史非作战目标(包括固定目标和规律航行的民用船只)航迹数据点与当前海战场环境下已更新的实时目标航迹数据点进行相似重复检测,若有实时目标航迹与历史非作战目标航迹是相似重复的,则该实时目标就是非作战目标。

    MNCT-RTCM方法的具体流程如下:

    1)输入历史数据集。

    $$ T_{P}=\left\{T_{P 1}, T_{P 2} \cdots T_{P i} \cdots T_{P p}\right\} $$ (7)

    式中,TP为过去N天内的全部目标航迹集合;p为历史航迹总数。

    2)将TP中的每条记录TPi与其他所有记录TPj(ji)逐个比较[17],计算SMDRS(TPi, TPj)。在海战场环境下,对日期、敌我属性和类型3个字段设定绝对权值,若两条记录的日期相同,则不能进行字段比较;若两条记录的敌我属性和类型不同,则不能进行字段比较。

    3)将相似的记录合并,只保留一条正确的记录。得到固定目标与规律航行目标数据集TC和不规律航行目标数据集TA

    4)对筛选出的数据集TC进行固定目标清洗,分离出目标海域内的固定目标集TG和规律航行目标集TH。根据目标的属性和类型信息,可进一步将规律航行目标集TH细分为军用目标集TJ和民用目标集TM,得到对战场态势分析影响较小的历史非作战目标集TY,表达式为:

    $$ T_{Y}=T_{G} \cup T_{M}=\left\{T_{Y 1}, T_{Y 2} \cdots T_{Y y}\right\} $$ (8)

    式中,TYTC; y为历史非作战目标航迹总数。

    5)输入海战场环境下已更新的实时数据集。

    $$ T_{X}=\left\{T_{X 1}, T_{X 2} \cdots T_{X i} \cdots T_{X x}\right\} $$ (9)

    式中,TX为全部实时目标航迹集合;x为实时航迹总数。每条目标航迹TXi中含有z(zm)个已更新的多维数据点,即

    $$ T_{X i}=\left\{T_{X i}(1), T_{X i}(2) \cdots T_{X i}(j) \cdots T_{X i}(z)\right\} $$ (10)

    式中,TXi(j)为第i条实时航迹样本中的第j个多维航迹数据点。

    6)将TXi的数据点TXi(j)与TY的每条记录TYk(k∈[1, y])中对应时刻的数据点TYk(j)逐个进行比较,计算SMDRS(TXi, TYk)。

    7)若TXiTYk为相似重复记录,则该实时目标航迹记录TXi就是要清洗的非作战目标航迹,予以剔除。

    本文实验参考偷袭珍珠港、中途岛海战等经典战役的作战过程及兵力分布情况,结合海上复杂环境、现代武器装备性能、作战条令和战术战法基础等,模拟军用场景建立了一个历史仿真数据集和一个海上作战实时仿真数据集。

    选取某宽阔海域450 n mile×300 n mile的区域进行战场环境仿真,设定仿真时间为过去N天内的每天12:00—18:00。数据集包含109×N条行为规律的目标航迹和θ条行为不规律的目标航迹。其中,行为规律的109个目标中,包括8个固定岛群共69个固定岛屿、6个海上漂浮物、我方3个军用编队共12条目标船只、敌方3个军用编队共11条目标船只和11条民用船只。假设每10 min更新一次战场态势信息,且船只在该海域内的航行高度是相对固定的,因此,每条目标航迹数据均由36个数据点组成且不考虑目标的高度信息。每条目标航迹数据在传统二维位置信息的基础上,结合现代海战场实际,人为添加了日期、初始速度/加速度、敌我属性和类型等多维信息,计算得出目标的速度、位置和航向特征等11个属性值。将全部航迹随机排序,共同构造出一个(109×N+θ)×11×36的多维目标航迹历史仿真数据集TP,如图 2所示。

    图  2  历史仿真数据集
    Figure  2.  Historical Simulation Dataset

    参照历史仿真数据集的场景设定,选取某日12:00—18:00、该宽阔海域450 n mile×300 n mile的区域进行战场环境仿真。得到的实时仿真数据集TX包括8个固定岛群共69个固定岛屿、6个海上漂浮物、我方5个作战编队共113条目标船只、敌方3个作战编队共43条目标船只和10条民用船只,共241个海上目标的航迹数据。假设每10 min更新一次战场态势信息,构建一个实时的、变化的海上作战过程,6 h后形成的全部目标航迹分布如图 3(a)所示。为了验证非作战目标实时清洗的效果,实时仿真数据集TX中设置了两条与历史非作战目标航迹轨迹不同的特殊航迹,如图 3(b)所示。

    图  3  实时仿真数据集
    Figure  3.  Real-Time Simulation Dataset

    选用图 2(b)所示N=30、θ=5时的历史仿真数据集和图 3(a)所示的海上作战实时仿真数据集,利用MNCT-RTCM方法进行非作战目标的实时清洗。

    确定合适的字段相似度阈值δ1和记录相似度阈值δ2(本实验中取δ1=0.90,δ2=0.97),基于相似重复记录检测的思想挖掘历史目标航迹的行为规律,结果如图 4所示。其中,图 4(a)为筛选出的所有固定目标和规律航行目标的航迹分布图,图 4(b)为分离出的不规律航行目标的航迹分布图,此类目标出现的频率较低,可能为异常航迹目标,应对其重点关注并进行针对性分析。采用循环阈值法对图 4(a)数据集进行固定目标清洗,得到历史非作战目标集合,其航迹分布情况如图 5所示。

    图  4  历史目标航迹数据行为规律挖掘结果
    Figure  4.  Behavior Mining Results of Historical Trajectories
    图  5  历史非作战目标
    Figure  5.  Historical Non-combat Targets

    确定合适的字段相似度阈值δ1和记录相似度阈值δ2(本实验中取δ1=0.85,δ2=0.87),将当前海战场环境下已更新的实时目标航迹数据点与筛选出的历史非作战目标航迹对应时刻的数据点进行相似重复检测,若有实时目标航迹与历史非作战目标航迹是相似重复的,则该实时目标为非作战目标,予以剔除。获取部分时刻更新战场态势信息后,得到非作战目标清洗后的海上作战态势目标航迹分布,结果如图 6所示。

    图  6  非作战目标实时清洗结果
    Figure  6.  Real-Time Cleaning Results of Non-combat Targets

    图 6中可以看出,针对实时仿真数据集中与历史非作战目标航迹轨迹相同的目标航迹,第2次更新战场态势信息后,MNCT-RTCM方法可以实时检测出仿真数据集中的非作战目标,并对其进行清洗。针对实时仿真数据集中设置的两条与历史非作战目标航迹轨迹不同的特殊航迹:第一条特殊航迹在第12个时刻发生改变,但MNCT-RTCM方法在第14次战场态势信息更新后,才识别出该目标不是非作战目标。因为该目标航迹开始变化时,其位置、速度和航向等特征变化极小,导致第13次战场态势信息更新后,该目标航迹中对应的各字段相似度并没有小于Pair-wise比较算法中设定的阈值δ1,且记录相似度MDRS的取值是所有已更新的子记录相似度的均值,故不能立刻判断出目标航迹的异常变化,做出了错误的判断,认为该目标仍是非作战目标。第二条目标航迹在第20个时刻发生变化,MNCT-RTCM方法在第21次战场态势信息更新后,就及时识别出该目标不是非作战目标,实现了对目标航迹异常变化的实时检测。

    通过计算MNCT-RTCM方法的召回率和准确率[18]对非作战目标实时清洗的质量进行评估。召回率是指被正确识别的非作战目标数量与实际非作战目标数量的百分比,而准确率是指被正确识别的非作战目标数量与识别出的非作战目标数量的百分比,根据上述定义绘制出召回率和准确率随战场态势更新次数变化的曲线图,如图 7所示。

    图  7  MNCT-RTCM方法的召回率与准确率
    Figure  7.  Recall and Precision of the MNCT-RTCM Method

    图 7中可以看出,在仿真军用场景中,随着战场态势信息的不断更新,针对实时仿真数据集中与历史非作战目标航迹轨迹相同的目标航迹,MNCT-RTCM方法可以实时检测出全部非作战目标并进行清洗。针对实时仿真数据集中与历史非作战目标航迹轨迹不同的目标航迹,若目标的各属性特征变化正常,MNCT-RTCM方法可以实时检测出目标的异常变化,判定该目标不是非作战目标;若目标的各属性特征变化极小,可能会导致MNCT-RTCM方法不能立刻检测出航迹的异常变化,仍认为该目标是非作战目标,但在态势更新一段时间后,该方法将识别出该目标航迹的异常变化,判定该目标不是要处理的非作战目标,对其进行保留。

    由于需要处理的数据集较大,且记录相似性匹配的复杂度为B(B-1)/2(N为数据集中的记录条数),因此MNCT-RTCM方法的计算过程较为复杂,需要耗费较长的时间。

    本文针对海上作战态势生成需求,将数据预处理技术中的重复数据清洗与目标行为规律挖掘相结合,定义了多维度记录匹配相似度,设计了一种海上非作战目标实时清洗方法,并在仿真军事场景上进行了实验验证,通过计算召回率和准确率对结果进行评估和分析。结果表明,MNCT-RTCM方法能够有效挖掘历史目标航迹的行为规律,得到历史非作战目标集合;随着战场态势的更新,检测出目标海域内的非作战目标,实现海上作战环境下非作战目标的实时清洗,提高海上态势生成的效率和准确性。

  • 图  1   海上非作战目标实时清洗方法流程

    Figure  1.   Flowchart of Real-Time Cleaning Method for Marine Non-combat Targets

    图  2   历史仿真数据集

    Figure  2.   Historical Simulation Dataset

    图  3   实时仿真数据集

    Figure  3.   Real-Time Simulation Dataset

    图  4   历史目标航迹数据行为规律挖掘结果

    Figure  4.   Behavior Mining Results of Historical Trajectories

    图  5   历史非作战目标

    Figure  5.   Historical Non-combat Targets

    图  6   非作战目标实时清洗结果

    Figure  6.   Real-Time Cleaning Results of Non-combat Targets

    图  7   MNCT-RTCM方法的召回率与准确率

    Figure  7.   Recall and Precision of the MNCT-RTCM Method

  • [1] 杨航. 基于历史信息的移动对象轨迹预测研究[D]. 桂林: 广西师范大学, 2016

    Yang Hang. Research on Prediction of Trajectories of Moving Objects Based on Historical Information [D]. Guilin: Guangxi Normal University, 2016

    [2] 刘现鹏, 张立华, 王涛, 等. 基于航迹线追踪的TERPM定位算法[J]. 武汉大学学报·信息科学版, 2018, 43 (2): 219-226 doi: 10.13203/j.whugis20160106

    Liu Xianpeng, Zhang Lihua, Wang Tao, et al. TERPM Locating Algorithm Based on Trajectory Tracking[J]. Geomatics and Information Science of Wuhan University, 2018, 43(2): 219-226 doi: 10.13203/j.whugis20160106

    [3]

    Pan Xinlong, He You, Wang Haipeng, et al. Mining Regular Behaviors Based on Multidimensional Trajectories[J]. Expert Systems with Applications, 2016, 66 (12): 106-113 http://smartsearch.nstl.gov.cn/paper_detail.html?id=628e611f86d4402ce035b1ce1a015fb2

    [4]

    Pan Xinlong, Wang Haipeng, He You, et al. Online Classification of Frequent Behaviors Based on Multidimensional Trajectories[J]. IET Radar, Sonar & Navigation, 2017, 11 (7): 1 147-1 154 http://ieeexplore.ieee.org/document/7968511/

    [5] 韩京宇, 徐立臻, 董逸生. 数据质量研究综述[J]. 计算机科学, 2008, 35 (2): 1-5 https://www.cnki.com.cn/Article/CJFDTOTAL-JSJA200802003.htm

    Han Jingyu, Xu Lizhen, Dong Yisheng. An Overview of Data Quality Research[J]. Computer Science, 2008, 35(2): 1-5 https://www.cnki.com.cn/Article/CJFDTOTAL-JSJA200802003.htm

    [6] 郭志懋, 周傲英. 数据质量和数据清洗研究综述[J]. 软件学报, 2002, 13 (11): 2 076-2 082 https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB200211002.htm

    Guo Zhimao, Zhou Aoying. Research on Data Quality and Data Cleaning: A Survey[J]. Journal of Software, 2002, 13(11): 2 076-2 082 https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB200211002.htm

    [7] 刘瑜, 詹朝晖, 朱递, 等. 集成多源地理大数据感知城市空间分异格局[J]. 武汉大学学报·信息科学版, 2018, 43(3): 327-335 doi: 10.13203/j.whugis20170383

    Liu Yu, Zhan Zhaohui, Zhu Di, et al. Incorporating Multi-Source Big Geo-Data to Sense Spatial Heterogeneity Patterns in an Urban Space[J]. Geomatics and Information Science of Wuhan University, 2018, 43(3): 327-335 doi: 10.13203/j.whugis20170383

    [8] 林珲, 游兰, 胡传博, 等. 时空大数据时代的地理知识工程展望[J]. 武汉大学学报·信息科学版, 2018, 43 (12): 2 205-2 211 doi: 10.13203/j.whugis20180318

    Lin Hui, You Lan, Hu Chuanbo, et al. Prospect of Geo-Knowledge Engineering in the Era of SpatioTemporal Big Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2 205-2 211 doi: 10.13203/j.whugis20180318

    [9] 潘新龙, 王海鹏, 何友, 等. 基于多维航迹特征的异常行为检测方法[J]. 航空学报, 2017, 38 (4): 249-258 https://www.cnki.com.cn/Article/CJFDTOTAL-HKXB201704024.htm

    Pan Xinlong, Wang Haipeng, He You, et al. Anomalous Behavior Detection Method Based on Multi-dimensional Trajectory Characteristics[J]. Acta Aeronautica et Astronautica Sinica, 2017, 38 (4): 249-258 https://www.cnki.com.cn/Article/CJFDTOTAL-HKXB201704024.htm

    [10]

    Yang A, Tan X, Baek J, et al. A New ADS-B Authentication Framework Based on Efficient Hierarchical Identity-Based Signature with Batch Verification [J]. IEEE Transactions on Services Computing, 2015, 10 (2): 165-175 doi: 10.1109/TSC.2015.2459709

    [11]

    Bilenko M, Mooney R, Cohen W, et al. Adaptive Name Matching in Information Integration[J]. IEEE Intelligent Systems, 2003, 18 (5): 16-23 doi: 10.1109/MIS.2003.1234765

    [12]

    Monge A E, Elkan C P. The Field Matching Problem: Algorithms and Applications[C]. Proceedings of the 2nd Conference on Knowledge Discovery and Data Mining, Portland, Oregon, 1996

    [13] 杨巧巧. 工业大数据相似重复记录数据清洗关键技术研究[D]. 青岛: 青岛大学, 2018

    Yang Qiaqiao. Research on Technologies of Duplicate Record Data Cleaning Under Industrial Big Data[D]. Qingdao: Qingdao University, 2018

    [14]

    Wagner R A, Fischer M J. The String-to-String Correction Problem[J]. Journal of Association for Computing Machine, 1974, 21 (1): 168-173 doi: 10.1145/321796.321811

    [15]

    Lowrance R, Wagner R A. An Extension of the String-to-String Correction Problem[J]. Journal of Association for Computing Machine, 1975, 22(2): 177-183 doi: 10.1145/321879.321880

    [16]

    Sellers P H. On the Theory and Computation of Evolutionary Distances[J]. SIAM Journal on Applied Mathematics, 1974, 26 (4): 787-793 doi: 10.1137/0126070

    [17]

    Hemandez M A, Stolfo S J. Real-World Data is Dirty: Data Cleansing and the Merge/Purge Problem [J]. Data Mining and Knowledge Discovery, 1998, 2 (1): 9-37 doi: 10.1023/A:1009761603038

    [18] 刘华. Web信息集成中数据清洗的研究[D]. 武汉: 武汉理工大学, 2007

    Liu Hua. Research on Data Cleaning in Web Information Integration[D]. Wuhan: Wuhan University of Technology, 2007

  • 期刊类型引用(1)

    1. 林雪原,潘新龙,王玮. 基于最大熵准则的GNSS/SINS组合导航滤波算法. 大地测量与地球动力学. 2024(08): 787-792 . 百度学术

    其他类型引用(0)

图(7)
计量
  • 文章访问数:  938
  • HTML全文浏览量:  323
  • PDF下载量:  60
  • 被引次数: 1
出版历程
  • 收稿日期:  2020-09-27
  • 发布日期:  2021-09-17

目录

/

返回文章
返回