一种适合垂直镜头的实时跨镜连续跟踪方法

徐辛超, 李旭佳, 徐彦田, 陈晨辰, 刘明岳, 朱佳武, 赵红喜, 程博

徐辛超, 李旭佳, 徐彦田, 陈晨辰, 刘明岳, 朱佳武, 赵红喜, 程博. 一种适合垂直镜头的实时跨镜连续跟踪方法[J]. 武汉大学学报 ( 信息科学版), 2021, 46(8): 1247-1258. DOI: 10.13203/j.whugis20190333
引用本文: 徐辛超, 李旭佳, 徐彦田, 陈晨辰, 刘明岳, 朱佳武, 赵红喜, 程博. 一种适合垂直镜头的实时跨镜连续跟踪方法[J]. 武汉大学学报 ( 信息科学版), 2021, 46(8): 1247-1258. DOI: 10.13203/j.whugis20190333
XU Xinchao, LI Xujia, XU Yantian, CHEN Chenchen, LIU Mingyue, ZHU Jiawu, ZHAO Hongxi, CHENG Bo. A Real⁃Time Cross⁃Lens Continuous Tracking Method for Vertical Mounted Cameras[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1247-1258. DOI: 10.13203/j.whugis20190333
Citation: XU Xinchao, LI Xujia, XU Yantian, CHEN Chenchen, LIU Mingyue, ZHU Jiawu, ZHAO Hongxi, CHENG Bo. A Real⁃Time Cross⁃Lens Continuous Tracking Method for Vertical Mounted Cameras[J]. Geomatics and Information Science of Wuhan University, 2021, 46(8): 1247-1258. DOI: 10.13203/j.whugis20190333

一种适合垂直镜头的实时跨镜连续跟踪方法

基金项目: 

国家自然科学基金 41401535

地球观测与时空信息科学重点实验室项目 201901

辽宁省自然科学基金 20180550849

辽宁省教育厅基础研究项目 LJ2019JL021

详细信息
    作者简介:

    徐辛超,博士,副教授,主要从事图像处理、视觉定位与三维重建方面的研究。xuxinchao@lntu.edu.cn

  • 中图分类号: P237

A Real⁃Time Cross⁃Lens Continuous Tracking Method for Vertical Mounted Cameras

Funds: 

The National Natural Science Foundation of China 41401535

the Key Laboratory of Earth Observation and Geospatial Information Science of NASG 201901

the Natural Science Foundation of Liaoning Province 20180550849

the Basic Research Project of the Educational Department of Liaoning Province LJ2019JL021

More Information
    Author Bio:

    XU Xinchao, PhD, associate professor, specializes in image processing, photogrammetric positioning and three-dimensional reconstruction.xuxinchao@lntu.edu.cn

  • 摘要: 针对现有效果较好的单镜头跟踪方法不能满足工程化的实时性要求,而现有行人重识别方法依赖于行人检测方法建立行人图像库,可能出现漏检和误检等问题,提出了一种适合垂直镜头的实时跨镜连续跟踪方法。首先,采用高斯混合模型进行背景消除,并提取目标的最小外接矩形用于跟踪目标的选择; 然后,采用改进空间可靠性和探测可靠性的相关滤波方法实现单镜头中的目标跟踪。针对垂直镜头的行人成像特点,采用加速稳健特征(speeded up robust features, SURF)匹配计算相邻镜头间的单应矩阵,确定跟踪目标在下一镜头中的最佳搜索区域; 通过高斯混合模型背景消除和模板匹配实现了行人的实时跨镜连续跟踪。采用垂直安置的4个摄像头进行了跟踪测试。实验结果表明,与当前主流方法相比,该方法在保持跟踪稳定性的基础上具有更好的跟踪效率,可以达到21.8帧/s,且在光照变化、形变、复杂背景和遮挡情况下跟踪优势更显著,跨摄像头连续跟踪效果稳定。
    Abstract:
      Objectives  Target tracking has been widely used in pedestrian tracking, automatic driving, target monitoring and other fields. The existing tracking methods in single camera have limited tracking range and relatively slow. The existing person re-identification methods rely on the pedestrian detection to establish image database, and all the methods may miss detection or lead to false detection. Therefore, in order to meet the needs of pedestrian tracking in large-scale scenes, a continuous pedestrian tracking method for vertical mounted camera is studied, which has better tracking robustness and faster speed.
      Methods  For tracking in a single camera, a discriminative correlation filter with detection and spatial reliability (DSR-DCF) was proposed. Firstly, the Gaussian mixture model was used to eliminate the background, and the minimum circumscribed rectangle of the target was extracted to select the tracking target. Then, 32 dimensional histogram of oriented gradient (HOG) feature and 1 dimensional grayscale feature are used as pedestrian feature description, and spatial reliability and detection reliability are applied to correlation filter to realize pedestrian tracking in single camera. In the process of tracking pedestrians across cameras, according to the imaging characteristics of pedestrians in the vertical mounted camera, the speeded up robust features (SURF) algorithm was used to match the features of overlapping areas. The homography matrix between adjacent shots was calculated according to the matching feature points to determine the best search area of tracking target in the adjacent camera. Finally, taking the pedestrian obtained by Gaussian mixture model background elimination in the search area and template pedestrian as input, and using the sum of absolute difference(SAD) as the matching measure, the real-time cross-lens continuous tracking of pedestrian was realized through template matching.
      Results  Scene simulation and tracking experiments were carried out with four cameras with a resolution of 1 920×1 080 pixels. The success rate was tested by online object tracking benchmark (OTB), and compared with kernelized correlation filters (KCF), discriminative correlation gilter with channel and spatial reliability (CSR-DCF) and other methods. The results show that the background elimination of Gaussian mixture model can extract all pedestrians, and there is no missing or false detection. When tracking across cameras, the best search range is 5 times of the initial tracking window size. In continuous tracking, the average speed of the proposed method can reach 21.8 frames/ s, and the tracking success rate is better, especially in the case of illumination change, deformation, complex background and occlusion.
      Conclusions  The single camera tracking method DSR-DCF, combined with search area restriction and template matching, can realize the continuous pedestrian tracking across camera. The tracking speed and success rate can meet the real-time requirements, and the tracking speed is better than 21 frames/s.
  • 地图是人类创造的一种空间认知工具,旨在促进信息和知识的传递和交流[1]。古地图虽然不同于基于投影理论的现代地图,但它蕴含着传统的空间认知与表征体系[1-3],并与其所在社会的生产、生活体系密切交互。而近半个世纪对古地图和地图学史的讨论不仅补充了一般史料无法传达的历史信息[4-5],支撑了科技史与测绘史的研究,更从知识史[6-7]的崭新视角展现了探索这类独特史料所蕴含的社会与政治权力、世界文化观以及人类不同的实践知识体系的可能[8-9]

    作为人类文化传承的物质载体和文化遗产的组成部分,古地图所涉及的丰富而隐含的信息和语义关联需要被全面记录和归档,以支持数字时代对文化遗产的解释、管理和保护工作。大多数拥有古地图的馆藏机构都有着对地图编目和数字化的传统,但其使用的元数据组织方式缺少语义层次结构,无法支持对纷繁复杂古地图所蕴含的表征、用途和社会知识背景等复杂性问题的系统性讨论。随着数字人文、数字遗产领域的兴盛,近年来档案知识组织的新趋势是利用链接开放数据和层级性关联复杂语义的本体技术对档案数据进行深度的关联管理、标准化共享乃至知识挖掘。基于本体这一新方法,相继有学者对地图内部的图例[10]和表征对象空间拓扑关系[11-12]、地图外部的地理空间信息和历史“事件”[13-14]进行建模。上述本体[11-12,14]还融合了一系列更为通用的标准框架,如基于定性空间表征的区域连接演算(region connection calculus,RCC)[15]、文化遗产通用本体国际文献工作委员会(International Committee for Documentation, CIDOC)概念参考模型(conceptual reference model,CRM)[16]、基于CRM和开放地理空间信息联盟标准的CRMgeo[17]等。对地图内部信息的提取方面,则发展出了基于国际图像互操作框架和网络地图切片服务的地图手工注释工具如Recogito[18]和Georeferencer[19],以及自动提取地图图形要素[20]和地图文字[21]的机器学习方法。而这些方法促进了对空间知识的再挖掘,如通过自动提取地图要素来追溯西方城市化过程[22]等应用。

    地图作为知识表征手段和思维工具的一种,在人类空间知识史的发展中不断推动着实践、物质和概念的相互作用[23]。但是,前述对地图信息管理的丰富方法多数将地图信息与地理实物直接相连,从而将地图降格为外部物质世界变化的记录来源,忽视了地图作为概念世界和物理世界中介的这一本质,禁锢了古地图作为空间概念史研究材料的广泛可能。即使一些研究[11-12]将地图上的表征信息与概念对象联系起来,而不是直接与外部物质世界联系,但这些概念物缺乏与其社会语境的明确关联和概念组织,因而无法很好地作用于概念史研究。

    艺术史中的图像志方法在一定程度上回应了历史语境缺失的困境[24],例如文献[25]基于视觉表征本体(visual representation ontology,VIR)[26]和CIDOC CRM的历史绘画本体,根据图像志理论建构了历史绘画的图像表征信息、信息表征的概念物以及外部社会背景的语义关联。然而,图像志根据研究者自身学识直接建立图像的概念和物质世界之间联系的方法,忽视了表征的实践性[27],既无法描述地图所表征的概念与人类认知活动交互的历史过程,也无法描述地图作为解决与空间有关问题的工具对物质世界产生的影响。从行动者网络理论[28]来看,地图在整个生命周期中都不断与物质世界的人、机构及其他人工物纠缠[29],也因而间接与概念世界纠缠。而从对概念世界和物质世界的作用来看,地图通过各类实践不断展开并最终成为不断影响世界发展的“铭文”和“命题系统”[30]

    因此,只有将地图的物质、认知、表征与其相关的实践(包括身体的、社会的、技术的、政治的等)相结合,才能理解作为解决方案的地图如何诞生的发生论问题,及其后在实践和话语中所发展出的作用和影响,乃至更长时段的迭代问题[30],这是一种超越传统科学史范式的知识史视角。为了以数字驱动方式深入挖掘古地图相关知识体系的形成、流通与转译等知识史问题,本文旨在构建一个古地图本体,以全面、连贯地描述古地图的表征、概念、实践、物质之间不可分割的关系;并根据新提出的古地图认知-实践模型,复用并扩展以“事件”为核心的文化遗产领域通用本体CIDOC CRM建立古地图本体。在进行案例验证时,选择了实践事件和所涉物质明确,同时概念世界自成体系,表征有一定代表性的清代建筑工程图纸样式雷图档,以体现本体的效用。

    为扩大本体的应用范围从而促进地图知识史数字范式的广泛研究,本文采用了宽泛的古地图定义:凡使用形象表征方式描述与空间相关概念者均可归为古地图,无论单行印刷本、书籍插图、绘本乃至岩画,且可包含政区图、河工图、军事图、城池图、山川图、民生图、海图、星图、各类土著地图等不同种类。进而通过分析相关模型推出古地图认知-实践模型,确定了古地图本体建构所需的核心概念和关系,并基于这些核心概念进行了一定的拓展。

    为了对作为人类认知工具的古地图进行本体建模,首先需要理解人们如何认识世界,以及被理解的空间特征在心理概念化后发展出的抽象范式最终如何在计算机系统中表示,即认知模型。文献[31]提出用于地理信息本体建模的“5个世界”认知模型,该模型通过物质、认知、表征、逻辑、执行5个层次较好地反映了人类地理空间认知和表达的过程。本文在Fonseca等[31]的认知范式基础上,提出古地图认知模型包括物质、认知、表征、逻辑共4个层次,描述古地图涉及的空间认知和知识表达过程:人类通过认知系统感知、认知真实物质世界中的现象,这一过程发生在认知世界;在地图上以各种符号对认知世界进行表达发生在表征世界;而本体则是逻辑世界的组成部分,是为了便于计算机处理、存储而对这一过程进行的形式化描述。

    在前述认知模型基础上,本文基于通用文化遗产本体CIDOC CRM框架进一步提出古地图认知-实践模型。CIDOC CRM是文化遗产领域的形式本体,于2006年通过了国际标准的认证,其命名空间为http://www.cidoc-crm.org/cidoc-crm/(缩写为前缀crm)。该模型通过对文化遗产信息资源中的隐性概念、显性概念及其关系的定义和形式化描述,提供一个通用的、可扩展的语义框架,促进文化遗产领域的知识共享[32]。CIDOC CRM以“事件”实体(crm: E2 事件实体)为中心,描述、整合地图及其相关“物质对象”(crm: E18 物质对象)和“概念对象”(crm:E28概念对象)间的关系[33]。这些不断变化的实体通过不同的“事件”联系,并与包括“行动者”(crm: E39行动者)、“地点”(crm: E53地点)在内的其他实体建立更加广泛的关联。古地图认知-实践模型在前述物质、认知、表征、逻辑4个世界基础上增加实践世界,实践能够关联物质、表征、认知,同时还能表达认知世界通过实践对物质世界的影响(见图1)。

    图  1  古地图认知-实践模型
    Figure  1.  Cognition-Practice Model of Ancient Map

    在物质、认知世界都起作用的空间关系对于古地图空间认知研究异常重要,故本文提出的认知-实践模型还对空间关系进行了定义。一般地理的空间关系都基于欧几里得的点、线、面表达,比如文献[14]利用空间坐标、地名录来记录地图信息的外部地点,以关联表征世界和物质世界。但是这种抽象的数学空间系统往往不能够描述古地图中相对模糊、注重上下文表达的经验空间。为了处理古地图中的这种定性空间关系,认知-实践模型特别引入了逻辑化描述实体和实体关系的定性空间表征(qualitative spatial representation,QSR)[34]。其表达方式与语义网类似并支持推理,其中经典的RCC8 理论能够描述两个区域间的相同、相离、外切、重叠和内切及其逆关系、内含及其逆关系,并能够通过GeoSPARQL进行推理。

    本体基于语义网结构,最小信息单位为三元组,每个三元组都以主语-谓语-宾语表达式的形式表示,其中主语(也称定义域)和宾语(也称值域)是实体,通常对应于自然语言中的名词,谓语则是描述两个名词之间关系的动词或形容词。 根据§1.1提出的古地图认知-实践模型,研究复用了CIDOC CRM中的相关概念和属性,并扩展了其中有关地图的概念和属性,从而建构了古代地图信息本体(复用部分的命名空间仍用前缀crm表示,扩展部分则用am表示)。因此,在本体的逻辑世界中,其他4个世界及其相互关联被相关的概念和属性填充:物质世界包括各类“实物”(crm: E18实物)、“地点”(crm:E53地点)等,以及人工生产的“地图载体”(am: L1地图载体)和作为复制品的“数字地图”(am: L2数字地图);认知世界包括各类“认知概念”(am: L3认知概念);表征世界则为“地图信息”(crm: E73地图信息),被物质世界的“地图载体”(am: L1 地图载体)所承载;上述3个世界的实体都可以被实践世界的各类“事件”(crm: E5事件)所关联。顶层本体所涉及的核心概念定义如下。

    1) “地图载体”(am: L1地图载体):人造实体物(crm: E24人造实体物)的子类,指作为物质对象的地图,是“地图信息”(crm: E73 地图信息)的物理载体,属于物理世界。如绘制地图的图纸载体。

    2) “地图信息”(crm: E73地图信息):概念对象(crm: E28概念对象)的子类,囊括了“地图载体”所承载的信息对象,是非物质的概念性实体,属于表征世界。如地图上的图例符号、文字、图形等。

    3) “实物”(crm: E18实物):囊括了地图所描绘的物质性实体,属于物质世界。该类的实例包括人工实物(如道路、建筑等)和自然实物(如山、河流等)。

    4) “地点”(crm: E53地点):指“实物”的物理位置,属于物质世界。

    5) “认知概念”(am: L3认知概念):概念对象(crm: E28概念对象)的子类,指人类通过感知和认知物质世界中的“实物”对象后,在认知世界中形成的各类概念,通常涉及“地图载体”外部复杂的领域知识。此外,由于“认知概念”与“地图信息”分属于认知世界和表征世界,因此两个类别不相交。

    6) “事件”(crm: E5事件):囊括了地图生命周期中出现的一切实践活动,包括生产地图和使用地图两种,后者也包括了学者用于生产“推测概念”“地图信息”“数字图像”的研究类事件。

    7) “推测概念”(am: L9推测概念):认知概念(am:L3认知概念)的子类,指由学者结合各类材料研究还原的“认知概念”。

    8) “数字图像”(am: L2数字图像):人造实体物(crm: E24人造实体物)的子类,指地图数字化所产生的数字地图复制品。

    古地图本体具体关系的描述见图2。实践世界的“事件”与其他世界中“地图载体”“实物”“认知概念”“推测概念”的关联,通过复用“发生现场存在”(crm: P12 发生现场存在)进行了较为宽泛的描述:“实物”和已有的“认知概念”通过生产地图“事件”产生出新的“认知概念”和对应的“地图载体”;而在使用地图“事件”中,“地图载体”和对应的“认知概念”(包括“推测概念”)被阅读、识别从而在认知世界流转,并可能反过来对物质世界的“实物”产生某种影响。生产地图“事件”和阅读地图“事件”都可以被进一步拆解成多个子“事件”,例如生产地图“事件”可粗略分为认知、绘图、改造“事件”,而使用地图“事件”可粗略分为认知、决策和进一步的行动和话语“事件”。

    图  2  古地图顶层本体
    Figure  2.  Top-Level Ontology of the Ancient Map

    “认知概念”及其变化贯穿了每一个大小“事件”。对于学者研究“事件”所还原的“推理概念”,使用“论及”(crm: P67论及)描述其和表征性“地图信息”的关系,而“地图信息”则又被“地图载体””所“承载”(crm: P128承载)或被其复制品“数字图像”所“描绘”(crm:P62描绘)。但需注意的是,“推理概念”可以无限接近于“认知概念”,但由于其作为当代使用地图事件的结果,因而无法等同于后者。

    “实物”与其所在“地点”之间的关系采用“目前或曾经被置放于”(crm: P53目前或曾经被置放于)描述。而对于“地图载体”“数字图像”“实物”所在“地点”以及“认知概念”的实例与同类型实例之间的定性空间关系,如地图上各元素之间的相对位置,在顶层本体中则采用“有定性空间关系”(am:Y1有定性空间关系)表达。

    通过复用CIDOC CRM中的相同或相近概念,以及已有古地图元数据[35]及相关语义框架研究[14]中的基本概念,对古地图顶层本体的“事件”“地图载体”“地图信息”“数字图像”和“地点”的核心概念进行扩展(见图3)。借鉴QSR的空间关系[34],对顶层本体中“地图载体”“数字图像”“认知概念”的空间拓扑关系进行描述。

    图  3  核心概念的扩展
    Figure  3.  Extension of Core Concepts

    “事件”关联着地图生命周期中人物、时间、地点。人物可分为“绘图者”(am: L17绘图者)、“使用者”(am: L18使用者)、“收藏者”(am: L19收藏者),其他相关者则复用其父类“人物”(crm: E39人物)记录。本体主要记录生产地图“事件”关联的“绘制时间”(am: L15绘制时间),其他与地图相关的“时间”复用crm: E52时间。各“事件”对应的“地点”则复用crm:E53地点。

    “地图载体”主要关联地图的基本特征信息,舆图元数据标准[33]中有较多元素可以描述相关信息,研究将其与CIDOC CRM建立映射关系以表达相关概念。包括“题名”(crm: E35题名)、“责任者”(am: L10责任者)、“尺寸”(crm: E54尺寸)、“比例”(am: L11 比例)、“色彩”(am: L11色彩)、“馆藏单位”(crm: E39馆藏单位)、“馆藏档案号”(crm: E42馆藏档案号)、“附注”(am: L20附注)。“资源集”(crm: E78资源集)一般指多个单张地图组成的图纸集合,而“地图载体”一般以单张图纸为单位记录。“相关资源”与“地图载体”之间的关系采用“有组成部分”(crm: P46有组成部分)描述。

    “地图信息”由“语言信息”和“图像信息”组成:“语言信息”(crm: E33语言信息)包括文本及各类字符,如数字、文字等;“图像信息”(crm: E36图像信息)则指可识别的图像的基本类型,如山、建筑等。“图像信息”的“再现法”采用am: L6 再现法描述,该类为crm: E55 Type的子类,取值范围包括平面、立面、透视、外轮廓等,“图像信息”的“表征色彩”则采用am: L7表征色彩描述。“地图信息”与“语言信息”“图像信息”之间采用“有组成元素”crm: P106有组成元素关联,表示“地图信息”的实例包括“语言信息”或“图像信息”的实例。对于已经形成固定表达形式的图例,研究通过参照地图图例本体(map legend ontology,MLO)[10],扩展“图例”概念(am: L8图例)作为“图像信息”的子类,并使用“图例类型”(am: L31图例类型)来区分其填充方式(点、线、面)。

    “数字图像”的相关概念有“数字图像”的“图像编号”(am: L12图像编号)、“图像格式”(am: L13图像格式)、“图像大小”(am: L14图像大小)、“分辨率”(am: L15分辨率)、“图像颜色”(am: L16图像颜色)。

    “地点”由其所关联的“地名”(crm: E48地名)和“空间坐标”(crm: E47空间坐标)来描述。

    “数字图像”和“推测概念”涉及的二维、三维空间关系的描述除直接应用RCC8,还进一步借鉴了3D空间拓扑关系的方向描述方式:全局方向包括东、南、西、北、东南、东北、西南、西北,局部方向包括上、下、左、右、前、后[36]。RCC8、全局方位、局部方位在描述实体空间关系时起到了不同维度的定位作用。其中,为了描述中国地图中常见的轴线关系,为“重叠”(am: Y6重叠)添加了子属性“位于轴线”(am:Y23位于轴线)(见表1)。

    表  1  “定性空间表征关系”的子属性
    Table  1.  Sub-Properties of “Has Qualitative Spatial Representation”
    属性属性描述对称性类型
    相同am: Y2 is equal to对称RCC8
    外切am: Y3 is externally connected to对称
    内切am: Y4 is tangential proper part of非对称
    相离am: Y5 disconnects from对称
    重叠am: Y6 partly overlaps对称
    内含am: Y7 is nontangential proper part of非对称
    在上方am: Y9 is above非对称局部方位
    在下方am: Y10 is below非对称
    在左方am: Y11 is to the left of非对称
    在右方am: Y12 is to the right of非对称
    在前方am: Y13 is in front of非对称
    在后方am: Y14 is behind of非对称
    在东边am: Y15 is to the east of非对称全局方位
    在西边am: Y16 is to the west of非对称
    在南边am: Y17 is to the south of非对称
    在北边am: Y18 is to the north of非对称
    在东南方am: Y19 is to the southeast of非对称
    在东北方am: Y20 is to the northeast of非对称
    在西南方am: Y21 is to the southwest of非对称
    在西北方am: Y22 is to the northwest of非对称
    下载: 导出CSV 
    | 显示表格

    样式雷图档是清代雷氏家族主持并参与皇家建筑工程时设计、绘制、写作并搜集的建筑画样和相关文件[37],其中翔实载述了清代有关国家级大型工程的机构设置与运作、选址勘测、规划设计、施工以至传统工艺等方面的详情细节,对探索中国古代建筑设计思想、理论和方法、施工技术和管理制度,乃至清史、图学史、古代科技史,以及相关文物建筑保护和研究均具重大价值[38]。2007年,中国国家图书馆藏“清代样式雷建筑图档”被联合国教科文组织列入《世界记忆名录》[39]。样式雷图档作为中国古代建筑工程图纸可被广义地视为一种专题地图,反映了包括选址勘测、规划设计、施工等一系列复杂的工程实践,并通过丰富的制图体系表达了当时人们对建筑及地理空间形态和空间关系的认知,是清代人认知、设计和改造空间的媒介。

    为了验证古地图本体在描述表征、概念、实践、物质关系的效用,需选择表征有一定代表性、

    概念世界复杂、实践“事件”和所涉物质明确的古地图系列加以验证。由于大部分古地图的生产和使用语境缺乏连贯记录,本文选用了数量较多、内容相互关联、地图内外语义复杂的特殊古地图——清代建筑工程图纸样式雷图档系列,以充分体现本体的效用。样式雷图档涉及了选址勘测、规划设计、施工等复杂的建筑实践活动,这些生产图和用图的“事件”被其他文字性史料全面地记录了下来,而其丰富的图像表征所表达的包括建筑规划、设计、风水、建造在内的复杂概念体系也已经得到了基本廓清[38,40]

    本文从清代帝王咸丰皇帝的陵寝——定陵工程图档中选取了4张生产时间较为靠近的“地图载体”(见图4),通过相关论文[41]的描述对“地图信息”及其相关实践、概念、实物、地点进行关联描述。建模分为3个部分:地图基本描述呈现了一般的“地图载体”元数据编目所关注的信息,而起框架性作用的地图实践活动在时空层面使不同世界的实体得以关联和讨论,表征与“认知概念”部分则可以基于前述基础跨地图、跨时空地系统讨论地图的概念世界、表征世界和实践世界的变化。

    图  4  样式雷图档中有关定陵的古地图案例
    Figure  4.  Map Carriers from Yangshi Lei Archives About Construction Engineering of Ding-Ling Tomb

    地图基本描述以实物“地图载体”和“数字图像”为核心,在建立二者关联的同时也包括了题名、馆藏单位、尺寸、色彩、制作时间、主题类别等基本内容(见表2)。图4中选定的4张图纸均产生于咸丰八年(公元1858年),其中平安峪地盘画样(181-0001)为确定勘测选址后绘制的正式图纸 (图4(a)),其余3张图纸被鉴定为随方案演变所产生的初始规划图(270-0004) (图4(b))和两张规划设计图(182-0016、181-0015) (图4(c)、4(d)),体现了此次定陵规划设计逐步完善的过程[40]

    表  2  与定陵建筑工程4张“地图载体”相关的实体
    Table  2.  Entities Related to “Map Carrier” from Construction Engineering of Ding-Ling Tomb
    馆藏档案号题名馆藏单位图纸尺寸/cm2地点色彩数字图像编号数字图像色彩数字图像大小/MB附注CVAT标注
    crm: E42 Identifiercrm: E35 Titlecrm: E39 Actorcrm: E54 Dimensioncrm: E53 Placeam: L11 Coloram: L12 Image Identifieram: L16 Image Coloram: L14 Image Extentam: L20 Descriptionam: L2 Digital Image
    181-0001平安峪地盘画样中国国家图书馆159.8×61.4定陵多色181-0001C彩色4.02确定选址后绘制的正式图
    270-0004平安峪地势约拟规制糙底中国国家图书馆定陵270-0004B黑白9.63182-0016方案底图,仅绘制各进院落及主要建筑的控制线
    182-0016平安峪地盘画样贴签子尺寸底中国国家图书馆124.5×39.7定陵双色182-0016C彩色0.697在182-0015基础上,将宝城面宽10丈地宫方案与总体布局方案合并、微调后形成的第二套规划方案
    181-0015平安峪地盘画样中国国家图书馆159.0×67.2定陵多色181-0015C彩色1.99修改182-0016而成的彩绘正式图
    下载: 导出CSV 
    | 显示表格

    “事件”实体将实践活动与“地图载体”“认知概念”及“实物”相连,打破了“地图载体”所涉及的物质世界与概念世界的分隔,并有助于进一步探索古地图作为人类认知工具随时间的效用变迁问题。

    定陵是清东陵的第四座帝陵,位于裕陵以西的平安峪。咸丰元年(1851年)开始选址,咸丰八年(1858年)钦定平安峪为万年吉地,次年(1859年)动工,同治四年(1865年)皇帝下葬[41]。在定陵动工的前一年(1858年),发生了一系列勘测平安峪地形、根据地形进行建筑规划及深化规划设计的实践活动,将其中181-0001、270-0004、182-0016、181-0015这4张“地图载体”对应的4次工程“事件”依次命名为“平安峪选址”“定陵规划设计01-01”“定陵设计01-02”“定陵设计01-03”(见图5),这些“事件”产生了相互关联的“认知概念”和“设计方案”(crm: E29设计方案,“认知概念”的子类),并生产了对应的4张“地图载体”。4张“地图载体”的生产时间前后相继,后生产的“地图载体”利用了之前的“地图载体”及其涉及的“认知概念”。而这些历史上的“认知概念”可以由当代的研究事件产生一个近似的“推理概念”。

    图  5  古地图载体案例中的各类实践事件与认知概念、实物的语义网
    Figure  5.  Semantic Web of Practical Events, Cognitive Concepts, and Physical Things in the Case of Map Carriers from Ding-Ling Tomb

    《平安峪工程备要》以文字记录了“平安峪选址”和“定陵设计01-03”事件的相关信息(见图6)。以“平安峪选址”事件为例,还包括了“覆勘平安峪”和“呈进1”事件,而整个选址事件产生了认知概念“平安峪”和地图载体“平安峪地盘画样”(181-0001)。根据对《平安峪工程备要》卷一中的奏章《派员覆勘吉地绘具图说呈进》进行文本标注,“覆勘平安峪”事件发生于咸丰八年八月二十日至二十五日,由章京司员户部郎中王正谊、钦天监博士方达、圆明园苑丞松瑞对现位于

    图  6  基于历史档案文本标注的地图载体相关的事件、实物、人的建模
    Figure  6.  Events, Physical Things, and Actors Related to Map Carriers Based on Text Annotation of Archivals

    “唐山市遵化市清东陵”的实物“平安峪”进行了勘测考察,而后产生的地图载体“平安峪地盘画样”(181-0001)于九月初二呈进给咸丰皇帝用于决策。该奏章还记录了与地图载体181-0001内容相互印证的具体内容(根据勘测确定的穴中、山向及其与东西山的距离)。

    利用计算机视觉注释工具[42]对“地图载体”的复制品“数字图像”进行手工标注,将整幅地图分解成诸多“数字图像”切片,建立切片与表征性“地图信息”及“推测概念”的联系,从而进一步讨论跨地图的概念、表征和实践的关系。

    表征性的“地图信息”分为“图像信息”(crm:E36图像信息)和“语言信息”(crm: E33语言信息),对图像信息采用类型化的命名方式,并使用“再现法”(am: L6 再现法)和“图例”(am: L8图

    例)来进一步区分图像信息的类型。数字图像切片涉及概念的词表最佳来源为原地图中的语言信息,也可从同时代相关的其他历史文献或已有研究中获取。

    通过对数字图像切片进行手工标注和属性分配将初始选址阶段图纸中的数字图像与地图信息(图7(a))、地图信息与推测概念(图7(b))进行串联,其中推测概念所使用的词汇基本来自于同一张图上的语言信息。数字图像181-0001C-0004利用“图像信息”的方式表征了推测概念“靠山”,该概念在空间上也位于其周边切片0005、0007所描绘的“内东山”“内西山”的中心。用于放置地宫棺床的“穴中”概念则内含于“靠山”中,并有语言信息“内东山至穴中宽五丈三尺”与“穴中至内山西山边宽四丈七尺”描绘了其与“内东山”“内西山”概念的距离。在空间上经过“穴中”,并位于“靠山”轴线的“山向1”概念则被0001切片的图像信息所描绘,也被“壬山丙向兼子午三分辛亥辛己分金”的语言信息描述了其具体方位。

    图  7  单张地图的图像-表征-概念(基于181‑0001C的图像标注)
    Figure  7.  Image-Representation-Concept in One Map Carrier Based on Image Annotation of 181-0001C

    通过将选址和初始设计阶段的地图载体之间的概念进行关联,可以发现地图被如何用以完成对概念的继承和再创造(见图8)。第二阶段初始规划事件生产出的地图载体270-0004继承了前一张181-0001选址图所涉及的“平安峪”概念。两张图的推测概念“平安峪”和“定陵设计01-02”在其组成部分方面有所重叠:它们共有“山向1”子概念,而设计概念组成中与勘测概念不同的组成部分,即“地宫设计”和“隆恩殿设计”,也与后者的子概念“山向1”“穴中”和“靠山”有空间上的关系。实际上,270-0004的设计方案正是通过前一张图所确定的“山向1”“穴中”和“靠山”进一步确定了概念物主要建筑与概念物山体及它们之间的空间布局关系:概念物主要建筑“地宫设计”和“隆恩殿设计”的中轴线被安排在了“山向”上,而由于山体与建筑的概念物在空间上部分重叠,原本的“靠山”也被“靠山改造”设计方案替代。

    图  8  不同地图间的概念继承与概念创新(基于181-0001C、270-0004B的图像标注)
    Figure  8.  Inheritance and Innovation of Cognitive Concepts Between Different Map Carriers Based on Image Annotation of 181-0001C and 270-0004B

    将3张定陵规划设计阶段图纸中的同类概念

    表征方式进行比较分析,从而可以理解不同表征在不同实践中的具体作用。在前后3张用于规划设计的地图载体上,对“隆恩殿设计”这一理想单体建筑设计概念均使用了“平面”化的图像信息表征方式,表达了“单体建筑”在平面上的布局,

    并且使用了稳定的符号化图例(如“窗”)来组合表达(见图9)。但在3张不同实践阶段的地图载体上,“单体建筑”的表征在逐步细化:初始规划图中的270-0004B-0001采用了外轮廓的简单表征方式;在稍后的规划设计草图中,182-0016C-0002利用了复杂而稳定的符号体系表达了平面上建筑的柱网结构、门、窗、墙、台基的组合关系,以及汉字和苏州码(一种便捷记数系统)表达的

    图  9  建筑设计方案的不同表征方式(基于270-0004B、182-0016C、181-0015C图像标注)
    Figure  9.  Different Representations of Architectural Design Concepts Based on Image Annotation of 270-0004B, 182-0016C, 181-0015C

    尺寸信息;规划设计终稿中的181-0015C-0002则采用了和规划设计草图一样的符号体系只是用笔更为正式,但对于语言信息的表征方式有了较大变化——草图中表征建筑的图像信息采用了比黑色的语言信息更为显眼的红色,但终稿中则正相反,采用了比红色线条的建筑表征更为显眼的红色贴签和标签上的黑色汉字来表达建筑命名和尺寸信息,从而在进呈后方便皇帝更容易地利用贴签定位建筑并获得有关建筑的描述。

    3张规划设计图中对山体的设计方案也使用了“符号”化的图像信息表征方式(见图10)。虽然对“山”的表征方式随设计推进看似越发详细,规划设计终稿中的181-0015C-0001甚至看起来像一幅不分虚实笔触的山水画,但这些不同版本的“山”符号在外轮廓、信息传递的深度和内容层面并无太多区别,这也说明了其表征的“靠山改造”概念在几张图中不是重点分析对象。但为了表征这些没有区分的“山”概念,却采取了不同的“山”符号,其背后的缘由应与其所涉的不同实践目的有关。为此可以将3个实践阶段对山的表征与对建筑的表征方式联系起来分析:初始规划图的目的是针对既有的山水空间概念对建筑进行大体的定位规划设计,而此地图载体中的“山”(270-0004B-0001)采用了和其“单体建筑”(270-0004B-0001)同样的外轮廓化的平面表征,说明这样的简单方式已经能够有效帮助建筑定位的推敲实践;在更为详细的规划设计草图中,虽然都是平面表征,但区别于作为重点表达对象的“单体建筑”(181-0016C-0002)所采用的红色、几何化的表征方式,“山”(181-0016C-0001)只是采用了黑色、白描的方式用以反衬建筑;而规划设计终稿中的“山”(181-0015C-0001)采用了比前两种“山”更为立体和整体的山水画式符号(与此类似的是选址阶段呈给皇帝的181-0001也采用了山水画式符号),这种更为直观的方式与其“单体建筑”共同表现了建筑与风水格局的整体关系。

    图  10  山体设计方案的不同符号化表征(基于270-0004B、182-0016C、181-0015C图像标注)
    Figure  10.  Different Symbolic Representations of Mountain Modification Concepts Based on Image Annotation of 270-0004B, 182-0016C, 181-0015C

    为了利用基于认知-实践模型的古地图本体框架对4张清代定陵工程地图信息建模进行案例验证,本文根据已有研究,首先基于同时代文本档案对4张案例地图所涉及实践世界的不同工程事件和行动者进行了描述,其次将地图上语言信息涉及的概念与图像信息对应,从而建立了局部

    概念和整体概念之间的关系,然后通过不同地图之间概念的关联分析描述了认知世界中概念继承和概念创新的流动过程,最后通过与概念世界、实践世界的交叉观察来表征世界实体的异同。

    通过多种来源的图像、语言信息的关联,认知-实践模型首先从概念与实践的关系角度揭示

    了勘测实践采用的风水概念通过“山向”“穴中”等影响陵寝建筑组群概念生产的方式以及建筑单体设计概念进一步深化的方式,而这些概念随时间的变化又反过来说明了清代皇陵工程实践在选址、规划、设计中的具体展开方式。

    由于定陵工程涉及不同的行动者对同类认知概念的处理实践,而认知-实践模型自然可以解释作为实践中介的地图表征所反映的不同行动者在实践和认知方面的异同。从设计师自用的规划设计草图和呈给皇帝的终稿采用了同样的建筑符号体系来看,清代样式房中以雷思起为首的设计师们和咸丰皇帝显然在对建筑的认知方面可以共享一套表征体系。但对认知、实践进行控制变量后,表征世界体现出的异质性也说明了不同行动者的认知差异及对地图载体所用的表征语言对这一习得性差异的调适。从草图的表征组合来看,画图人应该已经惯于借助不同细粒度的平面化表征(如外轮廓、复杂的建筑符号)并辅以简单的苏州码尺寸信息,在距大尺幅图纸或近或远的位置进行与空间概念相关的不同细粒度的分析、推敲和创作实践。但呈阅给习惯诗文书画的咸丰皇帝的终稿,其表征方式更加注重对文字信息、山水画式符号和整体空间关系的表达,这在一定程度上说明了对咸丰皇帝认知建筑概念来说,设计师习惯的分析性的、几何化的建筑平面表征反不如建筑命名和尺寸等文字信息有效,而设计师习惯的山体衬建筑的平面化表征也不如完整的、透视化的山体搭配几何化的建筑表征更能凸显二者的空间关系。这种表征性差异反映了地图载体背后的两种实践和认知体系,但画图人利用表征语言的变化使其在一定程度上迎合读图人不同的知识框架。因此概言之,清定陵工程地图载体所使用的表征方式可说是内嵌于不同认知模式的行动者的实践活动,而地图载体本身则给其概念世界的流动及不同人针对概念的交流和沟通、创造和推敲的实践提供了一个半标准化的操作平台。

    为了促进知识史视野下古地图知识形成、流通与转译问题的数字研究范式,本文提出了古地图认知-实践模型和古地图本体模型,并选取了涉及复杂工程实践、概念及表征体系的清代样式雷图档进行了标注实验。实验结果表明,该模型能够通过拓展部分本体结构有效支持描述,并记录古地图所涉及的表征、实践、概念及物质之间的复杂语义关系,有助于理解表征何以在概念和实践的互动中发生的问题。但在建模时,该本体对于隐含的历史事件和研究类事件并没有详细拓展,同时对于古地图表征与概念的关联尚未清晰界定具体操作方式。这一问题与认知心理学和计算机视觉领域的语义鸿沟问题有关,并且应该强调的是,作为解决与空间有关特定问题而出现的地图,其所联结的概念体系可能由于其实践性而具有一定的偶然性,因而需要积累大量的知识库以发现其共性、多样性和历史变化。而后续该本体将会应用到更多的案例中,同时,应该测试计算机视觉技术和自然语言处理技术加入的大规模本体填充的简化程序,从而自动提取古地图和历史文本中的表征、概念和实践的具体实例,并不断积累古地图知识库,推动数据挖掘、知识推理方法研究地图学史和形象史的新范式。

  • 图  1   8方向梯度示意图

    Figure  1.   Eight Directional Gradient Diagram

    图  2   背景消除结果

    Figure  2.   Background Elimination Result

    图  3   最小外接矩形及最终目标

    Figure  3.   Minimum Outside Rectangles and Final Objects

    图  4   不同方法在单摄像头中的跟踪结果

    Figure  4.   Tracking Results of Different Methods in Single Camera

    图  5   不同视角下的行人图像

    Figure  5.   Pedestrian Images Under Different Perspectives

    图  6   当前摄像头跟踪区域及相邻摄像头搜索区域

    Figure  6.   Tracking Areas in Current Camera and Search Areas in Adjacent Cameras

    图  7   完整包含目标时的放大倍数展示

    Figure  7.   Magnifications When Target Fully Included

    图  8   不同目标跨1号、2号摄像头的连续跟踪结果

    Figure  8.   Continuous Tracking Results of Different Targets Across Camera 1 and Camera 2

    图  9   不同目标跨2号、3号摄像头的连续跟踪结果

    Figure  9.   Continuous Tracking Results of Different Targets Across Camera 2 and Camera 3

    图  10   不同目标跨3号、4号摄像头的连续跟踪结果

    Figure  10.   Continuous Tracking Results of Different Targets Across Camera 3 and Camera 4

    图  11   不同方法的成功率统计结果

    Figure  11.   Success Rate Statistics of Different Methods

    表  1   不同重叠率下的放大倍率统计

    Table  1   Statistics of Magnifications Under Different Overlap Ratios

    组别 镜头号 重叠率/% 镜头高度/m 平均倍数
    第1组 1-2 17.0 14.72、14.81 4.375
    2-3 25.0 14.81、14.86 4.625
    3-4 44.0 14.86、14.83 3.000
    第2组 2-1 17.0 14.81、14.72 3.750
    3-2 25.0 14.86、14.81 3.000
    4-3 44.0 14.83、14.86 3.375
    第3组 5-6 49.3 14.85、14.88 4.625
    6-7 9.1 14.88、14.83 3.000
    7-8 35.9 14.83、14.76 3.000
    第4组 6-5 49.3 14.88、14.85 3.000
    7-6 9.1 14.83、14.88 3.000
    8-7 35.9 14.76、14.83 5.000
    下载: 导出CSV

    表  2   不同方法在测试平台下的跟踪平均速度/(帧·s-1)

    Table  2   Average Speed of Different Methods Under Test Platform/(frames·s-1)

    采用方法 实时性
    视频1 视频2 视频3 视频4
    KCF 31.5 33.3 32.1 35.7
    CSR-DCF 16.3 15.9 16.5 16.5
    YOLO v3+文献[24] 16.4 16.0 16.1 16.0
    DSR-DCF 21.9 22.1 21.4 21.8
    下载: 导出CSV
  • [1]

    Vilaplana V, Varas D. Face Tracking Using a Region-Based Mean-Shift Algorithm with Adaptive Object and Background Models[C]// Workshop on Image Analysis for Multimedia Interactive Services, London, UK, 2009

    [2]

    Bolme D S, Beveridge J R, Draper B A, et al. Visual Object Tracking Using Adaptive Correlation Filters[C]// IEEE Conference on Computer Vision and Pattern Recognition, San Francisco, USA, 2010

    [3]

    Kalal Z, Mikolajczyk K, Matas J. Tracking Learning Detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(7): 1 409-1 422 doi: 10.1109/TPAMI.2011.239

    [4]

    Danelljan M, Häger G, Khan F S, et al. Accurate Scale Estimation for Robust Visual Tracking[C]// British Machine Vision Conference, Nottingham, UK, 2014

    [5]

    Henriques J F, Caseiro R, Martins P, et al. High-Speed Tracking with Kernelized Correlation Filters[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(3): 583-596 doi: 10.1109/TPAMI.2014.2345390

    [6] 余旺盛, 田孝华, 侯志强, 等. 基于OLDM与贝叶斯估计的鲁棒视觉跟踪[J]. 武汉大学学报·信息科学版, 2015, 40(11): 1 539-1 544 doi: 10.13203/j.whugis20130535

    Yu Wangsheng, Tian Xiaohua, Hou Zhiqiang, et al. Robust Visual Tracking Based on OLDM and Bayesian Estimation[J]. Geomatics and Information Science of Wuhan University, 2015, 40(11): 1 539-1 544 doi: 10.13203/j.whugis20130535

    [7] 熊昌镇, 王润玲, 邹建成. 基于多高斯相关滤波的实时跟踪算法[J]. 浙江大学学报(工学版), 2019, 53(8): 1-9 https://www.cnki.com.cn/Article/CJFDTOTAL-ZDZC201908007.htm

    Xiong Changzhen, Wang Runling, Zou Jiancheng. Real-Time Tracking Algorithm Based on Multi-Gaussian Correlation Filtering[J]. Journal of Zhejiang University (Engineering Edition), 2019, 53(8): 1-9 https://www.cnki.com.cn/Article/CJFDTOTAL-ZDZC201908007.htm

    [8] 罗会兰, 石武. 结合连续卷积算子的自适应加权目标跟踪算法[J]. 中国图象图形学报, 2019, 24(7): 1 106-1 115 https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB201907010.htm

    Luo Huilan, Shi Wu. Adaptive Weighted Target Tracking Algorithm Combined with Continuous Convolution Operator[J]. Journal of Image and Graphics, 2019, 24(7): 1 106-1 115 https://www.cnki.com.cn/Article/CJFDTOTAL-ZGTB201907010.htm

    [9] 黄树成, 张瑜, 张天柱, 等. 基于条件随机场的深度相关滤波目标跟踪算法[J]. 软件学报, 2019, 30(4): 927-940 https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201904006.htm

    Huang Shucheng, Zhang Yu, Zhang Tianzhu, et al. Depth Correlation Filtering Target Tracking Algorithm Based on Conditional Random Field[J]. Journal of Software, 2019, 30(4): 927-940 https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB201904006.htm

    [10] 叶语同, 李必军, 付黎明. 智能驾驶中点云目标快速检测与跟踪[J]. 武汉大学学报·信息科学版, 2019, 44(1): 142-147 doi: 10.13203/j.whugis20170146

    Ye Yutong, Li Bijun, Fu Liming. Rapid Detection and Tracking of Point Cloud Targets in Intelligent Driving[J]. Geomatics and Information Science of Wuhan University, 2019, 44(1): 142-147 doi: 10.13203/j.whugis20170146

    [11]

    Lukezic A, Vojir T, Zajc L C, et al. Discriminative Correlation Filter with Channel and Spatial Reliability[C]// IEEE Conference on Computer Vision and Pattern Recognition, Hawaii, USA, 2017

    [12]

    Cheng D S, Cristani M, Bazzani L, et al. Custom Pictorial Structures for Re-identification[C]//British Machine Vision Conference, Dundee, Scotland, 2011

    [13]

    Liao S, Hu Y, Zhu X, et al. P‍erson Re-identification by Local Maximal Occurrence Representation and Metric Learning[C]// IEEE Conference on Computer Vision and Pattern Recognition, Boston, USA, 2015

    [14] 别秀德, 刘洪彬, 常发亮, 等. 自适应分块的多特征融合多目标跟踪[J]. 西安电子科技大学学报(自然科学版), 2017, 44(2): 151-157 doi: 10.3969/j.issn.1001-2400.2017.02.026

    Bie Xiude, Liu Hongbin, Chang Faliang, et al. Adaptive Multi-feature Fusion Multi-target Tracking[J]. Journal of Xidian University(Natural Science), 2017, 44(2): 151‍‍-157 doi: 10.3969/j.issn.1001-2400.2017.02.026

    [15] 杨忠桃, 章东平, 杨力, 等. DGD卷积神经网络行人重识别[J]. 中国计量大学学报, 2017, 28(4): 504-508 doi: 10.3969/j.issn.2096-2835.2017.04.016

    Yang Zhongtao, Zhang Dongping, Yang Li, et al. DGD Convolutional Neural Network Pedestrian Recognition[J]. Journal of China University of Metrology, 2017, 28(4): 504-508 doi: 10.3969/j.issn.2096-2835.2017.04.016

    [16] 张耿宁, 王家宝, 张亚非, 等. 基于特征融合的行人重识别方法[J]. 计算机工程与应用, 2017, 53(12): 185-189 doi: 10.3778/j.issn.1002-8331.1601-0064

    Zhang Gengning, Wang Jiabao, Zhang Yafei, et al. Pedestrian Re-identification Method Based on Feature Fusion[J]. Computer Engineering and Applications, 2017, 53(12): 185-189 doi: 10.3778/j.issn.1002-8331.1601-0064

    [17]

    Wu S, Chen Y C, Li X, et al. An Enhanced Deep Feature Representation for Person Re-identification[C]// IEEE Winter Conference on Applications of Computer Vision, New York, USA, 2016

    [18]

    Ding S, Lin L, Wang G, et al. Deep Feature Learning with Relative Distance Comparison for Person Re-identification[J]. Pattern Recognition, 2015, 48(10): 2 993-3 003 doi: 10.1016/j.patcog.2015.04.005

    [19]

    Liu J, Zha Z J, Tian Q I, et al. Multi-scale Triplet CNN for Person Re-identification[C]// Advanced Cosmetic Multi-media Meeting, Amsterdam, Netherlands, 2016

    [20]

    Cheng D, Gong Y, Zhou S, et al. Person Re-identification by Multi-channel Parts-Based CNN with Improved Triplet Loss Function[C]//IEEE Conference on Computer Vision and Pattern Recognition, LasVegas, USA, 2016

    [21]

    Hermans A, Beyer L, Leibe B. In Defense of the Triplet Loss for Person Re-identification[C]// IEEE Conference on Computer Vision and Pattern Recognition, Hawaii, USA, 2017

    [22]

    Zhang R, Lin L, Zhang R, et al. Bit-Scalable Deep Hashing with Regularized Similarity Learning for Image Retrieval and Person Re-identification[J]. IEEE Transactions on Image Processing, 2015, 24(12): 4 766-4 779 doi: 10.1109/TIP.2015.2467315

    [23]

    Chen W, Chen X, Zhang J, et al. Beyond Triplet Loss: A Deep Quadruplet Network for Person Re-identification[C]//IEEE Conference on Computer Vision and Pattern Recognition, Hawaii, USA, 2017

    [24]

    Luo H, Gu Y, Liao X, et al. Bag of Tricks and a Strong Baseline for Deep Person Re-identification[C]// IEEE Conference on Computer Vision and Pattern Recognition, Long Beach, USA, 2019

  • 期刊类型引用(2)

    1. 宁荣荣,王德,田信鹏,张永伟,周自翔,罗富彬. 黄河三角洲的地面沉降分析以及海水淹没预估. 地球科学进展. 2023(03): 296-308 . 百度学术
    2. 黄佳慧,贺小星,胡顺强,龚华博. 基于主成分分析方法的海平面变化精确估计方法. 测绘科学. 2023(12): 10-19 . 百度学术

    其他类型引用(1)

图(11)  /  表(2)
计量
  • 文章访问数:  1303
  • HTML全文浏览量:  435
  • PDF下载量:  70
  • 被引次数: 3
出版历程
  • 收稿日期:  2020-09-12
  • 发布日期:  2021-08-04

目录

/

返回文章
返回