地理位置关联的COVID-19传播时空分析

应申, 徐雅洁, 窦小影, 陈学业, 赵军, 郭晗

应申, 徐雅洁, 窦小影, 陈学业, 赵军, 郭晗. 地理位置关联的COVID-19传播时空分析[J]. 武汉大学学报 ( 信息科学版), 2020, 45(6): 798-807. DOI: 10.13203/j.whugis20200241
引用本文: 应申, 徐雅洁, 窦小影, 陈学业, 赵军, 郭晗. 地理位置关联的COVID-19传播时空分析[J]. 武汉大学学报 ( 信息科学版), 2020, 45(6): 798-807. DOI: 10.13203/j.whugis20200241
YING Shen, XU Yajie, DOU Xiaoying, CHEN Xueye, ZHAO Jun, GUO Han. Spatial-Temporal Analysis of COVID-19 Transmission Based on Geo-Location Linked Data[J]. Geomatics and Information Science of Wuhan University, 2020, 45(6): 798-807. DOI: 10.13203/j.whugis20200241
Citation: YING Shen, XU Yajie, DOU Xiaoying, CHEN Xueye, ZHAO Jun, GUO Han. Spatial-Temporal Analysis of COVID-19 Transmission Based on Geo-Location Linked Data[J]. Geomatics and Information Science of Wuhan University, 2020, 45(6): 798-807. DOI: 10.13203/j.whugis20200241

地理位置关联的COVID-19传播时空分析

基金项目: 

国家重点研发计划 2017YFB0503500

详细信息
    作者简介:

    应申, 博士, 教授, 主要研究领域为地图学、3DGIS与三维产权、智慧城市与位置关联大数据。shy@whu.edu.cn

  • 中图分类号: P208

Spatial-Temporal Analysis of COVID-19 Transmission Based on Geo-Location Linked Data

Funds: 

The National Key Research and Development Program of China 2017YFB0503500

More Information
    Author Bio:

    YING Shen, PhD, professor, specializes in cartography, 3DGIS and 3D cadastre, smart city and big data associated with location. E-mail: shy@whu.edu.cn

  • 摘要: 新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)暴发以来,许多研究对COVID-19的发生和发展进行了分析和预测,但鲜见采用GIS空间分析技术进行COVID-19流行病学调查的研究。不同于医学的病毒原理和大数据分析方法,将流行病学调查知识与位置关联分析相结合,利用五元组模型结构化每个病例数据,采用GIS时空交叠原理处理病例数据,定义统计分类和传播分析的五元组操作规则,实现了确诊病例的分时、分区统计以及输入型、接触型和聚集性病例的判断、挖掘和疾病传播过程的分析。结果显示,五元组结构及其操作规则可实现病例数据的计算机自动化处理,能够快速获取疫情发展状况,推演疫情传播过程。五元组模型结合时序图、关系图等可视化技术能够有效地分析和展示疾病、健康或卫生事件的分布和传播情况,为疾控机构快速掌握疫情传播状况提供支持。
    Abstract: Spatial-temporal analysis method provides technical support for epidemiological investigation. To analyse and demonstrate the transmission of coronavirus disease 2019(COVID-19), this paper takes the data of COVID-19 cases in Shenzhen as an example, combines epidemiological investigation knowledge with geo-location linked association analysis, and uses the spatial-temporal five-tuple model to structure and analyze the case data. Rules based on spatial-temporal five-tuple model for case type judgment and statistical analysis are defined, which can use spatial-temporal overlap principles to judge two types of cases, input cases and contact cases, and to make temporal statistics and zoning statistics about the confirmed cases. This paper defines the five-tuple model and its operation rules for judging and analyzing the epidemic gathering situation, which can use the principle of spatial-temporal overlap to judge and mine the epidemic gathering situation and to analyze its propagation process. Combined with GIS spatial-temporal visualization, the entire process of epidemic developments and transmission are displayed in the maps with interactive interface along with temporal series diagrams and social relationship diagrams. During the spreading stage of the epidemic situation, by updating the case data and implementing the analysis, the spatial-temporal five-tuple structure and its operating rules could be feasible to judge, deduce quickly and show the changing status of the epidemic simultaneously with their visualization. The spatial-temporal five-tuple model combined with visualization technology can effectively display the distribution and transmission of the diseases, health or hygiene events, and provide support for disease control agencies to understand and control the spread of epidemic conditions.
  • 地理信息技术让人们更好地理解这个世界,推动人类文明的发展。19世纪英国医生John Snow绘制出霍乱地图,揭示霍乱是通过受污染的饮用水传播,政府据此采取行动,最终有效控制住疫情[1]。将GIS应用到疫情防控中,可有效定位高危易感人群和病毒易发区域,医学GIS系统可识别和绘制医学领域中的弱势群体、健康结果、危险因素以及它们之间的关系。GIS技术、地图应用程序和大数据技术可以用于可视化、分析、解释和显示多种多样的地理位置数据[2]。希波克拉底见解认为,在病例集中的地方,它的起源很可能是在人类和地理环境中,绘制出病例的证据群落和环境能为人们从地理上切断传染病的传播提供依据[3-4]。在大数据与互联网快速发展的背景下,信息的获得与共享变得更加及时,GIS技术为疫情防控提供援助的能力也更加凸显。GIS在调查疾病流行病学特征、协助卫生检疫、评价疫情风险、分配医疗资源、预防控制和时空特征分析等方面都发挥着重要作用[5-10],并有效促进了人们对疾病的认知、解释、预报和调控[11]

    新型冠状病毒肺炎(coronavirus disease 2019,COVID-19)的传染源主要为新型冠状病毒感染的患者和隐形感染者,COVID-19疫情的传播经历了局部暴发、社区传播和大范围传播阶段[12]。疫情暴发以来,医学专家对COVID-19的特征[13]、临床特征[14]等方面进行了大量研究,并利用DNA追踪COVID-19的传播路径[15]。同时,疫情的发展带来了人口迁移的变化[16], 对疫情发展采用恰当的模型进行建模,可拟合和预测确诊人数和疫情拐点[17-18]、挖掘传播能力与防控措施效果之间的关系[19]。在面向防疫大数据分析中,GIS在系统快速构建、区域传播模拟、病毒空间溯源、地域风险划分、物资空间调配、社会心理空间探测等方面发挥着重要作用[20],但还未见采用GIS空间分析技术进行COVID-19流行病学调查的研究。不同于医学的病毒原理和大数据分析方法,本文利用地理位置关联分析的方法,根据五元组模型建模具体的病例,由每一个案例数据出发,寻找它们之间的时空关联关系,以支持流行病学调查,而最终所有的数据也可以支持大数据的分析。

    地理位置关联分析以时空特征为核心,构建人、事、地、物和时间相互联系的框架用于时空分析,其在社交网络[21]、人口流动[22]等方面均有运用。虽然对时空大数据的研究已有很多,但当前时空大数据还面临着诸多挑战,包括数据共享、定位精度、隐私保护和社会治理等多个方面[23]。五元组模型作为一种底层的数据结构,可在技术层面上为时空数据的描述、分析、可视化提供支持。流行病学调查中需要掌握病例发病情况、暴露史、接触史等流行病学相关信息,分析聚集性疫情的传播特征和传播链,追踪判定密切接触者[24]。如天津宝坻区某百货大楼出现的COVID-19聚集性疫情,疾控专家们逐条调查和询问病例的出行活动地点和时间,并人工推演时间先后和位置交叠,建立了流行病学联系。对病例染病原因进行时空溯源,并与地理信息中的时空分析原理相契合,对孤立病例、个人碎片信息等进行结构化,通过时间和位置的结合分析可构建人、事、物与位置的联系,快速高效地绘制时序图和关系图,构建传播链。不同于医学领域人为的分析和判断,本文基于信息科学和数据科学进行高效的自动化推理。通过五元组结构化组织病例数据,并制定传播分析的五元组规则,通过数据库技术从技术层面上高效地实现时空分析。利用深圳市COVID-19疫情公开数据,基于五元组模型和位置关联分析了深圳市COVID-19的疫情情况,旨在借助GIS技术重现疫情在深圳市的时空特征,为公共卫生安全提供指导。

    1) 研究区域

    深圳市南与香港相连,市北与东莞、惠州接壤,水陆空口岸俱全,常住人口达1 300万以上,探索COVID-19的传播链对有效防控疫情、保障人民的安全意义重大。2020-01-23,广东省启动重大突发公共卫生事件一级响应,恰逢春运人口流动量大,在武汉外流人口目的地城市中,深圳排在前50,截至01-27,累计病例数排在第17位[25]

    2) 研究数据

    疫情数据来源于深圳市政府数据开放平台提供的COVID-19疫情公开数据,包括:(1)每日新增确诊病例详情数据,包括发布日期、发布时间、病例号、年龄、性别、居住地、与其他病例关系、在武汉时间(区间)、来深时间、发病时间、入院时间、染病原因、病况、备注(症状与途经地)等信息。(2)深圳市每日确诊病例所属地,表明病例属地管理属于哪个行政区。(3)确诊患者曾逗留过的场所位置坐标,包括行政区划、小区名称、发布时间、小区经纬度坐标等信息。

    3) 研究方法

    流行病学调查方法中的描述性研究要求调查和了解疾病和健康状况在时间、空间和人群间的分布情况,为研究和控制疾病提供线索,为制定卫生政策提供参考[26]。中国疾病预防控制中心在2020-03-09发布了COVID-19流行病学调查指南,用于掌握病例情况、分析聚集性疫情传播特征和传播链等信息,对于个案调查则通过查阅资料、询问病例等方式展开,以调查和判定其接触者。接触者是指在病例的一定活动范围内,可能与其发生接触的所有人,包括家庭成员、亲友、同事、同学、医务工作者和服务人员等,还有同乘交通工具的密切接触者。流行病学调查描述性研究方法重视时间和空间的概念,而GIS研究方法以时空分析见长,利用GIS技术可以有效支撑流行病学调查。对事物的时空特征进行描述能够有效促进基于位置的知识发现,从而提供基于位置的服务。五元组是用于描述位置数据之间关联的模型[27],将某时间序列上的事件抽象为5个元素,即主体、活动、对象、时间和位置,五元组结构可满足流行病学调查数据的描述和分析,定义为:

    $$ Q= <S, A, O, T, L> $$ (1)

    式中,Q表示五元组(quintet),指描述事件信息的一条记录;S表示主体(subject),指活动的承担者或发起者,本文指COVID-19确诊患者(简称患者);A表示活动(activity),指主体的某一时刻动作或者一段时间内的变化过程等活动,也可以指主体描述、关注的活动,本文指患者在某一时刻或者一段时间内的探亲、购物等活动或发病、住院等状态;O表示对象(object),指活动的受动者,本文指密切接触者和一般接触者;T表示时间(time),指时间点或时间段;L表示位置(location),指主体所在的地点或者活动发生的地点。

    五元组模型以时空特征为核心,以此实现人、事、物与位置的联系。可根据病例间的时空关联来建立五元组间的关系,即判断主体A与主体B存在某种时间与位置的重叠性,从而建立主体A与主体B的关联关系(图 1)。

    图  1  时空五元组模型示例图
    Figure  1.  A Record Example of Spatial-Temporal Five-Tuple Model

    本文实验数据来自深圳市COVID-19病例公开数据(https://opendata.sz.gov.cn/data/epidemicDataSet/toEpidemicDataSet/epidemic/showEpidemicData),采用五元组结构对每个病例和记录进行结构化(表 1),并通过五元组的位置关联时空分析作进一步分析和流行病学调查推演。五元组将每个COVID-19确诊患者作为一个主体,将患者在重点疫区暴露后或与其他确诊病例接触后的行为或状态作为活动,将与患者接触的人员作为对象,时间为活动起止的时间段,位置为患者进行活动的地点。由于数据限制,每个患者在深圳逗留地能精确到城市中的小区。

    表  1  时空五元组模型元素及示例
    Table  1.  Elements and Examples of Spatial-Temporal Five-Tuple Model
    五元组 病例信息属性 示例
    主体 病例号 病例231
    活动 患者的行为或状态 探亲、逗留(仅限于位置在深圳的情况)、来深圳、发病、入院、接触
    对象 与患者接触的对象 病例1(病例231父亲)
    时间 患者进行活动的时间点或时间段 2020-01-23
    位置 患者所在位置名称,经度,纬度 幸福小区,116.21, 28.33
    下载: 导出CSV 
    | 显示表格

    五元组信息缺失部分由两种方式判断:(1)根据患者与其他确诊病例的关系,这种情况的主体和对象明确,时间和地点则根据两病例的情况、病例间的关系以及病例的逗留地来确定。例如接触活动的主体是对象的父母,而对象是未成年人,则认为对象跟随父母居住,主体与对象的接触地点为主体的逗留地,对象与主体的逗留地点一致。(2)根据深圳市卫健委发布的逗留场所,这种情况的时间和位置明确,但缺失主体、对象和活动。

    结合流行病学调查知识操作记录病例信息的五元组模型,可构建时序先后关系和空间位置的重叠关系,以支持流行病学调查。五元组模型操作的原则是判断病例之间是否存在时间和空间上的交叠关系,对病例进行统计分类和传播分析的五元组操作规则如下。

    规则1   分时、分区统计

    1) 分时统计是对截至日期为T0的全市域累计确诊病例进行统计,即select count(Q.S) as num from all when Q.A=‘确诊’ and Q.T < =T0

    2) 分区统计是基于位置的聚合统计,对位于行政区L0的确诊病例进行统计,即select count(Q.S) as num from all when Q.A=‘确诊’ and Q.LL0

    规则2   输入型病例判断

    若病例发病前有重点疫区旅居史,则判断病例S0是否为输入型病例的方法如下:

    1) 获取S0在重点疫区的时间T1,即select Q.T as T1 from all when Q.S=S0 and Q.L∈重点疫区。

    2) 获取S0发病的时间T2,即select Q.T as T2 from all when Q.S=S0 and Q.A =‘发病’。

    3) 若T1 < T2,则属于输入型病例。

    规则3   接触型病例判断

    接触型病例是指发病前曾接触确诊患者或者重点疫区来深的病例。由于病例的接触对象可能未知,因此将发病前没有重点疫区旅居史的病例视为接触型病例。判断病例S0是否为接触型病例的方法如下:

    1) 获取S0在重点疫区的时间T1,即select Q.T as T1 from all when Q.S=S0 and Q.L∈重点疫区,若T1不存在,则属于接触型病例;若T1存在,则继续判断过程。

    2) 获取S0发病的时间T2,即select Q.T as T2 from all when Q.S=S0 and Q.A =‘发病’。

    3) 若T1 > T2,则属于接触型病例。

    规则4   病例活动轨迹与病情变化获取

    病例活动轨迹是指病例感染后进行的空间移动。病情变化则指病例健康状态变化的重要节点,包括健康、无症状、发病、入院4种。健康与无症状状态的分界线为病例的感染时间,即在重点疫区暴露的时间或与其他确诊病例接触的时间。病例S0的活动轨迹与病情变化获取如下:

    1) 获取S0所有的五元组集合QS,即select Q as QS from all when Q.S=S0 order by Q.T

    2) 若S0为输入型病例,则找出QS中第1个位置不属于深圳的记录Q0,即select top 1* as Q0 from QS when Q.L∉深圳order by Q.T;若S0为接触型病例,则找出病例最早与其他病例接触的记录Q0,即select top 1* as Q0 from QS when Q.A=‘接触’ order by Q.T。若Q0非空,则将{Q0.T, Q0.L}加入S0的活动轨迹集合QL

    3) 若Q0非空,则在QS中对Q0之后的记录Qi依次进行处理:若Qi.LQi-1.L,则将{Qi.T, Qi.L}加入QL

    4) 分别查询病例健康状态的关键节点,即:

    select Q.T as T1 from QS when Q.A=‘来深圳’or Q.A=‘接触’;

    select Q.T as T2 from QS when Q.A=‘发病’;

    select Q.T as T3 from QS when Q.A=‘入院’。

    将{T1, T2, T3}加入S0的病情变化集合QB,其中T1之前对应健康状态,T1-T2时间段对应无症状状态,T2-T3对应发病状态,T3以后对应入院状态。

    规则5  聚集性病例分析

    聚集性疫情是指14天内在小范围发现2例及以上的确诊病例或无症状感染者,且存在因密切接触导致的人际传播的可能性,或因共同暴露而感染的可能性。聚集性疫情的小范围不局限于家庭、工地、单位,也包括养老院、医院、实验室等场所,或飞机、火车、汽车、轮船等交通工具[28]

    在五元组中,聚集性病例判断规则为查询位置相同的时间间隔小于2周且记录大于2的五元组记录。以位置L0为例,操作流程如下:

    1) 查询位置为L0且病例数大于2的记录集合Q0,即select Q as Q0 from all when Q.L=L0 order by Q.T having(count(Q.S) > =2)。

    2) 设Q0.S构成的集合为SL,对于SL中的元素Si依次获取发病时间Ti,即select Q.T as Ti from all when Q.S=Si and Q.A=‘发病’。

    3) 依据发病时间对SL重新排序,对SL中的病例Si依序进行处理,若Si已处理,则跳过;若Si未处理,判断是否存在Sj(i < j),使得|TiTj|≤14且|TiTj+1| > 14,若存在Sj,则将SiSj间的所有病例都设为已处理,并加入同一个聚集性病例集合;若Sj不存在,仅将Si设为已处理。

    以得到的聚集性病例集合SL为例,在五元组中对聚集性疫情的传播过程进行分析,从而得到病例间的传播关系和传播顺序。操作如下:

    1) 根据病例号依次查询SL中病例的病例类型,设接触型病例的集合为S1

    2) 得到按时间从早到晚的顺序排列的传播集合Q1,即select Q as Q1 from all when Q.SSL and Q.OS1 and Q.A=‘接触’ order by Q.T

    3) 设Q1中的元素为Qi,依次将{Qi.T, Qi.S, Qi.O}加入传播过程集合QC

    规则6   可能的聚集性病例挖掘

    逗留地相近的病例间往往有共同的生活区域(如超市、菜市场),存在因共同暴露而感染的可能性,因此逗留地相近的病例可能成为聚集性病例,其思路是先生成病例逗留地的缓冲区,然后判断缓冲区内逗留地指向的病例与所研究的病例是否符合聚集性疫情的判断标准。考虑到疫情封闭等因素,选取2 km的步行距离作为缓冲区半径阈值。以挖掘病例S0的逗留地附近可能的聚集性病例为例,其过程如下:

    1) 获取S0的逗留地(集),即select Q.L as L1 from all when Q.S=S0 and Q.A=‘逗留’。

    2) 获取S0的发病时间,即select Q.T as T1 from all when Q.S=S0 and Q.A=‘发病’。

    3) 得到逗留地缓冲区内的五元组(集),即select Q from all when Q.L is in the buffer of L1

    4) 依次判断步骤3)得到的五元组Qi是否有主体,若无,则执行步骤5),否则执行步骤6)。

    5) 若|Qi.TT1|≤14,则该记录属于可能的聚集性病例,否则不属于。

    6) 设Qi.SS1, 获取S1的发病时间T2,即select Q.T as T2 from all when Q.S=S1 and Q.A=‘发病’,若|T2T1|≤14,则该记录属于可能的聚集性病例,否则不属于。

    在五元组模型结构化每个COVID-19病例数据的基础上,利用GIS时空交叠原理定义基本的位置关联规则库来处理病例数据,可实现确诊病例的分时或分区统计、输入型、接触型和聚集性病例的判断和挖掘以及疾病传播过程的分析(图 2)。以深圳市为例,自2020-01-19第1例COVID-19确诊患者起至03-03,深圳市累计确诊人数为418人。深圳市实施公共卫生事件一级响应共32 d,疫情基本得到了控制。武汉出行禁令和国家紧急响应控制了疫情增长,最终限制了COVID-19疫情的规模[29]

    图  2  地理位置关联的COVID-19传播时空分析框架
    Figure  2.  Spatial-Temporal Analysis Framework of COVID-19 Transmission Based on Geo-Location Linked Analysis

    为展示深圳市启动公共卫生事件一级响应期间COVID-19疫情的时空分布情况,利用五元组时空关联分析将疫情数据进行统计和时空可视化。图 3(a)是利用五元组规则1的分区统计实现的截至2020-03-06深圳市不同行政区的确诊病例聚合统计,图 3(b)是利用五元组规则1的分时统计得到的2020-01-19—2020-03-06的深圳市累计确诊病例统计。图 4展示了深圳市确诊人数的时空可视化分布图。

    图  3  深圳市分区和分时COVID-19确诊人数统计图
    Figure  3.  Statistics of Confirmed COVID-19 Cases at Different Districts and Different Time in Shenzhen
    图  4  深圳市COVID-19确诊患者时空分布图
    Figure  4.  Temporal and Spatial Distributions of COVID-19 Cases in Shenzhen

    利用五元组判断规则2(输入型病例判断规则)获取五元组中位置来自重点疫区且时间小于该病例的发病时间的记录。按照时间先后进行空间可视化,并叠加当前全市整体的病例分布情况,能直观展现输入型病例的时间分布和空间分布(图 5),便于对照分析输入型病例与其他病例之间可能的关系。截至2020-02-23,湖北输入型病例主要分布在宝安区、南山区、福田区和罗湖区,与当前病例的整体分布一致。

    图  5  COVID-19输入型病例与所有病例的空间分布对比图(截至2020-02-23)
    Figure  5.  Comparison of Spatial Distribution of COVID-19 Input Cases and All Cases (Till Feb. 23, 2020)

    对于单个输入型病例,利用五元组的规则4得到病例的活动轨迹以及病情变化节点,并利用五元组的规则6找出病例逗留地附近可能的聚集性病例。取病例活动轨迹集合QL中所有时间点的并集作为时间轴的时间节点,与地图联动显示。如图 6所示,379号病例2020-01-18自驾到湖北咸宁,01-25自驾前往清远,01-26驾车返回深圳。01-26至02-08发病前的逗留场所为东方社区上头田新村。逗留场所周围2 000 m的步行距离内有一个可能的聚集性病例逗留场所,即潭头社区四村(距离东方社区上头田新村1 349 m)。

    图  6  COVID-19输入型病例可视化
    Figure  6.  Visualization of COVID-19 Input Case

    利用五元组的规则3筛选出深圳市的相关接触型病例,截至2020-03-06,接触型病例主要分布在南山区和福田区(图 7),通过叠加当前的整体分布可以发现,接触型病例和输入型病例分布基本一致,且占据了当前确诊人数的主要部分。

    图  7  COVID-19接触型病例与所有病例的空间分布对比图(截至2020-03-06)
    Figure  7.  Comparison of Spatial Distribution of COVID-19 Contact Cases and All Cases (Till Mar. 6, 2020)

    图 8描述了270号接触型病例的信息综合与可视化,该病例近期无重点疫区相关旅居史,2020-01-26发病,02-03入院。该病例在深圳有3个逗留地,即招商街道沿山路63号、水木华庭和西丽塘朗城。可能的聚集性病例逗留场所有水木丹华(距离西丽塘朗城1 559 m)、御景峰(距离西丽塘朗城1 852 m)、花园城一期(距离招商街道沿山路63号569 m)。

    图  8  COVID-19接触型病例可视化
    Figure  8.  v

    利用五元组的规则5查找聚集性疫情并分析其传播过程;利用五元组的规则4和规则6可得到病例的个案信息,再通过信息整合得到聚集性疫情多个病例的时空轨迹、病情变化过程和逗留地等信息。聚集性病例可视化采用时间轴与地图联动的方式展示病例的活动轨迹、逗留地和附近可能的聚集性疫情。但由于病例不止1个,故在逗留地点中心采用数字显示的方式表明逗留人数,且逗留地符号半径与逗留人数成比例。为展示聚集性病例之间的传播过程,采用关系图的形式,每个节点对应1个病例,节点之间若有连线,则表明对应的病例具有传播关系。地图、关系图与时间轴的联动可以清晰地展示聚集性疫情传播发生的时间、地点、传播者和被传播者。同时,为了展示所有病例的病情变化过程以及病例之间的病情变化对比,采用甘特图的形式,配合可缩放的时间尺度显示各病例病情随时间的变化情况,从而清晰地表示聚集性病例感染、发病、入院的先后顺序。

    图 9所示,以查询到的地址“福田区新世界四季山水一期”为例,共有3项病例记录,分别为病例415、病例402和病例397。第1个病例的发病时间为2020-02-09,第2、3个病例的发病时间均为2020-02-10,间隔时间小于2周,3个病例之间有亲属关系,经过五元组规则5的聚集性疫情判断可知,此3例病例为家庭聚集性疫情。其中,病例415在01-20的位置由湖北武汉变化为广东深圳,为输入型病例。病例397和病例402在2020年并无湖北旅居史,为接触型病例。病例402在01-20后与病例415密切接触,病例397在01-22后与病例415有密切接触。经过五元组规则5的聚集性疫情传播过程分析,可知该案例的传播链为:病例415(父亲)01-20之前在武汉探亲,01-20返回深圳家中,感染了病例402(母亲),01-22后感染了病例397(儿子)。

    图  9  COVID-19聚集性病例可视化
    Figure  9.  Visualization of COVID-19 Gathering Cases

    本文利用深圳市新型冠状病毒感染肺炎疫情公开数据,采用五元组时空关联和交叠分析方法进行分析,反映了COVID-19在深圳市响应“广东省启动重大突发公共卫生事件一级响应”32天的疫情情况,对热力图用色、病例关系图等可视化方法未作深入探讨。结构化的五元组模型可以有效描述病例情况,本文定义的五元组操作可以对病例类型进行快速判断和统计分析,并且能够查找、挖掘聚集性疫情,分析聚集性疫情的传播过程。此外,五元组模型及其操作规则可以实现病例数据的计算机自动化处理,以快速分析聚集性疫情、调查病例之间的流行病学传播链。在疫情发展阶段,当后续数据不断补充过程中,可通过预先定义好的规则快速判断和推演疫情情况。

  • 图  1   时空五元组模型示例图

    Figure  1.   A Record Example of Spatial-Temporal Five-Tuple Model

    图  2   地理位置关联的COVID-19传播时空分析框架

    Figure  2.   Spatial-Temporal Analysis Framework of COVID-19 Transmission Based on Geo-Location Linked Analysis

    图  3   深圳市分区和分时COVID-19确诊人数统计图

    Figure  3.   Statistics of Confirmed COVID-19 Cases at Different Districts and Different Time in Shenzhen

    图  4   深圳市COVID-19确诊患者时空分布图

    Figure  4.   Temporal and Spatial Distributions of COVID-19 Cases in Shenzhen

    图  5   COVID-19输入型病例与所有病例的空间分布对比图(截至2020-02-23)

    Figure  5.   Comparison of Spatial Distribution of COVID-19 Input Cases and All Cases (Till Feb. 23, 2020)

    图  6   COVID-19输入型病例可视化

    Figure  6.   Visualization of COVID-19 Input Case

    图  7   COVID-19接触型病例与所有病例的空间分布对比图(截至2020-03-06)

    Figure  7.   Comparison of Spatial Distribution of COVID-19 Contact Cases and All Cases (Till Mar. 6, 2020)

    图  8   COVID-19接触型病例可视化

    Figure  8.   v

    图  9   COVID-19聚集性病例可视化

    Figure  9.   Visualization of COVID-19 Gathering Cases

    表  1   时空五元组模型元素及示例

    Table  1   Elements and Examples of Spatial-Temporal Five-Tuple Model

    五元组 病例信息属性 示例
    主体 病例号 病例231
    活动 患者的行为或状态 探亲、逗留(仅限于位置在深圳的情况)、来深圳、发病、入院、接触
    对象 与患者接触的对象 病例1(病例231父亲)
    时间 患者进行活动的时间点或时间段 2020-01-23
    位置 患者所在位置名称,经度,纬度 幸福小区,116.21, 28.33
    下载: 导出CSV
  • [1]

    Brody H, Rip M R, Vinten-Johansen P, et al. Map-Making and Myth-Making in Broad Street: The London Cholera Epidemic, 1854[J]. The Lancet, 2000, 356(9 223):64-68

    [2]

    Musa G J, Chiang P H, Sylk T, et al. Use of GIS Mapping as a Public Health Tool—From Cholera to Cancer[J]. Health Services Insights, 2013, 6 :111-116

    [3]

    Koch T. Knowing Its Place: Mapping as Medical Investigation[J]. The Lancet, 2012, 379(9 819):887-888

    [4]

    Cliff A D, Smallman-Raynor M R, Stevens P M. Controlling the Geographical Spread of Infectious Disease: Plague in Italy, 1347—1851[J]. Acta MedicoHistorica Adriatica: AMHA, 2009, 7(2):197-236

    [5] 张孟林.基于GIS技术分析枣庄市农村地区2014—2016年感染性腹泻流行病学特征[D].青岛: 青岛大学, 2019

    Zhang Menglin. Analysis of Epidemiologic Characteristics About Infectious Diarrheal Diseases in the Rural Areas of Zaozhuang City, 2014—2016 Based on GIS[D]. Qingdao: Qingdao University, 2019

    [6] 韩鹏宇, 毕秀欣, 陈津津.GIS技术在国境口岸卫生检疫工作中的应用前景探索[J].口岸卫生控制, 2019, 24(1):3-5 http://d.old.wanfangdata.com.cn/Periodical/kawskz201901003

    Han Pengyu, Bi Xiuxin, Chen Jinjin. Prospect of the Application of GIS in Border Health Quarantine[J]. Port Health Control, 2019, 24(1):3-5 http://d.old.wanfangdata.com.cn/Periodical/kawskz201901003

    [7] 卢易, 王烁, 易敬涵, 等.基于GIS的中国非洲猪瘟疫情风险分析[J].中国兽医学报, 2019, 39(1):8-13 http://d.old.wanfangdata.com.cn/Periodical/zgsyxb201901002

    Lu Yi, Wang Shuo, Yi Jinghan, et al. Risk Analysis of African Swine Fever in China Based on GIS[J]. Chinese Journal of Veterinary Science, 2019, 39(1):8-13 http://d.old.wanfangdata.com.cn/Periodical/zgsyxb201901002

    [8] 马佳, 张知新, 裴韬, 等.地理信息系统在疾病防控与医疗资源配置中的研究进展[J].川北医学院学报, 2018, 33(6):957-961 http://d.old.wanfangdata.com.cn/Periodical/cbyxyxb201806042

    Ma Jia, Zhang Zhixin, Pei Tao, et al. The Latest Researches About Application of GIS in Disease Prevention and Allocation of Medical Resources[J]. Journal of North Sichuan Medical College, 2018, 33(6):957-961 http://d.old.wanfangdata.com.cn/Periodical/cbyxyxb201806042

    [9] 张蓉, 李艳红.空间流行病学在传染性疾病预防与控制中的应用[J].疾病监测与控制, 2018, 12(2):134-138 http://d.old.wanfangdata.com.cn/Periodical/jbjcykz201802016

    Zhang Rong, Li Yanhong. Application of Spatial Epidemiology in Infectious Disease Prevention and Control[J]. Journal of Diseases Monitor and Control, 2018, 12(2):134-138 http://d.old.wanfangdata.com.cn/Periodical/jbjcykz201802016

    [10] 郑嘉丽.传染病的多尺度时空特征分析及其风险因子探究[D].杭州: 浙江大学, 2018 http://cdmd.cnki.com.cn/Article/CDMD-10335-1018016053.htm

    Zheng Jiali. Analysis of Multi-scale Spatial-Temporal Characteristics and Risk Factors of Infectious Diseases[D]. Hangzhou: Zhejiang University, 2018 http://cdmd.cnki.com.cn/Article/CDMD-10335-1018016053.htm

    [11] 赵帅然, 周达岸.地理信息系统在医学研究中的应用[J].锦州医科大学学报, 2018, 39(5):100-102 http://d.old.wanfangdata.com.cn/Periodical/wsyj200402043

    Zhao Shuairan, Zhou Daan. The Application of Geographic Information System in Medical Research[J]. Journal of Jinzhou Medical University, 2018, 39(5):100-102 http://d.old.wanfangdata.com.cn/Periodical/wsyj200402043

    [12] 中华预防医学会新型冠状病毒肺炎防控专家组.新型冠状病毒肺炎流行病学特征的最新认识[J].中华流行病学杂志, 2020, 41(2):139-144 http://d.old.wanfangdata.com.cn/Periodical/zhlxbx202002002

    Special Expert Group for Control of the Epidemic of Novel Coronavirus Pneumonia Preventive of the Chinese Medicine Association. An Update on the Epidemiological Characteristics of Novel Coronavirus Pneumonia (COVID-19)[J]. Chinese Journal of Epidemiology, 2020, 41(2):139-144 http://d.old.wanfangdata.com.cn/Periodical/zhlxbx202002002

    [13]

    Gao Y, Yan L, Huang Y, et al. Structure of the RNA-Dependent RNA Polymerase from COVID-19 Virus[J]. Science, 2020, 368(6 492):779-782

    [14]

    Guan W, Ni Z, Hu Y, et al. Clinical Characteristics of 2019 Novel Coronavirus Infection in China[EB/OL]. http://dx.doi.org/10.1101/2020.02.06.20020974,2020

    [15]

    Forster P, Forster L, Renfrew C, et al. Phylogenetic Network Analysis of SARS-CoV-2 Genomes[J]. Proceedings of the National Academy of Sciences, 2020, 117(17):9 241-9 243

    [16] 刘张, 千家乐, 杜云艳, 等.基于多源时空大数据的区际迁徙人群多层次空间分布估算模型——以COVID-19疫情期间自武汉迁出人群为例[J].地球信息科学学报, 2020, 22(2):147-160

    Liu Zhang, Qian Jiale, Du Yunyan, et al. Multi-level Spatial Distribution Estimation Model of the Inter-regional Migrant Population Using Multi-source Spatio-Temporal Big Data: A Case Study of Migrants from Wuhan During the Spread of COVID-19[J]. Journal of Geo-information Science, 2020, 22(2):147-160

    [17] 王旭艳, 喻勇, 胡樱, 等.基于指数平滑模型的湖北省新冠肺炎疫情预测分析[J].公共卫生与预防医学, 2020, 31(1):1-4 http://d.old.wanfangdata.com.cn/Periodical/ggwsyyfyx202001001

    Wang Xuyan, Yu Yong, Hu Ying, et al. COVID-19 Analysis and Forecast Based on Exponential Smoothing Model in Hubei Province[J]. Journal of Public Health and Preventive Medicine, 2020, 31(1):1-4 http://d.old.wanfangdata.com.cn/Periodical/ggwsyyfyx202001001

    [18] 傅家旗, 刘敏, 邓春燕, 等.复杂人流网络下的COVID-19传播模型[J].电子科技大学学报, 2020, 49(3):383-391 http://d.old.wanfangdata.com.cn/Periodical/dzkjdxxb202003011

    Fu Jiaqi, Liu Min, Deng Chunyan, et al. Spreading Model of the COVID-19 Based on the Complex Human Mobility[J]. Journal of University of Electronic Science and Technology of China, 2020, 49(3):383-391 http://d.old.wanfangdata.com.cn/Periodical/dzkjdxxb202003011

    [19] 陈田木, 赵泽宇, 芮佳, 等.厦门市新冠肺炎传播能力计算与防控措施效果的模拟评估[J/OL].厦门大学学报(自然科学版), 2020, http://kns.cnki.net/kcms/detail/35.1070.n.20200402.1051.002.html

    Chen Tianmu, Zhao Zeyu, Rui Jia, et al. Estimating the Transmissibility of COVID-19 and Assessing the Effectiveness of the Countermeasures to Control the Disease in Xiamen City[J/OL]. Journal of Xiamen University(Natural Science), 2020, http://kns.cnki.net/kcms/detail/35.1070.n.20200402.1051.002.html

    [20]

    Zhou C, Su F, Pei T, et al. COVID-19: Challenges to GIS with Big Data[J/OL]. Geography and Sustainability, 2020, https://dx.doi.org/10.1016/j.geosus.2020.03.005

    [21] 殷钊.基于地理位置的社会信息的信息关联和可视化研究[D].北京: 北京大学, 2014 http://d.wanfangdata.com.cn/Thesis/Y2666811

    Yin Zhao. Research on Information Association and Visualization of Social Information Based on Geographical Location[D]. Beijing: Beijing University, 2014 http://d.wanfangdata.com.cn/Thesis/Y2666811

    [22] 蒋小荣, 汪胜兰, 杨永春.中国城市人口流动网络研究——基于百度LBS大数据分析[J].人口与发展, 2017, 23(1):13-23 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=671500539

    Jiang Xiaorong, Wang Shenglan, Yang Yongchun. Research on China's Urban Population Mobility Network Based on Baidu LBS Big Data[J]. Population and Development, 2017, 23(1):13-23 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=671500539

    [23] 李德仁, 邵振峰, 于文博, 等.基于时空位置大数据的公共疫情防控服务让城市更智慧[J].武汉大学学报·信息科学版, 2020, 45(4):475-487, 556 doi: 10.13203/j.whugis20200145

    Li Deren, Shao Zhenfeng, Yu Wenbo, et al. Public Epidemic Prevention and Control Services Based on Big Data of Spatiotemporal Location Make Cities more Smart[J]. Geomatics and Information Science of Wuhan University, 2020, 45(4):475-487, 556 doi: 10.13203/j.whugis20200145

    [24] 中国疾病预防控制中心.新型冠状病毒肺炎流行病学调查指南[EB/OL]. http://www.chinacdc.cn/jkzt/crb/zl/szkb_11803/jszl_11815/202003/W020200309540843000869.pdf, 2020

    Chinese Center for Disease Control and Prevention. Guidelines for the Epidemiological Investigation of Novel Coronavirus Pneumonia[EB/OL]. http://www.chinacdc.cn/jkzt/crb/zl/szkb_11803/jszl_11815/202003/W020200309540843000869.pdf, 2020

    [25] 许小可, 文成, 张光耀, 等.新冠肺炎暴发前期武汉外流人口的地理去向分布及影响[J/OL].电子科技大学学报, 2020, http://kns.cnki.net/kcms/detail/51.1207.T.20200213.2002.002.html

    Xu Xiaoke, Wen Cheng, Zhang Guangyao, et al. The Geographical Destination Distribution and Effect of Outflow Population of Wuhan When the Outbreak of the 2019-nCoV Pneumonia[J/OL]. Journal of University of Electronic Science and Technology of China, 2020, http://kns.cnki.net/kcms/detail/51.1207.T.20200213.2002.002.html

    [26] 詹思延.流行病学[M]. 8版.北京:人民卫生出版社, 2017

    Zhan Siyan. Epidemiology[M]. 8th ed. Beijing: People's Medical Publishing House, 2017

    [27] 陈坤平.移动互联环境下的位置数据关联研究[D].武汉: 武汉大学, 2018

    Chen Kunping. Geo-Linked Data Model and Analysis in Mobile Internet Environment[D]. Wuhan: Wuhan University, 2018

    [28] 中国疾病预防控制中心.新型冠状病毒肺炎聚集性疫情流行病学调查指南[EB/OL]. http://www.chinacdc.cn/jkzt/crb/zl/szkb_11803/jszl_11815/202002/W020200220475075382229.pdf, 2020

    Chinese Center for Disease Control and Prevention. A Guide to the Epidemiological Investigation of Novel Coronavirus Pneumonia Clustered Epidemic Situation[EB/OL]. http://www.chinacdc.cn/jkzt/crb/zl/szkb_11803/jszl_11815/202002/W020200220475075382229.pdf, 2020

    [29]

    Tian H Y, Liu Y H, Li Y D, et al. The Impact of Transmission Control Measures During the First 50 Days of the COVID-19 Epidemic in China[EB/OL]. https://doi.org/10.1101/2020.01.30.20019844, 2020

  • 期刊类型引用(9)

    1. 毛明扬. 基于时空位置大数据的新冠疫情传播风险控制模型. 计算机与数字工程. 2023(01): 213-218 . 百度学术
    2. 郑彦宁,胡漠,张蕴潮. 国外科技信息服务模式研究热点与前沿分析. 情报工程. 2023(01): 55-68 . 百度学术
    3. 刘桂锋,郭科远,包翔. 基于多源数据融合的新冠肺炎病例活动知识图谱构建与知识发现研究. 情报工程. 2023(01): 102-117 . 百度学术
    4. 宋争放. 从COVID-19疫情带来的新认知中寻找传染病应对之道. 预防医学情报杂志. 2022(01): 140-145 . 百度学术
    5. 邓远嘉,董明华,杨白彬. COVID-19疫情预测模型的研究进展. 赣南医学院学报. 2022(01): 37-43 . 百度学术
    6. 郑良婷,胡文英,胡斌,段平,李佳. 云南省新型冠状病毒肺炎的时空特征分析. 中国卫生统计. 2022(02): 176-179+185 . 百度学术
    7. 李建学,蒲英霞,刘大伟. 中国省际人口迁移短期预测分析. 地理与地理信息科学. 2021(02): 54-62 . 百度学术
    8. 曹永旺,刘樱,周春山. 城市群视角下新冠肺炎疫情的时空扩散特征与影响因素. 地域研究与开发. 2021(03): 1-7 . 百度学术
    9. 郭霄汉,迟远英,丁治明. 基于感知特征的时空过程可视化模型构建. 计算机与数字工程. 2021(12): 2514-2518+2537 . 百度学术

    其他类型引用(10)

图(9)  /  表(1)
计量
  • 文章访问数:  2994
  • HTML全文浏览量:  707
  • PDF下载量:  366
  • 被引次数: 19
出版历程
  • 收稿日期:  2020-06-02
  • 发布日期:  2020-06-04

目录

/

返回文章
返回