大数据驱动的人类移动模式和模型研究

刘瑜, 康朝贵, 王法辉

刘瑜, 康朝贵, 王法辉. 大数据驱动的人类移动模式和模型研究[J]. 武汉大学学报 ( 信息科学版), 2014, 39(6): 660-666. DOI: 10.13203/j.whugis20140149
引用本文: 刘瑜, 康朝贵, 王法辉. 大数据驱动的人类移动模式和模型研究[J]. 武汉大学学报 ( 信息科学版), 2014, 39(6): 660-666. DOI: 10.13203/j.whugis20140149
LIU Yu, KANG Chaogui, WANG Fahui. Towards Big Data-Driven Human Mobility Patterns and Models[J]. Geomatics and Information Science of Wuhan University, 2014, 39(6): 660-666. DOI: 10.13203/j.whugis20140149
Citation: LIU Yu, KANG Chaogui, WANG Fahui. Towards Big Data-Driven Human Mobility Patterns and Models[J]. Geomatics and Information Science of Wuhan University, 2014, 39(6): 660-666. DOI: 10.13203/j.whugis20140149

大数据驱动的人类移动模式和模型研究

基金项目: 国家自然科学基金资助项目(41271386,41271385,41171296)
详细信息
    作者简介:

    刘瑜,教授。主要从事地理信息科学研究。

  • 中图分类号: P208

Towards Big Data-Driven Human Mobility Patterns and Models

Funds: The National Natural Science Foundation of China,Nos.41271386,41271385,41171296.
More Information
    Author Bio:

    LIU Yu,professor.His research interest is geographical information science.

  • 摘要: 目的 大数据时代的到来使得基于个体粒度的海量时空轨迹获取人类移动模式成为可能。来自不同领域的学者基于手机通话数据、公交卡刷卡记录、社交网站签到数据、出租车轨迹、银行刷卡记录等进行了人类移动模式的研究,这些研究丰富了地理信息系统的时空分析方法,为从个体角度审视人与地理环境之间的交互关系提供了一个新视角,并可以应用于交通、公共卫生等领域。总结了基于大数据的人类移动模式研究流程,归纳了人类移动模式的基本度量方法,探讨了解释所观测移动模式的模型构建方法,指出了地理环境对于移动模型建立的影响。
    Abstract: Objective In the big data era,massive volumes of individual-level movements,extracted from variousgeospatial data,including mobile phone data,public transportation card records,social media check-indata,taxi trajectories,and bank card records,are available for scholars in different fields to study hu-man mobility patterns.These studies enrich spatio-temporal analysis methods in GIS and provide anew perspective to human-environment interactions.Observed human mobility patterns and modelscan be applied to many applications such as transportation and public health.This paper presents a ge-neric workflow for big-data-driven human mobility analyses and summaries major movement meas-ures.By comparing a number of models used to interpret and reproduce the observed pattern,this pa-per emphasizes the geographical impact on human mobility patterns.
  • 智慧城市是利用物联网、云计算、大数据技术将虚实世界融合,实现对人和机器的感知、分析、计算、控制和服务[1]。因此,智慧城市需要构建智能感知的、泛在的空间信息服务,并将这些服务组合在一起提供给用户[2, 3]。要实现这些服务的语义描述和智能感知,需要自动感知不同需求的上下文时空信息,譬如,通过手机记录的时间、位置、姿态、速度、加速度等时空连续数据的上下文信息感知,可以判断手机持有人的状态和异常行为(如马路上摔倒等),从而提供必要的应急服务。这类的空间感知和认知服务,本文称为上下文感知的空间信息服务。如何构建上下文感知的空间信息服务以及如何组合这些服务是本文研究的重点。

    构建上下文感知的空间信息服务,目前主要的研究思路是将上下文跟Web服务结合。具体结合方法有多种,其中具有代表性的方法包括采用切面描述上下文,切面与Web服务之间是松耦合的链接关系[4, 5],在运行的时候可以动态关联在一起;通过对OWL-S[6]进行扩展以加入上下文信息。Mokhtar 等提出了一个上下文感知服务组合系统[7],此系统扩展OWL-S来加入对上下文的支持,上下文作为OWL-S的Profile(概要)类的参数属性。Furno等提出了基于上下文的语义模型[8],此模型使用上下文条件和自适应规则扩展OWL-S中的Profile、Process(过程)和Grounding(绑定)类;最后一类方法是加入配置规则,代表性成果包括薛宵等利用配置建立上下文信息与服务之间的关系[9]。本文采用对OWL-S扩展的方法。

    单个的上下文感知空间信息服务提供的功能有限,现实中需要将多个上下文感知的空间信息服务进行组合形成一个更复杂、功能更加强大的服务,以满足用户的个性化需求。因为Web服务组合与人工智能(artificial intelligence,AI)规划两个学科问题间存在着很多相似之处,研究人员提出了很多基于AI规划的Web服务组合方法[10-13],但这些方法并没有考虑上下文信息。目前,基于上下文感知的空间信息服务组合的研究很少[14-17]

    本文首先创建了智慧城市中的地理上下文本体;其次设计了上下文感知的空间信息服务的语义表示模型,此模型扩展OWL-S本体以支持上下文;最后使用智能规划技术和语义增强技术,将上下文感知的空间信息服务组合转化为智能规划的求解过程,即将上下文感知的空间信息服务的领域服务集和目标服务转换为规划领域定义语言(planning domain definition language,PDDL)[18]的领域和问题,然后将PDDL文件输入满足PDDL规范的智能规划器进行规划,将规划结果转换为Web服务业务流程执行语言(web services business process execution language,WS-BPEL)[19]工作流语言,并将其输入到工作流引擎上运行。

    描述用户所处的各种地理环境或情景,寻找适合地理上下文感知计算的上下文模型,是构建地理上下文感知空间信息服务的基础性问题。

    智慧城市中的地理上下文信息是任何刻划城市情景的信息,主要包括地理空间位置、任务领域及其用户等方面的信息。目前主要的上下文建模方法有实体关系(entity relation,ER)模型、键值对模型、基于逻辑的模型、面向对象模型以及基于本体的上下文模型等。 其中基于本体的上下文模型由于其开放性、可扩展性,易于知识共享,而且支持本体推理和上下文重用的特点是目前研究的重点。智慧城市中涉及的地理空间信息是一个开放的集合,不可能一次性考虑到所有的地理上下文信息,采用本体上下文模型更容易扩展。

    智慧城市中较为常用的上下文信息有地图与兴趣点信息(point of interest,POI)、GPS数据、客流数据、手机数据、位置服务数据(location based service,LBS)、视频监控数据、环境与气象数据、社会活动数据等[20]。本文在参考普适计算、城市计算、语用Web等方面上下文本体研究成果的基础上[21-24],提出了空间因素、时间因素、社会因素、环境因素、技术因素、用户因素、任务因素等7大类地理上下文因素。其中空间因素是地理上下文的特有因素,包括位置、空间对象、空间关系等;时间因素包含相对时间和绝对时间等;用户因素包含身份信息、职业信息、偏好信息等;环境因素包含天气、温度、湿度、污染、环境安全、交通状况等;技术因素包含硬件、软件、数据、人机交互、信息技术安全等;社会因素包含文化(语言和习俗及规范)、社会资源、社会机构等。

    本文采用分层的思想,将地理上下文本体(OWL-GCt)划分为上层通用上下文本体和下层领域上下文本体。上层通用上下文本体主要负责地理上下文的基本概念和关系的实体;下层领域上下文负责具体领域相关的概念及关系。本文构建的地理上下文本体的上层通用上下文本体结构如图 1所示。本文的地理上下文本体使用Web本体语言(ontology web language,OWL)[25]语言表示。

    图  1  地理上下文本体
    Figure  1.  GeoContext Ontology

    目前,已经有OWL-S、WSMO、WSDL-S、SAWSDL、SWSF等语义网络服务技术。WSMO 和SWSF的逻辑表达不局限于描述逻辑。WSDL-S和SAWSDL侧重于对WSDL元素进行扩展,而没有提供一个描述服务的完整本体框架。由于OWL-S建立在W3C推荐的标准OWL的基础上,已经有不少软件工具支持OWL-S。本文采用OWL-S来表达空间信息服务的语义。

    OWL-S分为服务概要、服务模型、服务绑定3个部分。其中服务概要描述服务的功能;服务模型实现服务如何运行;服务绑定是服务如何被访问。服务模型建模服务的内部模型,定义了过程的输入、输出、前提条件和效果。OWL-S中定义的前提条件和效果是由输入、输出和内部的一些参数定义,无法表达外部信息定义的前提条件和效果。

    上下文感知的空间信息服务(OWL-SGC)利用地理上下文本体扩展OWL-S本体使其具有感知地理上下文的能力。其具体方法就是建立OWL-S中的Service对象和OWL-GCt中GeoContext对象之间的关系。

    上下文感知的空间信息服务也需要对地理上下文的变化作出响应,包括输入、输出值对地理上下文的变化的响应,前提条件是对地理上下文变化的响应、效果和地理上下文的变化的响应。OWL-SGC扩展OWL-S中的原子过程使输入、输出、前提条件和效果能够感知上下文的变化。为了表达外部地理上下文的前提条件和效果,OWL-SGC增加地理上下文前提条件和地理上下文效果两个类。地理上下文信息可以作为输入、输出值,需要建立输入和输出分别与地理上下文之间的值的对应关系,而增加上下文绑定类,如GPS数据,相机的拍摄角度信息等地理上下文信息作为输入。

    上下文感知空间信息服务的语义描述如图 2所示。图 2中,虚线矩形内的元素是扩展OWL-S本体的元素,其他元素都是OWL-S本体中已有元素,OWL-S本体中跟扩展无关的元素没有列出。GeoContextPrecondition是OWL-S本体中Condition类的子类,GeoContextEffect是OWL-S本体Expression类的子类。GeoContextPrecondition、GeoContextEffect和GeoContextBinding都使用GeoContext信息。

    图  2  上下文感知的空间信息服务的语义表示(OWL-SGC)
    Figure  2.  Semantic Representation of Context-Aware Geospatial Web Service

    OWL-SGC支持的地理上下文前提条件和效果类的表示有以下3种类型:第一种表示地理上下文对象是否存在;第二种表示地理上下文对象跟其他的对象是否存在属性关系;第三种表示为数值关系,如Op(current_ctx,value),Op是关系运算符,current_ctx指向当前上下文,value表示数值。这些情况都可以使用语义网规则语言(semantic web rule language,SWRL)[26]表示,如通过布尔函数表示为一个谓词。

    上下文感知的空间信息服务组合利用智能规划方法进行服务组合。组合服务请求也使用OWL-SGC表示,只是没有服务绑定,称为OWL-SGC目标服务,而所有已存在的OWL-SGC服务称为OWL-SGC领域服务。目标OWL-SGC服务和当前的地理上下文作为服务组合的问题内容输入,OWL-SGC服务集合作为服务组合的领域内容输入。

    输入内容经过OWL-SGC解析器解析,由PDDL转换器转换为符合PDDL标准的领域和问题。OWL-SGC解析器在解析过程中,如果有新的服务类型,就添加到领域本体库中。本体管理器(OOM)利用语义相似性技术对PDDL的领域和问题进行语义增强,将增强后的结果输入兼容PDDL的规划器进行规划,产生规划序列,再将这些规划序列转换为基于WS-BPEL标准的工作流,并在工作流引擎上执行。

    上下文感知的空间信息服务组合流程如图 3所示,具体包括OWL-SGC解析器、本体管理器、PDDL转换器、PDDL兼容规划器、WS-BPEL转换器和WS-BPEL兼容的工作流引擎。

    图  3  上下文感知空间信息服务组合流程
    Figure  3.  Workflow of Context-Aware Geospatial Service Composition

    OWL-SGC解析器将输入进行解析,解析的结果与本体管理器获得的相似对象一起,通过PDDL转换器转换为符合PDDL标准的问题和领域,转换规则详细见§3.2。OWL-SGC在解析过程中需要读取领域本体库,如果有新的服务类型,则添加到领域本体库中。

    本体管理器获取与目标服务中相似的本体对象。获得的相似对象用来扩展PDDL中问题的初始状态集合。本体管理器也获取与OWL-SGC服务集中相似的本体对象,这些对象用来增强PDDL中的领域集合。OWL-SGC服务集的增强是不变的,可以先计算好,然后存储起来。使用的时候不需要重新计算。

    本流程仅需要兼容PDDL的规划器。目前有很多基于PDDL标准的规划器,可以根据不同的需求灵活地选择不同的兼容规划器。规划器产生的结果为规划序列。 这些规划序列由规划转换器转换为WS-BPEL标准表示的工作流。最后,工作流输入到兼容WS-BPEL的工作流引擎上执行。

    规划域定义语言PDDL被广泛地认为是规划问题的标准输入描述语言,支持规划域和规划器功能的统一描述。一个PDDL规划由领域(Domain)和问题(Problem)两部分描述。其中领域描述所有领域特征的元素,如输入输出参数、对象类型、谓词、动作等;问题描述主要包括待规划问题中的对象、初始条件和目标,用以对需要规划的实际问题进行描述。

    对于语义Web服务使用的OWL-S模型,由于OWL-S本身的设计受PDDL语言的重大影响,因此,在两种表示之间实现互相转化是很直观的。为了实现服务的自动组合规划,将OWL描述的领域本体和OWL-S描述的目标服务,分别转化为等价的PDDL的问题描述和领域描述。这样,服务自动组合的过程即可转换为智能规划的求解过程。

    OWL-S中的效果是执行Web服务所产生的物理效果,输出是执行Web服务所产生的信息。因此,要将输出表示转换成谓词的形式,在语义上将OWL-S的输出看成是产生知识的效果,即输出是服务执行后已知的信息。本文将输出X转换为谓词hasKnowledge(X)。同样,输入在语义上可以看作知识的前提条件,即在执行活动前,必须知道输入的值,本文将输入Y转换为谓词hasKnowledge(Y)。

    文献[10, 27]中的方法只是进行了OWL-S到PDDL的转换,没有考虑上下文信息。本文方法是对文献[10, 27]中的方法进行扩展以支持地理上下文。OWL-SGC到PDDL的转换分为以下两部分:① 将OWL-SGC领域服务转换为PDDL领域描述文件;② 将OWL-SGC目标服务和当前的地理上下文转换为PDDL问题描述的文件。

    将OWL-SGC描述的领域服务转换为PDDL领域描述文件的转换规则如下:

    1) OWL-SGC领域服务中的每个服务的ID作为领域中每个PDDL动作的名称。

    2) OWL-SGC领域服务中每个服务的所有输入参数作为PDDL动作中的参数,其类型作为PDDL领域中的类型。

    3) OWL-SGC领域服务中的前提条件作为PDDL动作的前提条件,其包含的谓词也作为PDDL领域的谓词定义。

    4) OWL-SGC领域服务中定义的效果作为PDDL动作的效果,其包含的谓词也作为PDDL领域的谓词定义。

    5) OWL-SGC领域服务中的每个服务的地理上下文前提条件作为PDDL动作的前提条件,其包含的谓词也作为PDDL领域中的谓词定义。

    6) OWL-SGC领域服务中的每个服务定义的地理上下文效果作为每个PDDL动作的效果,其包含的谓词也作为PDDL领域的谓词定义。

    7) OWL-SGC领域服务中的每个服务所有的输入参数Inputi,转换为PDDL谓词hasKnowledge(Inputi),作为PDDL动作的前提条件。

    8) OWL-SGC领域服务中每个服务的所有的输出参数Outputi,转换为谓词hasKnowledge(Outputi),作为PDDL动作的效果,其类型作为PDDL领域中的类型。

    9) OWL-SGC领域服务中每个地理上下文GeoContexti,转换为谓词hasKnowledge(GeoContexti),作为PDDL动作的前提条件,其类型作为PDDL领域服务的类型。

    将OWL-SGC目标服务和当前的地理上下文转换为PDDL问题描述文件的规则如下:

    1) 当前的地理上下文作为PDDL问题描述的对象。

    2) OWL-SGC目标服务中定义的前提条件作为PDDL问题描述的初始状态。

    3) OWL-SGC目标服务中的定义的地理上下文前提条件作为PDDL问题描述的初始状态。

    4) OWL-SGC目标服务中的所有输入参数Inputi,转换为谓词hasKnowledge(Inputi),加入PDDL问题描述初始状态集合。

    5) 将所有的不存在于目标集合的对象Objecti,转换为谓词hasKnowledge(Objecti),加入PDDL问题描述的初始状态集合。

    6) 目标服务中定义的效果加入问题描述的目标集合。

    7) OWL-SGC目标服务中定义的地理上下文效果作为PDDL问题描述的目标集合。

    8) OWL-SGC目标服务中定义的所有的输出参数Outputi,转换为谓词hasKnowledge(Outputi),加入PDDL问题描述的目标集合。

    将上下文感知的空间信息服务组合转化为PDDL后,规划器进行规划匹配时使用的是语法匹配,而不关心其语义。上下文感知的空间信息服务使用语义表示,其组合就是希望通过语义来加强。这样,在转换成PDDL之前,需要在OWL-SGC目标服务和OWL-SGC领域服务中找出语义相同或者相似的对象来增强PDDL的问题和领域。

    一个规划器表示为三元组 <I,A,G >,I是初始状态集,A是动作集,G是目标。每个动作包含三个集合,前提条件集合(precondition),增加结果集(add)和删除结果集(del)。

    如果一个动作Ai能够应用于一个状态S,那么precondition(Ai)⊆S。

    如果Ai应用于S,那么S的后继状态S′=S-del(Ai)∪add(Ai)。

    从I开始,经过一系列动作A=A1,A2,A3…,An,导致S⊇G,那么称A为一个规划解。

    由此可以看出,增强I集合和A中的add集合,可以增加规划解,也即提高服务组合率。增强I集合和add集合,就是要找出I集合和add集合中的对象和属性相同或者相似的对象和属性,然后分别加入到I集合和add集合中。增强I集合和add集合的规则如下:

    1) 设ICi是集合I中对象,将跟ICi语义相同的对象或者ICi的直接父类对象加入集合I中;

    2) 设IPi是集合I中的属性,将跟IPi语义相同的属性和IPi直接父类的属性加入集合I中;

    3) 设ACi是集合add中的对象,将跟ACi语义相同的对象和ACi直接父类的对象加入add集合中;

    4) 设APi是集合add中的属性,将跟APi语义相同的属性和APi直接父类属性加入add集合中;

    5) 对于I集合中和add集合中的数值关系,形如Op(x,v),其中Op是关系运算符,x表示变量的名称(此变量可以是上下文感知信息服务中的输入、输出变量,或者内部变量,或者上下文变量),v表示数值。本文将Op的关系定义为相等、不相等、大于、大于或者等于、小于、小于或者等于。满足关系运算符Op是相同的,参数x的语义相等,数值v相等的数值关系加入到I集合和add集合中。

    本文以智慧旅游作为应用实例进行实验,通过主动感知旅游资源、旅游经济、旅游活动、旅游者方面的信息,为游客、旅行社、景区、酒店等提供帮助。

    在智慧旅游应用中,主要的活动功能包括景点的选取、酒店的选择、交通出行、景点旅游等活动。在智慧城市服务应用中每个活动功能由相应的上下文感知的空间信息服务来实现,这些服务能够获取用户的偏好、文化、游客手机流量消费情况等上下文,也可以考虑其他的上下文,如天气、距离、时间、景点游客流量、游览路线导航来决定用户的出行旅游方式。每个服务有一个服务接口,通过注册中心对外发布服务。以游客使用手机在某一景点拍照为例,在景点照片上可以呈现关于景点的文字描述和视频讲解信息,上下文信息包括用户对文字显示的偏好、运营商网络状况、GPS位置、拍摄角度等。

    为了解决游客的旅游需求,根据§3描述的服务组合方法,表 1定义了游客旅游的问题的描述:初始状态定义了游客当前欣赏的景点,目标是在此景点照片上按照游客的风格偏好呈现文字描述,并根据网络信号的强弱,决定是播放高清视频,还是压缩后的视频。地理上下文包含游客的基本信息、语言、文字显示的风格、游客的流量使用情况、运营商网络状况、GPS信号、拍摄角度等。表 2描述了游客旅游的领域服务的描述,即上下文感知空间信息服务集合,定义了每个服务的名称、输入、输出、前提条件、效果、地理上下文的前提条件和地理上下文效果。其中,游客位置匹配服务通过手机获取的GPS数据和拍摄角度数据,结合基础地理数据进行地图匹配,计算出当前游客的精确位置数据,搜索景点服务通过游客当前的精确位置数据和拍摄角度数据,从基础地理数据库中搜索最接近的POI数据,景点反投照片像素位置服务根据POI数据记录的位置,结合游客当前精确位置数据,拍摄角度数据,反算出POI在拍摄影像中的像素位置,文字标注显示服务在景点所在照片的位置显示景点文字的说明,导览视频播放服务播放景点的视频信息。

    表  1  游客旅游的问题描述
    Table  1.  Problem Description of Travel
    问题描述项内容
    当前上下文 用户名称
    语言
    文字的显示风格
    运营商网络
    游客流量消费
    GPS数据
    拍摄角度
    初始状态当前欣赏的景点
    目标当前景点相关视频播放
    当前景点的中文文字显示
    下载: 导出CSV 
    | 显示表格
    表  2  游客旅游的领域描述
    Table  2.  Domain Services Description of Travel
    服务名称输入输出前提条件效果地理上下文前提条件地理上下文效果
    景点拍摄真实景点图片GPS数据,拍摄角度
    游客位置匹配基础地理数据,GPS数据,拍摄角度游客精确位置GPS数据,拍摄角度
    搜索景点位置,拍摄角度,基础地理数据当前景点信息基础地理数据完备性拍摄角度
    景点反投照片像素位置景点,精确位置,拍摄角度景点在照片像素坐标拍摄角度
    文字标注显示图片,景点文字,像素坐标,文字显示文字显示风格中文
    导览视频播放图片,景点视频视频播放运营商网络状况,游客流量消费中文
    下载: 导出CSV 
    | 显示表格

    地理上下文和初始状态作为输入,领域服务作为转换函数,如果组合成功,就会到达目标,形成一个服务组合序列。本示例所形成的服务组合序列如图 4所示。整个上下文感知的空间信息服务的输入为当前的真实景点、上下文有游客的基本信息、文字的显示风格信息、运营商的网络状况信息、游客的流量消费信息、GPS数据、拍摄角度,最终目标是将此景点介绍的文字信息、视频信息和所拍摄照片叠加呈现在游客面前。提供的服务组合流程为游客使用拍摄照片,调用景点拍摄服务,将真实场景转换为图片,再通过当前的GPS数据、拍摄角度、基础地理数据,获取游客的精确位置,由游客的精确位置、拍摄角度、基础地理数据,能够获得景点的数字化信息,如文字、视频等。为了在景点在照片中的位置显示文字、视频等信息,经过景点反投照片像素位置服务获得景点在照片中的像素坐标。然后通过文字标注显示服务根据游客的显示风格进行显示。导览视频播放根据当前的运营商网络状况,游客流量消费情况,选择是播放高清视频还是播放压缩视频。

    上下文感知的空间信息服务的目标服务和领域服务转换为PDDL后,规划器产生一个抽象的PDDL规划。这个规划包含景点拍摄服务、游客位置匹配服务、搜索景点服务、景点反投照片像素位置、文字标注显示服务、导览视频播放服务的序列等。不使用地理上下文感知,此服务组合无法构建成功。

    图  4  游客旅游的服务组合
    Figure  4.  Service Composition of Travel

    本文提出了一个基于上下文感知的空间信息服务组合方法。上下文感知的空间信息服务的语义表示是对OWL-S本体进行扩展以支持地理上下文。该扩展增加了地理上下文类、地理上下文前提条件类、地理上下文效果类和地理上下文绑定类。上下文感知的空间信息服务组合转化成智能规划的求解过程。在转换过程中使用语义增强技术,增强服务组合率。

    同时,本文也提供了将上下文感知的空间信息服务组合转换为智能规划的问题和领域的方法,并最终转换成基于PDDL的问题和领域,输入到兼容PDDL的规划器进行规划,并将结果转换为WS-BPEL的标准过程流程,输入到工作流引擎上执行。下一步的研究包括加入规划流程校验,实现对校验不符合要求的服务组合进行重新规划,以及考虑更多的语义相似性技术,如语义距离、各项语义的权重等来增强服务。

计量
  • 文章访问数:  4697
  • HTML全文浏览量:  204
  • PDF下载量:  3186
  • 被引次数: 0
出版历程
  • 收稿日期:  2014-02-16
  • 修回日期:  2014-06-04
  • 发布日期:  2014-06-04

目录

/

返回文章
返回