留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

时空大数据时代的地理知识工程展望

林珲 游兰 胡传博 陈旻

林珲, 游兰, 胡传博, 陈旻. 时空大数据时代的地理知识工程展望[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318
引用本文: 林珲, 游兰, 胡传博, 陈旻. 时空大数据时代的地理知识工程展望[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318
LIN Hui, YOU Lan, HU Chuanbo, CHEN Min. Prospect of Geo-Knowledge Engineering in the Era of Spatio-Temporal Big Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318
Citation: LIN Hui, YOU Lan, HU Chuanbo, CHEN Min. Prospect of Geo-Knowledge Engineering in the Era of Spatio-Temporal Big Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318

时空大数据时代的地理知识工程展望

doi: 10.13203/j.whugis20180318
基金项目: 

国家重点基础研究发展计划 2015CB954103

江西省重大生态安全问题监控协同创新中心资助项目 JXS-EW-00

详细信息
    作者简介:

    林珲, 博士, 教授, 研究方向为地理信息科学。huilin@cuhk.edu.hk

    通讯作者: 胡传博, 博士, 助理研究员。cbhu@cuhk.edu.hk
  • 中图分类号: P208

Prospect of Geo-Knowledge Engineering in the Era of Spatio-Temporal Big Data

Funds: 

The National Basic Research Development Program of China 2015CB954103

the Collaborative Innovation Center for Major Ecological Security Issues of Jiangxi Province and Monitoring Implementation JXS-EW-00

More Information
    Author Bio:

    LIN Hui, PhD, professor, majors in geoinformation science. E-mail:huilin@cuhk.edu.hk

    Corresponding author: HU Chuanbo, PhD, associate and researcher. E-mail:cbhu@cuhk.edu.hk
计量
  • 文章访问数:  956
  • HTML全文浏览量:  68
  • PDF下载量:  501
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-09-13
  • 刊出日期:  2018-12-05

时空大数据时代的地理知识工程展望

doi: 10.13203/j.whugis20180318
    基金项目:

    国家重点基础研究发展计划 2015CB954103

    江西省重大生态安全问题监控协同创新中心资助项目 JXS-EW-00

    作者简介:

    林珲, 博士, 教授, 研究方向为地理信息科学。huilin@cuhk.edu.hk

    通讯作者: 胡传博, 博士, 助理研究员。cbhu@cuhk.edu.hk
  • 中图分类号: P208

摘要: 伴随智慧城市的逐步建设,日益成熟的传感网技术使时空数据的获取变得容易。遥感影像、地图瓦片、视频监控、网络爬虫、社交平台等各类时空数据常有PB级的巨量数据存储,人类社会已全面进入时空大数据时代。然而,海量数据的骤增与信息增值机制的缺乏形成了鲜明的对比,仅仅依靠信息技术尚难以快速地产生地理知识。如何利用新兴的信息化技术手段,结合地理信息及地理分析手段,快速挖掘、产生和利用时空数据成为当前亟待解决的关键问题。地理知识工程围绕人类空间认知与复杂知识发掘技术,对大数据时代的智能化应用和政府决策有重要的意义。立足于时空大数据背景,展开地理知识工程的内涵、时代特点、结构组成及研究方向等论述。地理知识工程的发展将在以虚拟地理环境、数字地球、智慧城市为代表的新型地理信息系统推动下,促进传统地理信息系统向着符合人类认知特点和探索过程的方向转变。通过海量时空数据到地理知识的快速转化,最终将解决"地理数据爆炸但地理知识贫乏"这一重要难题,提升数据的使用效能。

English Abstract

林珲, 游兰, 胡传博, 陈旻. 时空大数据时代的地理知识工程展望[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318
引用本文: 林珲, 游兰, 胡传博, 陈旻. 时空大数据时代的地理知识工程展望[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318
LIN Hui, YOU Lan, HU Chuanbo, CHEN Min. Prospect of Geo-Knowledge Engineering in the Era of Spatio-Temporal Big Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318
Citation: LIN Hui, YOU Lan, HU Chuanbo, CHEN Min. Prospect of Geo-Knowledge Engineering in the Era of Spatio-Temporal Big Data[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2205-2211. doi: 10.13203/j.whugis20180318
  • 2008年,Nature出版《Big Data》专刊,标示着大数据时代的来临[1]。2012年,美国奥巴马政府正式启动“大数据研究和发展倡议”计划,计划中将大数据比作未来世界的“石油”。伴随智慧城市的逐步建设,日益成熟的传感网技术已经从根源上解决了数据获取问题。据不完全统计,80%的大数据都与空间位置有关[2]。每年的增量地图数据及各类地理位置数据多达几十PB,其他视频监控、高清摄像头、网络爬虫、社交平台等也常有PB级的巨量数据存储。空间数据基础设施(Spatial Data Infrastructures,SDI)的构建更使得大量数据可以从在线网络中直接获取并使用[3]

    然而,伴随数据获取的逐渐便捷,海量时空数据的骤增与高效信息增值机制的缺乏形成了鲜明的对比,仅仅依靠信息技术尚难以快速地产生地理知识。如何利用新兴的信息化技术手段, 结合地理信息及地理分析手段,快速挖掘、产生和利用时空数据成为当前大数据时代亟待解决的关键问题。地理知识工程围绕人类空间认知与复杂知识发掘技术,对大数据时代的智能化应用和政府决策有着极为重要的意义[4]。以虚拟地理环境(Virtual Geographic Environments, VGEs)、数字地球、智慧城市为代表的新型系统的发展,推动了地理知识工程的发展,进一步促进了传统地理信息系统向着符合人类认知特点和探索过程的方向转变,旨在实现从海量地理数据快速转化成新的地理知识与认知,解决“地理数据爆炸但地理知识贫乏”这一重要问题,提升时空大数据的使用效能。

    • 知识的研究始于计算机科学的人工智能领域,知识被定义为“人们对于可重复信息之间的联系的认识,是信息经过加工整理、解释、挑选和改造而形成的”[5]。计算机相关领域学者们已经围绕知识的发现、获取、共享及管理展开了大量的研究[6-9],为地理知识的研究提供了丰富的理论和方法基础。基于此,许多地理信息领域学者和研究团队也纷纷展开了地理知识的研究。ESRI(Environmental Systems Research Institute)公司定义地理知识是描述地球上自然环境和人类环境的所有地理信息,并认为地理知识是未来地理信息基础设施框架的核心与支撑[10]。文献[11]提出地理知识区别于其他知识的主要特点是几何特性,地理知识是由数学规则和图论所支撑的。文献[12]对地理知识展开了分类和组织方式的研究,包括图形、语义、过程和学科知识类别。文献[13]从全球卫星导航实例的研究中,提出了基于社交网络统一的经济地理知识。文献[14]探讨了地理知识的局限性在于其内在的不确定性本质。从VGEs角度,林珲和游兰[15]进一步阐述了VGEs中地理知识的内涵和特点,认为地理知识是在VGEs下解决地学问题,解释地理现象、过程以及提取地理规律所涉及的信息。Golledge[16]详细阐述了地理知识的内在实质,包括地理知识的思维、推理及使用等3方面。尽管地理知识的定义各有不同,但归纳看来,地理知识除了具有通用知识的内涵和特点,还与地理事物或过程密切相关,具有特定的时空特征和地学机理特点。

      地理知识工程是以地理知识为研究对象,以解决不同领域不同形态地理知识的融合、演化、应用与创新等问题为核心,形成的整套地理信息方法、理论和技术体系。地理知识工程将充分利用Web3.0时代中云计算、人工智能、混合现实、知识图谱等新兴计算机技术,以便实现完全符合人类空间认知特点和探索过程的智能化地理信息系统。围绕地理知识相关,不同研究的侧重点不尽相同。Golledge[16]和Couclelis[14]分别从地理知识的思维和不确定性两个角度探讨了地理知识的内在本质。Karalopoulos等[17]在地理知识的表达方法中提出了概念图结构,该方法能够展示两个地理概念的相似度。Goodchild等[18]提出了简单通用的泛在地理知识表达理论,包括描述、表达、分析、可视化及模拟。Mani等[19]提出地理知识表达规范SpatialML,该规范采用自然语言描述地名位置的标记性参考语言,可以表达地理位置的名词参照、指定区域内的附近地标以及各地理位置之间的特征关系。Mekni等[20]采用基于消息机制的VGEs模型与多智能体技术模拟地理过程。Janowicz等[21]阐述了基于语义的地理知识引擎是数字地球的核心部分。在原有知识体层次模型基础上,Ahearn等[22]进行了延伸和扩展,实现了地理信息科学技术知识体框架。Balland等[13]以在欧洲的全球卫星导航系统为切入点,基于第五和第六欧洲联合框架项目开发了R & D协同项目数据库,并采用社交网络分析经济地理知识。林珲和游兰[15]指出未来VGEs将以知识工程为核心,系统地阐述了未来构建智能化的VGEs的意义和发展趋势,明确提出VGEs知识工程框架应围绕地理知识的表达、建模、协作、评价及共享等方面展开。但以上研究绝大多数针对地理知识展开定义或内涵的研究,并没有围绕地理知识工程的内容展开。

      如何深入探析不同层次地理知识的表达、建模与应用,如何充分利用大数据时代多学科知识的协同进行分析、推理或解释空间相关问题,是地理知识工程的主要研究内容。时空大数据环境中的地理知识工程将充分围绕地理知识的表达、获取、可视化及安全隐私等方面展开,将极大地促进地理空间知识的产生与应用,为应对时空大数据挑战提供行之有效的方法手段。

    • 随着智能感知、物联网、云计算等新兴信息技术的迅速发展,人类的位置、移动物体的轨迹、气象条件、城市环境的细微变化,都成为了被感知、存储、分析和利用的时空数据。地理知识研究的背景已经从数据稀缺环境转变为数据丰富环境。基于多源时空数据和相关领域需求形成了大量的时空数据衍生产物,包括面向时空大数据的云平台、时空模型与时空数据库、时空大数据分析方法、面向时空大数据的实时计算方法、时空大数据安全管理体系、基于时空大数据的垂直行业应用案例等。这些衍生产物形成了良好、高效的时空大数据基础环境,可以为各行各业提供针对时空数据的实时接入、综合管理、高效计算以及成熟的解决方案。因此,地理知识工程置身于时空大数据基础环境,可以高效地进行知识发现与知识挖掘,发挥时空大数据的真正价值。

    • 在时空大数据环境中,地理知识工程被赋予新的时代特点,它可以认为是通过新时代计算机技术、通信技术以及VGEs理论等手段,提出解决地理科学问题的方法,解释地理现象的过程,剖析地理规律的原理等抽象可重用的地理相关信息,包括地理概念、地理实例、专家知识、空间关联规则以及事件过程的手段[11]

      1) 地理概念[23]。分为基本概念和复合概念。前者是一般的、通用的、与地理实例直接相关的概念集合,不需要经过推理即可计算并获取地理实例,例如房屋、道路或者河流。后者是一种隐性的概念,需要通过各领域专家定义的知识(例如土地资源空间异质性评价、洪涝风险区划方法)计算或者推理而获得的实例的概念集。

      2) 地理实例[24]。分为要素型实例和属性型实例。前者对应具体的地理要素,如房屋的实例对应具体的房屋要素;后者则依赖于前者属性或者是独立存在的实例。此外地理实例是具有空间特征的,包括空间位置、实例之间的空间关系等。

      3) 专家知识。主要将多个领域具备专家水平的专业知识与实际经验抽象成可重复使用的资源,并通过有效的组织形成多层次知识库。当面对多领域复杂问题时,通过推理、判断形成有效的解决方案,从而实现人类专家决策过程的模拟。

      4) 空间关联规则。指的是空间实体间相邻、相连、共生和包含等空间关联规则, 用于多领域数据集模式挖掘,反映空间对象的潜在关联,达到提高地理认知程度的目的[25]

      5) 事件过程。空间对象经过若干对象参与,产生若干过程变化,达到性质变化的改变则可以称为一个事件过程[26]。例如,针对突发事件应急过程需要进行事件监测、事件警告、应急处置以及评估恢复等事件过程[27]。事件过程包括单向事件过程、双向事件过程、发散事件过程以及聚合事件过程等。

    • 时空大数据挖掘是从空间数据及其属性和关联关系中提取一定的时空模式、分布规律及隐含的地理知识的过程。时空大数据往往蕴含丰富的地理知识,通过分析挖掘时空大数据,可以从中发现城市居民的活动规律、个人兴趣、社会动向及网络舆论方向等,从而支持政府决策。因此,时空大数据驱动的地理知识获取就是时空数据发现和挖掘的过程。

      1) 如何利用地理情景、时空情景、用户背景知识的语义标识和提取,建立地理知识概念模型,以解决一类特定上下文情景的地理空间问题,这是地理知识获取首要关注的问题。

      2) 多源时空数据融合挖掘。一方面,单独使用任何一种时空数据都难以客观描述城市居民的生活、出行等规律;另一方面,遥感技术和传感器的应用使得大量不同设备源的空间数据可以获得,如新浪微博位置签到、出租车轨迹、微信定位、手机基站数据等,为多源数据融合提供了丰富的数据基础和可能。尽可能利用多源时空数据进行融合挖掘,以充分发挥不同时空数据的优势。

      3) 结合人工智能技术。Web3.0时代涌现出大量新兴技术,包括云计算、知识图谱、人工智能、自然语言处理等等,这些新兴技术的蓬勃发展将扩宽地理知识获取的渠道,提高效率和智能化程度,减少人机交互的参与程度。

      4) 充分考虑数据的时空特征及其对知识规律的影响,研究有时空特性的地理知识挖掘方法。

      5) 从海量时空数据中挖掘定量的时空模式和规则知识,用来预测未知数据的时空趋势和地理空间现象。

    • Web3.0是一个无线渗透的智能化与个性化网络[28],其目标是进行资源全面整合,涵盖数据集成、知识集成、服务集成、信息集成4个层次。知识集成是Web3.0建设的重点与难点内容。知识的碎片化问题是制约知识集成的主要问题。知识碎片化指的是知识具有即时动态性、低质化和无序化特点[29]。与传统知识相比,Web3.0环境下地理知识覆盖多种新时代媒体,存在形式广泛,包括地图数据、卫星导航定位、微博文本、微信消息、出租车轨迹、传感器数据及各类与位置相关的音视频文件等。地理知识工程首先要解决的就是地理知识的表示,即如何将多源异构的碎片化地理知识融合,充分保留原始数据的有效信息部分,建立地理知识间的丰富关联,形成统一的地理知识图谱。研究地理知识的表示需要解决以下关键问题。

      1) 表达过程如何保留最丰富信息价值的同时减少原始信息的丢失,需要权衡和取舍。

      2) 多源异构的碎片化地理知识同时具有多时空尺度、多粒度和时效性。如何统一描述、存储和管理,以便通过语法、语义、语境的匹配支持地学问题的智能化知识检索,是构建地理知识库的难点。

      3) 碎片化地理知识多为独立片段,但实际中往往隐含丰富的关联关系。在完备性缺乏的情况下如何梳理并建立地理知识片段之间的关联关系,是实现知识表达的关键。利用新兴的知识图谱方法有望解决该问题。

      4) 针对大数据环境下多源异构的碎片化地理知识,如何快速地实现地理知识分析、推理和预测。

      5) 地理知识的表达语言与规范是知识共享与重用的前提和基础。如何结合地学认知规律和过程对地理知识进行形式化表达与建模,是需要解决的难点问题。

    • VGEs是以虚拟现实理念为核心,基于地理信息、遥感信息以及网络信息与移动空间信息,研究现实地理环境和赛博空间的现象与规律[30]。VGEs作为新一代的地理分析工具,可提高人类对地理世界的理解,并在更深层次上辅助解决相关地理问题[31]。针对特定的地理科学问题,VGEs往往基于地理情景与时空特征,通过多领域知识的形式化表达方法,进行协同模拟、分析与决策。因此VGEs为地理知识工程提供了信息资源集成分析基础、形式化表达方法以及地理知识与其他领域知识的协同分析方法[32]。文献[15]在VGEs背景下为智能VGEs系统的构建提供了理论基础,以实现地理知识的快速转换和融合。此外,文献[33]将地理知识划分为3个层次(包括事实型、规则及控制型和决策型),并针对VGEs从多个角度分析了其服务于地理知识表达与共享的能力, 包括虚实结合理论、地理模型库及管理系统、动态可视化表达和异地协同工作环境等。VGEs已经展示了其满足地理知识管理和共享需求的潜在能力。此外,VGEs提供了多维表达模式与多通道感知协作方法,从而支持了具有视觉动能更易于理解的地理知识的方式[29]。同时,VGEs中引入虚拟现实与增强现实等技术,有助于缩短抽象的地理知识与现实世界的距离,增强用户对于地理知识的理解。因此,如何借助VGEs的相关理论与技术方法进行知识的综合管理与可视化,是时空大数据环境下地理知识工程的又一项重要的挑战。

    • 地理知识工程建设涉及复杂的生命周期,包括地理知识的获取、地理知识的表示、地理知识的管理与可视化等阶段[34]。在整个生命周期中,需要有效地组织多源时空大数据、自动化或者半自动化提取地理知识、综合管理多种地理知识,并做到知识的即插即用。然而,在整个生命周期中均面临着严峻的安全性与隐私问题[35]。针对特定地理问题,应集成各领域知识来构建解决方案。这些解决方案往往是通过各个领域专家协同建模、模拟、分析与评估的。然而,甄别各个专家相关知识的可靠性与可信度关系到整个解决方案质量的优劣。因此需要构建面向地理知识工程的溯源机制[36],以保障地理知识工程建设的安全性。此外,不同领域专家提供的知识往往需要保障其隐私性,因此需要构建面向敏感用户与敏感知识的隐私保护体系。总之,地理知识工程设计的生命周期中,安全有效地组织地理知识,全面合理地构建专家知识的隐私保护体系,成为有待解决的问题。

    • 物联网的快速发展与演进驱动了智慧城市的加速建设,大规模的时空数据每时每刻都在产生。这些时空数据中的空间属性、时间属性、社会属性等存在异构、高维、低质等方面的特性[37]。因此,从时空大数据中挖掘和获取地理知识仍是研究者面临的挑战之一。针对这一问题,我们可以充分利用海量、高维、动态时空大数据中隐含的时空模式与特征、时空与非时空数据等复杂时空语义关联关系,为城市复杂问题的动态感知与高效认知提供基础。此外,可以基于多源感知信息的多尺度关联关系,设计面向语义理解的融合计算分析方法和手段,实现多源时空数据融合,提高事件决策效率与准确度。再者,针对智慧城市动态认知的需求,可以通过多源异构时空数据的多层次关联关系,进行关联推理与知识挖掘,实现多维时空大数据综合分析。总之,基于时空大数据与知识联合动态驱动,面向多层次用户的个性化需求,利用多模态数据关联融合增强技术,实现智慧城市时空认知与动态决策,达到多层次细粒度的精细化城市综合管理目的[38-39]

    • 碎片化的知识统一规范化表示问题一直是知识工程面临的挑战之一。智能系统的兴起会成为Web3.0背后的推动力,进而推动碎片化知识的规范化、一般化。常识知识作为知识表示的基础,引起了研究者们的广泛关注。常识知识允许人类在逻辑上接近他们没有经验的情况。如果计算机有常识,并且可以将其应用到特定的领域,计算机就能做出与人类相似的直觉和逻辑决策[40]。常识知识库是智能系统或智能代理具备的一种知识库。它是解决人工智能或知识工程技术瓶颈难题的一项关键基础措施[41]。常识知识库与领域知识库是智能系统的知识库中的两种基本类型。近年来,面向地理科学的智能系统建设已逐渐借助地理知识库的支撑。然而,面对诸多地理空间问题,地理常识匮乏往往成为制约地理信息科学发展的主要障碍。地理常识知识具有规模大、集成复杂以及缺乏统一的标准规范等特性。文献[42]构建了一个面向GIR (Geographic Information Retrieval)的地理常识库,设计了3个提取器用于提取地理实体、实体属性和实体关系。其采用基于模式匹配的方法可以有效地从Wikipedia的内容中提取关系。文献[41]将虚拟地理场景的构建总结为5类常识相关的任务,包括设计空间决策标签、空间关系对象自动定位、空间关系推理、对象及其相关空间关联推荐和对象的相关物理属性与相关分布学习。其通过使用深度学习和概率图形模型来处理这些任务,并基于现有的数据集和网络信息来学习相应的常识。

    • 现代城市群、城市带是人类活动最为集中的区域,也是面对气候、环境变化和灾害时最为脆弱的区域。然而,传统的城市环境预测方法与预警模式无法突破瓶颈,城市灾害的精准预测与高效预警始终未能实现。随着城市大数据、云计算以及人工智能等信息技术的发展,充分利用人工智能的学习能力,挖掘出海量城市时空大数中大量的结构化知识与非结构化地理知识已有可能。挖掘出的知识需要进行有效的管理,并高效地与传统灾害预测计算方法融合,以实现灾害的精准预测与高效预警。通过构建面向城市灾害预警的综合知识库,可以提高城市灾害预测准确率与时效性。此外,针对多尺度的复杂灾害链,需要结合传统的地理知识与时空大数据分析手段,实现灾害高风险区域的快速聚焦与高效预警。

    • 面对新时代信息化战争对信息资源的严重利用和依赖,如何充分考虑陆、海、空、天、电等全维空间展开的多军兵种,高效地进行敌我博弈,迅捷地制定准确的作战行动计划,达到智慧指挥与精准动态作战的目的,一直是信息化战争亟待解决的问题。作战行动计划的制定存在着“决策迷雾”与“实用性低”等问题,导致常常无法在混乱的战场中快速准确动态地制定行动计划。针对这些问题,文献[43]基于知识工程设计了解决方案,利用知识工程理论中的本体表示、知识图谱和语义推理等技术,结合作战行动计划的表示、要素关系构建和计划校验等需求,分析了作战行动计划领域的核心难点,提出基于作战行动状态转移理论的作战行动计划制定方法,实现智能化作战指挥与作战方案动态制定。

参考文献 (43)

目录

    /

    返回文章
    返回