2020年 第45卷 第12期
物理空间和社会空间共同构成人类社会的二元空间。随着信息通信技术的迅速发展与普及应用,信息空间成长为第三空间,并与物理空间和社会空间共同构成人类社会的三元空间。智慧城市是三元空间条件下城市的智慧化转型,基本工程逻辑是建立城市物理空间和社会空间到信息空间的映射,再通过信息空间回馈物理空间和社会空间,进而优化城市系统,解决城市问题。地理信息系统(geographic information system,GIS)是以空间视角刻画和表达物理空间和社会空间的技术科学,通过GIS建立三元空间的关联,将是智慧城市建设的逻辑基础。分析了面向智慧城市的GIS在数字化、可视化、智能化和开放式开发框架等方面的技术需求,提出了面向智慧城市的GIS框架,探讨了需要重点聚焦的统一数据平台构建、数字孪生及可视化、双向同步的空间智能、开放式平台服务等关键研究内容。
随着遥感数据体量的不断增加,高效的在线遥感数据管理与服务系统已成为利用海量遥感数据开展应用研究必不可少的基础设施。目前,由于在底层海量遥感数据和顶层服务应用之间缺乏独立的中间框架层设计,不同的底层数据存储与顶层服务应用方案给系统实现与应用带来了困难,迫切需要一种独立于数据存储与服务应用的在线分布式遥感数据管理与服务中间框架,重构数据管理与服务的实现模式,降低海量遥感数据在线管理与服务应用的难度。以此为背景,通过对遥感数据的管理与服务模型进行抽象,设计并提出一种平台独立的分布式遥感数据在线管理与服务框架(online distributed management and service framework for remote sensing data,RS-ODMS)。该框架构建以遥感数据为基础的混合存储模型(distributed hybrid storage model,DHS)与分布式计算模型(distributed parallel-computing model,DPC),提升遥感数据管理能力与服务效率。结合原型系统的实验表明,以RS-ODMS为基础的遥感数据管理与服务框架可支持多分布式存储后端的影像管理扩展能力,具备高效、稳定的服务能力和良好的适用性,能为海量遥感数据的在线管理与服务应用研究提供参考。
公共卫生事件和公共安全应急事件凸显了人群动态的观测重要性,人群动态的观测是对人观测的重要组成部分,也是构建“空-天-地-海-人”全球观测体系的重要环节。首先介绍人群动态的观测概念、内涵和边界,以及该方面理论的作用与意义;接着,基于公共卫生与安全应急的视野,重点分析人群动态的精准性、科学性和按需性等观测需求,以及人群动态的数据感知、人群规模的采样扩样、人群动态的定量建模、人群动态研究领域等现状;然后,从4个重要方面思考人群动态的观测任务,包括个体与群体的严谨区分、以时空过程为中心的非常态观测、数据缺失下的观测思维突破、特定情景推演下的人群动态科学预测等;最后,结合公共卫生与安全应急任务,总结3个重要的研究挑战,包括观测能力的提升挑战、对人与对地观测的融合观测挑战、对人观测的研究伦理挑战等。该研究所提出的概念、思考维度与挑战方向,对应对公共卫生与安全应急重大事件、弄清城市多类空间发展规律、掌握空间演进分异机制、掌控城市空间发展路径等提供基础理论与方法,具有重要的前沿探索意义。
深度学习的迅猛发展,为遥感大数据的智能分析提供了重要技术手段。首先主要介绍了遥感数据识别和应用中设计的深度学习模型与方法,提出并实现了面向激光雷达点云、光学遥感图像和高光谱图像等数据地物识别的深度强化学习、多任务学习和亚像素-像素-超像素特征学习网络模型。这类模型的参数基本上由学习得到,调参工作量小,而且充分顾及了地物间的空间和上下文信息以及纹理和光谱特征,泛化能力强。然后描述了联合深度学习和多源遥感数据在精准扶贫评估、青藏高原20 a湿地变化及空间分析和玉米产量估产等方面的研究进展。从中可以看出,为了更好地促进遥感数据向知识的转化,需要面向应用,充分发挥深度学习在遥感大数据处理的优势,发展新的数据处理算法与技术。
人工智能领域的技术进步给地理空间相关领域研究的智能化发展和融合创新带来了新机遇和新挑战。地理空间人工智能(geospatial artificial intelligence,GeoAI)是指地理空间科学与人工智能相结合的交叉学科研究方向,通过研究与开发机器的空间智能,提升对于地理现象和地球科学过程的动态感知、智能推理和知识发现能力,并寻求解决人类和地球环境系统相互作用中的重大科学和工程问题。简要回顾了GeoAI发展的历史渊源,介绍空间显式与隐式的人工智能模型,总结近期研究热点话题和应用方向(包括空间表征学习、时空预测和空间插值、对地资源环境监测、地图学、地理文本语义分析),思考并提出地理空间人工智能未来发展的几个重要挑战和研究方向。
城市是人类活动的主要场所,是人流、物流、信息流和资金流的交换枢纽,具有高度的动态性和复杂性。智慧城市建设提供了卫星与无人机遥感、移动感知、社会感知、众包感知等多种时空感知大数据的数据获取手段,为分析城市空间、人类行为及其二者之间的交互等城市动态提供了新途径。介绍了城市动态感知的框架,论述了空间动态、人类行为动态、“空间-行为”交互动态感知等典型应用,讨论了融合多源时空大数据感知城市动态研究中存在的时空大数据不确定性、城市感知多视角学习、结果验证、城市多要素级联影响等问题。展望未来,城市动态研究应结合泛在物联网产生的实时数据,捕捉多维、多时空分辨率的多维城市动态,提升时空大数据在精细化城市治理中的应用深度,切实解决城市问题。
城市模拟自20世纪七八十年代兴起后,已成为城市研究的一种新范式,体现了计算思维对于城市研究的深刻影响。城市模拟方法建立在元胞自动机(cellular automata,CA)和机器学习基础上,形成了具有模拟城市复杂演化过程、实现多情景分析能力的城市CA模型。回顾了城市模拟的起源和发展,在归纳城市CA一般结构的基础上,讨论了机器学习方法在支持城市模拟方面的必要性和可行性,并进一步综述了机器学习与CA在城市研究中的新趋势,阐述了当前面临的主要挑战。
近年来,用户兴趣点(point of interest,POI)推荐是基于位置的社会网络(location-based social network,LBSN)研究的热门话题,POI推荐不仅可以帮助用户找到心仪的POI,也可为商家带来可观收益。深度学习技术因可以更有效地捕获用户与物品间的非线性关系,逐渐应用到推荐系统任务中。对近年来结合深度学习技术的用户POI推荐的研究进行综述。首先介绍了用户POI推荐与传统推荐任务的区别,并介绍了可以提高推荐任务模型性能的多种影响因素;随后将深度学习应用到POI推荐的方式分为4类:POI的向量化学习、深度协同过滤、从辅助内容中提取特征和利用循环神经网络进行序列推荐,并阐述了深度学习技术在这些方式中的应用效果与优势;最后对结合深度学习技术的用户POI推荐的发展方向进行了总结与展望。
将地理计算任务以及地理时空数据资源按照特定的业务逻辑组合起来,可以满足用户针对特定领域复杂地理问题的处理需求。传统地理计算流程构建后如果有复杂的迭代情况,仍然需要人工参与。科学工作流支持自动化流程管理方法来辅助地理学家进行地理计算和发现。提出了科学工作流支持的复杂地理计算流程处理方法,能够对复杂应用程序及各程序间的数据依赖关系进行组合,并控制各部分在时间、空间以及资源等约束条件下按序完成,实现地理时空数据进行查找、移动、分析、处理及可视化等操作。
众源地理空间数据作为一种由大众采集并向大众提供的开放地理数据,蕴含着丰富的空间信息和规律性知识,其中具有代表性的是签到数据。基于地理学第一定律:所有的事物都是相互联系的,但离得越近,彼此之间的联系越强,利用移动社交网站中的签到数据,研究空间与文本的相关性,在对数据进行了预处理和地理映射处理的前提下,统计出各区域的文本属性值,在空间尺度的变化下采用探索性空间分析法分别对美国各州、纽约市和洛杉矶市做全局空间自相关性分析和局部空间自相关性分析。结果表明,不同的文本属性信息在空间上存在着不同全局空间自相关特性,局部自相关的分析也揭示了文本的聚集规律,为相关决策部门或企业制定合理决策提供了合理科学的依据。
时空数据挖掘是地理信息科学的核心研究命题。大数据时代,地理时空数据的爆炸性增长对时空知识发现提出了迫切的需求,促进了时空数据挖掘技术不断发展。然而,时空大数据普遍存在的异质性与稀疏分布特征制约了时空数据挖掘算法的实现,显著影响了自然和社会复杂系统刻画与分析能力。鉴于此,围绕异质稀疏分布时空数据表达与应用过程中面临的系列瓶颈问题开展研究,探讨了缺失时空数据插值、稀疏时空数据重构、时空状态预测等时空数据挖掘重点任务的研究现状和存在问题,凝练了关键的科学问题,并提出了相应的解决方案,以期丰富时空数据挖掘领域的方法体系,提升时空数据建模的质量与应用价值。
场所是连接人类行为与地理环境的重要纽带,为地理分析提供了以人为本的研究视角。由于场所名称固有的模糊性、不确定性与多义性,以及个体层面的空间活动数据的获取成本高,导致早年有关场所的研究难以捕获场所特征并将其在计算机中进行表达。近年来,多源地理大数据和人工智能方法为场所建模与感知带来了新机遇。场所建模也是地理人工智能中知识表达的重要构成。梳理了有关场所模型与场所感知两个方向的研究历程及其技术进展。场所建模的研究目标旨在建立更符合人们空间认知与空间交流习惯的空间知识表达模型,以提高地理信息检索、智能问答的智能化与人机交互水平。场所感知致力于捕获人们对地理环境的情感与认知,深入理解人类活动与地理环境之间的耦合关系,精细表达场所丰富的地理语义属性,从而促进地理人工智能系统的发展。
在大规模道路环境中,基于点的语义分割方法需要动态计算,而基于体素的方法权衡分辨率和性能导致损失大量信息。为了克服上述两类方法的缺陷,提出了一种通用的结合双层卷积和动态边缘卷积优化的网络架构来进行大型道路场景语义分割。该框架结合点与超体素两种不同域的卷积运算来避免冗余的计算和存储网络中的空间信息,并结合动态边缘卷积优化,使其端到端地一次性处理大规模点云。在不同场景的数据集上对该方法进行了测试与评估,结果表明,该方法能适应不同场景数据集并取得较高精度,优于现有方法。
Cox回归模型能够对事件发生时间及其影响因素进行有效关联,是面向事件数据生存分析的重要方法。基础的Cox回归模型仅能对单次独特事件进行研究,通过事件分组、事件起始时间设置调整后的模型能够对重复事件进行解析,尽管现有的Cox模型能够处理时变解释变量,但仍不能考虑事件时空因素的综合影响。国家恐怖袭击事件的不同生存状态是重复出现的,因此,基于全球恐怖主义数据库,以国家恐怖袭击高风险状态再次发生的概率为研究对象,通过引入时间交互、空间滞后解释变量,提出一种顾及多种时空因素的重复事件Cox回归分析方法。结果表明,1995—2016年,相比于经济社会与地理类因素,政治、军事类因素对国家恐怖袭击高风险状态再次发生概率的影响程度更为明显。引入时间交互、空间滞后解释变量的Cox模型回归效果有所提高,空间滞后解释变量对国家高风险状态的发生概率作用显著,时空因素的引入具有重要意义。
街道网作为城市的骨架,其模式识别对于城市景观分析、市政规划、交通流量分析等都具有重要作用,是综合了道路几何特征、语义特征及上下文关系的智能识别问题。道路网模式识别目前主要是基于边-节点的图结构和道路网眼的多边形群结构两种模型,运用相关几何度量和统计指标通过模式识别规则探测获得。由于道路模式表达受人的空间认知、视觉心理影响,具有一定的不确定性和复杂性,基于规则推理与统计分析的方法很难获得与人工判断相一致的结果。在人工智能技术的驱动下,引入一种图结构上的深度学习模型,即图卷积网络,用于识别道路网正交网格模式。先以道路交叉点作为节点、道路连接作为边构建图结构,并划分出网格和非网格两类,作为模型的标注和预测目标; 同时将道路网线性剖分以获取图节点特征,作为模型的输入信息; 然后提取两端点都被预测为网格点的路段,实现网格模式的识别。实验结果表明,该方法中,道路网节点分类的准确率达到89.2%,道路段分类的准确率达到86.1%,能有效用于网格模式识别。
预测居民的未来活动位置与轨迹,为传染病防控、交通疏导、公共安全等城市智慧管理和服务提供主要决策依据。当前的个人位置预测方法往往基于个体的历史轨迹规律模式挖掘与建模进行位置预测,对于个体在不同停留位置的特征信息挖掘不够充分。为此,提出一种顾及停留位置特征提取的个人位置预测模型。首先,模型基于轨迹数据构建历史轨迹链路,采用位置发现规则将轨迹链路转化为停留位置链路,对停留位置进行空间聚类以构建聚类链路;其次,对不同的停留位置进行特征信息(进入/离开时间、天气状况、土地利用)提取,并提取聚类链路的空间特征;最后,将带有特征信息的链路代入长短期记忆神经网络进行定制集成,并实现个人位置的预测。实验结果表明,基于深圳市志愿者用户23天300余万个轨迹位置数据,本模型用户位置预测的F值在不同时间步长参数下均优于变阶马尔可夫模型(约5.5%增益)和传统N阶马尔可夫模型(约7%增益),引入停留位置特征的模型性能增益约为6.6%。
城市交通时间序列模式识别主要基于距离计算和特征提取两种方法,但前者结果受到时间序列非线性特征的影响,后者难以提取多时间段Shapelet子序列。为准确识别城市交通指数数据模式,提出了基于卷积神经网络对交通时间序列数据进行模式识别的方法。首先将时间序列数据预处理成N维矩阵,确定神经网络模型的输入数据; 然后通过反复训练特征网络提取输入层的特征信息,确定交通指数的模式类型; 最后利用Softmax分类器进行模式分类,实现交通指数类别划分。实验以2016—2018年北京市全市交通指数时间序列模式识别为例,对比发现,该方法能更准确地将交通指数时间序列数据划分为符合真实情况的5类模式。该方法对时间序列数据模式识别更准确,适合呈现时间阶段性变化的数据间相关性研究和模式发现。
理解并准确预测行人的移动轨迹,对提高自动驾驶技术的水平,减少交通事故的发生有重要的意义。针对现有轨迹预测方法预测精度不高,对行人交互信息利用不充分等问题,提出了一种结合自注意力机制和结伴行为特征的行人轨迹预测模型,该模型考虑了每个行人的运动信息及其与周围行人的交互作用,使用循环神经网络和图卷积网络分别对行人的行走状态和行人间的交互进行建模。在图卷积网络中,定义图的节点表示行人的运动信息,图的边表示行人之间的交互,使用自注意力机制计算行人间的交互程度。此外,为了增加模型捕捉结伴行走行为特征的能力,提高对该类轨迹预测的精度,提出了同伴损失函数的概念。在公共数据集上的实验表明,该模型在预测精度上相比其他方法有较大的提升。
随着用户需求的不断提高和空间数据的不断丰富,同一地理空间范围可包含地形、遥感影像、倾斜摄影测量三维模型等不同类型空间数据,三维WebGIS在同一场景中对不同类型空间数据尚不能实现有效加载。提出了一种面向三维WebGIS的空间数据加载优化方法,对多类型空间数据高效加载进行优化。首先,利用3D Tiles具有规则包围体外形和重叠区域的结构特点,提出一种基于二叉树的多边形快速生长算法对三维模型的外边界进行定位和粗提取;然后,针对粗提取的多边形外边界存在锯齿状凸起的问题,提出一种基于邻近两点的多边形简化方法,对多边形外边界进行裁剪优化,实现三维模型外边界的精确提取;最后,通过判断地图瓦片和地形瓦片数据与三维模型外边界的包含关系,实现对瓦片数据的选择加载。实验表明,当视点高度在300 m以下时,地图瓦片数据加载总量可减少约40%,表明在不影响三维WebGIS可视化效果的前提下,该方法较为明显地提高了系统的数据加载效率。