文章信息
- 张博, 张猛, 王非, 范红超
- ZHANG Bo, ZHANG Meng, WANG Fei, FAN Hongchao
- VGI数据与地形图数据的自动融合研究
- Automatic Data Integration between VGI and Topographic Data
- 武汉大学学报·信息科学版, 2019, 44(11): 1708-1714
- Geomatics and Information Science of Wuhan University, 2019, 44(11): 1708-1714
- http://dx.doi.org/10.13203/j.whugis20180023
-
文章历史
收稿日期: 2018-05-24

2. 武汉大学遥感信息工程学院, 湖北 武汉, 430079
2. School of Remote Sensing and Information Engineering, Wuhan University, Wuhan 430079, China
在过去的十余年中,随着全球定位技术的不断发展与普及,地理信息数据的采集与生产方式发生了根本性的变化。2007年,Goodchild首次提出志愿者地理信息(volunteered geographic information, VGI)的概念[1-2]。与基于传统测绘方式所获得的专业地理数据相比,VGI能够充分发挥大众参与的优势,其数据的现势性更高,细节也更为丰富。随着社会信息化的不断发展,传统的道路网数据在现势性、精确性、完整性等方面都已经无法满足人们日益增长的需求。这就需要将传统的道路网数据与VGI数据匹配并融合起来,充分发挥其各自的优势,提高数据的质量并实现数据的增值[3]。鉴于空间道路网数据的“海量性”特点,这一工作很难依靠人工的方法来完成。因此,自动化的匹配及融合算法便成为研究的重点[4]。
本文旨在研究并开发一种高效率的算法模型,以实现ATKIS与AOSD这两种道路网数据的自动匹配与融合。其中,ATKIS数据由德国联邦测绘局采集,它以数字模型的形式为德国联邦政府提供地形图数据,比例尺范围为1:25 000 ~1:100 000,更新周期为1 a,是德国政府的官方数据[5]。本文采用的是其中比例尺为1:25 000的基础道路网数据,主要通过对航空摄影测量图片的矢量化而采集/获取。AOSD为VGI数据,由大量的户外运动爱好者携带定位仪器所采集的轨迹数据汇集而成,并通过德国Alsptein公司所开发的网站与应用进行统一的组织管理,其内容主要包括阿尔卑斯山脉区域内经典的户外运动路线(包括骑行、徒步、滑雪、缆车等),数据的更新周期大致为1 a,并不十分固定。
不难看出,AOSD仅包括与户外运动相关的道路数据,并不是一个完整的道路网,也缺少基本的地形与导航数据,而ATKIS数据中则缺少户外运动的相关属性信息及路线。因此,只有将AOSD与ATKIS匹配并融合在一起,才能满足户外运动爱好者的全部数据需求。
1 VGI数据和地形图数据自动融合的算法模型本文所提出的算法模型以ATKIS为基础数据,AOSD为补充数据,其目标任务主要有两个:(1)若ASOD中的某条道路在ATKIS中能够找到相应的匹配道路,进行AOSD中户外运动属性信息向ATKIS数据集中转移;(2)若ASOD中的某条道路在ATKIS中没有相应的匹配道路,则需要将这条道路整体移植到ATKIS数据集中。
为了以高自动化的方式实现这两个目标任务,本文所提出的算法模型分析了VGI数据与传统数据在数据结构以及比例尺表达等方面的差异,并综合考量了道路网几何特征、拓扑形态等多项指标,其具体匹配/融合过程可分为4个步骤:(1)道路要素的智能化分割;(2)ATKIS与AOSD间的道路网匹配;(3)ATKIS与AOSD间的数据融合;(4)融合后道路网数据集内部要素间的匹配运算和数据集成。
1.1 道路要素的智能化分割由于ATKIS与AOSD的数据采集方式截然不同,因此,它们在空间表达上差异很大。其中最为明显的区别是,AOSD中的道路要素要远远长于ATKIS中的道路要素。
针对此类数据的匹配运算,常常会遇到两类问题:(1)AOSD道路网中的一个道路要素,在ATKIS的道路网中往往对应着若干个道路要素。如图 1(a)、1(b)所示,AOSD中的A′→B′仅为一个道路要素。然而,在ATKIS中,与其对应的A→B则为一个由14个道路要素组成的“串”,该要素串包含了6个交叉路口。这样的交叉口常常会干扰算法模型对匹配对的探寻,从而降低匹配的正确性与成功率[6-7]。(2)AOSD道路网中的某些道路要素,在ATKIS中并没有完全与之对应的道路要素或要素串,但却存在着部分对应的匹配关系。
|
| 图 1 ATKIS和AOSD数据详细程度对比 Fig. 1 Comparison of Different Details Between ATKIS and AOSD |
如图 1(c)所示,ATKIS中E→F明显长于AOSD中的C→D,它们并不完全匹配对应。然而,E→F的前半部分G→F段却和C→D耦合得很好,并在现实中代表着同一条路段。
针对此类数据,若不做预处理而直接进行匹配运算,则很难找到合适的匹配对。在传统的方法中,常采用对小比例尺道路网中的要素进行等距分割的方法来解决这一问题。但该方法有两个缺点:(1)由于没必要的分割导致数据量增加;(2)等距分割后,仍然无法确保这些分割点能够落在大比例尺道路网中对应节点的搜索区域之内,从而导致匹配运算失败,如图 2所示。
|
| 图 2 等距分割方法 Fig. 2 Isometric Segmentation Method |
为此,本文本着“当且仅当对匹配运算有利时才进行道路要素分割”这一原则,创建了一种智能化的道路网分割方法,具体过程如下:
1) 依据良好连续性准则,将一系列首尾相连的道路要素连接成为Stroke。Stroke的概念源于Gestalt认知原则,从一笔画出的曲线段的思想中产生。通俗地说,就是将一些满足好的连续律的线状要素连接到一起形成的“串”[8]。通过这样的连接,整个道路网就可被拆解为若干个Stroke。
2) 选取ATKIS中的道路交叉口或终节点,并定义一个半径为r的搜索区域,其中,半径r须大于同名线要素间距离的上限阈值[9]。若AOSD中所有穿过该搜索区域的Strokes存在相应的节点落在该搜索区域中,则不进行分割操作(见图 3中点S1);若没有节点落在该区域内,则需进入下一个步骤进行新节点的创建。
|
| 图 3 智能分割方法 Fig. 3 Intelligent Segmentation Method |
3) 沿着ATKIS中的搜索中心点向AOSD中相应的道路要素做欧氏垂线。若该垂足距离与其相邻的已存形点的距离非常小(如小于3 m),则在该形点的位置创建新节点(见图 3中的点S3);否则,该垂足便是新创建的节点(见图 3中的点S2)。
需要说明的是,为了保证算法模型的普适性和通用性,基础数据(ATKIS)中的道路要素也同样需要进行相应的智能分割操作。
1.2 ATKIS与AOSD间的道路网匹配在以往的绝大多数研究中,M:N(M≥0, N≥0, MN≠0)常常被认为是不同数据集道路要素之间最一般性的匹配对应关系。缓冲区增长(buffer growing,BG)算法与迭代最近节点(iterative closest points,ICP)算法是道路网匹配中最常用的两个算法[10]。在多年的科学实验及工程应用中,这两个算法在探寻具有M:N对应关系的匹配对的运算中,均在不同程度上表现出良好的匹配性能。其中,BG算法是基于线要素的匹配,而ICP算法是基于点要素的匹配。考虑到ATKIS和AOSD在空间比例尺表达上的显著不同,BG算法更适合本文所需的匹配任务。
然而,除了M:N这种对应关系之外,不同道路网的要素之间还存在着部分对应(见图 1)。“部分对应”指的是道路要素或道路要素串之间并不存在完整的对应关系,但是它们中的某些部分却相互匹配对应。根据对应部位的不同,可被细分为延伸对应(见图 4(a)),包含对应(见图 4(b))以及搭接对应(见图 4(c))。
|
| 图 4 3种不同的的部分对应关系 Fig. 4 Three Different Relationships of Partial Correspondence |
当不同的空间道路网在空间表达上存在明显差异时,“部分对应”普遍存在。通过§1.1中的智能化分割,部分对应可被化解为M:N对应,仍可采用BG算法进行处理。
1.3 ATKIS与AOSD间的数据融合匹配运算结束后,AOSD中的道路可分为两类:匹配成功的道路和未被匹配的道路。对于匹配成功的道路来说,需要进行属性的转移。而未被匹配的道路则很有可能是因为这些道路在ATKIS中并不存在。它们将被初步认定为“需要被融合的实体道路”,并进行道路实体的整体集成。
1.3.1 属性转移针对对应关系为1:1的匹配对,属性的转移操作可直接进行。然而,由于ATKIS和AOSD之间的表达尺度差异很大,此类情况极少发生,更为普遍的匹配对应关系为M:N (M≥1, N≥1, M+N > 2),因此,本文采用空间内插的方法来处理匹配对中ATKIS和AOSD的所有节点,使每个节点都能在另外的数据集中找到与之相对应的节点,从而将具有M:N对应关系的匹配对统一拆解为若干个1:1的匹配对(图 5中的a→f ′ vs. e→f, f'→b vs. f→b', b→g' vs. b′→g, g'→c vs. g→c', c→h' vs. c'→h以及h'→d vs. h→ i),从而方便属性信息在不同数据集间的转移。
|
| 图 5 匹配对的空间内插 Fig. 5 Spatial Interpolation of Matching Pairs |
需要特别说明的是,内插过程结束中,具有某些定量特性的属性信息(如道路的长度、通行时间等)也需要进行内插分割。但在本文所描述的任务中,需要转移的属性均为定性类信息(如是否为自行车骑行路、或徒步路线等),因此可直接进行属性转移。
1.3.2 道路实体的集成匹配运算结束后,补充数据集(AOSD)中的道路可被分为两大类:(1)匹配成功的道路,即在基础数据集(ATKIS)中找到了与之相对应的道路;(2)未被匹配的道路,即未能在基础数据集中找到与之相对应的道路。对于匹配成功的道路,它们的实体无需再被转移集成到基础数据集中,因为相应的道路已经存在了。而未被匹配的道路在很大程度上则是因为这些道路在基础数据集中并不存在。因此,它们将会被初步认定为“需要被融合的实体道路”并参与后续的融合操作。然而这些“需要被集成的实体道路”并不能直接被移植到基础数据集中。其原因是这些道路的几何位置与基础数据集中道路网在空间上是相互分离或相互冲突的。为此,需要对这些道路实体进行几何变形。为了保持所集成的道路在整体上的协调统一,又保持道路个体在局部上的几何特征[11],该过程可通过以下3类点的位移来实现完成。
1) 在匹配成功的道路要素之间进行空间内插后(见图 6中的箭头线),AOSD中的一些点在ATKIS中可直接找到其对应的位置。针对此类型的点,可直接进行几何位移。如图 6所示,P4被移至A3、点P5被移至P5′等。
|
| 图 6 道路实体的集成 Fig. 6 Integration of Road Features |
2) 道路交叉口或终节点(见图 6中的P1),此类点的移位可通过类型1)中点的位移计算得出。将AOSD的道路网划分为一系列的“网眼”[12-13],“网眼”区域内任意一点的位移都可以根据“网眼”边界上各点的位移推算得出:
式中, pi=[xi yi]T和pi'=[xi' yi']T分别表示“网眼”边界点的原始以及位移后的坐标;P0=[X0 Y0]T和P0'=[X0' Y0']T则分别表示交叉点的原始坐标以及变形后的坐标;n表示“网眼”边界点的个数;pi, j代表“网眼”边界上与pi相邻的点,m表示其个数;α、β为两个取值在0~1之间的经验参数。
3) 其他的点。基于类型1)和2)中的点位移,此类点的位移可通过内插的方法计算得出,如图 6(b)中的P7的位移(即P7→P7′)需要以P1和P4的位移(即P1→P1'和P4→A3)为依据。
几何位移完成后,还需在相应的位置添加新的节点(如图 6中的P5'),从而保证集成后道路网数据在几何形态和拓扑结构上的正确性,进而保证集成后道路网的数据质量。
1.4 融合后道路网数据集内部要素间匹配运算和数据集成在实际的工程和应用中,即使对道路网匹配算法不断进行优化与完善,仍然很难达到100%的成功率与正确性。相应地,融合后的道路网数据集也会存在一些错误与不足。由此,需要对匹配的算法进行整合与改进。对此,为了进一步提高道路网数据融合的完整性与准确性,本模型创建了内部要素间的匹配运算和属性转移过程。其具体包括4个步骤:
1) 将融合的数据分为两个子集:一个子集标注为SRD(subset of reference dataset),即参考数据集子集, 包含了ATKIS中的所有要素;另一个子集标注为SAD(subset of additional dataset),即补充数据集子集,包含§1.3.2中从AOSD中融合来的所有道路要素。
2) 如果SRD中的一个道路要素(串)和SAD中的一个道路要素(串)相互交错却在交叉处无节点(见图 7(a)),那么,则需在交点创建新节点并对相应道路要素进行分割(见图 7(b))。
|
| 图 7 内部要素间的匹配运算和数据集成示例 Fig. 7 Example of Internal Data Matching and Integration |
3) 在SRD和SAD间进行匹配运算。若匹配成功,则进行属性信息的转移(转移方法见§1.3.1)并删除相应的SAD道路要素(删除后的结果见图 7(c));若匹配不成功,则需保留SAD道路要素并参照§1.3.2的方法进行几何变形与位移。
4) 对步骤1)~3)进行迭代操作,直至没有新识别的匹配对为止。数次迭代之后,融合后的道路网数据无论在完整性还是在正确性方面均可得到进一步的改善与提升。
2 VGI数据和地形图数据自动融合实验利用本文提出的道路网自动匹配与融合模型,可以在匹配成功的道路要素之间进行属性转移,而对于无法成功匹配的AOSD道路要素,则通过几何变形与位移的方式将其集成到ATKIS中。此外,本文还提出了内部要素间的数据匹配和属性转移这一过程,在很大程度上提高了融合后道路网的完整性与准确性。
为了测试算法模型的整体性能,本文在德国和奥地利交界处的阿尔卑斯山地区选取不同的测试区进行了实验,图 8便是从中随机选取的实例。图 8(a)所示的区域位于市区,而图 8(b)的区域则位于山区,这两个测试区的面积均为15×15 km2。在这两张图中,红色线条表示具有户外运动属性信息的道路,其中包括:(1)通过属性转移的方式,从AOSD中获取户外属性信息的ATKIS道路; (2)从AOSD中集成的道路实体;黑色线条表示ATKIS中的其他道路。
|
| 图 8 自动匹配及融合运算的结果 Fig. 8 Results of Automatic Data Matching and Integration |
如图 9所示,在融合后的道路网数据中,无论是在普通的路网稀疏区域,还是在复杂的数据交叉口处,户外运动路线(红线)都保持了很好的连通性,数据质量很好。
|
| 图 9 融合后道路网数据的细节图 Fig. 9 Some Details of Automatic Data Integration |
为了进一步评判该算法模型的性能,本文将自动运算结果与人工匹配融合的结果进行了比较分析,电脑配置为Intel Core i7 2.80 GHz,统计结果参见表 1。表 1中,匹配/融合失败的道路要素包括:(1)AOSD数据中的属性未能成功转移到ATKIS中的道路要素;(2)不准确或者错误地进行了实体转移的AOSD道路要素。
从表 1可以看出,该算法模型具有以下两个显著的特点:(1)匹配成功率高。在随机选取的4个总面积为450 km2测试区域内,匹配融合的道路总长为3 666.8 km,其中融合成功的总长度为364.9 km,仅仅有0.62 km的道路网要素未能或未能正确地进行匹配与融合成功,整体准确率超过99.98%,融合准确率也达到了99.83%。其中,整体正确率=[(所有道路要素-匹配融合失败的道路要素)/所有道路要素]×100%,融合准确率=[(匹配融合的道路要素-匹配融合失败的道路要素)/匹配融合的道路要素]×100%。(2)运算速度快。在一台普通的个人电脑上(Intel Core i7 2.80 GHz),对近450 km2区域内的匹配及融合运算仅需75 s。鉴于该算法模型的优良性能,所开发的程序软件被成功应用于整个阿尔卑斯山脉地区的道路网数据的加工与生产中。作为德国Alsptein公司的一项Web服务,经匹配融合后的数据也已被广泛用于户外运动路线的计算以及相关路径的导航(www.alsptein.net)。
此外,需要特别说明的是,本文所提出的算法模型并不依赖语义信息,仅仅依靠道路网的几何和拓扑信息进行运算,具有很强的普遍性。除ATKIS与AOSD外,该算法模型可普遍适用于其他的道路网数据。
3 结语本文研究并开发了多源道路网自动匹配融合算法模型,包括道路网智能化分割、道路网数据匹配、道路网数据融合、融合后道路网内部要素间的匹配运算及数据集成等4个过程。
通过道路网智能化分割可以在很大程度上消除由于比例尺表达差异大而给匹配运算所造成的巨大干扰。实验结果表明,本文提出的算法模型成功率高、准确率高、运算速度快、普遍性强,已被成功应用于实际道路网数据的加工与生产中。
| [1] |
Goodchild M F. Citizens as Sensors: The World of Volunteered Geography[J]. GeoJournal, 2007, 69(4): 211-221. DOI:10.1007/s10708-007-9111-y |
| [2] |
Fast V, Rinner C. A Systems Perspective on Volunteered Geographic Information[J]. ISPRS International Journal of Geo-Information, 2014, 3(4): 1278-1292. DOI:10.3390/ijgi3041278 |
| [3] |
Zhang Yunfei, Yang Bisheng, Luan Xuechen. Automatic Matching of Urban Road Network with Probabilistic Relaxation Method[J]. Acta Geodaetica et Cartographica Sinica, 2012, 41(6): 933-939. (张云菲, 杨必胜, 栾学晨. 利用概率松弛法的城市路网自动匹配[J]. 测绘学报, 2012, 41(6): 933-939. ) |
| [4] |
Fu Zhongliang, Yang Yuanwei, Gao Xianjun. Multivariate Logistic Regression was Used to Match the Road Network[J]. Geomatics and Information Science of Wuhan University, 2016, 41(2): 171-177. (付仲良, 杨元维, 高贤君, 等. 利用多元Logistic回归进行道路网匹配[J]. 武汉大学学报·信息科学版, 2016, 41(2): 171-177. ) |
| [5] |
Monmonier M. Kartographische Generalisierungen Oder Viele Kleine Notlügen[M]. Switzerland: Birkhäuser Basel, 1996: 45-68.
|
| [6] |
Velaga N R, Quddus M A, Bristow A L, et al. Map-Aided Integrity Monitoring of a Land Vehicle Navigation System[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(2): 848-858. DOI:10.1109/TITS.2012.2187196 |
| [7] |
Lüscher P, Burghardt D, Weibel R. Matching Road Data of Scales with an Order of Magnitude Difference[J]. International Cartographic Association, 2007, 1(11): 12-13. |
| [8] |
Zhang Meng, Li Tian, Guo Wei. Application of GIS in Environmental Science[M]. 2nd ed.Beijing: Tsinghua University Press, 2016: 35-38. (张猛, 李天, 郭伟. 地理信息系统在环境科学中的应用[M]. 2版.北京: 清华大学出版社, 2016: 35-38. )
|
| [9] |
Hu Y, Chen J, Li Z, et al.Road Data Updating Using Tools of Matching and Map Generalization[C].The 21st ISPRS Congress, Beijing, China, 2008
|
| [10] |
Wang Hao, Zhai Renjian, Zhou Minghui. A Road Matching Method Based on Complex Network[J]. Journal of Surveying and Mapping Science and Technology, 2016, 33(1): 88-93. (王昊, 翟仁健, 周明辉, 等. 一种基于复杂网络的道路匹配方法[J]. 测绘科学技术学报, 2016, 33(1): 88-93. ) |
| [11] |
Gong Xianyong, Wu Fang, Ji Cunwei, et al. The Model of Ant Colony Algorithm for Road Network Matching[J]. Geomatics and Information Science of Wuhan University, 2014, 39(2): 191-195. (巩现勇, 武芳, 姬存伟, 等. 道路网匹配的蚁群算法求解模型[J]. 武汉大学学报∙信息科学版, 2014, 39(2): 191-195. ) |
| [12] |
Meng L. Selective Omission of Road Features Based on Mesh Density for Automatic Map Generalization[J]. International Journal of Geographical Information Science, 2009, 23(8): 1013-1032. DOI:10.1080/13658810802070730 |
| [13] |
Zhang M, Yao W, Meng L. Automatic and Accurate Conflation of Different Road-Network Vector Data Towards Multi-modal Navigation[J]. ISPRS International Journal of Geo-Information, 2016, 5(5): 68. DOI:10.3390/ijgi5050068 |
2019, Vol. 44


