-
道路选取是地理信息科学研究领域的热门研究问题,涉及导航、交通流量预测、城市形态分析、空间信息多尺度表达等多个方面的应用。根据网络化简的方式不同,可将已有的道路选取方法分为4类。第1类:点选取/合并方法,即通过选取道路交叉点或合并道路交叉点来选取相应道路[1-2]。第2类:面合并方法,即从不满足约束条件的地方(如网眼面积小于视觉阈值)开始,计算构成网眼的路段的重要程度或计算合并网眼后对道路网的影响,删除路段合并网眼[3-7]。第3类:线删除/选取方法,即直接通过删除重要程度较低或是保持网络的专题功能的道路单元来达到选取的目的[8-18]。对于删除重要程度较低的方法,这里又可细分为通过设定某个属性的阈值删除[8-9],通过聚类的方法删除[10-11],以及通过重要度排序方法删除[12-16]。所谓的道路单元在stroke概念提出前主要是指通视线或道路段,在stroke概念提出后一般是指stroke。第4类:线面混合方法,先后通过约束条件按面合并方法和线选取方法分别对路网中的面状结构和依附于保留网眼边的线状结构进行选取[19-20]。以往研究倾向于针对道路选取问题提出不同的解决方法。最近,出现了针对道路选取中的一些细节问题的比较研究,如对道路描述参量与道路是否选取的关系研究[21],度量道路重要度的参量评估[22],stroke生成方法对选取结果的影响[23],不同道路网模式下综合方法有效性的比较等等[16]。
渐进式综合与连续综合理论的出现[24-25],导致在道路选取的过程中存在两种策略,一种是删除后不更新策略,按照最初确定的道路的重要度进行删除,直到满足尺度要求,例如按照某个属性的阈值或是聚类方法进行道路选取采取的就是此种策略[8-11];另一种是删除后更新策略,每次删除一条道路后,重新计算剩余道路的重要度,然后根据新的重要度进行下次删除,直到满足尺度要求,文献[7]采用的即是此种策略。本文将从概念层和操作层对删除后不更新策略与删除后更新策略进行比较。
HTML
-
选取是顾及目标地理意义与上下文环境的情况下,根据比例尺的要求,保留相对重要的要素,舍弃相对次要的要素的地图综合操作。在选取过程中,删除一个目标后,可能影响到其他目标的重要度。即在选取过程中,可能出现这样一种情况:删除一部分要素后,保留要素的重要度发生变化,甚至出现重要度排序的改变。如图 1所示,道路2是连接左下部分的唯一通道,其重要度高于道路1和道路3,然而,假定道路4被删除,那么道路1、2、3将会同等重要。
按照渐进式综合与连续综合的观点[24-25],删除一条道路后,会生成源比例尺的一个粗略的表达,然后再从这个表达派生更粗略的表达,每一个中间表达是存在的。从理论上说,已经是遵循删除后更新的策略了。假定现在有两种选取过程,一种是由源比例尺So路网Ro对道路按照重要度函数计算和排序,删掉重要度较小的道路,直接生成目标比例尺St路网Rt1;另一种是由源比例尺路网Ro生成中间比例尺Si路网Ri,再由中间比例尺Si路网Ri生成目标比例尺St路网Rt2,那么,此过程可理解为对路网Ro中的道路按照重要度函数计算和排序后删掉一部分道路,生成中间比例尺路网Ri,然后再对Ri按照重要度函数计算和排序后再删掉一部分,生成目标比例尺路网Rt2。删除后更新策略始终保证了Rt1和Rt2的一致性,而删除后不更新策略由于按照初始的重要度去排序,可能会导致由源比例尺路网直接生成的综合结果Rt1和由源比例尺生成中间结果,然后由中间结果生成目标比例尺结果Rt2不一致的产生。
由上述讨论可知,删除后更新策略优于删除后不更新策略,那么下面将以道路选取中常用的stroke重要度排序法为例,从操作层面进行实证研究,验证这个观点是否正确。
-
以stroke重要度排序法为道路选取方法[12, 15],研究在stroke生成方法和stroke重要度计算相对确定的情况下,两种不同策略对选取结果的影响。采用的研究方法是将控制变量固化,研究自变量和因变量的关系,如图 2所示,其中控制变量是stroke生成以及stroke重要度的确定,自变量是删除后更新以及删除后不更新两种选取策略,因变量是选取结果,评价指标用来对选取结果进行评价。
-
stroke的生成主要由路段连接规则和连接策略决定。连接规则主要有几何规则、专题规则以及混合规则[23]。几何规则由Gestalt原则中的“好的延续性”原则导出,主要指两条路段的转折角小于阈值;专题规则主要是指道路同名和道路等级相同;混合规则是指同时考虑几何规则和专题规则。连接策略主要有每对最大适合策略(every- best-fit)、自身最大适合策略(self-best-fit)、自身适合策略(self-fit)[26]。Zhou和Li认为混合连接规则和每对最大适合策略的组合生成的stroke能得到较好的地图综合结果[23]。由于本研究也是针对地图综合,所以根据Zhou和Li的研究结论,采用混合连接规则与每对最大适合策略生成道路网stroke。混合连接规则是路段连接时判断路段是否具有相同的等级,然后判断路段间的转折角是否小于阈值,转折角阈值设定为60°。每对最大适合策略是指互为最适应的路段相连。
-
目前,计算stroke重要度主要有3种方法:①规则法,即定义属性参数的优先顺序来确定道路重要度[6];②权重法,对属性参数赋予权重,重要度即为参数的加权和[15];③参数生成法,将某一个或者某几个参量进行变换或集成,生成新的参量来描述道路重要度[14, 16]。本文采用CRITIC加权法[27-28]计算stroke的重要度。
-
表 1列举了已有道路网选取文献中使用的描述参量,图 3对已有文献中用到的描述参量进行了统计。这些参量具有以下特点:①描述了道路的几何、拓扑、专题和密度方面的特征;②同一个参量在不同的文献中名称有所区别。例如等级和类型两个参量含义相近、连接度与连通中心度的概念与定义相同;③参量计算的载体主要有通视线、道路段、名字相同的道路以及stroke,目前主要是针对stroke; ④使用较多的参量是:描述专题方面的等级和类型,描述几何方面的长度以及描述拓扑方面的连通度、中介度和接近度。
文献 参量 针对对象 文献[8] 连通度、控制值、深度值、集成度 通视线 文献[3] 等级、长度、蜿蜒度 道路段 文献[17] 长度、旅行时间 道路段 文献[12] 类型、长度 stroke 文献[4] 类型、长度 stroke 文献[21] 类型、长度、宽度、车道数、交通方式、连通度 道路段 文献[9] 连通度、中介度、接近度 名字相同道路 文献[10] 等级、长度、限速、连通度、中介度、接近度、车道数 名字相同道路 文献[13] 长度、连通比率、长度比率 stroke 文献[18] 等级、长度 道路 文献[14] 中介度 stroke 文献[6] 等级、连通度、长度 stroke、道路段 文献[11] 长度、等级、Voronoi密度 stroke 文献[7] 连通度、中介度、接近度、长度、密度、交通流量 stroke 文献[22] 等级、长度、连通度、中介度、接近度 stroke 文献[15] 长度、连通度、中介度、接近度 stroke 文献[16] 路径中心度、连接度、长度 stroke Table 1. Measures for Individual Roads Existed in Literature
-
本文选择参量时顾及两个基本的原则。即:①“有图能算”原则,只要给定数据,参量就能计算。②“普遍接受”原则,即参量被很多学者采用。根据这两条原则,本文选择的描述参量为长度、连通度、接近度和中介度。表 2介绍了这4种参量的计算方法和含义。
参量名称 意义 计算方法 长度(Length) 该stroke的几何长度 连通度(Degree) 与该stroke相交的其他stroke的数量 $D\left( {{v_i}} \right) = \sum\limits_{k = 1}^n {{r_{ik}}} $, 其中rik为边的邻接矩阵第i行第k列的元素。 接近度(Closeness) 该stroke到所有其他stroke的最少连接数量,反映了其他stroke聚集于该stroke的可能性 $C\left( {{v_i}} \right) = \frac{{n - 1}}{{\sum\limits_{k = 1}^n {d\left( {{v_i}, {v_k}} \right)} }}$,其中d(vi, vk)表示节点vi和vk的最短距离。 中介度(Betweenness) 度量了该stroke处于其他stroke之间的程度,度量stroke是否起“桥梁”作用 $B = \left( {{v_i}} \right) = \frac{1}{{\left( {n - 1} \right)\left( {n - 2} \right)}}\sum\limits_{j, k \in n;j \ne k;k \ne i\;j \ne k;k \ne i}^{} {\frac{{{m_{jk}}\left( {{v_i}} \right)}}{{{m_{jk}}}}} $,其中,mjk表示节点vj和vk间最短路径的数量;mjk(vi)表示节点vj和vk间最短路径中经过节点vi的数量。 Table 2. Meaning and Calculation of Measures
引入对偶图的概念,图的节点表示stroke,边代表stroke与stroke相交的关系。形式化定义为G=G(V,E),其中V是节点的集合,V={v1, v2…vn};E是边的集合,E={vivj|vi, vj∈V}。图可由其邻接矩阵表示为R(G)=[rij]n×n,其中,
-
本文主要考察两种策略。第一种是删除后不更新策略,即按照最初由参量确定的stroke重要度进行删除,直到满足尺度要求;第二种是删除后更新策略,即每次删除一条stroke后,重新计算剩余stroke的重要度,然后根据新的重要度进行下次删除,直到满足尺度要求。在删除过程中,如果某条道路的删除会影响路网的连通性,那么将其保留[15]。
-
如何确定选取停止条件是研究的难点。常用的方法是:①基于统计规律的方法,即运用开方根规律估计选取数量或长度比例;②基于约束条件的方法,即通过网眼面积是否符合最小尺寸进行判断。由于开方根规律主要是针对地形图(符号化后的数据),而本研究的数据并不是符号化数据,所以选择根据实际的参照数据上的最小网眼面积作为停止条件来进行评价。
-
对综合结果进行评价也一直是地图自动综合的难点问题[26]。路网综合的评价指标定量方面主要有相似性指标、连通性指标、漏删率和误删率等,定性方面主要是对分布模式的视觉判别[15, 19]。在选取策略中通过约束条件保证了选取前后的连通性,因此本文采用相似性指标、漏删率和误删率结合目视判别模式是否保持来进行评价。
在定量评价方面,采用广泛运用的基于相似性的对照评价方法。将已有地图作为参考标准,将选取结果与其进行对照,重合部分越多则相似性越高,证明选取结果越好[19]。相似性(Similarity)指标的取值范围为[0, 1],其计算式为:
式中,A∩B表示自动选取和参考标准上同时出现的道路总长度;A表示自动选取后保留的道路的总长度;B表示参考标准上保留的道路总长度。相似性指标越高,则选取结果越好。
漏删率与误删率是导致自动选取结果与标准图之间存在差异的两类原因,它们可以通过下列公式进行量化评价:
式中,Commission Error表示漏删率;A∩ ┐B表示自动选取结果中保留的参考标准上删除的道路总长度;Omission Error表示误删率;┐A∩B表示自动选取结果中删除的参考标准上保留的道路总长度。这两个指标越低,则选取结果越好。
在定性评价方面,对比综合结果与参考标准图的差异,运用目视判别对路网几何模式与密度对比的保持进行评价。
-
实验数据是广东省深圳市1:1万道路网,参照数据是其1:5万道路网,该数据由广东省深圳市基础地理信息中心提供。1:1万道路网是选取对象,1:5万道路网是参照数据,如图 4所示。
-
图 5是选取过程中两种不同策略中间结果与参考标准图的相似性变化曲线。相似性在开始阶段随保留线要素条数的减小而上升;在上升过程中,存在一些小幅下降,是由于删除了参考标准图中保留的线划;最后,由于过度删除而下降至零。每条曲线上存在一些关键点,即相似性取得最大值的点M与M′、保留道路单元数与标准图相同的点N与N′、保留道路总长度与标准图相同的点L与L′、图面最小网眼尺寸与标准图相同的点S与S′ (即本文选用停止条件下的最终结果)。由这些关键点处的相似性值、漏删率和误删率(见表 3)可知,从定量方面评价,删除后不更新策略优于删除后更新策略。
关键点 删除后更新 关键点 删除后不更新 相似性 漏删率 误删率 相似性 漏删率 误删率 M 0.605 1 0.229 5 0.262 8 M′ 0.622 8 0.248 2 0.291 6 N 0.600 4 0.213 4 0.283 8 N′ 0.603 4 0.209 0 0.281 2 L 0.592 6 0.253 5 0.256 8 L′ 0.620 0 0.220 7 0.235 2 S 0.597 4 0.210 9 0.289 0 S′ 0.605 5 0.218 8 0.270 7 Table 3. Quantitative Evaluation Measures at Several Critical Points
两种策略最小网眼面积停止条件下的最终选取结果对比如图 6所示,其中更新策略、不更新策略、参考标准图分别用黄色、红色、蓝色表示。通过不同的叠置顺序可以显示漏删与误删的线划,结果表明,删除后更新策略与删除后不更新策略结果均存在明显的不足,各有优缺点。从道路的几何模式来看,更新策略对网格模式保留较为完好,但是低密度区的网格完全消失(图 6(b));不更新策略破坏了网格模式,大量依附于主要道路的短小支路,形成了悬挂现象(图 6(d))。从道路的密度变化来看,更新策略的结果中高密度区域得到更多保留,夸大了不同区域的密度对比;而不更新策略能较好保持密度对比。
Figure 6. Differences Between Benchmark and Selection Results of Two Strategies with Minimum Mesh Area as Stop Condition
视觉差异变化发生的原因是:随着综合的不断进行,初始重要度较高道路周围的次要路段被不断删除,而这些相对重要的道路由于不更新策略得以保留,最终变为悬挂边;而更新策略中,路段的重要度随周围路段的删除而下降,从而导致部分区域路网集中地被删除。