留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种界址点与界址线提取的优化算法

李朝奎 刘俊杰 董沈峰 陈建辉

李朝奎, 刘俊杰, 董沈峰, 陈建辉. 一种界址点与界址线提取的优化算法[J]. 武汉大学学报 ● 信息科学版, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273
引用本文: 李朝奎, 刘俊杰, 董沈峰, 陈建辉. 一种界址点与界址线提取的优化算法[J]. 武汉大学学报 ● 信息科学版, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273
LI Chaokui, LIU Junjie, DONG Shenfeng, CHEN Jianhui. An Optimization Algorithm for Boundary Points and Boundary Lines Extraction[J]. Geomatics and Information Science of Wuhan University, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273
Citation: LI Chaokui, LIU Junjie, DONG Shenfeng, CHEN Jianhui. An Optimization Algorithm for Boundary Points and Boundary Lines Extraction[J]. Geomatics and Information Science of Wuhan University, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273

一种界址点与界址线提取的优化算法

doi: 10.13203/j.whugis20190273
基金项目: 

国家自然科学基金 41571374

国家重点研发计划 2018YFB0504501

国家重点研发计划 2017YFB0503802

详细信息
    作者简介:

    李朝奎,博士,教授,博士生导师,主要从事三维地理信息理论方法与应用技术研究。chkl_hn@163.com

  • 中图分类号: P208; P273

An Optimization Algorithm for Boundary Points and Boundary Lines Extraction

Funds: 

The National Natural Science Foundation of China 41571374

the National Key Research and Development Program of China 2018YFB0504501

the National Key Research and Development Program of China 2017YFB0503802

More Information
    Author Bio:

    LI Chaokui, PhD, professor, specializes in 3D geographic information theory, method and application. E-mail: chkl_hn@163.com

图(8) / 表(4)
计量
  • 文章访问数:  49
  • HTML全文浏览量:  7
  • PDF下载量:  17
  • 被引次数: 0
出版历程
  • 收稿日期:  2019-12-26
  • 刊出日期:  2021-03-05

一种界址点与界址线提取的优化算法

doi: 10.13203/j.whugis20190273
    基金项目:

    国家自然科学基金 41571374

    国家重点研发计划 2018YFB0504501

    国家重点研发计划 2017YFB0503802

    作者简介:

    李朝奎,博士,教授,博士生导师,主要从事三维地理信息理论方法与应用技术研究。chkl_hn@163.com

  • 中图分类号: P208; P273

摘要: 界址点与界址线的提取在土地确权工作中是一项非常重要的工作。传统的界址点与界址线提取方法需要经过人工判断,根据判断后的结果将界址点与界址线相对应的属性信息手动输入到属性表中。而过多的人工干预使工作效率降低,同时也容易引发各类错误。针对上述问题提出了一种界址点与界址线提取的优化算法。该算法的思路为:(1)利用ArcGIS中的建模工具建立一套针对全部宗地的数据预处理模型,通过该模型生成相应的界址点与界址线的模板文件;(2)利用地理空间数据抽象库(geospatial data abstraction library,GDAL)读取宗地与模板文件的若干属性字段信息;(3)生成并自动读取宗地界址点与界址线文件。实验结果表明,该方法能够有效避免人工干预,提高了界址点与界址线的提取效率。在实际生产尤其是在大批量界址点和界址线的提取工作中,该方法具有相当的优势,为中国同类土地监测与管理工作提供了原创性技术支持。

English Abstract

李朝奎, 刘俊杰, 董沈峰, 陈建辉. 一种界址点与界址线提取的优化算法[J]. 武汉大学学报 ● 信息科学版, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273
引用本文: 李朝奎, 刘俊杰, 董沈峰, 陈建辉. 一种界址点与界址线提取的优化算法[J]. 武汉大学学报 ● 信息科学版, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273
LI Chaokui, LIU Junjie, DONG Shenfeng, CHEN Jianhui. An Optimization Algorithm for Boundary Points and Boundary Lines Extraction[J]. Geomatics and Information Science of Wuhan University, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273
Citation: LI Chaokui, LIU Junjie, DONG Shenfeng, CHEN Jianhui. An Optimization Algorithm for Boundary Points and Boundary Lines Extraction[J]. Geomatics and Information Science of Wuhan University, 2021, 46(3): 410-416. doi: 10.13203/j.whugis20190273
  • 宗地是土地权属界址线所封闭的地块,即地籍调查和土地登记的基本土地单元[1]。界址点是宗地权属界线的转折点,它是标定宗地权属界线的重要标志,界址点测量是地籍调查工作的核心内容之一[2-4]。界址线是由相邻界址点连线构成的折线。界址点和界址线是农民对其所拥有的承包土地的权属界线范围的依据,具有法律意义[5-8]。随着全国各地农村土地权属调查工作的陆续开展,当前的作业模式亟待优化,以确保按时、保质、保量地完成编程工作[9-13]。在实际工作中,由于界址点与界址线两者的数据体量较大,其属性信息的提取也较为复杂,因此,如何快速而又准确地提取界址点与界址线就成为当前的一大难题。

    传统的提取方法多为在专业测绘软件(如南方CASS等)中进行人工提取[14-16]。但CASS仅支持对单个宗地进行界址点与界址线的提取和编辑,并不支持批量提取。同时,CASS并不具备界址点与界址线中部分特殊字段的计算功能,因此,仍旧需要内业人员进行相应的人工判读,而较多的人工干预也容易造成错误,这使该工作费时费力且效率低下。文献[17]提出了一种利用ArcGIS Engine组件技术对界址点和界址线进行批量提取的方法,但该方法在实现的过程中包含大量基于缓冲区查询的中间步骤,因此,在宗地数据量较大的情况下效率较为低下。文献[18]提出了一种基于模板文件的界址点和界址线提取方法。该方法首先利用ArcGIS中的建模工具生成界址点和界址线的模板文件,再通过读取模板文件中的相关信息提取界址点和界址线。虽然该方法能够较好地提取界址点和界址线,但由于其核心算法仍旧是基于空间查询,导致效率同样较为低下。因此,当前迫切需要寻找一种快速简便的方法批量提取界址点和界址线。

    针对上述问题,本文提出了一种基于地理空间数据抽象库(geospatial data abstraction library,GDAL)的界址点与界址线批量提取方法,实现了界址点与界址线的快速智能化提取。该方法的具体实现流程为:首先,利用ArcGIS中的建模工具建立了一套针对宗地的数据预处理模型,通过该模型生成界址点与界址线对应的模板文件;然后,处理相关信息;最后,生成界址点与界址线文件。该方法相较于传统方法的最大优势是避免了耗时的空间查询操作,仅通过读取属性信息即可批量快速生成界址点与界址线文件。实验证明,该方法无需人工干预且效率较高,极大地减轻了内业人员的工作量,同时,保证了界址点与界址线提取的准确性与可靠性,为中国土地监测与管理工作提供了新方法和技术支撑。

    • 界址点是指宗地权属界线的转折点。根据土地确权工作中的相关要求,界址点文件需要包含8个属性字段,如表 1所示。

      表 1  界址点属性字段

      Table 1.  Boundary Points Attribute Field

      序号 字段名称 字段代码 字段类型 字段长度 小数位数
      1 标识码 BSM Int 10
      2 要素代码 YSDM String 6
      3 界址点号 JZDH String 10
      4 界址点类型 JZDLX String 1
      5 界标类型 JBLX String 1
      6 地块编码 DKBM String 254
      7 X坐标值 XZBZ Double 10 3
      8 Y坐标值 YZBZ Double 10 3

      表 1中,标识码和界址点号从1开始递增,要素代码可取默认值211021,界址点类型可取默认值1,界标类型可取默认值3,地块编码字段描述的是与界址点相交的宗地的地块编码值,XY则描述界址点的位置坐标信息。

    • 地块编码是宗地包含的重要信息,根据地块编码即可对宗地进行快速识别。在界址点的属性表中应包含相应的与其相交的宗地的地块编码集合。地块编码的计算规则为:若某界址点只与单个宗地在空间位置上成相交关系,则该界址点的地块编码值就是该宗地的地块编码值;若某界址点与多个宗地在空间位置上成相交关系,则需要获取多个宗地的地块编码值,对其进行升序排序,排序后的地块编码值就是该界址点的地块编码值。如图 1所示,除界址点AE外的其他界址点都只与单个宗地相交,界址点BCDJ的地块编码均为3401231010140000011,界址点FGHI的地块编码为3401231010140000005;而界址点AE由于与两块宗地同时处于相交关系,因此,其地块编码值为3401231010140000005/3401231010140000011。

      图  1  界址点地块编码示意图

      Figure 1.  Demarcation Points Plot Coding

      现有的地块编码提取方法主要基于要素间的空间查询。其核心思想为:首先,遍历每一个界址点,将某个界址点作为空间查询实体,利用ArcEngine中的ISpatialFilter接口查询出与该界址点在空间位置上成相交关系的宗地集合;然后,读取宗地集合的地块编码值并排序;最后,获取界址点的地块编码。在数据量较大的情况下,单个界址点实体空间查询的效率较低,若对每个界址点都执行一次空间查询,其效率就更低。因此,本文利用ArcGIS建立针对宗地的数据预处理模型,如图 2所示。

      图  2  界址点模板生成模型

      Figure 2.  Boundary Points Template Generation Model

      图 2可知,通过该模型生成界址点的模板文件,利用读取宗地和模板文件的属性信息来确定界址点的地块编码值。该模型执行面转线、折点处分割线、要素折点转点3个步骤,最终生成的界址点模板文件的属性表中包含左编号和右编号两个字段。其中,左编号表示某界址点所在线段左侧的宗地编号,右编号表示某界址点所在线段右侧宗地的编号。由于界址点模板文件包含空间位置上的重复数据记录,因此,读取这些重复数据的左编号和右编号值并进行唯一值查询,在输入宗地数据后,可以确定与该界址点相交的宗地的地块编码值。

      表 2所示,在界址点模板文件的属性表中被选中的3条记录在空间位置上表示同一个界址点,这3条记录的编号集合的唯一值为-1、0、2。其中,-1表示没有宗地与之相交,可以确定该界址点与编号为0和2的两块宗地成相交关系,其地块编码值即为0号宗地和2号宗地的地块编码组合值。

      表 2  界址点模板文件属性

      Table 2.  Boundary Points Template File Attribute

      编号 空间属性字段 左编号 右编号
      0 -1 0
      1 -1 0
      2 2 0
      3 -1 2
      2 -1 0
      5 -1 1
    • 界址线是指宗地四周的权属界线,根据土地确权工作中的相关要求,界址线文件需要包含12个属性字段,如表 3所示。

      表 3  界址线属性字段

      Table 3.  Boundary Lines Attribute Field

      序号 字段名称 字段代码 字段类型 字段长度
      1 标识码 BSM Int 10
      2 要素代码 YSDM String 6
      3 界线性质 JXXZ String 6
      4 界址线类别 JZXLB String 2
      5 界址线位置 JZXWZ String 1
      6 界址线说明 JZXSM String 254
      7 毗邻地物权利人 PLDWQLR String 100
      8 毗邻地物指界人 PLDWZJR String 100
      9 界址线号 JZXH String 10
      10 起界址点号 QJZDH String 10
      11 终界址点号 ZJZDH String 10
      12 地块编码 DKBM String 254

      表 3中,标识码和界址线号从1开始递增,要素代码取默认值211031,界线性质取默认值600009,界址线类别取默认值01,界址线位置取默认值2,地块编码、毗邻地物权利人、毗邻地物指界人、起界址点号、终界址点号由与其相交的界址点的点号确定,界址线说明由起界址点号、终界址点号、界址线本身共同确定。

    • 与提取界址点地块编码类似,本文通过构建相应预处理模型实现界址线地块编码的提取。其提取规则为:若某条界址线只处于单个宗地的边界线上,则界址线的地块编码值就是该宗地的地块编码值;若某条界址线同时处于两个宗地的边界线上,则获取这两个宗地的地块编码值,然后对其进行升序排序,排序后的地块编码值即为该界址线的地块编码值。根据线面之间的拓扑关系可知,界址线至多处于两块宗地的边界线上。界址线地块编码示意如图 3所示。

      图  3  界址线地块编码示意图

      Figure 3.  Diagram of Boundary Line Block Code Coding

      图 3中,除界址线D外的其他界址线都处于一块宗地的边界线上,界址线ABCJK的地块编码均为3401231010140000011,界址线EFGHI的地块编码为3401231010140000005;界址线D处于两块宗地的边界线上,其地块编码为3401231010140000005/3401231010140000011。

      目前,针对界址线地块编码的提取方法仍基于要素间的空间查询。因此,本文利用ArcGIS建立针对宗地的数据预处理模型,通过该模型生成界址线的模板文件,通过读取宗地和模板文件的属性信息来确定界址线的地块编码值。该模型如图 4所示。

      图  4  界址线模板生成模型

      Figure 4.  Boundary Lines Template Generation Model

      在输入宗地数据后,该模型执行面转线、折点处分割线两个步骤。生成的界址线模板文件属性表中包含左编号和右编号两个字段,每条要素在空间位置上是唯一的。因此,利用左编号和右编号即可确定边界线包含该界址线的宗地集合,如表 4所示。表 4中,在界址线模板文件的属性表中,第1条记录左侧的宗地编号为31 059,右侧的宗地编号为31 058,表示该界址线处在两个地块的边界线上;第2条记录左侧的编号为-1,右侧的宗地编号为31 058,表示该界址线处在一个地块的边界线上;通过宗地的编号获取相应的地块编码值。该方法通过读取字段属性信息获取界址线与宗地的空间位置关系,避免了空间查询带来的时间损耗。

      表 4  界址线模板文件属性

      Table 4.  Boundary Lines Template File Attribute

      编号 空间属性字段 左编号 右编号
      24 折线 31 059 31 058
      25 折线 -1 31 058
      26 折线 31 058 31 057
      27 折线 -1 31 055
      28 折线 -1 31 054
    • 由拓扑关系可知,界址线的起界址点号、终界址点号与其端点对应的界址点号相同。本文利用散列表结构对界址点号信息进行存储和查询,其过程为:首先,遍历界址点要素,以界址点的横纵坐标字符串为键,界址点号为值存入散列表;然后,遍历界址线要素,在获取某条界址线实体后,将该界址线的起点和终点的坐标字符串带入散列表进行搜索;最后,获取该条界址线的起界址点号和终界址点号。该方法同样避免了点线间的空间查询所带来的时间上的损耗,提高了运行效率。

    • 根据土地确权工作的相关要求,每条界址线都应具备相对应的界址线说明。界址线说明通常由起界址点号、终界址点号、界址线长度和界址线方向4大要素构成,其具体格式为:从点A开始,沿B方向经过C长度,到D终止。其中,A代表该界址线的起界址点号,B代表该界址线的方向,C代表该界址线的长度,D代表该界址线的终界址点号。前文已阐述界址线的起界址点号和终界址点号的获取方法,界址线的长度也可直接读取,只需考虑如何确定该界址线的方向。一般使用中北、中东、中西、中南4种方位对界址线进行方位上的描述,其方向划分规则如图 5所示。

      图  5  定义界址线方向

      Figure 5.  Define Boundary Lines Direction

      根据界址线方位的划分规则,本文设计了一种算法对界址线的方向进行计算。其具体流程为:首先,遍历每条界址线要素,以界址线的起点为坐标原点构建平面直角坐标系,根据起点和终点的横纵坐标值确定该界址线落入的象限方位;然后,计算该界址线的斜率,比较斜率与阈值的大小关系即可确定界址线的方向。为避免斜率不存在的情况,本文的阈值取sin45°的绝对值。以第1象限为例:若斜率大于阈值,则为中北方向;反之,则为中东方向。其他3个象限的界址线方向可以此类推。

    • 界址线的毗邻地物权利人和毗邻地物指界人字段用以存放界址线的相邻宗地的权属信息。其计算规则为:若某条界址线只处在单个宗地的边界线上,则该界址线的毗邻地物权利人和毗邻地物指界人是该宗地的权利人;若某条界址线同时处于两个宗地的边界线上,则这两个宗地的权利人均为该界址线的毗邻地物权利人和毗邻地物指界人,指界人的顺序按照地块编码的大小进行升序排序。

    • 本文实验利用C#结合GDAL实现界址点与界址线的批量提取算法。GDAL是一套用于读写空间数据的开源库[19-22]。与传统的ArcEngine组件技术相比,GDAL可直接对文件读取和写入,其读写速度相对较快。本文以某地区宗地数据为实验数据,对本文方法进行验证,见图 6

      图  6  实验区内的宗地数据

      Figure 6.  Parcel Data in the Test Area

      图 6中,本文构建的界址点与界址线提取软件在提取界址点时,只需输入宗地文件和界址点模板文件即可;提取界址线时,只需输入宗地文件、界址点文件和界址线模板文件即可。在ArcGIS中,打开已经建立好的模型,设置参数后运行模型,获取界址点及界址线模板。运行界址点及界址线提取程序,可提取界址点及界址线,生成结果如图 7所示。

      图  7  生成的界址点和界址线数据

      Figure 7.  Generated Boundary Points and Lines Data

      实验发现,该区域内有31 448块宗地,生成192 263个界址点所花费的时间大约为10 min,生成221 838条界址线花费的时间大约为1.5 min。为验证生成的界址点和界址线数据的正确性,本文利用农村土地承包经营权确权登记数据库成果质量检查软件对界址点和界址线的数据质量进行检查。根据质检结果可知,利用本文方法生成的界址点和界址线的数据质量完全符合规定的标准。

      同时,为了验证本文方法相较于传统方法的优越性,本文共选取6个实验区的宗地数据对不同算法进行验证对比。实验区的宗地数量分别为5 000、10 000、15 000、20 000、25 000、30 000。改进前的算法主要利用空间查询方法实现。两种方法提取相同数量的界址点和界址线所用时间的对比如图 8所示。

      图  8  提取界址点和界址线时间对比

      Figure 8.  Time Comparison of Extracting Boundary Points and Lines

      图 8实验结果表明,本文提出的界址点提取方法的时间效率是传统方法的23倍,界址线提取方法的时间效率是传统方法的4倍。可以看出,本文提出的方法显著提高了界址点和界址线的提取效率,极大地提高了土地调查工作的效率。

    • 针对中国土地调查中界址点与界址线提取效率低下的问题,对传统手工操作方法及笔者早前开发报道的方法进行改进与优化。优化方法先采用构建拓扑语义的方式实现地理实体间空间位置关系的确定,再利用GDAL直接对文件进行读写。将优化后的算法与优化前算法进行了对比实验,得到如下结论:(1)优化后算法在界址点和界址线的提取方面效率大幅提高;(2)设计的基于C#和GDAL的界址点与界址线提取软件界面友好、操作简便、人机交互性强;(3)本文提出的模型与算法为中国土地监测与管理工作提供了原创性技术支持,具有一定的参考价值。

参考文献 (22)

目录

    /

    返回文章
    返回