留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

互联网+地表覆盖验证及应用

陈军 陈斐 武昊 陈利军 韩刚

陈军, 陈斐, 武昊, 陈利军, 韩刚. 互联网+地表覆盖验证及应用[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305
引用本文: 陈军, 陈斐, 武昊, 陈利军, 韩刚. 互联网+地表覆盖验证及应用[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305
CHEN Jun, CHEN Fei, WU Hao, CHEN Lijun, HAN Gang. Internet+ Land Cover Validation: Methodology and Practice[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305
Citation: CHEN Jun, CHEN Fei, WU Hao, CHEN Lijun, HAN Gang. Internet+ Land Cover Validation: Methodology and Practice[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305

互联网+地表覆盖验证及应用

doi: 10.13203/j.whugis20180305
基金项目: 

国家自然科学基金 41231172

国家自然科学基金 41631178

详细信息
    作者简介:

    陈军, 教授, 博士生导师, 主要从事地理信息建模、更新与服务的理论方法与工程应用研究。chenjun@ngcc.cn

    通讯作者: 陈斐, 博士, cfei0618@163.com武昊, 博士, wuhao@ngcc.cn
  • 中图分类号: P208

Internet+ Land Cover Validation: Methodology and Practice

Funds: 

The National Natural Science Foundation of China 41231172

The National Natural Science Foundation of China 41631178

More Information
    Author Bio:

    CHEN Jun, professor, specializes in the theories and methods of land cover mapping, updating and validation. E-mail: chenjun@ngcc.cn

    Corresponding author: CHEN Fei, PhD. E-mail: cfei0618@163.comWU Hao, PhD. E-mail: wuhao@ngcc.cn
图(5)
计量
  • 文章访问数:  881
  • HTML全文浏览量:  38
  • PDF下载量:  262
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-08-04
  • 刊出日期:  2018-12-05

互联网+地表覆盖验证及应用

doi: 10.13203/j.whugis20180305
    基金项目:

    国家自然科学基金 41231172

    国家自然科学基金 41631178

    作者简介:

    陈军, 教授, 博士生导师, 主要从事地理信息建模、更新与服务的理论方法与工程应用研究。chenjun@ngcc.cn

    通讯作者: 陈斐, 博士, cfei0618@163.com武昊, 博士, wuhao@ngcc.cn
  • 中图分类号: P208

摘要: 为有效地组织大范围地表覆盖数据验证,需要发动和组织来自不同地域、不同机构的专家,但往往缺少网络化环境下的协同验证方法和工具。针对这一问题,将互联网+、服务计算技术等与地表覆盖验证业务相融合,提出了互联网+地表覆盖验证服务模型,构建了面向互联网+的地表覆盖验证业务流程和方法,研制了基于景观形状指数(landscape shape index,LSI)抽样算法的在线验证系统GLCVal(global land cover validation),为大范围、高分辨率地表覆盖数据验证提供了新思路、新方法。利用所提出的方法与系统,与GEO(Group of Earth Observation)、UN-GGIM(the United Nations Initiative on Global Geospatial Information Management)等组织合作开展了GlobeLand30的全球验证,有效支持了跨区域专家的主动参与、多角色协同,促进了验证资源联通和共享,提高了验证效率。

English Abstract

陈军, 陈斐, 武昊, 陈利军, 韩刚. 互联网+地表覆盖验证及应用[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305
引用本文: 陈军, 陈斐, 武昊, 陈利军, 韩刚. 互联网+地表覆盖验证及应用[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305
CHEN Jun, CHEN Fei, WU Hao, CHEN Lijun, HAN Gang. Internet+ Land Cover Validation: Methodology and Practice[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305
Citation: CHEN Jun, CHEN Fei, WU Hao, CHEN Lijun, HAN Gang. Internet+ Land Cover Validation: Methodology and Practice[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2225-2232. doi: 10.13203/j.whugis20180305
  • 数据产品验证是国内外地表覆盖遥感制图与分析应用的一项重要基础性工作。其基本任务是:在地理空间上布设若干具有代表性的样本点,采集能反映地面真实情况的检验参考信息,进行覆盖类型等一致性比对,计算和分析数据产品的精度[1-3]。它既可为数据生产者提供数据产品精度、误差来源等信息,也便于用户了解数据产品的不确定性与适用范围[4-6]。对于大范围地表覆盖数据验证来说,由于所涉地域范围广袤、景观复杂多样,样本布设、参考信息采集及一致性判定的任务艰巨、工作量大,往往要发动和组织来自不同地域、不同机构的专家开展协作验证[7]。例如,有来自全球范围的39名专家参与了1 km分辨率全球地表覆盖数据产品IGBP-DISCover的验证[1],16名专家参与了全球地表覆盖数据产品GlobCover2005全球验证[8],分别承担抽样、参考数据提供、影像解译分析、精度评估、数据误差分析等不同任务。

    为了有效地组织大范围地表覆盖数据的协同验证,需要制定和遵循统一的验证技术规范,还要采用适宜的工具手段,以提高协同效率与水平。以往地表覆盖数据验证主要是使用单机或离线工具,如商业化遥感图像处理软件ERDAS的精度评价模块,其提供了随机生成或添加样本点、设置参考信息等功能,可获得生产者精度、用户精度、总体精度、Kappa系数等指标及生成精度评价报告,但不能支持网络化环境下的跨地域协同验证。近年来,人们将互联网技术用于地表覆盖验证,发展了基于Web的地表覆盖样本采集系统VIEW-IT(virtual interpretation of earth web-interface tool)[9]、基于网络地理标记文本的样本信息自动搜索等方法或工具[10]。最近,奥地利国际系统研究所研发了LACO-Wiki(http://laco-wiki.net/),供志愿者上传样本数据和进行单点精度评价等,但尚不能支持检验样本的抽样布设、验证信息的资源共享以及参与人员之间的信息交互等分析[11]

    2016年初,国家基础地理信息中心和对地观测组织(Group of Earth Observation, GEO)联合组织了面向全球30 m地表覆盖数据产品的国际验证活动。与以往较粗分辨率(250 m~1 km)地表覆盖数据产品相比,30 m空间分辨率地表覆盖在全球范围内表现出了极强的空间异质性,对验证方法、工具手段均提出了诸多挑战。在国家国际科技合作项目和国家自然科学基金项目的支持下,笔者团队与国内外专家合作,研究提出了顾及地表异质性的样本自适应抽样等系列技术方法,制定了全球30 m地表覆盖验证技术规范。与此同时,借鉴互联网+思路,设计了地表覆盖验证服务模型,研发了在线验证系统,为全球30 m地表覆盖数据的国际协同验证提供了先进工具。

    • 全球大范围地表覆盖协同验证具有地域性分工和工序性协作两个特点。前者是指把全球划分为若干地理范围,由来自世界各地的不同专家分工负责,进行参考信息采集、一致性比对、结果汇交等;后者是指在样本布设、参考信息集成、类型一致性比对、精度计算分析等不同验证阶段,分别由具有经验或特长的抽样专家、采集人员(含专业人员和志愿者)、检核专家、评价专家等承担,并共享原始信息和中间成果。这对验证全过程的信息有序传递、数据共享服务和在线协同处理提出了很高的要求。而近年来迅速发展的互联网+是将互联网技术与特定领域业务(或应用)深度融合,以信息互联互通和资源开发利用为核心,实现数字化驱动、网络化协同、个性化定制和智能化生产[12-14]。借鉴这一思路,本文设计提出了互联网+地表覆盖验证服务模型,构建了一套面向互联网+的地表覆盖验证业务流程和方法。

    • 地表覆盖验证服务模型是利用计算机服务计算技术[15],将地表覆盖验证所涉及的业务数据和处理方法(或算法)封装成可通过互联网直接调用的Web服务,实现验证信息资源的互联互通与共享利用,提供在线服务计算,支撑跨地域和工序性的在线协作处理。

      从在线服务计算的角度出发,地表覆盖验证服务模型是以信息数据和模型-算法的Web服务发布为基础,由参与对象、内容服务及交互消息3方面组成[16]

      1) 参与对象包括服务发布者、服务使用者和服务管理者。其中,服务使用者又可以细分为抽样专家、验证信息提供专家、检核专家和评价专家等4类参与者,在不同的验证环节承担各自的任务。

      2) 内容服务是为服务使用者提供地表覆盖验证的各种数据服务和算法服务,为实现地表覆盖验证的在线计算提供计算资源(数据)和计算手段。其中,数据服务包括分类数据、地图底图数据、分类影像、参考地表覆盖分类数据、样本数据等服务,算法服务包括样本抽样、样本检核、精度评价等服务[17]。服务使用者可通过调用算法服务的接口,使用相应的数据服务进行计算,以得到不同验证环节的计算结果。

      3) 交互消息是参与对象与内容服务之间请求与响应的传递载体,可针对不同消息类型(如影像、矢量、文本等),由相应数据结构(如JPG、JSON、XML等)和数据内容(如验证照片、样本点、精度评价结果等)构建。

      从互联网+的概念出发,地表覆盖验证服务模型中的参与对象、内容服务和交互消息为互联网+地表覆盖验证的操作协同和信息流转提供了基础,但是并不能形成完整的互联网+业务,还需要通过一定的交互操作(即人机交互功能)在算法服务间进行串联。

      4) 交互操作是服务使用者为算法服务选择输入,并对数据服务和算法服务的计算结果进行操作的过程,包括选择验证区域、输入置信区间、选择参考信息、一致性对比、输入验证信息等。

      基于上述思路,本文提出了基于4层结构的互联网+地表覆盖验证服务模型,见图 1

      图  1  互联网+地表覆盖验证服务模型

      Figure 1.  Service Model for Land Cover Data Validation Based on Internet+

    • 基于互联网+地表覆盖验证服务模型,可构建地表覆盖验证业务流程。值得说明的是,不同的专家可能参与验证的一个环节,也可能参与验证的多个环节。这就可以充分利用互联网在交互性和协同性方面的优势,不仅使得多个服务使用者可以共同参与一个验证任务,而且可以通过不同验证环节的灵活组合构建多种验证流程。因此可以说,互联网+地表覆盖验证服务模型在一定程度上改变了传统地表覆盖验证方式,形成了全新的交互关系和协同模式。

      基于上述分析,各类用户(参与者)可借助于发布/订阅(Publish/Subscribe)技术[18],根据其角色和职责实现协同处理。如图 2所示,具体可实现的协同验证业务流程包括如下4种。

      图  2  互联网+地表覆盖验证协同处理业务流程图

      Figure 2.  Collaborative Work-Process for Internet+-Based Land Cover Data Validation

      1) 由服务管理者发起验证任务,选择验证区域并推送给抽样专家,验证信息提供者。

      2) 抽样专家输入置信区间, 选择抽样算法服务,并将抽样结果发布为样本数据服务,推送给检核专家。

      3) 检核专家根据参考地表覆盖分类数据服务,并通过选择参考信息、一致性对比等操作,检核样本点的属性信息,推送给评价专家。

      4) 评价专家计算精度评价指标,分析数据误差分布与来源,并将结果推送给服务管理者,结束任务。

    • 样本抽样是互联网+地表覆盖验证的首要技术环节,一般应符合概率抽样、均衡布设、区域/地类样本量充足、成本可控等基本原则[19-21]。但传统抽样方法难以有效顾及大范围地表覆盖的空间异质性,带来区域样本量不合理、稀少类样本量不足、样本空间分布不均衡等诸多问题[22-23],且较少考虑互联网环境下的计算时间和计算成本。笔者团队提出了一种顾及地表覆盖空间异质性的自适应抽样方法,通过计算验证区域、区内地类和抽样单元3个层级的景观形状指数(landscape shape index,LSI), 推导出基于区域级景观形状指数(region LSI,rLSI)及面积的区域样本量解析计算公式, 建立了顾及地类级景观形状指数(class LSI,cLSI)的样本量内曼分配公式, 提出了基于单元级景观形状指数(unit LSI,uLSI)曲线的样点抽取方法(如图 3所示), 为科学地确定样本数量及空间分布提供了解决方案[24]。为了实现高效的实时在线计算,采用离线、在线相结合的模式。

      图  3  在线LSI抽样算法

      Figure 3.  Online Sampling Algorithm Based on LSI

    • 基于景观形状指数计算验证区域的样本量,第i个验证区域的样本量Ni受其面积大小Ai、rLSIi的共同影响。

      $$ {N_i} = N \times \frac{{{\rm{rLS}}{{\rm{I}}_i} \times {A_i}}}{{\sum\limits_{i = 1}^n {{\rm{rLS}}{{\rm{I}}_i} \times {A_i}} }}, i = 1, 2 \cdots n $$ (1)

      然而,rLSI是根据验证区域内地类的边长、面积得出的,统计每一地类的边长与面积需要遍历所有像素,花费时间较多,难以实现高效计算。针对这一问题,在全球范围内离线统计各国、各省的rLSI与面积,构建全球区域景观形状指数数据库,当用户请求时,直接检索、匹配相应区域的rLSI与面积,减少计算用时,为高效、实时的在线样本量计算提供数据支持。

    • 研究表明,样本量在地类间进行分配时,需同时顾及稀少类与异质地类,第i个验证区域内k地类的样本量cNi, k与其面积比例Wi, k和cLSIi, k直接相关。

      $$ c{N_{i, k}} = {N_i} \times \frac{{{\rm{cLS}}{{\rm{I}}_{i, k}} \times {W_{i, k}}}}{{\sum\limits_{t = 1}^m {{\rm{cLS}}{{\rm{I}}_{i, k}} \times {W_{i, k}}} }}, k = 1, 2 \cdots m $$ (2)

      然而,大范围地表覆盖验证中,稀少类别的数量往往因地而异,在区域样本量较小的情况下,偶尔还是会造成稀少类的样本量不足。因此,引入顾及稀少类的Power降幂指数a,当稀少类样本量不足时,降低地类面积的权重,满足稀少类样本量充足的需求。Power降幂指数a介于0与1之间,若a=1,稀少类样本量充足,则终止计算;若稀少类样本量不足,逐步降低a的数值,直至稀少类样本量充足为止。

      $$ c{N_{i, k}} = {N_i} \times \frac{{{\rm{cLS}}{{\rm{I}}_{i, k}} \times W_{i, k}^a}}{{\sum\limits_{t = 1}^m {{\rm{cLS}}{{\rm{I}}_{i, k}} \times W_{i, k}^a} }}, k = 1, 2 \cdots m $$ (3)

      降幂指数a的大小与验证区域内稀少类多少、区域样本量大小相关。为了能自适应地计算降幂指数a,采用迭代法,从高到低迭代不同大小的a,从而得到多组地类样本量分配结果,从中选取合适的Power降幂指数与地类样本量。

    • 为使样本的空间分布顾及破碎地带,采用抽样单元级景观形状指数uLSI布设样本。其方法是为每一地类构建uLSI空间,在异质性强度空间上等间隔布样,使样本分布既可以顾及破碎地带,又不会忽视均质地区。为了提高布设的效率,离线构建全球抽样uLSI数据库。在全球范围内划分抽样单元,统计每一单元内各地类的边长与面积,导入uLSI数据库。依据用户请求的验证区域调用相应的uLSI数据,继而构建异质性强度空间,等间隔布设样本。

    • 根据前述研究,设计研发了地表覆盖在线验证系统GLCVal(global land cover validation, http://glcval.geo-compass.com/)。它是面向全球30 m地表覆盖验证的实际需求,提供样本布设、交互检核和精度评价等在线处理功能,实现多源参考资源互联互通、自适应抽样计算、多角色专家参与、抽样样本数据共享、样本检核结果共享,为地表覆盖数据协同验证提供支撑。图 4给出了该系统的总体架构。

      图  4  GLCVal总体架构

      Figure 4.  Main Framework of GLCVal Platform

      1) 主要功能

      系统是根据数据验证的主要技术流程,支持样本总量估算与类间分配、样本空间布设, 并实现了与多种在线参考资料的联通,方便专家和志愿者查找和调用参考信息、上传样本信息和在线标注错误信息等。

      2) 使用流程

      使用在线验证系统GLCVal的验证流程为:选择验证数据→选择验证区域→设置抽样参数并布设样本→样本检核→精度评价,实现包括样本量估算、空间布设、网络验证信息整合、专家判别及信息管理、样本库管理、在线错误信息标报、精度计算及报告生成等在内的多项功能。其界面设计如图 5所示。

      图  5  在线验证系统界面图

      Figure 5.  Interface of Online Validation System

    • GlobeLand30是中国自主研制的全球地表覆盖数据产品,空间分辨率为30 m,有2000年和2010年两个年份[25-26]。由于其所涉地域范围广袤,景观复杂多样,样本布设、参考信息采集及一致性判定的任务艰巨、工作量大,因此组织和发动了多个GEO成员国、UN-GGIM(the united Nations Initiative on Global Geospatial Information Management)、CO-DATA等组织,联合开展GlobeLand30的全球验证工作。

    • 受条件所限,中国以往极少系统地采集境外地表覆盖样本资料,掌握的境外遥感验证资源较少。通过GlobeLand30的联合验证,对于所采集的有效验证样本点,按照GLCVal设计的元数据属性进行标准化处理,并录入GLCVal系统,实现了样本资源的集成管理,为建设全球地表覆盖样本资源库打下了基础。至今,共计采集了非洲、欧洲、美洲等多个大陆共计4 000余条检验样本信息。

    • 针对全球地表覆盖数据验证具有的大尺度、验证资料数量众多、验证手段多样的特点,开展了典型地区的GlobeLand30的验证及精度分析。已有非洲10国、欧洲5国、美洲2国等共计十多个国家完成了典型区域的精度评价,总体精度在80%以上。其中,南非农村发展与土地改革委员会的Luncedo Ngcofe博士及其团队在南非全境开展了验证工作,反馈500个多级检验样本点,总体精度达83.4%。此外,非洲区域制图与发展中心组织了博茨瓦纳、纳米比亚、卢旺达、坦桑尼亚、乌干达、莱索托、马拉维、埃塞俄比亚、赞比亚等多个国家收集检验样本点信息,除卢旺达(77%)以外,其余国家总体精度都能达到80%及以上,最高的精度达到91%(纳米比亚)。

    • 本文将互联网+、服务技术等用于地表覆盖验证业务,提出了互联网+全球地表覆盖验证服务模型、在线计算方法,开发了在线验证系统GLCVal,为大范围、高分辨率地表覆盖数据验证提供了新思路、新方法,支持开展了GlobeLand30的全球验证。研究与应用实践表明,互联网+地表覆盖验证改变了传统的业务模式,支持了跨区域专家主动参与、多角色协同验证;促进了验证资源联通,加速了数据流动,推动了验证资源共享使用。此外,样本布设、参考数据采集、样本属性检核、精度评价均能在同一界面下自动化计算,有效提高验证效率。今后,将继续研究互联网+地表覆盖领域服务计算的模型与方法,并将互联网+地表覆盖验证业务与深层网络服务搜索、志愿者标报等技术有机结合,实现多源泛在参考信息的动态集成,提高用户的参与度和交互性。

参考文献 (26)

目录

    /

    返回文章
    返回