留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

多源空间矢量数据可用性评估方法设计

陈换新 孙群 李少梅 马超

陈换新, 孙群, 李少梅, 马超. 多源空间矢量数据可用性评估方法设计[J]. 武汉大学学报 ● 信息科学版, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374
引用本文: 陈换新, 孙群, 李少梅, 马超. 多源空间矢量数据可用性评估方法设计[J]. 武汉大学学报 ● 信息科学版, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374
CHEN Huanxin, SUN Qun, LI Shaomei, MA Chao. Design of Evaluating Method for Multi-source Spatial Vector Data Usability[J]. Geomatics and Information Science of Wuhan University, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374
Citation: CHEN Huanxin, SUN Qun, LI Shaomei, MA Chao. Design of Evaluating Method for Multi-source Spatial Vector Data Usability[J]. Geomatics and Information Science of Wuhan University, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374

多源空间矢量数据可用性评估方法设计

doi: 10.13203/j.whugis20140374
基金项目: 

国家863计划 2012AA12A404

国家自然科学基金 41201391

国家自然科学基金 41071297

国家自然科学基金 41201469

地理信息工程国家重点实验室开放基金 SKLGIE2013-Z-4-1

地理信息工程国家重点实验室开放基金 SKLGIE2013-M-4-5

详细信息
    作者简介:

    陈换新, 博士, 研究方向为数字制图与空间数据融合。chx1557@163.com

  • 中图分类号: P208

Design of Evaluating Method for Multi-source Spatial Vector Data Usability

Funds: 

The National 863 Program of China 2012AA12A404

the National Natural Science Foundation of China 41201391

the National Natural Science Foundation of China 41071297

the National Natural Science Foundation of China 41201469

the Open Fund of State Key Laboratory of Geographic Information Engineering SKLGIE2013-Z-4-1

the Open Fund of State Key Laboratory of Geographic Information Engineering SKLGIE2013-M-4-5

More Information
    Author Bio:

    CHEN Huanxin, PhD, specializes in digital map making and spatial data integration. E-mail:chx1557@163.com

  • 摘要: 随着空间数据获取手段的进步和数据质量研究的深化,考虑用户需求、辅助数据使用决策的空间数据可用性评估研究开始受到关注。在阐述空间数据可用性概念和介绍代表性研究方法的基础上,考虑不同的因素对现有方法进行了比较分析。针对现有方法的缺陷,设计了多源空间矢量数据可用性评估的方法,并阐述了其中的关键环节和解决方案。
  • 图  1  空间数据研究的发展历程

    Figure  1.  Course of Spatial Data Study

    图  2  多源空间矢量数据可用性评估流程图

    Figure  2.  Flowchart of Vector Data Usability Evaluation

    图  3  多源空间数据集成处理的技术流程图

    Figure  3.  Technical Flowchart of Data Integration

    图  4  空间矢量数据源可用性度量评估方案

    Figure  4.  Evaluating Scheme of Vector Data Usability

    图  5  可用性评估结果的可视化表达

    Figure  5.  Visualization of Usability Evaluating Result

    表  1  现有方法考虑因素统计表

    Table  1.   Considering Factors of Existing Methods

    方法 因素
    元数据 专家决策 软件辅助
    基于元数据
    专家决策分析
    风险评估管理
    语义解译分析
    GIS功能拓展
    下载: 导出CSV
  • [1] 华一新, 吴升, 赵军喜.地理信息系统原理与技术[M].北京:解放军出版社, 2001

    Hua Yixin, Wu Sheng, Zhao Junxi. Principle and Technology of Geographical Information System[M]. Beijing:PLA Press, 2001
    [2] 李志林.空间数据的关注问题:从质量到可用性[J].地理信息世界, 2006(3):14-17 http://www.cnki.com.cn/Article/CJFDTOTAL-CHRK200603003.htm

    Li Zhilin. Concerns with Spatial Data:From Quality to Usability[J]. Geomatics World, 2006(3):14-17 http://www.cnki.com.cn/Article/CJFDTOTAL-CHRK200603003.htm
    [3] Shneiderman B, Plaisam C. Designing the User Interface:Stralegies for Effective Human-Computer Interaction[M]. New York:Addison Wesley, 2004
    [4] 李响, 华一新, 王双, 等.通过模式语言研究GIS用户界面[J].中国图象图形学报, 2010, 15(7):1014-1022 doi:  10.11834/jig.090330

    Li Xiang, Hua Yixin, Wang Shuang. The Research of Pattern Language For GIS User Interface[J]. Journal of Image and Graphics, 2010, 15(7):1014-1022 doi:  10.11834/jig.090330
    [5] 凌云, 陈毓芬, 王英杰.基于用户认知特征的地图可视化系统自适应用户界面研究[J].测绘学报, 2005, 34(3):277-282 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB200503016.htm

    Ling Yun, Chen Yufen, Wang Yingjie. Cognitive Basis of Adaptive User Interface for Catographic Visualization System[J]. Acta Geodaetica et Cartographica Sinica, 2005, 34(3):277-282 http://www.cnki.com.cn/Article/CJFDTOTAL-CHXB200503016.htm
    [6] 李响. 网络地图可用性工程研究[D]. 郑州: 信息工程大学, 2011

    Li Xiang. Research on Web Map Usability Engineering[D]. Zhengzhou:Information Engineering University, 2011
    [7] 孟立秋.地图学和地图何去何从[J].测绘科学技术学报, 2013, 30(4):334-342 http://www.cnki.com.cn/Article/CJFDTOTAL-JFJC201304003.htm

    Meng Liqiu. Cartography and Maps:Where to Go[J]. Journal of Geomatics Science and Technology, 2013, 30(4):334-342 http://www.cnki.com.cn/Article/CJFDTOTAL-JFJC201304003.htm
    [8] Devillers R, Beard K. Communication and Use of Spatial Data Quality Information in GIS[M]. New York:ISTE Press, 2006
    [9] Devillers R, Bédard Y, Jeansoulin R, et al. Towards Spatial Data Quality Information Analysis Tools for Experts Assessing the Fitness for Use of Spatial Data[J]. International Journal of Geographical Information Sciences, 2007, 21(3):261-282 doi:  10.1080/13658810600911879
    [10] Bédard Y, Normand P, Larrivée S. Modélisation des Contraintes d'intégrité Spatiale[R]. Quebec Ministry of Natural Resources, Canada, 1998
    [11] Bejaoui L, Bédard Y. Logical Consistency of Vague Spatio-Temporal Objects and Relations[C]. The 5th International Symposium on Spatial Data Quality, Enschede, the Netherlands, 2007
    [12] Levesque M A, Bédard Y, Gervais M, et al. Towards a Safer Use of Spatial Datacubes:Communicating Warnings to Users[C]. International Symposium on Spatial Data Quality, Enschede, the Netherlands, 2007
    [13] Guemeida M, Jeansoulin R, Salzano G. Quality-Aware Metadata-Based Mediator for Environmental Information[C]. International Symposium on Spatial Data Quality, Enschede, the Netherlands, 2007
    [14] Wachowicz M, Hunter G. Spatial Data Usability[J]. Data Science Journal (Spatial Data Usability Special Section), 2003, 2(26):75-78 doi:  10.2481/dsj.2.75
    [15] 陈换新, 孙群, 肖强, 等.空间数据融合技术在空间数据生产及更新中的应用[J].武汉大学学报·信息科学版, 2014, 39(1):117-121 http://ch.whu.edu.cn/CN/abstract/abstract2865.shtml

    Chen Huanxin, Sun Qun, Xiao Qiang, et al. Application of Spatial Data Fusion in the Production and Updating of Spatial Data[J]. Geomatics and Information Science of Wuhan University, 2014, 39(1):117-121 http://ch.whu.edu.cn/CN/abstract/abstract2865.shtml
    [16] 史文中, 刘春, 刘大杰.基于一般抽样原理的GIS属性数据质量评定方法[J].武汉大学学报·信息科学版, 2002, 27(5):445-450 http://ch.whu.edu.cn/CN/abstract/abstract4989.shtml

    Shi Wenzhong, Liu Chun, Liu Dajie. Quality Assessment for Attribute Data in GIS Based on Simple Random Sampling[J]. Geomatics and Information Science of Wuhan University, 2002, 27(5):445-450 http://ch.whu.edu.cn/CN/abstract/abstract4989.shtml
    [17] Thomas J J, Cook K K A. A Visual Analytics Agenda[J]. IEEE Transaction on Computer Graphics and Applications, 2006, 26(1):10-16 doi:  10.1109/MCG.2006.5
  • [1] 潘少明, 赖新果, 种衍文, 李红.  用户访问驱动的空间数据存储组织策略 . 武汉大学学报 ● 信息科学版, 2019, 44(2): 296-301, 309. doi: 10.13203/j.whugis20170019
    [2] 李军利, 何宗宜, 朱乔利, 刘亚虹.  一种粒化理论的地理本体融合方法 . 武汉大学学报 ● 信息科学版, 2013, 38(4): 489-492.
    [3] 潘少明, 徐正全, 刘小俊.  空间数据访问规律的动态统计算法 . 武汉大学学报 ● 信息科学版, 2013, 38(6): 734-736.
    [4] 高为广, 苏牡丹, 李军正, 胡志刚.  北斗卫星导航系统试运行服务性能评估 . 武汉大学学报 ● 信息科学版, 2012, 37(11): 1352-1355.
    [5] 喻占武, 郑胜, 李忠民, 胡滨.  基于对象存储的海量空间数据存储与管理 . 武汉大学学报 ● 信息科学版, 2008, 33(5): 528-532.
    [6] 彭三城, 贾维嘉, 王国军.  移动自组网中抗毁性定量评估模型 . 武汉大学学报 ● 信息科学版, 2008, 33(10): 1095-1098.
    [7] 张东, 刘爱龙, 杨学伟, 陈涛.  车辆导航路径规划中道路可用性研究 . 武汉大学学报 ● 信息科学版, 2007, 32(5): 462-465.
    [8] 胡春春, 孟令奎, 谢文君, 周新忠.  空间数据模糊聚类的有效性评价 . 武汉大学学报 ● 信息科学版, 2007, 32(8): 740-743.
    [9] 朱庆, 周艳.  分布式空间数据存储对象 . 武汉大学学报 ● 信息科学版, 2006, 31(5): 391-394.
    [10] 史玉峰, 史文中, 靳奉祥.  GIS中空间数据不确定性的混合熵模型研究 . 武汉大学学报 ● 信息科学版, 2006, 31(1): 82-85.
    [11] 高劲松, 张文, 关泽群, 邓世军.  基于虚拟SAN的网格GIS数据存储技术研究 . 武汉大学学报 ● 信息科学版, 2005, 30(3): 214-217.
    [12] 刘春, 史文中, 刘大杰.  GIS空间数据面元与线元不确定性的关系 . 武汉大学学报 ● 信息科学版, 2005, 30(1): 65-68.
    [13] 胡鹏, 李圣权, 亢江妹.  空间数据问题与GIS发展的思考 . 武汉大学学报 ● 信息科学版, 2005, 30(9): 796-800.
    [14] 黎展荣, 杨如军, 周新忠.  关系数据库管理空间数据的方式下数据查询方法的研究 . 武汉大学学报 ● 信息科学版, 2005, 30(12): 1104-1106.
    [15] 吴凡.  基于小波分析的线状特征数据无级表达 . 武汉大学学报 ● 信息科学版, 2004, 29(6): 488-491.
    [16] 朱庆, 陈松林, 黄铎.  关于空间数据质量标准的若干问题 . 武汉大学学报 ● 信息科学版, 2004, 29(10): 863-867.
    [17] 朱欣焰, 龚健雅, 黄俊韬, 熊汉江.  GeoStar空间数据组织与管理 . 武汉大学学报 ● 信息科学版, 2000, 25(2): 122-126.
    [18] 詹庆明, 黄正东, 吴军.  空间OLE/ActiveX控件的生成与应用 . 武汉大学学报 ● 信息科学版, 1999, 24(3): 272-275.
    [19] 李霖.  空间数据库查询语言的特征 . 武汉大学学报 ● 信息科学版, 1997, 22(2): 107-110.
    [20] 张巍, 许云涛, 龚健雅.  面向对象的空间数据模型 . 武汉大学学报 ● 信息科学版, 1995, 20(1): 18-22.
  • 加载中
图(5) / 表(1)
计量
  • 文章访问数:  1111
  • HTML全文浏览量:  62
  • PDF下载量:  436
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-07-04
  • 刊出日期:  2017-05-05

多源空间矢量数据可用性评估方法设计

doi: 10.13203/j.whugis20140374
    基金项目:

    国家863计划 2012AA12A404

    国家自然科学基金 41201391

    国家自然科学基金 41071297

    国家自然科学基金 41201469

    地理信息工程国家重点实验室开放基金 SKLGIE2013-Z-4-1

    地理信息工程国家重点实验室开放基金 SKLGIE2013-M-4-5

    作者简介:

    陈换新, 博士, 研究方向为数字制图与空间数据融合。chx1557@163.com

  • 中图分类号: P208

摘要: 随着空间数据获取手段的进步和数据质量研究的深化,考虑用户需求、辅助数据使用决策的空间数据可用性评估研究开始受到关注。在阐述空间数据可用性概念和介绍代表性研究方法的基础上,考虑不同的因素对现有方法进行了比较分析。针对现有方法的缺陷,设计了多源空间矢量数据可用性评估的方法,并阐述了其中的关键环节和解决方案。

English Abstract

陈换新, 孙群, 李少梅, 马超. 多源空间矢量数据可用性评估方法设计[J]. 武汉大学学报 ● 信息科学版, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374
引用本文: 陈换新, 孙群, 李少梅, 马超. 多源空间矢量数据可用性评估方法设计[J]. 武汉大学学报 ● 信息科学版, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374
CHEN Huanxin, SUN Qun, LI Shaomei, MA Chao. Design of Evaluating Method for Multi-source Spatial Vector Data Usability[J]. Geomatics and Information Science of Wuhan University, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374
Citation: CHEN Huanxin, SUN Qun, LI Shaomei, MA Chao. Design of Evaluating Method for Multi-source Spatial Vector Data Usability[J]. Geomatics and Information Science of Wuhan University, 2017, 42(5): 676-682. doi: 10.13203/j.whugis20140374
  • 空间数据是地理信息系统的血液[1],在地理信息类项目中其开销占到总投入的80%[2]。因此空间数据的相关研究一直以来备受关注。随着空间探测技术的发展和数据获取手段的进步,空间数据产品日益丰富、成果质量不断提高、数据量爆炸式增长,但与之形成鲜明对比的是空间数据使用的相关研究严重滞后和方法工具的匮乏。空间数据的研究应结合用户需求考虑可用性问题。本文在追溯空间数据研究历程及相互关联、列举分析现有可用性研究方法的基础上,设计了多源空间数据可用性评估方法。

    从空间数据的出现及使用的角度而言,其相关研究大体经历了4个发展阶段,如图 1所示:(1) 第一阶段 (20世纪60年代),地理信息系统 (geographic information system, GIS) 的出现需要空间数据维持运转,大量的人力物力投入到空间数据生产及相关研究中;(2) 第二阶段 (20世纪70年代),为保证GIS处理分析结果的可靠,空间数据的质量与精度分析开始受到关注;(3) 第三阶段 (20世纪80年代),除了继续从误差的角度研究数据质量外,含义更为广泛的不确定性被提出;(4) 第四阶段 (20世纪90年代),在引入新技术深化空间数据不确定性研究的同时,空间数据可用性研究开始兴起。可用性的概念最早诞生于工业领域,主要用于检验工业产品的市场竞争能力[3]。信息时代的到来和迅猛发展使得可用性的概念渗透到信息产业,并由最初的软件开发、交互界面设计[4-5]及可视化传输[6]等方面逐渐拓展到空间数据领域。空间数据可用性是用户在使用某种方法工具实现特定目标的过程中空间数据具备的有用程度。

    图  1  空间数据研究的发展历程

    Figure 1.  Course of Spatial Data Study

    从研究对象来讲,空间数据质量及不确定性研究是一脉相承的,都是基于空间数据本身进行控制误差、保证数据质量的研究,而可用性研究则突破了空间数据本身,增加了用户角色,从用户需求出发考虑数据是否可用、可用程度如何。从研究的层次阶段来说,不确定性是传统数据质量研究的发展,而空间数据可用性则是在各种数据产品极大丰富,且经过了质量门槛后,考虑用户因素解决数据选择和使用方面的问题,属于空间数据应用领域的研究,是对传统研究的一种延拓。故空间数据可用性研究是空间数据本身及其相关研究发展到一定阶段的产物,离不开已有研究的支撑。

    空间数据可用性研究在促进数据使用的同时也会对其他研究产生一定的影响:

    1) 对空间数据生产的影响。常规的空间数据生产及更新应该由“面向覆盖”向“面向要素”转移[7],在满足几何无缝全覆盖的基础上,根据用户的关注需求提供不同要素、不同频率更新的空间数据。目前考虑数据可用性的生产模式已经出现,例如瑞士开始按照用户的需求提供某层要素数据或参考底图,追求可用性。

    2) 对质量和不确定性研究的影响。现阶段空间数据质量和不确定性研究主要限定于整个空间数据生产使用的中下游环节,可用性研究则要求从现有静态研究向动态模拟延伸发展,向前拓展向后延伸。就向前拓展而言,传感器和互联网的发展已经具备了实时、不间断地获取并传输发生改变地理实体信息的能力,但是现实世界中瞬时变化的事物不仅数据量大,而且来源、格式、结构等方面复杂多样,需要建立对多源数据,特别是日益增长的志愿者地理信息 (volunteered geographic information,VGI) 的质量控制和评估机制,在多源、异构、海量的数据中提取出有用、可靠的数据,消除数据输入时的“噪音”;就向后延伸而言,质量和不确定性研究不应随着数据产品的问世而终止,应向数据的使用延伸发展,例如通过误差及不确定性的传播与控制对特定类型操作结果的误差或不确定性做出风险评估,辅助用户决策。

    • 多源空间数据包括栅格数据和矢量数据两大类。栅格数据主要包括遥感影像、航空相片、数字高程模型等,矢量数据主要包括基础数据、专题数据等。本文中的多源空间矢量数据专指来源广泛、异质异构的各种矢量数据,包括各种系列比例尺的地形图数据、航空图数据、航海图数据、车载GPS数据、不同行业的专题数据等。由于矢量数据是空间分析的基础,且较讲求分辨率、时效性的栅格数据而言,矢量数据的可用性评估更为复杂,本文主要对此进行介绍。

    • 虽然空间数据可用性概念提出的时间不长,但长期以来用户在制定数据使用决策之前,都会对已有矢量数据的可用程度进行一定评估,代表性的评估方法有以下几种。

      1) 基于元数据的方法。元数据是由数据生产者提供的描述数据产品相关信息的一个记录,其中既包含比例尺、坐标范围等方面的定量描述,也包括生产单位、数据来源等方面的定性描述。元数据既是数据生产者方便产品管理的技术文档,又是用户了解数据的重要方式,其简洁直观的特性被用户广泛使用。随着元数据内容的不断丰富,在传统参考阅读的基础上又发展出了几种基于元数据的评估方法:(1) 元数据的可视化。早期采用制图的方式使用不同的颜色或符号来表现数据的品质[8]。文献[9]结合可视化与决策支持两项技术,将现有元数据集成到多维数据库中,并按照元数据描述层次 (数据集、要素类、要素实例) 加以组织管理,使得用户通过GIS界面浏览不同层次的细节描述。(2) 元数据的空间完整性约束。按照一定的规范提供元数据,保证元数据文档内容和数据本身的一致性,从而更好地评估和维护数据。代表性的研究有文献[10]综合使用半结构化的自然语言和ISO的e-相关矩阵建立了描述空间数据库完整性约束的原型,文献[11]通过设计模糊空间完整性约束来获取更加丰富的质量信息。

      2) 专家决策分析的方法。地理信息领域的专家通过人工参与的方式,凭借专业知识和经验对资料来源、数据内容的详细程度、准确性、可靠性等方面进行分析,在摸清空间数据情况的基础上结合任务需求为用户提供数据使用建议。这种方式对专家在内的分析人员要求较高,例如在法国,专家 (审核员) 需要依照国家相关行业的法律规定,遵从严格的注册条例并承担相应的责任,提供数据使用辅助决策书。

      3) 风险评估管理。收集专家对地理空间数据使用的潜在风险评估,经规范化整理后加以记录存储。类似的方法还有文献[12]提出的风险管理模型,在数据库的生成阶段识别地理空间数据使用的潜在风险,并将其嵌入到制图软件中告知用户。风险评估管理的方法便于用户在使用前了解数据及相关风险,制定最佳的使用策略来规避、减少风险,或在接受风险的基础上预先制定相关处理方案。

      4) 语义解译分析。文献[13]提出的解译分析器类似于语义网,用来解释用户关于数据选择、重构等方面的需求,由用户触发,在数据源和用户间广泛使用中间件调节的模式,将用户需求转译为计算机识别的语言。目前,许多研究者致力于将用户需求转译为地理信息、元数据、地图服务等开放地理空间信息联盟 (Open Geospatial Consortium, OGC) 网络服务架构能够识别处理的工作。此外,文献[14]提出了能够动态自动融合分布式元数据及地理空间服务的模型,帮助用户摆脱复杂的预处理,增强空间数据的可用性。

      5) GIS功能拓展。将空间数据质量或不确定性信息嵌入到现有GIS系统中,在用户操作数据时GIS能够预先提供相应的不确定性评估或错误警告。其中,搞清误差或不确定性在特定GIS操作及空间分析中的传播机制是关键,这样才能将存储在元数据中的空间数据描述信息与GIS功能操作相结合,帮助用户在预知数据使用效果的基础上制定最佳使用策略。

    • 现有可用性研究方法在不同程度上帮助用户了解数据的品质,改善空间数据的使用。但不同方法的实现途径、侧重内容不同,从体现专家决策、依赖元数据、软件辅助的因素出发,现有方法的表现如表 1所示。

      表 1  现有方法考虑因素统计表

      Table 1.  Considering Factors of Existing Methods

      方法 因素
      元数据 专家决策 软件辅助
      基于元数据
      专家决策分析
      风险评估管理
      语义解译分析
      GIS功能拓展

      通过分析可以发现现有方法的缺陷有:

      1) 表 1所列的方法中有3项依赖元数据或与之相关,这意味着大多数方法使用的前提是拥有可靠、完备的元数据。但现有元数据的情况并不理想:一方面,缺乏统一的标准规定和相关法律的约束,许多数据生产者出于简化环节生产、降低成本等因素,提供的元数据中信息缺失及不完整现象普遍存在;另一方面,不同的生产者采用不同的方式设计元数据,描述的格式、内容都不统一。为改变上述状况,以国际标准化组织 (International Organization for Standardization, ISO) 为代表的国际组织希望通过元数据的标准化举措,用统一的格式代替以往自由的描述形式,便于不同系统间的相互交流。但实际收效却使问题进一步恶化:由于建立符合ISO标准的元数据过程复杂且投入成本较高,数据生产者索性不予采纳,因此导致元数据的标准化得不到很好的落实。可见依赖元数据的方法受限于元数据本身的具体情况,使用范围有限。

      2) 将“专家决策”与“软件辅助”两列对比可发现二者不同时使用。专家决策方法依赖于地理信息领域的空间数据专家,在和用户的直接交流下,根据用户需求有的放矢地提供决策建议,保证用户获得科学专业的建议。但由于执行过程大都基于人工参与,自动化程度及效率不高。软件辅助决策的方法主要依靠一定的算法对既定的评估指标内容进行分析,统计计算能力较强,执行效率较高且比较客观,但是用户参与程度不如传统人工方法。总之两种方法各有优势,可以互为补充加以使用。

      3) 几乎没有方法专门针对多源矢量数据的可用性评估,仅专家决策的方法可以对不同数据进行横向比较。不可否认的是,不同数据出于不同的用途需要在地理要素的选取、表达等方面存在诸多差异,虽然它们都通过了各自质量标准的检验并入库,但这些差异导致用户在面对多种数据选择时无从下手,不知选择哪种合适。因此,多源数据的可用性评估有着强烈的现实需求,对多源矢量数据的可用性评估方法亟待深入的研究。此外,将可用性评估的结果以适当的方式展现给用户是评估的最终目的,但现有方法对结果显示的关注较少,同样需要加强。

    • 在梳理现有方法缺点的基础上,本文设计了多源空间矢量数据可用性评估方法,设计遵循的原则有:(1) 充分体现可用性及可用性工程的思想,以用户为中心,考虑用户需求并以此为驱动明确数据可用性的评估内容;(2) 以多源异构的空间矢量数据源为评估对象,弥补现有方法对该方面评估的不足;(3) 降低对元数据的依赖,扩大评估方法适用范围。元数据不是弃之不用,而是用于引证参考,但不再是唯一途径;(4) 将专家决策与软件辅助的方式相结合,使得新方法既拥有专家决策的科学性、宏观性,又具备软件的客观、高效性;(5) 注重“可视化”环节,将可用性评估结果以形象直观、易于理解的形式提供给用户。

    • 根据上述原则,本文设计的多源空间矢量数据可用性评估方法总体流程如图 2所示。首先,建立以用户为中心的评估指标体系,明确评估内容,使得整个评估以用户需求为驱动;其次,构建多源空间数据处理平台,实现对多源空间数据的统一管理,为不同种数据间的横向度量评估提供环境;再次,通过相应的算法工具对以用户为中心的评估指标进行可用性度量;最后,将可用性评估结果进行可视化表达。纵观上述总体流程,该方法不仅能够对多源、异构的空间矢量数据进行可用性评估,而且降低了对元数据的依赖,以用户为中心的评估指标体系和评估结果可视化表达充分考虑了用户因素。

      图  2  多源空间矢量数据可用性评估流程图

      Figure 2.  Flowchart of Vector Data Usability Evaluation

    • 多源空间矢量数据可用性评估在执行中的关键环节如图 2中的灰色方框所示,具体内容及解决方案阐述如下。

    • 2001年第四届欧洲地理信息实验室协会大会成立的空间数据可用性研究工作组曾制定了52个度量指标[2]。鉴于该方面的研究刚刚起步,本文首先覆盖相对重要、关注较多的指标,通过面向用户调查获取并采用分类分级的方式进行组织,形成具有结构层次的指标体系,然后逐渐扩充。其中,数据质量就是可用性研究的重要部分,例如上述52个指标中很多源于ISO 19113及ISO 19115的数据质量标准,故对不同数据源的质量评估十分必要。虽然不同数据质量标准体系的具体内容不同,但是诸如精确性、完整性、现势性等方面都有包含,可以参考这些因素设置相应的指标。

      由于空间数据的可用性是相对的,不同用户在不同的需求驱动下对空间数据关注的要素内容不同 (交通、水系等)、侧重点不同 (准确性、完整性等),所以空间数据可用性评估指标的制定是整个评估开展的首要环节,在评估前应该明确对哪几种数据、哪些要素进行哪些方面的评估。

    • 由于缺乏统一的标准规范,加之不同来源数据的获取手段不同,导致现有多源空间数据在比例尺、空间基准、数学基础、语义编码、存储格式等诸多方面存在差异。这些差异使得各种数据间无法进行互操作,更谈不上数据间的可用性度量。

      构建多源数据处理平台就是为了消除上述差异,实现对多源空间数据的一致性处理和透明化组织管理。本文主要采用空间数据集成的技术手段,具体技术流程如图 3所示。对于矢量数据,在进行数据格式、语义、空间基准和数学基础变换后导入多源数据处理平台,并将几何数据写入设计文件中。与此同时,栅格数据将作为参考加以使用,将遥感影像和扫描纸图在空间基准和数学基础变换及图像处理后导入平台,并以参考文件的形式与符号化的矢量数据叠加显示。具体内容和相关处理方法可参考文献[15]。

      图  3  多源空间数据集成处理的技术流程图

      Figure 3.  Technical Flowchart of Data Integration

    • 空间数据是地理信息系统的血液,多源空间矢量数据可用性评估通过对构成血液的细胞进行度量,从基本的点、线、面要素开始,自下而上对要素、要素层 (类)、数据集逐级度量、统计汇总,从而得到不同数据某个指标的具体表现。在执行时,将专家决策方法的内容分解为计算机可执行的功能模块,发挥软件辅助方法的客观性和高效性,提高评估的自动化、智能化程度。由于空间数据主要包括几何数据、属性数据,以及尺度、生产单位、数据专题等其他方面的描述信息,故本文将可用性评估对象分为几何数据和描述性数据两大类,相应的度量评估方案如图 4所示。

      图  4  空间矢量数据源可用性度量评估方案

      Figure 4.  Evaluating Scheme of Vector Data Usability

      1) 几何数据度量。首先,将多源矢量数据与时效性好的遥感影像叠加;其次,通过数据匹配进行同名实体匹配,由于不同数据对客观世界描述时选取的指标、对象、数量不同,所以匹配的结果包含两部分,一部分是由于选取不同导致匹配不上的要素, 可以通过该部分来判断各种数据表达要素的多少,对“相对”完整性进行度量;再次,另一部分是各种数据均有描述的公共部分,以此作为样本进行检测:由于最近遥感影像的时效性要优于矢量数据,故可以从遥感影像上提取该部分所对应的几何数据作为“参考数据”,然后将待评估的多源数据与提取的参考数据进行几何相似性度量,结果用来评价几何数据的准确性和现势性。

      2) 描述性数据的评估。以属性数据为主,在此基础上对其他宏观描述信息进行评估。首先,根据一定的抽样方法查找不同数据集中的闲置项和不可用项,统计属性项缺陷率[16],结果用于评价属性数据的“相对”完整性;其次,对于同名实体匹配中均有描述的公共部分,从属性项的设置、数量、内容等方面进行评估,对于同一属性项可以参考现势性评价结果和相关资料评价“相对”精度;再次,对多源数据宏观描述性信息指标进行评估。

    • 可用性评估结果可视化的目的是将§4.3节中度量、评估得到的数据转换成图形或其他形式,帮助用户直观清晰地了解空间数据内在特征以辅助决策。传统的图表等方法虽然能展现数据某一方面的可用性,但不同表示法间彼此孤立,不利于用户多角度的认识数据。因此,本文采用可视分析技术中的协同互补视图法对可用性评估结果进行表达。可视分析具有强大的分析、可视化及交互能力,使得用户在海量、复杂的数据中根据自身的兴趣需求动态地探索发现隐藏的可用知识[17]。协同互补视图可以将多源数据的不同特性分类展示,同时各分类图间相互关联协调,能够从总体到细节全方位地展现数据。

      可用性评估结果表达的预想效果如图 5所示,左上角为国外某区域3种矢量数据和遥感影像经集成处理后的叠加图,右上角为这3种数据的准确性和“相对”完整性在不同要素层总体的表现,左下角的平行坐标图则更为详细地表示了3种数据准确性的具体情况。由于右上角和左下角两幅图中的指标是经§4.3节中相应算法计算得到的,有具体的度量数值为依据,因此可以进行上述的量化表示。相比之下,权威性、可靠性、合法性、流行性等描述性信息指标的评估一般很难得到具体的数值。因此,本文采用右下角玫瑰图的显示方式,从宏观上概略地对描述性信息的指标进行表达。此外,还有直方图、扇形图等其他可视化方式,可以根据用户需要加载。由此可见,基于协同互补视图的评估结果可视化能够让用户自主选择关心的要素及指标,还可以从不同的类别、粒度多视角地了解数据,在此基础上探索不同数据的可用程度,制定科学的数据使用方案。

      图  5  可用性评估结果的可视化表达

      Figure 5.  Visualization of Usability Evaluating Result

    • 随着数据获取手段的进步和空间数据质量研究的深化,满足相关质量要求、可供选择的数据产品越来越多,海量、多源、异构的数据让用户在选择时无从下手。因此,迫切需要帮助用户结合自身的需求在认识空间数据可用程度的基础上制定科学合理的数据使用方案,从而规避或减少数据选择及使用不当带来的风险。空间数据可用性的研究刚刚起步,既需要深化概念模型的理论内涵,也需要研究适应于不同用户需求的方法并开发相应的辅助决策工具。相关研究对满足用户的个性化需求和自适应服务、增强知识发现的效果、提高海量空间数据的合理使用等方面具有深远的现实意义。

参考文献 (17)

目录

    /

    返回文章
    返回