留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于语义的地理概念范例构造方法

李霖 沈航 刘羽 朱海红 罗振威 孙涛 李昭熹

李霖, 沈航, 刘羽, 朱海红, 罗振威, 孙涛, 李昭熹. 基于语义的地理概念范例构造方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232
引用本文: 李霖, 沈航, 刘羽, 朱海红, 罗振威, 孙涛, 李昭熹. 基于语义的地理概念范例构造方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232
LI Lin, SHEN Hang, LIU Yu, ZHU Haihong, LUO Zhenwei, SUN Tao, LI Zhaoxi. Semantic-Based Methodology for Creation of Exemplars of Geographical Concepts[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232
Citation: LI Lin, SHEN Hang, LIU Yu, ZHU Haihong, LUO Zhenwei, SUN Tao, LI Zhaoxi. Semantic-Based Methodology for Creation of Exemplars of Geographical Concepts[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232

基于语义的地理概念范例构造方法

doi: 10.13203/j.whugis20180232
基金项目: 

国家重点研发计划 2016YFF0201302

详细信息
    作者简介:

    李霖, 博士, 教授, 主要从事数字地图制图、空间数据模型、地理本体、地理信息可视化等方面的研究。lilin@whu.edu.cn

    通讯作者: 朱海红, 博士, 教授。hhzhu@whu.edu.cn
  • 中图分类号: P208

Semantic-Based Methodology for Creation of Exemplars of Geographical Concepts

Funds: 

The National Key Research and Development Program of China 2016YFF0201302

More Information
    Author Bio:

    LI Lin, PhD, professor, his research interests including digital cartography, spatial data modeling, geo-ontology, geo-information visualization. E-mail: lilin@whu.edu.cn

    Corresponding author: ZHU Haihong, PhD, professor. E-mail: hhzhu@whu.edu.cn
  • 摘要: 跨领域地理信息的语义共享的实现依赖于对地理概念的明确理解,而由于文字的模糊性,仅从地理概念的文字描述或定义来理解往往会有一定歧义。从认知原理看,地理概念的形成更多是对其外延进行归纳,并在大脑中构建出概念范例来完成。探索了一种在地理信息领域中构造地理概念范例的方法,即通过在概念文字描述中提取确定概念范畴及外延的本体属性,通过外延和实体属性来选择实例作为表达概念显著特征的范例。通过两个构建范例的案例验证了该方法的有效性。
  • 图  1  地理信息中语义单元示例

    Figure  1.  Examples of Semantic Units in Geographical Information

    图  2  “国道”概念的语义框架

    Figure  2.  Semantic Framework of Concept "National Roads"

    表  1  本体属性类

    Table  1.   Category of Ontological Attributes

    本体属性类 描述
    物质性 其本身、组成和对象的物质
    成因 其状态的形成方式,如自然或人工
    空间性 空间形态、空间关系、空间方向和空间位置等特征
    时间性 具有瞬时、常态、生命周期等时态特征
    功能或目的 其自然或人工赋予的功效
    度量 可以某种度量方式描述的性质
    下载: 导出CSV

    表  2  “国道”概念的本体属性

    Table  2.   Ontological Attributes of Concept "National Roads"

    成因 地域性 空间关系 功能/目的 量度
    人工 城镇、村庄 之间 提供公路运输服务∩通行机动车 国家级等级
    下载: 导出CSV

    表  3  “国道”实体属性的权重矩阵

    Table  3.   Weight Matrix of Attributes of Entity "National Roads"

    实体属性 公路等级 设计时速 公路代码编号 构造特性 车道数 路面宽 路面铺设材料 组成部分 功能 地域性 路面标志
    公路等级 1 5 1/2 2 2 4 5 7 6 7 1/3
    设计时速 1/5 1 1/9 1/2 1/2 2/5 2/5 1/2 1/2 1/2 1/9
    公路代码编号 3 9 1 5 3 3 5 7 6 8 1/2
    构造特性 1/3 2 1/5 1 1/2 1/2 1 3 2 3 1/4
    车道数 1/2 2 2/5 2 1 1 2 5 4 6 1/5
    路面宽 1/2 2 2/5 2 1 1 2 5 4 6 1/6
    路面铺设材料 2/7 2 1/5 1 1/2 1/2 1 3 2 2 1/6
    组成部分 1/5 2 1/7 1/3 1/5 1/5 1/3 1 1/2 1/2 1/9
    功能 1/5 2 1/6 1/2 1/4 1/4 1/2 2 1 1 1/8
    地域性 1/5 2 1/8 1/3 1/6 1/6 1/2 2 1 1 1/9
    路面标志 3 9 2 4 5 6 6 9 8 9 1
    下载: 导出CSV

    表  4  “河流”实体权重对比矩阵表

    Table  4.   Weight Matrix of Entity "Rivers"

    属性 长江 黄河 黑龙江 松花江 珠江 雅鲁藏布江 澜沧江 怒江 汉水 辽河
    长江 1 2 3 4 4 4 5 5 6 7
    黄河 1/2 1 2 3 3 3 4 5 6 7
    黑龙江 1/3 1/2 1 2 3 3 3 3 4 5
    松花江 1/4 1/4 1/2 1 2 3 4 4 5 5
    珠江 1/4 1/3 1/3 1/2 1 2 2 3 3 4
    雅鲁藏布江 1/4 1/3 1/3 1/3 1/2 1 2 3 3 4
    澜沧江 1/5 1/4 1/3 1/4 1/2 1/2 1 1 2 3
    怒江 1/5 1/5 1/3 1/4 1/3 1/3 1 1 2 3
    汉水 1/6 1/6 1/4 1/5 1/3 1/4 1/2 1/2 1 2
    辽河 1/7 1/7 1/5 1/5 1/4 1/4 1/3 1/3 1/2 1
    下载: 导出CSV
  • [1] Janelle D G, Goodchild M F. Concepts, Principles, Tools, and Challenges in Spatially Integrated Social Science[M]//Nyerges T L, Couclelis H, McMaster R B. The SAGE Handbook of GIS and Society. Thousand Oaks, CA: Sage, 2011
    [2] Francisco J, Lopez-Pellicer, Javier L, et al. An Ontology for the Representation of Spatiotemporal Jurisdictional Domains in Information Retrieval Systems[J]. International Journal of Geographical Information Science, 2012, 26(4):579-597 doi:  10.1080/13658816.2011.599811
    [3] Kuhn W. Core Concepts of Spatial Information for Transdisciplinary Research[J]. International Journal of Geographical Information Science, 2012, 26(12):2267-2276 doi:  10.1080/13658816.2012.722637
    [4] Yang Y, Zhang L M, Zhen Y, et al. Learning for Visual Semantic Understanding in Big Data[J]. Neurocomputing, 2015, 169:1-4 doi:  10.1016/j.neucom.2015.05.023
    [5] 李德仁, 柳来星.上下文感知的智慧城市空间信息服务组合[J].武汉大学学报·信息科学版, 2016, 41(7):853-860 http://ch.whu.edu.cn/CN/abstract/abstract5475.shtml

    Li Deren, Liu Laixing. Context-Aware Smart City Geospatial Web Service Composition[J]. Geomatics and Information Science of Wuhan University, 2016, 41(7):853-860 http://ch.whu.edu.cn/CN/abstract/abstract5475.shtml
    [6] Neuman Y, Nave O.A Mathematical Theory of Sign-Mediated Concept Formation[J]. Applied Mathematics and Computation, 2008, 201:72-81 doi:  10.1016/j.amc.2007.12.001
    [7] Medin D, Smith E. Concepts and Concept Formation[J]. Annual Review of Psychology, 1984, 35:113-138 doi:  10.1146/annurev.ps.35.020184.000553
    [8] 鲁学军, 周成虎, 龚建华.论地理空间形象思维——空间意象的发展[J].地理学报, 1999, 54(5):401-409 doi:  10.3321/j.issn:0375-5444.1999.05.003

    Lu Xuejun, Zhou Chenghu, Gong Jianhua.On Geographic Spatial Thinking in Images-The Development of Spatial Mental Image[J]. Acta Geographica Sinica, 1999, 54(5):401-409 doi:  10.3321/j.issn:0375-5444.1999.05.003
    [9] Brodaric B, Gahegan M. Experiments to Examine the Situated Nature of Geoscientific Concepts[J]. Spatial Cognition & Computation, 2007, 7(1):61-95 doi:  10.1080/13875860701337934
    [10] Rosch E. Cognitive Reference Point[J]. Cognitive Psychology, 1975, 7:532-547 doi:  10.1016/0010-0285(75)90021-3
    [11] van Mechelen I, Hampton J, Michalski R, et al. Categories and Concepts[M]. London:Academic Press, 1993
    [12] Rosch E.Principles of Categorization[M]//Rosch E, Lloyd B. Cognition and Categorization. Hillsdale NJ: Erlbaum, 1978
    [13] Medin D.Concepts and Conceptual Structure[J]. American Psychologis, 1989, 44:1469-1481 doi:  10.1037/0003-066X.44.12.1469
    [14] 史厚敏.原型理论的认知机制[J].湖南文理学院学报(社会科学版), 2006, 1:132-135 doi:  10.3969/j.issn.1672-6154.2006.01.033

    Shi Houmin. Cognitive Mechanism of Prototype Theory[J]. Journal of Hunan University of Arts and Science:Social Science Edition, 2006, 1:132-135 doi:  10.3969/j.issn.1672-6154.2006.01.033
    [15] Buitelaa P, Cimiano P, Magnini B. Ontology Learning from Text:Methods, Evaluation and Applications[J].Compute Linguist, 2006, 32:569-572 doi:  10.1162/coli.2006.32.4.569
    [16] Li J, Chen C. Citespace:Text Mining and Visuali-zation in Scientific Literature[M]. Beijing:Capital University of Economics and Business Press, 2016
    [17] 李军利, 何宗宜, 柯栋梁, 等.一种描述逻辑的地理本体融合方法[J].武汉大学学报·信息科学版, 2014, 39(3):317-321 http://ch.whu.edu.cn/CN/abstract/abstract2908.shtml

    Li Junli, He Zongyi, Ke Dongliang, et al. An Approach for Insight into Geo-Ontology Merging Based on Description Logics[J].Geomatics and Information Science of Wuhan University, 2014, 39(3):317-321 http://ch.whu.edu.cn/CN/abstract/abstract2908.shtml
    [18] Wang J, Worboys M. Ontologies and Representation Spaces for Sketch Map Interpretation[J].Int J Geogr Infor Sci, 2017, 31:1697-1721 doi:  10.1080/13658816.2017.1309043
    [19] Li L, Liu Y, Zhu H H, et al. A Bibliometric and Visual Analysis of Global Geo-Ontology Research[J]. Computers and Geosciences, 2017, 99:1-8 doi:  10.1016/j.cageo.2016.10.006
    [20] Ma X G, Fox P, Rozell E, et al. Ontology Dyna-mics in a Data Lifecycle:Challenges and Recommendations from a Geoscience Perspective[J]. J Earth Sci, 2014, 25:407-412 doi:  10.1007/s12583-014-0408-8
    [21] Hong J H, Kuo C L. A Semi-automatic Lightweight Ontology Bridging for the Semantic Integration of Cross-Domain Geospatial Information[J]. Int J Geogr Inf Sci, 2015, 29:1-25 doi:  10.1080/13658816.2014.933480
    [22] Zheng J G, Fu L Y, Ma X G, et al. SEM+:Tool for Discovering Concept Mapping in Earth Science Related Domain[J]. Earth Sci Inform, 2015, 8:1-8 doi:  10.1007/s12145-015-0212-8
    [23] 顾海燕, 李海涛, 闫利, 等.地理本体驱动的遥感影像面向对象分析方法[J].武汉大学学报·信息科学版, 2018, 43(1):31-36 http://ch.whu.edu.cn/CN/abstract/abstract5943.shtml

    Gu Haiyan, Li Haitao, Yan Li, et al. A Geographic Object-Based Image Analysis Methodology Based on Geo-Ontology[J]. Geomatics and Information Science of Wuhan University, 2018, 43(1):31-36 http://ch.whu.edu.cn/CN/abstract/abstract5943.shtml
    [24] Kuai X, Li L, Luo H, et al. Geospatial Information Categories Mapping in a Cross-lingual Environment:A Case Study of "Surface Water" Categories in Chinese and American Topographic Maps[J]. ISPRS International Journal of Geo-information, 2016, 5:21 doi:  10.3390/ijgi5020021
    [25] Liu Y, Li L, Shen H. A Co-Citation and Cluster Analysis of Scientometrics of Geographic Information Ontology[J]. ISPRS International Journal of Geo-information, 2018, doi: 10.3390/ijgi7030120
    [26] Guarino N. Formal Ontology and Information Systems[C].The Conference on Formal Ontology in Information Systems, FOIS'98, Trento, Italy, 1998
    [27] 王红, 李霖, 朱海红.国家基础地理信息本体关键问题研究[M].北京:科学出版社, 2011

    Wang Hong, Li Lin, Zhu Haihong. Research on the Key Issues of National Basic Geographic Information Ontology[M].Beijing:Science Press, 2011
    [28] Miller G A. The Magical Number Seven, Plus or Minus Two:Some Limits on Our Capacity for Processing Information[J]. The Psychological Review, 1956, 63:81-97 doi:  10.1037/h0043158
  • [1] 刘俊楠, 刘海砚, 陈晓慧, 郭漩, 赵清波, 刘建湘, 康磊.  顾及语义知识的地理空间数据快速检索 . 武汉大学学报 ● 信息科学版, 2022, 47(3): 463-472. doi: 10.13203/j.whugis20200058
    [2] 赵云鹏, 孙群, 刘新贵, 程绵绵, 俞童, 李元復.  面向地理实体的语义相似性度量方法及其在道路匹配中的应用 . 武汉大学学报 ● 信息科学版, 2020, 45(5): 728-735. doi: 10.13203/j.whugis20190039
    [3] 贾小斌, 艾廷华, 彭子凤, 王光霞.  地理信息语义的LOD表达与相似性度量 . 武汉大学学报 ● 信息科学版, 2016, 41(10): 1299-1306. doi: 10.13203/j.whugis20140711
    [4] 王跃, 庞小平, 王晓璇.  面向服务的极地地理信息共享与应用 . 武汉大学学报 ● 信息科学版, 2016, 41(11): 1518-1523. doi: 10.13203/j.whugis20150249
    [5] 牛继强, 徐丰, 李卓凡, 洪晓峰.  顾及地理实体语义相似度的土地用途分区模型 . 武汉大学学报 ● 信息科学版, 2015, 40(6): 816-822. doi: 10.13203/j.whugis20130647
    [6] 刘岳峰, 杨忠智, 孙希龄, 司若辰.  空间实体的时态属性时间语义特征及代数表达框架 . 武汉大学学报 ● 信息科学版, 2013, 38(9): 1097-1102.
    [7] 张雪英, 张春菊, 杜超利.  空间关系词汇与地理实体要素类型的语义约束关系构建方法 . 武汉大学学报 ● 信息科学版, 2012, 37(11): 1266-1270.
    [8] 汪华, 朱海红, 李霖.  利用地理属性量表的色盲人群地图色彩设计研究 . 武汉大学学报 ● 信息科学版, 2012, 37(4): 477-481.
    [9] 章汉武, 吴华意, 胡月明, 桂志鹏.  从地理空间数据质量到地理空间信息服务质量 . 武汉大学学报 ● 信息科学版, 2010, 35(9): 1104-1107.
    [10] 郭继发, 崔伟宏, 刘臻, 彭光雄.  模糊地理实体不确定性综合描述研究 . 武汉大学学报 ● 信息科学版, 2010, 35(1): 46-50.
    [11] 杨春成, 何列松, 谢鹏, 周校东.  顾及距离与形状相似性的面状地理实体聚类 . 武汉大学学报 ● 信息科学版, 2009, 34(3): 335-338.
    [12] 杨慧, 盛业华, 温永宁, 胡颖.  基于Web Services的地理模型分布式共享方法 . 武汉大学学报 ● 信息科学版, 2009, 34(2): 142-145.
    [13] 刘凯, 毋河海, 艾廷华, 秦耀辰.  地理信息尺度的三重概念及其变换 . 武汉大学学报 ● 信息科学版, 2008, 33(11): 1178-1181.
    [14] 舒红, 齐翠红.  地理信息时态不确定性的语义与计算 . 武汉大学学报 ● 信息科学版, 2007, 32(7): 633-636.
    [15] 吴华意, 章汉武.  地理信息服务质量(QoGIS):概念和研究框架 . 武汉大学学报 ● 信息科学版, 2007, 32(5): 385-388.
    [16] 余明, 祝国瑞, 李春华.  地学信息图谱图形与属性信息的双向查询与检索方法研究 . 武汉大学学报 ● 信息科学版, 2005, 30(4): 348-350.
    [17] 田扬戈, 边馥苓.  基于概念聚类和面向属性归纳的区划分析 . 武汉大学学报 ● 信息科学版, 2005, 30(1): 86-88.
    [18] 刘春, 史文中, 刘大杰.  数字土地信息中属性数据的质量控制 . 武汉大学学报 ● 信息科学版, 2004, 29(3): 244-248.
    [19] 李伟生, 许云涛, 胡启平.  适合共享的面向对象的地理数据模型 . 武汉大学学报 ● 信息科学版, 1996, 21(1): 82-85.
    [20] 李德仁, 龚健雅.  面向目标数据模型在地理属性数据库中的应用 . 武汉大学学报 ● 信息科学版, 1991, 16(4): 1-8.
  • 加载中
图(2) / 表(4)
计量
  • 文章访问数:  908
  • HTML全文浏览量:  90
  • PDF下载量:  236
  • 被引次数: 0
出版历程
  • 收稿日期:  2018-08-05
  • 刊出日期:  2018-12-05

基于语义的地理概念范例构造方法

doi: 10.13203/j.whugis20180232
    基金项目:

    国家重点研发计划 2016YFF0201302

    作者简介:

    李霖, 博士, 教授, 主要从事数字地图制图、空间数据模型、地理本体、地理信息可视化等方面的研究。lilin@whu.edu.cn

    通讯作者: 朱海红, 博士, 教授。hhzhu@whu.edu.cn
  • 中图分类号: P208

摘要: 跨领域地理信息的语义共享的实现依赖于对地理概念的明确理解,而由于文字的模糊性,仅从地理概念的文字描述或定义来理解往往会有一定歧义。从认知原理看,地理概念的形成更多是对其外延进行归纳,并在大脑中构建出概念范例来完成。探索了一种在地理信息领域中构造地理概念范例的方法,即通过在概念文字描述中提取确定概念范畴及外延的本体属性,通过外延和实体属性来选择实例作为表达概念显著特征的范例。通过两个构建范例的案例验证了该方法的有效性。

English Abstract

李霖, 沈航, 刘羽, 朱海红, 罗振威, 孙涛, 李昭熹. 基于语义的地理概念范例构造方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232
引用本文: 李霖, 沈航, 刘羽, 朱海红, 罗振威, 孙涛, 李昭熹. 基于语义的地理概念范例构造方法[J]. 武汉大学学报 ● 信息科学版, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232
LI Lin, SHEN Hang, LIU Yu, ZHU Haihong, LUO Zhenwei, SUN Tao, LI Zhaoxi. Semantic-Based Methodology for Creation of Exemplars of Geographical Concepts[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232
Citation: LI Lin, SHEN Hang, LIU Yu, ZHU Haihong, LUO Zhenwei, SUN Tao, LI Zhaoxi. Semantic-Based Methodology for Creation of Exemplars of Geographical Concepts[J]. Geomatics and Information Science of Wuhan University, 2018, 43(12): 2243-2249. doi: 10.13203/j.whugis20180232
  • 跨部门、跨行业的地理信息语义共享和应用的实现主要依赖于应用主体对数据或信息的准确认识和理解[1-5]。地理数据集或信息库的组织绝大多数都是基于数据存储管理结构,通过协议、规范及模型等标准化手段提高地理信息共享和重用效率已取得了很大进展。但这些数据的组织形式本身对其语义特征或本质涵义的说明并不明晰,除了与数据集或信息库相伴的元数据或其他简单数据说明外,很少提供与这些数据库相适应/匹配的认知方式或工具来帮助用户认识和理解这些数据集或要素体现出的地理概念,极大地制约了地理信息的语义共享和重用。

    地理信息共享和广泛应用不仅需要面向计算机形式的操作层面,更需要面向服务于人们的认识层面。对地理信息呈现出的地理现象和规律的正确理解和有效认知,驱使人类深入地利用地理信息。地理信息的共享和重用不仅要求地理信息的数据组织具有形式化规范的表达,同时要求考察地理数据背后的认知机理和逻辑描述,保证地理空间概念准确地从一个系统转到另一个系统, 并符合人类的认知规律,从而方便人们通过各种地理数据和信息更好地认知地理环境。因此,地理信息语义研究的核心在于克服由于背景知识以及对信息应用的目的不同引起的认知差异,探索符合或贴近一般认知习惯的地理概念语义表达模型和方式。

    对地理语义和内涵建模的前提是对地理概念的正确理解和清晰说明。从人类认知特点和知识组织形式看,语言是概念表达的基础[6],语义是概念表达的核心。概念的形成是由认知过程决定的[7],认知行为受多种因素影响[8],其中地理概念形成对区位和环境依赖性比较明显[9]。然而,人对地理概念的自然形成是通过对一个地理实体的观察和归纳,在大脑中构建/存储一个或几个的实例作为代表此概念(此类要素)的典型范例,以此作为概念的具体表象和范畴。与其他概念不同,地理概念可以从人们直观和亲历的地理空间中获取和形成。因此,基于实体范例的概念认知在概念形成中具有重要的地位。

    本文试图通过对概念形成的机制分析,根据地理信息领域对地理要素描述的特征,提出一种从概念文字描述的语义中构建地理概念范例的方法,即通过语义分析,规约概念的本体属性,利用本体属性确定概念范畴的实体外延,并利用外延实体的典型属性来确定范例实体。

    • 对于概念的形成和表达[10-11],认知心理学归纳出概念的结构性(the perceived world comes as structured information rather than as arbitrary or unpredictable attributes)[12]这个基本定律。一般可以将概念的形成归纳为3种基本方式[13]。本质模型(essentialism model)认为每个概念或种类都与一定的属性或性质关联,这些属性足已确定对象所属的相关外延。原型模型(prototype model)认为概念范畴中存在最能典型表征概念的成员,即原型;它具有普遍意义,在概念形成中起着核心作用。样例视图(exemplar view)认为可以用一些真实的实例(或实体)来进行概念表征,不需对实例进行抽象概括。这3种概念结构的方式各有优势,各自解释概念认知的部分规律,但每个结构都不能单独地揭示概念形成中的所有规律[12-14]

      地理概念通常指地理事物及其演变过程的本质属性和规律,这些地理现象是自然界中可以感知的对象,在地理信息领域一般由地理实体类及其相互联系构成。地理空间中的地理事物或现象被看成是一个个实例,它是人类认识各种地理规律的基础,是进行地理思维的基本单元或“细胞”。

      从概念形成的3种基本方式看,描述概念的属性或具有区分概念范畴的本体属性和典范化的实例(或者范例)是表征概念的关键,也是理清各概念间关系的基础。体现及描述概念的属性是语义关系,来源于对概念定义的文字和相关说明。因此,通过概念文字及描述来构造范例,需要对地理概念本体和实体的属性进行分析,确定可以判定概念外延的范畴,以及明确体现概念典型性的实体属性或者明确实体典型性的准则。

    • 地理概念的文字描述在语法结构上都可以看作为“主语+谓语+宾语”三元组。通过文字分词技术可以将文字描述分解成由基本语义单元组成的词汇集[15-16],每个词标识一个基本单元,也形成一种概念。本文将出现在文字描述中具有独立形式标志的最小意义单元或要素称为基本概念或元概念,即描述概念的概念。在这种语言描述(txt)结构下,一个地理概念G可以用标识这些概念的词汇V和语义关系S来表示:

      $$ G = \left\{ {\left( {V, S} \right)|V \in {\rm{txt, }}S{\rm{为语义关系}}} \right\} $$ (1)

      通过对收集到的基础地理信息领域地理概念描述和相关说明进行分析整理,可以从形式、来源、过程、功效和目的等多种认知维度上来考察描述概念的语义单元。例如,从基础地理信息中的自然要素和人工要素的描述文字中,可以归结出如图 1所示的一些语义单元。从信息共享的形式化要求看,语义单元的本质性、完整性以及可标示性都作为语义单元划分和语义关系建立的依据。因此,需要对每个概念描述分别进行语义解析,对语义单元按特征进行归类,确定最小语义单元。比如分析“沙丘”类地理对象的空间形状(空间形态维度)时,可以提取出诸如新月形、板状、网格状、堆装/形、条状等的基本语义单元。

      图  1  地理信息中语义单元示例

      Figure 1.  Examples of Semantic Units in Geographical Information

    • 地理概念所描述的特征主要是其内涵的表达,地理本体在地理认知和概念表达方面提供了比较严密的逻辑和机制[17-19],在语义层面为地学领域的数据挖掘和语义匹配[20-23]以及跨语言环境的地理概念匹配[24]提供了有效工具,其原理和方法在地理研究领域受到持续的关注[25]

      利用形式本体方法可以抽取出表现概念本体的属性。形式本体方法指利用逻辑对事物存在的形式和方式进行系统化、形式化和公理化的开发方法。概念化可定义为三元组[26]C=〈D, W, $\hat A$〉,其中$\hat A$为定义在域空间(domain space)(DW)上的概念关系(或内涵关系,intensional relation)的集合,域空间(DW)是一种世界结构(world structure),D为域,WD的最大状态集(即可能世界,possible world)。概念关系是概念化的关键,正如概念化相对于(形式)本体。

      概念关系r定义为从WD上所有外延关系的映射(或函数):rW→2D

      给定一个语言L(如中文)和它的词汇V′,一个对概念化C =〈D, W, $\hat A$〉的本体承诺O=(C, Á)。其中Á为映射V′=D∪$\hat A$将D中的元素赋给V′中的(常量)词,$\hat A$中的元素赋给V′中的谓词(符号)。

      基于上述形式化原理,可将一个地理概念语义定义为:

      $$ {G_c} = \left( {c, \left\{ A \right\}} \right) $$ (2)

      式中,c为概念术语或标识;A为表示概念的属性。

      将属性[A]中表示概念本质的属性归为本体属性,本体属性可以谓词形式来判别,即所谓“恒真”性:φ(x)=TRUE。

      假设“湖泊”概念中有“蓄水”和“水面面积”指示的属性。“蓄水”属性可以作为每一个“湖泊”实例对象的基本性质,属性“蓄水”值永远为“真”,因此,“蓄水”是“湖泊”的本体属性;“水面面积”随实体而变化,因此不能作为“湖泊”的本体属性。

      结合语言描述层面的概念描述(1)和逻辑层面的概念表示(2),容易得知,当对一个具体概念G的本体属性为{A}时,有{A}$ \subset $VV′。

      地理概念的文字描述和说明可能有多种方式,不同的方式所用的词汇及语义关系也不一定完全相同,但描述地理概念的性质可以归于表 1[27]表 1中每一类从形式本体的角度反映了概念对应地理实体的时空及物理状态性质,每一类都可以作为其本体属性范畴。

      表 1  本体属性类

      Table 1.  Category of Ontological Attributes

      本体属性类 描述
      物质性 其本身、组成和对象的物质
      成因 其状态的形成方式,如自然或人工
      空间性 空间形态、空间关系、空间方向和空间位置等特征
      时间性 具有瞬时、常态、生命周期等时态特征
      功能或目的 其自然或人工赋予的功效
      度量 可以某种度量方式描述的性质
    • 依据概念表达(2),可以通过本体属性来判断一个地理现象或一个地理要素是否是此概念的实例(或实体),从而得到此概念的外延集。本体属性作为概念的内涵属性和关系,体现出范畴或分类的性质。这对任意给出一个地理实体并判断其属于哪个地理要素类具有关键作用,也可以作为界定概念外延的准则或标准。

      范例是概念外延中能反映这个概念的典型实例或个体的代表。它可以直接从概念外延中选取,或者根据实体属性,通过属性的值域来构造范例。实体属性用来区分同一类(概念)下不同的个体(或外延实体),它与本体属性不同,不具备所谓的“恒真”性。这些属性可以从所有文字描述的词汇及语义关系(V, S)中,根据反映个体的(词汇所代表的)特征来确定。然而,在实际工作中,构建信息库时,已为外延数据库设计好表示地理实体的数据库模式,这些模式可以直接作为实体属性集,并且具有明确的属性值域(Dom)。因此,可以通过典型化属性值来构造此概念的范例。

      典型化的方法有很多,比如根据值域的最小值、最大值、中值或者最大频数等,也可以直接从概念外延实例中依据多维属性空间的中心位置来选择(或构造)实例作为范例,或者依据公众(认知)印象来确定其范例。由于地理概念对应的地理现象复杂多样,不存在唯一确定地理概念范例的方法,概念的外延特征决定了对地理概念范例的选择或构造方式和方法。

      从范例存在的真实性来说,范例可以存在为理想形式和实例两种方式。

      1) 理想形式。即现实世界中不存在这样的实体,完全根据值域来构造。比如,对某概念来说,用属性值域的中值作为最具典型性特征,即E(G)={MeanA(Dom(A))|A∈{A}},其中,A为实体属性,{A}是所有实体属性集,G为某概念,E(G)为概念G的范例,Dom(A)为属性A的值域,MeanA()表示取中值。

      2) 实例。即从概念外延(实体)中,依据某典型化方法选定某一个或几个作为其范例。比如将属性值域映射到多维空间坐标系中,计算出这些实例在空间坐标系的位置点,将位于中心点/重心点的实例作为其范例。

    • 地理概念所描述的地理现象在地理信息领域一般可以分成人工要素和自然要素,“道路”是基础地理信息领域中最典型的人工构筑物,“水系”特别是所谓“常年河”是基础地理信息领域中最典型的自然河流。下面以人工要素“国道”和自然要素“常年河”为例,分别介绍确定或构造这两个地理概念范例的简单方法。

    • 要从众多不同形式不同形态的人工要素中确定代表“国道”概念的范例,首先需要判断哪些要素属于“国道”,即确定“国道”概念的本体属性;然后,在属于“国道”的要素中确定范例实体。为了确定具有典型代表的“国道”实体,首先在众多实体属性中确定所谓“典型”属性,然后通过“典型”属性来确定“典型”实体作为此概念范例。

      1)“国道”概念的本体属性

      交通道路中“国道”是指“具有全国性的政治、经济、国防意义,并经确定为国家级干线的公路”,直接父类为“城际公路”。依据本体属性描述原理[27],其本体属性见表 2

      表 2  “国道”概念的本体属性

      Table 2.  Ontological Attributes of Concept "National Roads"

      成因 地域性 空间关系 功能/目的 量度
      人工 城镇、村庄 之间 提供公路运输服务∩通行机动车 国家级等级

      2)“国道”一般实体属性

      描述“国道”实体的(实体)属性有很多,行业标准规范《JTG B01-2003公路工程技术标准》对国道的属性描述包含20个属性,在认知维度进行分类初步分析,可以得到11个有关属性,这些属性根据重要性或显著特征进行两两比较,对其重要性(按1~9量表)赋值,可以建立其权重矩阵(表 3)。根据权重矩阵可以计算出每个属性显著程度的权重:路面标志为0.262, 公路代码编号为0.234, 公路等级为0.16, 车道数为0.085, 路面宽为0.083, 构造特性为0.046, 路面铺设材料为0.044, 功能为0.028, 地域性为0.023, 组成部分为0.02, 设计时速为0.016。

      表 3  “国道”实体属性的权重矩阵

      Table 3.  Weight Matrix of Attributes of Entity "National Roads"

      实体属性 公路等级 设计时速 公路代码编号 构造特性 车道数 路面宽 路面铺设材料 组成部分 功能 地域性 路面标志
      公路等级 1 5 1/2 2 2 4 5 7 6 7 1/3
      设计时速 1/5 1 1/9 1/2 1/2 2/5 2/5 1/2 1/2 1/2 1/9
      公路代码编号 3 9 1 5 3 3 5 7 6 8 1/2
      构造特性 1/3 2 1/5 1 1/2 1/2 1 3 2 3 1/4
      车道数 1/2 2 2/5 2 1 1 2 5 4 6 1/5
      路面宽 1/2 2 2/5 2 1 1 2 5 4 6 1/6
      路面铺设材料 2/7 2 1/5 1 1/2 1/2 1 3 2 2 1/6
      组成部分 1/5 2 1/7 1/3 1/5 1/5 1/3 1 1/2 1/2 1/9
      功能 1/5 2 1/6 1/2 1/4 1/4 1/2 2 1 1 1/8
      地域性 1/5 2 1/8 1/3 1/6 1/6 1/2 2 1 1 1/9
      路面标志 3 9 2 4 5 6 6 9 8 9 1

      3)“国道”典型实体属性及范例

      人类记忆特点和认知局限[28]一般认为,对一个概念(事物)认知最有效的信息单元是5~7个左右。因此,从“国道”实例属性中,可以选如下7个属性作为最具典型的属性:路面标志、公路代码编号、公路等级、车道数、路面宽、构造特性和路面铺设材料。

      基于“国道”数据库中提供的实体,可以从这7个属性中挑选最常见或最容易见到的某一个或几个“国道”实体。比如挑选“路面标志”最多的或道路最长的实例,或者挑选“公路代码编号”最多或道路最长的实例,或者“车道数”中最多或道路最长的实例,也可以结合几个属性来统筹考虑。

      如果以基础地理信息库中的国道实体(基础地理要素分类码为420100)作为其概念外延实体集,可以“路面标志”出现最多的实例为范例。然而,实际数据库中并不包含“路面标志”,但它是依据道路长度来计算的,因此可以借用最长道路来代替。因此,在此数据库中,318国道可以作为“国道”概念的范例(起点为上海,终点为西藏友谊桥,全长5 476 km,是中国最长的国道)。

      “国道”概念的语义框架如图 2所示,包括本体与实体属性,AKO(aking of)反映父子类关系,右边是属性,其中,独立的本体属性只列出功能性,作为“度量”的本体属性反映在实体属性公路等级中。

      图  2  “国道”概念的语义框架

      Figure 2.  Semantic Framework of Concept "National Roads"

    • 概念范例也可以采用与上述不同的方法来构造,直接利用人们对现存实例的认知差异来体现对其概念认知的典型性和代表性。此处假设概念外延实体已确定,而且以人们对这些外延实体的熟知程度作为其实体典型性的依据。

      “常年河”有很多实例,如果以公众认知角度来看,不同的河流被公众熟知程度不同,可以按其熟知程度或“著名”性为典型性计算出“常年河”概念的范例是哪条河流。以中国著名河流(http://tieba.baidu.com/p/305009513)中的10个实体长江、黄河、黑龙江、松花江、珠江、雅鲁藏布江、澜沧江、怒江、汉水和辽河为例,直接对这10个实体进行两两比较,可以得到如表 4所示的权重矩阵,根据权重矩阵可以计算出实体的著名程度为:长江13.04, 黄河10.36, 黑龙江6.73, 松花江5.52, 珠江3.74, 雅鲁藏布江3.12, 澜沧江2.19, 怒江1.95, 汉水1.25, 辽河1。

      表 4  “河流”实体权重对比矩阵表

      Table 4.  Weight Matrix of Entity "Rivers"

      属性 长江 黄河 黑龙江 松花江 珠江 雅鲁藏布江 澜沧江 怒江 汉水 辽河
      长江 1 2 3 4 4 4 5 5 6 7
      黄河 1/2 1 2 3 3 3 4 5 6 7
      黑龙江 1/3 1/2 1 2 3 3 3 3 4 5
      松花江 1/4 1/4 1/2 1 2 3 4 4 5 5
      珠江 1/4 1/3 1/3 1/2 1 2 2 3 3 4
      雅鲁藏布江 1/4 1/3 1/3 1/3 1/2 1 2 3 3 4
      澜沧江 1/5 1/4 1/3 1/4 1/2 1/2 1 1 2 3
      怒江 1/5 1/5 1/3 1/4 1/3 1/3 1 1 2 3
      汉水 1/6 1/6 1/4 1/5 1/3 1/4 1/2 1/2 1 2
      辽河 1/7 1/7 1/5 1/5 1/4 1/4 1/3 1/3 1/2 1

      据此,“长江”实体可以作为“常年河”概念的认知范例。对这个概念范例的确定没有直接利用本体属性和实体属性,而是直接以存在的实体作为外延来进行选择,这个过程本身隐含以概念本体属性作为范畴判断依据。这个例子看似平凡,但揭示了人们对地理自然要素认知的基本机制,即通常用自己熟知的实例来外推出反映这一类实体的概念。此案例直接利用人们的认知习惯来构造概念范例,是直接从外延实体中确定其概念范例的方法。

    • 地理信息共享,特别在语义层面的共享是地理信息领域中的一项挑战课题,各种语义分析、语义网构建、本体匹配等技术的开发都是对这一挑战的探索,对某些具体任务或工程而言,这些探索提供了有效可行的方案。本文在帮助人们理解地理信息领域的地理概念方面提供一种基于认知特征的概念范例构造或确定方法,主要解决以下问题,即对任意一个地理概念,如何找到代表此概念的范例。本文在语义基础上通过概念文字描述的语义分析,利用本体属性作为概念外延范畴的内涵条件;然后,通过外延实体或及其属性的显著性作为典型化的机制,构造或确定出范例实体。通过案例介绍了构造范例的两种方法,可以作为构建其他地理概念范例的原理性方法。然而,从认知原理看,地理概念的范例不是唯一的,所谓典型范例也只是一定意义上的认知范例。而且,纯从语义(词汇)上来确定概念属性,有时还存在模糊性,比如语义单元“槽形”反映地理要素的几何或空间形态,如何将其转化为可计算空间形态;或更普遍一些,探讨如何将在语义层面反映地理概念的时空特征转化为可计算或可形式化判断的表达方式,这些有待进一步深入探索。

参考文献 (28)

目录

    /

    返回文章
    返回