ZHAI Weixin, CHENG Chengqi. An Improved Spatial Weights Matrix Construction Strategy[J]. Geomatics and Information Science of Wuhan University, 2017, 42(6): 731-736. doi: 10.13203/j.whugis20150015
• 中图分类号: P208

## An Improved Spatial Weights Matrix Construction Strategy

Funds:

The National Major Projects on High-Resolution Earth Observation System 03-Y30B06-9001-13/15

The National Major Projects on High-Resolution Earth Observation System 30-Y30B13-9003-14/16

Research Projects on Public Services of Mapping and Geography Information 201512020

###### Corresponding author:CHENG Chengqi, professor. E-mail:ccq@pku.edu.cn
• 摘要: 在地理学空间自相关的分析中，权重矩阵对整个分析结果有着较大影响。常见的权重矩阵，例如车矩阵、皇后矩阵、距离权重矩阵和k-邻近矩阵，都有各自的优势和缺点。提出了一种基于长度面积比例的空间权重矩阵（ratio of length and area，RLA），并以近年来危害最大的几种传染病之一——病毒性肝炎在中国大陆各省份的发病率为例进行了实验分析。实验结果表明，RLA矩阵能够很好地实现空间权重矩阵的基本功能，是常见的车矩阵的一种更为广义的定义，并且可以更加自由地实现空间自相关的分析。利用本空间权重矩阵能够更好地模拟不同地理单元之间的邻接关系，为流行病的预防提供支持。
• 图  1  RLA的阈值选取

Figure  1.  Determination of RLA Threshold

图  2  相邻区域的个数统计图

Figure  2.  Number of Adjacent Areas

图  3  两种方法的聚类分析图

Figure  3.  Cluster Map of Two Methods

图  4  显著性分析图

Figure  4.  Significant Map of Two Methods

##### 出版历程
• 收稿日期:  2016-02-24
• 刊出日期:  2017-06-05

## 一种空间权重矩阵的优化方法

##### doi: 10.13203/j.whugis20150015
###### 1. 北京大学地球与空间科学学院, 北京, 1008712. 北京大学工学院, 北京, 100871
基金项目:

高分辨率对地观测系统国家重大专项 03-Y30B06-9001-13/15

高分辨率对地观测系统国家重大专项 30-Y30B13-9003-14/16

测绘地理信息公益性行业科研专项 201512020

• 中图分类号: P208

### English Abstract

ZHAI Weixin, CHENG Chengqi. An Improved Spatial Weights Matrix Construction Strategy[J]. Geomatics and Information Science of Wuhan University, 2017, 42(6): 731-736. doi: 10.13203/j.whugis20150015
• 空间统计学作为一种处理和分析空间数据的计算方法，已经被广泛地应用到与空间信息操作相关的诸多领域，例如地质、防疫、防灾、土壤、农业、环境、经济、公共卫生等[1-5]。与传染病相关的研究在国内[6-8]和国外[9-12]已成为地理学研究的热点之一。空间统计的方法能有效处理与疾病相关的空间数据，分析不同区域传染性疾病分布和变化的联系，探索传染性疾病病因及各种影响因素[13-14]，被广泛应用。由于传染性疾病的发生和流行与空间环境因素密切相关，疫区分布具有明显的地理特征，因此，找出传染性疾病与空间环境因素之间的内在联系，是预测流行趋势并进行有效控制的关键[15]。常用的空间自相关分析的方法均是基于空间权重矩阵的，一个符合真实地理情况的权重矩阵能够更好地帮助实现空间统计，得到事物空间分布的内在规律[16]。空间权重矩阵的判断一般为二值型，即认为两个空间单元相邻或者不相邻。对于具体的空间实体，将其本身的空间属性(例如面积)信息融入空间权重的判断方法可以有效增强对空间单元之间邻近关系判断的适应和表达能力[17-18]

传统的空间权重矩阵的构造有3类方法：① 按照面域之间是否有邻接关系的邻接法；② 基于面域之间距离的距离权重法；③ k -近邻方法。相应地，空间权重矩阵也分为三类。每一类方法均可以以一个N×N的空间权重矩阵来表示，在该权重矩阵中每一个元素的值ωij为0或者1，0代表第i个和第j个空间单元不邻接，1代表这两个空间单元邻接[19]

第一种方法的空间权重矩阵第i行第j列的元素值表示为：

 $${{\omega }_{ij}}=\left\{ \begin{array}{*{35}{l}} 1,&{{A}_{i}}与{{A}_{j}}相邻 \\ 0,&其他情况 \\ \end{array} \right.$$ (1)

式中，AiAj表示两个面域(下同)。这种权重矩阵的邻接性的度量可分为车矩阵和皇后矩阵两种，定义是：如果AiAj有重合的边(对于皇后矩阵，除了边之外，重合的点也考虑)，则认为两者相邻接，矩阵中ωij元素和ωji元素的值均为1。

第二种方法的空间权重矩阵第i行第i列的元素值表示为:

 $${{\omega }_{ij}}=\left\{ \begin{array}{*{35}{l}} 1,&d({{A}_{i}},\text{ }{{A}_{j}})＜距离阈值 \\ 0,&其他情况 \\ \end{array} \right.$$ (2)

式中，d(Ai, Aj)代表AiAj与之间的距离。这种权重矩阵对距离函数的定义和距离阈值的选择有一定的要求，常见的距离函数计算方法是中心距离法，即选取面状单元的空间中心来计算距离。

第三种方法的空间权重矩阵第i行第j列的元素值表示为：

 $${{\omega }_{ij}}=\left\{ \begin{array}{*{35}{l}} 1,&({{A}_{i}}、{{A}_{j}}属于k-邻近)＜距离阈值 \\ 0,&其他情况 \\ \end{array} \right.$$ (3)

k-邻近方法是数据挖掘中一种常见方法，在空间统计学方面主要是代表选取每一个单元最近的k个单元作为其邻接单元，相应的空间权重矩阵中的元素为1，而其他的相应元素则为0。

本文提出了一种新的计算空间权重矩阵(ratio of length and area，RLA)的度量方法。这种方法相比传统度量方法能够更精确地刻画不同空间实体之间的邻接关系。基本思想是，选取空间单元的面积作为其自身综合影响力的标度，选取任意两个空间单元的相重合的边长作为其邻接的绝对标度。如果邻接的绝对标度与空间单元自身影响力的标度之比值大于某一阈值，说明邻接单元对该空间单元的影响不容忽视，认为两者相连。这种对于空间相邻区域影响的度量与边长正相关、与面积负相关，能够刻画出相邻的两个空间单元的接壤部分对于各自空间单元的影响。本文以我国近年病毒性肝炎发病情况为例，进行全局和局部的病毒性肝炎疾病空间自相关对比分析。

本文选取GeoDa作为跨平台开源软件，可以用于空间统计的各个方面[20]。GeoDa软件采用随机模拟方法对Moran’s Ⅰ值进行显著性检验[21]。判断显著性的参数p值大小反映了观测数据为空间随机分布的可能性。一般认为，当p≤0.05时，观测数据为随机分布的可能性不到5%，即区域单元的观测值存在显著的空间自相关性。

