-
摘要: 基于关系型数据库的空间数据存储与处理是地理信息系统(geographic information system,GIS)领域的主流模式,但伴随着物联网、移动互联网、云计算及空间数据采集技术的发展,空间数据已从海量特征转变为大数据特征,对空间数据的存储和管理在数据量和处理模式上提出了新的挑战。首先分析了基于传统的集中式存储与管理模式在处理和应用大数据方面的局限性,包括存储对象的适应性、存储能力的可扩展性及高并发处理能力要求;然后在分析当前几大主流NoSQL数据库特点的基础上,指出了空间大数据基于NoSQL数据库的单一存储模式在数据操作方式、查询方式和数据高效管理方面存在的局限性;最后结合GIS领域空间大数据存储对数据库存储能力的可扩展性及数据处理和访问的高并发要求,提出基于内存数据库和NoSQL数据库的空间大数据分布式存储与综合处理策略,并开发了原型系统对提出的存储策略进行可行性和有效性进行了验证。Abstract: Geospatial data in databases have shifted to conform to the characteristics of big-data in tandem with the development of the Internet, mobile Internet, cloud computing, and especially, spatial data acquisition technologies. Faced with tackling spatial big data, traditional spatial database management techniques based on Relational Database Management Systems have encountered problems including the unstructured characteristics of the spatial object, the high scalability of storage capacity, and the high concurrency in big data application environment. This paper focuses on the mainstream of NoSQL databases that successfully deal with unstructured big data and are widely used in Internet applications, but lack of spatial characteristics. The data operational and query modes cannot meet the requirments of GIS applications. To resolve this problem, this paper proposes a strategy that takes a NoSQL database as a warehouse for spatial big data and a traditional spatial database as the application server. The storage system architecture and the key technology and solutions are discussed. A prototype system was developed based on MongoDB, PostgreSQL and SQLite to verify the feasibility and effectiveness of the strategy.
-
Keywords:
- spatial database /
- big data /
- NoSQL database /
- distributed storage
-
新技术的发展给空间数据存储与管理又提出了新的挑战。物联网、移动互联网和云计算技术及应用的蓬勃发展,使得空间数据在数据量和应用模式上发生了转变;此外,传感器技术的发展,使采集数据的空间分辨率和时间分辨率显著提高,导致所获取的数据规模成指数级快速上升,面对动辄以TB(trillionbyte),甚至PB(petabyte)计的数据,也给空间数据存储和处理带来巨大的压力[1-3]。
传统的基于关系型数据库的空间数据存储与管理已经无法满足大数据存储和处理的实际应用要求,随着互联网领域云技术、非关系型数据库技术的迅速发展,各种分布式GIS技术的研究成为研究热点。本文主要着眼于空间大数据的存储与管理,首先分析了传统集中存储模式在大数据存储方面的局限性;然后,针对互联网领域大数据的成功解决方案,研究当前主流NoSQL数据库的特点,分析其在处理空间数据时的优势与不足;最后,针对这些需求和存在的问题,本文提出空间大数据分布式存储与处理策略,并在原型系统中进行试验验证。
1 空间数据存储技术现状
基于成熟的关系型数据库设计空间数据引擎,集中存储和管理空间数据是当前应用的主流模式。
1.1 空间数据集中存储模式及其局限性
从空间数据引擎和关系数据库与应用程序结合的紧密程度来看,可以将空间数据引擎的体系结构分为内置模式、三层结构模式和两层结构模式[4, 5],这些集中存储模式很好地解决了海量空间数据存储和管理的问题。
目前,各种地理空间信息获取手段多样、数据规模巨大、更新频率快、数据应用现势性强。传统的空间数据集中,单一的存储方式不能满足大数据高并发甚至高时效的应用要求,空间数据从海量特征转变为大数据特征对存储技术的要求主要表现如下。
1) 存储对象的变化。关系型数据库不擅长处理大量位置相关的视频、音频、图片等数据。
2) 存储能力的扩展。在容量上,传统关系型数据库难以维护动辄千万级别的二维表,且存储能力的横向扩展也非常困难。在性能上,由于需要维护数据的完整性、一致性,数据存储的性能受到很大影响。
3) 并发访问能力。 关系型数据库区别传统文件的最大优势在于其对数据的多用户并发访问能力,但在云服务、互联网等应用领域,用户的并发量要求是关系型数据库无法满足的。
1.2 基于NoSQL的空间数据单一存储模式优势与不足
在互联网领域,基于非关系型数据库的NoSQL数据库技术已经得到成功应用。从数据存储的角度来说,NoSQL数据库非常适合空间大数据的存储,但互联网领域的应用模式与GIS领域存在一定差异,由此产生的局限性主要包括如下方面。
1) 数据操作方式的局限性。在空间数据库中对数据的修改是常用操作,但NoSQL数据库一般不建议对数据进行修改,不慎重的修改操作甚至会因为引起相关存储数据的大量迁移而导致性能急剧下降。
2) 数据查询方式的局限性。基于空间数据的各种专题图展示能力以数据库的查询能力为重要基础,需要按图层的属性信息提取数据,因此基于数据库的按字段查询、排序、统计等功能是重要基础。NoSQL数据库提供的查询能力非常有限,MongoDB也不能满足GIS常用查询的需要。
3) 单一空间索引算法或技术的局限。类似关系型数据库,空间数据的索引技术是空间数据存储技术的重要研究内容[6-9],但有一定局限性[10-14]。在大数据应用环境下,应该考虑把空间索引技术从算法层面提升到方法策略层面,才能解决空间数据的高效检索问题。
本文综合NoSQL数据库和关系型数据库各自的优势,提出一种混合的空间大数据分布式存储策略,既满足大数据存储的需要,又能满足传统GIS应用的需求。
2 空间大数据分布式存储策略
本文提出空间大数据分布式存储策略是针对传统的矢量、栅格及各种移动设备产生的实时/近实时的流式大数据存储与管理,设计基于内存数据库、关系型数据库、NoSQL数据库的三层物理存储体系及数据调度系统。
2.1 空间大数据存储与管理系统
面向空间大数据的分布式存储与管理系统具备存储和管理矢量、栅格和流式大数据的能力,整个系统能够对外提供多种能力,既包括实时/近实时的流式数据的存储和管理,又能对分布式数据库中的数据进行快速提取从而支持传统应用,如专题图展示、空间关联分析等。基于该系统的应用框架结构见图 1。
空间数据存储子系统。综合内存数据库、传统空间数据库和NoSQL数据库,三者结合对外提供流式数据处理能力、传统空间数据库查询和分析能力及分布式系统大数据处理能力。
1) 内存数据库,高效的数据操作层。I/O处理速度比传统数据库要快很多,一般都在10倍以上。
2) 传统空间数据库,提供数据集中存储的能力,与此同时使得整个空间大数据分布式存储管理系统对外具备传统GIS的能力,保证整个系统对外提供的能力不退化。
3) 分布式存储系统,基于NoSQL数据库的分布式存储系统作为大数据仓库,为空间大数据提供低成本、高可扩展、高可用性、高通量I/O的持久化存储和数据提取能力。
2.2 关键技术
1) 空间数据在NoSQL数据库中的存储实现。本文主要研究MongoDB的数据库存储特点。MongoDB是一种基于文档的NoSQL数据库,与空间数据库中的各类对象的映射关系见表 1。
表 1 各数据库中空间数据存储组织方式Table 1. Object Types Mapping in DatabaseSQLite:Mem PostgreSQL MongoDB 空间位置信息存储格式 Text bin BSON 数据源对应的数据库对象 database database database 图层对应的数据库对象 table table collection 空间对象对应的数据库对象 row row document 2) NoSQL数据库中空间大数据的组织结构设计。本文主要讨论MongogDB的Replica Set集群和Sharding集群。在实际应用中,应用场景会极大地影响数据存储策略。本文的实验场景中,通过多次优化验证,采用的是根据地理范围进行外部分片,再搭建Sharding集群,可称之为滞后Sharding集群。
3) NoSQL数据库中空间大数据的快速提取技术。除空间数据的组织结构会影响数据的提取效率,空间索引策略也是提高数据访问效率的关键点。本文设计的空间索引策略充分与集群方案结合,是基于元数据的多级图幅索引。
4) 数据合理调度问题。考虑空间大数据高效分析和处理的需要,其存储需要设计内外存协同的存储模式。将高频率访问热点数据直接内存于数据库中,实现高通量I/O;其余海量的低频率“冷”数据以归档形式存储在关系型数据库或者NoSQL数据库中。
5) 空间数据访问接口设计。对关系型数据提供的API(application programming interface)基于开源的OGDC(open geospatial database connectivity)[15],类似于空间数据库领域的ODBC,提供最基础的空间数据库访问接口,包含了多种关系型数据库的驱动程序,如Oracle、DB2、MySQL、DM、Kingbase等;对分布式存储系统,本文基于OGDC接口进行完善,为数据的并行存取提供通道。
3 空间大数据分布式存储实践
本文分别选取SQLite、PostgreSQL和MongoDB作为内存数据库、关系型数据库和NoSQL数据库的存储实践实现原型系统,重点解决空间大数据在MongoDB中的底层存储和上层逻辑组织结构等关键技术,实现大数据仓库中的空间数据快速存储与提取,对本文的存储策略进行验证。
实验选取空间大数据入库和空间叠加统计分析两个场景对本文提出的存储策略进行对比和验证。
实验数据采用全国大范围土地覆盖测试数据,共10 101幅shape文件,数据量5.4TB,约11亿个空间面对象。
实验主要硬件为三台32核、内存128GB的服务器挂载磁盘存储;操作系统为64位RedHat。
3.1 原型系统存储体系结构
空间大数据存储原型系统分三层结构,包括数据库层、中间件层和数据访问接口层,见图 2。
1) 数据库层。SQLite是一个跨平台的开源小型桌面数据库,提供全内存模式;PostgreSQL是一个传统类型的开源关系型数据库;MongoDB是目前为止与关系型数据库最接近的NoSQL数据库,实验搭建MongoDB的Sharding集群。
2) 中间件层。属于核心部分,包括传统的空间数据库引擎、分布式空间数据库引擎和数据调度子模块。传统的空间数据库引擎主要负责空间数据在关系型数据库中的存储和管理,由于SQLite是关系型数据库,SQLite:Mem和PostgreSQL的存储处理方式基本类似;分布式空间数据库引擎负责空间大数据在MongoDB中的组织。各数据库中数据的组织方式见表 1。
关系型数据库中,图层与表对应。矢量图层的每个对象对应表中的一行,这一行数据就包括了位置信息和属性信息,对于MongoDB来说,每个对象包装成一个带有空间信息和属性信息的BSON对象。
数据调度主要是基于数据操作接口,在不同的数据库之间进行数据的输入和提取。
3) 数据访问接口层。主要为上层应用提供操作存储于不同数据库的空间数据的接口。
3.2 空间大数据入库实验
实验目标:将5.4TB shape数据全部导入MongoDB,并建立空间索引。
实验目的:对本文空间大数据分布式存储方案、空间索引策略和内存数据库的应用进行验证。
1) 数据分布式存储方案
数据入库主要是对数据集合 (记为collection)写操作,由于MongoDB采用的是数据库级锁,过多并发对同一数据库(记为database)中同一集合或不同集合的插入操作都会导致锁争用而产生性能瓶颈;通过Sharding集群的实例节点写入数据,由于节点间通信及维护开销,单个shape导入的性能比单节点写入性能慢2~3倍。为提高入库效率,本实验放弃对单个collection的Sharding集群存储,将研究区域的数据进行划分,存储到两个存储节点的6个database中,每个database包含多个collection,每个collection包含200万~300万个对象(见图 3)。图 3中,A1、A2;B1、B2;C1、C2等为研究区域的数据分片,DB_A1、DB_A2、DB_B1、DB_B2、DB_C1、DB_C2等为对应的存储节点数据库,Shard Node1、Shard Node2为存储节点。集群搭建采用滞后方式,即两个存储节点先作为单独实例启动,数据入库完成后再搭建Sharding集群。实际环境中也建议在数据入库完成后再建立各Sharding集群结点的备份结点,搭建数据副本-分片集群(Replica Set-Sharding)。
本实验环境下,对单个数据库级别的database开启10进程并发持续写入能够获得较好的效果。
2) 基于元数据的多级空间索引策略
通过元数据表记录不同存储粒度的地理范围:存储结点级别(Shard Node)、数据库级别(database)和图层级别(layer)。图层的数据粒度为300万~400万对象,用图幅索引进行划分,即每个对应一张collection。在存储结构上,layer对应的database.collection的Tile_ID(图幅标识)列记录空间对象所在的图幅号,索引表的结构如图 4(b)所示。其中各变量满足以下条件:
① $\sum\limits_{i = 0}^k {{n_i} = N} $,N为对象总个数;
② ti∈T,T=∪Obj_IDTile,Obj_IDTile为索引表对象Obj_ID
3) 内存数据库的应用
入库过程中对图层建立图幅索引需要多次对collection进行ID查询,统计地理范围极值等操作,而MongoDB并不直接提供对列求极值的操作算子,需要遍历数据。本实验利用内存数据库,实现了单个shape(要素)入库处理时间不随目标层数据量增加而增长的目标。步骤如下。
(1) 单个要素(shape)导入内存数据库得到MemLayer;
(2) 对MemLayer切分图幅T1,T2,…Tn;
(3) 将n图幅数据追加至目标图层。对第Ti图幅数据,获取数据范围、对象数,获取目标数据集的新图幅标识(Tile_ID),写入目标图层。
数据写入完毕,实际上图层的图幅索引也建立完毕。本文统计3个图层约60个shape,每个shape约500MB,11万个对象,单个shape处理的平均时间见表 3。实验中整个入库过程shape处理速度基本平稳。
表 2 单个要素平均处理时间Table 2. Average Time Consumption for One Shape File耗时/s 备注 导入内存数据库 20.6 - 内存图层切分图幅 2.3 12列×3行 追加到目标图层 46.7 - 总计 69.6 - 4) 实验结果
基于以上方案,对5.4TB的矢量数据采用2个存储节点、60进程并发入库并建立空间索引的总时间耗费为3 h 42 min,有效地保障了海量数据高并发环境下的入库效率。
3.3 叠加分析统计实验
实验目标:从MongDB中提取安徽省相关数据,并对安徽省各县市土地覆盖类型进行分类统计。参与叠加分析的安徽省行政区划图层为L_AnHui,包含105个面对象。
实验目的:对本文的空间索引策略的有效性进行验证;对本文的内存数据库、关系型数据库和分布式数据库的协同应用策略进行验证。
实验步骤分为数据提取到关系型数据库PostgreSQL和基于关系型数据库的叠加分析统计。
1) 数据提取过程
充分利用基于元数据的空间索引,提取图幅粒度的相关数据输入PostgreSQL数据库。
(1) 根据L_AnHui得到矩形查询范围rcBounds;
(2) 查询元数据表找到与查询范围(rcBounds)相关的layer:L1,L2,…,Ln。数据入库后,存储结点、数据库和图层级别的元数据总计354条,因此对元数据的范围查询时间在ms级别;
(3) 对图层Li查询rcBounds相关的图幅Ti1 ,Ti2…Tim;
(4) 取图层Li的Ti1 ,Ti2,…,Tim图幅的数据,采用图幅追加的方式写入PostgreSQL。
各步骤时间统计见表 3。与安徽省相关的图层共计8个,这8个图层中再次过滤得到3 861个图幅。最终分8个图层启用8个进程写入PostgreSQL,总对象数12 574 739。
2)叠加分析统计
在PostgreSQL中对提取的土地覆盖数据与L_AnHui进行叠加裁剪,并按土地覆盖类型字段CType对各县市进行分类统计求和。假设L_AnHui中的对象为A1,A2,…,An,土地覆盖数据各layer为L1,…,Lm,对于Ai和Lj计算步骤如下。
表 3 数据提取时间记录Table 3. Data Extraction Bases on Spatial Index耗时/s 备注 元数据查询 0.6 - 图层内图幅查询 2.3 8个图层 图幅数据追加 978 3 861个图幅 总计 981 12 574 739对象 (1) 通过Lj的图幅索引,提取被Ai完全包含的图幅TID_in和相交的图幅TID_intersect。通过图幅TID_in取对象面积以及CType值,得到结果R_in1;
(2) 对于TID_intersect提取各图幅中空间对象的四至,与Ai叠加:被Ai包含的取出对象面积及CType值,写入结果R_in2;相交的对象写入内存数据库图层Mem layer等待计算;
(3) 在内存数据库中对Mem layer和Ai进行叠加裁剪(线段打散→求交→拓扑构面),并计算裁剪后的对象面积,得到结果R_clip;
(4) R_in1、R_in2和R_clip结果合并。
该过程通过逐级过滤,尽量过滤掉不需要进行叠加裁剪的对象,并将裁剪过程迁移至内存数据库,减少计算过程中对数据库的频繁访问,提高计算效率。
表 4对比了是否采用内存数据库的测试结果,实验中实际参与叠加计算的对象总数为182 947个。
3) 实验结果
本实验中,基于元数据的空间索引能够快速过滤定位到相关图幅,从MongoDB中提取安徽省相关数据并输入PostgreSQL的耗时主要用在数据的I/O;叠加分析和统计过程中采用内存数据源减少了与数据库的交互,有效提高了空间分析的效率。
表 4 各图层叠加统计耗时Table 4. Time Consumption on Overlay Analysis图层 图幅数 对象数 耗时A/s 耗时B/s(内存数据库) L1 73 253 454 192 126 L2 385 1 264 189 643 397 L3 656 2 159 563 1072 658 L4 656 2 111 632 1123 744 L5 658 2 176 057 1070 723 L6 762 2 475 838 1119 691 L7 581 1 879 148 649 419 L8 90 254 858 215 141 4 结 语
面向大数据的空间数据分布式存储策略结合了传统的基于关系型数据库的GIS基本能力和NoSQL数据库提供的大数据分布式存储能力,既满足了大数据存储的需要,又保证了整个系统对外提供的GIS功能不退化。本文基于SQLite、PostgreSQL和MongoDB数据库,开发了原型系统,并选取了两个实验场景对该存储策略的有效性进行了验证。空间大数据的存储和管理是一个相对复杂的问题,根据应用的实际情况,大数据的空间索引策略、数据分解方法、数据调度策略等都值得进一步深入研究。
-
表 1 各数据库中空间数据存储组织方式
Table 1 Object Types Mapping in Database
SQLite:Mem PostgreSQL MongoDB 空间位置信息存储格式 Text bin BSON 数据源对应的数据库对象 database database database 图层对应的数据库对象 table table collection 空间对象对应的数据库对象 row row document 表 2 单个要素平均处理时间
Table 2 Average Time Consumption for One Shape File
耗时/s 备注 导入内存数据库 20.6 - 内存图层切分图幅 2.3 12列×3行 追加到目标图层 46.7 - 总计 69.6 - 表 3 数据提取时间记录
Table 3 Data Extraction Bases on Spatial Index
耗时/s 备注 元数据查询 0.6 - 图层内图幅查询 2.3 8个图层 图幅数据追加 978 3 861个图幅 总计 981 12 574 739对象 表 4 各图层叠加统计耗时
Table 4 Time Consumption on Overlay Analysis
图层 图幅数 对象数 耗时A/s 耗时B/s(内存数据库) L1 73 253 454 192 126 L2 385 1 264 189 643 397 L3 656 2 159 563 1072 658 L4 656 2 111 632 1123 744 L5 658 2 176 057 1070 723 L6 762 2 475 838 1119 691 L7 581 1 879 148 649 419 L8 90 254 858 215 141 -
[1] Mooney P, Corcoran P, Winstanley A C. Geospatial Data Issues in the Provision of Location-based Services[C].Proceedings of the 7th International Symposium on LBS & Telecartography, Guangzhou, China, 2010
[2] 龚健雅.空间数据库管理系统的概念与发展趋势[J].测绘科学, 2001, 26(3):4-9 http://www.cnki.com.cn/Article/CJFDTOTAL-CHKD200103001.htm Gong Jianya. Concepts and Development of Spatial Database Management System[J]. Science of Surveying and Mapping, 2001, 26(3):4-9 http://www.cnki.com.cn/Article/CJFDTOTAL-CHKD200103001.htm
[3] 刘经南, 方媛.位置大数据的分析处理研究进展[J]. 武汉大学学报·信息科学版, 2014, 39(4):380-385 http://ch.whu.edu.cn/CN/abstract/abstract2947.shtml Liu Jingnan, Fang Yuan. Research Progress in Location Big Data Analysis and Processing[J].Geomatics and Information Science of Wuhan University,2014, 39(4):380-385 http://ch.whu.edu.cn/CN/abstract/abstract2947.shtml
[4] 周芹,李绍俊.基于Oracle Spatial的空间数据库缓存技术研究[J].地球信息科学, 2007, 9(3):39-44 http://www.cnki.com.cn/Article/CJFDTOTAL-DQXX200703010.htm Zhou Qin, Li Shaojun. Study on Spatial Data Cache Technology Based on Oracle Spatial[J].Geo-Information Science, 2007, 9(3):39-44 http://www.cnki.com.cn/Article/CJFDTOTAL-DQXX200703010.htm
[5] 周芹,李绍俊,李云锦,等.空间数据库引擎的关键技术及发展[C]. 中国地理信息系统协会第四次会员代表大会, 北京,2007 Zhou Qin, Li Shaojun, Li Yunjin, et al. The Key Technique and Development of Spatial Database Engine[C]. The Fourth Member Representative Assembly of China Geographic Information System Association, Beijing, China, 2007
[6] Zhong Y, Han J, Zhang T, et al. A Distributed Geospatial Data Storage and Processing Framework for Large-scale WebGIS[C]. The 20th International Conference on Geoinformatics, Hong Kong. China, 2012
[7] Han D, Stroulia E. HGrid:A Data Model for Large Geospatial Data Sets in HBase[C]. Proceedings of the 2013 IEEE Sixth International Conference on Cloud Computing, CA. USA, 2013
[8] Wei L Y, Hsu Y T, Peng W C, et al. Indexing Spatial Data in Cloud Data Managements[J].Pervasive and Mobile Computing, 2014, 15:48-61 doi: 10.1016/j.pmcj.2013.07.001
[9] 陈崇成, 林剑峰, 吴小竹, 等.基于NoSQL的海量空间数据云存储与服务方法[J].地球信息科学学报, 2013, 15(2):166-174 doi: 10.3724/SP.J.1047.2013.00166 Chen Chongcheng, Lin Jianfeng, Wu Xiaozhu,et al. Massive Geo-spatial Data Cloud Storage and Services Based on NoSQL Database Technique[J]. Journal of Geo-Information Science, 2013, 15(2):166-174 doi: 10.3724/SP.J.1047.2013.00166
[10] Chang F, Dean J, Ghemawat S, et al. Bigtable:A Distributed Storage System for Structured Data[J].ACM Transactions on Computer Systems, 2008, 26(2):1-26 http://cn.bing.com/academic/profile?id=6034c75210d72de01b3e8b076389df33&encoded=0&v=paper_preview&mkt=zh-cn
[11] Ghemawat S, Gobioff H, Leung S T. The Google File System[C]. 19th ACM Symposium on Operating Systems Principles, New York, USA, 2003
[12] Burrows M. The Chubby Lock Service for Loosely-coupled Distributed Systems[C]. Proceedings of the 7th Symposium on Operating Systems Design and Implementation, Berkeley, USA, 2006
[13] 陈吉荣,乐嘉锦.基于Hadoop生态系统的大数据解决方案综述[J].计算机工程与科学, 2013, 35(10):25-35 http://www.cnki.com.cn/Article/CJFDTOTAL-JSJK201310004.htm Chen Jirong, Le Jiajin. Reviewing the Big Data Solution Based on Hadoop Ecosystem[J]. Computer Engineering & Science, 2013, 35(10):25-35 http://www.cnki.com.cn/Article/CJFDTOTAL-JSJK201310004.htm
[14] Hecht R, Jablonski S. NoSQL Evaluation:A Use Case Oriented Survey[C]. 2011 International Conference on Cloud and Service Computing, Hong Kong, China, 2011
[15] 李绍俊,钟耳顺,周芹,等.开放式空间数据库访问接口的开发应用[J].地球信息科学学报, 2013, 10(2):193-199 http://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201302007.htm Li Shaojun, Zhong Ershun, Zhou Qin,et al. Study on Opening Geospatial Database Connectivity[J].Journal of Geo-Information Science,2013, 10(2):193-199 http://www.cnki.com.cn/Article/CJFDTOTAL-DQXX201302007.htm
-
期刊类型引用(66)
1. 韩烨. 基于大数据技术的非关系型数据库分布式存储方法研究. 信息与电脑(理论版). 2024(04): 166-168 . 百度学术
2. 黄小冬,陈薇. 虚拟仿真实训基地成果积分管理系统设计. 现代信息科技. 2024(08): 24-27 . 百度学术
3. 付艳丽,邵飞,王海斌. 矢量空间数据文档存储模型研究. 电脑与信息技术. 2024(03): 78-81 . 百度学术
4. 袁泽文,周国成,周胜洁,邸国辉. 分布式存储与计算方法在水利地理空间大数据中的应用. 测绘与空间地理信息. 2024(07): 10-13 . 百度学术
5. 李兴能. 通信运营信息的大数据采集及存储系统. 信息记录材料. 2024(07): 184-186 . 百度学术
6. 王阳,周小虎,史小辉,黄琪,刘禄山. 青藏高原东北缘清水河流域地貌特征及其构造意义. 成都理工大学学报(自然科学版). 2024(04): 624-639+648 . 百度学术
7. 彭志忠,袁飞云,何朝阳,李东来,解明礼,饶泽迅. 地质灾害多源基础数据结构体系及应用. 成都理工大学学报(自然科学版). 2024(04): 675-686 . 百度学术
8. 方乾,张晓霞,王霖,石磊,王雅琨. 智能化煤矿大数据治理关键技术研究、实践与应用. 工矿自动化. 2023(05): 37-45+73 . 百度学术
9. 谌诞楠,关雪峰,韩林栩,向隆刚,吴华意. VA-HBase:一种面向矢量数据的自适应分布式管理方案. 武汉大学学报(信息科学版). 2023(12): 1999-2008 . 百度学术
10. 宋德周. 大数据背景下数据库技术应用分析. 软件. 2022(01): 99-101 . 百度学术
11. 王伟,姚晓婧,蒋许峰,陈静,刘烁. 高性能瓦片数据存储与发布应用技术研究. 天津职业技术师范大学学报. 2022(02): 15-22 . 百度学术
12. 徐子君,郑杰,吴华意. 一站式遥感大数据分布式管理与训练云平台. 测绘地理信息. 2022(S1): 80-84 . 百度学术
13. 曾初阳,陈刚,庞晓健,吴金宇,胡海生. 数据存储技术在电力监控系统安全审计平台中的应用. 数字技术与应用. 2022(08): 143-145 . 百度学术
14. 唐时荞. 基于GIS的智慧园区动态感知数据服务平台的设计与实现. 物联网技术. 2022(09): 32-34 . 百度学术
15. 陈真玄,王琳,张怡,孟庆学. 水文预报业务非结构化数据库选型探索. 水利信息化. 2022(05): 43-47 . 百度学术
16. 袁智勇,肖泽坤,于力,徐全,林跃欢,李培强,何西. 智能电网大数据研究综述. 广东电力. 2021(01): 1-12 . 百度学术
17. 余列冰,向隆刚,孙尚宇,关雪峰,吴华意. 面向分布式列式存储的轨迹大数据k近邻查询. 武汉大学学报(信息科学版). 2021(05): 736-745 . 百度学术
18. 奚军庆,李绍俊,李波. 分布式系统设计中NewSQL数据库技术的应用. 长江信息通信. 2021(05): 64-67 . 百度学术
19. 赵鹏飞,赵敏,王亮. 省级国土空间基础信息平台建设关键技术研究. 测绘与空间地理信息. 2021(S1): 106-109 . 百度学术
20. 李正伟. 大数据分析视域下分布式MOLAP技术运用. 电子技术与软件工程. 2021(13): 185-186 . 百度学术
21. 刘娜. 分布式数据库查询优化研究. 微型电脑应用. 2021(08): 108-111 . 百度学术
22. 赵秋菊. 新疆自然资源一体化数据库构建及应用. 测绘与空间地理信息. 2021(09): 151-154+160 . 百度学术
23. 刘汉龙,马彦彬,仉文岗. 大数据技术在地质灾害防治中的应用综述. 防灾减灾工程学报. 2021(04): 710-722 . 百度学术
24. 余秋实,邵燕林. 空间数据库的回归与发展趋势. 地理空间信息. 2021(11): 31-33+6 . 百度学术
25. 申红雪,郭延哺. 分布式数据库研究新趋势. 软件. 2021(10): 31-34 . 百度学术
26. 刘慧慧. 基于NoSQL技术的卫星配载数据管理系统设计. 廊坊师范学院学报(自然科学版). 2021(04): 34-37 . 百度学术
27. 虢莉娟. 大数据时代的数据库建设与应用. 信息技术与信息化. 2021(11): 81-83 . 百度学术
28. 陈钊,白穆,郭春喜,余晓松,王泓森. 地理空间大数据中心基础设施架构研究与应用. 测绘与空间地理信息. 2021(12): 141-143+149 . 百度学术
29. 平宗玮. 大数据存储技术在测绘数据管理中的应用. 地矿测绘. 2021(04): 1-6+11 . 百度学术
30. 温建伟,张立,李永利. 面对气象大数据的存储管理与快速查询的技术研究. 河南科技. 2021(26): 144-146 . 百度学术
31. 奥勇,李美丽,赵永华,孙佳佳,付泉. 分布式数据库中数据集成与共享的研究进展. 科技与创新. 2020(01): 31-35 . 百度学术
32. 卢万杰,徐青,蓝朝桢,吕亮,施群山. 基于SQL/NoSQL的空间目标光学特性数据混合存储策略. 天文学报. 2020(01): 59-69 . 百度学术
33. 张生鹏. 基于WebGIS的公示地价信息管理平台的设计与实现. 地理空间信息. 2020(04): 79-83+7 . 百度学术
34. 陈敬彬. 基于NoSQL数据库的空间大数据分布式存储策略. 计算机产品与流通. 2020(08): 40 . 百度学术
35. 陈勉,李龙海,谢鹏,付少锋,何列松,周校东. 基于Phoenix的地理空间大数据管理系统. 武汉大学学报(信息科学版). 2020(05): 719-727 . 百度学术
36. 张凯斐,王翠娥. 分布式空间数据库有效数据高效检测方法. 吕梁学院学报. 2020(02): 39-42 . 百度学术
37. 刘延芳. 基于二分图的动态排课系统的设计与实现. 滁州学院学报. 2020(02): 122-127 . 百度学术
38. 杨帆,高国静,张怡锋. 并行计算框架的内存优化算法研究. 信息技术. 2020(08): 132-135+140 . 百度学术
39. 徐万江. 大数据时代信息与计算科学专业数据库原理课程改革研究. 电脑知识与技术. 2020(25): 156-157+165 . 百度学术
40. 龚利,谯兵,赵超,姚凯. 机务安全监测及检测数据融合与应用研究. 控制与信息技术. 2020(05): 62-67 . 百度学术
41. 林徐. 一种关系型数据非结构化的转换方法. 榆林学院学报. 2020(06): 69-72 . 百度学术
42. 屈志坚,范明明,赵亮,朱丹,孙旭兵,王子潇. 基于倒排索引的铁道供电集群监控H-CRQ技术. 铁道学报. 2020(11): 75-83 . 百度学术
43. 吴华意,成洪权,郑杰,祁昆仑,杨红兵,李学锡. RS-ODMS:一种分布式遥感数据在线管理与服务框架. 武汉大学学报(信息科学版). 2020(12): 1836-1846 . 百度学术
44. 徐拥军,何文春,刘媛媛,王琦. 气象大数据存储体系设计与实现. 电子测量技术. 2020(22): 19-25 . 百度学术
45. 张雪英,闾国年,叶鹏. 大数据地理信息系统:框架、技术与挑战. 现代测绘. 2020(06): 1-8 . 百度学术
46. 刘纪平,董春,亢晓琛,邱士可,赵荣,栗斌,孙立坚. 大数据时代的地理国情统计分析. 武汉大学学报(信息科学版). 2019(01): 68-76+83 . 百度学术
47. 潘少明,赖新果,种衍文,李红. 用户访问驱动的空间数据存储组织策略. 武汉大学学报(信息科学版). 2019(02): 296-301+309 . 百度学术
48. 唐桂文,韩嘉福,李洪省. 面向空间大数据的分布式存储策略. 计算机技术与发展. 2019(03): 194-197 . 百度学术
49. 姚立群,邓攀,任海,白亮,邱源,张凤源,李辉勇,牛建伟. 星载多源数据的分布式存储与快速检索系统设计. 单片机与嵌入式系统应用. 2019(04): 1-5 . 百度学术
50. 蒋元义,金宝轩,赵康,朱文. 一种基于NoSQL数据库与瓦片技术的WebGIS系统架构研究. 工程勘察. 2019(09): 64-68+74 . 百度学术
51. 黄培. 基于非关系数据库的文件型大数据存储技术研究. 电脑知识与技术. 2019(23): 3-4 . 百度学术
52. 李斌,郭景维,彭骞. 面向大数据存储的HBase二级索引设计. 计算技术与自动化. 2019(02): 124-129 . 百度学术
53. 王艳喜. 探索基于NoSQL数据库的空间大数据分布式存储策略. 数码世界. 2019(10): 76 . 百度学术
54. 华满,邵雄凯,高榕. 基于Spark的电信用户画像的研究应用. 湖北工业大学学报. 2019(05): 78-82 . 百度学术
55. 戴昀. 基于大数据背景的数据库技术应用现状与发展方向研究. 数字技术与应用. 2019(10): 86-87 . 百度学术
56. 龚健雅,张翔,向隆刚,陈能成. 智慧城市综合感知与智能决策的进展及应用. 测绘学报. 2019(12): 1482-1497 . 百度学术
57. 荣雪琴,刘勇,刘昊,卜树坡. 基于时序数据库的电力运维系统关键技术研究. 电测与仪表. 2018(09): 48-51+83 . 百度学术
58. 蔡亮,鲁俊,程雅琼. 智慧校园建设平台下系统负载分析研究. 兰州文理学院学报(自然科学版). 2018(04): 68-72 . 百度学术
59. 陈长林,申家双,贾俊涛,王耿峰,邹永刚. 基于混合云模式的海洋基础地理信息云服务. 海洋测绘. 2018(03): 43-47 . 百度学术
60. 张慧宁,李拥军,王绍东. Redis压缩列表研究与优化设计. 计算机工程与应用. 2018(18): 90-98+124 . 百度学术
61. 沈洋. NoSQL数据库中的空间大数据分布式存储实现研究. 科技风. 2018(23): 224 . 百度学术
62. 王大冬. NoSQL技术在气象传感器数据处理中的应用. 科技风. 2018(26): 111-112 . 百度学术
63. 刘阳娜. 基于NoSQL数据库下空间大数据分布式存储策略的分析. 数字技术与应用. 2018(02): 77+79 . 百度学术
64. 刘丽婕,杨昆桦,王泽芬,蒋友权. 信息碎片化的模式探讨企业大数据的挖掘. 电力大数据. 2018(12): 76-82 . 百度学术
65. 关雪峰,曾宇媚. 时空大数据背景下并行数据处理分析挖掘的进展及趋势. 地理科学进展. 2018(10): 1314-1327 . 百度学术
66. 周杨,胡校飞,靳彩娇,张龙,陈安东. 图形图像融合的海量建筑绘制. 中国图象图形学报. 2018(07): 1072-1080 . 百度学术
其他类型引用(68)