大家好,地理空间数据分析在城市规划、环境研究、农业和交通等行业中至关重要。不断增长的需求导致Python包在各种地理数据分析要求上的使用增加,例如分析气候模式、研究城市发展或跟踪疾病传播等,评估和选择具有快速处理、修改和可视化能力的正确工具对于有效分析和可视化地理空间数据至关重要。
首先,了解什么是地理空间数据至关重要。地理空间数据是具有地理成分的数据,表示地球表面上对象、特征或事件的位置和特性。它描述了物理宇宙中各种物体的空间连接、分布和属性。地理空间数据主要有两种类型:
-
栅格数据(Raster data):适用于没有固定边界的连续信息,表示为具有值的单元格网格,这些值表示观察到的特征。通常在固定的时间间隔上进行监测,并进行插值以创建连续表面。
-
矢量数据(Vector data):使用点、线和多边形来表示空间属性,包括兴趣点、交通网络、行政边界和土地地块等,通常用于具有精确位置或硬约束的离散数据。
地理空间数据可以以多种格式存储,如 ESRI Shapefile、GeoJSON、Erdas Imagine Image File Format(EIF)、GeoTIFF、Geopackage(GPKG)、GeoJSON、Light Detection、Ranging(LiDAR)等。
地理空间数据涵盖了各种类型,例如卫星图像、高程模型、点云、土地利用分类和基于文本的信息,为跨行业的空间分析和决策提供了有价值的洞察,微软、谷歌、Esri和亚马逊网络服务等大型公司都利用地理空间数据来获得有价值的洞察。接下来一起了解一下地理空间数据分析的五大Python包,这些包能够进行数据读取/写入、操作、可视化、地理编码和地理索引,适用于初学者和有经验的用户,为地理空间数据的有效探索、可视化和洞察提供支持。
1. Geopandas
适用于:矢量数据
Geopandas是一个广泛使用的Python库,用于处理矢量地理空间数据,在Pandas DataFrames中提供直观的地理数据处理,它支持Shapefile和GeoJSON等格式,并提供合并、分组和空间连接等空间操作。Geopandas可以与流行的库(如Pandas、NumPy和Matplotlib等)无缝集成,它可以处理大型数据集,但这可能带来挑战。Geopandas包通常用于空间数据分析任务,包括空间连接、查询以及缓冲区和交叉分析等地理空间操作,需要使用不同的包,如Shapely处理几何操作,Fiona访问文件,以及matplotlib绘图。
例如,可以使用Geopandas来探索房地产数据,以确定城市中最昂贵的街区,或者分析人口数据以可视化不同社区的增长和迁移模式。
可以使用以下pip
命令安装该包:
pip install geopandas
使用GeoPandas进行绘图,通过以下代码查看内置地图:
import geopandas
# 检查可用地图
geopandas.datasets.available
本文将使用GeoPandas加载世界地图数据集,提取美国的形状文件,并使用以下代码将其绘制在图表上:
# 选择特定地图
geopandas.datasets.get_path('naturalearth_lowres')
# 打开所选地图-GeoDataFrame
world = geopandas.read_file(geopandas.datasets.get_path('naturalearth_lowres'))
# 创建GeoDataFrame的子集
usa = world[world.name == "United States of America"]
# 绘制子集
usa.plot();
以上代码将打印出一个子集数据框的地图:
2. Folium
适用于:点云
Folium是一个用于创建带有标记、弹出式窗口、choropleth和其他地理空间可视化的Python库,它与Leaflet JavaScript库集成,并允许将地图导出为HTML。并且可以与Geopandas和Cartopy结合使用,并使用Map Tiles处理大型数据集。Folium在简洁性、美观性以及与其他地理空间库的集成方面表现出色,然而对于高级地理空间分析和操作,Folium可能存在一些局限性。
例如,Folium可用于供应链和物流领域,用于可视化分销网络、优化路线和监测货物位置及装运地点。可以使用以下命令安装Folium:
pip install folium
现在可以使用以下几行代码在以[0, 0]为中心的示例交互式地图上放置一个标记:
import folium
# 以中心坐标(0, 0)生成Folium地图
map = folium.Map(location=[0, 0], zoom_start=2)
# 定位坐标(0, 0)
folium.Marker([0, 0]).add_to(map)
# 显示地图
map
可以根据特定的地理空间数据进一步自定义此地图,例如添加标记、图层或样式选项。
3. ipyleaflet
适用于:点云,交互式
ipyleaflet包能够在Python中轻松创建交互式地图,特别适用于Jupyter笔记本,在其中允许用户生成和共享具有各种底图、标记和其他地理空间操作的交互式地图。ipyleaflet基于Leaflet JavaScript库构建,支持GeoJSON和WMS图层、CSS和JavaScript样式以及地理空间计算。虽然ipyleaflet在交互式小部件方面表现出色,但由于其依赖于JavaScript,对于纯Python项目可能不是理想选择。
例如,ipyleaflet可以应用于环境监测,以可视化传感器数据、监测空气质量并实时评估环境变化。要安装ipyleaflet,可以使用以下pip
命令:
pip install ipyleaflet
使用ipyleaflet绘图,用以下代码在地图上创建一个标记,该标记位于纽约市的坐标(40.7128,-74.0060)处,以表示感兴趣的点:
from ipyleaflet import Map, Marker
# 创建地图
m = Map(center=(40.7128, -74.0060), zoom=12)
# 添加标记
marker = Marker(location=(40.7128, -74.0060))
m.add_layer(marker)
以下是代码的输出结果:
4. Rasterio
适用于:栅格数据
Rasterio是一个功能强大的Python库,用于处理地理空间栅格数据,具有高效的性能和广泛的操作,如裁剪、重投影和重采样。它支持各种栅格格式,并与其他地理空间库良好集成,尽管在处理矢量数据和复杂分析任务方面存在一些限制。然而,Rasterio是Python中高效操作和处理栅格数据的必备工具。
例如,Rasterio可用于读取和写入卫星图像、进行地形分析、从数字高程模型中提取数据以及进行遥感分析等任务。
!pip install rasterio
rasterio.open()
函数用于打开文件,read()
方法将图像读取为NumPy数组。最后,使用Matplotlib中的plt.imshow()
函数显示图像,plt.show()
在输出中显示绘图。
import rasterio
from rasterio.plot import show
使用rasterio库打开并可视化来自kaggle数据集“High-resolution GeoTIFF images of climatic data”中的sample.tif
文件的栅格图像,将红色通道(图像中的一种颜色通道)作为子图使用Reds颜色映射进行显示,将原始图像(包含多个颜色通道)作为另一个子图使用viridis颜色映射进行显示。也可以使用相同的方法可视化其他颜色通道,如绿色和蓝色。
src = rasterio.open('/content/sample.tif')
plt.figure(figsize=(15,10))
fig, (axr, axg) = plt.subplots(1,2, figsize=(15,7))
show((src, 1), ax=axr, cmap='Reds', title='red channel')
show((src), ax=axg, cmap='viridis', title='original image')
plt.show()
原始GeoTIFF图像(右)来源:Kaggle.com
https://www.kaggle.com/datasets/abireltaief/highresolution-geotiff-images-of-climatic-data
在地理空间分析中,分析特定的颜色通道(如红色、蓝色和绿色)是为了关注或提取与图像中那些颜色分量相关的特定属性、特征或特征所表示的有价值信息,可以用于遥感中的植被健康、植被指数或水体等方面。
5. Geoplot
适用于:矢量数据,交互式
Geoplot是一个用户友好型的Python库,可以快速创建具有吸引力的地理空间可视化效果,包括等值线地图和散点图,它与流行的数据处理库(如Pandas等)无缝集成,并支持多种地图投影。然而,Geoplot在交互式地图支持和绘图类型方面存在一些限制,比专门的地理空间库要少。尽管如此,它仍然对于快速实现地理空间数据可视化和获取空间模式的洞察力非常有价值。
!pip install geoplot
本文将使用Geoplot绘制一个等值图可视化,根据世界形状文件中的“continent
”属性选择亚洲国家,根据“pop_est
”属性分配颜色强度,并使用带图例的“icefire
”彩色地图进行绘制,图例的尺寸大小为10x5。
import geoplot
# 绘制亚洲人口分布图
asia = world.query("continent == 'Asia'")
geoplot.choropleth(asia, hue = "pop_est", cmap = "icefire",legend=True, figsize = (10, 5));
例如,geoplot
包可以创建choropleth地图,用于可视化人口密度、绘制犯罪事件的空间模式、显示环境因素的分布,并根据地理数据分析疾病的传播。