一、数据获取与预处理
-
数据来源选择
全国A级景区数据可从各省文化和旅游厅官网、国家文化和旅游部网站或第三方GIS数据平台获取。推荐使用2020-2021年更新的矢量数据(shp格式)或Excel表格,其中包含景区名称、地址、等级及WGS84经纬度信息。例如:- 数据字段示例:景区名称、地址、等级、经度(Lon)、纬度(Lat)。
- 格式要求:优先选择包含空间坐标的shp文件(点数据)或标准化CSV文件。
-
数据清洗与校验
- 去重处理:通过Excel的"删除重复项"或QGIS的"删除重复几何"工具,消除同一景区的重复记录。
- 缺失值处理:若经纬度字段缺失,可结合景区地址通过地理编码插件(如MMQGIS)补全坐标。
- 异常值检测:筛选经度范围(73°E-135°E)、纬度范围(3°N-54°N)外的异常坐标,并人工核查修正。
-
格式统一化
- 将Excel数据转换为UTF-8编码的CSV文件,避免中文乱码。
- 若使用分省数据(如各省单独shp文件),需通过QGIS的"合并矢量图层"工具整合为全国数据集。
二、QGIS数据导入与坐标验证
-
导入矢量数据(shp格式)
- 操作路径:
图层 → 添加图层 → 添加矢量图层
。 - 坐标系设置:选择WGS84(EPSG:4326)。
- 属性表检查:右键图层选择"打开属性表",确认经度(X)、纬度(Y)字段存在且数值合理。
- 操作路径:
-
导入CSV文本数据
- 操作路径:
图层 → 数据源管理器 → 分隔文本
。 - 参数设置:
- 操作路径:
- 文件格式:CSV,编码选GBK或UTF-8。
- X字段:经度(Longitude);Y字段:纬度(Latitude)。
- 坐标系:强制指定为WGS84(EPSG:4326)。
- 示例代码(用于检测导入异常):
SELECT * FROM 景区表 WHERE Lon NOT BETWEEN 73 AND 135 OR Lat NOT BETWEEN 3 AND 54;
- 示例代码(用于检测导入异常):
- 可视化验证
- 叠加底图:通过
XYZ Tiles
加载OpenStreetMap或高德地图,观察景区点位是否与真实位置匹配。 - 空间分布分析:使用QGIS的"点密度分析"工具,检测是否存在坐标聚集异常(如大量景区集中在同一经纬度)。
- 叠加底图:通过
三、坐标提取与导出
-
直接导出属性表
- 操作路径:右键图层 →
导出 → 保存要素为
。 - 格式选择:CSV、Excel或GeoJSON,保留"经度"、"纬度"字段。
- 编码设置:导出CSV时选择UTF-8,避免中文乱码。
- 操作路径:右键图层 →
-
脚本批量处理(Python示例)
使用QGIS内置Python控制台批量导出多省份数据:import processing layers = QgsProject.instance().mapLayers().values() for layer in layers: if layer.name().startswith("A级景区"): output_path = f"C:/output/{layer.name()}.csv" processing.run("qgis:exportaddstabletolayer", { 'INPUT': layer, 'OUTPUT': output_path })
运行
-
高级导出需求
- KML格式:适用于Google Earth可视化,导出时选择
Keyhole Markup Language (KML)
。 - GeoPackage:适用于多图层集成存储,通过
导出 → GeoPackage
实现。
- KML格式:适用于Google Earth可视化,导出时选择
四、数据质量提升技术
- 地理编码补全缺失坐标
- 安装MMQGIS插件:
插件 → 管理插件 → 搜索MMQGIS
。 - 批量补全地址坐标:
- 安装MMQGIS插件:
- 输入文件:包含"地址"字段的CSV。
- 服务选择:高德地图API(需申请密钥)或OpenStreetMap。
- 输出字段:自动生成"经度"、"纬度"列。
-
坐标纠偏技术
若原始数据使用GCJ-02或BD-09坐标系,需通过HCMGIS
插件转换为WGS84:- 操作路径:
HCMGIS → 工具 → 坐标系转换
。 - 参数设置:输入坐标系选GCJ-02,输出选WGS84。
- 操作路径:
-
异常值修正方法
- 人工修正:通过
Lat Lon Tools
插件点击地图获取准确坐标。 - 交叉验证:对比国家地理信息公共服务平台(天地图)的POI数据。
- 人工修正:通过
五、可视化与成果应用
-
热力图分析
使用QGIS的"热力图渲染"功能,分析景区分布密度:- 半径设置:50公里(全国尺度)。
- 配色方案:从蓝色(低密度)到红色(高密度)。
-
ECharts动态可视化
导出CSV数据后,通过ECharts生成交互式地图:option = { series: [{ type: 'scatter', coordinateSystem: 'geo', [ [116.40, 39.90, '故宫'], [120.15, 30.25, '西湖'], // ...其他景区数据 ], symbolSize: 8, label: { show: true } }] };
运行
-
空间分析扩展
- 缓冲区分析:计算5A级景区周边10公里内的交通设施覆盖率。
- 可达性评估:通过
Service Area
工具分析高铁站到景区的通行时间。
六、注意事项与常见问题
-
坐标系一致性
- 确保所有数据统一为WGS84(EPSG:4326),避免混合使用GCJ-02或CGCS2000。
- 投影转换工具:
处理工具箱 → 矢量通用 → 重投影图层
。
-
性能优化
- 大数据处理:对全国1.2万+景区数据启用空间索引(
图层属性 → 源 → 创建空间索引
)。 - 分省处理:通过
按属性分割
工具分批次导出,减少内存占用。
- 大数据处理:对全国1.2万+景区数据启用空间索引(
-
法律与数据伦理
- 遵守《地理信息安全保密规定》,不得公开军事禁区、自然保护区等敏感区域坐标。
- 引用数据需注明来源(如"数据来源于各省文化和旅游厅,2020年")。