天气数据集-Jena Climate dataset

天气数据集-Jena Climate dataset

1.数据集基本信息

  • Dataset Name:  mpi_saale_2021b.csv  

  • Size: 26495 rows;  1 year (2021), 10 min  

  • 气象学、农业、环境科学

  • 开源机构:  Max Planck Institute for Biogeochemistry

2.数据特征

2.1 特征简介

  • 数据共有31个特征,包括一些地理测量数据,如气压、温度、湿度、降雨量、风向等等

  • 我们是希望通过各种测量数据预测气温,这里很多特征是类似的,比如不同高度下的温度就是彼此相似

2.2 特征可视化

因为这个数据随时间变化,我们直接画出数据各个特征随时间变化的趋势图, 这里用index作为x 轴:

2.3 数据特征细节

1. ‘Date Time', 日期和时间



2. ‘p (mbar)',  大气压力(毫bar) 



3. ’T (degC)',  温度(摄氏度)



4. ‘rh (%)', relative_humidity 相对湿度 (%)



5. ‘sh (g/kg)', 每千克空气中的水汽含量



6. ‘Tpot (K)', 相当位温(以开尔文为单位)



> 指在将大气气块压缩或扩张到参考压力下(通常为1000毫巴),使其在对流过程中不发生任何相变(即凝结或蒸发)的温度



  > 开尔文(Kelvin)是温度的国际单位,通常用于科学和工程领域。开尔文温度标度是绝对温度标度,以绝对零度(零度的-273.15摄氏度)作为零点。开尔文温度通常用符号 "K" 表示,不加摄氏度符号。因此,绝对零度为0K,而水的冰点是273.15K,水的沸点是373.15K。



> 空气在湿度和压力保持恒定时的温度

       

7. ‘Tdew (degC)', 露点温度(以摄氏度为单位)



  > 指空气在恒定压力下,通过降低温度使其饱和,产生露珠或霜的温度。简单来说,就是当空气中的水汽凝结成液态水或冰时的温度。露点温度通常用来描述空气中的湿度。当露点温度与空气温度相近时,空气的相对湿度较高;当它们之间的差距较大时,相对湿度较低。



  > 在气象学中,露点温度是一个重要的指标,用于衡量空气中的水汽含量以及空气的湿度。较高的露点温度意味着空气中含有较多的水汽,较低的露点温度则表示空气较为干燥。露点温度也是天气预报中的一个重要参数,因为它与空气中的水汽含量直接相关,对天气的变化和降水的可能性具有一定的预测意义。



8. ‘VPmax (mbar)', 最大水汽压力(以毫巴为单位)



> 在达到饱和状态时,液体表面的蒸汽压力达到最大值,此时液体中的分子以与气体中相同的速率从液体表面蒸发,并与气体中的分子再次凝结,这样就建立了动态平衡。



9. ’VPact (mbar)', 实际水汽压力(以毫巴为单位)



> 液体表面上的蒸汽与液体达到动态平衡时的压力。液体分子会不断从液体表面蒸发成气体,同时也会有气体分子再凝结成液体,当这两个过程达到平衡时,液体表面上就会有一定的蒸汽压。蒸汽压受温度和液体性质的影响,温度越高,蒸汽压越高;液体的性质(比如分子间力)也会影响蒸汽压的大小。



10. ‘VPdef (mbar)', 水汽压力缺失(以毫巴为单位)



> 际水汽压力与空气中饱和水汽压力之间的差值



11. ‘H2OC (mmol/mol)', 水汽含量(以毫摩尔/毫摩尔为单位)



12. ‘rho (g/m**3)', 空气密度(以克/立方米为单位)



13. ‘wv (m/s)',  风速 (米/秒)



> 强风可能伴随着暴风雨或暴风



14. ‘wd (deg)',  风向(度)



15. ‘rain (mm)',  降雨量(毫米)



> 降水的数量,可用于判断是否下雨



16. ‘SWDR (W/m**2)', 短波辐射(瓦特/平方米)



  > 短波辐射(Shortwave Downward Radiation)是指太阳短波辐射能量在大气层顶进入地面或水面的辐射能量。它是太阳能辐射的一部分,主要包括可见光和紫外光,通常以瓦特每平方米(W/m²)为单位表示。短波辐射是地球能量平衡中的一个重要组成部分,它决定了地球表面的能量收入。



  > 在气象学和气候学中,短波辐射是一个重要的气象参数,用于分析太阳辐射对地球能量平衡和气候变化的影响。它受到大气中云量、气溶胶、水汽含量等因素的影响,因此对于研究大气辐射传输和气候模拟具有重要意义。



17. ‘SDUR (s)', 短波辐射持续时间(以秒为单位)



18. ’TRAD (degC)', 地表温度(以摄氏度为单位)



19. ‘Rn (W/m**2)',  净辐射(以瓦特/平方米为单位)



20. ‘ST002 (degC)', 地表温度在 2 厘米深度的测量值(以摄氏度为单位)



21. ’ST004 (degC)', 地表温度在 4 厘米深度的测量值(以摄氏度为单位)



22. ‘ST008 (degC)', 地表温度在 8 厘米深度的测量值(以摄氏度为单位)



23. ‘ST016 (degC)',  地表温度在 16 厘米深度的测量值(以摄氏度为单位)



24. ’ST032 (degC)', 地表温度在 32 厘米深度的测量值(以摄氏度为单位)



25. ’ST064 (degC)', 地表温度在 64 厘米深度的测量值(以摄氏度为单位)



26. ‘ST128 (degC)', 地表温度在 128 厘米深度的测量值(以摄氏度为单位)



27. ‘SM008 (%)', 土壤湿度在 8 厘米深度的测量值(以百分比表示)



28. ‘SM016 (%)', 土壤湿度在 16 厘米深度的测量值(以百分比表示)



29. ‘SM032 (%)', 土壤湿度在 32 厘米深度的测量值(以百分比表示)



30. ’SM064 (%)', 土壤湿度在 64 厘米深度的测量值(以百分比表示)



31. ‘SM128 (%)'   土壤湿度在 128 厘米深度的测量值(以百分比表示)

3.数据预处理

3.1 特征选择

- 由于顺序数据index和data性质类似,这里删掉 “Data Time”

- 由于ST002(degC)-ST064(degC)是不同地表高度的温度,和我们要预测的数据T(degC),在性质上类似,因此全部删掉

3.2 输入输出

我们计划用RNN模型来预测温度,大概是知道前n-1时刻的特征数据(包括温度),预测第n时刻的温度,因此:

我们要对shape为(26495,31)的数据进行处理。

  • 先删掉不需要的特征13个,剩下18个,删后的shape为(26495,18)

  • 我们用过8个连续时间点预测第9个时间点,即模型输入为 x = (_, 8, 18), 输出为 y = (_, 1)

> 这里的shape留了个空位给batch_size,用于模型批量化处理数据

  • 我们假设输出的参考真实值为标签y‘,即数据集中第三列特征

参考链接

  • LSTM 原版: Weather forecast using LSTM networks
  • 天气数据集:   Max-Planck-Institut fuer Biogeochemie - Wetterdaten

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/673005.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【GeoServer系列】——安装与发布shapefile数据

GeoServer是一个基于java的服务器,它允许用户查看和编辑地理空间数据。使用OGC制定的开放标准,GeoServer在地图创建和数据共享方面具有极大的灵活性。 功能概述: Open and Share Your Spatial Data GeoServer允许您向世界显示您的空间信息。G…

上可生产力,下可打游戏!奥睿科USB4炫影固态硬盘盒是真的稳

上可生产力,下可打游戏!奥睿科USB4炫影固态硬盘盒是真的稳 哈喽小伙伴好,我是Stark-C~ 开篇 对于和我一样经常需要和存储数据打交道的人群来说,大容量的移动硬盘可以说是不可或缺的。移动硬盘作为一种便携式的存储设备&#xf…

笔记:美团的测试

0.先启动appium 1.编写代码 如下: from appium import webdriver from appium.webdriver.extensions.android.nativekey import AndroidKeydesired_caps {platformName: Android,platformVersion: 10,deviceName: :VOG_AL10,appPackage: com.sankuai.meituan,ap…

Git操作笔记

学git已经好多次了。但是还是会忘记很多的东西,一些常用的操作命令和遇到的bug以后在这边记录汇总下 一.github图片展示 图片挂载,我是创建了一个库专门存图片,然后在github的md中用专用命令展示图片,这样你的md就不会全是文字那…

Android O Camera深度研究

目录 Adnroid O之前的Android camera软件框架 Adnroid O camera软件框架 Passthrough Mode Binderized mode Wrapper shim for libhardware HALs Wrapper shim for libhardware HALs Customized Treble Camera HAL/framework Camera HAL transition and removal plan …

【限免】杂波环境下线性调频脉冲、巴克码、频率步进脉冲雷达MTI、脉冲压缩【附MATLAB代码】

来源:微信公众号:EW Frontier 本代码主要模拟杂波环境(飞机、地杂波、鸟类信号)下,Chirp脉冲、巴克码脉冲、频率步进脉冲雷达信号的脉冲压缩及MTI、​匹配滤波。 MATLAB主代码 % 定义参数 fs 1000; % 采样率 T 1; …

MYSQL一、MYSQL的了解

一、MySQL概述 1、数据库相关概念 为了方便,我们一般把mysql数据库管理系统简称位mysql数据库 通过可以操作数据库管理系统,然后再通过数据库管理系统操作(数据库)和(数据库里面的数据) 2、当前主流的关系…

Vue3 - Mac系统用文本编辑写html不显示效果的坑

平时在win系统下,可以直接对文本进行编辑,非常的舒服。 在mac系统中,也有类似的功能,就是文本编辑,没想到居然还有坑。 这是我mac系统中创建的html文件,想着没有几行代码,就没有开编辑器了&am…

Java 异常

一、异常的继承体系图 如图 二、Throwable类常用的方法 1.获取异常的信息 public String getMessage() {return detailMessage; } 2.获取异常的原因 // 获取异常的原因 public String getLocalizedMessage() {return getMessage(); } 3.打印异常信息 // 打印异常信息 publi…

NDIS Filter开发-OID 请求

NDIS 定义对象标识符 (OID) 值来标识适配器参数,其中包括操作参数,例如设备特征、可配置的设置和统计信息。 Filter驱动程序可以查询或设置基础驱动程序的操作参数,或过滤/覆盖顶层驱动程序的 OID 请求。 NDIS 还为 NDIS 6.1 及更高版本的Fi…

STM32_SPI

1、SPI简介 1.1 什么是SPI SPI,即Serial Peripheral Interface,串行外设接口。SPI是一种高速的、全双工、同步的串行通信总线;SPI采用主从方式工作,一般有一个主设备和一个或多个从设备;SPI需要至少4根线,…

【操作与配置】VS2017与MFC环境配置

【操作与配置】VS2017与MFC环境配置 概述 Visual Studio 是一款强大且多功能的集成开发环境(IDE),适用于软件开发人员和团队。使用此应用程序,您可以构建和调试现代Web应用程序,并利用扩展帮助探索几乎任何编程语言。…

springboot高校网上选课系统-计算机毕业设计源码85583

摘 要 本论文主要论述了如何使用JAVA语言开发一个高校网上选课系统,本系统将严格按照软件开发流程进行各个阶段的工作,采用B/S架构,面向对象编程思想进行项目开发。在引言中,作者将论述高校网上选课系统的当前背景以及系统开发的目…

重复文件怎么查找并清理?电脑重复文件清理工具分享:4个

在日常使用电脑的过程中,我们不可避免地会遇到各种重复文件的问题。这些重复文件不仅占据了宝贵的存储空间,还可能导致系统性能下降,甚至引发一些不必要的问题。因此,如何有效地查找并清理这些重复文件成为了许多用户关注的焦点。…

牛客BM85 验证IP地址【中等 字符串 Java/Go/PHP】

题目 题目链接: https://www.nowcoder.com/practice/55fb3c68d08d46119f76ae2df7566880 https://www.lintcode.com/problem/1222/description 思路 直接模拟,注意IPv4,ipv6的条件Java代码 import java.util.*;public class Solution {/*** 验证IP地址…

docker基础,docker安装mysql,docker安装Nginx,docker安装mq,docker基础命令

核心功能操作镜像 Docker安装mysql docker run -d --name mysql -p 3306:3306 -e TZAsia/Shanghai -e MYSQL_ROOT_PASSWORDlcl15604007179 mysql docker的基本操作 docker rm 容器名称即可 docker ps 查看当前运行的容器 docker rm 干掉当前容器 docker logs 查看容器命令日…

Day 41 NGINX详解

Nginx详解 一、HTTP协议 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。 1、HTTP 工作原理 HTTP协议通信流程 WEB Server&…

数组基础-笔记

数组是非常基础的数据结构,实现运用和理解是两回事 数组是存放在连续内存空间上的相同类型的数据的集合 可以方便的通过下表索引的方式获取到下标下对应的数据。 举一个字符数组的例子: 注意两点: 数组下标从0开始 数组内存空间的地址是连…

AOP案例

黑马程序员JavaWeb开发教程 文章目录 一、案例1.1 案例1.2 步骤1.2.1 准备1.2.2 编码 一、案例 1.1 案例 将之前案例中增、删、改相关节后的操作日志记录到数据库表中。 操作日志:日志信息包含:操作人、操作时间、执行方法的全类名、执行方法名、方法…

pytest框架用例命名规则详解

pytest 测试用例的命名规则是为了确保 pytest 能够正确地识别和执行测试用例。 以下是关于 pytest 测试用例命名规则的详细解释: 1 编写单个测试文件 单个测试文件须以‘test_’开头或者以‘_test’结尾 比如我们创建test_case1.py case2_test.py文件。 2 在单个…