R语言数据分析案例31-运用差分整合移动平均自回归模型对世界主要国家(俄罗斯)的污染物排放量进行研究预测

一、研究背景与意义

空气污染导致的环境恶化已经成为世界各国许多国家和地区发展受限的重要原因。空气污染物是由气态物质、挥发性物质、半挥发性物质和颗粒物质的混合物造成的,其中典型 的空气污染物就是人们生活中经常使用到的高频词汇雾霾。本文主要对其中的污染物的排放量进行预测和研究。。。。。

本文利用气象中心和公开数据平台所提供的数据进行预处理(给定的全球暖化数据集),首先对应数据进行相应的可视化,随后进行检验和模型的选择判断,最终选择出最优的模型进行预测和分析。最终通过实验,验证了本文研究的数据处理方法、分析预测模型的有效性,能够较好地实现短时临近污染物排放的时序预测。

二、 文献综述

传统时间序列分析预测方法和机器学习体现了人工智能的核心技术,也是使计算机更加智能化的重要技术之一。随着机器学习算法取得更加突破性的进展,人工智能领域发展的速度也逐渐加快。机 器学习具有的高计算效率,高预测准确率,高灵活性等特点,让它在不同行业都得到 了广泛的使用,当然也包括气象领域[20]。机器学习的诞生改变了传统的气象监测方法, 使得气象监测效率提高,准确率增强,提高了天气预报的质量,给人们的生活带来改善。。。。

王建书借助于自回归积分滑动平均(Autoregressive Integrated Moving Average Model,ARIMA)模型对苏州市空气质量指数进行预测,为空气污染的健康防护预警提供参考。。。。

三、数据集介绍

本文所运用到的数据来源于气象中心和公开数据平台所提供的数据(给定的全球暖化数据集),其中包括一氧化碳、非甲烷挥发性有机物、硫氧化物等,数据具体情况如下:

数据和代码

数据代码报告

1 俄罗斯1990-2016年的污染物排放量数据(硫氧化物

SgnYear

CountryCode

Cntrnm

CountryCode3

AirPollutant

TotalStaSource

1990

643

俄罗斯

RUS

硫氧化物

9427

1991

643

俄罗斯

RUS

硫氧化物

9165

...

...

...

...

...

2016

643

俄罗斯

RUS

硫氧化物

4011

2俄罗斯1990-2016年的污染物排放量数据(氮氧化物)

SgnYear

CountryCode

Cntrnm

CountryCode3

AirPollutant

TotalStaSource

1990

643

俄罗斯

RUS

氮氧化物

3029

1991

643

俄罗斯

RUS

氮氧化物

3030

...

...

...

...

...

2016

643

俄罗斯

RUS

氮氧化物

1830

3 俄罗斯1990-2016年的污染物排放量数据(一氧化碳)

SgnYear

CountryCode

Cntrnm

CountryCode3

AirPollutant

TotalStaSource

1990

643

俄罗斯

RUS

一氧化碳

8126

1991

643

俄罗斯

RUS

一氧化碳

7588

...

...

...

...

...

2016

643

俄罗斯

RUS

一氧化碳

4907

4 俄罗斯1990-2016年的污染物排放量数据(非甲烷挥发性有机物)

SgnYear

CountryCode

Cntrnm

CountryCode3

AirPollutant

TotalStaSource

1990

643

俄罗斯

RUS

非甲烷挥发性有机物

1864

1991

643

俄罗斯

RUS

非甲烷挥发性有机物

1742

...

...

...

...

...

2016

643

俄罗斯

RUS

非甲烷挥发性有机物

1305

 四、理论部分

自回归移动平均模型(Autoregressive moving average model)是研究时间序列的重要方法,由自回归模型(简称AR模型)与移动平均模型(简称MA模型)为基础进行“混合”而构成。

将所预测的指标随时间推移而形成的数据序列就可以看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延展性。。。。

五、实证分析

由于本文数据是直接从数据库取而得,且数据的整体完整性较好,从而不需要对数据做特别的处理,直接在r程序软件上读取即可。

首先展示污染物为了硫氧化物的数据

library(tseries)
library(forecast)
library(readxl)
library(stats)
#####数据读取
Tem_dataset<- read.xlsx("Ru.xlsx", sheet = 1)
Tem_dataset
###随后对整体数据进行描述性添加分析
summary(Tem_dataset)

从上面图1可以看出,使用summary函数对数据进行了描述性统计,其中对每个特征的最大最小值,均值以及分位数都进行了描述分析。下图3画出了俄罗斯1990-2016年不同污染物的排放情况,具体情况如下图:

###画出1990年-2016年俄罗斯不同污染物排放时间序列图
Tem_dataset$TotalStaSource
ATEM<-ts(Tem_dataset$TotalStaSource,start=c(1990),frequency=1)
ATEM


plot(ATEM,type="o",pch=20,main="1990年-2016年俄罗斯不同污染物(硫氧化物)排放时间序列图",xlab = "年份/Year",ylab="排放量",col = "violet")

 

 

模型构建

纯随机性分析,即白噪声检验,看其是否为白噪声:

#绘制自相关图和偏自相关图
acf(ATEM,lag=12)
pacf(ATEM,lag=12)

从上面结果可以看出,无论是6阶、12阶还是18阶,进行纯随机性检验,检验结果显示统计量的p值显著小于0.05的显著性水平,可判断序列为平稳非白噪声序列。

可以继续建模。

接下来进行ADF检验查看,并且函数进行自动定阶

###自动定阶
auto.arima(ATEM)

###模型拟合
ATEM.fit<-auto.arima(ATEM)
ATEM.fit 

 接下来进行模型对比,如下图:

接下来进行序列的残差检验:

 

从上面结果可以看到,在0.05的显著性水平下p值为0.2232,不拒绝原假设,则可以说明滞后1期的残差均是白噪音。

最后进行预测,预测10期,即未来10年的污染物排放情况,具体情况如下:

#模型预测
per_ATEM<-forecast(ATEM.fit,h=10)
per_ATEM
plot(per_ATEM)

六、结论

本文采用了ARIMA(0,2,1)模型,利用1990-2016年历史的俄罗斯空气污染物排放量数据进行了10年的的数据预测,从预测结果来看,所得空气污染物排放指标数据与往年同期相比,符合相关规律。。。。

参考文献

  1. 王建书,王瑛,赵敏娴,周晓龙,陆颂文,杨海兵,刘强.ARIMA模型在苏州市空气质量指数预测中的应用[J].公共卫生与预防医学,2019,30(02):18-20.
  2. 夏晓圣,陈菁菁,王佳佳,等.基于随机森林模型的中国PM2.5浓度影响因素分析[J].环境 科学,2020,41(05):2057-2065.

创作不易,希望大家多点赞关注评论!!!(类似代码或报告定制可以私信)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/719511.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

黄仁勋加州理工毕业典礼演讲:人工智能是我们这个时代最重要的技术

英伟达公司首席执行官黄仁勋周五&#xff08;6月14日&#xff09;在加州理工学院&#xff08;Caltech&#xff09;毕业典礼上发表演讲&#xff0c;鼓励毕业生在逆境中努力&#xff0c;不断寻求新的机遇。 黄说&#xff0c;加州理工学院因其毕业生受人尊敬而闻名&#xff0c;如…

查询Kafka集群中消费组(group)信息和对应topic的消费情况

个人名片 &#x1f393;作者简介&#xff1a;java领域优质创作者 &#x1f310;个人主页&#xff1a;码农阿豪 &#x1f4de;工作室&#xff1a;新空间代码工作室&#xff08;提供各种软件服务&#xff09; &#x1f48c;个人邮箱&#xff1a;[2435024119qq.com] &#x1f4f1…

玩转nRF52840-DK开发套件(4)

nRF52840-DK 开发套件UART interface through a virtual serial port &#xff0c;如下 串口初始化以及引脚定义&#xff1a; const app_uart_comm_params_t comm_params {RX_PIN_NUMBER,TX_PIN_NUMBER,RTS_PIN_NUMBER,CTS_PIN_NUMBER,UART_HWFC,false, #if defined (UART_PRES…

如何量化管理研发团队的技术债务?

在探讨技术债的成因之前&#xff0c;我们需要澄清一些关于技术债起因和本质的普遍误解。 误解一&#xff1a;技术债务等同于劣质代码 那么&#xff0c;什么构成了所谓的「劣质代码」&#xff1f; 所谓的好代码&#xff0c;可能是指那些整洁、不会在未来限制你决策的代码&…

Type-C诱骗芯片LDR6500

随着科技的飞速发展&#xff0c;电子设备的智能化和便携化已成为趋势。在这个过程中&#xff0c;Type-C接口因其高速传输、正反可插以及强大的扩展能力&#xff0c;逐渐成为主流接口标准。然而&#xff0c;Type-C接口的广泛应用也带来了一系列挑战&#xff0c;其中之一便是如何…

CENTOS7.9下服务器双网卡bond模式6配置示例

​1.bond口的特点 bond口通过将多个网口进行聚合&#xff0c;多个网口聚合后一方面实现了大带宽传输&#xff0c;另外多网口聚合后也同时具有冗余特性&#xff0c;当其中一个网口down掉后&#xff0c;其他网口会继续转发流量&#xff0c;不会导致流量中断。 2.使用条件 当环境…

wireshark使用情况与网口调试记录

wireshark使用情况与网口调试记录 前言wireshark无法获取本地数据方法一——Npcap方法二——WinPcap效果 UDP组播&#xff0c;却一直捕获到127.0.0.1总结 前言 在网口调试中&#xff0c;wireshark使用较多&#xff0c;常出现一些无法捕获或者ip获取数据不正确的情况&#xff0…

探索设计模式——单例模式详解

前言&#xff1a;设计模式的作用主要是为了——利用设计方式的重用来自动地提高代码的重新利用、提高代码的灵活性、节省时间&#xff0c; 提高开发效率、低耦合&#xff0c;封装特性显著&#xff0c; 接口预留有利于扩展。 设计模式的种类有很多种&#xff0c;本篇内容主要讲解…

目标检测顶会新成果!20个突破性方法,更高性能,更强理解与分析能力!

【目标检测】在近年来的深度学习领域中备受关注&#xff0c;它通过识别和定位图像中的目标对象&#xff0c;提升了模型在图像理解和分析方面的能力。目标检测技术在自动驾驶、安防监控和医疗影像分析等任务中取得了显著成果。其独特的方法和卓越的表现使其成为研究热点之一。 为…

我整理的面向大模型的高质量语料集!

自己一直在做企业内部的垂类大模型&#xff0c;但随着运营深入&#xff0c;发现光有企业内部的领域数据还不足以微调出一个健壮的领域大模型&#xff0c;因为泛化能力比较弱。 在领域数据中融入公共数据进行训练是公认的提升领域大模型泛化能力的方法&#xff0c;下面是我整理的…

《 穿越时空的代码、在回首:Evil.js两年后的全新解读 》

破坏计算机系统罪可能香翅捞饭&#xff01;&#xff01;&#xff01; 本文以源码解析&#xff0c;场景复现&#xff0c;毒与药1.0.0攻防战&#xff0c;来主导本次攻击下毒、防守破解 只有周日才注入&#xff0c;当周日产生bug时&#xff0c;工作日程序员进行debug时将不会进行…

JavaScript和promise——0_1 promise

文章目录 是什么&#xff1f;未来值回调和未来值在回调环境下这么和未来值交互&#xff1f;群居的未来值其他的解决方案 这样写可以实现目标效果。可是&#xff0c;这样写优雅吗&#xff1f; 英雄登场关键词&#xff1a;then关键词&#xff1a;回调 为什么promise不需要start函…

【机器学习】CART决策树算法的核心思想及其大数据时代银行贷款参考案例——机器认知外界的重要算法

目录 引言 概述 CART决策树的特点 核心思想 减少不确定性的指标 基尼系数&#xff08;Gini Index&#xff09; 分类错误率 熵 银行实例 背景 数据准备 模型构建 模型评估与优化 应用与结果 代码示例 ✈✈✈✈引言✈✈✈✈ CART算法既可以用于分类问题&#xff0…

Simulink代码生成: 状态机的其他建模方法

本文研究状态机建模的一些方法和技巧。 文章目录 1 引入2 状态机建模方法2.1 状态机中的计时2.2 状态机中的计数2.3 转移顺序 3 总结 1 引入 博主一直很喜欢用Simulink中的状态机建模&#xff0c;在这里想记录一下自己平时使用Stateflow建模的心得。因为自身行业所限&#xff…

深入理解并打败C语言难关之一————指针(3)

前言&#xff1a; 昨天把指针最为基础的内容讲完了&#xff0c;并且详细说明了传值调用和传址调用的区别&#xff08;这次我也是做到了每日一更&#xff0c;感觉有好多想写的但是没有写完&#xff09;&#xff0c;下面不多废话&#xff0c;下面进入本文想要说的内容 目录&#…

【数据结构】第十七弹---C语言实现选择排序

✨个人主页&#xff1a; 熬夜学编程的小林 &#x1f497;系列专栏&#xff1a; 【C语言详解】 【数据结构详解】【C详解】 目录 1、选择排序 1.1、基本思想 1.2、代码实现 1.3、代码测试 1.4、时空复杂度分析 总结 1、选择排序 1.1、基本思想 选择排序是一种简单直观的比…

【测试专题】系统测试报告(原件Word)

软件测试报告在软件开发过程中起着至关重要的作用&#xff0c;主要有以下几个主要原因&#xff1a; 1、确保软件质量 2、提供决策支持 3、记录测试过程和结果 4、促进沟通和协作 5、符合标准和法规要求 6、改进测试流程和策略 7、降低风险 软件开发全套资料获取进主页或者本文末…

如何判断三相交流电子负载的性能

三相交流电子负载是模拟实际负载的设备&#xff0c;用于测试电源、变频器、逆变器等电力电子设备的性能。在购买和使用三相交流电子负载时。 三相交流电子负载能够稳定输出的最大有功功率&#xff0c;额定功率越高&#xff0c;说明负载的承载能力越强。在选择三相交流电子负载时…

计算机相关专业是否仍是“万金油”的选择?

亲爱的朋友们&#xff1a; 2024 年高考已然落幕&#xff0c;数百万高三学子站在了人生的重要十字路口&#xff0c;面临着选择大学专业这一关键抉择。在这个节点上&#xff0c;计算机相关专业是否还能被称为“万金油”的选择呢&#xff1f; 相信大家都知道&#xff0c;在最近这几…

【前端项目笔记】2 主页布局

主页布局 element-ui提供的组件名称就是它的类名 ☆☆ CSS选择器&#xff1a; &#xff08;1&#xff09;基本选择器 类型选择器 p/span/div…… 类选择器 (.classname) ID选择器 (#idname) 通配选择器 ( * ) &#xff08;2&#xff09;属性选择器 选择具有特定属性或属性值的…