python数据分析-连云港石化基地2023年用电量分析

接下来对连云港石化基地2023年用电量进行分析,首先导入数据分析基本的包:

import pandas as pd
import matplotlib.pyplot as plt


# Load the data from the provided Excel files
file_path1 = 'data1.xlsx'
file_path2 = 'data2.xlsx'

data1 = pd.read_excel(file_path1)
data1

从上面结果可以发现,数据集一个有246条数据

# 接下来可以进行数据分析和可视化

# 将日期格式更改为仅包含年和月
data1['时间'] = data1['时间'].dt.to_period('M')

# 接下来可以进行数据分析和可视化

接下来进行描述性统计结果分析:

  1. 数据概况

    • 数据包含了 246 个观测值,分别对应不同的月份和用电量。
    • 用电量的平均值为 3257539 千瓦时,中位数为 284677.5 千瓦时,说明数据存在一定的右偏态。
    • 标准差为 8436332 千瓦时,说明数据的离散程度较大,可能存在一些极端值。
  2. 用电量分布

    • 用电量的最小值为 11700 千瓦时,最大值为 37745478 千瓦时,说明数据的范围非常广泛。
    • 大部分用电量集中在较低的水平,可能存在一些大型用电设备或工业用户导致了极端值的出现。
  3. 异常值检测

    • 可以通过绘制箱线图来检测异常值。从箱线图中可以看出,存在一些用电量明显高于其他观测值的异常值。
    • 这些异常值可能需要进一步调查,以确定是否存在数据录入错误或其他异常情况。
import matplotlib.pyplot as plt 
%matplotlib inline
plt.rcParams['font.sans-serif'] = ['KaiTi']  #中文
plt.rcParams['axes.unicode_minus'] = False   #负号
import pandas as pd
import seaborn as sns
# 企业用电量排名
import matplotlib.pyplot as plt
import numpy as np

# 定义企业名称和用电量数据
companies = ['盛虹炼化(连云港)有限公司', '连云港石化有限公司', '江苏瑞恒新材料科技有限公司', '江苏嘉宏新材料有限公司', '江苏方洋能源科技有限公司',
             '中化连云港石化仓储有限公司', '连云港徐圩港口控股集团有限公司', '连云港圣奥化学科技有限公司', '江苏洋井石化集团有限公司', '连云港徐圩港口码头有限公司']
electricity = [4191025003, 2192691053, 1186132719, 283658970, 87738582, 21805327, 9319212, 7785657, 7636359, 7440616]

# 为每个企业选择一个不同的颜色
colors = plt.cm.tab10(np.arange(len(companies)))

# 绘制柱状图
plt.figure(figsize=(10, 8),dpi=200)
plt.bar(companies, electricity, color=colors)
plt.xlabel('企业名称')
plt.ylabel('用电量')
plt.title('不同企业的用电量情况')
plt.xticks(rotation=45)  # 如果企业名称较长,可以旋转以免重叠
# plt.grid(True)  # 显示网格线

# 设置y轴标签为非科学技术法显示
plt.gca().ticklabel_format(axis='y', style='plain')
plt.show()

首先,我们对数据进行了彻底的清洗和验证,确保所有用电数据均准确无误。然后,我们从企业规模和行业类型这两个维度对数据进行了对比分析。具体来说,我们将企业按照用电量进行了排名,以此识别出用电量最高的企业。分析结果表明,盛虹炼化(连云港)有限公司和连云港石化有限公司的用电量显著高于其他企业,这反映了它们作为该地区主要炼油或化工企业的能源密集特性。它们对电力的巨大需求可能是支持高强度生产过程所必需的。紧随其后的江苏瑞恒新材料科技有限公司,其用电量也相对较高,这可能指示该公司是一家从事新材料生产的高能耗企业。与这些企业相比,其他企业的用电量相对较低,这可能反映了它们较小的规模或参与的行业对能源的需求相对较低。尽管如此,这些企业仍在当地经济中扮演着重要角色。

# 绘制条形图
plt.figure(figsize=(12, 6),dpi=200)
sns.barplot(x=monthly_electricity.index, y=monthly_electricity.values)
plt.title('每月用电量分布')
plt.xlabel('月份')
plt.ylabel('用电量(千瓦时)')
# 设置y轴标签为非科学技术法显示
plt.gca().ticklabel_format(axis='y', style='plain')
plt.show()

 

# 为饼图准备数据
values = [specific_company_electricity, total_electricity - specific_company_electricity]
labels = ['江苏瑞恒新材料科技有限公司', '其他公司']

# 绘制饼图
plt.figure(figsize=(8, 6),dpi=200)
plt.pie(values, labels=labels, autopct='%1.1f%%', startangle=140)
plt.title('江苏瑞恒新材料科技有限公司用电量占比')
plt.show()

 

我们的分析结果显示,江苏瑞恒新材料科技有限公司的用电量占比高达14.8%,这一显著的比例不仅展示了该公司在当地能源消耗方面的重要性,而且暗示了其较大的企业规模和市场影响力。在典型经济体中,企业的用电量往往与其规模、产能和产品产出水平紧密相关。较高的用电量可能表明该公司拥有大型生产设施和高产出的生产线。此外,这一较高的用电量占比还可能反映出该公司在其行业中的领先地位,如在新材料科技领域的技术优势或市场占有率。 

读取另一个文件

import pandas as pd
import matplotlib.pyplot as plt


# Load the data from the provided Excel files
file_path2 = 'data2.xlsx'

data2 = pd.read_excel(file_path2)
data2

通过这个数据集,可以了解不同用电单位在特定时间内的用电情况,包括用电量的多少。这对于电力管理、计费、规划等方面都具有重要的参考价值。同时,结合其他相关信息,还可以进一步分析用电趋势、优化电力供应等。

这里设置显示选项,避免科学计数法

pd.set_option('display.float_format', lambda x: '%.2f' % x)

# 只显示数值型数据的描述统计信息
numeric_data_description = data2.describe(include=np.number)
print(numeric_data_description)

# 按项目分组并计算每个项目的总用电量
project_electricity = data2.groupby('项目')['电量'].sum().sort_values(ascending=False).head(20)
# 重置索引,便于作图
project_electricity_df = project_electricity.reset_index()

# 绘制条形图
plt.figure(figsize=(8, 10),dpi=300)
sns.barplot(x='电量', y='项目', data=project_electricity_df)
plt.title('前20个项目的用电量对比')
plt.xlabel('总用电量(千瓦时)')
plt.ylabel('项目')
plt.xticks(rotation=90)
# 设置y轴标签为非科学技术法显示
plt.gca().ticklabel_format(axis='x', style='plain')
plt.show()

从图表中明显看出,如220kV炼化变高压供用电和连云港石化高压供用电这样的主要项目用电量显著高于其他项目,这些项目代表了该地区主要的工业生产基地,其高用电量体现了对电力的强烈需求。同时,我们也注意到了一些与新材料产业相关的项目,比如瑞恒新材料110kV瑞恒碳三变电站高压供用电,这些项目的用电数据提供了对新兴行业在当地经济中的发展情况和影响力的重要见解。除了工业生产,我们还发现了诸如能源科技第三方治理工程高压供用电这样的能源治理和环保项目,这些项目的用电情况反映了当地对环保和可持续发展的重视。

通过这项分析,我们得以全面了解该地区的产业结构、经济活动和基础设施建设状况。排名前20的项目不仅涵盖了石化、新材料、能源治理和环保等多个领域,还包括了基础设施建设项目,如变电站和输煤管道,这些用电数据反映出对基础设施建设的投入,突显了该地区对建设和发展的承诺。这样的综合分析不仅帮助我们把握当地的经济结构和发展趋势,而且为未来的经济发展和能源规划提供了宝贵的参考。这些信息对于政府规划部门、企业决策者以及投资者都极为重要,帮助他们在制定策略和计划时做出更加明智的选择。

数据加完整代码

创作不易,希望大家多点赞关注评论!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/693197.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

轻松构建聊天机器人,大模型 RAG 有了更强大的AI检索器

节前,我们星球组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、参加社招和校招面试的同学。 针对算法岗技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备、面试常考点分享等热门话题进行了深入的讨论。 合集&#x…

【机器学习300问】109、什么是岭回归模型?

在进行回归任务时间,可以能会遇到特征数量多于观测数量或某些特征变量之间相关性较高(几乎线性相关)时,标准的线性回归模型的系数估计可能非常不精确,可以理解成独立方程个数小于未知数个数此时方程有无穷多解。 例如&…

基于SVPWM矢量控制的无速度传感器电机控制系统simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 5.完整工程文件 1.课题概述 基于SVPWM矢量控制的无速度传感器电机控制系统simulink建模与仿真,包括电机,SVPWM模块,矢量控制器模块等。 2.系统仿真结果 3.核心程序与模…

ChatGPT为啥不用Websocket而是EventSource?

点击下方“JavaEdge”,选择“设为星标” 第一时间关注技术干货! 免责声明~ 任何文章不要过度深思! 万事万物都经不起审视,因为世上没有同样的成长环境,也没有同样的认知水平,更「没有适用于所有人的解决方案…

《精通ChatGPT:从入门到大师的Prompt指南》第9章:实战练习

第9章:实战练习 9.1 Prompt练习题 在本节中,我们将提供一系列练习题,旨在帮助读者通过实际操作提升使用ChatGPT的能力。这些练习题涵盖了从基础到高级的不同难度级别,并针对各种应用场景设计,确保读者能够在实际使用…

山东大学软件学院项目实训-创新实训-基于大模型的旅游平台(三十一)- 微服务(11)

12.7 DSL查询语法 查询的基本语法 GET /indexName/_search{"query": {"查询类型": {"查询条件": "条件值"}}} 查询所有 GET /hotel/_search{"query": {"match_all": {}}} 12.7.1 全文检索查询 全文检索查询,会…

【Vue3-Element-Admin 动态路由】涉及到的配置

Vue3-Element-Admin 动态路由 涉及到的配置 0. Vue3-Element-Admin 项目地址1. router/index.ts2. Mock接口模拟数据3. store/permission4. api/menu5. plugins/permission 这篇文章讲的主要是 Vue3-Element-Admin 差不多内置的动态路由配置 (根据后端接口渲染) 先把开发环境&a…

Hive on Spark版本兼容性

Hive on Spark仅在特定版本的Spark上进行测试,因此给定版本的Hive只能保证与特定版本的Spark一起工作。其他版本的Spark可能与给定版本的Hive一起工作,但不能保证。以下是Hive版本及其对应的Spark版本列表: 详情参考官方文档:http…

11.Spring AOP

文章目录 1.什么是 Spring AOP?2.为什要用 AOP?3.Spring AOP 应该怎么学习呢?3.1 AOP 组成3.1.1 切⾯(Aspect) 切点 通知3.1.2 连接点(Join Point)3.1.3 切点(Pointcut)…

53.ReentrantLock原理

ReentrantLock使用 ReentrantLock 实现了Lock接口, 内置了Sync同步器继承了AbstractQueuedSynchronizer。 Sync是抽象类,有两个实现NonfairSync非公平,FairSync公平。 所以ReentrantLock有公平锁和非公平锁。默认是非公平锁。 public sta…

[数据集][目标检测]足球场足球运动员身份识别足球裁判员数据集VOC+YOLO格式312张4类别

数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):312 标注数量(xml文件个数):312 标注数量(txt文件个数):312 标注类别…

Nvidia/算能 +FPGA+AI大算力边缘计算盒子:电力巡检智能机器人

聚焦数字经济与双碳经济赛道,专注于提供集中式新能源场站与分布式综合能源数智化整体解决方案,坚持以场站数字化、综合能源数字化双轮驱动发展。依靠专业化人才队伍与丰富的实证基地研究经验,打造成熟、先进的数智新能源研发平台。 在集中式新…

linux本地搭建apt源

使用apt-mirror搭建 1.安装 apt-get install apt-mirror2.编辑配置文件 vi /etc/apt/mirror.list修改下载目录 set_base_path 后面改为下载镜像的目录,同时删除前面#号 添加同步的源,建议用国内的,速度快,我这里用的阿里云的镜…

Leetcode 力扣109. 有序链表转换二叉搜索树 (抖音号:708231408)

给定一个单链表的头节点 head ,其中的元素 按升序排序 ,将其转换为 平衡 二叉搜索树。 示例 1: 输入: head [-10,-3,0,5,9] 输出: [0,-3,9,-10,null,5] 解释: 一个可能的答案是[0,-3,9,-10,null,5],它表示所示的高…

每日一题——Python实现PAT甲级1015 Reversible Primes(举一反三+思想解读+逐步优化)

一个认为一切根源都是“自己不够强”的INTJ 个人主页:用哲学编程-CSDN博客专栏:每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 我的写法 is_prime函数分析: decimal_to_base函数分析: 主循…

无头+单向+非循环链表的实现

这里写目录标题 1. 链表1.1 链表的概念及结构1.2 链表的分类 2. 接口实现3. 链表的实现3.1 打印链表3.2 头插3.3 尾插3.4 头删3.5 尾删3.6 单链表查找3.7 在pos之前插入3.8 在pos之后插入3.9 删除pos位置的值3.10 删除pos位置之后的值3.11 链表的释放3.12 动态申请一个节点 4. …

STM32F103C8T6 HAL库串口重定向

前言: 这里仅用做个人记录,实现USART1串口通信,并通过printf重定向输出“串口打印测试” 正文开始: 首先在STM32CubeMX上对串口进行配置,其实方法也非常简单。 按照箭头顺序,先点击Connectivity找到USART1…

30分钟吃掉pytorch转onnx及推理

pytorch模型线上部署最常见的方式是转换成onnx然后再转成tensorRT 在cuda上进行部署推理。 本文介绍将pytorch模型转换成onnx模型并进行推理的方法。 #!pip install onnx #!pip install onnxruntime #!pip install torchvision 公众号算法美食屋后台回复关键词:源码…

jmeter -n -t 使用非GUI模式运行脚本说明

命令模式下执行jmx文件 jmeter -n -t fatie.jmx -l results\t4.jtl -e -o results\h1 表示以命令行模式运行当前目录下的脚本fatie.jmx,将结果存入当前目录下的results\t1.jtl,并且生成html格式的报告,写入文件夹results\h1。 说明:生成结果的文件夹r…

《精通ChatGPT:从入门到大师的Prompt指南》第10章:案例分析

第10章:案例分析 10.1 优秀Prompt案例解析 在深入探讨如何精通ChatGPT的使用之前,理解并分析一些优秀的Prompt案例是至关重要的。这不仅有助于更好地掌握Prompt的构建技巧,还能提高与AI交互的效果。在这一节中,我们将详细解析一…