基于Python实现汽车销售数据可视化+预测【500010086.1】

导入模块

import numpy as np
import pandas as pd
from pylab import mpl
import plotly.express as px
import matplotlib.pyplot as plt
import seaborn as sns

设置全局字体

plt.rcParams['font.sans-serif']=['kaiti']

获取数据

total_sales_df =pd.read_excel(r"./data/中国汽车总体销量.xlsx")
sales_by_manufacture =pd.read_excel(r"./data/中国汽车分厂商每月销售表.xlsx")
sales_by_model =pd.read_excel(r"./data/中国汽车分车型每月销售量.xlsx")

数据分析处理

total_sales_df.head(5),sales_by_manufacture.head(5),sales_by_model.head(5)

image.png
时间:表示数据所属的月份和年份。
销量:该月的汽车总销量。
同比:与上一年同期相比的销量变化百分比。

desc_stats_total_sales = total_sales_df.describe()

image.png
数据范围:数据集包含201条记录。
销量数据:总销量为319,164,052辆;平均每月的销量约为1,587,881辆;单月最高销量为2,672,264辆;单月最低销量为216,481辆。

desc_stats_model = sales_by_model.describe(include='all')

image.png
车型数量:共有1341个不同的汽车型号。
销量数据:总销量为202,077,324辆;平均每个车型每月的销量约为4,095辆;最高月销量为169,607辆;最低月销量为1辆。

数据可视化及预测

销量分析

中国汽车总体销量这个数据集进行更深入的分析。以下是一些可能的分析方向:1,时间序列分析:观察汽车销量随时间的变化趋势,包括季节性变化、年度趋势等。2, 同比增长分析:分析不同月份的年度同比增长率,以了解市场的整体增长或下滑趋势。3, 波动性分析:评估销量数据的波动性,了解市场稳定性。4, 预测未来销量:基于历史数据建立一个简单的预测模型来预估未来几个月的销量趋势。

波动性分析
汽车月销量时间序列图

Figure_1.png
从时间序列图中可以看出,汽车销量随时间波动较大。波动性可能受多种因素影响,如市场需求、经济状况、政策变化等。

计算月销量的标准差
std_deviation = total_sales_df['销量'].std()
mean_sales = total_sales_df['销量'].mean()
coefficient_of_variation = std_deviation / mean_sales

image.png
月销量的标准差为480,106辆,变异系数(Coefficient of Variation, CV):约为0.30,这表明数据的相对波动性。

滚动标准差

Figure_2.png
通过对数据进行12个月滚动标准差分析,我们可以观察到销量的波动性随时间的变化。从图中可以看出,销量波动性在某些时期较高,而在其他时期则相对稳定。
波动性的变化可能与多种因素有关,包括市场需求、宏观经济状况、行业政策、节假日影响等。这些波动性的增加可能指示市场不确定性的增加,而波动性的减少可能表明市场趋于稳定。

同比增长分析(汽车销量同比增长率)

Figure_3.png
通过上图展示的同比增长率热力图,我们可以观察到中国汽车销量在不同年份的月份之间的同比增长情况。每个单元格代表特定年份和月份的销量同比增长率(以百分比表示)。
从热力图中,可以观察到不同年份同月销量的增长或下降趋势。例如,某些年份的特定月份可能显示出显著的增长或下降,这可能受到宏观经济状况、行业政策、市场需求变化等因素的影响。

时间序列分析

Figure_4.png

  1. 展示了原始数据,即实际销量随时间的变化。
  2. 显示了数据中的长期趋势。可以看到销量随时间的整体增长或下降趋势。
  3. 展示了数据中的季节性模式。如果图表显示了一定的周期性重复模式,这表明销量受季节性因素影响。
  4. 包含除趋势和季节性之外的其他信息,可能是不规则的或不可预测的变化。

从时间序列中,我们可以观察到销量随时间的整体变化趋势。揭示了销量的季节性波动,这可能与特定节假日、季节变化或行业特定因素相关。剩余部分表明除了趋势和季节性之外的其他影响因素。

预测未来销量

为了预测未来的汽车销量,我们可以使用时间序列分析中的预测模型。存在多种方法可以用于时间序列预测,例如 ARIMA(自回归积分滑动平均模型)、SARIMA(季节性ARIMA)、简单的指数平滑等。选择哪种模型取决于数据的特性,例如是否存在明显的季节性、趋势等。
在进行预测之前,我将首先对数据集进行检查,以确定是否存在趋势或季节性,这将有助于选择合适的预测模型。然后,我将使用选定的模型来预测未来几个月的销量。
让我们首先检查数据集,以确定适合的预测模型。我将执行一个简单的时序图检查和自相关函数(ACF)和偏自相关函数(PACF)的检查,以帮助确定数据的特性。这将为选择合适的预测模型提供指导。
Figure_5.png
Figure_6.png
时间序列图:显示出销量随时间的变化,似乎有一定的季节性模式。
ACF图:展示了时间序列与其自身在不同滞后值下的相关性。高的自相关值表示销量数据在不同时间点存在强烈的相关性。
PACF图:显示了时间序列和其滞后值之间的偏自相关,有助于确定适用于预测的模型类型。
这些观察结果表明,我们可能需要一个能够处理季节性的时间序列预测模型。基于这些信息,SARIMA(季节性自回归积分滑动平均模型)可能是一个合适的选择。SARIMA模型可以同时处理时间序列数据的季节性、趋势和噪声成分。
接下来,我将使用SARIMA模型进行销量预测。由于时间序列分析通常需要详细的模型调整,我将选择一个基本的SARIMA模型配置进行预测。如果您有特定的预测时间范围(例如未来几个月或一年),请告诉我。否则,我将默认进行未来12个月的销量预测。
Figure_7.png
使用了SARIMA模型预测了未来12个月的中国汽车销量。请注意,这些预测是基于历史数据和模型假设,实际销量可能因多种因素而有所不同。
预测结果如下:
未来第1个月的预测销量:约751,579辆
未来第2个月的预测销量:约716,739辆
未来第3个月的预测销量:约620,680辆
…(以此类推,直到第12个月)
请注意,由于使用的是基础SARIMA模型配置,没有进行详细的参数调整和优化,因此这些预测应被视为初步估计。对于更精确的预测,通常需要进行详细的模型选择和参数调优。

厂商分析

对于中国汽车分厂商每月销售表的更深入分析,我们可以考虑以下几个方向:1, 厂商销量分析:分析不同厂商的销量表现,包括总销量、平均销量、销量增长趋势等。2, 市场份额分析:计算和比较不同厂商的市场份额变化。3, 时间趋势分析:观察各厂商销量随时间的变化趋势,包括季节性变化和年度趋势。4,最佳和最差表现分析:识别销量表现最好和最差的厂商。5,销量与时间的关系:探索不同年份和月份的销量变化,以及特殊事件或政策变化对销量的影响

厂商销量分析
计算各厂商的总销量和平均月销量
total_sales_by_manufacture = sales_by_manufacture.groupby('厂商')['销量'].sum().sort_values(ascending=False)
average_sales_by_manufacture = sales_by_manufacture.groupby('厂商')['销量'].mean().sort_values(ascending=False)

top_10_total_sales = total_sales_by_manufacture.head(10)
top_10_average_sales = average_sales_by_manufacture.head(10)
top_10_total_sales, top_10_average_sales

image.png

接下来,我们可以探索这些厂商的销量随时间的增长趋势,以及年度和月度销量的变化。这将有助于我们更全面地了解各厂商的销售表现。

Top 5 厂商的年度销量趋势

Figure_8.png
从上图中,我们可以观察到排名前五的厂商——上汽大众、上汽通用五菱、一汽-大众、长城汽车、东风日产——的年度销量趋势。图表展示了这些厂商在不同年份的销量变化情况。
从趋势中可以看出,这些顶级厂商的销量表现各有特点,其中某些厂商显示出明显的增长趋势,而其他厂商则可能有所波动。这些变化可能受到市场需求、竞争环境、新产品发布、政策变化等多种因素的影响。

市场份额分析
市场份额排名前10的厂商
sales_by_manufacture_clean = sales_by_manufacture[sales_by_manufacture['占销量份额'].str.isnumeric()]

try:
    sales_by_manufacture['占销量份额'] = pd.to_numeric(sales_by_manufacture['占销量份额'].str.rstrip('%'), errors='coerce') / 100
except Exception as e:
    error_message = str(e)
    sales_by_manufacture['占销量份额'] = sales_by_manufacture['占销量份额'].str.rstrip('%').astype('float', errors='ignore') / 100

average_market_share = sales_by_manufacture.groupby('厂商')['占销量份额'].mean().sort_values(ascending=False) * 100

top_10_market_share = average_market_share.head(10)
top_10_market_share, error_message if 'error_message' in locals() else "No errors"

image.png

Top 5 厂商的市场份额趋势

Figure_9.png
上图展示了排名前五的厂商——上汽大众、一汽-大众、吉利汽车、上汽通用别克、比亚迪——的市场份额随时间变化的趋势。通过这张图,我们可以观察到这些主要厂商在不同时间点的市场控制力。市场份额的变化可能受到多种因素的影响,包括新车型的推出、市场竞争格局的变化、宏观经济条件的波动等。

时间趋势分析

Figure_10.png
上图展示了排名前五的厂商——上汽大众、一汽-大众、吉利汽车、上汽通用别克、比亚迪——的销量时间趋势。这些数据反映了各个厂商销量随时间的变化,包括季节性变化和年度趋势。
从图中我们可以观察到:季节性变化:各厂商的销量可能在某些月份表现更好,这可能与行业特定的季节性因素(如新车型发布、假日销售等)相关;年度趋势:长期来看,一些厂商的销量表现出明显的增长或下降趋势,这可能受市场竞争、产品线更新、市场策略等因素的影响。

时间趋势分析

Figure_11.png
上图展示了中国汽车分厂商整体销量的时间趋势。从图中我们可以观察到:

  • 长期趋势:整体销量随时间的变化,展示了市场的增长或下降趋势。
  • 季节性变化:某些时间点的销量可能高于或低于平均水平,表明市场可能存在季节性波动。这可能与特定季节的市场需求、节假日销售活动或新车型发布有关。
  • 此分析为我们提供了对中国汽车市场总体销售动态的宏观视角,反映了市场的长期趋势和潜在的季节性模式。
最佳和最差表现分析
total_sales_ranking = sales_by_manufacture.groupby('厂商')['销量'].sum().sort_values(ascending=False)

average_monthly_sales_ranking = sales_by_manufacture.groupby('厂商')['销量'].mean().sort_values(ascending=False)

best_performers_total_sales = total_sales_ranking.head(5)
worst_performers_total_sales = total_sales_ranking.tail(5)

best_performers_average_sales = average_monthly_sales_ranking.head(5)
worst_performers_average_sales = average_monthly_sales_ranking.tail(5)

best_performers_total_sales, worst_performers_total_sales, best_performers_average_sales, worst_performers_average_sales

image.png
基于《中国汽车分厂商每月销售表》的分析,我们得出以下关于销量表现最好和最差的厂商:
销量表现最好的厂商(基于总销量):
上汽大众:累计销量约1309万辆
上汽通用五菱:累计销量约1306万辆
一汽-大众:累计销量约1064万辆
长城汽车:累计销量约960万辆
东风日产:累计销量约950万辆
销量表现最差的厂商(基于总销量):
郑州日产新能源:累计销量57辆
长安启源:累计销量30辆
奇瑞瑞麒:累计销量12辆
DS(进口):累计销量10辆
哈飞汽车:累计销量9辆
销量表现最好的厂商(基于平均月销量):
上汽大众:平均月销量约124,700辆
一汽-大众:平均月销量约101,359辆
吉利汽车:平均月销量约81,784辆
上汽通用别克:平均月销量约77,219辆
比亚迪:平均月销量约67,011辆
销量表现最差的厂商(基于平均月销量):
长安启源:平均月销量30辆
哈飞汽车:平均月销量9辆
郑州日产新能源:平均月销量7辆
奇瑞瑞麒:平均月销量2辆
DS(进口):平均月销量2辆

销量与时间的关系

Figure_13.pngFigure_12.png
上图展示了中国汽车分厂商的年度销量趋势和月度销量趋势:
年度销量趋势:图表显示了每年的总销量,反映了市场需求随时间的整体变化。从图中可以看出,销量在不同年份有所波动,这可能受到宏观经济状况、行业政策、市场竞争等因素的影响。
月度销量趋势:图表展示了每月的平均销量,揭示了可能的季节性模式。某些月份的销量可能明显高于或低于其他月份,这可能与节假日、促销活动、季节性市场需求变化等因素有关。
此外,特殊事件或政策变化,如新能源汽车补贴政策、重大经济事件、环保标准升级等,也可能对销量产生显著影响。然而,这类影响的详细分析可能需要更多具体事件的数据和背景信息。

车型分析

中国汽车分车型每月销售量从几个不同的角度进行探索,比如:1,车型销量分析:分析不同车型的销量表现,包括总销量、平均销量、销量增长趋势等。2,车型市场份额:计算不同车型的市场份额,并分析其随时间的变化。3,时间趋势分析:观察不同车型销量随时间的变化趋势,包括季节性变化和年度趋势。4,最佳和最差表现车型分析:识别销量表现最好和最差的车型。 5销量与时间的关系:探索不同年份和月份的销量变化,以及特殊事件或政策变化对销量的影响。

车型销量分析
total_sales_by_model = sales_by_model.groupby('车型')['销量'].sum().sort_values(ascending=False)
average_sales_by_model = sales_by_model.groupby('车型')['销量'].mean().sort_values(ascending=False)

top_10_total_sales_models = total_sales_by_model.head(10)
top_10_average_sales_models = average_sales_by_model.head(10)

top_10_total_sales_models, top_10_average_sales_models
print(top_10_total_sales_models, top_10_average_sales_models)

image.png
这些数据显示了各个车型在市场上的表现。总销量和平均月销量排名不同的原因可能是某些车型虽然销量高,但上市时间较短,或者某些车型虽然上市时间长,但月销量较低。

车型市场份额分析
total_market_sales = sales_by_model['销量'].sum()

market_share_by_model = (sales_by_model.groupby('车型')['销量'].sum() / total_market_sales) * 100

market_share_by_model_sorted = market_share_by_model.sort_values(ascending=False)

top_10_market_share_models = market_share_by_model_sorted.head(10)
top_10_market_share_models

image.png

时间趋势分析

Figure_14.png
上图展示了中国汽车各车型的销量时间趋势。从图中可以观察到:
整体趋势:销量随时间的变化反映了市场的整体需求波动。可以看出,某些时间段的销量特别高,可能受季节性活动或特殊事件的影响。
季节性变化:如果某些月份的销量明显高于其他月份,这可能表明市场对特定车型有季节性需求,例如节假日促销、新车型发布等。
这种分析为提供了对市场动态的洞察,帮助我们了解不同车型的销量随时间的变化。这些信息对于制定销售策略和市场预测非常有价值。

最佳和最差表现车型分析
best_performers_total_sales_models = total_sales_by_model.head(5)
worst_performers_total_sales_models = total_sales_by_model.tail(5)

best_performers_average_sales_models = average_sales_by_model.head(5)
worst_performers_average_sales_models = average_sales_by_model.tail(5)

best_performers_total_sales_models, worst_performers_total_sales_models, best_performers_average_sales_models, worst_performers_average_sales_models

image.png
这些结果显示了市场上不同车型的销售表现差异,反映了它们在市场竞争中的地位。

销量与时间的关系

Figure_16.pngFigure_15.png
上图展示了中国汽车各车型的年度销量趋势和月度销量趋势:
年度销量趋势:图表显示了每年的总销量,反映了市场需求随时间的整体变化。从图中可以看出,销量在不同年份有所波动,这可能受到宏观经济状况、行业政策、市场竞争等因素的影响。
月度销量趋势:图表展示了每月的平均销量,揭示了可能的季节性模式。某些月份的销量可能明显高于或低于其他月份,这可能与节假日、促销活动、季节性市场需求变化等因素有关。
此外,特殊事件或政策变化,如新能源汽车补贴政策、重大经济事件、环保标准升级等,也可能对销量产生显著影响。然而,这类影响的详细分析可能需要更多具体事件的数据和背景信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/180168.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

从根到叶:随机森林模型的深入探索

一、说明 在本综合指南中,我们将超越基础知识。当您盯着随机森林模型的文档时,您将不再对“节点杂质”、“加权分数”或“成本复杂性修剪”等术语感到不知所措。相反,我们将剖析每个参数,阐明其作用和影响。通过理论和 Python 实践…

【STM32外设系列】GPS定位模块(ATGM336H)

🎀 文章作者:二土电子 🌸 关注公众号获取更多资料! 🐸 期待大家一起学习交流! 文章目录 一、GPS模块简介二、使用方法2.1 引脚介绍2.2 数据帧介绍2.3 关于不同的启动方式 三、前置知识3.1 strstr函数3.2…

【洛谷算法题】P5714-肥胖问题【入门2分支结构】

👨‍💻博客主页:花无缺 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 本文由 花无缺 原创 收录于专栏 【洛谷算法题】 文章目录 【洛谷算法题】P5714-肥胖问题【入门2分支结构】🌏题目描述🌏输入格式&a…

实在智能携“TARS大模型”入选“2023中国数据智能产业AI大模型先锋企业”

近日,由数据猿与上海大数据联盟联合主办的“2023企业数智化转型升级发展论坛”在上海圆满收官。 论坛颁奖典礼上,《2023中国数据智能产业AI大模型先锋企业》等六大榜单正式揭晓,旨在表彰在AI领域为数智化升级取得卓越成就和突出贡献的企业&am…

【Flask使用】全知识md文档,4大部分60页第3篇:Flask模板使用和案例

本文的主要内容:flask视图&路由、虚拟环境安装、路由各种定义、状态保持、cookie、session、模板基本使用、过滤器&自定义过滤器、模板代码复用:宏、继承/包含、模板中特有变量和函数、Flask-WTF 表单、CSRF、数据库操作、ORM、Flask-SQLAlchemy…

深入浅出理解libevent——2万字总结

概述 libevent,libev,libuv都是c实现的异步事件库,注册异步事件,检测异步事件,根据事件的触发先后顺序,调用相对应回调函数处理事件。处理的事件包括:网络 io 事件、定时事件以及信号事件。这三个事件驱动着服务器的运…

中国智能汽车这一年,主打一个“卷”

文丨刘俊宏 “这才刚过去半年多,汽车行业又更新了一轮。”一位车评人在广州车展感叹道。 作为每年最后一个A级车展,广州车展向来被视为中国车市的“风向标”。相比上海车展“拥抱汽车行业新时代”、成都车展“驭见未来”的主题,广州车展“新…

为什么鼠标按键释放后才执行对应的动作?

如果你留心观察的话,你会发现这样一个事实:大部分的软件的用户体验中,一般都是在鼠标按键释放后,才会执行相应的动作,而不是按下的时候。例如,当我们按下开始菜单的时候,不会有任何动作发生&…

数据库基础入门 — SQL运算符

我是南城余!阿里云开发者平台专家博士证书获得者! 欢迎关注我的博客!一同成长! 一名从事运维开发的worker,记录分享学习。 专注于AI,运维开发,windows Linux 系统领域的分享! 本…

2023 年亚马逊黑色星期五和网络星期一的企业电子商务指南

亚马逊黑色星期五和网络星期一 周末即将到来!感恩节于 11 月 23 日举行,紧接着是 24 日黑色星期五和 27 日网络星期一。您的亚马逊业务准备好应对大量涌入了吗? 我们相信您已经准备好黑色星期五优惠并准备好库存,以确保您有足够的…

一键重装系统Win10专业版教程

在电脑操作过程中,用户如果遇到无法解决的系统问题,就可以考虑直接重新系统。现在,用户想要重新安装一下Win10专业版系统,但是不清楚具体的重装操作步骤。接下来小编给大家介绍轻松重装Win10专业版系统的详细步骤。 推荐下载 系统…

怎么快速卸载office365

怎么快速卸载office365 根据官网提供的两种解决方案即点即用或MSIMicrosoft Store 根据官网提供的两种解决方案 官网地址:https://support.microsoft.com/zh-cn/office/%E4%BB%8E-pc-%E5%8D%B8%E8%BD%BD-office-9dd49b83-264a-477a-8fcc-2fdf5dbf61d8#OfficeVersio…

如何在AppLink配置金蝶云星空预算使用单流程

上一篇有提到金蝶云星空如何通过AppLink平台配置销售订单操作,这次来演示下如何“保存预算使用单”、“调拨单定时自动审核”以及“预算使用单反审核后删除”操作。 根据请求数据保存预算使用单 当webhook接收到数据时触发流程 步骤1:根据webhook的请…

监控员工上网有什么软件丨三款好用的员工上网管理软件推荐

监控员工上网行为是企业管理中不可或缺的一部分,因此,选择一款好的监控员工上网的软件至关重要。目前市场上存在多种监控员工上网的软件,它们具有各种特点和功能,但企业需要仔细评估和选择。 一、域之盾软件 这是一款优秀的监控员…

第十七章 Java链接数据库

目录 1.登录MySQL 2.创建库和表 3.使用Java命令查询数据库操作 4.右击——点击“Build Path”——选择第四个——找到包的位置——导入成功 一、创建java项目 1.注册驱动 2.获取链接 3.获取statment对象 4.执行sql语句返回结果集 5.遍历结果集 6.关闭连接释放资源 封装…

给项目快速接入链路追踪

为什么需要链路追踪? 我们程序员在日常工作中,最常做事情之一就是修bug了。如果程序只是运行在单机上,我们最常用的方式就是在程序上打日志,然后程序运行的过程中将日志输出到文件上,然后我们根据日志去推断程序是哪一…

事件溯源模式

概念解释 事件溯源(Event Sourcing)是一种设计模式,其核心思想是将系统的状态变化表示为一系列不可变的事件,并将这些事件存储在事件日志中。系统的当前状态可以通过重新应用(回放)这些事件来还原&#xf…

webshell之扩展免杀

由于很多企业为了防止源码泄露,都会使用加密扩展将代码进行加密,那么我们就可以就将计就计,将webshell也利用扩展加密,将特征消除,从而达到免杀的效果 1.php-beast 扩展地址 下载dll,并添加至ext中 在php…

网络安全等级保护收费标准?

不同省份价格会略有不同,二级等保一般不低于5万元;三级等保不低于9万元,个别省份也可能7万也能办理,根据企业实际情况和省市选定的代理机构确定。 等级保护二级? 第二级等保是指信息系统受到破坏后,会对公民、法人和其他组织的合…

Airtest结合Poco对控件实施精准截图,学起来!

1.前言 最近在Q群内发现有个小伙伴提出了一个很有趣的脚本需求,想要实现“通过选择器获取到了控件,然后截图这个控件范围”,根据我们的Airtest的局部截图接口以及poco控件的属性查询接口是可以很快实现的~ 2.接口查找 首先我们需要知道我们…