Python数据分析大作业(ARIMA 自回归积分滑动平均模型) 4000+字 图文分析文档 销售价格库存分析+完整python代码

资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

完整代码分析

同时销售量后1000的sku品类占比中(不畅销产品)如上,精品类产品占比第一,达到66.7%,其次是香化类产品,占比11.90%,远远小于精品类产品,酒水类产品占比7.3%,有税商品免税其他商品和电子类产品分别占比6.40%、6.40%、1.3%,

将数据按照毛利进行排序,毛利前1000和后1000的sku品类占比如下,

可以发现按照毛利排序,各品类的sku数量占比区别不如按照销量排序的各品类sku数量占比那么大,其中按照毛利排序的sku前1000,品类sku占比最大的是香化类,其次是精品类,它们占比分别达到33.2%和31.5%,其中占比最小的是免税商品其他类,说明该品类的毛利率相对较小,而毛利率较大的为精品类和香化类,这和品牌有一定关系,人民生活正在慢慢变好,精品类商品能满足大部分人民的精致生活,同时香化类产品受众多为女性,商品需求大,毛利也高。对于毛利sku后1000的商品,其中有税商品和精品类和香化类商品仍然占领霸主位置,原因可能由于对于精品类和香化类的部分商品经常打折来吸引顾客,所以这部分商品的毛利较低,sku后1000商品品类占比最大的为有税商品,占比达到33.00%,由于考虑到税额加上顾客的消费能力,这部分的商品毛利相对低一点,同时香化类和精品类占比也达到25.9%和25.6%,占比最小的为电子产品,占比为1.3%。

分析sku销量前1000和销量后1000商品的毛利率,得到毛利率的条形图如下,

从上图可以发现sku前1000商品的毛利率大概在0.2到0.5左右,而sku后1000的商品的毛利率大部分在0.4到0.5左右,可以认为销量高的商品其毛利率未必会比销量低的商品的毛利率高,这给我们销售商品很有启示,对于商品售卖我们未必要一定去打折扣吸引顾客(当然折扣对部分顾客有一定吸引力),对于畅销品我们就没必要去打折,因为商品本身可能就供不应求,这样通过畅销品的提高整个商场的利润,对于不畅销商品,我们也不一定要去打折,对于不畅销商品,可能其受众较小,而对于那部分受众来说,这对于其他人最不畅销的商品对于他们来说可能是必需品,所以也没必要打折,通过保证毛利,也能提高商场的利润。

价格分析

首先将各品类下的大类进行区间划分,拟定划分6个区间,然后计算每个品类下每个大类的每个价格区间的个数,各品类商品的大类价格区间条形图如下,

上面4个品类,精品品类、免税其他品类、香化品类、有税品类的价格区间如图,取免税其他品类进行分析说明,首先免税其他品类下面有六个大类,对这六个大类进行区间划分,划分6个价格区间,其中条形图的高度为对应区间的个数,对于所有的大类,其位于低价位的价格区间个数是最多的,说明大多数人的消费能力有限,会偏向于低价位的商品,对于精品品类,其类下的高级珠宝在各个价格区间中价格区间个数相对其他大类会更多一点,说明高级珠宝受价格的影响相对较小,因为高级珠宝的受众基本是固定的,这些顾客不管价格高或者低都是能够消费的起,所以价格对他们影响不大。对于香化类,价格区间个数很大一部分都在最低价格区间内,随着化妆品行业兴起,很多爱美的顾客都选择购买化妆品,但大多数人的消费能力有限,所以低价格的化妆品成为了畅销产品,而且低价格的化妆品价格区间个数远远高于高价格的价格区间个数。对于酒水和电子品类,其对应的大类只有一个,如下所示,对于这两个品类,可以发现酒水品类的低价位远远比其他价位的多,说明便宜酒水的受众很多,而昂贵酒水受众较少,所以对于低价位酒水可以通过促销来促进购买,对于高价位酒水则可以定高价保证利润。对于电子产品,其中等价位及以下的销售区间个数比较多,相当于珠宝酒水来说,人民更愿意在电子产品上花钱,这也是科技给人们带来的便捷之处,但高价位的电子产品的区间个数仍是较少,和人们的消费习惯和消费能力有关。

接着查看各品类下的各大类的畅销产品价格区间的折扣率,这里在每一个品类中选取一个大类的价格区间折扣进行分析,对于有税品类下的个人洗护大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(35.877, 56.5] 0.6818181818181818

(56.5, 77.0] 0.640625

(77.0, 97.5] 1.0

(97.5, 118.0] 0.8571428571428571

(118.0, 138.5] 0.0

(138.5, 159.0] 0.5

最畅销产品价格区间(56.5, 77.0]

最不畅销产品价格区间(118.0, 138.5]

从上面可以发现最畅销产品价格区间位于低价区间,但其折扣率为0.6,算是较高了,而最不畅销的价格区间,其折扣率为0,结合前面的分析,对于低价产品,我们可以减小我们的折扣率来提高利润。对于不畅销的产品我们可以进行适当的折扣来促进购买,对于电子品类下的家居大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(32.326, 3875.875] 0.9583333333333334
(3875.875, 7696.5] 0.978021978021978
(7696.5, 11517.125] 0.9745347698334965
(11517.125, 15337.75] 1.0
(15337.75, 19158.375] 1.0
(19158.375, 22979.0] 1.0
最畅销价格区间(7696.5, 11517.125]

最不畅销价格区间(19158.375, 22979.0]

和有税品类不同的是,最不畅销产品价格区间为最贵的价格区间,而且最不畅销的产品价格区间达到了百分百,而最畅销产品的价格区间位于中等价位价格区间,折扣率也比较高。说明对于电子产品这一类相当难以进行修补的产品来说,人们更倾向于贵一点的,可能这和人们的消费理念和消费能力有关, 一般来说电子产品作为非易换品,人们更倾向于买好一点,用久一点,所以出现最畅销的反而不是价格最低的。对于精品品类下的服装大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(38.19, 410.342] 0.08333333333333333

(410.342, 780.273] 0.09401709401709402

(780.273, 1150.205] 0.016129032258064516

(1150.205, 1520.137] 0.058823529411764705

(1520.137, 1890.068] 0.3333333333333333

(1890.068, 2260.0] 0.11764705882352941

最畅销产品价格区间(780.273, 1150.205]

最不畅销产品价格区间(1520.137, 1890.068]

同上面一样,最畅销产品价格区间位于非位于最低价价格区间,而最不畅销的产品价格区间位于中间价位价格区间,因为对于服装类来说,每一个人都有需求,而对于消费能力不够的消费者来说,他们大多会选择网购而不会选择去商城购物,而大多数人选择去商城购买衣服的都是具有一定的消费能力,但他们消费能力也是有限,所以最畅销的价格区间是中等价位偏下,而中等价位偏上的价格区间对于消费能力不足的消费者来说性价比不高,而对于消费能力足够的消费者来说又不上档次,所以这个价位处于一个比较尴尬的位置。对于这个区间的产品可以稍微的促销提高销量。

对于酒水品类下的进口酒水大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(6.66, 9378.333] 0.27345591702027344
(9378.333, 18722.667] 1.0
(18722.667, 28067.0] 0.05555555555555555
(28067.0, 37411.333] 0.0
(37411.333, 46755.667] 0.0
(46755.667, 56100.0] 0.0
最畅销价格区间(6.66, 9378.333]
最不畅销价格区间(9378.333, 18722.667]

和上面品类不一样的是,最畅销的产品位于最低价价格区间,由于低价酒类的受众较多,而10000元以下的酒对于普通消费人群来说也不便宜,所以这个价位最畅销,同时折扣也较低,对于最不畅销的商品,是在第二低价价格区间,折扣率为1,而最高价位的酒折扣率为0反而不是最不畅销的价格区间,因为高价酒的受众较少,同时他们也有能力进行消费,所以不需要进行折扣。而最不畅销的价格区间是不受低端客户和高端客户的喜爱,所以不畅销。

对于香化品类下的个人洗护大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(59.07, 215.0] 0.09813084112149532
(215.0, 370.0] 0.0729483282674772
(370.0, 525.0] 0.10810810810810811
(525.0, 680.0] 0.0425531914893617
(680.0, 835.0] 0.25
(835.0, 990.0] 0.10526315789473684
最畅销产品价格区间(215.0, 370.0] 
最不畅销产品价格区间(680.0, 835.0]

同上面一个,畅销产品为虽为低价产品,但其并未是最低价产品,该产品折扣率低,同时不畅销产品为高价产品,但也并非是最高价区间产品,折扣率也低。说明价格并不是决定畅销和不畅销的唯一因素,对于洗护类产品,由于关乎自身皮肤健康,所以相当中等价位的产品比较畅销,对于免税其他商品的书写工具大类其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(5.879, 2215.883] 0.24
(2215.883, 4412.707] 0.36363636363636365
(4412.707, 6609.53] 0.0
(6609.53, 8806.353] 0.3333333333333333
(8806.353, 11003.177] 0.0
(11003.177, 13200.0] 0.0
最畅销价格区间(5.879, 2215.883]
最不畅销价格区间 (8806.353, 11003.177]
对于书写工具,由于需求较大,人民对其没有过多要求,能写就行,所以人民会倾向于较低价的产品,所以其最畅销的价格区间为最低价价格区间,而最不畅销的是倒数第二贵的价格区间,同样这个区间基本只有有强大消费能力的人去购买,而这类人往往会挑选最贵的去买,所以其成为最不畅销的产品价格区间。

库存分析

 资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

分析各品类下各大类的sku数,以条形图展现,如下

通过分析各大类的sku数可以判断哪些大类商品需要更多的库存,哪些大类商品需要的库存少,对于有税商品中的干杂大类,香化品类中的护肤大类,免税其他品类的玩具大类以及精品品类下的珠宝和钟表大类,他们sku数比较多,可以多放些库存以免缺货。

接着根据28法则,分析各品类下sku金额以及累计金额,结果如下,

从上面的表中可以发现,免税其他品类和有税品类的前20%的商品金额大概占比总的商品金额的60%,而其他四个品类大概占比了80%,符合28法则。

分析每个品类下的期初期末以及平均库存,结果如下

免税其他品类的营养保健类、干杂类库存较多,而期初库存全为0,根据上面的分析,书写工具和玩具的sku数较多,可以加大这两类库存

进口酒类期初库存也为0,可以加一些期初库存

精品品类的珠宝和钟表类的sku数较多,而上方珠宝的库存较少,可以加大该类的品类库存

对于家居品类,可以加一些期初库存。

对于有税商品,干杂类珠宝sku数较多,可以加大珠宝类的库存,根据上图,珠宝类的库存较少,可以加强库存。

标题

对于香化品类,护肤和香水大类的sku数较多,而上图香水库存较少,可以加强该库存。

使用价格区间来分析库存。

通过分析最畅销库存以及最不畅销库存来调配商品。由于品类过多,选取一部分分析,结果如下。

 有税品类的个人洗护类:

                

电子品类:

精品类

酒水类

对于这六个品类,除了有税品类下的个人洗护类的不畅销价格区间的库存相对多一点外,其他的最不畅销的价格区间的商品库存都比最畅销的商品库存低许多,说明在不同价格区间的库存来说,库存的配比没有问题,对于精品类,由于其占商品销售很大一部分,所以需要着重的分析,首先需要提高畅销产品的库存,但不一定要减小不畅销产品的库存,因为对于精品类来说,其最不畅销的产品销量可能比其他的类要高,所以可以选择增大畅销产品的库存,同时不动非畅销品的库存。而其他四个看起来正常,他们的库存远远多于最不畅销产品的库存量,在一定程度上认为是合理的。

分析有效库存的各品类的库存数

上图为总库存,有效库存,无效库存的条形图,发现有效库存占总库存的绝大多数,接下来分析不同品类下的库存数量,

有税品类的库存如下,有税品类下干杂类sku最多,其库存也最多,库存配比无误

电子类,电子类占销售比例也较大,其库存也算较多,库存配比无误,

精品类库存图如下,精品类下钟表和珠宝的sku较多,而下面珠宝的库存不多,可以适当提高其库存,相对减少其他库存

 资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/583939.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【架构】后端项目如何分层及分层领域模型简化

文章目录 一. 如何分层1. 阿里规范2. 具体案例分析 二. 分层领域模型的转换1. 阿里规范2. 模型种类简化分析 三. 小结 本文描述后端项目中如何进行分层,以及分层领域模型简化 一. 如何分层 1. 阿里规范 阿里的编码规范中约束分层逻辑如下: 开放接口层&#xff1a…

Apache Seata基于改良版雪花算法的分布式UUID生成器分析1

title: Seata基于改良版雪花算法的分布式UUID生成器分析 author: selfishlover keywords: [Seata, snowflake, UUID] date: 2021/05/08 本文来自 Apache Seata官方文档,欢迎访问官网,查看更多深度文章。 Seata基于改良版雪花算法的分布式UUID生成器分析…

NLP(10)--TFIDF优劣势及其应用Demo

前言 仅记录学习过程,有问题欢迎讨论 TF*IDF: 优势: 可解释性好 可以清晰地看到关键词 即使预测结果出错,也很容易找到原因 计算速度快 分词本身占耗时最多,其余为简单统计计算 对标注数据依赖小 可以使用无标注语…

请编写函数fun,该函数的功能是:将放在字符串数组中的M个字符串(每串的长度不超过N),按顺序合并组成一个新的字符串。

本文收录于专栏:算法之翼 https://blog.csdn.net/weixin_52908342/category_10943144.html 订阅后本专栏全部文章可见。 本文含有题目的题干、解题思路、解题思路、解题代码、代码解析。本文分别包含C语言、C++、Java、Python四种语言的解法完整代码和详细的解析。 题干 请编…

React Router 路由配置数组配组持久化

在一些特定场景下,你可能需要将路由配置数组进行持久化,例如从后端动态加载路由配置或根据用户权限动态生成路由配置。这时,持久化路由配置数组就很有用,可以避免每次应用启动时重新获取或计算路由配置。 持久化路由配置数组的步骤如下: 定义路由配置数组 首先,你需要定义一…

[华为OD]C卷 找座位,在一个大型体育场内举办了一场大型活动,由于疫情防控的需要 100

题目: 在一个大型体育场内举办了一场大型活动,由于疫情防控的需要,要求每位观众的必须间隔至 少一个空位才允许落座。现在给出一排观众座位分布图Q,座位中存在已落座的观众,请计 算出,在不移动现有观众座位的情况…

从不同性别、年龄入手,发过的主题还能发!| NHANES数据库周报(4.24)

零基础NHANES挖掘培训班,欢迎咨询! 课程 | 零基础两天掌握NHANES公共数据库挖掘技巧,发表SCI论文 美国国家健康和营养检查调查(NHANES)是一项旨在评估美国成人和儿童健康和营养状况的研究计划。该调查的独特之处在于它结合了访谈和…

Spring6 当中 获取 Bean 的四种方式

1. Spring6 当中 获取 Bean 的四种方式 文章目录 1. Spring6 当中 获取 Bean 的四种方式每博一文案1.1 第一种方式:通过构造方法获取 Bean1.2 第二种方式:通过简单工厂模式获取 Bean1.3 第三种方式:通过 factory-bean 属性获取 Bean1.4 第四种…

LT6911C HDMI 1.4 至 2 端口 MIPI DSI/CSI 龙迅方案

1. 描述LT6911C 是一款高性能 HDMI1.4 至 MIPIDSI/CSI/LVDS 芯片,适用于 VR/智能手机 / 显示应用。对于 MIPIDSI / CSI 输出,LT6911C 具有可配置的单端口或双端口 MIPIDSI/CSI,具有 1 个高速时钟通道和 1~4 个高速数据通道,工作速…

NFTScan | 04.22~04.28 NFT 市场热点汇总

欢迎来到由 NFT 基础设施 NFTScan 出品的 NFT 生态热点事件每周汇总。 周期:2024.04.22~ 2024.04.28 NFT Hot News 01/ ApeCoin DAO 发起「由 APE 代币支持的 NFT Launchpad」提案投票 4 月 22 日,ApeCoin DAO 社区发起「由 APE 代币支持的 NFT Launch…

JAVA基础——集合框架(List与Set)

数据结构 什么是数据结构 数据结构就是用来装数据以及数据与之间关系的一种集合。如何把相关联的数据存储到计算机,为后续的分析提供有效的数据源,是数据结构产生的由来。数据结构就是计算机存储、组织数据的方式。好的数据结构,让我们做起事…

Deckset for Mac激活版:MD文档转幻灯片软件

Deckset for Mac是一款专为Mac用户打造的Markdown文档转幻灯片软件。它凭借简洁直观的界面和强大的功能,成为许多用户的心头好。 Deckset for Mac激活版下载 Deckset支持Markdown语法,让用户在编辑文档时无需分心于复杂的格式设置,只需专注于…

分布式与一致性协议之Raft算法(二)

Raft算法 什么是任期 我们知道,议会选举中的领导者是有任期的,当领导者任命到期后,需要重新再次选举。Raft算法中的领导者也是有任期,每个任期由单调递增的数字(任期编号)标识。比如,节点A的任期编号是1。任期编号会…

Spark-机器学习(8)分类学习之随机森林

在之前的文章中,我们学习了分类学习之支持向量机决策树支持向量机,并带来简单案例,学习用法。想了解的朋友可以查看这篇文章。同时,希望我的文章能帮助到你,如果觉得我的文章写的不错,请留下你宝贵的点赞&a…

【全开源】Java上门老人护理老人上门服务类型系统小程序APP源码

功能: 服务分类与选择:系统提供详细的老人护理服务分类,包括日常照护、康复训练、医疗护理等,用户可以根据老人的需求选择合适的服务项目。预约与订单管理:用户可以通过系统预约护理服务,并查看订单详情&a…

mybatis工程需要的pom.xml,以及@Data 、@BeforeEach、@AfterEach 的使用,简化mybatis

对 “mybatis - XxxMapper.java接口中方法的参数 和 返回值类型&#xff0c;怎样在 XxxMapper.xml 中配置的问题” 这篇文章做一下优化 这个pom.xml文件&#xff0c;就是上面说的这篇文章的父工程的pom.xml&#xff0c;即&#xff1a;下面这个pom.xml 是可以拿来就用的 <?…

Python爬虫(入门版)

1、爬虫是什么 简单的来说&#xff1a;就是用程序获取网络上数据。 2、爬虫的原理 如果要获取网络上数据&#xff0c;我们要给爬虫一个网址&#xff08;程序中通常叫URL&#xff09;&#xff0c;爬虫发送一个HTTP请求给目标网页的服务器&#xff0c;服务器返回数据给客户端&am…

帕累托森林李朝政博士受聘「天工开物开源基金会」专家顾问

导语&#xff1a; 开源铸造了当前最前沿的科技引擎。开源驱动了软件生态&#xff0c;也以指数级速度驱动硬件生态。 3月中旬&#xff0c;天工开物开源基金会授予李朝政博士专家顾问&#xff0c;表彰他积极推动参与中国智能软件生态的建设&#xff0c;期待一起共筑未来新生态。…

稳扎稳打 部署丝滑 开源即时通讯(IM)项目OpenIM源码部署流程(linux windows mac)

背景 OpenIM包含多个关键组件&#xff0c;每个都是系统功能必不可少的一部分。具体来说&#xff0c;MongoDB 用于持久化存储&#xff1b;Redis 用作缓存&#xff1b;Kafka 用于消息队列&#xff1b;Zookeeper 用于服务发现&#xff1b;Minio 用于对象存储。这些组件的众多可能会…

C# Web控件与数据感应之 ListControl 类

目录 关于数据感应 ListControl 类类型控件 范例运行环境 数据感应通用方法 设计 实现 调用示例 数据源 调用 小结 关于数据感应 数据感应也即数据捆绑&#xff0c;是一种动态的&#xff0c;Web控件与数据源之间的交互&#xff0c;诸如 System.Web.UI.WebControls 里…