商务与经济统计案例分析:3-1Pelican 商店——python 实现

商务与经济统计案例分析:3-1Pelican 商店

  • 要求
  • Python实现

要求

1.净销售额的描述统计量和各种不同类型顾客的净销售额的描述统计量。
2.关于年龄与净销售额之间关系的描述统计量。

Python实现

0.相关分析:2-1案例
1.净销售额的描述统计量和各种不同类型顾客的净销售额的描述统计量。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.read_csv("F:\DataAnalysis\StatisticForBusinessAndEconomics\PelicanStores\PelicanStores.csv")
data.head()

在这里插入图片描述

data['Net Sales'].describe()

在这里插入图片描述
从上面描述统计量中可以得出,该数据的样本量为100,其中最小净销售额为13.23,最大净销售额为287.59,平均净销售额是77.600500,该值大于第二四分位数(中位数)59.705000,有可能是因为受极大值影响,所以下面分别看一下净销售额的分布及箱型图:

分布条形图:

bin=[0,20,40,60,80,100,120,140,160,180,200,220,240,260,280,300]
data['GroupbyNetSales']=pd.cut(data['Net Sales'],bin,right=False,labels=['20','40','60','80','100','120','140','160','180','200','220','240','260','280','300'])
frequency=data['GroupbyNetSales'].value_counts()
x=list(frequency.sort_index().index)
y=list(frequency.sort_index().values)
plt.style.use('ggplot')
plt.bar(x=x,height=y,width=0.6)
plt.title('净销售额分布条形图')
plt.xlabel('')
plt.ylabel('频数')
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.show()

在这里插入图片描述
通过分布条形图可以看出,净销售额的分布出现左偏的现象,通过箱型图可以查找异常值:

plt.boxplot(x=data["Net Sales"],
            patch_artist=True,   # 是否要自定义颜色
            showmeans=False,     # 是否显示均值点
            boxprops={"color": "black", "facecolor": "c"},    # 箱体的颜色属性,color:边框色,facecolor:填充色
            flierprops={"marker": 'o', "markerfacecolor": "darkorange", "color": "black", "alpha": 0.8},  # 异常值的颜色属性,color:轮廓颜色,marker:标记形状,markerfacecolor:填充色
            medianprops={"linestyle": "--", "color": "black"})   # 中位线颜色属性,linestyle:线型,color:线的颜色
plt.show()

在这里插入图片描述
可以得出净销售额在180以上的数据为“异常数据”。

#查看各种不同类型顾客的净销售额的描述统计量。
table2 = data.pivot_table(values=["Net Sales"], index=["Type of Customer"], aggfunc=[np.mean,np.median,np.std,np.amin,np.amax], fill_value=0)
table2

在这里插入图片描述
从结果来看,促销用户的最小净销售额要小于普通用户的净销售额,促销用户最大净销售额要大于普通用户的净销售额,促销用户的净销售额标准差也大于普通用户的净销售额标准差,促销用户的离散程度比较高,又因为促销用户的净销售额被一些极大值的影响,提高了促销用户净销售额的平均值

#查看各类型用户的净销售额和的占比
data1=data.groupby(by=['Type of Customer'] )['Net Sales'].agg(np.sum)
sizes =list(data1[0:])
labels = list(data1.index)
colors = [ 'lightskyblue', 'lightcoral']
plt.pie(sizes,  labels=labels, autopct='%1.1f%%', colors=colors,shadow=True, startangle=110)

在这里插入图片描述
从总净销售额占比来看,促销用户的总销售额占总净销售额的76%。

2.关于年龄与净销售额之间关系的描述统计量。

plt.scatter(data['Age'], Data['Net Sales'])

plt.title('Age and Net Sales')
plt.xlabel('Age')
plt.ylabel('Net Sales')

plt.tight_layout()
plt.show();

在这里插入图片描述
通过散点图不容易看出这两个变量之间的关系,下面看一下年龄和净销售额的协方差及皮尔逊积矩相关系数:

np.cov(data['Age'], data['Net Sales'])

array([[ 153.48848485, -7.33488889],
[ -7.33488889, 3098.58537045]])

X = np.stack((data['Age'], data['Net Sales']), axis=0)# 每一行作为一个变量
np.corrcoef(X)

array([[ 1. , -0.01063589],
[-0.01063589, 1. ]])
通过计算两个变量之间的协方差可得知年龄和净消费额之间是负相关,进一步的通过皮尔逊相关系数可以得出这两个变量之间是弱相关

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/227311.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Docker二】docker网络模式、网络通信、数据管理

目录 一、docker网络模式: 1、概述 2、docker网络实现原理: 3、docker的网络模式: 3.1、bridge模式: 3.2、host模式: 3.3、container模式: 3.4、none模式: 3.5、自定义网络模式&#xf…

stateflow——如何查看状态机中参数变化及状态机断点调试

法一:使用Data Inspector 点击“符号图窗”和“属性”,如图;在选择变量n并右键点击inspector,最后在logging,如图 法二:log active state 和法一类似使用data inspector查看,类似的查看方法和…

《机器学习实战》MNIST 数据集的导入方法

1、在网上下载数据集 mnister 数据集有两个类型, (1)一个是手写的阿拉伯数字图片:MNIST 下载地址: 链接:https://pan.baidu.com/s/1dd-I-laysPbT8wxbyvxTvg 提取码:1234 (2…

【Flink系列五】Checkpoint及Barrier原理

本章内容 一致性检查点从检查点恢复状态检查点实现算法-barrier保存点Savepoint状态后端(state backend) 本文先设置一个前提,流处理的数据都是可回放的(可以理解成消费的kafka的数据) 一致性检查点(che…

基于ssm少儿编程管理系统源码和论文

idea 数据库mysql5.7 数据库链接工具:navcat,小海豚等 环境: jdk8 tomcat8.5 开发技术 ssm 基于ssm少儿编程管理系统源码和论文744 摘要 网络的广泛应用给生活带来了十分的便利。所以把少儿编程管理系统与现在网络相结合,利用java技术建设…

安装python第三方库后,在pycharm中不能正常导入

python小白学习opencv,使用pip安装完opencv库后import cv2报错,按照如下设置解决: 需要正确设置python解释器路径

VC++使用GetProcessTimes获取进程创建时间、销毁时间、用户态时间、内核态时间

一、GetProcessTimes函数简介(微软MSDN) 微软提供了一个非常有用的API函数GetProcessTimes用来获取进程创建时间、销毁时间、用户态时间、内核态时间,msdn连接为:GetProcessTimes 函数 (processthreadsapi.h) 其函数原型为&#…

<Linux>(极简关键、省时省力)《Linux操作系统原理分析之Linux文件管理(3)》(27)

《Linux操作系统原理分析之Linux文件管理(3)》(27) 8 Linux文件管理8.6 文件管理和操作8.6.1 系统对文件的管理8.6.2 进程对文件的管理 8 Linux文件管理 8.6 文件管理和操作 8.6.1 系统对文件的管理 Linux 系统把所有打开的活动…

智能优化算法应用:基于北方苍鹰算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于北方苍鹰算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于北方苍鹰算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.北方苍鹰算法4.实验参数设定5.算法结果6.参考…

12.07

#include "mywidget.h"MyWidget::MyWidget(QWidget *parent): QWidget(parent) {//窗口设置//去掉表头this->setWindowFlags(Qt::FramelessWindowHint);//重新设置大小this->resize(800,420);//设置背景颜色this->setStyleSheet("background-color:whi…

mfc140.dll丢失的解决方法,以及解决方法的优缺点

如果你在使用电脑时遇到了“mfc140.dll丢失”的错误提示,这可能会阻止你运行特定的应用程序或游戏。这篇文章将向你介绍导致此错误出现的原因以及mfc140.dll丢失的解决方法,让你的电脑系统恢复正常运行。 一.mfc140.dll丢失的解决方法以及优缺点 方法 1…

Hadoop3.x完全分布式环境搭建Zookeeper和Hbase

先在主节点上进行安装和配置,随后分发到各个从节点上。 1. 安装zookeeper 1.1 解压zookeeper并添加环境变量 1)解压zookeeper到/usr/local文件夹下 tar -zxvf /usr/local2)进入/usr/local文件夹将apache-zookeeper-3.8.0-bin改名为zookeep…

【Linux】进程通信之命名管道mkfifo

1.认识命名管道 匿名管道应用的一个限制就是只能在具有共同祖先(具有亲缘关系)的进程间通信。如果我们想在不相关的进程之间交换数据,可以使用FIFO文件来做这项工作,它经常被称为命名管道。命名管道是一种特殊类型的文件 2.在命…

学会使用这个魔法棒,再也不用在容器里安装乱七八糟的命令工具了!

在构建镜像的时候,我总是倾向于极简构建,一切没有必要的软件包都不安装,以此来缩小镜像的容量。但是这种做法为后续运维带来了一些困难,如在日常查询、排查问题的时候发现很多命令用不了,不得不在容器中安装额外的命令…

配置BFD状态与接口状态联动示例

BFD简介 定义 双向转发检测BFD(Bidirectional Forwarding Detection)是一种全网统一的检测机制,用于快速检测、监控网络中链路或者IP路由的转发连通状况。 目的 为了减小设备故障对业务的影响,提高网络的可靠性,网…

git 本地有改动,远程也有改动,且文件是自动生成的配置文件

在改动过的地方 文件是.lock文件,自动生成的。想切到远程的分支,但是远程的分支也有改动过。这时候就要解决冲突,因为这是两个分支,代码都是不一样的,要先把这改动的代码提交在本地或者提交在本分支的远程才可以切到其…

用keepalived做mysql高可用

两台机器(centos7系统)安装mysql [rootmysql-keep-master ~]# wget https://dev.mysql.com/get/mysql80-community-release-el7-3.noarch.rpm [rootmysql-keep-master ~]# rpm -ivh mysql80-community-release-el7-3.noarch.rpm [rootmysql-keep-master ~]# yum -y install yu…

深入探索C语言中的二叉树:数据结构之旅

引言 在计算机科学领域,数据结构是基础中的基础。在众多数据结构中,二叉树因其在各种操作中的高效性而脱颖而出。二叉树是一种特殊的树形结构,每个节点最多有两个子节点:左子节点和右子节点。这种结构使得搜索、插入、删除等操作…

web:[GXYCTF2019]BabyUpload(文件上传、一句话木马、文件过滤)

题目 页面显示为文件上传 随便上传一个文件看看 上传一个文本文件显示 上传了一个图片显示 上传包含一句话木马的图片 上传了一个包含php一句话木马的文件,显示如上 换一个写法 上传成功 尝试上传.htaccess,上传失败,用抓包修改文件后缀 …

python 编写的windows实用演示程序 使用到C语言风格,同时对Windows消息机制进行演示

因为内容较多 涉及知识点也多一些 但是具体使用时分开在几个文件 同时展示C语言的结构类型如何在python中定义与使用。为了便于区别 我定义的数据文件最后都带有一个数字1,涉及第三方库较少 ,以便灵活使用Windows自带的很多api函数功能,可以根…