手机销量分析案例

项目背景

  • 某电商商城随着业务量的发展,积累了大量的用户手机销售订单数据。决策层希望能够通过对这些数据的分析了解更多的用户信息及用户的分布,从而可以指导下一年的市场营销方案以及更加精准的定位市场,进行广告投放。

数据说明

  • 数据时间从 2017.01.01至2019.03.31 共41800 条,数据存储在 excel 文件 中(Phone.xlsx)。
    在这里插入图片描述

import pandas as pd
data = pd.read_excel(‘./Phone.xlsx’)
data.head()
在这里插入图片描述

data.shape
(41800, 20)

  • 查看缺失数据的个数和占比

#查看缺失数据
for col in data.columns:
null_count = data[col].isnull().sum()
if null_count > 0:
p = str(null_count / data[col].size * 100)+‘%’
print(col+‘:’+p)
年:100.0%
月:100.0%
年龄段:100.0%

  • 缺失值处理

data[‘年’] = data[‘订单日期’].dt.year
data[‘月’] = data[‘订单日期’].dt.month

#数据分箱:
#[0-16,17-26,27-36,37-49]
data[‘年龄段’] = pd.cut(data[‘年龄’],bins=[0,16,26,36,49])

  • 查看消费者对不同手机品牌的青睐程度

#查看不同品牌手机的累计销量和累计销售额,且对累计销量进行降序
data.groupby(by=‘品牌’)[[‘销售额’,‘数量’]].sum().sort_values(‘数量’,ascending=False)
在这里插入图片描述

  • 查看不同品牌的不同型号数量

p_count_list = [] #品牌名称和品牌型号的数量
for p in data[‘品牌’].unique():
#可以将p表示品牌的行数据
p_df = data.loc[data[‘品牌’] == p]
p_count = p_df[‘型号’].nunique() #品牌对应不同型号的数量
p_count_list.append([p,p_count])
pd.DataFrame(p_count_list,columns=[‘品牌’,‘型号数量’])
在这里插入图片描述

#分组聚合
data.groupby(by=‘品牌’)[‘型号’].nunique()
在这里插入图片描述

#分类汇总
data.pivot_table(index=‘品牌’,values=‘型号’,aggfunc=‘nunique’)
在这里插入图片描述

  • 查看不同品牌中价格最高和最低的型号是什么

data.groupby(by=[‘品牌’,‘型号’])[‘价格’].agg([‘max’,‘min’])
在这里插入图片描述

  • 查看不同月份的销量情况,哪些月份销量比较高

data.groupby(by=‘月’)[‘数量’].sum().sort_values(ascending=False)

3 16582
1 16420
2 15561
12 11060
5 11026
7 10987
11 10960
8 10884
4 10863
10 10833
6 10733
9 10644
Name: 数量, dtype: int64

  • 不同年龄段的购买力

data.groupby(by=‘年龄段’)[‘数量’].sum().sort_values(ascending=False)
年龄段
(16, 26] 74573
(26, 36] 68910
(0, 16] 1758
(36, 49] 1312
Name: 数量, dtype: int64

  • 查看不同省份不同城市的购买力情况

data.pivot_table(index=[‘省份名字’,‘城市名字’],values=‘数量’,aggfunc=‘sum’).sort_values(‘数量’,ascending=False)
在这里插入图片描述

  • 查看不同品牌的不同机身内存的订单量(只考虑订单量,不考虑一个订单中包含几个已购商品)

pd.crosstab(index=data[‘品牌’],columns=data[‘机身内存’])
在这里插入图片描述
内容来源于大数据分析课程。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/501884.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

链表基础题

206. 反转链表 问题描述 给定单链表的头节点 head ,请反转链表,并返回反转后的链表的头节点。 示例 1: 输入:head [1,2,3,4,5] 输出:[5,4,3,2,1]示例 2: 输入:head [1,2] 输出:…

CXL事务层(续)

3.2 CXL.cache 3.2.1 概览 CXL.cache协议将设备和主机之间的交互定义为多个请求,每个请求至少有一条相关的响应消息,有时还有数据传输。该接口在每个方向上由三个通道组成:请求(Request)、响应(Response&…

Docker Desktop 在 Windows 上的安装和使用

目录 1、安装 Docker Desktop 2、使用 Docker Desktop (1)运行容器 (2)查看容器信息 (3)数据挂载 Docker Desktop是Docker的官方桌面版,专为Mac和Windows用户设计,提供了一个简…

记录rocketMQ5.+启动报错解决过程

1.根据官方文档指引下载对应的rocketMQ源码包,上传到服务器解压 2. 启动NameServer nohup sh bin/mqnamesrv & 验证namesrv是否启动成功 tail -f ~/logs/rocketmqlogs/namesrv.log The Name Server boot success… 3.启动BrokerProxy nohup sh bin/mqbroker -n …

HuTool工具箱验证JWT生成Token失败

系列文章目录 文章目录 系列文章目录前言前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 Json web token (JWT), 是为了在网络应用环境间传递声明而执行的一种基于…

羡青山有思,Java有接口

本篇会加入个人的所谓‘鱼式疯言’ ❤️❤️❤️鱼式疯言:❤️❤️❤️此疯言非彼疯言 而是理解过并总结出来通俗易懂的大白话, 小编会尽可能的在每个概念后插入鱼式疯言,帮助大家理解的. 🤭🤭🤭可能说的不是那么严谨.但小编初心是能让更多人…

网络安全-内网DNS劫持-ettercap

前言 一,我也是初学者记录的笔记 二,可能有错误的地方,请谨慎 三,欢迎各路大神指教 四,任何文章仅作为学习使用 五,学习网络安全知识请勿适用于违法行为 学习网络安全知识请勿适用于违法行为 学习网络安全…

XR虚拟直播间,引领创新风潮,打破直播局限!

随着互联网技术日新月异的发展,直播行业也迎来了蓬勃发展的春天。然而,大多数直播间在吸引观众眼球和延长用户观看时长方面,仍然面临着巨大的挑战。正是在这样的背景下,XR虚拟直播系统应运而生,以其多维度的直播场景、…

香港服务器怎么看是CN2 GT线路还是CN2 GIA线路?

不知道有没有小伙伴们注意过,很多人在租用香港服务器的时候都习惯性选择 CN2 线路?仿佛香港服务器是否采用 CN2 线路成为个人企业选择香港服务器的一个标准。其实,香港服务器有CN2、优化直连(163)、BGP多线(包含了国际和国内线路)&#xff0c…

unity小:使用Unity FBX Exporter 将 3DMax场景或者模型无损导入Unity

本指南旨在帮助您顺利安装和配置Unity FBX Exporter插件,并解决相关的常见问题。 安装 FBX Exporter 下载并安装FBX Exporter插件。 打开Unity,选择 Edit > Project Settings > Fbx Export。 点击 Install Unity Integration 并选择3ds Max的插…

图片标注编辑平台搭建系列教程(4)——fabric几何定制渲染

背景 标注的几何,有时需要一些定制化的渲染样式,例如,线中间展示箭头,表示方向。本期教程教大家如何实现fabric几何定制化渲染。 带箭头的线 fabric提供了一些原生的几何,例如Point、Polyline、Polygon。同时提供了…

编程器固件修改教程

首发csdn,转载请说明出处,保留一切权益。 关于编程器固件 所谓编程器固件是用编程器读取嵌入式设备的FLASH存储数据生成的文件,类似于直接用工具复制整个硬盘 编程器固件与普通固件的差异 编程器固件是用特定的结构(按顺序、大小)将一些文件系…

私有库 nexus Dependency ‘SNAPSHOT‘ not found

私有库 nexus 提示 Dependency SNAPSHOT not found jar包无法下载,困扰了很久,后来才发现,是因为只在 dependencyManagement 里写了引用,没有在具体的 dependencies 里引用,导致无法获取到jar包,低级错误…

测试用例设计方法:正交试验法详解!

01、正交试验法介绍 正交试验法是研究多因素、多水平的一种试验法,它是利用正交表来对试验进行设计,通过少数的试验替代全面试验,根据正交表的正交性从全面试验中挑选适量的、有代表性的点进行试验,这些有代表性的点具备了“均匀…

Linux学习教程 Linux入门教程(超全面 超详细)收藏这一篇就够了

Linux是什么? linux是一个开源、免费的操作系统,其稳定性、安全性、处理多并发能力已经得到业界的认可,目前大多数企业级应用甚至是集群项目都部署运行在linux操作系统之上,很多软件公司考虑到开发成本都首选linux,在…

文本批量高效处理,自动粘贴筛选网址,轻松管理海量链接

在互联网时代,网址链接成为我们获取信息、沟通交流的重要桥梁。然而,面对海量的网址链接,如何快速筛选、整理并管理它们成为了一个挑战。为了解决这一问题,我们特别推出了智能网址筛选功能,让您在自动粘贴的同时&#…

软考103-上午题-【结构化开发】-模块独立

一、命题特点 考试类型: 选择题(3~9分)综合分系题(数据流图【试题一】,15分) 二、系统设计的基本原理 1、抽象 2、模块化 将一个待开发的软件分解为若干个小的简单部分——模块。 每个模块可以独立的开…

基于java+SpringBoot+Vue的校友社交系统设计与实现

基于javaSpringBootVue的校友社交系统设计与实现 开发语言: Java 数据库: MySQL技术: SpringBoot MyBatis工具: IDEA/Eclipse、Navicat、Maven 系统展示 前台展示 后台展示 系统简介 整体功能包含: 校友社交系统是一个为校友提供一个交流互动、信息共享的平台…

ObjectiveC-03-XCode的使用和基础数据类型

本节做为Objective-C的入门课程,笔者会从零基础开始介绍这种程序设计语言的各个方面。 术语 ObjeC:Objective-C的简称,因为完整的名称过长,后续会经缩写来代替;项目/工程:也称工程,指的是一个A…

canvas画图,画矩形,圆形,直线,曲线可拖拽移动

提示:canvas画图,画矩形,圆形,直线,曲线可拖拽移动 文章目录 前言一、画矩形,圆形,直线,曲线可拖拽移动总结 前言 一、画矩形,圆形,直线,曲线可拖…