【python】python 电子产品销售分析可视化(数据集+源码)【独一无二】

请添加图片描述


👉博__主👈:米码收割机
👉技__能👈:C++/Python语言
👉公众号👈:测试开发自动化【获取源码+商业合作】
👉荣__誉👈:阿里云博客专家博主、51CTO技术博主
👉专__注👈:专注主流机器人、人工智能等相关领域的开发、测试技术。


python 电子产品销售分析可视化(数据集+源码)【独一无二】


目录

  • python 电子产品销售分析可视化(数据集+源码)【独一无二】
  • 一、设计要求
  • 二、代码分析
      • 导入库和配置
      • 显示初始数据
      • 简单条件查询
      • 计算列数据的添加
      • 添加一行新数据
      • 修改特定条件的数据
      • 数据删除操作
      • 数据排序处理
      • 分组统计查询
      • 数据可视化
      • 总结


一、设计要求

主要实现了对电子产品销售数据的读取、处理、分析和可视化。具体而言,代码从CSV文件中读取数据,并展示初始数据内容。随后,通过各种条件查询操作,筛选出符合特定条件的数据记录,如价格大于100元、品牌为Samsung等。代码还进行了数据的计算与处理,添加了价格含税列和年龄段列,修改了特定条件下的字段值,并删除了不必要的列。排序操作按价格和年龄对数据进行升序和降序排序。此外,代码还进行了分组统计分析,计算每个品牌的平均价格、各年龄段的订单数量以及各性别的总消费金额。最后,通过折线图、柱状图和饼状图等可视化手段,直观展示了前20条记录的价格变化、前30个品牌的价格占比以及按性别和年龄段分组的统计结果。这些操作共同实现了对销售数据的全面分析与可视化呈现,为进一步的市场分析和决策提供了数据支持。

在这里插入图片描述

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈


二、代码分析

导入库和配置

import pandas as pd
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif']=['SimHei'] # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号

实现思路:

  1. 导入必要的库:pandas用于数据处理,matplotlib.pyplot用于数据可视化。
  2. 配置matplotlib以支持中文字符和负号的正常显示,确保在绘图时能够正确显示中文标签和负数。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

显示初始数据

print("初始数据内容:")
print(data.head())

初始数据内容: Unnamed: 0 event_time order_id
… age sex local 0 0 2020-04-24 11:50:39 UTC
2294359932054536986 … 24.0 女 海南 1 1 2020-04-24
11:50:39 UTC 2294359932054536986 … 24.0 女 海南 2 2
2020-04-24 14:37:43 UTC 2294444024058086220 … 38.0 女 北京 3
3 2020-04-24 14:37:43 UTC 2294444024058086220 … 38.0 女 北京
4 4 2020-04-24 19:16:21 UTC 2294584263154074236 … 32.0
女 广东

实现思路:

  1. 打印初始数据的前五条记录,以了解数据的基本结构和内容。

简单条件查询

price_gt_100 = data[data['price'] > 100]
print("价格大于100的记录:")
print(price_gt_100)

价格大于100的记录:
Unnamed: 0 event_time … sex local 0 0 2020-04-24 11:50:39 UTC … 女 海南 1 1
2020-04-24 11:50:39 UTC … 女 海南 4 4
2020-04-24 19:16:21 UTC … 女 广东 6 6
2020-04-26 09:33:47 UTC … 男 北京 7 7
2020-04-26 09:33:47 UTC … 男 北京 … …
… … … … 564160 2633512 2020-11-21 10:06:01 UTC …
女 北京 564162 2633514 2020-11-21 10:08:54 UTC … 女 上海
564163 2633515 2020-11-21 10:08:54 UTC … 女 上海 564164
2633516 2020-11-21 10:10:01 UTC … 男 上海 564165 2633517
2020-11-21 10:10:13 UTC … 女 北京

实现思路:

  1. 使用布尔索引查询price大于100的记录。
  2. 打印查询结果。

计算列数据的添加

data['price_with_tax'] = data['price'] * 1.10
print("添加税后价格的记录:")

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

添加税后价格的记录:
Unnamed: 0 event_time … local price_with_tax
0 0 2020-04-24 11:50:39 UTC … 海南 178.211
1 1 2020-04-24 11:50:39 UTC … 海南 178.211
2 2 2020-04-24 14:37:43 UTC … 北京 85.272
3 3 2020-04-24 14:37:43 UTC … 北京 85.272
4 4 2020-04-24 19:16:21 UTC … 广东 239.327

实现思路:

  1. 计算每条记录的价格加上10%的税费,并将结果存储在一个新列price_with_tax中。
  2. 打印更新后的数据。

添加一行新数据

new_data = {
    'event_time': '2020-04-25 10:00:00 UTC',
    'order_id': 2.29460E+18,
    ...
}
data = data.append(new_data, ignore_index=True)

实现思路:

  1. 构造一条新数据,将其存储在一个字典中。
  2. 使用append方法将新数据添加到DataFrame中。

修改特定条件的数据

data.loc[data['category_code'].isnull(), 'category_code'] = 'unknown'
print("修改category_code为空后的记录:")

实现思路:

  1. 找出所有category_code为空的记录,并将其category_code修改为unknown
  2. 打印更新后的数据。

数据删除操作

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

data = data.drop(columns=['local'])
print("删除'local'列后的记录:")

实现思路:

  1. 删除指定的列(如local),以简化数据结构。
  2. 打印更新后的数据。

数据排序处理

sorted_by_price = data.sort_values(by='price')
print("按价格升序排序后的记录:")

实现思路:

  1. 按照price列的值对数据进行升序排序。
  2. 打印排序后的数据。

分组统计查询

mean_price_by_brand = data.groupby('brand')['price'].mean()
print("按品牌分组的平均价格:")

实现思路:

  1. brand分组,计算每个品牌的平均价格。
  2. 打印分组后的统计结果。

数据可视化

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

plt.figure(figsize=(10, 6))
plt.plot(indices, prices, marker='o', linestyle='-', color='b')

折线图用于显示前20条记录的价格变化趋势。代码通过提取数据的前20条记录并获取其索引和价格,然后使用matplotlib的plot函数绘制折线图。在图表中,设置了图表的大小、标题、标签,并添加了网格线以便于观察数据点的变化。折线图清晰地展示了不同记录的价格走势,适合用来分析短期内价格的波动情况。

在这里插入图片描述

柱状图则用于展示前20条记录的价格分布情况。通过类似的方式提取前20条记录的价格数据,然后使用matplotlib的bar函数绘制柱状图。柱状图直观地显示了每条记录的价格差异,帮助识别高价和低价产品的数量及其价格区间。图表同样设置了标题和标签,便于理解图表的内容。柱状图可以很好地用于比较不同记录的价格,并在价格分析中提供清晰的视觉参考。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

在这里插入图片描述

最后,饼状图用于展示前30个品牌的总价格占比。代码首先计算每个品牌的总价格,并选取前30个品牌的数据。然后使用matplotlib的pie函数绘制饼状图。通过饼状图,可以直观地看到各品牌在总价格中的占比,帮助分析哪些品牌占据了主要的市场份额。饼状图设置了标签和百分比显示,增强了数据的可读性和直观性。整体而言,这些可视化图表通过不同的方式展示了销售数据的特征和统计结果,为数据分析提供了丰富的视觉支持,便于更深入地理解和挖掘数据中的信息。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

在这里插入图片描述

实现思路:

  1. 设置绘图的画布大小。
  2. 绘制折线图,显示前20条记录的价格变化情况。

总结

通过一系列步骤实现了电子产品销售数据的读取、处理和可视化分析。每个步骤都有明确的目的,从数据的读取和初步展示,到各种条件查询、数据处理,再到详细的分组统计和可视化,整个流程设计清晰、逻辑严谨,能够有效地对电子产品销售数据进行全面分析。

👉👉👉 源码获取 关注【测试开发自动化】公众号,回复 “电子产品” 获取。👈👈👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/697994.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【已解决】chrome视频无法自动播放的问题

问题: 在用datav开发大屏的时候,放了一个视频组件,但是发现视频组件即使设置了自动播放,仍然无法自动播放 原因: 76 以上版本的谷歌浏览器只能在系统静音下自动播放 解决: 音频自动播放浏览器白名单设置&…

幕墙设计乙级资质:企业技术负责人经验与教育背景

幕墙设计乙级资质中,对企业技术负责人的经验与教育背景有着明确的要求。以下是具体的解读: 一、教育背景 企业技术负责人应具备大学本科或以上学历,这是对其基本教育背景的要求。同时,这一学历背景通常需要在建筑、土木工程、结构…

一文细谈SNN的基本数学原理,LIF模型,STDP与STBP学习方法

首先本文是读完 如何看待第三代神经网络SNN?详解脉冲神经网络的架构原理、数据集和训练方法 原创-CSDN博客 一文通俗入门脉冲神经网络(SNN)第三代神经网络-CSDN博客 两篇文章的总结,文章仅用于学习。 本文主要讨论STDP和STBP方法。 我们都知道&…

YoloV9改进策略:Block篇|FFA-Net:用于单图像去雾的特征融合注意力网络(独家原创)

摘要 本文使用FFA-Net的Block改进YoloV9,使用Block替换RepNCSP中的RepNRes,非常简单!Block由卷积、通道注意力、像素注意力组成。结构图如下: 论文翻译:《FFA-Net:用于单图像去雾的特征融合注意力网络》…

夺冠了!U19国足是什么?这场夺冠对于中国足球意味着什么?

夺冠了!U19国足是什么?这场夺冠对于中国足球意味着什么? 在2024年“丝绸之路华山杯”渭南国际足球邀请赛中,中国U19国家男子足球队以出色的表现,力压群雄,最终夺得冠军。这一成绩不仅是对U19国足队员们辛勤…

ROS1配置husky仿真环境遇到的一些问题+方法论

ROS 系列学习教程(总目录) 本文目录 一、问题描述二、问题分析2.1 分析日志2.2 尝试一(失败)2.3 尝试二(成功) 三、husky仿真需要安装的软件包四、总结 - 方法论4.1 文件路径不合法4.2 文件内容不合法4.3 ROS 环境变量4.3.1 方法一…

Spring Boot集成tablesaw插件快速入门Demo

1.什么是tablesaw? Tablesaw是一款Java的数据可视化库,主要包括两部分: 数据解析库,主要用于加载数据,对数据进行操作(转化,过滤,汇总等),类比Python中的Pandas库;数据…

idea鼠标滚轮滚动放大缩小字体

在idea中的【file】->【settings】菜单,弹出settings窗口,点击窗口中的【Editor】->【General】,在右侧窗口中,选中【Change font size with CtrlMouse Wheel in All editors】即可。

Apollo9.0 PNC源码学习之Control模块(二)

前面文章:Apollo9.0 PNC源码学习之Control模块(一) 本文将对具体控制器以及原理做一个剖析 1 PID控制器 1.1 PID理论基础 如下图所示,PID各参数(Kp,Ki,Kd)的作用: 任何闭环控制系统的首要任务是要稳、准、快的响…

AdroitFisherman模块测试日志(2024/6/10)

测试内容 测试AdroitFisherman分发包中SHAUtil模块。 测试用具 Django5.0.3框架,AdroitFisherman0.0.31 项目结构 路由设置 总路由 from django.contrib import admin from django.urls import path,include from Base64Util import urls urlpatterns [path(ad…

教育的数字化转型——Kompas.ai如何变革学习体验

引言 在现代教育中,数字化转型逐渐成为提升学习效果的重要手段。随着科技的进步,人工智能(AI)在教育领域的应用越来越广泛。本文将探讨教育数字化转型的发展趋势,并介绍Kompas.ai如何通过AI技术变革学习体验。 教育数…

Nodejs 第七十六章(MQ进阶)

MQ介绍和基本使用在上一章介绍过了,不再重复 消息:在RabbitMQ中,消息是传递的基本单元。它由消息体和可选的属性组成 生产者Producer:生产者是消息的发送方,它将消息发送到RabbitMQ的交换器(Exchange&…

新概念英语视频百度云,新概念英语视频百度网盘,新概念1-4册

在现今数字化时代,英语学习资源丰富多样,其中新概念英语视频因其深入浅出的教学风格和丰富多样的学习内容,备受广大英语学习者的青睐。本文旨在为广大英语学习者提供一份详尽的新概念英语视频下载指南,帮助大家轻松获取优质学习资…

vscode 中 eslint 无效?npm init 是什么?

vscode 中 eslint 无效 我想要给一个项目添加 eslint,按照 eslint 官方指南操作: npm init eslint/configlatest自动安装了相关依赖并创建配置文件 eslint.config.mjs。 按理说,此刻项目应该已经配置好 eslint 了。但是我的编辑器 vscode …

冯喜运:6.11最新黄金原油趋势解析及独家多空操作建议

【黄金消息面分析】:周二(6月11日)亚市早盘,现货黄金窄幅震荡,目前交投于2310.15美元/盎司附近。黄金价格在上一交易日创下三年半来最大单日跌幅后于周一反弹,收报2310.71美元/盎司附近,投资者在…

java复习知识点

1.get,set: java 中当定义了一个私有的成员变量的时候,如果需要访问或者获取这个变量的时候,就可以编写set或者get方法去调用,set是给属性赋值的,get是取得属性值的,被设置和存取的属性一般是私有&#xf…

今日科普:生命杀手——“脑出血”

在我们的日常生活中,有一种被称为“脑出血”的疾病,它像是一位潜伏的杀手,无声无息地威胁着我们的生命。脑出血,简单来说,就是脑部血管破裂,导致血液流入脑组织,形成血肿,压迫和破坏…

SpringTask-Timer实现定时任务

1、Timer 实现定时任务 1.1、JDK1.3 开始推出定时任务实现工具。 1.2、API 执行代码 public static void main(String[] args) throws ParseException {Timer timer new Timer();String str"2024-06-10 23:24:00";Date date new SimpleDateFormat("yyyy-MM…

文本省略实现展开和收起功能(Taro)

目录 前言 思路 代码 CSS 效果 前言 在写项目的过程中很容易有说明性文本溢出需要出现省略号的功能,并且可以展开查看所有信息,并能够收起。我在写项目的过程中就遇到了这个问题,本来是想要使用组件库中的组件进行功能的实现,…

log4j日志打印导致OOM问题

一、背景 某天压测,QPS压到一定值后机器就开始重启,出现OOM,好在线上机器配置了启动参数-XX:HeapDumpOnOutOfMemoryError -XX:HeapDumpPath/**/**heapdump.hprof。将dump文件下载到本地,打开Java sdk bin目录下的jvisualvm工具&a…