数据分析案例-二手车用户数据可视化分析(文末送书)

 

🤵‍♂️ 个人主页:@艾派森的个人主页

✍🏻作者简介:Python学习者
🐋 希望大家多多支持,我们一起进步!😄
如果文章对你有帮助的话,
欢迎评论 💬点赞👍🏻 收藏 📂加关注+


目录

1.项目背景

2.数据集介绍

3.技术工具

4.导入数据

5.数据可视化

文末推荐与福利


1.项目背景

        二手车市场作为汽车行业中的重要组成部分,一直备受关注。随着社会经济的不断发展和人们生活水平的提高,越来越多的消费者选择购买二手车。这一趋势使得二手车市场的规模不断扩大,也引起了人们对二手车市场的关注和研究。

        在二手车市场中,用户数据是一个极具价值的研究对象。通过对二手车用户数据的深入分析,可以揭示出用户的购车偏好、消费习惯、区域分布等重要信息。这些信息对于汽车生产企业、销售商以及政府部门来说都具有重要意义。例如,汽车生产企业可以根据用户数据来调整产品结构和定价策略;销售商可以根据用户数据来开展精准营销和销售服务;政府部门可以通过对用户数据的分析来指导相关政策的制定和调整。

        此外,通过对用户数据进行可视化分析,可以更直观地展现数据之间的关联性和趋势变化。通过可视化手段,决策者可以更清晰地了解用户的行为特征和市场变化趋势,从而更准确地制定相应的战略和政策。

        因此,对二手车用户数据进行可视化分析具有重要的理论和实践意义。这不仅有助于深入了解二手车市场的运行情况和用户特征,还能为相关利益方提供决策参考,推动二手车市场的健康发展。

2.数据集介绍

        数据集来源于Kaggle,原始数据集为美国二手车市场用户数据,共有7906条,18个变量,各变量含义如下:

Sales_ID(销售ID)

name(二手车名称)

year(购车年份)

selling_price(二手车当前销售价格)

km_driven(总行驶公里数)

Region(使用地区)

State or Province(使用的州或省)

City(使用城市)

fuel(燃料类型)

seller_type(谁在出售汽车)

transmission(汽车的变速器类型)

owner(业主类型)

mileage(汽车行驶里程)

engine(发动机功率)

Max_power(最大功率)

torque(转矩)

seats(座位数)

sold(二手车是否售出)

3.技术工具

Python版本:3.9

代码编辑器:jupyter notebook

4.导入数据

首先导入数据可视化用到的第三方库并加载数据

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
from plotly.offline import iplot 
import warnings
warnings.filterwarnings('ignore')

df = pd.read_csv("UserCarData.csv")
df.head()

查看数据大小

查看数据基本类型 

查看数值型变量的描述性统计

查看非数值型变量的描述性统计

统计缺失值情况 

 

 统计重复值情况

5.数据可视化

# 二手车名称分析
print(f"Most Used Sold Car '{df['name'].value_counts().idxmax()}'")
print(f"Lowest Used Car Sold '{df['name'].value_counts().idxmin()}'")
iplot(px.bar(df['name'].value_counts()[:20],
             labels={'value':'Count','name':'Name'},
             color=df['name'].value_counts()[:20].index,
             text_auto=True,
             title='Top Used Cars Sold'
))

# 二手车年份分析
print(f"Most Year Used Sold Car '{df['year'].value_counts().idxmax()}'")
print(f"Lowest Year Used Car Sold '{df['year'].value_counts().idxmin()}'")
iplot(px.bar(df['year'].value_counts()[:20].sort_index(ascending=False),
             labels={'value':'Count','year':'Year'},
             color_discrete_sequence=['#c72320'],
             text_auto=True,
             title='Top Year Used Cars Sold'
).update_xaxes(type=('category')))

# 地区分析
iplot(px.pie(values=df['Region'].value_counts(),
             names=['Central','West','East','South'],
             title='Region where Sold Used Car'
).update_traces(textinfo='label+percent'))

# 省或州分析
print(f"Top State or Province where Sold Used car '{df['State or Province'].value_counts().idxmax()}'")
print(f"Least State or Province where Sold Used car '{df['State or Province'].value_counts().idxmin()}'")
iplot(px.bar(df['State or Province'].value_counts().sort_values(ascending=True)[:30],
             orientation='h',
             color=df['State or Province'][:30].index,
             title='Top State or Province Sold Used Car',
             labels={'value':'Count'}
))

# 城市分析
print(f"Top City where Sold Used car '{df['City'].value_counts().idxmax()}'")
print(f"Least City where Sold Used car '{df['City'].value_counts().idxmin()}'")
iplot(px.bar(df['City'].value_counts().sort_values(ascending=False)[:20],
             color=df['City'][:20].index,
             title='Top City Sold Used Car',
             labels={'value':'Count'},
             text_auto=True
))

# 燃料分析
print(f"Top Fuel Used in Used car '{df['fuel'].value_counts().idxmax()}'")
print(f"Least Fuel Used in Used car '{df['fuel'].value_counts().idxmin()}'")
iplot(px.pie(values=df['fuel'].value_counts(),
             names=['Diesel','Petrol','CNG','LPG'],
             title='Fuel Used in Used Car'
).update_traces(textinfo='label+percent'))

# 卖家类型分析
print(f"Most Type of Seller '{df['seller_type'].value_counts().idxmax()}'")
iplot(px.pie(values=df['seller_type'].value_counts(),
             names=['Individual','Dealer','Trustmark_Dealer'],
             title='Types of Seller Used Cars'
).update_traces(textinfo='label+percent'))

# 变速器类型
iplot(px.pie(values=df['transmission'].value_counts(),
             names=['Manual','Automatic'],
             title='Types of Transmissions Used in Used Sold Cars'
).update_traces(textinfo='label+percent'))

# 业主类型分析
print(f"Most Owner Sold Used Cars '{df['owner'].value_counts().idxmax()}'")
iplot(px.pie(values=df['owner'].value_counts(),
             names=['First Owner','Second Owner','Third Owner','Fourth Above Owner','Test Drive Car'],
             title='Owners of Used Cars'
).update_traces(textinfo='label+percent'))

# 转矩分析
iplot(px.bar(df['torque'].value_counts().sort_values(ascending=False)[:20],
             orientation='h',
             color=df['torque'][:20].index,
             title='Top Torque Used in Used Sold Cars',
             labels={'value':'Count','torque':'Torque'}
))

# 行驶里程分析
plt.figure(figsize=(15,6))
sns.kdeplot(df['mileage'],fill=True)
plt.xlabel("Mileage")
plt.show()

文末推荐与福利

《AI绘画教程:Midjourney使用方法与技巧从入门到精通》免费包邮送出3本!

内容简介:      

       本书介绍了当前AI绘画领域极具人气的绘画工具——Midjourney,并全面系统地讲述了Midjourney绘画的基本应用技能和相关领域的实战案例。

        全书共分为11章,第1章介绍了Midjourney的基础知识;第2章至第6章讲解了Midjourney 绘画的基础技能,包括Midjourney的注册、登录与订阅流程,Midjourney绘画初体验,使用Midjourney的提示词、指令、参数的方法,以及Midjourney生图方式与实战;第7章至第10章为Midjourney 绘画的实战应用,讲解了Midjourney在设计、绘画、摄影、创意生图等领域的应用,提供了实际案例以供借鉴;第11章为扩展部分,介绍了Midjourney社区的氛围及社区成员之间交流学习等相关知识。

编辑推荐:           

一本书读懂Midjourney绘画,让创意更简单,让设计不再难!

零基础快速入门:Midjourney基础操作+构建有效提示词+精准生图+案例驱动

提示词速查宝典:涵盖平面设计+产品设计+室内设计+建筑设计+时尚设计+工业设计+绘画材料和技法+绘画主题+绘画风格+CG插画+摄影主题+摄影技术等提示词速查手册

超值附赠:超全领域的提示词速查表,Midjourney指令和参数速查表等

  • 抽奖方式:评论区随机抽取3位小伙伴免费送出!
  • 参与方式:关注博主、点赞、收藏、评论区评论“人生苦短,拒绝内卷!”(切记要点赞+收藏,否则抽奖无效,每个人最多评论三次!
  • 活动截止时间:2024-3-9 20:00:00
  • 京东链接:https://item.jd.com/14002721.html

    当当链接:http://product.dangdang.com/29685117.html

 名单公布时间:2024-3-9 21:00:00 

 

资料获取,更多粉丝福利,关注下方公众号获取

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/432868.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

哪种杠杆最安全?允许的最低杠杆是多少?WeTrade一篇文章讲清楚

各位投资者都知道外汇交易中的财务杠杆其实就是一种期权,允许交易者以数倍于交易保证金的实际金额进行交易。保证金交易的一种工具,这就是投资者借入的资金,用于增加持仓量,从而增加自己的利润,避免自己的资金不足。We…

MS8911S/8921S/8922M/8931S——4ns 延时、轨到轨高速比较器

产品简述 MS8911S/MS8921S/MS8922M/MS8931S 是一款具 有内部迟滞的高速比较器。其电源电压范围为 3.0V- 5.5V ,输入和输出范围均可做到轨到轨。其输出为推 挽结构,兼容 CMOS/TTL 逻辑电平标准。传输延时为 4ns ,且失调电压低。单一比…

7种数组排序算法(多语言描述)

912. 排序数组 冒泡排序 C void bubble_sort(vector<int>& nums) {bool sorted false;int N nums.size();while (!sorted) {sorted true;for (int i 1; i < N; i) {if (nums[i - 1] > nums[i]) {swap(nums[i - 1], nums[i]);sorted false;}}N--;} }Pyt…

TinyEMU编译与使用(一)

TinyEMU编译与使用&#xff08;一&#xff09; 1 介绍2 准备工作3 编译TinyEMU3.1 安装依赖库3.2 编译 4 运行TinyEMU4.1 在线运行4.2 离线运行 5 共享目录5.1 修改root_9p-riscv64.cfg5.2 启动TinyEMU5.3 执行挂载命令 6 TinyEMU命令帮助 1 介绍 原名为riscvemu&#xff0c;于…

OpenHarmony下musl编译工具链普法

OpenHarmony下musl编译工具链普法 引言 欠的债总是要还的&#xff0c;这不前面欠的关于OpenHarmony下musl相关的还是要还的。这里我对其中的相关知识点&#xff0c;梳理&#xff0c;归纳重新消化下&#xff01; 一.GCC/Clang/LLVM的区别与联系 说实话&#xff0c;这块我现在都…

基于springboot的月度员工绩效考核管理系统论文

摘 要 科学时代的发展改变了人类的生活&#xff0c;促使网络与计算机技术深入人类的各个角落&#xff0c;得以普及到人类的具体生活中&#xff0c;为人类的时代文明掀开新的篇章。本系统为月度员工绩效考核管理系统&#xff0c;是专为企业开发的对员工考核的协助软件。可以帮助…

video视频播放

1.列表页面 <template><div><ul><li class"item" v-for"(item,index) in list" :key"index" click"turnPlay(item.videoUrl)"><img :src"item.img" alt""><div class"btn…

教资截流,值得一做的项目

从去年9月份开始&#xff0c;教资这个类目基本上就成熟了&#xff0c;所以截流就出来了。 有流量的地方&#xff0c;就有截流。 12月教资截流&#xff0c;值得一做的项目 截流万变不离其宗&#xff0c;就是去别人有流量的文章或者视频下面截流。 我记得今年7月的时候&#xff…

K线实战分析系列之二十一:三星形态——罕见的反转信号

K线实战分析系列之二十一&#xff1a;三星形态——罕见的反转信号 一、三星形态二、三星形态总结 一、三星形态 二、三星形态总结 三星形态由三根十字线组成&#xff0c;是反转信号&#xff0c;在行情阶段性的顶部或者是底部出现典型的三星形态中间的十字线收盘价高于前一根和…

Docker实战——使用 Docker Compose 进行服务编排

目录 安装配置 Docker Compose方法一&#xff1a;方法二&#xff1a; 进行服务编排使用手动方式部署应用1、使用 Python 创建 Web 应用&#xff08;创建文件“app.py”&#xff09;&#xff0c;文件内容如下&#xff1a;2、创建 “requirements.txt” 文件&#xff0c;由于在应…

根据关键词过滤内容

package com.example.test.utils;import java.util.*;/*** Author leo* Date 2024/3/6 10:41* description: 敏感词工具类* Title: MgcUtils* Package org.jeecg.modules.yygl.dbwgl*/ public class MgcUtils {private static Map<String, Object> dictionaryMap null;p…

EasyX的学习2

消息处理——漂亮的按钮(鼠标) 用到的函数 1.消息结构体变量类型&#xff1a;使用ExMessage ExMessage msg{ 0 }; 定义一个变量名为msg的ExMessage结构体变量并初始化为0 2.获取消息函数&#xff1a;peekmessage函数 //获取消息 peekmessage(&msg, EX_MOUSE); 两个参…

阿里云几核服务器够用?内存多少合适?

阿里云服务器配置怎么选择&#xff1f;CPU内存、公网带宽和系统盘怎么选择&#xff1f;个人开发者或中小企业选择轻量应用服务器、ECS经济型e实例&#xff0c;企业用户选择ECS通用算力型u1云服务器、ECS计算型c7、通用型g7云服务器&#xff0c;阿里云服务器网aliyunfuwuqi.com整…

Git分布式管理-头歌实验远程版本库

Git的一大特点就是&#xff0c;能为不同系统下的开发者提供了一个协作开发的平台。而团队如果要基于Git进行协同开发&#xff0c;就必须依赖远程版本库。远程版本库允许&#xff0c;我们将本地版本库保存在远端服务器&#xff0c;而且&#xff0c;不同的开发者也是基于远程版本…

算法Day04_203.移除链表元素

推荐阅读 算法day01_ 27. 移除元素、977.有序数组的平方 算法day02_209.长度最小的子数组 算法day03_ 59.螺旋矩阵II 目录 推荐阅读203.移除链表元素题目思路解法暴力解法虚拟头结点解法 203.移除链表元素 题目 给你一个链表的头节点 head 和一个整数 val &#xff0c;请你删…

Python爬虫实战第三例【三】【上】

零.实现目标 爬取视频网站视频 视频网站你们随意&#xff0c;在这里我选择飞某速&#xff08;狗头保命&#xff09;。 例如&#xff0c;作者上半年看过的“铃芽之旅”&#xff0c;突然想看了&#xff0c;但是在正版网站看要VIP&#xff0c;在盗版网站看又太卡了&#xff0c;…

大模型快速实现python3+html内容在线渲染

需求&#xff1a; 有一份数据需要通过前端在线展示给用户&#xff0c;不需要复杂的样式交互&#xff0c;后端服务是基于Python3实现的API接口&#xff0c;对前端技术不是很了解&#xff0c;需要快速实现该需求。类似样式即可&#xff1a; 思路&#xff1a; 如果页面不复杂&am…

【MySQL】深入解析日志系统:undo log、redo log、bin log

文章目录 前言1、undo log1.1、undo log 是什么1.2、事务回滚 2、redo log2.1、redo log 是什么2.2、redo log 刷盘2.3、redo log 硬盘文件 3、bin log3.1、bin log 是什么3.2、bin log 和 redo log 区别3.3、bin log 刷盘3.4、两阶段提交 前言 MySQL数据库提供了功能强大的日…

一文了解74HCT14D的引脚图、符号、封装、数据手册及应用

74HCT14D 是一款采用硅栅 C2MOS 技术制造的高速 CMOS 施密特逆变器。它实现了类似于等效 LSTTL 的高速操作&#xff0c;同时保持 CMOS 的低功耗。该器件可用作电平转换器&#xff0c;用于将 TTL 或 NMOS 连接到高速 CMOS。 输入与 TTL、NMOS 和 CMOS 输出电压电平兼容。所有输入…

CSS实现选中卡片样式操作

图一默认自动选中&#xff0c;并且不可取消选中&#xff0c;当选择其他卡片才可点击下一步 在 “ src/assets ” 路径下存放 save.png&#xff0c;代表选中的状态 <div class"cards"><ul class"container"><li v-for"image in image…