Seaborn——可视化的具体API应用

一、Seaborn概述

        Seaborn 是基于 matplotlib的图形可视化 python包。提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。

        Seaborn在 matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。

        Seaborn和 Pandas的API配合的很好,使用DataFrame/Series的数据就可以绘图

二、绘制单变量图

1、直方图    histplot
# 导包
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# 配置Matplotlib
# 设置正常显示中文
plt.rcParams['font.sans-serif'] = ['SimHei']
# 设置如何显示负号
plt.rcParams['axes.unicode_minus'] = False

rcParams:是一个字典,用于设置Matplotlib的配置参数

' font.sans-serif ':是rcParams中的一个键,它用于指定无衬线字体(sans-serif 字体)的默认字体。

[ ' SimHei ' ]:是一个列表,其中包含一个字体名称。这里,我们设置默认的无衬线字体为“SimHei”。“SimHei”是一种常用的中文字体,用于在显示中文时确保文字的正常显示。 #

' axes.unicode_minus ':用于指定是否使用Unicode字符来表示负号。

# 加载小费数据
tips = pd.read_csv('data/tips.csv')

# 使用subplots函数创建画布,并在其中添加子图
fig, ax = plt.subplot(figsize=(12,6))

# kde 绘制核密度估计
sns.histplot(tips['total_bill'],kde=True,ax=ax)
ax.set_title('总账单直方图')
plt.show()

运行结果:

 2、密度图(核密度估计)   kdeplot

        是展示单变量分布的另一种方法,本质上是通过绘制每个数据点为中心的正态分布,然后消除重叠的图,使曲线下的面积为1来创建的。

sns.kdeplot(tips['total_bill'],ax=ax)
ax.set_title('总账单KDE图')
plt.show()

运行结果:

 3、计数图(条形图)   countplot

        计数图(条形图)是对离散变量(分类变量)计数

sns.countplot(data=tips,x='day')
ax.set_title('Count of days')
ax.set_xlabel('Day of the Week')
ax.set_ylabel('Frequency')
plt.show()

运行结果:

 三、双变量数据可视化

1、散点图    scatterplot
sns.scatterplot(x='total_bill',y='tip',data=tips)
ax.set_title('Total Bill 和 Tip 散点图')
ax.set_xlabel('Total Bill')
ax.set_ylabel('Tip')
plt.show()

运行结果:

 regplot 不仅可以绘制散点图,还会拟合回归线,把 fit_reg 设置为False,将只显示散点图

sns.regplot(x='total_bill',y='tip',data=tips)
ax.set_title('regplot of Total Bill and Tip')
ax.set_xlabel('Total Bill')
ax.set_ylabel('Tip')
plt.show()

运行结果:

 lmplot 函数和regplot函数类似,也可以用于创建散点图。lmplot 函数内部会调用regplot,两者的主要区别是 regplot 创建坐标轴,而 lmplot 创建图

sns.lmplot(x='total_bill',y='tip',data=tips)

运行结果:

 还可以使用 jointplot 在每个轴上创建包含单个变量的散点图

joint = sns.jointplot(x='total_bill',y='tip',data=tips)
joint.set_axis_labels(xlabel = 'Total Bill', ylabel = 'Tip')
joint.fig.suptitle('Joint Plot of Total Bill and Tip', fontsize = 10, y=1.03)
plt.show()

运行结果:

 2、蜂巢图

使用 Seaborn 的 jointplot 绘制蜂巢图

joint = sns.jointplot(x='total_bill',y='tip',data=tips,kind='hex')
joint.set_axis_labels(xlabel = 'Total Bill', ylabel = 'Tip')
joint.fig.suptitle('Hexbin Joint Plot of Total Bill and Tip', fontsize = 10, y=1.03)
plt.show()

运行结果:

3、 2D密度图

2D密度图和 kdeplot 类似,但2D核密度图可展示两个变量

sns.kdeplot(data=tips,x='total_bill',y='tip',fill=True)    # 是否填充轮廓
ax.set_title('Kernel Density Plot of Total Bill and Tip')
ax.set_xlabel('Total Bill')
ax.set_ylabel('Tip')
plt.show()

运行结果:

sns.kdeplot(data=tips,x='total_bill',y='tip')    # 是否填充轮廓

 运行结果:

 4、条形图    barplot

barplot 默认会计算平均值

sns.barplot(x='time',y='total_bill',data=tips,errorbar=None)

运行结果:

 5、箱线图    boxplot

用于显示多种统计信息:最小值,1/4分位,中位数,3/4分位,最大值,以及离群值(如果有)

sns.boxplot(x='time',y='total_bill',data=tips)

        箱子的中间有一条线,代表了数据的中位数

        箱子的上下底,分别是数据的上四分位数(Q3)和下四分位数(Q1)

        箱体包含了50%的数据。因此,箱子的高度在一定程度上反映了数据的波动程度

        上下边缘则代表了该组数据的最大值最小值

        有时候箱子外部会有一些点,可以理解为数据中的“异常值

6、小提琴图    violinplot

        箱线图是经典的可视化方法,但可能会掩盖数据的分布,小提琴图能显示与箱线图相同的值 小提琴图把"箱线"绘成核密度估计,有助于保留数据的更多可视化信息

sns.violinplot(x='time',y='total_bill',data=tips)

 7、成对关系

        当大部分数据是数值时,可以使用 pairplot 函数把所有成对关系绘制出来

        pairplot 函数会为单变量绘制直方图,双变量绘制散点图

 sns.pairplot(tips)

 pairplot 的缺点是存在冗余信息,图的上半部分和下半部分相同

 可以使用 pairgrid 手动指定图的上半部分和下半部分

pair_grid = sns.PairGrid(tips)
pair_grid.map_upper(sns.regplot)
pair_grid.map_lower(sns.kdeplot)
pair_grid.map_diag(sns.histplot)
plt.show()

 

 四、多变量数据

1、通过颜色区分

        使用 violinplot 函数时,可以通过 hue 参数按性别(sex)给图着色,可以为“小提琴”的左右两半着不同颜色,用于区分性别

sns.violinplot(x='time', y='total_bill', hue='sex', data=tips, split=True)

 

scatter = sns.lmplot(x='total_bill', y='tip', data = tips, hue='sex', fit_reg = False)

sns.pairplot(tips, hue = 'sex')

 2、通过大小和形状区分

        可以通过点的大小表示更多信息,但通过大小区分应谨慎使用,当大小差别不大时很难区分 在Seaborn中的 lmplot,可以通过 scatter_kws 参数来控制散点图点的大小

scatter = sns.lmplot(x='total_bill', y='tip', data = tips, fit_reg=False, hue='sex', markers=['o','x'])

五、Seaborn主题和样式

        可以使用 sns.set_style 函数更改样式,该函数只要运行一次,后续绘图的样式都会发生变化 Seaborn 有5种样式:darkgrid 黑色网格(默认)、whitegrid 白色网格、dark 黑色背景、white 白色背景

fig,ax = plt.subplots()
ax = sns.violinplot(x='time', y='total_bill', hue='sex', data = tips, split = True)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/324488.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

WEB 3D技术 three.js 阴影属性

上文 WEB 3D技术 three.js 光照与阴影 我们说了阴影 那么 我们继续将阴影的属性 目前 我们的代码 import ./style.css import * as THREE from "three"; import { OrbitControls } from "three/examples/jsm/controls/OrbitControls.js";//创建相机 cons…

集成xxljob项目如何迁移到K8S

前言 大家好,今天我们将基于XXL-Job,探讨任务调度迁移到云端的相关话题。 XXL-Job是一款功能强大、易用可靠的国产分布式任务调度平台,是目前国内使用比较广泛的分布式任务调度平台之一。它的主要特点包括: 支持分布式、多线程…

Java中的异常处理

目录 前言: 异常简介: Error类: Exception类: Exception异常: 运行异常: 编译异常: throw和throws关键字: throw: throws: try-catch关键字: finally: 为…

nvcc -V显示command not found

出现这个问题,不仅是 nvcc -V会显示command not found,nvidia-smi同样也会显示 解决方法如下: 1)这里首先转换到CUDA所在位置,一般是在这个位置 cd /usr/local 2)打开、编辑环境变量的配置文件 vim ~/.bashrc …

NLP论文阅读记录 - 2021 | WOS 利用 ParsBERT 和预训练 mT5 进行波斯语抽象文本摘要

文章目录 前言0、论文摘要一、Introduction1.1目标问题1.2相关的尝试1.3本文贡献 二.前提三.本文方法A. 序列到序列 ParsBERTB、mT5 四 实验效果4.1数据集4.2 对比模型4.3实施细节4.4评估指标4.5 实验结果4.6 细粒度分析 五 总结思考 前言 Leveraging ParsBERT and Pretrained …

【JupyterLab】在 conda 虚拟环境中 JupyterLab 的安装与使用

【JupyterLab】在 conda 虚拟环境中 JupyterLab 的安装与使用 1 JupyterLab 介绍2 安装2.1 Jupyter Kernel 与 conda 虚拟环境 3 使用3.1 安装中文语言包(Optional)3.2 启动3.3 常用快捷键3.3.1 命令模式下 3.4 远程访问个人计算机3.4.1 局域网下 1 JupyterLab 介绍 官方文档: …

分布式搜索——Elasticsearch

Elasticsearch 文章目录 Elasticsearch简介ELK技术栈Elasticsearch和Lucene 倒排索引正向索引倒排索引正向和倒排 ES概念文档和字段索引和映射Mysql与Elasticsearch 安装ES、Kibana安装单点ES创建网络拉取镜像运行 部署kibana拉取镜像部署 安装Ik插件扩展词词典停用词词典 索引…

政采网调试要求及常见问题解决方法

登录平台软件环境要求: 操作系统:建议Win10及以上(Win10-64位专业版 版本号17134纯净安装版本) 浏 览 器:IE11浏览器、谷歌120.0.6099.217(64位正式版)浏览器 必要软件:CA互联互通…

python高校舆情分析系统+可视化+情感分析 舆情分析+Flask框架(源码+文档)✅

毕业设计:2023-2024年计算机专业毕业设计选题汇总(建议收藏) 毕业设计:2023-2024年最新最全计算机专业毕设选题推荐汇总 🍅感兴趣的可以先收藏起来,点赞、关注不迷路,大家在毕设选题&#xff…

蓝桥杯省赛无忧 STL 课件19 第2次学长带练

01 讲解例题 02 复习和拓展课程知识

HDFS和MapReduce综合实训

文章目录 第1关:WordCount词频统计第2关:HDFS文件读写第3关:倒排索引第4关: 网页排序——PageRank算法 第1关:WordCount词频统计 测试说明 以下是测试样例: 测试输入样例数据集:文本文档test1…

上下左右视频转场模板PR项目工程文件 Vol. 05

pr转场模板,视频画面上下左右转场后带有一点点回弹效果的PR项目工程模板 Vol. 05 项目特点: 回弹效果视频转场; Premiere Pro 2020及以上; 适用于照片和视频转场; 适用于任何FPS和分辨率; 视频教程。 PR转场…

从0开始学Git指令(3)

从0开始学Git指令 因为网上的git文章优劣难评,大部分没有实操展示,所以打算自己从头整理一份完整的git实战教程,希望对大家能够起到帮助! 远程仓库 Git是分布式版本控制系统,同一个Git仓库,可以分布到不…

训练官方源码RT-DETR(血泪的教训!严格按照官方流程!)

文章目录 参考链接1 配置环境2 配置数据路径3 配置训练参数4 可能的报错AttributeError: module torchvision has no attribute disable_beta_transforms_warning 参考链接 源码:https://github.com/lyuwenyu/RT-DETR详解RT-DETR网络结构/数据集获取/环境搭建/训练…

22.实战演练--记住密码和登录状态

在登录注册案例的基础上,实现一个相对完整的登录注册模块 (1).记住密码 (2).记住登录状态(自动登录) (3).注册成功,登录成功,退出登录时的页面跳转

【JavaScript】多种实现文件下载的工具类

【JavaScript】多种实现文件下载的工具类 方法一方法二方法三整体调用代码异常处理 示例以下载txt文件为例,代码已封装上传,可直接下载资源在服务器中使用。如有异常,可查看“异常处理”小节或评论区指出。 方法一 在html中,可以…

java中String的两种创建方法、字符串常量池

java中String的两种创建方法 字符串常量池 字符串常量池 String的两种创建方式: 第一种方式是在常量池中获取字符串对象。第二种方式是直接在堆空间创建一个新的字符串对象。 //先检查字符串常量池中有没有“apesource”,如果字符产常量池中没有,则创建一个&#x…

测绘资质工程测量乙级资质办理条件

新测绘资质分为10个专业: 1.大地测量 2.测绘航空摄影 3.摄影测量与遥感 4.工程测量 5.海洋测绘 6.界线与不动产测绘 7.地理信息系统工程 8.地图编制 9.导航电子地图制作 10.互联网地图服务。 新《测绘资质管理办法》和《测绘资质分类分级标准》&#xff…

【linux】查看Debian应用程序图标对应的可执行命令

在Debian系统中,应用程序图标通常与.desktop文件关联。您可以通过查看.desktop文件来找到对应的可执行命令。这些文件通常位于/usr/share/applications/或~/.local/share/applications/目录下。这里是如何查找的步骤: 1. 打开文件管理器或终端。 2. 导…

Windows下python用ctypes调用C++程序的动态链接库方法(vs2019)

Windows下python用ctypes调用C程序的动态链接库方法(vs2019) https://blog.csdn.net/qq_34288751/article/details/121939189 https://blog.csdn.net/iambinglan1/article/details/133790822