本次修炼方法请往下查看
🌈 欢迎莅临我的个人主页 👈这里是我工作、学习、实践 IT领域、真诚分享 踩坑集合,智慧小天地!
🎇 免费获取相关内容文档关注:微信公众号,发送 pandas 即可获取
🎇 相关内容视频讲解 B站
🎓 博主简介:AI算法驯化师,混迹多个大厂搜索、推荐、广告、数据分析、数据挖掘岗位 个人申请专利40+,熟练掌握机器、深度学习等各类应用算法原理和项目实战经验。
🔧 技术专长: 在机器学习、搜索、广告、推荐、CV、NLP、多模态、数据分析等算法相关领域有丰富的项目实战经验。已累计为求职、科研、学习等需求提供近千次有偿|无偿定制化服务,助力多位小伙伴在学习、求职、工作上少走弯路、提高效率,近一年好评率100% 。
📝 博客风采: 积极分享关于机器学习、深度学习、数据分析、NLP、PyTorch、Python、Linux、工作、项目总结相关的实用内容。
🎯 1. 基本介绍
catplot 是 Seaborn 库中的一个高级接口,用于创建涉及分类变量(categorical variables)的多种图表。它基于 FacetGrid 类,可以自动处理多个图表的布局,非常适合于展示分类变量之间的比较和分布。
💡 2. 原理介绍
catplot 本身不涉及复杂的数学公式推导,它主要是数据可视化的实现。不过,根据选择的图表类型,可能会涉及到如下统计量的计算:
- 频率或概率:用于计算每个分类的唯一值或出现的次数。
均值、中位数:用于展示分类变量的中心趋势。
箱型图参数:如四分位数和四分位距,用于展示数据的分散程度。
🔍 3. 画图实践
3.1 数据准备
我们通过seaborn自带的数据对其进行相关的画图,具体的导入数据代码如下所示:
import seaborn as sns
import matplotlib.pyplot as plt
# 使用Seaborn内置的tips数据集
tips = sns.load_dataset("tips")
total_bill tip sex smoker day time size
0 16.99 1.01 Female No Sun Dinner 2
1 10.34 1.66 Male No Sun Dinner 3
2 21.01 3.50 Male No Sun Dinner 3
3 23.68 3.31 Male No Sun Dinner 2
4 24.59 3.61 Female No Sun Dinner 4
... ... ... ... ... ... ... ...
239 29.03 5.92 Male No Sat Dinner 3
240 27.18 2.00 Female Yes Sat Dinner 2
241 22.67 2.00 Male Yes Sat Dinner 2
242 17.82 1.75 Male No Sat Dinner 2
243 18.78 3.00 Female No Thur Dinner 2
3.2 画图实践
如果画两个变量关系图,具体的代码如下所示:
import seaborn as sns
import matplotlib.pyplot as plt
# 绘制因子变量图形
g = sns.catplot(x="day", y="total_bill", hue="smoker", data=tips, kind="bar")
# 设置图形标题
g.fig.suptitle("Title of the plot", y=1.03)
# 显示图形
plt.show()
🔍 4. 注意事项
- catplot 的 kind 参数可以设置为 strip、swarm、box、violin 等,以选择不同的图表类型。
catplot 默认会为每个分类变量生成一个子图,可以通过设置 col、row、col_wrap 等参数来调整布局。 - 在使用 catplot 时,注意数据的规模和分类变量的数量,以避免生成过于拥挤的图表。
- 可以通过 height 和 aspect 参数调整子图的大小和比例。
🔍 5. 总结
Seaborn 的 catplot 是一个功能强大的工具,用于探索分类变量之间的关系和分布。通过本博客的代码示例,我们学习了如何使用 catplot 绘制箱型图,并展示了如何通过图表分析不同类别的数据分布。希望这篇博客能够帮助你更好地利用 catplot 进行数据探索和分析。