Python中的数据可视化:Matplotlib基础与高级技巧

Python中的数据可视化:Matplotlib基础与高级技巧

数据可视化是数据分析和数据科学中不可或缺的一部分。通过图表,我们可以更直观地观察数据的分布和趋势。Matplotlib作为Python最基础、也是最广泛使用的绘图库之一,不仅支持多种常用图表,还可以通过设置样式、添加注释等高级操作,满足各种定制化需求。本文将带你从Matplotlib的基础用法入手,再到一些高级技巧,全面掌握数据可视化的必备技能。
在这里插入图片描述

1. Matplotlib概述与安装

Matplotlib是Python的二维绘图库,专注于生成简单、清晰的图表。它特别适合数据分析工作流,与NumPy和Pandas等库的兼容性极高。首先,安装Matplotlib:

pip install matplotlib

导入Matplotlib

安装完成后,我们通常以plt作为别名导入Matplotlib的pyplot模块:

import matplotlib.pyplot as plt
import numpy as np

在这里插入图片描述

2. Matplotlib基础用法

2.1 绘制简单折线图

# 示例数据
x = np.linspace(0, 10, 100)  # 生成0到10的等距数值
y = np.sin(x)  # 计算y值

# 绘制折线图
plt.plot(x, y, label='sin(x)', color='blue', linestyle='-', linewidth=2)
plt.xlabel('X-axis')  # x轴标签
plt.ylabel('Y-axis')  # y轴标签
plt.title('Simple Line Plot')  # 图表标题
plt.legend()  # 显示图例
plt.grid(True)  # 显示网格线
plt.show()

在这个简单折线图中,我们定义了标签、标题、线条样式和颜色,并显示了网格线和图例。

2.2 设置样式与颜色

Matplotlib提供了丰富的样式与颜色选择,可以轻松定制图表风格。我们可以通过linestylecolor等参数来调整图表风格,还可以用内置的主题快速应用图表风格:

plt.style.use('ggplot')  # 使用ggplot样式

在这里插入图片描述

3. 常见图表类型

Matplotlib支持多种图表类型,可以满足多种可视化需求。以下是几种常用的图表及其使用方法。

3.1 柱状图(Bar Chart)

柱状图适用于表示分类数据的数量分布。

# 示例数据
categories = ['A', 'B', 'C', 'D']
values = [10, 20, 15, 25]

plt.bar(categories, values, color='skyblue')
plt.xlabel('Categories')
plt.ylabel('Values')
plt.title('Bar Chart Example')
plt.show()

3.2 散点图(Scatter Plot)

散点图用于展示两个变量之间的关系,特别适合展示点状数据。

# 示例数据
x = np.random.rand(50)
y = np.random.rand(50)
sizes = 100 * np.random.rand(50)  # 点的大小
colors = np.random.rand(50)       # 点的颜色

plt.scatter(x, y, s=sizes, c=colors, alpha=0.6, cmap='viridis')
plt.colorbar()  # 显示颜色条
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Scatter Plot Example')
plt.show()

3.3 直方图(Histogram)

直方图用于展示数据的分布情况,是观察数值型数据集中趋势和分布的好工具。

data = np.random.randn(1000)  # 生成标准正态分布数据

plt.hist(data, bins=30, color='purple', edgecolor='black', alpha=0.7)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram Example')
plt.show()

3.4 饼图(Pie Chart)

饼图用于展示各个类别占整体的比例。

# 示例数据
labels = ['Category A', 'Category B', 'Category C']
sizes = [15, 35, 50]

plt.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)
plt.title('Pie Chart Example')
plt.show()

在这里插入图片描述

4. 子图与布局调整

在数据分析中,经常需要在一张图中展示多种数据。Matplotlib支持使用subplots函数创建多子图,并通过调整布局使图表更紧凑。

# 创建2行2列的子图布局
fig, axes = plt.subplots(2, 2, figsize=(10, 8))

# 绘制每个子图
axes[0, 0].plot(x, y, 'r')        # 折线图
axes[0, 1].bar(categories, values) # 柱状图
axes[1, 0].scatter(x, y)           # 散点图
axes[1, 1].hist(data, bins=20)     # 直方图

# 调整布局
fig.tight_layout()
plt.show()

在这里插入图片描述

5. 图表美化与高级技巧

5.1 添加注释

Matplotlib允许在图表中添加文本注释,以便标注出关键点或数据。

# 绘制简单折线图
plt.plot(x, y, label='sin(x)')

# 添加注释
plt.annotate('Max Point', xy=(np.pi/2, 1), xytext=(np.pi/2+1, 1.5),
             arrowprops=dict(facecolor='black', shrink=0.05))

plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Annotation Example')
plt.legend()
plt.show()

5.2 自定义坐标轴与网格

可以通过调整坐标轴的刻度、标签和样式来定制图表外观。

plt.plot(x, y)
plt.xlabel('X-axis')
plt.ylabel('Y-axis')
plt.title('Custom Axes and Grid')

# 自定义坐标轴
plt.xticks(np.arange(0, 11, 2))  # 设置x轴刻度间隔
plt.yticks([-1, 0, 1])           # 设置y轴刻度

# 自定义网格线
plt.grid(color='gray', linestyle='--', linewidth=0.5)

plt.show()

5.3 双Y轴图表

对于需要展示两个不同变量(且单位不同)的图表,可以使用双Y轴。

# 数据
x = np.arange(0, 10, 0.1)
y1 = np.sin(x)
y2 = np.cos(x)

# 创建双Y轴
fig, ax1 = plt.subplots()

ax1.plot(x, y1, 'g-', label='sin(x)')
ax1.set_xlabel('X-axis')
ax1.set_ylabel('sin(x)', color='g')

# 创建第二个Y轴
ax2 = ax1.twinx()
ax2.plot(x, y2, 'b--', label='cos(x)')
ax2.set_ylabel('cos(x)', color='b')

fig.tight_layout()
plt.title('Dual Y-Axis Example')
plt.show()

在这里插入图片描述

6. 保存图表

Matplotlib支持将生成的图表保存为多种格式(如PNG、PDF、SVG等)。可以使用savefig方法将图表保存到本地:

plt.plot(x, y)
plt.title('Save Plot Example')

# 保存图表
plt.savefig('plot_example.png', dpi=300, bbox_inches='tight')  # dpi设置图像清晰度,bbox_inches调整图表边距
plt.show()

在这里插入图片描述

7. 实战案例:销售数据分析

接下来,通过一个案例来整合上述技巧,分析销售数据并生成多个图表。

案例说明

假设我们有一组包含月度销售额和利润的数据,目标是分析月度趋势、销售额与利润的关系,并进行可视化展示。

7.1 数据准备

# 生成示例数据
months = np.arange(1, 13)
sales = np.random.randint(5000, 15000, size=12)
profits = sales * np.random.uniform(0.05, 0.15, size=12)

7.2 绘制分析图表

1. 月度销售趋势图
plt.plot(months, sales, marker='o', color='b', label='Sales')
plt.xlabel('Month')
plt.ylabel('Sales ($)')
plt.title('Monthly Sales Trend')
plt.legend()
plt.grid(True)
plt.show()
2. 销售额与利润的散点图
plt.scatter(sales, profits, color='purple')
plt.xlabel('Sales ($)')
plt.ylabel('Profit ($)')
plt.title('Sales vs. Profit')
plt.grid(True)
plt.show()
3. 多子图展示
fig,

 axs = plt.subplots(1, 2, figsize=(14, 6))

# 折线图
axs[0].plot(months, sales, marker='o', label='Sales', color='blue')
axs[0].set_title('Monthly Sales Trend')
axs[0].set_xlabel('Month')
axs[0].set_ylabel('Sales ($)')

# 散点图
axs[1].scatter(sales, profits, color='green')
axs[1].set_title('Sales vs. Profit')
axs[1].set_xlabel('Sales ($)')
axs[1].set_ylabel('Profit ($)')

fig.tight_layout()
plt.show()

在这里插入图片描述

8. 总结

本文带领大家从基础到高级,全面介绍了Matplotlib的各种功能,包括基础图表、子图布局、注释、坐标轴定制、双Y轴图表等。同时,结合实战案例分析销售数据,展示了如何在真实场景中使用Matplotlib进行数据可视化。希望本文能帮助你掌握数据可视化的基本技能,并为日后的数据分析提供支持。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/904016.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

‘cmd‘ 不是内部或外部命令,也不是可运行的程序或批处理文件。

报错描述: 我在使用python执行一个spark任务时,一直报如下错误,检查电脑上所有的环境变量后发现都配置正确,但还是一直报cmd 不是内部或外部命令,也不是可运行的程序这个错误,如果你也有这样的情况&#x…

【网络】传输层协议TCP

目录 四位首部长度 序号 捎带应答 标记位 超时重传机制 连接管理机制(RST标记位) 三次握手及四次挥手的原因 TCP的全称是传输控制协议(Transmission Control Protocol),也就是说,对于放到TCP发送缓冲…

【优选算法篇】前缀之序,后缀之章:于数列深处邂逅算法的光与影

文章目录 C 前缀和详解:基础题解与思维分析前言第一章:前缀和基础应用1.1 一维前缀和模板题解法(前缀和)图解分析C代码实现易错点提示代码解读题目解析总结 1.2 二维前缀和模板题解法(二维前缀和)图解分析C…

采用STM32CubeMX和HAL库的定时器应用实例

目录 STM32的通用定时器配置流程 定时器应用的硬件设计 定时器应用的软件设计 1. 通过STM32CubeMX新建工程 通过STM32CubeMX新建工程的步骤如下: 2. 通过Keil MDK实现工程 通过Keil MDK实现工程的步骤如下: STM32的通用定时器配置流程 通用定时器…

开源一套基于若依的wms仓库管理系统,支持lodop和网页打印入库单、出库单的源码

大家好,我是一颗甜苞谷,今天分享一款基于若依的wms仓库管理系统,支持lodop和网页打印入库单、出库单的源码。 前言 在当今快速发展的商业环境中,库存管理对于企业来说至关重要。然而,许多企业仍然依赖于传统的、手动…

算法实现 - 快速排序(Quick Sort) - 理解版

文章目录 算法介绍算法分析核心思想三个版本运行过程挖坑法Hoare 原版前后指针法 算法稳定性和复杂度稳定性时间复杂度平均情况O(nlogn)最差情况O( n 2 n^2 n2) 空间复杂度 算法介绍 快速排序是一种高效的排序算法,由英国计算机科学家C. A. R. Hoare在1960年提出&a…

C语言指针的介绍

零.导言 在日常生活中,我们常常在外出时居住酒店,细心的你一定能发现酒店不同的房间上有着不同的门牌号,上面写着像308,512之类的数字。当你定了酒店之后,你就会拿到一个写有门牌号的钥匙,凭着钥匙就能进入…

聊聊解构的那些事

#我们都知道es6出了个新特性,支持解构,使用过的人可能都觉得挺简单的,但有一些小点,只有使用中留意了或者踩坑了才发现我们认识的还很浅# 解构定义 允许按照一定模式,从数组和对象中提取值,对变量进行赋值…

Qt Designer客户端安装和插件集(pyqt5和pyside2)

GitHub - PyQt5/QtDesignerPlugins: Qt Designer PluginsQt Designer Plugins. Contribute to PyQt5/QtDesignerPlugins development by creating an account on GitHub.https://github.com/PyQt5/QtDesignerPlugins 一、下载客户端 https://github.com/PyQt5/QtDesigner/rel…

Idea常见插件(超级实用)

文章目录 Idea好用的插件推荐Idea插件安装Chinese(中文版)Alibaba Java Coding Guidelines(代码规范)Auto Filling Java Arguments(自动补全参数)CamelCase(变量名称格式转换)CodeGeeX(智能&…

Windows 下实验视频降噪算法 MeshFlow 详细教程

MeshFlow视频降噪算法 Meshflow 视频降噪算法来自于 2017 年电子科技大学一篇高质量论文。 该论文提出了一个新的运动模型MeshFlow,它是一个空间平滑的稀疏运动场 (spatially smooth sparse motion field),其运动矢量 (motion vectors) 仅在网格顶点 (m…

WPF+MVVM案例实战(三)- 动态数字卡片效果实现

1、创建项目 打开 VS2022 ,新建项目 Wpf_Examples,创建各层级文件夹,安装 CommunityToolkit.Mvvm 和 Microsoft.Extensions.DependencyInjectio NuGet包,完成MVVM框架搭建。搭建完成后项目层次如下图所示: 这里如何实现 MVVM 框…

5G+智慧园区:引领城市现代化建设新篇章

5G智慧园区,作为新时代城市发展的创新引擎,正引领着现代城市建设的新趋势。依托5G通信技术,结合物联网、大数据、人工智能等前沿信息技术,5G智慧园区实现了园区内人员、建筑、产业等核心要素的数字化、智能化管理与服务&#xff0…

【NOIP提高组】 关押罪犯

【NOIP提高组】 关押罪犯 C语言C语言实现Python语言实现 💐The Begin💐点点关注,收藏不迷路💐 S城现有两座监狱,一共关押着N名罪犯,编号分别为1-N。他们之间的关系自然也极不和谐。很多罪犯之间甚至积怨已久…

Chrome和Firefox哪款浏览器的密码管理更安全

在当今数字化时代,浏览器已成为我们日常生活中不可或缺的工具。其中,谷歌Chrome和Mozilla Firefox是两款广受欢迎的浏览器。除了浏览网页外,它们还提供了密码管理功能,帮助用户保存和管理登录凭证。然而,关于哪款浏览器…

预览 PDF 文档

引言 在现代Web应用中,文件预览功能是非常常见的需求之一。特别是在企业级应用中,用户经常需要查看各种类型的文件,如 PDF、Word、Excel 等。本文将详细介绍如何在Vue项目中实现 PDF 文档的预览功能。 实现原理 后端API 后端需要提供一个…

web前端多媒体标签设置(图片,视频,音频)以及图片热区(usemap)的设置

多媒体标签运用 在HTML中有以下常见多媒体标签&#xff1a; <img> &#xff08;图像标签&#xff09; - 作用&#xff1a;用于在网页中嵌入图像。 - 示例&#xff1a; <img src"image.jpg" alt"这是一张图片"> 。其中 src 属性指定图像的…

结合无监督表示学习与伪标签监督的自蒸馏方法,用于稀有疾病影像表型分类的分散感知失衡校正|文献速递-基于生成模型的数据增强与疾病监测应用

Title 题目 Hybrid unsupervised representation learning and pseudo-label supervisedself-distillation for rare disease imaging phenotype classification with dispersion-aware imbalance correction 结合无监督表示学习与伪标签监督的自蒸馏方法&#xff0c;用于稀…

【C++】入门C++

1.C的第一个程序 之前写的C语言文件都是后缀为.c的文件&#xff0c;进入C后就要把后缀改为.c了&#xff0c;vs编译器看到是.cpp就会调⽤C编译器编译。C兼容C语言的绝大多数语法&#xff0c;所以C语言的 hallo word 依旧可以在C下使用。 //test.cpp //c语言的hallo world #inc…

紫光同创——盘古 50KN 网口板

本原创文章由深圳市小眼睛科技有限公司创作&#xff0c;版权归本公司所有&#xff0c;如需转载&#xff0c;需授权并注明出处&#xff08;www.meyesemi.com) 一、开发系统介绍 盘古 50KN 网口板开发板&#xff08;MES50H-Ethernet&#xff09;采用了核心板扩展板的结 构&#…