数据可视化(附带操作实例)

一、主要目的:

数据可视化是关于图形或表格的数据展示,旨在借助图形化手段,清晰有效的传达与沟通信息。通过直观地传达关键内容与特征,从而实现对相当稀疏而又复杂的数据集的深入洞察。熟悉在Python开发环境中支持数据可视化环节的可用模块以及其中的方法,通过查阅相关说明文档掌握Python中相应模块中的方法进行可视化展示的步骤。基于一定的样例数据,编写可视化的示例代码。

二、主要内容:

1.Matplotlib绘图示例
(1)点图和线图

点图和线图可以用来表示二维数据之间的关系,是查看两个变量之间关系的最直观方法,可以通过plot()来得到。

使用subplot()函数能够绘制多个字图像,并且可以添加X,Y坐标轴的名称。

(2)直方图

在统计学中,直方图(Histgram)是一种对数据分布情况的图形表示,是一种二维统计表,它的两个坐标分别是统计样本和该样本对应的某个属性的度量。

使用hist()函数来绘制向量的直方图,计算出直方图的概率密度,并且绘制出概率密度曲线,在标注中使用数学表达式。

(3)等值线图

等值线图又称为等量线图,是以相等数值点的连线表示连续分布且逐渐变化的数量特征的一种图形,是用数值相等各点连成的曲线(即等值线)在平面上的投影来表示被摄物体的外形和大小的图。

使用contour()函数将三维图像在二维空间上表示,并且使用clabel()在每条线上显示数据值的大小。

(4)三维曲面图

三维曲面图通常用来描绘三维空间的数值分布和形状。可以通过plot_surface()函数来得到想要的图像。

(5)条形图

Bar Chart)亦称条图、条状图、棒形图、柱状图,是一种以长方形的长度为变量的统计图表。长条图用来比较两个或两个以上的数值(不同时间或者不同条件),只有一个变量,通常利用较小的数据集分析。长条图亦可横向排列,或用多维方式表达。

(6)饼图

饼图,或称饼状图,是一个划分为几个扇形的圆形统计图表,用于描述量、频率或百分比之间的相对关系。

(7)气泡图(散点图)

气泡图是散点图的一种变体,通过每个点的面积大小,反映第三维数据。气泡图可以表示多维数据,并且可以通过对颜色和大小的编码表示不同的维度数据。如果使用颜色对数据分组,使用大小来映射相应值的大小。可以通过scatter()函数得到散点图。

2.Seabon中的图例

Seabon是专门的统计数据可视化包。可以使用Iris数据做样例。

(1)数据分布可视化

① 直方图和密度图

② 散点图和直方图

③ 分组散点图

④ 六边形图

⑤ 二维核密度估计图

核密度估计(Kernel Density Estimation , KDE)是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。

⑥ 矩阵散点图

当同时考察多个变量间的相关关系时,若一一绘制它们之间的简单散点图,比较麻烦。利用矩阵散点图来同时绘制各自变量间的散点图,这样可以快速发现多个变量间的主要相关性,这一点在进行多元回归时显得尤为重要。

利用PairGrid()和pairplot()函数来绘制成对的关系图。

参阅:Seaborrn(sns)官方文档学习笔记 Seaborn(sns)官方文档学习笔记(第一章 艺术化的图表控制) - 知乎

(2)线性相关图
(3)分类数据可视化
① 小提琴图(盒形图的变形)

小提琴图是“箱线图”与“核密度图”的结合,箱线图展示了分位数的位置,小提琴图则展示了任意位置的密度,通过小提琴图可以知道哪些位置的密度较高。

Seaborn中的boxplot可以画箱线图,可以看出不同种类的分布情况。

②热力图

热力图是在不同的地方按照不同的颜色(亮度)来表达该区域数据大小等的图形,应用在很多地方,其中最常见的有热力地图、相关系数矩阵的展示等。使用Seaborn中的heatmap()函数来表示相关系数矩阵。

3.Pandas的一些可视化功能
(1)绘制箱线图
(2)时间序列图

时间序列图也叫折线图,是以时间为横轴,变量为纵轴的一种图。

(3)安德鲁曲线和平行坐标图

在数据可视化中,安德鲁曲线是一种可视化高维数据结构的方法,可以看作平滑版本的平行坐标图。

平行坐标图是一种常用的可视化方法,一般用于高维几何和多元数据的可视化。

(4)基于弹簧张力高维数据可视化

弹簧张力高维数据图是基于一个简单的弹簧张力最小化算法。代码如下:

from pandas.tools.plotting import radviz

4.PIL图库

PIL库在Python3中可以使用pillow库来替代,即安装pillow,就可以使用PIL。

(1)读取图片

读取图片并将其转化为灰度图

(2)创建缩略图

thumbnail()方法可以接收一个元组参数(该参数指定生成缩略图的大小),然后将图像转换成符合元组参数指定大小的图像。

(3)复制和粘贴图像区域

使用copy()方法可以从一幅图像中裁剪指定的区域

(4)调整尺寸和旋转

要调整一幅图像的大小,可以调用resize()方法,该方法的参数为一个元组,用来指定新图像的大小。使用rotate()方法旋转图像,该方法的数值参数表示逆时针旋转的角度。

(5)图像轮廓和直方图

显示图像轮廓和直方图

三、心得

通过这次的学习,我对Python中各种数据可视化的方法有了更深入的理解和掌握。我了解到,Python提供了多种强大的可视化工具,如Matplotlib,Seaborn,Pandas的可视化功能和PIL图库,可以帮助我们更直观地理解数据和进行数据分析。

在Matplotlib中,我学习了如何创建点图和线图,直方图,等值线图,三维曲面图,条形图,饼图和气泡图(散点图)。在Seaborn中,我了解了如何进行数据分布可视化,如直方图和密度图,散点图和直方图,分组散点图,六边形图,二维核密度估计图,矩阵散点图等,以及如何创建线性相关图,分类数据可视化图等。

在Pandas的可视化功能中,我学习了如何绘制箱线图,时间序列图,安德鲁曲线和平行坐标图,以及如何进行基于弹簧张力的高维数据可视化。在PIL图库中,我了解了如何读取图片,创建缩略图,复制和粘贴图像区域,调整尺寸和旋转,以及如何显示图像轮廓和直方图。

总的来说,这次的学习让我对Python的数据可视化有了更全面的了解,也增强了我在数据分析方面的技能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/255836.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【基础篇】1.2 认识STM32(二)

3.3 VREF/VREF-引脚 VREF和VREF-是STM32中用于提供参考电压的引脚。如下图: VREF引脚可以连接一个单独的外部参考电压,范围在2.0V~VDDA,但不能超过VDDA,否则就超过了模拟器件的最大供电电压。在100引脚的封装中&#…

微服务实战系列之ZooKeeper(实践篇)

前言 关于ZooKeeper,博主已完整的通过庖丁解牛式的“解法”,完成了概述。我想掌握了这些基础原理和概念后,工作的问题自然迎刃而解,甚至offer也可能手到擒来,真实一举两得,美极了。 为了更有直观的体验&a…

分布式链路追踪 —— 基于Dubbo的traceId追踪传递

文章目录 原文链接RpcContext 上下文对象Dubbo 过滤器(Filter)对象基于Dubbo的traceId追踪传递实现 原文链接 RpcContext 上下文对象 在实现 Dubbo 调用之间的链路跟踪之前,先简单了解 RpcContext 上下文对象和 Filter 过滤器对象&#xff…

vue使用xlsx和xlsx-style导出xlsx文件并修改样式

1.下载依赖 npm install xlsx --save npm install file-saver --save npm install xlsx-style --save2.先修改xlsx-style的源码,一旦引入xlsx-style则会报错 在\node_modules\xlsx-style\dist\cpexcel.js 807行 的 var cpt require(’./cpt’ ‘able’); 改成 v…

接口测试的工具(3)----postman+node.js+newman

1.安装newman:输入命令之后 一定注意 什么都不要操作 静静的等待结束就行了。 2.安装失败的对此尝试不行 在用下面的方法 解压一下就行了 3.验证是否成功 多次尝试是可以在线安装成功的

开发企业展示小程序的关键步骤和技巧

随着移动互联网的快速发展,小程序已经成为企业展示形象、推广产品和服务的重要工具。拥有一个优秀的小程序可以帮助企业提高品牌知名度,吸引更多潜在客户,提升用户体验。以下是拥有一个展示小程序的步骤: 确定需求和目标 首先&am…

21、同济、微软亚研院、西安电子科技大提出HPT:层次化提示调优,独属于提示学习的[安妮海瑟薇]

前言: 本论文由同济大学、微软亚洲研究院、西安电子科技大学,于2023年12月11日中了AAAI2024 论文: 《Learning Hierarchical Prompt with Structured Linguistic Knowledge for Vision-Language Models》 地址: [2312.06323]…

操作系统习题

操作系统习题 一.选择题二.判断题三.PV操作题 学习完操作系统以后也要做题巩固一下,下面是我收集到的一些题目,如有问题欢迎大家一起讨论! 题目较多,可以选择自己需要的来做,答案仅供…

干货教学!!!RHEL8中ansible中常用模块的使用

内容很长各位大老爷耐心观看 本章主要介绍ansible中最常见模块的使用 文件管理模块软件包管理模块服务管理模块磁盘管理模块用户管理模块防火墙管理模块 ansible的基本用法如下 ansible 机器名 -m 模块x -a “模块的参数” 对被管理机器执行不同的操作,只需要调…

WinSCP显示服务器隐藏的文件

正常情况下,如果我们有使用WinSCP作为SFTP、FTP管理主机空间的时候,如果有类似.htaccess或者其他.开头或者其他特殊文件名扩展会直接看不到而是隐藏着的。这样就显得比较麻烦,自己都不知道有还是没有,比如我们要修改.htaccess伪静…

【1.8计算机组成与体系结构】磁盘管理

目录 1.磁盘基本结构与存取过程1.1 磁盘基本结构1.2 磁盘的存取过程 2.磁盘优化分布存储3.磁盘单缓冲区与双缓冲区4.磁盘移臂调度算法 1.磁盘基本结构与存取过程 1.1 磁盘基本结构 磁盘:柱面,磁道,扇区。 1.2 磁盘的存取过程 存取时间寻…

预测性维护在汽车制造行业中的应用

汽车制造行业是一个高度复杂和精细化的领域,依赖于各种设备来完成生产流程。这些设备包括机械装配线、焊接机器人、喷涂设备、传送带等。然而,这些设备在长时间运行中不可避免地会遇到各种故障,给生产进程带来延误和成本增加。为了应对这一挑…

22--Map集合

1、Map集合 现实生活与开发中,我们常会看到这样的一类集合:用户ID与账户信息、学生姓名与考试成绩、IP地址与主机名等,这种一一对应的关系,就称作映射。Java提供了专门的集合框架用来存储这种映射关系的对象,即java.…

安卓小练习-校园闲置交易APP(SQLite+SimpleCursorAdapter适配器)

环境: SDK:34 JDK:20.0.2 编写工具:Android Studio 2022.3.1 整体效果(视频演示): 小练习-闲置社区APP演示视频-CSDN直播 部分效果截图: 整体工作流程: 1.用户登录&…

C语言输出菱形(详解版)

菱形,就是如下所示的图形,总行数与总列数相等: 写一个程序,根据用户输入的总行数,打印出菱形。 这个题目主要是找出规律,考察读者的逻辑思维。 你可以从第一行开始,遍历所有的列,也…

数据可视化---双Y轴折线图比较

内容导航 类别内容导航机器学习机器学习算法应用场景与评价指标机器学习算法—分类机器学习算法—回归机器学习算法—聚类机器学习算法—异常检测机器学习算法—时间序列数据可视化数据可视化—折线图数据可视化—箱线图数据可视化—柱状图数据可视化—饼图、环形图、雷达图统…

Pytorch神经网络的参数管理

目录 一、参数访问 1、目标参数 2、一次性访问所有参数 3、从嵌套块收集参数 二、参数初始化 1、内置初始化 2、自定义初始化 3、参数绑定 在选择了架构并设置了超参数后,我们就进入了训练阶段。此时,我们的目标是找到使损失函数最小化的模型参数…

【漏洞复现】华为Auth-Http服务文件读取漏洞

Nx01 产品简介 Huawei Auth-HTTP Server 1.0 可以实现基于角色的访问控制,通过用户的身份认证和权限控制,确保只有经过授权的用户可以访问特定的资源和服务。它支持常见的身份认证协议和技术,如LDAP、RADIUS、TACACS等,能够与企业…

tensorflow入门 自定义模型

前面说了自定义的层,接下来自定义模型,我们以下图为例子 这个模型没啥意义,单纯是为了写代码实现这个模型 首先呢,我们看有几个部分,dense不需要我们实现了,我们就实现Res,为了实现那个*3,我们…

Postman使用总结--参数化

将 测试数据,组织到 数据文件中,通过脚本的反复迭代,使用不同的数据,达到测试不同用例的目标 数据文件有两种: CSV (类似于excel) 格式简单用这个 文件小 JSON(字典列表&#x…