Python画箱线图展示数据分布情况

箱线图(Boxplot)是一种常用的统计图表,用于展示数据的分布情况。

它由五个统计量组成:最小值、第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)和最大值。

通过这些统计量,可以直观地了解数据的集中趋势、离散程度以及是否存在异常值。

构成要素

  1. 中位数(Q2)

    • 箱线图中的中间线代表数据的中位数,即将数据按大小排列后中间位置的数值。
  2. 四分位数(Q1和Q3)

    • 箱体的上边界(Q3)和下边界(Q1)分别表示数据的第三四分位数和第一四分位数。箱子的高度即为四分位距(IQR),是Q3和Q1的差值,用来衡量数据的离散程度。
  3. 盒须

    • 箱体外部的直线(盒须)延伸至数据集的最大值和最小值,用来显示非异常值的范围。盒须外部的点表示可能的异常值,即相对于主体数据分布偏离较大的数据点。
  4. 异常值

    • 在盒须外部的点表示可能存在的异常值,即与其他数据点相比显著偏离的数据。

使用场景

箱线图常用于以下情况:

  • 数据分布比较:可以同时比较多组数据的分布情况,帮助观察各组数据的中位数、四分位数和离散程度。
  • 异常值检测:通过观察箱体外部的点,可以快速发现可能的异常值或离群点。
  • 数据分散度分析:箱体的长度和位置反映了数据的分散程度,有助于对数据的离散程度进行比较。
        # 创建示例数据
        data = {
            'Group': ['A'] * 11 + ['B'] * 10 + ['C'] * 10,
            'Value': [23, 25, 19, 21, 24, 27, 22, 20, 21, 24, -1, # Group A
                      30, 28, 36, 31, 34, 29, 35, 33, 32, 30,  # Group B
                      15, 17, 14, 16, 13, 18, 14, 15, 17, 16]  # Group C
        }

        # 转换为 DataFrame
        df = pd.DataFrame(data)

        # 设置绘图风格
        sns.set(style="whitegrid")

        # 绘制箱线图
        plt.figure(figsize=(10, 6))
        sns.boxplot(x='Group', y='Value', data=df)

        # 添加标题和标签
        plt.title('Box Plot of Three Groups')
        plt.xlabel('Group')
        plt.ylabel('Value')

        # 显示图表
        # plt.show()
        plt.savefig('./boxPlot_seaborn.png')

  • 中位数(箱体内部的横线):每个组的数据中间值。
  • 四分位数(箱体的上下边缘):分别表示25%和75%的数据点。
  • 最小值和最大值(盒须的末端):除去异常值后数据的范围。
  • 异常值(箱体外的点):与其他数据点相距较远的数值。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/716675.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ffmpeg封装和解封装介绍-(10)综合完成视频重编码为h265,解封装解码编码再封装

主函数逐句解析: 由于代码太多我们只解析主函数,(其他封装函数见前面文章,同时用到了解码编码封装代码)。 初始化和参数处理 int main(int argc, char* argv[]) {/// 输入参数处理string useage "124_test_x…

1.华为路由器-三层交换机-二层交换机组网连接

AR1配置GE 0/0/0接口IP [Huawei]int g0/0/0 [Huawei-GigabitEthernet0/0/0] [Huawei-GigabitEthernet0/0/0]ip add 1.1.1.1 24 [Huawei]iP route-static 192.168.0.0 16 1.1.1.2三层交换机配置如下 创建vlan [Huawei]vlan batch 10 20配置接口ip [Huawei]int g0/0/1 [Huawei…

让AI 赋予人类超强的记忆力

遗忘曲线告诉我们,绝大部分新掌握的知识约在一周后被遗忘,一个月左右基本忘光。「好记性不如一个烂笔头」,借助AI还真能做出这样「烂笔头」。 提升个人的记忆力-个人搜索引擎 个人搜索引擎的想法是一个强大而诱人的想法。如果有一个应用程序可…

你的iPhone安全吗?想要保护个人隐私一定要这么做

在这个数字化时代,个人隐私安全显得尤为重要,尤其是对于那些依赖智能手机处理日常事务的用户而言。作为市场上最受欢迎的智能手机之一,iPhone的安全性备受关注,但即便如此,它也可能成为黑客攻击和非法监控的目标。如何…

慎投!新增1本中科院1区顶刊被“On Hold”

本周投稿推荐 SSCI • 中科院2区,6.0-7.0(录用友好) EI • 各领域沾边均可(2天录用) CNKI • 7天录用-检索(急录友好) SCI&EI • 4区生物医学类,0.5-1.0(录用…

CC1310 LaunchPad开发板底噪测试

测试射频底噪时,主要关注的是在无信号输入时,系统或器件产生的最小噪声功率。这通常涉及到使用频谱分析仪(频谱仪)来测量输出噪声功率谱密度。以下是进行射频底噪测试的几种方法: 使用频谱仪直接测量: 通过…

做LLM推理时,常见的显卡如何选择?

随着开源LLM越来越成熟,业务接入LLM推理也成为必然,如何选模型大小和显卡,主要看下面这些。 一、选GPU显卡 在选择显卡进行大型语言模型推理时,主要要看下面几个指标: 1、 VRAM(视频随机存取存储器&…

Docker部署Nginx下载站点服务

1、下载镜像 由于docker官方镜像站点被封了,所以我把镜像上传到阿里云镜像仓库了 docker pull registry.cn-hangzhou.aliyuncs.com/qinzt-tools/file-nginx:1.18.02、运行容器实例 运行变量解释: 变量名称默认值解释USERhyadmin访问下载站点的认证用…

Typora—适用于 Mac 和 Win 系统的优秀 Markdown 文本编辑器

Typora 是一款适用于 Mac 和 Win 系统的优秀 Markdown 文本编辑器,它以其简洁易用的界面和强大的功能受到了众多用户的喜爱。 首先,Typora 的界面设计非常简洁直观,没有过多繁杂的菜单和按钮,让用户能够专注于写作本身。它采用实时…

C#结合JS 修改解决 KindEditor 弹出层问题

目录 问题现象 原因分析 范例运行环境 解决问题 修改 kindeditor.js C# 服务端更新 小结 问题现象 KindEditor 是一款出色的富文本HTML在线编辑器,关于编辑器的详细介绍可参考我的文章《C# 将 TextBox 绑定为 KindEditor 富文本》,这里我们讲述在…

如何利用被动DNS(Passive DNS)加强网络安全

通过收集和分析被动DNS数据,可以帮助识别恶意站点,打击钓鱼和恶意软件,本文将介绍如何利用被动DNS(Passive DNS)加强网络安全。 在过去的一些年里,我们目睹了对DNS基础设施的攻击日益增多:对权…

【嵌入式】CAN总线详解

【嵌入式】CAN总线详解 一、CAN总线简介 CAN总线是一种控制器局域网总线,每一个挂载在CAN局域网的设备,都可以利用CAN去发送信息,也可以接收局域网的各种信息,每个设备都是平等的,共享CAN的资源。广泛应用于汽车、嵌…

101.qt qml-自定义日历控件2-附带动画效果

黑色风格截图如下所示: 白色风格如下所示: GIF效果如下所示: 1.控件使用介绍 QianWindow2.5版本及以上提供,源码位于:qrc:/common/qmlQianDateTime/QianCalendarInputField.qml QianWindow2.5版本及以上提供,示例使用代码位于:qrc:/pages/QianControlPages/QianDateTimeP…

金鸣识别:图片转excel的“黑科技”神器

近期,我意外发现了一个令人惊艳的工具——金鸣表格文字识别系统。起初,我只是出于好奇尝试了一下,但使用体验远远超出了我的预期,让我深感其价值。 在日常生活和工作中,我们经常需要从各类图片中提取文字信息&#xf…

express+vue在线im实现【一】

在线体验地址 需要用邮箱注册一个账号 在线链接 目前实现的功能 1、在线聊天(群聊) 2、实时监控成员状态 3、历史聊天,下拉加载 4、有新消息,自动滚动到最新消息,如果自己在查看历史记录,不会强行滚动 后续计划新增功能 感兴…

Java健身私教服务师傅小程序APP源码(APP+小程序+公众号+H5)

私人定制的健身之旅 🏋️ 引言:探索私人健身新纪元 在现代都市的快节奏生活中,越来越多的人开始注重身体健康和健身塑形。然而,传统的健身房模式可能无法满足每个人的个性化需求。这时,一款名为“健身私教服务师傅”的…

Spring IoC【控制反转】DI【依赖注入】

文章目录 控制反转(IoC)依赖注入(DI)IoC原理及解耦IoC 容器的两种实现BeanFactoryApplicationContext IoC 是 Inversion of Control 的简写,译为“控制反转”,它不是一门技术,而是一种设计思想&…

centos7.9部署k8s的几种方式

文章目录 一、常见的k8s部署方式1、使用kubeadm工具部署2、基于二进制文件的部署方式3、云服务提供商的托管 Kubernetes 服务4、使用容器镜像部署或自动化部署工具 二、使用kubeadm工具部署1、硬件准备(虚拟主机)2、环境准备2.1、所有机器关闭防火墙2.2、…

Cisco Catalyst 9800 wireless Controller配置操作指引

一、控制器基本信息 外立面信息: 硬件规格如下: 序号 硬件规格满配能力1业务端口 4个1G/10G光口 2 冗余端口 1个GE电口或1G光口 3 最大管理AP数量 20004 最大接入客户端数量 320005 最大WLAN数量(SSID) 40966电源模块数量 2 7 最大吞吐量 40 …

云计算 | (四)基本云安全

文章目录 📚基本云安全🐇云安全背景🐇基本术语和概念⭐️风险(risk)⭐️安全需求🐇威胁作用者⭐️威胁作用者(threat agent)⭐️匿名攻击者(anonymous attacker)⭐️恶意服务作用者(malicious service agent)⭐️授信的攻击者(trusted attacker)⭐️恶意的内部人员(mal…