【小白学机器学习29】 概率统计与图形 ( hist, bar, pie , box ,scatter ,line)

目录

1 频度/次数

1.1 频度统计表:频度分布表

1.2 频数分布图=直方图  histogram / hist

1.3 对比,柱状图  bar graph /column chart

2 饼图  pie  chart

2.1饼图特点

3 南丁格尔玫瑰图

4 茎叶图 stem-and-leaf display

5 箱型图  box  plot

6 散点图 scatter plot

7 折线图  line graph

10 注意图标会骗人的几个点

10.1  X轴,Y轴,是否从0开始?

10.2 X轴,Y轴,是否足够伸展

10.3 只取部分数据的图形

等等


1 频度/次数

  • 频度=次数:事件发生的次数
  • (频度)概率学 和贝叶斯概率学,概率从一开始关注的就是频度。

  • 伯努利大数定律,试验次数足够多,频率会接近单次试验的概率
  • 一定程度上说,频率=概率,也没大毛病

1.1 频度统计表:频度分布表

频度分布表:概率分布的雏形吧

核心信息

  • min
  • max
  • 全距=max-min
  • 组数:分为几组数据
  • 组距:组间的距离长度,有些是天然的,也可以认为定义组距

1.2 频数分布图=直方图  histogram / hist

  • 频度直方图—直方图
  • 直方图上就是表示频度
  • 特点:
  1. 直方图:一定是频度的,频度直方图
  2. 横轴数据是连续的,无间隔
  3. 高度/ Y轴表示的是某数据出现的 次数/数量 count
  4. 每个柱子宽度不一定相同,多数相同
  5. 每个柱子面积是有意义的,面积=次数count*区间差

1.3 对比,柱状图  bar graph /column chart

别名:柱状图,条形图,棒状图等等

  • 特点:
  1. 横轴数据一般是有间隔的,离散的
  2. 高度/ Y轴表示的是某数据的具体数值 value
  3. 柱状图:只是排列数值,和频度无关!
  4. 只看高度数值value, 每个柱子宽度一定相同
  5. 柱子的面积没有意义

2 饼图  pie  chart

2.1饼图特点

  • 平面饼图最准确
  • 立体饼图,因为3D有比例看起来不对的风险
  • 注意,饼图要求数据总和=100%,因为多选题的统计不适合用饼图
  • 因为多选得做成饼图加仓概率和会超过100%,因为有重复叠加的多选部分。

3 南丁格尔玫瑰图

根据饼状图来的,南丁格尔玫瑰图

每个饼分位多个分块,每个分块大小不同,每个分块还可以分尖端和后面2部分。

4 茎叶图 stem-and-leaf display

  • 茎叶图,我看起来,更像是表格
  • frequency | stem  leaf
  • 频度 | 主体 小数

5 箱型图  box  plot

  • 典型例子
  • 四分位图
  • 股价图

  • 四分位数,就是几个1/4分位
  • 四分位数与箱型图
  • 除了4分位数,还有min, max,中位数=2/4分位。1/4为箱子底, 3/4为箱子盖


和股价图有差别

  • 形状像
  • 但是股价图 Min,max不变,但可能发生的时间不定
  • 箱子上可能是开盘价格,收盘价位置不同,阳性和阴线的区别。

6 散点图 scatter plot

  • 和折线图最大的区别
  • 散点图:2个数据,分别作为X轴,Y轴
  • 折线图,2个数据都作为Y轴的数据,图形对比,X轴是默认的其他序列数据等

7 折线图  line graph

  • 折线图,2个数据都作为Y轴的数据,图形对比,X轴是默认的其他序列数据

10 注意图标会骗人的几个点

10.1  X轴,Y轴,是否从0开始?

  • 如果不从0开始,比如从1000开始,就为放大局部效果

10.2 X轴,Y轴,是否足够伸展

  • X轴,Y轴,是否足够伸展,还是压缩,得到图形完全不同
  • 也就是图形可以被压缩,要注意

10.3 只取部分数据的图形

  • 只取部分数据的图形
  • 比如有1-100的数据,只作图现实50-100的数据,图形可能失真!
  • 是局部效果。不是全局效果。

等等

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/905681.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Zookeeper分布式锁实现

1、zk分布式锁的实现原理 Zookeeper 就是使用临时顺序节点特性实现分布式锁的,官网。 获取锁过程 (创建临时节点,检查序号最小)释放锁 (删除临时节点,监听通知) 1_获取锁过程 1、当第一个客…

Kafka社区KIP-500中文译文(去除ZooKeeper)

原文链接:KIP-500: Replace ZooKeeper with a Self-Managed Metadata Quorum - Apache Kafka - Apache Software Foundation 译者:关于Kafka3.x版本最大的一个变化即是解除了对ZooKeeper的依赖,而本文的作者是大神Colin,他高屋建瓴…

clickhouse运维篇(二):多机器手动部署ck集群

熟悉流程并且有真正部署需求可以看一下我的另一篇简化部署的文章,因为多节点配置还是比较麻烦的先要jdk、zookeeper,再ck,还有各种配置文件登录不同机器上手动改配置文件还挺容易出错的。 clickhouse运维篇(三)&#x…

我的电视 左侧列表内置版 | 非常高清,频道丰富的电视直播应用

我的电视是一款专注于电视直播的应用程序,提供丰富且全面的电视频道,包括央视及各大卫视。无论您是想看新闻、体育、电影还是综艺节目,都可以在这里找到。应用支持高清画质播放,确保流畅无卡顿的观看体验。简洁的界面设计和智能推…

Android开发教程viewpager2点击指示标也能切换

Android开发教程viewpager2点击指示标也能切换 viewpager2的使用范例,关键是点击指示标也能切换 一、思路: 用viewpager2加两个imageview 二、效果图: 三、关键代码: public class MainActivity extends AppCompatActivity {…

荣耀独立四周年:以己之名,终至海阔天空

“多少次,迎着冷眼与嘲笑,从没有放弃过,心中的理想……” 10月30日晚,原Beyond成员黄贯中充满激情的《海阔天空》歌声,在荣耀Magic7系列AI旗舰新品发布会上空飘扬。 如歌词所唱,荣耀独立四年以来&#xf…

pytest高版本兼容test_data[“log“] = _handle_ansi(“\n“.join(logs))错误

一、问题现象: 执行seleniumpytest结束时报: INTERNALERROR> File "D:\workspace\pytestframe\.venv\Lib\site-packages\pytest_html\report_data.py", line 141, in add_test INTERNALERROR> test_data["log"] _handle_ansi(&q…

OpenCV 学习笔记

OpenCV 环境安装 pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple 显示窗口 cv2.namedWindow 是 OpenCV 库中的一个函数,用于创建一个命名窗口,以便在该窗口中显示图像或进行其他图形操作。这个函数在处理图像和视频时非常…

JavaEE初阶---网络原理/UDP服务器客户端程序

文章目录 1.网络初识2.网络编程2.1TCP/UDP区别介绍2.2UDP的socket api使用2.3UDP协议里面的服务器客户端程序 1.网络初识 网络和计算机类似:都是属于军用》民用; 网络诞生于美苏争霸时期,当时就感觉核战争一触即发,形式非常严峻…

【skywalking】监控 Spring Cloud Gateway 数据

使用Spring Cloud 开发,用Skywalking 监控服务,但是Skywalking 默认是不支持 Spring Cloud Gateway 网关服务的,需要手动将 Gateway 的插件添加到 Skywalking 启动依赖 jar 中。 skywalking相关版本信息 jdk:17skywalking&#x…

开源协议类型及长安链开源协议介绍

截至目前,我国参与国际开源社区协作的开发者数量排名全球第二并推出了众多社区活跃度较高的高质量开源项目,是全球开源生态的重要贡献力量,但在开源治理方面我国还处于发展初期,大部分开发者对开源的印象还限于开放代码、免费使用…

胡壮麟《语言学教程》第五版PDF英文版+中文版翻译

胡壮麟《语言学教程》中文版:https://pan.quark.cn/s/9491130ec572 《语言学教程》(英文版)是一部经典的语言学教材,自 1988 年面世以来,被众多高校广泛采用,长销不衰。该教材自出版以来不断修订&#xff…

AI产品经理实战手册:策略、开发与商业化指南

通过《AI产品经理手册》,将可以了解不同类型的AI,如何将AI整合到产品或业务中,以及支持创建AI产品或将AI集成到现有产品所需的基础设施。熟悉实践管理AI产品开发流程、评估和优化AI模型,以及应对与AI产品相关的复杂伦理和法律问题…

31.安卓逆向-抓包-实战4

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于:图灵Python学院 本人写的内容纯属胡编乱造,全都是合成造假,仅仅只是为了娱乐,请不要盲目相信。第一…

FMC ADDA子卡 2 通道 14bit 2 通道 3GS/s ADC +16bit 2 通道 12.6GS/s DAC AD9208/AD9172/AD9689

14bit 2 通道 3/2.6/2GS/s ADC 16bit 2 通道 12.6GS/s DAC FMC AD/DA 子卡 是一款高分辨率、高采样率的 ADCDAC FMC 子板。它同时支持 2 路 14 位 3.0/2.6/2.0GS/s 的 A/D 通道输入和 2 路 16 位 12.6GS/s 的 D/A 通道输出, 全功率模拟 -3dB 输入带宽可达 9GHz。A 为…

红米k50电竞版修复“NV损坏” 刷写工程固件操作步骤解析 去除校验电阻图示

Redmi K50电竞版。机型代码:ingres,高通 骁龙8 Gen1。八核处理器。适用于以下型号的小米机型:21121210C, 21121210G,国外型号称为POGO F4 GT。 通过博文了解 1💝💝💝-----此机型工程固件的资源刷写注意事项 2💝💝💝-----此机型刷写工程固件预览界面 3💝�

CSRF与SSRF

csrf(跨站请求伪造)的原理: csrf全称是跨站请求伪造(cross-site request forgery),也被称为one-click attack 或者 session riding scrf攻击利用网站对于用户网页浏览器的信任,劫持用户当前已登录的web应用程序,去执行分用户本意的操作。 利…

2024版最新Metasploit安装及使用教程(非常详细)从零基础入门到精通,看完这一篇就够了。

通过本篇文章,我们将会学习以下内容: 1、在Windows上安装Metasploit 2、在Linux和MacOS上安装Metasploit 3、在Kali Linux中使用 Metasploit 4、升级Kali Linux 5、使用虚拟化软件构建渗透测试实验环境 6、配置SSH连接 7、使用SSH连接Kali 8、配…

【利器】12个评估大语言模型(LLM)质量的自动化框架

LLM评估是指在人工智能系统中评估和改进语言和语言模型的过程。在人工智能领域,特别是在自然语言处理(NLP)及相关领域,LLM评估具有至高无上的地位。通过评估语言生成和理解模型,LLM评估有助于细化人工智能驱动的语言相…

使用GetX实现GetPage中间件

前言 GetX 中间件(Middleware)是 GetX 框架中的一种机制,用于在页面导航时对用户进行权限控制、数据预加载、页面访问条件设置等。通过使用中间件,可以有效地控制用户的访问流程,并在适当条件下引导用户到所需页面。 这…