ML 系列:机器学习和深度学习的深层次总结(17)从样本空间到概率规则概率

一、说明

        概率是支撑大部分统计分析的基本概念。从本质上讲,概率提供了一个框架,用于量化不确定性并对未来事件做出明智的预测。无论您是在掷骰子、预测天气还是评估金融市场的风险,概率都是帮助您驾驭不确定性的工具。本篇将讲授概率的原理和可操作性。

二、关键概念和示例 

        以下是样本空间、结果、事件和概率等关键概念的定义,以及有助于阐明每个概念的解释和示例:

2.1. 样本空间 (S)


        样本空间是随机实验的所有可能结果的集合。样本空间包括实验可能出现的所有潜在结果。例如,在抛硬币时,样本空间由两个结果组成:正面和反面

示例

  • 硬币翻转:样本空间 (S) 为 {正面、反面}。
  • 掷六面骰子: 样本空间 (S) 为 {1, 2, 3, 4, 5, 6} 。

结果

图 1.结果

        结果是随机实验的单个可能结果。

        结果是进行实验时发生的特定结果。样本空间的每个元素都代表一个唯一的结果。

        示例

  • 硬币翻转:一种可能的结果是“正面”。
  • 掷骰子:一种可能的结果是掷出“4”。

2.2 . 事件 (E)


        事件是样本空间的子集,由一个或多个结果组成。
        事件表示样本空间中的特定事件。它可以包括一个结果或结果的组合。事件可以用多种方式描述,例如“至少一个正面”或“掷出偶数”。

例:

  • 抛硬币:事件可以是“正面朝上” E = {正面}。
  • 掷骰子:事件可以是“掷偶数” E = {2, 4, 6} 。

2.3 概率 (P)


        概率衡量事件发生的可能性,用 0 到 1 之间的数字表示,其中 0 表示不可能,1 表示确定性。
        概率量化了事件发生的几率。概率为 0 表示事件不会发生(不可能),而概率为 1 表示事件是确定的。事件 E 的概率的计算方法是将 E 的有利结果数除以样本空间 S 中的结果总数。

例:

  • 抛硬币:正面朝上的概率 P(正面) = 1/2。
  • 掷骰子:掷出偶数 P(偶数) = 3/6 = 1/2 的概率,因为在六种可能的结果中,有三种有利的结果(2、4、6)。

三、事件类型

        在概率中,可以根据事件与其他事件的关系来定义几种不同类型的事件:

图 2.事件类型

1. 简单(或基本)事件
        简单事件是指由样本空间中的一个结果组成的事件。

示例:
在一次六面骰子的掷骰中,“掷 4”事件是一个简单的事件,因为它只对应于一个结果:{4}。

2. 复合事件
        复合事件是由两个或多个简单事件组成的事件。

示例
在六面骰子的单次掷骰中,“掷偶数”事件是一个复合事件,因为它包括多个结果:{2, 4, 6}。

3. 特定事件
特定事件是保证发生的事件。它的概率始终为 1。

        示例:
        在六面骰子的单次掷骰中,“在 1 到 6 之间掷出一个数字”事件是确定的事件,因为掷骰子的每个结果都在这个范围内。因此,P(掷出 1 到 6 之间的数字)= 1

图 3.特定事件

        4. 穷举事件
        如果必须至少发生一个事件,则一组事件是穷举的。事件集涵盖实验的所有可能结果。

        示例:
        在一次六面骰子的掷骰中,{掷 1}、{掷 2}、{掷 3}、{掷 4}、{掷 5} 和 {掷 6} 的事件是详尽的,因为它们包括掷骰子的所有可能结果。他们的概率之和是 1:
P(掷 1) + P(掷 2) + P(掷 3) + P(掷 4) + P(掷 5) + P(掷 6) = 1

图 4. 穷举事件

某些事件和详尽事件之间的主要区别

Certain Event:
— 指保证发生的单个事件。
— 事件的概率为 1。

Exhaustive Events(穷举事件):
— 指一组多个事件,这些事件共同包含实验的所有可能结果。
— 穷举集中所有事件的概率之和为 1。

        5. 不可能的事件
        不可能的事件是不可能发生的事件;它的概率为 0。

示例:
在单次掷出六面骰子时,“掷 7”事件是不可能的事件,因为没有与掷 7 相对应的结果。

图 5.不可能和某些事件

        6. 互斥(或不相交)事件
        互斥事件是指不能同时或同时发生的事件;如果一个事件发生,另一个事件就不能。

示例:
在一次六面骰子掷骰子中,“掷 3”和“掷 5”事件是互斥的,因为两者不能同时发生。这些事件的交集为空:P(3 ∩ 5) = 0。

图 6. 互斥且详尽无遗

        7. 非互斥事件
        非互斥事件是指可以同时发生的事件;他们至少有一个共同的结果。

示例:
在一次六面骰子掷骰子中,“掷偶数”和“掷出大于 3 的数字”事件是非互斥的,因为结果 4 对两个事件都是通用的。

图 7. 显示互斥和非互斥的维恩图

        8. 独立事件
        独立事件是指一个事件的发生不会影响另一个事件发生的概率的事件。

示例:
在两个独立的实验中,抛硬币和掷骰子,“flipping faces”和“rolling a 4”这两个事件是独立的。翻转正面的概率是 1/2,掷出 4 的概率是 1/6;P(头 ∩ 4}) = 1/2 × 1/6 = 1/12。

图 8. 独立活动

硬币之前“不知道”它曾出现过正面朝上。

而每一次抛硬币都是一个完美的孤立事物。

所以概率 = 1 / 2 = 0.5

        9. 相关事件
        相关事件是指一个事件的发生会影响另一个事件发生的概率的事件。

示例:
假设您想找到在第二次抽牌时抽到 A 的概率,假设抽到的第一张牌是 K。

  1. 第一次抽奖:
  • 最初牌组中有 52 张牌。
  • 第一次抽到 K 的概率为 4/52 = 1/13

2. 第二次抽奖(无替换):

  • 如果先抽出 K,则现在牌组中还剩下 51 张牌。
  • 牌组中还有 4 张 A。
  • 假设先抽出 K,则在第二次抽中 A 的概率为 4/51。

        “先抽 K”和“后抽 A”这两个事件是相关的,因为移除 K 会改变牌组的组成,从而影响接下来抽到 A 的概率。

        10. 互补事件
        互补事件是指一个事件的发生意味着另一个事件不会发生的两个事件。它们的概率之和为 1。

        示例:
        在一次六面骰子的掷骰中,“掷出 4”和“不掷 4”事件是互补的。如果 A 是“掷出 4”的事件,那么 Ac(A 的补数)是“不掷 4”。P(A) + P(Ac) = 1

        11. 条件事件
        条件事件是其概率取决于另一个事件发生的事件。

示例:
在一副 52 张牌中,如果已经抽到一张红牌,抽到红桃的概率是一个条件概率。如果 A 抽到红牌,B 抽到红桃,则 P(B|A) 是抽到红牌的情况下抽到红桃的概率。

四、概率规则:

  1. 联合规则:

两个事件并集的一般公式(无论它们是互斥的还是独立的)为:

图 9. 联盟

此公式考虑了两种情况:

  • 互斥事件的情况下,其中 P(A ∩ B) = 0,公式简化为 P(A ∪ B) = P(A) + P(B)
  • 独立事件的情况下,其中 P(A ∩ B) = P(A) × P(B),公式也是 P(A ∪ B) = P(A) + P(B) + P(A) × P(B)

        2. 交叉规则

  • 对于互斥事件,其中 P(A ∩ B) = 0

图 10. 当两个事件 A 和 B 是互斥事件时的交集规则

  • 独立事件的情况下,其中 P(A ∩ B) = P(A) × P(B),公式也是 P(A ∩ B) = P(A, B) = P(A) × P(B)

图 11. 两个事件 A 和 B 独立时的交集规则

        示例:抛硬币并得到正面,然后掷骰子并获得 4 的概率是 1/2 × 1/6 = 1/12。

        3. 互补规则

事件未发生的概率等于 1 减去事件发生的概率。

公式:P(Ac) = 1 − P(A)

如果 A 是事件,则 Ac (A 补码) 是 A 未发生的事件。事件的概率与其补数之和始终为 1。

        示例:如果今天下雨的概率为 P(雨)=0.3,则不下雨的概率为:P(无雨)= 1−P(雨)= 1−0.3 = 0.7

五、结论

        在第 17 讲,我们介绍了样本空间、结果、事件和概率等关键概念,讨论了 11 种类型的事件,并探索了基本的概率规则,包括加法、乘法和互补规则。在即将发布的博客文章。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/900048.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux使用Dockerfile部署Tomcat以及jdk

资源准备 首先提供本教程所有资源包。 当然也可以根据自己需求去官网下载。 链接:百度网盘 请输入提取码 提取码:f31y #我们开始吧 首先我们需要一台linux操作系统的机器,当然windows也是可以的,本系列教程是基于Linux的&#…

【网络】H3C交换机配置

1. 网关配置(web管理界面) 默认S5048PV2_EI交换机 第一步:若是首次配置,通过Console口配置以太网交换机管理VLAN的IP地址,默认的网关是192.168.0.253。 system-view [H3C] interface Vlan-interface 1(进入…

[mysql]聚合函数GROUP BY和HAVING的使用和sql查询语句的底层执行逻辑

#GROUP BY的使用 还是先从需求出发,我们现在想求员工表里各个部门的平均工资,最高工资 SELECT department_id,AVG(salary) FROM employees GROUP BY department_id 我们就会知道它会把一样的id分组,没有部门的就会分为一组,我们也可以用其他字段来分组,我们想查询不同jb_id…

ArcGIS计算多个面要素范围内栅格数据各数值的面积

本文介绍在ArcMap软件中,基于面积制表工具(也就是Tabulate Area工具),基于1个面要素数据集与1个栅格数据,计算每一个面要素中各栅格数据分布面积的方法。 首先,来看一下本文的需求。现有一个矢量面的要素集…

水陆两栖车应对应急事件发挥的作用_鼎跃安全

随着气候变化,城市内涝等问题日益严重。为了应对可能出现的洪水灾害,许多城市开始将水陆两栖车纳入应急救援装备体系。在暴雨引发城市积水时,水陆两栖车可以作为一种高效的救援和运输工具,及时疏散被困群众,运送应急物…

Hallo2 长视频和高分辨率的音频驱动的肖像图像动画 (数字人技术)

HALLO2: LONG-DURATION AND HIGH-RESOLUTION AUDIO-DRIVEN PORTRAIT IMAGE ANIMATION 论文:https://arxiv.org/abs/2410.07718 代码:https://github.com/fudan-generative-vision/hallo2 模型:https://huggingface.co/fudan-generative-ai/h…

执行Django项目的数据库迁移命令时报错:(1050, “Table ‘django_session‘ already exists“);如何破?

一、问题描述: 当我们写Django时,由于自己的操作不当,导致执行数据库迁移命令时报错,报错的种类有很多,例如: 迁移文件冲突:可能你有多个迁移文件试图创建同一个表。数据库状态与迁移文件不同…

Javascript数据结构——哈希表

18_哈希表_深入链地址法_哔哩哔哩_bilibili 哈希表(Hash Table),又称为散列表,是一种通过哈希函数组织数据以实现快速访问的数据结构。下面将从其概述、底层实现和前端应用场景等方面进行详细阐述。 概述 哈希表的基本思路是&a…

C#与C++交互开发系列(九):字符串传递的几种形式

前言 在C#与C交互开发中,字符串的传递是非常常见的需求。字符串作为数据类型在托管代码(C#)和非托管代码(C)之间的传递存在一些特殊的挑战,因为两者的字符串内存管理和编码方式不同。本篇博客将详细介绍几…

gitlab不同账号间·仓库转移

背景:公司业务调整,原先在海外仓库的代码转移回国内 诉求:完整的保留项目记录 操作: 步骤一: 定位到需要迁移的原项目地址 步骤二:创建新项目 步骤三:打开命令行,创建好文件路径为需要clo…

软件工程中的建造者模式:用于构建复杂对象

在软件工程中,我们经常会遇到需要构建复杂对象的场景。这些对象可能包含多个组件,而这些组件的创建过程可能相当繁琐。为了解决这个问题,设计模式提供了一种优雅的方法,这就是建造者模式(Builder Pattern)。…

HTTP之响应消息Response

个人简介:Java领域新星创作者;阿里云技术博主、星级博主、专家博主;正在Java学习的路上摸爬滚打,记录学习的过程~ 个人主页:.29.的博客 学习社区:进去逛一逛~ HTTP之响应消息Response 1 Response 组成2 状态…

基于SpringBoot+Vue+MySQL的实践性教学系统

系统展示 用户前台界面 后台界面 系统背景 随着信息技术的快速发展,企业对于高效、智能的管理系统需求日益迫切。传统的管理系统大多采用单机版或C/S架构,存在操作复杂、维护困难、数据共享性差等问题。而基于SpringBootVueMySQL的全栈管理系统&#xff…

通信协议——UART

目录 基础概念串行&并行串行的优缺点 单工&双工 UART基本概念时序图思考:接收方如何确定01和0011 基础概念 串行&并行 串行为8车道,并行为1车道 串行的优缺点 通行速度快浪费资源布线复杂线与线之间存在干扰 单工&双工 单工&#xf…

018集——c# 实现CAD添加侧栏菜单(WPF控件)(CAD—C#二次开发入门)

本例实现的效果如下&#xff1a; 第一步&#xff1a;添加引用 using UserControl System.Windows.Controls.UserControl; using System.Windows.Forms.Integration;//PaletteSet integration 第二步 <UserControl x:Class"AcTools.UserControl1"xmlns"htt…

【数据分析】Power BI的使用教程

目录 1 Power BI架构1.1 Power BI Desktop1.2 Power BI服务1.3 Power BI移动版 2 Power Query2.1 Power Query编辑器2.2 Power Query的优点2.3 获取数据2.4 数据清洗的常用操作2.4.1 提升标题2.4.2 更改数据类型2.4.3 删除错误/空值2.4.4 删除重复项2.4.5 填充2.4.6 合并列2.4.…

【Airtest】 UI 自动化

一、环境配置 项目名称&#xff1a;Yavin 锁定python3.7.x和opencv-contrib-python3.4.2.17&#xff0c;不然各种报错 参考airtest官网https://airtest.doc.io.netease.com/ 虚拟环境配置 安装所需要的依赖包 二、框架使用方式 1.目录结构介绍 2.config文件config.yaml文…

前端开发设计模式——状态模式

目录 一、状态模式的定义和特点 二、状态模式的结构与原理 1.结构&#xff1a; 2.原理&#xff1a; 三、状态模式的实现方式 四、状态模式的使用场景 1.按钮的不同状态&#xff1a; 2.页面加载状态&#xff1a; 3.用户登录状态&#xff1a; 五、状态模式的优点 1.提…

【深度学习基础】详解Pytorch搭建CNN卷积神经网络实现手写数字识别

MNIST 数据集,其包含70000 个2828 的手写数字的数据集,其中又分为60000 个训练样本与10000 个测试样本。 安装实验用到的包 anaconda promt 安装python包, 首先在开始界面打开prompt 进入到相应的虚拟环境中,下面的python38你自己创建的虚拟环境名称。 # 激活虚拟环境,v…

Ubuntu 24.04 系统上配置 Node.js 运行环境

本文我们重点介绍两种安装 Node.js 的方法。第一种方法使用 NVM (Node VersionManager)&#xff0c;这是安装和管理多个 Node.js 版本的最好和最快的方法。第二种方法使用官方包存储库在 Ubuntu 上安装 Node.js&#xff0c;一次只允许安装一个版本。 必备条件 A running Ubun…