ML 系列:第 18 部 - 高级概率论:条件概率、随机变量和概率分布

文章目录

  • 一、说明
  • 二、关于条件概率
    • 2.1 为什么我们说条件概率?
    • 2.2 为什么条件概率在统计学中很重要
  • 三、 随机变量的定义
    • 3.1 定义
    • 3.2 条件概率中的随机变量
  • 四、概率分布的定义
  • 五、结论

一、说明

条件概率是极其重要的概率概念,它是因果关系的数学表述,也是随机过程的主要核心内容。本文将就条件概率的相关概念进行叙述。

二、关于条件概率

碳条件概率是假设另一事件已经发生,则某事件发生的概率。当两个或多个事件不独立时,使用条件概率。这意味着 一个事件发生的可能性受到另一个事件是否发生的影响。

从数学上讲,条件概率用𝑃(𝐵∣𝐴) 表示,即“在事件 A 发生的情况下,事件 B 发生的概率”。它问道:“如果我们知道 A 已经发生,那么 B 发生的概率是多少?”
在这里插入图片描述
图 1.条件概率公式

2.1 为什么我们说条件概率?

我们使用“条件概率”一词,因为它表示在另一事件已经发生的条件下发生某事件的概率。换句话说,它量化了在我们有关于另一事件发生的额外信息的情况下发生某事件的可能性。
在这里插入图片描述

图 2.条件概率项

2.2 为什么条件概率在统计学中很重要

条件概率在统计学中至关重要,因为它可以帮助我们根据已知的信息调整预测。当我们已经知道事件 A 已经发生时,它告诉我们事件 B 发生的可能性。

三、 随机变量的定义

3.1 定义

随机变量是将实数与事件相关联的函数。这意味着为每个可能的结果分配一个值(一个实数)。用更数学的术语来说,它是从样本空间 Ω 到实数的函数。我们可以根据需要选择随机变量。

在这里插入图片描述

图 3.随机变量

3.2 条件概率中的随机变量

它为随机实验的样本空间中的每个结果分配一个数值,从而更容易处理和分析这些结果的概率属性。

在这里插入图片描述

图 4.硬币的随机变量
如果硬币正面朝上,则随机变量 X 的值为 1;如果硬币反面朝上,则随机变量 X 的值为 0。在一次抛硬币中,出现这两种情况的概率均为 50%。X(在本例中为 1 和 0)可以取的值称为样本空间,可以表示为 {0, 1}。

处理随机变量时,我们经常使用符号𝑃(𝐵=𝑏∣𝐴=𝑎)。

每个部分的含义如下:

𝐴 和 𝐵 是随机变量,a和b是这些随机变量可以取的特定值。𝑃(𝐵=𝑏∣𝐴=𝑎) 的含义:
该符号表示在随机变量 𝐴 取值a的情况下,随机变量 𝐵 取值b的概率。简单来说,它描述了了解 𝐴 的结果如何影响 𝐵 结果的可能性。

例子
假设某人掷出两个公平的六面骰子,并且我们希望计算第一个骰子的正面值为 2 的概率,前提是它们的总和不大于 5。

令D 1 为骰子 1 掷出的值。
令D 2 为骰子 2 掷出的值。
D 1 = 2的概率
在这里插入图片描述

图 5. D 1 = 2的概率
表 1 显示了两个骰子掷出的 36 种组合的样本空间,每种组合出现的概率为 1/36,红色和深灰色单元格中显示的数字为D 1 + D 2 (D = D1+D2 = 36)。注意:表 1 中的每个单元格代表 D1 和 D2(两个骰子的结果)的总和

在 36 个结果中,恰好有 6 个结果为D 1 = 2;因此P ( D 1 = 2) = 6/36 = 1/6

  1. D 1 + D 2 ≤5的概率

在这里插入图片描述

图 6. D 1 + D 2 ≤5的概率
我们有 36 种结果,但只有 10 种可能性小于 5,换句话说,结果是 10 / 36

  1. 假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率

这是一个有趣的例子,在这个例子中,条件概率发挥了作用。

在这里插入图片描述

图 7.假设D 1 + D 2 ≤ 5 ,则D 1 = 2的概率
表 3 显示,对于这 10 个结果中的 3 个(D 1+ D 2 ≤5),D 1 = 2。因此,条件概率 P( D 1 = 2 | D 1+ D 2 ≤5) = 3/10 = 0.3

让我们尝试了解其背后的数学原理:

B:D1=2
答:D1 + D2≤5
P( B | A ) = P(B∩A)/P(A) = (3/36)/(10/36) = 3/10是多少
所以我们可以说P( B | A ) = P(B ∩ A) / P(A);如果 P(A) ≠0

探索不同类型的随机变量:离散和连续
随机变量可分为两种主要类型:离散型和连续型。了解这两种类型之间的差异对于选择合适的统计方法和模型至关重要。
在这里插入图片描述

图 8.离散和连续随机变量

1.离散随机变量
离散随机变量具有可数的不同值。这些值通常是整数,随机变量通常来自可以计算结果的场景。示例包括一系列抛硬币中正面朝上的次数、一小时内通过收费站的汽车数量或教室里的学生人数。

在这里插入图片描述

图 9.离散随机变量
**主要特点:**

可数结果:离散随机变量具有有限或可数无限的可能值集。
2.连续随机变量
连续随机变量在给定间隔内具有无数个值。这些值通常是测量值,可以取一定范围内的任何值。示例包括班级学生的身高、完成任务所需的时间或城市的温度。

主要特点:

不可数结果:连续随机变量可以在区间内取任意值,使得其可能值集不可数。

四、概率分布的定义

随机变量 (X) 的概率分布显示事件概率在随机变量的不同值上的分布情况。当随机变量的所有值在图形上排列时,其概率值会形成一个形状。概率分布具有几个可以测量的属性(例如:期望值和方差)。应该记住,有利结果的概率始终大于零,所有事件的所有概率之和等于 1。

概率分布本质上是任何随机实验或事件的所有可能结果的集合。

概率分布在理解随机变量中的作用
概率分布表征随机变量可能取的值,并为这些值分配概率。这些分布是统计学中的基本概念,描述随机变量的值如何分布。根据随机变量是可数的还是不可数的,概率分布可以分别是离散的或连续的。

离散概率分布:处理离散随机变量(例如,硬币翻转的正面次数)并由概率质量函数(PMF)定义。
连续概率分布:处理连续随机变量(例如,人的身高)并由概率密度函数定义(PDF)。
在这里插入图片描述

图 10.概率分布

五、结论

我们的 ML 系列第 18 天深入探讨了条件概率、随机变量和概率分布,这些都是理解概率论的重要概念。在第 19 天 — PMF、PDF、均值、方差、标准差中,我们将通过探索概率质量函数 (PMF)、概率密度函数 (PDF)和深入研究著名的概率分布来进一步简化。请继续关注我们,我们将继续探索概率世界及其在机器学习及其他领域的应用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/905745.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

十个常见的软件测试面试题,拿走不谢

所有面试问题一般建议先总后分的方式来回答,这样可以让面试官感觉逻辑性很强。 1. 自我介绍 之所以让我们自我介绍,其实是面试官想找一些时间来看简历,所以自我介绍不用太长的时间,1-2分 钟即可。 自我介绍一般按以下方式进行介…

软考高级中哪个好考?软考5个高级资格详细分析!

计算机软件资格考试是由国家人力资源和社会保障部、工业和信息化部领导下的国家级考试,这个考试既是职业资格考试,又是职称资格考试。 软考专业资格层次对应表 计算机软件资格考试设置了27个专业资格,涵盖5个专业领域,3个级别层次…

vi —— 终端中的编辑器

目标 vi 简介打开和新建文件三种工作模式常用命令分屏命令常用命令速查图 01. vi 简介 1.1 学习 vi 的目的 在工作中,要对 服务器 上的文件进行 简单 的修改,可以使用 ssh 远程登录到服务器上,并且使用 vi 进行快速的编辑即可常见需要修改…

sklearn|机器学习:决策树(一)

文章目录 sklearn|机器学习:决策树(一)(一)概述(二)实战1. 环境配置2. sklearn 中的决策树(1)模块 sklearn.tree(2)sklearn 基本建模流…

React基础语法

1.React介绍 React由Meta公司开发,是一个用于构建Web和原生交互界面的库 1.1 React优势 相较于传统基于DOM开发的优势 1.组件化的开发方式 2.不错的性能 相较于其他前端框架的优势 1.丰富的生态 2.跨平台支持 1.2React的时长情况 全球最流行,大厂…

docker安装、设置非sudo执行、卸载

安装 sudo snap install docker 设置docker非sudo执行 sudo groupadd docker sudo usermod -aG docker $USER newgrp docker sudo chown root:docker /var/run/docker.sock 卸载docker 1.删除docker及安装时自动安装的所有包 apt-get autoremove docker docker-ce docker-…

golang的RSA加密解密

参考:https://blog.csdn.net/lady_killer9/article/details/118026802 1.加密解密工具类PasswordUtil.go package utilimport ("crypto/rand""crypto/rsa""crypto/x509""encoding/pem""fmt""log"&qu…

SpringSecurity框架(入门)

简介: Spring Security 是一个用于构建安全的 Java 应用程序的框架,尤其适用于基于Spring的应用程序。它提供了全面的安全控制,从认证(Authentication)到授权(Authorization),以及…

探索C嘎嘎:初步接触STL

#1024程序员节|征文# 前言: 在前文小编讲述了模版初阶,其实讲述模版就是为了给讲STL提前铺垫,STL是C中很重要的一部分,各位读者朋友要知道它的份量,下面废话不多说,开始走进STL的世界。 目录&am…

使用Python进行数据分析入门

文章目录 Python环境搭建安装Anaconda验证安装 必备库介绍NumPyPandasMatplotlibSciPy 数据导入与清洗导入数据清洗数据 数据探索与分析描述性统计相关性分析 数据可视化绘制直方图 高级主题机器学习深度学习 总结 随着大数据时代的到来,数据分析变得越来越重要。Py…

宏组学干货|一文get宏基因组产品如何选择

大家好,小编来分享宏基因组产品选做思路喽~ 随着微生物研究的发展和高通量测序技术的出现,微生物的研究迎来了宏组学技术研究时代。目前宏组学产品种类繁多,常见项目主要包括宏基因组、宏病毒组和宏转录组。宏基因组项目可以检测宏样本中所有…

Elasticsearch —— ES 环境搭建、概念、基本操作、文档操作、SpringBoot继承ES

文章中会用到的文件,如果官网下不了可以在这下 链接: https://pan.baidu.com/s/1SeRdqLo0E0CmaVJdoZs_nQ?pwdxr76 提取码: xr76 一、 ES 环境搭建 注:环境搭建过程中的命令窗口不能关闭,关闭了服务就会关闭(除了修改设置后重启的…

【电商搜索】现代工业级电商搜索技术-亚马逊-经典的Item-to-Item协同推荐算法

【电商搜索】现代工业级电商搜索技术-亚马逊-经典的Item-to-Item协同推荐算法 文章目录 【电商搜索】现代工业级电商搜索技术-亚马逊-经典的Item-to-Item协同推荐算法1. 论文信息2. 算法介绍3. 创新点小结4. 实验效果5. 算法结论6. 代码实现7. 问题及优化方向1. 冷启动问题2. 稀…

Windows 系统安装 Hadoop 详细教程

Hadoop 是一个分布式系统基础架构,在大数据处理领域有着广泛的应用。在 Windows 系统上安装 Hadoop 虽然相对复杂一些,但只要按照步骤来,也可以顺利完成。本文将详细介绍在 Windows 系统下安装 Hadoop 的过程。 一、准备工作 下载 Hadoop 安装…

如何快速使用Cesium完成项目

要快速使用Cesium完成项目,可以按照以下步骤进行: 学习基础知识: 首先,了解Cesium的基本概念和功能。可以通过阅读Cesium的官方文档和一些入门教程来掌握基础知识。例如,可以参考“Cesium速成教程:一小时入…

记录一下方便的条件编译

1. 需要准备: 1-1、npm i cross-env -D 是跨平台的自定义编译 1-2、构造工具:vite/webpack > vite: import.meta.env.VITE_NODE_ENV > webpack:process.env.NODE_ENV这里使用vite为例子 1-3、 package.json 2. 思路与步骤 首先我们知道 axio…

前端开发转行做渗透测试,通过挖漏洞来赚钱

最近,一个做运维的朋友在学渗透测试。他说,他公司请别人做渗透测试的费用是 2w/人天,一共2周。2周 10w 的收入,好香~ 于是,我也对渗透测试产生了兴趣。开始了探索之路~ 什么是渗透测试 渗透测试这名字听起来有一种敬…

网络自动化02:基于xlsx传入设备信息与所需执行备份配置命令,使用netmiko自动化登录分发

这是这个系列第二篇 本文将仅简单介绍使用xlsx导入设备信息,并使用netmiko配置 目录 环境设备信息表格式单线程代码解释代码逻辑分析函数解析 逻辑调用图逻辑说明 遇到的问题写在最后 环境 所有设备均能与我执行Python脚本的环境互通,同时均拥有独立的ip…

Knowledge-refined Denoising Network for Robust Recommendation

Knowledge-refined Denoising Network for Robust Recommendation(Sigir23) 摘要 知识图(KG)包含丰富的边信息,是提高推荐性能和可解释性的重要组成部分。然而,现有的知识感知推荐方法直接在KG和用户-项目…

数据结构 之 图的 最小生成树(十二)

提示:本篇难点: 生成树概念的理解 重点:是普利姆算法、克鲁斯卡尔算法构造最小生成树 超超超重点的是 普利姆和克鲁斯卡尔构造最小生成树的算法,这部分可能需要同学们自行去学习了。 一定要理解后用代码能够实现这两个算法已经了解…