概率密度函数(PDF)正态分布

概率密度函数(PDF)是一个描述连续随机变量取特定值的相对可能性的函数。对于正态分布的情况,其PDF有一个特定的形式,这个形式中包括了一个常数乘以一个指数函数,它假设误差项服从均值为0的正态分布:
正太分布(高斯分布)
p ( ϵ ( i ) ) = 1 2 π σ 2 exp ⁡ ( − ( ϵ ( i ) ) 2 2 σ 2 ) p(\epsilon^{(i)}) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(\epsilon^{(i)})^2}{2\sigma^2}\right) p(ϵ(i))=2πσ2 1exp(2σ2(ϵ(i))2)
各名词解释:
p ( ϵ ( i ) ) p(\epsilon^{(i)}) p(ϵ(i)):这部分表示给定误差 ϵ ( i ) \epsilon^{(i)} ϵ(i)的概率密度。

σ 2 \sigma^2 σ2:正态分布的形状完全由两个参数决定:均值( μ \mu μ)和方差( σ 2 \sigma^2 σ2)。均值决定了分布的中心位置,而方差(标准差的平方)决定了分布的离散程度。这里均值( μ \mu μ)都假设为0因此不讨论。详细解释一下 σ 2 \sigma^2 σ2

  1. σ 2 \sigma^2 σ2是分布宽度的度量, σ 2 \sigma^2 σ2的数值表示数据分布的离散程度: σ 2 \sigma^2 σ2越大,数据分布越分散; σ 2 \sigma^2 σ2越小,数据分布越集中(如上图中的钟形越瘦)。
  2. σ 2 \sigma^2 σ2的计算过程:
    a.假设你有一组数据 X = { x 1 , x 2 , . . . , x n } X = \{x_1, x_2, ..., x_n\} X={x1,x2,...,xn},且已知均值 μ \mu μ为0。
    b.计算每个数据点的平方: x i 2 x_i^2 xi2计算了每个数据点距离均值(0)的距离的平方。
    c.计算这些平方的平均值(即方差 σ 2 \sigma^2 σ2): σ 2 = 1 n ∑ i = 1 n x i 2 \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} x_i^2 σ2=n1i=1nxi2(即 x i 2 x_i^2 xi2求和后平均)

1 2 π σ 2 \frac{1}{\sqrt{2\pi\sigma^2}} 2πσ2 1:这是正态分布概率密度函数的前缀,其中 σ 2 \sigma^2 σ2是方差。它的作用是确保概率密度函数(PDF)的积分——也就是函数下整个面积等于1。在数学上,这意味着对于连续概率分布,确保所有概率值的总和为1。

exp: e e e是一个重要的数学常数(自然对数的底数),约等于2.71828,而exp是 e e e的幂。exp用于计算概率的指数部分,确保了大多数数据点都集中在平均值附近,而远离均值的数据点则呈指数级减少,就是让曲线呈“钟形曲线(高斯分布)”。

− ( ϵ ( i ) ) 2 2 σ 2 -\frac{(\epsilon^{(i)})^2}{2\sigma^2} 2σ2(ϵ(i))2:这是exp指数函数内的幂,代表了 ϵ ( i ) \epsilon^{(i)} ϵ(i)偏离均值0的程度。

  1. 由于我们假设误差项 ϵ \epsilon ϵ均值为0,所以这里直接用 ϵ ( i ) \epsilon^{(i)} ϵ(i)。这个比例的平方表示了误差项的值距离均值(0)的距离的平方,然后除以 2 σ 2 {2\sigma^2} 2σ2来“标准化”这个距离。在正态分布中,这个距离的平方越大,观测到该误差的概率就越低。
  2. 这个过程与误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)的值(第 i i i个数据点的误差项)的平方成正比,这里的平方是必要的,因为我们对误差的大小感兴趣,而不管它是正的还是负的。平方确保了所有的误差值都是非负的,且更大的误差(无论正负)都会产生更大的平方值。
  3. 与方差 σ 2 {\sigma^2} σ2的两倍成反比,这里 σ 2 {\sigma^2} σ2表示整个数据集中的误差项的分布宽度。方差的两倍是概率密度函数的标准组成部分,用于“标准化”误差项的平方,这样不同的分布(具有不同的方差)就可以使用相同的函数形式。这里的乘以 1 2 σ 2 \frac{1}{2\sigma^2} 2σ21类似于计算出“相对”值而不是“绝对”值,在不改变误差项的方向的情况下,调整它的相对重要性。主要作用是:由于不同的数据集可能有不同的方差(即不同的误差分布宽度),我们需要有一种方式来标准化这些误差,使它们可以在统一的尺度上比较。
  4. − 1 2 σ 2 -\frac{1}{2\sigma^2} 2σ21:这个负号和分母 2 σ 2 {2\sigma^2} 2σ2一起工作,形成一个比例因子,表示一个衰减的过程,它反映了误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)相对于方差的大小。由于是负指数,误差项的平方越大, e e e的幂就越小,从而降低了该误差值的概率密度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/221192.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深度优先搜索LeetCode979. 在二叉树中分配硬币

给你一个有 n 个结点的二叉树的根结点 root ,其中树中每个结点 node 都对应有 node.val 枚硬币。整棵树上一共有 n 枚硬币。 在一次移动中,我们可以选择两个相邻的结点,然后将一枚硬币从其中一个结点移动到另一个结点。移动可以是从父结点到…

15.(vue3.x+vite)组件间通信方式之默认插槽(匿名插槽)

前端技术社区总目录(订阅之前请先查看该博客) 示例效果 默认插槽(匿名插槽) 插槽 slot 通常用于两个父子组件之间,最常见的应用就是我们使用一些 UI 组件库中的弹窗组件时,弹窗组件的内容是可以让我们自定义的,这就是使用了插槽的原理。 (1)slot 是 Vue中的内置标签…

使用 PyTorch 进行 K 折交叉验证

一、说明 中号机器学习模型在训练后必须使用测试集进行评估。我们这样做是为了确保模型不会过度拟合,并确保它们适用于现实生活中的数据集,与训练集相比,现实数据集的分布可能略有偏差。 但为了使您的模型真正稳健,仅仅通过训练/测…

在AWS Lambda上部署标准FFmpeg工具——自定义层的方案

大纲 1 确定Lambda运行时环境1.1 Lambda系统、镜像、内核版本1.2 运行时1.2.1 Python1.2.2 Java 2 打包FFmpeg3 创建Lambda的Layer4 测试4.1 创建Lambda函数4.2 附加FFmpeg层4.3 添加测试代码4.4 运行测试 参考文献 FFmpeg被广泛应用于音/视频流处理领域。对于简单的需求&#…

Databend 开源周报第 122 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 支持链式函数调…

Gee教程6.模板(HTML Template)

这一章节的内容是介绍 Web 框架如何支持服务端渲染的场景 实现静态资源服务(Static Resource)。支持HTML模板渲染。 这一章节很多内容是基于net/http库的,该库已经实现了很多静态文件和HMML模板的相关功能的了。 静态文件 网页的三剑客,JavaScript、C…

28、pytest实战:获取多用户鉴权

前提 测试过程中有用户体系,例如包括管理员、商家、用户角色,不同测试用例需要使用不同角色来操作,操作权限根据用户的鉴权来判断实现。 技能点 建立全局变量文件,保存账号相关信息获取鉴权信息变为module级别fixture&#xff…

mac批量修改图片格式

1. 当前窗口在word文档,选择工具-》宏-》点击宏 2. 弹出弹框,起个宏名1,点击2添加一个宏。 输入以下代码: Sub 图片格式统一()图片格式统一 宏Dim iDim Height, WeightHeight 200 改成自己的高度Weight 350 改成自己的宽度On E…

基于Java swing 学生选课成绩管理系统

Java swing 学生选课成绩管理系统 在SQL Server下建库、建表、建约束、建视图、建触发器、建角色、建用户等,并录入必要的数据。 编程实现至少3个模块 登录模块:输入用户名、密码,选择身份(通过检索出数据库里现有的用户身份&…

分类预测 | Matlab实现OOA-CNN-SVM鱼鹰算法优化卷积支持向量机分类预测

分类预测 | Matlab实现OOA-CNN-SVM鱼鹰算法优化卷积支持向量机分类预测 目录 分类预测 | Matlab实现OOA-CNN-SVM鱼鹰算法优化卷积支持向量机分类预测分类效果基本描述程序设计参考资料 分类效果 基本描述 1.Matlab实现OOA-CNN-SVM鱼鹰算法优化卷积支持向量机分类预测&#xff0…

智能优化算法应用:基于闪电连接过程算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用:基于闪电连接过程算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用:基于闪电连接过程算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.闪电连接过程算法4.实验参数设定5.算…

开始使用高性能、低延迟的对象存储服务 Amazon S3 Express One Zone

全新的对象存储服务 Amazon S3 Express One Zone 旨在提供比 Amazon S3 Standard 高出10倍的性能,同时每秒可处理数十万个请求,并且延迟始终保持在个位数毫秒级,因此非常适合存储最常访问的数据和要求最苛刻的应用程序。将对象存储和复制到单…

【链表Linked List】力扣-24 两两交换链表中的节点

目录 题目描述 解题过程 题目描述 给你一个链表,两两交换其中相邻的节点,并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成本题(即,只能进行节点交换)。 示例 1: 输入:he…

⭐ Unity里 用OpenCv 插件 将图片生成Gcode

现在遇到一个需求,用Unity里用图片生成Gcode 告知硬件让它去画出来 翻阅了一些资料,最后决定用OpenCV去做 下图左侧是生成的Gcode文件 右侧是要画的图片 话不多说直接上代码 using System.IO; using UnityEngine; using OpenCVForUnity.CoreModule; …

第十五届蓝桥杯模拟赛B组(第二期)C++

前言: 第一次做蓝桥模拟赛的博客记录,可能有很多不足的地方,现在将第十五届蓝桥杯模拟赛B组(第二期)的题目与代码与大家进行分享,我是用C做的,有好几道算法题当时自己做的也是一脸懵&#xff0c…

财报解读:立足海外音视频直播战场,欢聚的BIGO盾牌还需加强?

如今,音视频社交平台出海早已不是新鲜事,随着时间推移,一批“坚定全球化不动摇”的企业也实现突围,站在出海舞台中心。 若提到中国企业出海范本,欢聚集团定是绕不开的存在。作为最早一批出海的中国互联网企业&#xf…

CS144(2023 Spring)Lab 0:networking warmup(环境搭建 webget bytestream)

文章目录 前言其他笔记相关链接 1. Set up GNU/Linux on your computer2. Networking by hand3. Writing a network program using an OS stream socket3.1 Linux配置3.2 C规范3.3 Writing webget3.3.1 实现3.3.2 测试 4. An in-memory reliable byte stream4.1 思路分析4.2 代…

记录 | vscode设置自动换行

右上菜单栏 -> 查看 -> 打开自动换行 或者还有种方式,如下, 左下角小齿轮,点击设置 然后输入 Editor: Word Wrap ,把开关打开为 on

扩散模型实战(十四):扩散模型生成音频

推荐阅读列表: 扩散模型实战(一):基本原理介绍 扩散模型实战(二):扩散模型的发展 扩散模型实战(三):扩散模型的应用 扩散模型实战(四&#xff…

使用 Go Modules 管理依赖:简明教程

一、GoLang 中包的介绍和定义 包(package)是多个 Go 源码的集合,是一种高级的代码复用方案Go 语言为我们提供了很多内置包,如 fmt、strconv、strings、sort、errors、times、encoding/json、os、io 等Golang 中的包可以分为三种&…