常见推断方法一览:极大似然估计、最大后验估计、期望最大化、贝叶斯推断、马尔科夫链蒙特卡洛方法、变分推断

常见推断方法一览

    • 推断方法区别
    • 频率派
      • 极大似然估计 MLE
      • 最大后验估计 MAP
      • 期望最大化 EM
    • 贝叶斯推断 Bayesian
      • 马尔科夫链蒙特卡洛方法 MCMC
      • 变分推断 VI

 


推断方法区别

  1. 极大似然估计 (Maximum Likelihood Estimation, MLE):

    • 解释: 假设你有一堆骰子,你投掷它们很多次,然后记录下每次的结果。
    • 极大似然估计就是一种方法,用来估计这些骰子每一面出现的概率是多少。
    • 根据实际观察到的数据来找到一组参数,使得这些数据出现的可能性最大。
    • 是从已有的数据出发,然后去寻找最能解释这些数据的参数。
    • 应用领域: 在科学实验和社会调查中,用来估计未知参数,比如估计一个新药的有效率。
  2. 最大后验估计 (Maximum A Posteriori Estimation, MAP):

    • 解释: 这个方法和极大似然估计很像,但它还考虑了你之前已经知道的信息。
    • 比如,如果你在估计骰子的概率时,已经知道这个骰子可能是不均匀的,这个先验知识会影响你的估计结果。
    • 应用领域: 用于包含先验知识的统计问题,比如在医学图像处理中估计病变的位置。
  3. 期望最大化 (Expectation Maximization, EM):

    • 解释: 这是一种处理不完整数据的方法。
    • 假设你有一部分骰子的投掷数据丢失了,EM算法可以帮你估计这些丢失数据的最可能值,并据此来估计骰子的概率。
    • 应用领域: 用于处理不完整数据,如在经济学研究中处理缺失数据。
  4. 贝叶斯推断 (Bayesian Inference):

    • 解释: 贝叶斯推断是一种统计方法,它使用概率来量化不确定性。
    • 在贝叶斯推断中,你可以用新的数据来更新你对某个参数的信念。
    • 例如,你可以根据新的病例数据来更新一个疾病爆发的可能性。
    • 应用领域: 广泛应用于各种领域,包括医学研究、机器学习和金融市场分析。
  5. 马尔科夫链蒙特卡洛方法 (Markov Chain Monte Carlo, MCMC):

    • 解释: 这是一种通过构建“随机游走”来估计复杂概率分布的方法。
    • 想象你在一个棋盘上随机移动,每一步都基于某种规则,长时间后,你的位置可以帮助我们理解棋盘上的某些特性。
    • 应用领域: 在统计物理、金融和生态学中模拟复杂系统。
  6. 变分推断 (Variational Inference):

    • 解释: 这是一种使用简化的概率分布来近似复杂概率分布的方法。
    • 就像用一张简单的地图来代表一个复杂的地形,虽然不完全准确,但足以给出一个大概的理解。
    • 应用领域: 在机器学习中,特别是在大数据和高维数据中使用,如在自然语言处理和计算机视觉中。

搭建模型需要设计目标函数(比如神经网络),绝大多数机器学习的目标函数都是基于 MLE、MAP、Bayesian搭建的。

因为这些模型在学习时,都试图找到最佳的方式去解释数据,同时考虑到现有的知识和不确定性。

频率派

极大似然估计 MLE

MLE定义 给定 theta 的条件下,最大化看到所有样本的概率,最大化目标函数。

假设你有一组数据,并且你有一个模型,这个模型由一些参数(θ)控制。

MLE 的目标是找到这些参数的最佳值,使得这些参数下观察到的数据出现的概率最大,确保模型尽可能地反映出现实世界中的情况。

然后用这个接近现实世界的模式,去预测事情。

似然函数:在特定参数设定下,评估在给定模型参数下,观察到的特定数据集出现的概率。

假设你有一个硬币,想知道是不是公平的。你抛了10次,其中7次正面朝上。

似然函数会尝试不同的概率(比如50%,60%,70%…不同参数下),并计算每种情况下出现“7次正面,3次反面”的概率。

最大化似然函数:目标是找到一个概率值,使得这种结果出现的可能性最大。如果这个最大的概率发生在70%,那你就会说根据目前的数据,最有可能的情况是硬币正面朝上的概率是70%,参数就是这个。

基于实际观察到的数据来估计模型参数,这就是最大似然估计的核心思想。

但这种思想,结论可靠性高度依赖于样本的大小和实验的重复性。

如果我们只抛10次,我们得到的结论可能不太可靠。

但如果我们抛1000次,并且大约700次正面朝上,我们就更有信心认为硬币有偏差。

属于频率派搞法。

数学公式:

  • M L E ( θ ) = a r g m a x [ P ( X ∣ θ ) ] MLE(θ) = argmax [P(X|θ)] MLE(θ)=argmax[P(Xθ)]

在机器学习中的应用,一个神经网络模型,输入是图片,输出是图片属于“猫”或“狗”的概率。

  • 似然函数:在这个场景中,似然函数衡量的是,在给定网络当前参数的情况下,正确分类所有训练图片的概率。
  • 参数优化:通过调整网络的权重和偏置,我们尝试最大化这个似然函数。换句话说,我们在寻找一组参数,它们使得网络正确分类训练集中的猫和狗图片的概率最大。

最大似然估计在机器学习中的作用:它提供了一个强大的框架来指导模型参数的优化过程,使模型能够有效地从数据中学习。

这种基于概率的方法有助于确保模型不仅能够适应已见过的数据,而且能够泛化到新的、未见过的数据。

最大后验估计 MAP

极大似然估计只关注当前的样本,也就是只关注当前发生的事情,不考虑事情的先验情况。

MAP是在MLE的基础上增加了先验知识。

如果没有先验信息,或者先验信息是均匀分布的,那么MAP就简化为MLE。

MAP不仅考虑数据本身,还考虑了参数的先验概率。

试图找到使得参数在观测数据下,后验概率最大的参数值。

  • 先验概率:这是在观测数据之前对参数的信念。例如,如果你已经知道在大多数情况下,猫和狗的图片大致平分,这个信息就可以作为先验。

  • 直观理解:在同样的猫狗识别模型中,如果你已经知道猫的图片通常比狗的图片多(或者相反),MAP会利用这个先验知识来调整参数估计。

数学公式:

  • M A P ( θ ) = a r g m a x [ P ( θ ∣ X ) ] = a r g m a x [ ( P ( X ∣ θ ) ∗ P ( θ ) ) P ( X ) ] MAP(θ) = argmax [P(θ|X)] = argmax [\frac{(P(X|θ) * P(θ))}{P(X)}] MAP(θ)=argmax[P(θX)]=argmax[P(X)(P(Xθ)P(θ))]

    由于 P(X) 是固定的,我们通常简化为:

  • M A P ( θ ) = a r g m a x P ( X ∣ θ ) P ( θ ) MAP(θ) =argmax P(X|\theta)P(\theta) MAP(θ)=argmaxP(Xθ)P(θ)

    对比 MLE 公式,发现就是多了一个先验模块 P ( θ ) P(\theta) P(θ)

MLE纯粹基于数据来估计参数,而 MAP在估计参数时同时考虑了数据和先验知识。

在数据稀少或有强先验知识的情况下,MAP可能比MLE更有效。

期望最大化 EM

迭代算法,用于含有隐变量的统计模型中,交替计算期望步骤和最大化步骤,来寻找参数的最优估计。

比如看故事书,但故事中有一些缺失的部分(这些就是“隐变量”)。

你的目标是填补这些缺失部分,使得整个故事变得连贯和合理。

EM算法就像一个两步循环过程,帮助你逐渐完善这个故事:

  • 期望步骤 (E步骤): 在这一步,你根据目前所知的信息,对故事中缺失的部分做出最佳猜测。就好比你根据故事的上下文来推测这些缺失部分可能的内容。

  • 最大化步骤 (M步骤): 接下来,你根据这些猜测来重新讲述整个故事,并调整故事中其他已知部分的细节,使得整体故事更加合理。这个过程就像根据新的假设来优化故事的连贯性。M步骤可以使用MLE或MAP。

这个循环反复进行:你根据当前的故事版本来改善你对缺失部分的猜测,然后再用这些新猜测来优化整个故事。

随着每次迭代,故事变得越来越连贯,直到最终达到一个点,你觉得再怎么调整也无法使故事更好了。

这时,你就找到了最合适的版本来填补缺失部分,也就是说,你找到了模型参数的最优估计。

详情,请猛击:《期望最大化 EM》。

贝叶斯推断 Bayesian

用贝叶斯定理更新参数的概率分布,考虑到新的数据。

马尔科夫链蒙特卡洛方法 MCMC

构建马尔科夫链来抽样未知分布,用于复杂分布的参数估计和积分。

详情,请猛击:【史上最易懂】马尔科夫链-蒙特卡洛方法:基于马尔科夫链的采样方法,从概率分布中随机抽取样本,从而得到分布的近似

变分推断 VI

简化模型来近似复杂概率分布,常用于贝叶斯推断中处理复杂模型。

详情,请猛击:【史上最易懂】变分推断:从【求分布】的推断问题,变成【缩小距离】的优化问题,用简单的分布 q 去近似复杂的分布 p

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/280185.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

行车记录仪变清晰,变高清的办法一定要收藏

有时候我们会发现行车记录仪拍摄的视频不够清晰,特别是出现事故需要视频为证的时候,如果视频太模糊,很难获得交警的支持,那么如何让行车记录仪拍摄的视频变得更加清晰呢? 小编给大家分享几个办法,建议收藏…

Getway介绍和使用

Getway 入门简介 网关搭建步骤: 创建项目,引入nacos服务发现和gateway依赖 配置application.yml,包括服务基本信息、nacos地址、路由 路由配置包括: 路由id:路由的唯一标示 路由目标(uri)…

openGauss学习笔记-180 openGauss 数据库运维-升级-升级前必读

文章目录 openGauss学习笔记-180 openGauss 数据库运维-升级-升级前必读180.1 升级方案180.2 升级前的版本要求180.3 升级影响和升级约束 openGauss学习笔记-180 openGauss 数据库运维-升级-升级前必读 180.1 升级方案 本节为指导用户选择升级方式。 用户根据openGauss提供的…

按摩上门预约小程序源码系统 开发组合:PHP+MySQL 附带完整的搭建教程

现代生活节奏的加快,人们越来越注重健康与放松。按摩作为传统的舒缓方式,市场需求逐年上升。然而,传统的按摩服务预约方式较为繁琐,用户需拨打热线电话或前往实体店进行预约,这无疑增加了用户的操作成本。因此&#xf…

redhat 8 安装openstack

redhat 8 安装openstack 1、安装文档2、redhat 8 安装openstack3、使用openstack 1、安装文档 openstack官方安装文档 https://docs.openstack.org/install-guide/ 2、redhat 8 安装openstack 3、使用openstack

人工智能——移动摄影技术

目录 封面 1 .移动计算摄影简介 2.手机相机的硬件限制 2.1 传感器尺寸和镜头孔径 2.2 噪声和动态范围 2.3 景深 2.4 变焦 2.5 色彩欠采样 3 .相机图像处理流水线 3.1 相机传感器 3.2 相机流水线 5.拓展 1 .移动计算摄影简介 现代数字摄影的进度始终伴随着图像传感器…

云计算IaaS、PaaS和SaaS之

提供的服务来比较如下两图 示例图 示例图

前端优化 - 防抖和节流

📢 鸿蒙专栏:想学鸿蒙的,冲 📢 C语言专栏:想学C语言的,冲 📢 VUE专栏:想学VUE的,冲这里 📢 CSS专栏:想学CSS的,冲这里 &#x1f4…

提升爬虫IP时效:解决被封IP的难题

在进行数据采集时,经常会遇到被目标网站封禁IP的情况,这给爬虫系统带来了困扰。本文将介绍如何提升爬虫IP的时效,解决被封IP的难题,帮助您顺利进行数据采集,不再受限于IP封禁。 第一步:使用爬虫IP 使用爬虫…

【MySQL】数据库之存储过程(“SQL语句的脚本“)

目录 一、什么是存储过程? 二、存储过程的作用 三、如何创建、调用、查看、删除、修改存储过程 四、存储过程的参数(输入参数,输出参数,输入输出参数) 第一种:输入参数 第二种:输出参数 …

车牌识别技术,如何用python识别车牌号

目录 一.前言 二.运行环境 三.代码 四.识别效果 五.参考 一.前言 车牌识别技术(License Plate Recognition, LPR)在交通计算机视觉(Computer Vision, CV)领域具有非常重要的研究意义。以下是该技术的一些扩展说明&#xff1…

如何解决msvcp110.dll丢失问题,多种解决方法分享

在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是“msvcp110.dll丢失”,msvcp110.dll是Microsoft Visual C 2012 Redistributable的一个组件,它提供了许多用于运行程序的函数和类库。当这个文件丢失或损坏时&#xff…

oracle-存储结构

文件包括 控制文件.ctl、数据文件.dbf、日志文件.log这三类放在存储上。 参数文件:空间的划分,进程的选用(.ora) oracle启动的时候需要读一下,数据库启动后,参数文件并不关闭,但即使文件丢了&a…

域用户信息查询

域环境基本知识 本地账户 本地账户 命令行查询本地账户 net user来宾账户默认来宾组: net localgroup Guests 查询guest账号SID wmic group get name,sid | findstr Guestspowershell 查询本地用户和 SID Get-WmiObject -Class Win32_UserAccount -Filter &q…

visual studio + intel Fortran 错误解决

版本:VS2022 intel Fortran 2024.0.2 Package ID: w_oneAPI_2024.0.2.49896 共遇到三个问题。 1.rc.exe not found 2.kernel32.lib 无法打开 3.winres.h 无法打开 我安装时参考的教程:visual studio和intel oneAPI安装与编写fortran程序_visual st…

私有部署ELK,搭建自己的日志中心(六)-- 引入kafka对采集日志进行削峰填谷

一、背景 首先,要说明一点,elk日志中心,是可以缺少kafka组件的。 其次,如果是研发环境下,机器资源紧张的情况下,也是可不部署kafka。 最后,因为kafka的部署是可以独立的,所以本文将…

IP地理位置定位技术基本原理

IP地理位置定位技术的基本原理是基于IP地址的特性。每个IP地址在网络中都有一个与之对应的地理位置信息,这是通过IP地址数据库来确定的。这个数据库由ISP(Internet Service Provider)或其它一些机构维护,其中包含了每个IP地址的地…

凸包算法--物体表面积/体积计算--python版

文章目录 环境:1.1 凸包法介绍:2.1 python代码3.1 可视化4.1 体积/表面积Calculation 环境: Open3D 1.1 凸包法介绍: 用于找到包围给定点集的最小凸多边形或凸多面体 常用的凸包算法: Grabam扫描法(适用…

iptables 防火墙(二)

目录 1. SNAT 策略及应用 1.1 SNAT策略概述 1. 只开启路由转发,未设置地址转换的情况 2. 开启路由转发,并设置SNAT转换的情况 1.2 SNAT策略的应用 1. 2.1 共享固定IP上网 (1)打开网关的路由转发 (2)…

LLaVA-v1.5-7B:实现先进多模态学习的开源AI

引言 LLaVA-v1.5-7B是一个开源大型多模态模型(LMM),它通过结合视觉指令调整(Visual Instruction Tuning)技术,展示了在多模态理解和生成任务上的卓越性能。该模型特别注重简洁性和数据效率,利用…