蒙蒂霍尔悖论

贝叶斯与频率主义对蒙蒂霍尔问题的解

在定义概率时,通常有两种思想流派:贝叶斯主义和频率主义。前者将概率视为我们对事件发生的信念程度,而后者则将其视为事件发生的相对频率。这篇文章介绍了使用贝叶斯和频率主义方法来解决著名的蒙蒂霍尔问题。

alt

蒙蒂霍尔问题的插图

蒙蒂霍尔问题

我第一次偶然发现这个概率谜题是在电影21。这个谜题起源于一个古老的美国游戏节目Let's Make a Deal,并以主持人Monty Hall的名字命名。

基于维基百科,这在1990年给Marilyn vos Savant的“Ask Marilyn”专栏的一封信中广为人知:

假设你正在参加一个游戏节目,你可以选择三扇门:一扇门后面是一辆汽车;在其他人后面,是山羊。你选择一扇门,说1号,主持人,谁知道门后面是什么,打开另一扇门,说3号,里面有一只山羊。然后他对你说:“你想选择2号门吗?转换选择对您有利吗?

玛丽莲建议你应该坚持切换,因为这会使你赢得赛车的机会从 1/3 增加到 2/3。这个答案遭到了巨大的批评,因为人们直觉上倾向于认为,由于只剩下两扇门,那么两扇门后面的汽车的概率是 1/2。因此,无论您选择切换门,几率都是一样的。

在这篇博文中,我将演示如何使用贝叶斯或频率主义方法来回答这个悖论。

像贝叶斯一样思考

贝叶斯学派对概率采取主观方法,并以贝叶斯定理为基础。它基本上是由以下公式定义的条件概率概念。

简而言之,结果概率也称为后验概率是使用三个组成部分得出的:可能性、先验概率和观察证据的概率(0 到 1 之间的值)。

alt

使用贝叶斯定理来解释为什么不同的人对相似经验证据的评价不同。

贝叶斯定理

在Monty Hall问题的背景下,我们有兴趣比较切换或坚持我们最初选择的门之间的概率,因为主机选择打开一扇后面有山羊的门。

使用上面提出的示例问题,假设门 3 已被揭示为山羊,汽车将在门 1(我们最初的选择)或门 2(如果我们选择切换)后面。

alt

为了解决这个问题,让我们应用贝叶斯定理公式并比较

P(门1 = 车| 打开=门3)

P(门2 = 车| 打开=门3)

贝叶斯定理在蒙蒂霍尔问题中的应用

先验概率 P(A)

让我们从最简单的计算概率开始,先验概率。这是指在游戏开始时,在门 1 打开之前,汽车在门 2 和门 3 后面的初始预期概率。

假设汽车是随机分配的,每扇门都有平等的机会让汽车落后。因此,P(门1 = 汽车)和 P(门 2 = 车)的概率相等为 1/3。

可能性 P(B|A)

接下来,我们将计算主持人为各自的假设打开门 3 的可能性。

第1个假设,如果汽车在门 1 后面,主持人可以打开门 2 或门 3 以露出一只山羊。因此:

P(打开 = 门 3 | 门 1 = 汽车) = 1/2

另一方面,如果汽车在门 2 后面,主持人别无选择,只能打开门 3,因为它是唯一的一扇门后有山羊的门。因此,对于第二个假设,

P(打开 = 门 3 | 门 2 = 汽车) = 1

联合概率 P(B|A) X P(A)

在已知可能性和先验概率值的情况下,我们可以计算出两个假设的公式的分子值。

P(打开 = 门 3 | 门 1 = 汽车) X P(门 1 = 汽车) = 1/2 X 1/3 = 1/6

P(打开 = 门 3 | 门 2 = 汽车) X P(门 1 = 汽车) = 1 X 1/3 = 1/3

观察到的证据概率 P(B)

我们可以通过简单地将联合概率相加来得出观察到的证据的概率。此值表示主持人在参赛者选择门 3 的情况下选择打开门 1 的概率。

P(打开 = 门 3) = 1/6 + 1/3 = 1/2

后验概率 P(A|B)

最后,我们可以通过将上述所有派生值输入公式来求解后验概率。

P(门 1 = 汽车 | 打开 = 门 3) = (1/6) / (1/2) = 1/3

P(门 2 = 汽车 | 打开 = 门 3) = (1/3) / (1/2) = 2/3

后验概率值告诉我们,主持人在门 1 后面有山羊,坚持选择门 3,那么赢得汽车的几率是 1/3。相反,如果我们选择接受切换到门 2 的提议,我们的机会就会翻倍到 2/3。

因此,贝叶斯方法支持Marilyn vos Savant的建议,即如果可以选择,请始终进行切换。

像频率主义者一样思考

与贝叶斯方法相反,顾名思义,频率主义者根据采样频率来确定概率。例如,如果我们想知道在抛硬币中获得“正面”的概率,我们可以掷硬币进行x次试验,并根据“正面”发生的频率分布确定概率。

正如伯努利大数定律所声称的那样,事件发生的长期频率将收敛于其理论概率。因此,为了解决Monty Hall问题,我们可能会在大量的试验中运行游戏节目谜题的模拟,并比较坚持我们最初选择的决定和改变选择的决定之间的赢得汽车的频率。

对于这个项目,我使用python编程语言执行了蒙特卡罗模拟。蒙蒂霍尔游戏被模拟了相当多的重复,并记录了各自策略的获胜几率。模拟唯一需要的包是随机包。首先,我创建了三个空列表来存储每个示例模拟的结果。

初始化空的数组存放模拟过程中的数

chance_of_winning_ifswitch_list = []
#放弃最初选择,改选另外的门

chance_of_winning_ifdonotswitch_list = []
#坚持最初选择的门

percentage_diff_list = []
相差的百分比

接下来,使用“for-loops”设置模拟。

在每个模拟循环中,汽车和山羊的位置被随机分配,并选择随机门作为参赛者的初始选择。鉴于游戏主持人总是会用山羊打开另一扇门,只有当最初选择的门碰巧后面有汽车奖品时,切换的决定才会适得其反。

换句话说,如果选择不切换选择,获胜的概率相当于当初选择带车门的概率。因此,包含一个“if-else”条件语句来检查最初选择的门是否有汽车。

如果所选门后面没有汽车,我们分配一个值 1 来表示选择切换选项时的获胜事件。如果所选门后面有汽车,我们分配一个值 0 来表示选择不切换选择时的获胜事件。

为了确定每种策略的获胜频率,获胜的几率是根据Monty Hall游戏的1,000个模拟回合的样本计算的。

此抽样重复 10,000 次,以确定每种策略的获胜百分比分布。设置随机种子值以确保结果的可重复性。

# Repeat 10000 trials with 1000 samples per trial

for i in range(10000):    
    results_list = []    

    for i in range(1000):        
        door_list = ["car""goat""goat"]                 
        random.shuffle(door_list)        
        chosen_door_number = random.sample(range(3), 1)        
        chosen_door = door_list[chosen_door_number[0]]        
        
        if chosen_door != "car":            
            results_list.append(1)        
        else:
            results_list.append(0)
    
    # Compute winning percentage if choose to switch  
    chance_of_winning_ifswitch = sum(results_list)/len(results_list)*100              
    
    # Compute winning percentage if choose not to switch
    chance_of_winning_ifdonotswitch = 100 - chance_of_winning_ifswitch                    
    
    # Compute difference in winning percentage between the two strategies             
    percentage_diff = chance_of_winning_ifswitch - chance_of_winning_ifdonotswitch  
             
    # Append the results to respective lists                
    chance_of_winning_ifswitch_list.append(chance_of_winning_ifswitch)                             
    chance_of_winning_ifdonotswitch_list.append(chance_of_winning_ifdonotswitch)    
    percentage_diff_list.append(percentage_diff)

下图说明了基于我们的模拟结果的两种策略的获胜赔率分布。蓝色直方图表示策略切换的分布,而黄色直方图表示策略坚持初始选择的分布。

alt

根据中心极限定理,当样本量较大时,样本均值的分布将近似于高斯分布或正态分布。正如我们从大量模拟试验中预期的那样,我们观察到一条钟形曲线,该曲线表征了正态分布。

两个直方图的 x 轴清楚地表明了两种策略之间的获胜几率差异。

如果你选择切换,62-72%的机会开着车回家,而如果你选择不切换,则有28-38%的机会。

为两种策略计算的 95% 置信区间进一步支持了这一点。在 95,10 次试验抽样获胜赔率的 000% 内,如果您切换,获胜的频率在 66.646% 和 66.705% 之间,而坚持相同的门选择将在 33.295% 和 33.354% 之间。

由于 95% 置信区间不重叠,我们可以推断两种策略之间的胜率存在统计上的显著差异。

事实上,如第三个直方图橙色所示,我们有 95% 的信心选择切换会使我们的获胜几率增加 33.293 至 33.410%。因此,频率主义的方法也支持玛丽莲·沃斯·萨凡特的建议,即如果可以选择,请始终进行切换。

结论

这篇博文展示了使用贝叶斯和频率主义方法来解决蒙蒂霍尔问题。通过上面的例子,我们可以看到推导概率值的不同方法。

虽然这两种方法不同,但在蒙蒂霍尔问题的背景下,推导出的概率彼此相似。结果清楚地表明,无论你是赞同贝叶斯范式还是频率范式,改变你的选择总是一个更明智的选择,以增加赢得汽车的机会。

模拟、分析和可视化都是使用 Python 进行的。

# Import required packages

import random
import numpy as np
import scipy.stats
import matplotlib.pyplot as plt
import pandas as pd

####----Create Monty Hall Game Simulation----####

# Create empty lists to store simulation results output
chance_of_winning_ifswitch_list = []
chance_of_winning_ifdonotswitch_list = []
percentage_diff_list = []

# Set a seed value for reproducibility
random.seed(1234)

# Create simulation using for-loops
# Repeat 10000 trials with 1000 samples per trial
for i in range(10000):
    results_list = []
    
    for i in range(1000):
        door_list = ["car""goat""goat"]
        random.shuffle(door_list)
    
        chosen_door_number = random.sample(range(3), 1)
        chosen_door = door_list[chosen_door_number[0]]
    
        if chosen_door != "car":
            results_list.append(1)
        else:
            results_list.append(0)
    
  
    chance_of_winning_ifswitch = sum(results_list)/len(results_list)*100              # Compute winning percentage if choose to switch
    chance_of_winning_ifdonotswitch = 100 - chance_of_winning_ifswitch                # Compute winning percentage if choose not to switch
    percentage_diff = chance_of_winning_ifswitch - chance_of_winning_ifdonotswitch    # Compute difference in winning percentage between the two strategies
    
    # Append the results to respective lists
    chance_of_winning_ifswitch_list.append(chance_of_winning_ifswitch)                
    chance_of_winning_ifdonotswitch_list.append(chance_of_winning_ifdonotswitch)
    percentage_diff_list.append(percentage_diff)


####----Analysis of the simulation results----####

# Create a function to calculate 95% confidence intervals
def mean_confidence_interval(data, confidence=0.95):
    a = 1.0 * np.array(data)
    n = len(a)
    m, se = np.mean(a), scipy.stats.sem(a)
    h = se * scipy.stats.t.ppf((1 + confidence) / 2., n-1)
    return m, m-h, m+h

# Compute 95% confidence intervals of chance of winning if choose to switch
mean_confidence_interval(chance_of_winning_ifswitch_list)

# Compute 95% confidence intervals of chance of winning if choose not to switch
mean_confidence_interval(chance_of_winning_ifdonotswitch_list)

# Compute 95% confidence intervals of difference in chances of winning between the two strategies
mean_confidence_interval(percentage_diff_list)

####----Simple visualisation of the simulation results----####

fig = plt.figure(figsize = (15,8))
ax1, ax2, ax3 = fig.subplots(3, 1)

# Title and caption of plot
fig.suptitle("Comparison of winning odds between strategies", fontsize = 20, fontweight = "bold")
fig.text(.99, .010, "Visualisation:@nxrunning", ha='right', fontsize = 15)

# Subplot number 1
ax1.set_title("Distribution of winning percentage if choose not to switch", loc = "left", fontweight = "bold")
ax1.hist(chance_of_winning_ifswitch_list, alpha = 1, color = "#023047", edgecolor = "white", bins = (30))
ax1.set_ylabel("Frequency")
ax1.set_xlabel("Odds of winning (%)", fontsize = 13)
ax1.annotate("95% Confidence Interval:\n[66.646, 66.705]", xy = (70, 500), fontsize = 13)

# Subplot number 2
ax2.set_title("Distribution of winning percentage if choose not to switch", loc = "left", fontweight = "bold")
ax2.hist(chance_of_winning_ifdonotswitch_list, alpha = 1, color = "#ffb703", edgecolor = "white", bins = (30))
ax2.set_xlabel("Odds of winning (%)", fontsize = 13)
ax2.set_ylabel("Frequency")
ax2.annotate("95% Confidence Interval:\n[33.295, 33.354]", xy = (36.7, 500), fontsize = 13)

# Subplot number 3
ax3.set_title("Distribution of differences in odds of winning between the two strategies", loc = "left", fontweight = "bold")
ax3.hist(percentage_diff_list, alpha = 1, color = "#fb8500", edgecolor = "white", bins = (30))
ax3.set_ylabel("Frequency")
ax3.set_xlabel("Odds of winning (%)", fontsize = 13)
ax3.annotate("95% Confidence Interval:\n[33.293, 33.410]", xy = (40, 500), fontsize = 13)
fig.tight_layout()

# Removing top and right borders
ax1.spines['top'].set_visible(False)
ax1.spines['right'].set_visible(False)
ax2.spines['top'].set_visible(False)
ax2.spines['right'].set_visible(False)
ax3.spines['top'].set_visible(False)
ax3.spines['right'].set_visible(False)

# Adjust space between title and subplots
plt.subplots_adjust(top=0.90)

# Save plot
fig.savefig('Montyhallproblemsimulation.png', dpi=500)

完整的代码可以在这里找到。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/16602.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

IDEA Java 第一个mybatis入门程序

文章目录 准备mysql 开始新建maven项目maven添加引用mybatis配置文件工具类创建实例类添加mappermappermapper.xml 测试类 发现问题org.apache.ibatis.binding.BindingException: Type interface com.cpyy.mapper.UserMapper is not known to the MapperRegistry.The error may…

chatGPT国内可用镜像源地址

chatGPT国内可用镜像源地址 彷丶徨丶 关注 IP属地: 湖北 0.811 2023.03.15 16:02:16 字数 1,152 阅读 249,582 如果你正在尝试访问Chatgpt网站,但由于某些原因无法访问该网站,那么你可以尝试使用Chatgpt的国内镜像网站。以下是一些Chatgpt国内镜像网站的…

【MYSQL】数据类型和约束

目录 数据类型 1.数值类型 1.1.位--类型bit(M) 1.2. 整数类型--tinyint,smallint,int,bigint 1.3.小数类型--float、decimal 2.字符类型--char、varchar 3.日期类型--datetime、timestamp 4.string类型--enum和set mysql的约束 1.空…

【人工智能】— 不确定性、先验概率/后验概率、概率密度、贝叶斯法则、朴素贝叶斯 、最大似然估计

【人工智能】— 不确定性 不确定性不确定性与理性决策基本概率符号先验概率(无条件概率)/后验概率(条件概率)随机变量概率密度联合概率分布公理完全联合分布概率演算独立性 贝叶斯法则例1例2 使用贝叶斯规则:合并证据朴素贝叶斯最大似然估计小结 不确定性 不确定性与…

PCIe物理层详细总结-PCIE专题知识(一)

目录 一、简介二、PCIe物理层结构及功能2.1 PCIe端对端连接方式2.2 PCIe组成2.2.1 逻辑层(Logic)1 发送逻辑2 接收逻辑 2.2.2 电气层(Electrical)1 物理层-电气(Physical Layer Electrical)2 数据传送----差分方式 2.2.3 PLP介绍 三、其他相关链接1、PCI总线及发展历程总结2、P…

mockjs学习笔记

文章目录 一、什么是mockjs二、安装mockj项目安装mock 三、mock语法生成字符串生成文本生成标题和句子生成段落生成数字生成自增id生成姓名-地址-身份证随机生成图片生成时间 mock拦截请求定义get请求定义post请求 四、实现新闻管理案例获取数据添加新闻删除新闻 一、什么是moc…

最优化方法Python计算:一元函数搜索算法——二分法

设一元目标函数 f ( x ) f(x) f(x)在区间 [ a 0 , b 0 ] ⊆ R [a_0,b_0]\subseteq\text{R} [a0​,b0​]⊆R(其长度记为 λ \lambda λ)上为单峰函数,且在 ( a 0 , b 0 ) (a_0,b_0) (a0​,b0​)内连续可导,即其导函数 f ′ ( x ) f…

PySpark基础入门(1):基础概念+环境搭建

目录 Spark基础入门 spark基础概念 spark架构 Spark环境搭建 local模式 Standalone 模式 Spark On YARN 模式 PySpark开发环境搭建 Python On Spark 执行原理 更好的阅读体验:PySpark基础入门(1):基础概念+环…

数字图像处理--matlab图像反转、对数变换、伽马变换、对比度拉伸详解和代码实现

灰度变换在图像的单个像素上操作,主要以对比度和阈值处理为目的 空间滤波涉及改善性能的操作(邻域操作),如通过图像中每一个像素的邻域处理来锐化图像 这两种方法均属于图像增强。 灰度变换 邻域基本增强变换定义数学表达三种基本…

基于协同过滤的旅游推荐系统设计与实现(论文+源码)_kaic

1 绪论 1.1 研究背景及意义 1.2 国内外研究现状 1.3 研究目标与意义 1.4 主要研究工作 2 相关理论介绍 2.1HTML与JavaScript 2.2 MySQL数据库 2.3 协同过滤算法简介 3 系统分析与设计 3.1 系统需求分析 3.1.1 功能性需求 3.1.2 安全性需求 3.2 系统总体架构 3.3 功能模块设计 3…

【LeetCode】221.最大正方形

221.最大正方形(中等) 题解 对于在矩阵内搜索正方形或长方形的题型,一种常见的做法是:定义一个二维 dp 数组,其中 dp[i][j] 表示满足题目条件的、以(i,j)为右下角的正方形或长方形属性。在本题中…

Android 编译模块 (小记)

1.整编 source build/envbuild.sh lunch xxx make 2.单独编译模块 2.1 去Android.bp 中找模块名 比如我想编译system/core/fastboot,那么我就去找这个路径下的Android.bp/ Android.mk Android.bp 中找每个模块的那么就行 然后直接make这个name make fastboot_…

设置苹果电脑vsode在新窗口中打开文件

0、前言 最近切换到mac电脑工作,又得重新安装一些工具软件并设置。虽然这些设置并表示啥复杂的设置,但是久了不设置还是会忘记。于是记录之,也希望给能帮助到需要的人。 我们使用vscode阅读或者编辑文件时,有时候希望同时打开多…

3个经典线程同步问题

生产者消费者问题 问题描述 系统中有一组生产者进程和一组消费者进程,生产者进程每次生产一个产品放入缓冲区,消费者进程每次从缓冲区中取出一个产品并使用。生产者、消费者共享一个初始为空、大小为n的缓冲区 伪码描述 semaphore mutex 1;//互斥信…

SpringBoot集成 ElasticSearch

Spring Boot 集成 ElasticSearch 对于ElasticSearch比较陌生的小伙伴可以先看看ElasticSearch的概述ElasticSearch安装、启动、操作及概念简介 好的开始啦~ 1、基础操作 1.1、导入依赖 <dependency><groupId>org.springframework.boot</groupId><arti…

2023 年 五一杯 B 题过程 + 代码(第一问)

文章目录 第一题问题分析PageRank 算法&#xff08;可跳过&#xff09;PageRank 算法修正权重系数 结果各城市链出与链入链出 权重链入 权重 PageRank 算法结果代码 第一题 问题分析 从收货量、发货量、快递数量增长/减少趋势、相关性等多角度考虑&#xff0c;建立数学模型&…

基于jQuery------购物车案例

目录 基于jQuery------购物车案例 案例&#xff1a;购物车案例模块-增减商品数量分析 案例&#xff1a;购物车案例模块-修改商品小计分析 案例&#xff1a;购物车案例模块-计算总计和总额 案例&#xff1a;购物车案例模块-删除商品模块 案例&#xff1a;购物车案例模块-选…

基于.Net开发的、支持多平台、多语言餐厅点餐系统

今天给大家推荐一套支持多平台、多语言版本的订单系统&#xff0c;适合餐厅、酒店等场景。 项目简介 这是基于.Net Framework开发的&#xff0c;支持手机、平板、PC等平台、多语言版本开源的点餐系统&#xff0c;非常适合餐厅、便利店、超市、酒店等&#xff0c;该系统基础功…

C语言宏使用

C语言宏 编译一个C语言程序的第一步骤就是预处理阶段&#xff0c;这一阶段就是宏发挥作用的阶段,编译完之后宏对二进制代码不可见。 使用 1. 宏常量 #define PI 3.142. 宏语句 #define Print printf("hello,world!\r\n")3. 宏函数 使用宏来定义函数&#xff0c…

UDP的报文结构和注意事项

1.UDP的报文结构 UDP的报文结构如图&#xff1a; 画成一行会比较好理解&#xff1a; 主要由两部分组成&#xff1a;UDP报头和UDP载荷。 UDP载荷其实就是数据。 UDP报头分为四个部分&#xff0c;每个部分占两个字节。 源端口目的端口报文长度校验和 下面介绍报头里各个部分…