纳什均衡:博弈论中的运作方式、示例以及囚徒困境

文章目录

  • 一、说明
  • 二、什么是纳什均衡?
    • 2.1 基本概念
    • 2.2 关键要点
  • 三、理解纳什均衡
  • 四、纳什均衡与主导策略
  • 五、纳什均衡的例子
  • 六、囚徒困境
  • 七、如何原理和应用
    • 7.1 博弈论中的纳什均衡是什么?
    • 7.2 如何找到纳什均衡?
    • 7.3 为什么纳什均衡很重要?
    • 7.4 如何计算纳什均衡?
    • 7.5 纳什均衡的局限性是什么?
  • 八、后记

关键词:Nash Equilibrium、Dominant Strategy

一、说明

   博弈论者使用纳什均衡来分析多个决策者战略互动的结果。在战略互动中,每个决策者的结果取决于其他人的决策以及他们自己的决策。纳什思想背后的简单见解是,如果孤立地分析多个决策者的决策,就无法预测他们的选择。相反,我们必须问每个玩家在考虑到玩家对其他人的期望后会怎么做。纳什均衡要求玩家的选择是一致的:没有玩家希望在其他人做出决定的情况下撤销自己的决定。

二、什么是纳什均衡?

2.1 基本概念

   在博弈论中,纳什均衡是非合作博弈中最常用的解决方案概念。纳什均衡是指没有玩家可以通过改变自己的策略(保持其他玩家的策略不变)来获利的情况。[1]纳什均衡的概念可以追溯到古诺时代,他在 1838 年将其应用于寡头垄断竞争模型。[2]

   纳什均衡表现为一种“饱和态”,如果每个玩家都选择了一种策略 (基于游戏中迄今为止发生的事情的行动计划),并且在其他玩家保持不变的情况下,没有人可以通过改变自己的策略来增加自己的预期收益。表现为“势均力敌”的状态。
   纳什均衡是博弈论中的一个概念,指博弈达到最优结果。这是一种不鼓励个体玩家偏离其初始策略的状态。玩家知道对手的策略,但仍然不会偏离他们最初选择的策略,因为这仍然是每个玩家的最佳策略。

   总体而言,假设其他玩家的策略保持不变,个人无法从改变行动中获得增量收益。然而,一场游戏可能有多个纳什均衡,也可能根本没有。

2.2 关键要点

  • 纳什均衡是博弈论中的一个决策定理,该定理指出玩家可以通过不偏离其初始策略来实现期望的结果。
  • 在纳什均衡中,每个玩家的策略在考虑其他玩家的决策时都是最优的。每个玩家都会获胜,因为每个人都会得到他们想要的结果。
  • 囚徒困境是一个常见的博弈论例子,它充分展示了纳什均衡的效果。
  • 纳什均衡通常与主导策略一起讨论,主导策略指出,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。
  • 纳什均衡并不总是意味着选择最优策略。
    1

三、理解纳什均衡

   纳什均衡以其发明者美国数学家约翰·纳什的名字命名。它被认为是博弈论中最重要的概念之一,它试图从数学和逻辑上确定游戏参与者应采取的行动,以确保自己获得最佳结果。

   纳什均衡之所以被认为是博弈论中如此重要的概念,是因为它的适用性。纳什均衡可以纳入从经济学到社会科学等广泛的学科。

   为了快速找到纳什均衡或查看它是否存在,请向其他玩家透露每个玩家的策略。如果没有人改变他们的策略,那么纳什均衡就被证明了。

四、纳什均衡与主导策略

   纳什均衡经常与占优策略进行比较,两者都是博弈论中的策略。纳什均衡指出,参与者的最佳策略是在了解对手策略的情况下坚持其初始策略,并且所有参与者都保持相同的策略。

   主导策略断言,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。

   所有博弈论模型只有当参与的玩家都是“理性主体”时才有效,这意味着他们渴望特定的结果,试图选择最优结果,在决策中考虑不确定性,并在选择上采取现实态度。
   这两个术语相似但略有不同。纳什均衡表明,如果任何一个玩家改变策略而其他所有玩家都保持策略,则不会有任何收获。主导策略断言,无论其他玩家选择了什么策略,玩家都会选择一种能够带来最佳结果的策略。主导策略可以包含在纳什均衡中,而纳什均衡可能不是游戏中的最佳策略。

五、纳什均衡的例子

   想象一下汤姆和萨姆之间的游戏。在这个简单的游戏中,两位玩家都可以选择策略 A,获得 1 美元,或者策略 B,损失 1 美元。从逻辑上讲,两位玩家都会选择策略 A,并获得 1 美元的收益。

   如果您向 Tom 透露 Sam 的策略,反之亦然,您会发现没有玩家偏离原始选择。了解其他玩家的举动意义不大,也不会改变任何一方的行为。结果 A 代表纳什均衡。

纳什均衡示例
在这里插入图片描述

六、囚徒困境

   囚徒困境是博弈论中分析的一种常见情况,可以运用纳什均衡。在这个博弈中,两名罪犯被捕,各自被单独监禁,无法与对方交流。检察官没有证据定罪这对罪犯,所以他们给每个囚犯一个机会,要么背叛对方,作证对方犯了罪,要么合作,保持沉默。

   如果两名囚犯互相背叛,则每人将被判处五年监禁。如果 A 背叛 B,但 B 保持沉默,则囚犯 A 将被释放,囚犯 B 将被判处十年监禁,反之亦然。如果双方都保持沉默,则每人将被判处一年监禁。

   在这个例子中,纳什均衡是两个参与者互相背叛。尽管相互合作会带来更好的结果,但如果一个囚犯选择相互合作而另一个囚犯不选择,那么其中一个囚犯的结果会更糟。

七、如何原理和应用

7.1 博弈论中的纳什均衡是什么?

   博弈论中的纳什均衡是指玩家在考虑到对手的策略后,将继续执行自己选择的策略,而没有偏离该策略的动机。

7.2 如何找到纳什均衡?

   要在游戏中找到纳什均衡,就必须模拟出每种可能的情况以确定结果,然后选择最佳策略。在双人游戏中,这将考虑两个玩家可以选择的可能策略。如果两个玩家都不了解所有信息并改变策略,则会出现纳什均衡。

7.3 为什么纳什均衡很重要?

   纳什均衡很重要,因为它可以帮助玩家根据自己的决策和其他相关方的决策确定最佳收益。纳什均衡可以应用于生活的方方面面,从商业策略到卖房,从战争到社会科学等等。

7.4 如何计算纳什均衡?

   没有特定的公式来计算纳什均衡。可以通过对给定游戏中的不同场景进行建模来确定每个策略的收益以及哪种策略是最佳选择。

7.5 纳什均衡的局限性是什么?

   纳什均衡的主要限制是它要求玩家了解对手的策略。只有当玩家了解对手的策略并选择继续使用当前策略时,纳什均衡才会发生。

   在大多数情况下,例如在战争中(无论是军事战争还是竞价战争),个人很少知道对手的策略或他们想要的结果。与主导策略不同,纳什均衡并不总是导致最优结果。它只是意味着个人根据他们掌握的信息选择最佳策略。

   此外,在与相同对手进行的多场游戏中,纳什均衡并没有考虑过去的行为,而过去的行为往往可以预测未来的行为。

八、后记

   纳什均衡是博弈论的一个组成部分,它断言玩家在了解对手的策略的情况下会继续使用他们选择的策略,因为他们没有改变路线的动机。纳什均衡可以应用于各种现实生活中的情况,根据你的决定以及对对手决定的了解来确定在某种情况下的最佳收益是什么。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/696360.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Ubuntu 22.04安装cuda及Pytorch教程

文章目录 1、安装显卡驱动2、安装CUDA3、安装cuDNN4、安装pyTorch5、卸载CUDA参考资料 服务器重装系统后,需要重新安装显卡驱动、cuda及Pytorch等,有些步骤容易忘记,这里记录一下。这里我的服务器配置以及安装版本的情况如下: 服…

OpenGauss数据库-5.数据更新

第1关:插入数据 gsql -d postgres -U gaussdb -W "passwd123123" create table student (id integer primary key,name char(20),age integer ); insert into student values(1,"lily",20),(2,lily,21),(3,marry,19); 第2关:删除数…

【只是查漏补缺】关于动力节点2024版java新课程

反编译命令 javap进行反编译操作,例如:javap Test;使用jd-gui.exe来实现反编译。 二进制数据是采用0和1来表示,则换算单位肯定为2的n次方,而2的10次方恰好等于1024,所以就使用了1024来作文文件存储的换算单…

纯理论容器实现的原理

近期在复习容器的原理,希望这篇文章可以帮助到大家。 一、什么是容器? 容器本质上就是主机上的一个进程。这个进程拥有自己的用户空间并且和主机共享内核空间。 容器内的进程可以通过系统调用与内核进行交互,使用内核提供的各种功能和资源。…

数据可视化Python实现超详解【数据分析】

各位大佬好 ,这里是阿川的博客,祝您变得更强 个人主页:在线OJ的阿川 大佬的支持和鼓励,将是我成长路上最大的动力 阿川水平有限,如有错误,欢迎大佬指正 Python 初阶 Python–语言基础与由来介绍 Python–…

【PowerDesigner】创建和管理CDM之新建实体

目录 🌊1. PowerDesigner简介 🌍1.1 常用模型文件 🌍1.2 PowerDesigner使用环境 🌊2. 创建和管理CDM 🌍​​​​​​2.1 新建CDM 🌍2.2 新建实体 🌊1. PowerDesigner简介 🌍1…

Innodb Buffer Pool缓存机制(三)Innodb Buffer Pool内部组成

一、控制块缓存页 Buffer Pool中默认的缓存页大小和在磁盘上默认的页大小是一样的,都是16KB。为了更好的管理这些在Buffer Pool中的缓存页,InnoDB为每一个缓存页都创建了一些所谓的控制信息,这些控制信息包括该页所属的表空间编号、页号、缓存…

11.链表

数组的分类:便于遍历 静态数组:int arr[10]数据过多造成空间溢出,数据过小空间浪费 动态数组:malloc calloc realloc 合理利用空间不能快捷的插入或删除数据(会涉及到大量的数据移动) 知识点一&#xff1…

【Python】使用pip安装seaborn sns及失败解决方法与sns.load_dataset(“tips“)

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。 🤓 同时欢迎大家关注其他专栏,我将分享Web前后端开发、人工智能、机器学习、深…

system 和 exec 的区别

在 linux 中,使用 system 和 exec 都可以执行一个程序或者执行一个命令。两者的区别如下: system 中创建了一个子进程,在子进程中执行用户的命令,子进程执行完毕之后,system 会返回。exec 不会创建子进程,…

pdf的压缩该怎么做?快速在线压缩pdf的方法

pdf文件是现在很常用的一种文件格式,有很多的文件内容都可以通过这种格式来展示内容,比如一些通知文件、设计图、个人信息等等,文件的内容越多就会越大,在使用的时候经常会受到一定的限制。那么有什么方法能够快速的将pdf文件变小…

计算机提示msvcp120.dll如何修复,7个不同方法分享

msvcp120.dll 是 Microsoft Visual C Redistributable 的一个关键组件,它包含了 C 运行时库,这些库对基于 Visual C 编写的应用程序至关重要。当应用程序运行时,msvcp120.dll 会被加载到内存中以提供必要的函数和类支持。 一、msvcp120.dll功…

详解python中的pandas.read_csv()函数

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。 🤓 同时欢迎大家关注其他专栏,我将分享Web前后端开发、人工智能、机器学习、深…

从GPU到ASIC,博通和Marvell成赢家

ASIC市场上,博通预计今年AI收入将达到110亿美元以上,主要来自与Google和Meta的合作;Marvell预计2028年AI收入将达到70亿至80亿美元,主要来自与Amazon和Google的合作。 随着芯片设计和系统复杂性的增加,科技大厂将更多地…

初阶 《函数》 2.C语言中函数的分类

2.C语言中函数的分类 1.库函数 2.自定义函数 2.1 库函数 为什么会有库函数? 1.我们知道在我们学习C语言编程的时候,总是在一个代码编写完成之后迫不及待的想知道结果,想把这个结果打印到我们的屏幕上看看。这个时候我们会频繁的使用一个功能…

排序-快排算法对数组进行排序

目录 一、问题描述 二、解题思路 1.初始化 2.将右侧小于基准元素移到左边 3.将左侧大于基准元素移到右边 4.重复执行上面的操作 5.对分好的左、右分区再次执行分区操作 6.最终排序结果 三、代码实现 四、刷题链接 一、问题描述 二、解题思路 快排算法实现数组排序&am…

配置 JDK 和 Android SDK

目录 一、配置JDK 1. 安装 JDK 2. JDK 环境配置 3. JDK的配置验证 二、配置 adb 和Android SDK环境 1、下载 2、配置 Android SDK 环境 一、配置JDK 1. 安装 JDK 安装链接:Java Downloads | Oracle 我安装的是 .zip ,直接在指定的文件夹下解压就…

产品创新:驱动企业增长的核心动力

在当今快速变化的市场环境中,产品创新已成为企业生存和发展的关键。产品创新不仅涉及全新产品或服务的开发,也包括对现有产品或服务的持续改进和优化。本文将深入探讨产品创新的定义、重要性以及如何通过创新驱动企业增长,并结合实际案例进行…

Redis系列之淘汰策略介绍

Redis系列之淘汰策略介绍 文章目录 为什么需要Redis淘汰策略?Redis淘汰策略分类Redis数据淘汰流程源码验证淘汰流程Redis中的LRU算法Redis中的LFU算法 为什么需要Redis淘汰策略? 由于Redis内存是有大小的,当内存快满的时候,又没有…

IO进程线程(十一)进程间通信 消息队列

文章目录 一、IPC(Inter-Process Communication)进程间通信相关命令 :(一)ipcs --- 查看IPC对象(二)获取IPC键值(三)删除IPC对象的命令(四)获取IPC键值的函数1. 函数定义…