运筹说 第130期 | 对策论引言

通过对对策论基础知识进行梳理和总结,小编绘制了《对策论思维导图》,如下图所示,对策论章节一共包含4个小节。

第1小节是对策论引言。介绍了对策论的基本概念,包含对策行为和对策论、对策现象的三要素、对策问题举例及对策的分类。

第2小节是矩阵对策的基本理论。介绍了矩阵对策的纯策略、矩阵对策的混合策略和矩阵对策的基本定理。

第3小节是矩阵对策的解法。分别介绍了图解法、方程组法和线性规划法3种矩阵对策的求解方法。

第4小节是其他类型对策简介。介绍了二人无限零和对策、多人非合作对策以及合作对策。

图片

01 对策行为和对策论

1、对策行为

在日常生活中经常可以看到一些具有对抗或竞争性质的现象,如下棋、打牌、体育比赛等。在战争中的双方,都力图选取对自己最有利的策略,千方百计去战胜对手;在政治方面,国际间的谈判,各种政治力量间的较量,各国际集团间的角逐等都无不具有对抗性;在经济活动中,各国之间的贸易摩擦、企业之间的竞争等;举不胜举。

对策行为是具有竞争或对抗性质的行为。在这类现象中,参加竞争或对抗的各方各自具有不同的利益和目标。为了达到各自的利益和目标,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最有利或最合理的方案。对策论(game theory)就是研究对策现象中各方是否存在最合理的行动方案,以及如何找到最合理的行动方案

2、对策论

对策论又称竞赛论或博弈论,是研究具有对抗或竞争性质现象的数学理论和方法。它既是现代数学的一个新分支,也是运筹学的一个重要学科。对策论发展的历史并不长,但由于它所研究的现象和政治、经济、军事活动乃至一般的日常生活等有着密切联系,并且处理问题的方法具有明显特色,所以日益引起广泛的重视。特别是从20世纪50年代纳什(Nash)建立了非合作博弈的“纳什均衡”理论后,标志着对策论发展的一个新时期的开始。对策论在这一新时期发展的一个突出特点是,博弈的理论和方法被广泛应用于经济学的各个学科,成功地解释了具有不同利益的市场主体,在不完备信息条件下,如何实现竞争并达到均衡。正是由于纳什在对策论研究和将对策论应用于经济学研究方面的突出贡献,使得他1994年获得了诺贝尔经济学奖。他提出的著名的纳什均衡概念在非合作博弈理论中起着核心作用,为对策论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础。

在我国古代,“齐王赛马”就是一个典型的对策论研究的例子。

战国时期,有一天齐王提出要与田忌赛马,双方约定:从各自的上、中、下三个等级的马中各选一匹参赛;每匹马均只能参赛一次;每一次比赛双方各出一匹马,负者要付给胜者千金。已经知道的是,在同等级的马中,田忌的马不如齐王的马,而如果田忌的马比齐王的马高一等级,则田忌的马可取胜。当时,田忌手下的一个谋士给他出了个主意:每次比赛时先让齐王牵出他要参赛的马,然后来用下马对齐王的上马,用中马对齐王的下马,用上马对齐王的中马。比赛结果,田忌二胜一负,夺得千金。由此看来,两个人各采取什么样的出马次序对胜负是至关重要的。

 02 对策现象三要素

为对策问题进行数学上的分析,需要建立对策问题的数学模型,称为对策模型。根据所研究问题的不同性质,可以建立不同的对策模型。但不论对策模型在形式上有何不同,都必须包括以下3个基本要素

1、局中人

一个对策中有权决定自己行动方案的对策参加者称为局中人,通常用I表示局中人的集合。如果有n个局中人,则I={1, 2, …, n}。一般要求一个对策中至少要有两个局中人。如在“齐王赛马”的例子中,局中人是齐王和田忌。

2、策略集

对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人ii∈I都有自己的策略集Si。一般,每一局中人的策略集中至少应包括两个策略。

在“齐王赛马”的例子中,如果用(上,中,下)表示以上马、中马、下马依次参赛,就是一个完整的行动方案,即为一个策略。可见,局中人齐王和田忌各自都有6个策略:(上,中,下)、(上,下,中)、(中,上,下)、(中,下,上)、(下,中,上)、(下,上,中)。

3、赢得函数 / 支付函数(payoff function)

一个对策中,每一局中人所出策略形成的策略组称为一个局势,即若si是第i个局中人的一个策略,则n个局中人的策略形成的策略组s=(s1, s2, …, sn)就是一个局势。若记S为全部局势的集合,则当一个局势s出现后,应该为每个局中人i规定一个赢得值(或所失值)Hi(s)。显然,Hi(s)是定义在S上的函数,称为局中人i的赢得函数。在“齐王赛马”中,局中人集合为I={1,2},齐王和田忌的策略集可分别用S1={a1, a2, a3, a4, a5, a6}和S2={β1, β2, β3, β4β5β6}表示。这样,齐王的任一策略ai和田忌的任一策略βj就构成了一个局势sij。如果a1=(上,中,下),β1=(上,中,下),则在局势s11下齐王的赢得值为H1(s11)=3,田忌的赢得值为H2(s11)=-3,如此等等。

一般地,当局中人、策略集和赢得函数这3个要素确定后,一个对策模型也就给定了。

03 对策问题举例及对策的分类

1、囚徒困境

关于博弈论,流传最广的是一个叫做“囚徒困境”的故事。这个博弈是1950年塔克(Tucker)提出的。两个嫌疑犯作案后被警察抓住,分别关在不同的屋子里接受审讯。警察知道两人有罪,但缺乏足够的证据。根据法律,如果两个人都承认此案是他们干的,则每人各判刑7年;如果两人都不承认,则由于证据不足,两人各判刑1年;如果只有一人承认,则承认者予以宽大释放,而不承认者将判刑9年。因此,对两个囚犯来说,面临着一个在“承认”和“不承认”这两个策略间进行选择的难题。二者的得益矩阵如表1所示:

囚徒困境案例的前提假设如下:

①他们具备纯粹的博弈理性,即他们以自身利益最大化为目标,了解游戏规则,能清晰推导出自身选择的后果及对方选择的后果。

②不存在兄弟情谊,两人选择的损益仅限于刑期的长短。

③俩人的选择不会对他们未来的声誉造成影响。

图片

在(坦白,坦白)这个组合中,囚徒1和囚徒2都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

2、对策的分类

为了便于对不同的对策问题进行研究,对策论中将问题根据不同方式进行了分类。通常的分类方式有:

①根据局中人的个数,分为二人对策和多人对策;

②根据各局中人的赢得函数的代数和是否为零,分为零和对策与非零和对策;

③根据各局中人间是否允许合作,分为合作对策和非合作对策;

④根据局中人的策略集中的策略个数,分为有限对策和无限对策。

此外,还有许多其他的分类方式,例如根据策略的选择是否与时间有关,可分为静态对策和动态对策;根据对策模型的数学特征,可分为矩阵对策、连续对策、微分对策、阵地对策、凸对策、随机对策等,如下图所示。

图片

在众多对策模型中,占有重要地位的是二人有限零和对策(finite two-person zero-sum game),又称为矩阵对策。这类对策是到目前为止在理论研究和求解方法方面都比较完善的一个对策分支。矩阵对策可以说是一类最简单的对策模型,其研究思想和方法十分具有代表性,体现了对策论的一般思想和方法,且矩阵对策的基本结果也是研究其他对策模型的基础。基于上述原因,本章将着重介绍矩阵对策的基本内容,只对其他对策模型作简要介绍。

以上就是对策论引言的全部内容了,通过本期学习,大家是否对对策论有了一个初步的认识呢?下一期小编将带大家学习矩阵对策的基本理论,敬请关注!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/938217.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Windows 与 Linux 下 Ping IPv6 地址 | 常用网络命令

注:本文为网络命令相关文章合辑。 未整理去重。 一、IPv6 概述 IPv6 即 “Internet 协议版本 6”,因 IPv4 地址资源面临耗尽问题而被引入以替代 IPv4。IPv6 则提供了理论上多达 2 128 2^{128} 2128 个地址,有效解决地址不足困境。 IPv6 具…

密码学——密码学概述、分类、加密技术(山东省大数据职称考试)

大数据分析应用-初级 第一部分 基础知识 一、大数据法律法规、政策文件、相关标准 二、计算机基础知识 三、信息化基础知识 四、密码学 五、大数据安全 六、数据库系统 七、数据仓库. 第二部分 专业知识 一、大数据技术与应用 二、大数据分析模型 三、数据科学 密码学 大数据…

Android Studio、JDK、AGP、Gradle、kotlin-gradle-plugin 兼容性问题

文章目录 问题:解决办法:gradle与 java的版本兼容AGP与Gradle的版本兼容kotlin 与 jvm 的版本兼容KGP、Gradle、AGP兼容关系kotlin 与 java 的编译版本配置 问题: 你从githb上clone了一个项目,本地跑的时候,各种报错。…

ChatGPT搜索全新升级,向全体用户开放,近屿智能助力AI行业发展

12月17日,OpenAI在第八天直播中正式宣布ChatGPT搜索功能全面升级,并即日起对所有ChatGPT用户开放。此次更新不仅带来了显著的性能提升,还引入了多项突破性功能,如更快的搜索速度、全新的地图体验以及YouTube视频嵌入,为…

VSCode编辑+GCC for ARM交叉编译工具链+CMake构建+OpenOCD调试(基于STM32的标准库/HAL库)

本文以【STM32F103ZET6】单片机作为示例来进行演示,标准库/HAL库的工程是通用的,修改CMakeLists.txt里面的源文件和头文件引用部分即可。 更多细节请参考【VSCode编辑GCC for ARM交叉编译工具链Makefile构建OpenOCD调试(基于STM32的标准库&am…

ResNet网络:深度学习中的革命性架构

目录 ​编辑 引言 ResNet网络的特点 1. 残差块(Residual Block) 2. 恒等映射(Identity Mapping) 3. 深层网络训练 4. Batch Normalization 5. 全局平均池化 6. 灵活的结构 ResNet的应用案例 ResNet的研究进展 实战案例…

Axure9设置画布固定

在使用AxureRP9设计原型时,如果遇到画布在拖动时变得难以控制,可以尝试在Windows系统中通过‘文件’>‘首选项’,或在Mac系统中通过‘AxureRP9’>‘偏好设置’进行设置,以稳定画布的行为。 现象 页面底层的画布&#xff0…

景联文科技入选中国信通院发布的“人工智能数据标注产业图谱”

近日,由中国信息通信研究院、中国人工智能产业发展联盟牵头,联合中国电信集团、沈阳市数据局、保定高新区等70多家单位编制完成并发布《人工智能数据标注产业图谱》。景联文科技作为人工智能产业关键环节的代表企业,入选图谱中技术服务板块。…

ESlint代码规范,手动与自动修复

规范说明 规则参考 - ESLint - 插件化的 JavaScript 代码检查工具 规范说明 ​ ​ 可看到是main.js文件报错分别是第三行第30个字符,以及第七行第一个字符 后面则是规范说明,可以根据说明查找相应的规范 一.手动修正 ctrl f 可以搜索 二.自动修正 …

一条线上的点

给你一个数组 points &#xff0c;其中 points[i] [xi, yi] 表示 X-Y 平面上的一个点。求最多有多少个点在同一条直线上。 提示&#xff1a; 1 < points.length < 300points[i].length 2-104 < xi, yi < 104points 中的所有点 互不相同 解析&#xff1a;使用斜…

wxpython图形用户界面编程

wxpython图形用户界面编程 一、wxpython的基础 1.1 wxpython的基础 作为图形用户界面开发工具包 wxPython&#xff0c;主要提供了如下 GUI 内容&#xff1a; 窗口。控件。事件处理。布局管理。 1.2 wxpython的类层次机构 1.3 wxpython的安装 Windows 和 macOS 平台安装&a…

【优选算法篇】位运算小课堂:从入门到精通的奇妙之旅(上篇)

文章目录 须知 &#x1f4ac; 欢迎讨论&#xff1a;如果你在学习过程中有任何问题或想法&#xff0c;欢迎在评论区留言&#xff0c;我们一起交流学习。你的支持是我继续创作的动力&#xff01; &#x1f44d; 点赞、收藏与分享&#xff1a;觉得这篇文章对你有帮助吗&#xff1…

pytest入门九:feature

fixture是pytest特有的功能&#xff0c;用以在测试执行前和执行后进行必要的准备和清理工作。使用pytest.fixture标识&#xff0c;定义在函数前面。在你编写测试函数的时候&#xff0c;你可以将此函数名称做为传入参数&#xff0c;pytest将会以依赖注入方式&#xff0c;将该函数…

Day9 神经网络的偏导数基础

多变量函数与神经网络 在神经网络中&#xff0c;我们经常遇到多变量函数。这些函数通常描述了网络的输入、权重、偏置与输出之间的关系。例如&#xff0c;一个简单的神经元输出可以表示为&#xff1a; z f ( w 1 x 1 w 2 x 2 … w n x n b ) z f(w_1x_1 w_2x_2 \ldots…

sg-exam:Star 2.2k,一套完善的在线教育平台,支持在线考试、在线学习,教育项目用它就没有错~~

​嗨&#xff0c;大家好&#xff0c;我是小华同学&#xff0c;关注我们获得“最新、最全、最优质”开源项目和高效工作学习方法 sg-exam是一个基于Java语言的在线考试系统&#xff0c;它集成了试卷管理、试题管理、考试安排、在线作答、自动阅卷等功能。该项目旨在帮助教育机构…

ArkTS中string和String/number和Number类型大小写的区别

ArkTS和TypeScript类似&#xff0c;string 和 String&#xff0c;number 和 Number 之间有一些重要的区别&#xff1a; 基本类型与对象类型 基本类型 (string, number)&#xff1a; string 和 number 是基本数据类型&#xff0c;用于表示原始值。例如&#xff1a;let str: str…

Ubuntu22.04切换gcc版本教程

在编译安装程序的时候,由于gcc版本过高,导致编译无法通过,需要降低gcc版本。 一、安装gcc版本 根据自己的需求安装gcc版本。 sudo apt update sudo apt install gcc-10 g++-10二、切换gcc版本 sudo update-alternatives --install /usr/bin/gcc gcc

c++领域展开第四幕——类和对象(上篇收尾 this指针、c++和c语言的初步对比)超详细!!!!

文章目录 前言一、this指针二、c和c语言的初步对比总结 前言 上篇我们初步学习了类的基本概念以及实例化 今天我们来学习类的构造以及析构还有类的默认成员函数&#xff0c;类和对象这一部分都会有点难 跟着我一起来吧 一、this指针 Date类中有 Init 与 Print 两个成员函数&…

python | linux | ModuleNotFoundError: No module named ‘WFlib‘ |找不到模块

问题&#xff1a; (base) beautyby521-7:~/Website-Fingerprinting-Library-master$ bash scripts/NetCLR.sh Traceback (most recent call last):File "/home/beauty/Website-Fingerprinting-Library-master/exp/pretrain.py", line 8, in <module>from WFli…

联发科MTK8788_MT8788安卓核心板安兔兔跑分_安卓主板方案商

MT8788安卓核心板具有集成的蓝牙、fm、WLAN和gps模块&#xff0c;是一个高度集成的基带平台&#xff0c;包括调制解调器和应用处理子系统&#xff0c;启用LTE/LTE-A和C2K智能设备应用程序。该芯片集成了工作在2.0GHz的ARM Cortex-A73、最高可达2.0GHz的ARM Cortex-A53和功能强大…