博弈论学习笔记(2)——完全信息静态博弈

news2025/7/22 5:43:57

 前言

这部分我们学习的是完全信息静态博弈,主要内容包括博弈论的基本概念、战略式博弈、Nash均衡、Nash均衡解的特性、以及Nash均衡的应用。

零、绪论

1、什么是博弈论

1)博弈的定义

博弈论:研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。

完全理性的个人或群体发生直接相互作用的情形。博弈论研究这种情形下个人或群体的决策以及这种选择所导致的结果的理论。

2)博弈与传统决策的区别

传统的决策是从若干备选方案中选择一个有利方案,如出门带伞问题就是一个决策问题。而博弈是研究决策主体的行为发生直接相互作用时候的决策,在博弈中,决策主体的选择不仅与决策主体的偏好结构有关,而且与其他人的选择有关。

2、如何研究博弈论

1)完全理性假设的主要表现
  1. 参与人的偏好具有一致性

  2. 参与人对面临的决策问题具有完全的理解

  3. 参与人具有强大的逻辑推理能力和计算能力

2)共同知识是什么

如果有一种每个参与人都知道的“信息或事件”,并且每个参与人都知道每个参与人都知道它,每个参与人都知道每个参与人都知道每个参与人都知道它,……,如此等等,那么这种“信息”对于参与人而言就是共同知识。显然关于一个事件的共同知识这个概念比人们所熟悉的“相互知识”需要更多的信息,共同知识是无穷尽的“相互知识”。

有了参与人完全理性和参与人完全理性是共同知识这两个假设,就可以确保博弈过程的分析具有逻辑上的一致性。

3、博弈论研究的目的

1)什么是博弈问题的解

所有参与人都预测到的博弈结果,即参与人的一致性预测

将Nash均衡作为博弈问题的一致性预测,也就是博弈问题的解。

4、博弈论的主要分类

1)合作博弈与非合作博弈

决策主体的行为相互作用时,当事人能否达成一个具有约束力的协议

2)静态博弈与动态博弈

根据参与人的先后顺序。

3)完全信息博弈与不完全信息博弈

参与人对其他参与人的特征,战略空间及支付函数在博弈开始时是否已知。

4)完美信息博弈与不完美信息博弈

注意完美信息博弈与完全信息博弈的比较

一、战略式博弈

1、基本概念

1)参与人

博弈中选择行动以最大化自己效用的决策主体

2)行动

参与人在博弈的某个时点的决策变量

3)行动组合(行动断面)

博弈中每个参与人采取一个行动的一种博弈情形

4)战略

参与人的行动规则,规定了参与人在每一种轮到自己行动的情形下,应该采取的行动。它是与博弈行动顺序相关的行动有序集,战略是行动的规则,而不是行动本身,作为行动规则,战略必须是完备的。

【特例】

在完全信息静态博弈中,不存在决策时序上的差异,所有参与人在同一决策时点即博弈开始那一时刻决策,因此所有参与人面临的决策情形只有一种。参与人的战略集与行动集相同。

5)战略组合

博弈中每个参与人采取战略组合中相应战略Si的一种博弈情形。

6)支付

参与人在博弈中的所得。参与人的支付就可表示为一种特定博弈情形(如行动组合或战略组合)下参与人得到的确定效用水平或期望效用水平。

7)信息

参与人所具有的有关博弈的所有的知识。

8)完美信息与完全信息

9)结果

博弈分析者所感兴趣的所有东西,如:均衡策略组合、均衡行动组合、均衡支付等。

10)均衡

所有参与人的最优的战略组合。在博弈论中,均衡是指所有个人的买卖规则(战略)的组合,均衡价格是这种战略组合的结果。

2、战略式博弈

1)战略式博弈的定义

战略式博弈是博弈问题的一种规范性描述,亦称为标准式博弈。

战略式博弈是一种相互作用的决策模型,这种模型假设每个参与人仅选择一次行动或行动计划(战略),并且这些选择是同时进行的。

二、Nash均衡

1、占优均衡

1)“囚徒困境”

理性的前提假设,使得每个小偷都有背离“抵赖,抵赖”的意愿,因此,小偷的选择会偏离“抵赖”,而选择“坦白”。

无论对方如何选择,每个小偷都会选择“坦白”,可以发现战略“坦白”具有这样的特点:无论对方怎样选择(选择“坦白”或者“抵赖”),“坦白”总是理性小偷的最优战略,而与其他小偷的选择无关。

在学习占优行为、重复剔除劣战略行为这章之前,不妨做一做下面这道题。

【收益矩阵的参数范围问题】

题解】

2)占优战略

参与人的最优战略与其他参与人的选择无关。无论其他参与人选择什么战略,参与人的最优战略总是唯一的。这样的最优战略我们称为“占优战略”(dominant strategy)

3)占优行为

在一个博弈问题中,如果某个参与人具有占优战略,那么只要这个参与人是理性的,他肯定就会选择他的占优战略。参与人的这种选择行为我们称为占优行为。占优行为是理性参与人选择行为的最基本特征。

4)占优战略均衡

如果所有的参与人都具有占优战略,那么只要参与人是理性的,肯定都会选择自己的占优战略。

博弈的结果就由参与人的占优战略共同决定。像这种由参与人的占优战略共同决定的博弈结果,称为占优战略均衡(dominant-strategy equilibrium)。

2、重复剔除劣战略行为

1)劣战略

2)剔除劣战略行为

3)重复剔除的占优均衡

4)弱劣战略

5)均衡结果是否与劣战略的剔除顺序有关

一般而言,如果每次剔除的是严格劣战略,均衡结果与剔除顺序无关;如果剔除的是弱战略,均衡结果可能与剔除顺序有关

在重复剔除劣战略的过程中,需要注意:

  • 重复剔除劣战略均衡要求“理性”为“共同知识”

  • 一般而言,参与人的战略空间越大,需要剔除的步骤就越多,对“理性”的要求就越严格。

3、Nash均衡

1)什么是博弈问题的解
  1. 博弈分析是在博弈问题的结构参与人完全理性为共同知识下进行的;

  2. 对博弈问题的求解,等同于完全理性的参与人对博弈的求解;

  3. 博弈问题的解:所有参与人的一致性预测。

2)什么是Nash均衡

3)求解Nash均衡的方法

划线法】

在两人博弈中,相互构成最优战略的战略组合就是Nash均衡。

箭头法】

在两人博弈中,一个战略组合只有在两个参与人都不愿意偏离的情况下才能构成Nash均衡。计算步骤如下:

  1. 对于每个战略组合,检查是否有参与人会偏离

  2. 找出没有参与人会偏离的战略组合

4)Nash均衡 VS 占优战略均衡 VS 重复剔除的占优均衡

4、混合战略Nash均衡

1)混合战略

以一定的概率分布来选择自己战略的行为,在博弈中称之为混合战略。与此相对应,参与人在给定信息下只选择一种特点战略,成为纯战略。

混合战略解释了一个参与人对其他参与人所采取的行动的不确定性,它描述了参与人在给定信息下以某种概率分布随机地选择不同的行动或战略混合战略为定义在纯战略集上的一个概率分布。

2)混合战略的支付

对于混合战略,参与人的支付是不确定的,此时,参与人关心的是支付的期望收益

3)混合战略与混合战略组合

4)纯战略-混合战略 VS 完全混合战略

5)混合战略Nash均衡

6)最优混合战略的特性

7)支集

8)最优反应的引理

5、混合战略Nash均衡的求解

1)等值法

【举例说明】

2)Wilson奇数定理

3)支撑是什么

掌握支撑的写法

4)支撑求解法

支撑法求解过程中可能遇到的问题:

5)支撑法求解典例

6)支撑法的问题,计算量大

用剔除劣战略的方法,排除支撑!!!

7)规划求解法

8)规划法求解典例

从理论上来讲,这两种方法对有限战略式博弈都是适用的,但从以上例子的求解过程来看,都存在着计算过程复杂,计算量大等问题,尤其是对多人(即参与人人数大于2)博弈问题。当参与人人数大于2时,使用支撑法,就必须求解非线性方程组;而使用规划法,就必须求解一个无论是目标函数还是约束条件都是非线性的规划问题。

三、Nash均衡解的特性

1、Nash均衡的意义

1)一致性预测

Nash均衡是博弈中的一种一致性预测——如果所有参与人预测一个特点的Nash均衡会出现,那么所有参与人都不会偏离,这个Nash均衡就会出现。

2)Nash均衡的特点

对任一个参与人i,在给定其他参与人选择的情况下,均衡战略是自己的最优战略

3)一般解的定义

2、Nash均衡解的存在性

1)不同均衡概念之间的关系

2)Nash均衡的存在性定理

每一个有限的战略式博弈至少存在一个Nash均衡(包括纯战略和混合战略Nash均衡)。

3、Nash均衡解的多重性

1)什么是Nash均衡的多重性问题

传统的博弈论研究的问题或许并不是如何找到博弈的Nash均衡(即存在性问题),而是在博弈的多个Nash均衡中选择一个合理的均衡(即多重性问题)

但事实上,当在一个博弈中存在多个Nash均衡时,目前还没有一个一般的理论能证明哪个Nash均衡结果一定会出现。

2)如何解决Nash均衡的多重性问题

1、均衡精炼的方法

从博弈解的定义入手,在Nash均衡的基础上,通过定义更加精炼的博弈解如子博弈精炼Nash均衡、精炼贝叶斯Nash均衡等,剔除Nash均衡中不合理的均衡。这种解决Nash均衡多重性的思路具有普遍性,对所有的博弈问题都适用;

均衡精炼的方法可以称为规范式的方法,其它的方法称为非规范式的方法。

2、非规范式的方法

  • 焦点效应

  • 相关均衡

3)什么是焦点效应

在一个具有多重均衡的博弈中,趋向于将参与人的注意力集中到一个均衡的任何事情,都可能使参与人全都预期并随之实行这个均衡,就像一个自行应验的预言一样。

Schelling将这种现象称之为焦点效应 (focal-point effect)。

在焦点效应中具有某种使它显著地区别于所有其它均衡性质的均衡,被称为“焦点均衡”(focal equilibrium)。

结合“性别战”的例子理解,详见PPT

  1. 博弈的现实状况或背景也会将博弈引向特定的均衡。

  2. 此外,“焦点效应”在某些博弈中还可能由均衡战略自身的性质来确定。

但是需要注意的是,聚焦因素只有针对Nash均衡时才可能是有效的。

4)什么是廉价磋商

类似于“性别战”中这种博弈之前进行的沟通或商议,在博弈分析中称之为具有通信的博弈或“廉价磋商”(cheap talk)。

在博弈分析中,将参与人在博弈开始之前,不花任何成本所达成的、对参与人没有约束力的协议称为“廉价磋商”。

5)什么是相关均衡

在“性别战”博弈中,夫妻双方通过长期的共处,在周末娱乐项目的选择上可能会形成这样的习惯:双方根据周末的天气状况来选择娱乐项目。

便得到了一种解决Nash均衡多重性问题的方式:让参与人根据某个共同观测到的信号(如“性别战”中的天气状况)来选择行动。

如果参与人根据信号选择行动的规则本身能够构成一个Nash均衡,那么参与人就可能会根据某个共同观测到的信号来选择行动。这种由参与人的行动规则所构成的Nash均衡,就是Aumann定义的“相关均衡”(correlated equilibrium)。

四、Nash均衡的应用

1、Cournot寡头竞争模型

该模型研究了寡头垄断市场中,企业追求利润最大化时的决策问题。

1)Cournot模型的基本假设

2)什么是反应函数

上面两个函数分别描述了给定对手的产量,企业 i 应该如何反应,因而分别称为企业1与企业2的反应函数(reaction function)。

反应函数意味着每个企业的最优产量是另一个企业的产量的函数,两个反应函数的交点便是Nash均衡点。

3)Cournot模型的计算

联合垄断市场、“垄断最优的情形在两个寡头的时候是无法达到”等内容详见PPT

2、Bertrand寡头竞争模型

在寡头垄断市场中,企业关心更多的可能是自己的产品在市场上的价格,而不是生产多少产品,也就是说,企业进行的可能是价格竞争而不是产量竞争。

1)Bertrand模型的基本假设

2)Bertrand模型的计算

3)Bertrand悖论

3、Hotelling寡头竞争模型

在Hotelling价格竞争模型中,Hotelling通过引入产品在空间位置上的差异,巧妙地解决了产品的差异形式的描述问题。

在Hotelling价格竞争模型中,产品虽然仍是同质的,但其在空间位置上有差异,因而对于不同位置的消费者其运输成本不同,由此导致产品不再是完全替代的。

1)Hotelling模型的基本假设

2)Hotelling模型的求解

通过引入产品的位置差异,使得企业的均衡利润不再为0,而企业的定价也大于产品的边际成本,在一定程度上解释了Bertrand悖论。

在上面的分析中,我们将两个企业固定于线性城市的两端。如果允许企业在选择价格的同时还可以选择位置,那么两个企业都会选择线性城市的中点(即[0,1]区间的中点),而当两个企业都位于中点时,Bertrand均衡则成为模型的唯一均衡。

4、Hardin公共财产问题

公共资源被过度使用,如草原沙化,渔业资源枯竭以及各种矿产资源的过度开发等等,使人类社会的生存面临着极大的挑战。以G. Hardin的公共财产模型为例,分析人们的利己行为如何使得公共资源被过度使用。

具体求解过程详见PPT

5、混合战略Nash均衡的应用

1)小偷-守卫博弈

2)监督博弈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1157151.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蓝桥杯 (C++ 求和 等差数列 顺子日期 灌溉)

目录 1、求和 题目: 思路: 代码: 1、求和 题目: 思路: 1、首先想到的是两重遍历,累加和。但是当n取200000时,会超时,所以暴力的遍历没有办法通过全部案例。 2、将公式变形得到…

AI先行者第一辑:AI for Science 要坚持高压强投入

‍‍ 中国在AI for Science的基础还非常的薄弱,且非短期内可以提升,需要有一个长期性的计划,也需要有足够的金钱投入和人才队伍建设。 本篇作者褚学森,中国船舶科学研究中心、深海技术科学太湖实验室 研究员;新兴技术研…

代码随想录算法训练营第四十天丨 动态规划part03

343. 整数拆分 思路 看到这道题目,都会想拆成两个呢,还是三个呢,还是四个.... 来看一下如何使用动规来解决。 动态规划 动规五部曲,分析如下: 确定dp数组(dp table)以及下标的含义 dp[i]…

DNS 域名解析系统

文章目录 前言什么是 DNS 域名解析系统为什么需要 DNS 域名解析DNS 是如何发展的hosts 文件维护域名和IP的映射关系DNS 系统(服务器)DNS 镜像系统 前言 前面为大家分享了关于计算机网络中应用层——自定义协议、传输层——UDP、TCP 协议、网络层——IP协…

怎样用ps把人物皮肤磨皮,人物皮肤磨皮怎么办

品牌型号:联想GeekPro 2020 系统: Windows 10 64位专业版 软件版本: portraiture 3.5.6 皮肤瑕疵是人像拍摄中比较容易出现的问题,对于皮肤瑕疵后期一般会使用磨皮的方法处理。那么,怎样用ps把人物皮肤磨皮?ps磨皮的工具丰富多样&#xff…

如何在不同的系统中查找IP地址

知道如何找到你的IP地址是我们大多数人在日常生活中很少使用的技能,但当你需要的时候,这是一种你会感激的技能——尤其是如果你运行的是最好的Wi-Fi路由器之一。 当你从事家庭网络项目时,知道你的IP地址很重要,一旦你知道了基本知…

倾斜摄影三维模型数据几何坐标重建方法分析

倾斜摄影三维模型数据几何坐标重建方法分析 利用几何坐标变换等技术实现倾斜摄影三维模型数据的坐标重建,可以采用以下方法: 1、数据准备:首先,需要获取倾斜摄影影像数据。这些影像应包含多个视角下的拍摄图像,并覆盖…

docker--基本操作

第 1 章 Docker基础 1.1 docker简介 在这一部分我们主要讲两个方面: docker是什么、docker特点 1.1.1 docker是什么 docker是什么? docker的中文解释是码头工人。 官方解释: Docker是一个开源的容器引擎,它基于LCX容器技术&…

最新广告联盟系统源码/实时监控移动广告联盟系统/多元化合作推广方式+支持各种广告效果

源码简介: 最新广告联盟系统源码,作为实时监控移动广告联盟,它有着多元化合作推广方式,并支持各种广告效果。它是最新版本、功能强大的广告联盟系统。 诚丰广告联盟系统的单台服务器每天能够承受至少2000万个PV流量,并…

前端(二十六)——常见的HTTP异常状态码以及正反向代理配置

👵博主:小猫娃来啦 👵文章核心:前端常见的HTTP异常状态码以及正反向代理配置 文章目录 前端常见的HTTP异常状态码404 - 未找到资源403 - 禁止访问304 - 未修改500 - 服务器内部错误 正反向代理配置重要性本地正向代理配置服务器配…

GhostNet(CVPR 2020)学习笔记 (附代码)

论文地址:​​​​​​https://arxiv.org/abs/1911.11907v2 代码地址:https://github.com/huawei-noah/Efficient-AI-Backbones/blob/master/ghostnet_pytorch/ghostnet.py 1.是什么? Ghost module是一种模型压缩的方法,它可以…

韦东山D1S板子——利用xfel工具初始化内置64MB内存,并直接下载程序到内存运行

1、前言 (1)最近使用韦东山老师的D1S板子学习RISC-V架构知识,我是结合《RISC-V体系结构编程与实践》这本书的进行学习,其中韦东山老师对书中的代码做了部分移植,到MMU模块就没有在移植书中代码; &#xff0…

从小白到大牛:Linux嵌入式系统开发的完整指南

Linux嵌入式系统开发一直是一个激动人心的领域,吸引着越来越多的开发者。无论你是初学者还是已经有一些经验的开发者,本文将为你提供从小白到大牛的完整指南,帮助你掌握Linux嵌入式系统开发的关键概念和技能。我们将深入探讨Linux内核、设备驱…

从开发者的角度看K8S中的复合容器模式

就应用设计最佳实践和原则而言,构建复杂的基于容器的架构与编程没有太大区别。本文的目标是使用众所周知的编程原理从开发人员的角度展示三种流行的可扩展性架构模式。 让我们从单一职责原则开始。根据 R. Martin 的说法,“一个类应该只有一个改变的理由…

高性能渲染——详解Html Canvas的优势与性能

本文由葡萄城技术团队原创并首发。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 一、什么是Canvas 想必学习前端的同学们对Canvas 都不陌生,它是 HTML5 新增的“画布”元素&#x…

污水一体处理设备工艺有哪些

污水一体处理设备工艺主要包括以下几种: AO工艺:AO工艺是增加好氧池缺氧池形成硝化-反硝化系统,处理污水中氮含量效率提升。SBR工艺:SBR工艺是按间歇曝气方式运行的活性污泥处理技术,厌氧、好氧、缺氧处于交替状态&am…

选择适合制造业的企业邮箱平台

自2010年成立以来,J公司已从一家小型有限责任公司发展成为全球领先的工业内窥镜研发、生产和销售企业。公司的产品制造采用国际先进技术和一流生产工艺,专业为客户提供定制解决方案,产品已广泛应用于锅检特检、机械制造、发电、石油、燃气、化…

AWS认证考试的那些事

1 为啥会有这个认证 你既然点进来了这个也就不重要了,重要的是怎么拿到他,以SAA-C03为例,从开始到结束我们一起来进行准备 2 考试卷 目前AWS的考试是要交钱的,正常情况下拿到5折劵很容易,比如你之前考过AWS的认证会给…

蓝牙 - LE的Connection Parameters设定

BLE链接参数设定 两个BLE设备建立链接后,可以更改链接参数。Central和Peripheral设备均可发送更新链接参数请求。这个在很多时候是有必要的,因为广播扫描的建立链接过程,和链接保持的过程,对链接参数的要求是不同的。比如设置连接…

LInux之在同一Tomcat下使用不同的端口号访问不同的项目

🎉🎉欢迎来到我的CSDN主页!🎉🎉 🏅我是君易--鑨,一个在CSDN分享笔记的博主。📚📚 🌟推荐给大家我的博客专栏《LInux实战开发》。🎯🎯 …