博弈论笔记

图书馆借阅了张维迎的《博弈论与信息经济学》来系统性地入门博弈论,简单记些笔记。持续更新。

博弈论笔记

注:

  1. 实在不喜欢书中把strategy译为“战略”的说法,此处均称为“策略”。
  2. 更加不喜欢书中把payoff译为“支付”的说法,此处均称为“收益”

0 导论

0.1 经济学相关概念

0.1.1 经济学

传统观点:经济学是研究稀缺资源的有效配置的。

现代观点:经济学是研究人的行为(human behavior)的。

0.1.2 理性人

经济学假定人是理性的。

理性人:理性人是指有一个很好定义的偏好,在面临给定的约束条件下最大化自己的偏好。

理性人的假设使得经济学得以运用数学工具描述人的行为。

注意,理性人与自私人不同。理性人可能是利己主义者,也可能是利他主义者。

0.1.3 合作、冲突与价格制度

理性人在最大化偏好时,需要相互合作(cooperation),而合作中又存在着冲突(conflict)。

价格制度(或称市场制度)是人类为达到合作和解决冲突所发明的最重要的制度之一。

0.1.4 新古典经济学

传统的新古典经济学(neo-classic economics)就是以价格制度为研究对象的,故又称价格理论。

新古典经济学的两个基本假定:

  1. 市场参与者的数量足够多从而市场是竞争性的;
  2. 参与人之间不存在信息不对称问题。

0.1.5 博弈论与信息经济学

但这两个假设在现实中一般无法满足。

首先,现实中买卖双方人数有限,因此市场不可能是完全竞争的。在不完全竞争中,人们之间的行为是直接影响的,人在决策时必须考虑对方的反应,这就是博弈论要研究的问题。

其次,现实中市场参与者之间的信息一般是不对称的,卖家对产品质量的了解通常比买家多。当参与人之间存在信息不对称时,任何一种有效的制度安排必须满足“激励相容”(incentive compatible)或“自选择”(self-selection)条件,这是信息经济学研究的问题。

0.2 博弈论相关概念

0.2.1 博弈论

博弈论(game theory),是研究决策主体的行为发生直接相互作用的时候的决策以及这种决策的均衡问题的。

也就是说,当一个主体,好比说一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

传统微观经济学 博弈论
个人效用函数 个人效用函数只依赖于他自己的选择,而不依赖其他人的选择。 个人效用函数不仅依赖于他自己的选择,而且依赖于他人的选择。
理解 给定价格参数和收入条件,最大化他的效用。对单个人而言,所有其他人的行为都被总结在了价格参数中。不直接面临其它决策主体。 个人的最优选择是其他人选择的函数。

博弈论研究的是在相互外部经济条件下的个人选择问题。

0.2.2 合作博弈与非合作博弈

博弈论可分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。

通常说的博弈论一般指非合作博弈。

合作博弈与非合作博弈之间的区别主要在于人们的行为相互作用时,当事人能否达到一个具有约束力的协议,这就是说,有没有一个binding agreement。如果有,就是合作协议;反之,则是非合作协议。

合作博弈 非合作博弈
约束协议
理性 团队理性(collective rationality 个人理性
目标 效率(efficiency)、公正(fairness)、公平(equality 个人最优决策,可能是有效率的,也可难可能是无效率的

0.2.3 静态博弈与动态博弈

博弈论按参与人行动的先后顺序,可以分为静态博弈(static game)和动态博弈(dynamic game)。

静态博弈:博弈中参与人同时选择行动,或虽非同时但后行动者并不知道先行动者采取了什么具体行动;

动态博弈:参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。

0.2.4 完全信息博弈与非完全信息博弈

博弈论按参与人对有关其他参与人的特征、策略空间及支付函数的知识,可以分为完全信息博弈和不完全信息博弈。

完全信息博弈指的是每一个参与人对其他参与人的特征、策略空间及支付函数有准确的知识;否则,就是不完全信息博弈。

0.2.5 博弈论的分类

静态博弈 动态博弈
完全信息 完全信息静态博弈;纳什均衡(Nash equilibrium);代表人物:纳什(1950, 1951 完全信息动态博弈;子博弈精炼纳什均衡(subgame perfect Nash equilibrium);代表人物:泽尔腾(1965
不完全信息 不完全信息静态博弈;贝叶斯纳什均衡(Bayesian Nash equilibrium);代表人物:海萨尼(1967-1968 不完全信息动态博弈;精炼贝叶斯纳什均衡(perfect Bayesian Nash equilibrium);代表人物:泽尔腾(1975)、科瑞普斯和威尔逊(1982)、弗登博格和泰勒尔(1991

0.2.6 博弈论基本概念

博弈论的基本概念包含:

  1. 参与人(player
  2. 行动(action or move
  3. 信息(information
  4. 策略(strategy
  5. 收益(payoff
  6. 结果(outcome
  7. 均衡(equilibrium
0.2.6.1 参与人(player

参与人指的是一个博弈中的决策主体。

参与人的目的是通过选择行动(或策略)来最大化自己的收益(效用)水平。

参与人可以是自然人,也可以是团体。决定外生的随机变量的概率分布的机制称为“自然”(nature),作为“伪参与人”(pseudo-player)处理。(此处pseudo译为“伪”,书本原文称为“虚拟”)。例如,在房地产开发商之间的博弈中,开发商是博弈的参与人,而购房需求方则是伪参与人(或自然),通过决定市场需求来影响到博弈。

重要的是,每个参与人必须有可供选择的行动和一个很好定义的偏好函数。那些不作决策的被动主体只当作环境参数来处理。

一般地,用$i=1, \cdots, n$代表参与人,$N$代表“自然”。

0.2.6.2 行动(action or move

行动是参与人在博弈中的某个时间点的决策变量。

一般地,用$a_i$表示第$i$个参与人的一个特定行动,$A_i=\lbrace a_i \rbrace$表示包含可供$i$选择的所有行动的行动集(action set)。行动可以是离散的,也可以是连续的,例如:开发或不开发($A_i = \lbrace 开发, 不开发 \rbrace$),产量$q_i$($A_i = \lbrace q_i | q_i \ge 0, q_i \in R \rbrace$)。

在$n$人博弈中,$n$个参与人的行动的有序集$a=(a_1, \cdots, a_i, \cdots, a_n)$称为“行动组合”(action profile),其中的第$i$个元素$a_i$是第$i$个参与人的行动。

与行动相关的一个重要问题是行动顺序(order of play),行动顺序对于博弈的结果是非常重要的。静态博弈和动态博弈的区分就是基于行动的顺序作出的。

0.2.6.3 信息(information

@todo

0.2.6.4 策略(strategy
0.2.6.5 收益(payoff
0.2.6.6 结果(outcome
0.2.6.7 均衡(equilibrium

1 完全信息静态博弈

2 完全信息动态博弈

3 不完全信息静态博弈

4 不完全信息动态博弈

支持我的写作!(Support my writing!)

欢迎关注我的其它发布渠道