♪[音乐]♪
课后辅导时间:
博弈论
- [Mary Clare] 今天
我们将通过一个简单的例子
进一步理解博弈论
Bob 和 Al 是互为对手的
著名的魔术师
他们研究出了一种颇受欢迎的新戏法
为了利益最大化
他们同意限制各自的表演场数
如果一周内
他们两个都只表演一场
那么,每人都将得到
$10,000 的出场费
然而,如果有一个魔术师违反契约
每周演出五次
而另一个照旧演出一次的话 --
那个作弊者将赚到$15000
而另一个魔术师
将只能赚到$1000
如果两个魔术师都违反契约
各演五场,那么将各赚$6000
那么,他们各自演出场数的
纳什均衡是怎样的呢?
纳什均衡是说
除非别人改变了他们的行为或策略
否则无一参与者
有理由改变自己的行为或策略
为了找到 Bob 和 Al
演出场数的纳什均衡点
我们必须在 Al 的行为基础上
先分析一下 Bob 的行为
反之亦然
我们画一个2乘2的矩阵
解释起来会比较容易
两个人各自有两个选项
在矩阵的每个格子中
我们列出了不同状态下
他们各自的收益
我们先来解释 Bob 的
再来解释 Al 的
基于 Al 的行为
我们先来看看
Bob 的最佳策略
Al 要么遵守诺言
每周表演一次
要么她违背诺言
进行五场演出
如果她合作,只演一场
那么 Bob 的最佳策略是什么呢?
请注意,我们只从 Bob 的角度看
那么他最好的选择是作弊
一周演出五场
赚取 $15000
而不是演一场,赚 $10000
现在,如果 Al 背信弃义
表演五场又会怎样呢?
Bob 的最佳策略依旧是
每周演出五场
赚取 $6000
而不是每周演出一次,只赚$1000
不管 Al 怎么做
Bob 的最佳策略都是欺骗--表演五场
那么作弊便成了他的优势策略
现在,我们从 Al 的角度再来看看
我敢打赌
你们已经知道结果会是怎样
如果 Bob 遵守诺言
每周只演出一场
那么 Al 最好的选择
是进行五场演出
与其赚$10,000
她会赚到$15,000
如果 Bob 失信
演出五场
Al 的最佳选择也是作弊
进行五场演出
因为她会赚$6,000
而不是$1,000
鉴于 Al 的最佳策略
是每周演出五场
无论 Bob 怎么做
这也成了她的优势策略
所以,如果 Bob 的优势策略也是作弊
那么在这个游戏中的纳什均衡点
就是他俩都失信
在一周内都表演五场
各自赚取 $6,000
请注意,这可不是一个最佳方案
如果每人每周只进行一场演出
那则会好很多
他们会赚到更多的钱
而且有一大堆闲暇时间
但是,如果我们只是评估
矩阵中列出的收益情况
Bob 和 Al 为了获得最大利益
则会一起作弊
这就是纳什均衡
当然,矩阵之外是一个真实的世界
情况要错综复杂得多
人们注重信守诺言
长远地考虑问题
而不只是短视
把这个例子作为
简单而有力的出发点
从而更好地理解
人类如何做出决策
一如既往
请告诉我们你的想法
想练习更多的习题
在这个视频的结尾处
有更多挑战性问题等着你呢!
♪ [音乐] ♪