♪[音乐]♪
课后辅导时间:
博弈论
- [Mary Clare] 今天
我们将通过一个简单的例子
进一步理解博弈论
Bob 和 Al 是互为对手的
著名的魔术师
他们研究出了一种
颇受欢迎的新戏法
为了利益最大化
他们同意限制表演场数
如果一周内
他们两个都只表演一场
他俩都将得到
1万美元的出场费
然而,如果有一个
魔术师违约
每周演出5次
而另一个照旧演出1次的话
那个作弊者将赚到15000块
而另一个魔术师
将只能赚到1000块
如果两个魔术师都违反契约
各演5场
那么将各赚6000块
那么,他们各自演出场数的
纳什均衡是怎样的呢?
纳什均衡是说
除非别人改变了
他们的行为或策略
否则无一参与者
有理由改变自己的行为或策略
为了找到 Bob 和 Al
演出场数的纳什均衡点
我们必须在 Al 的行为基础上
先分析一下 Bob 的行为
反之亦然
我们画一个2乘2的矩阵
解释起来会比较容易
两个人各自有两个选项
在矩阵的每个格子中
我们列出了不同状态下
他们各自的收益
我们先来解释 Bob 的
再来解释 Al 的
基于 Al 的行为
我们先来看看
Bob 的最佳策略
Al 要么遵守诺言
每周表演1次
要么她违背诺言
进行5场演出
如果她合作,只演1场
那么 Bob 的最佳策略是什么呢?
请注意,我们只从
Bob的角度看
那么他最好的选择是作弊
一周演出5场
赚取15000
而不是演1场,赚10000
现在,如果 Al 背信弃义
表演5场又会怎样呢?
Bob 的最佳策略依旧是
每周演出5场
赚取6000
而不是每周演出1次,只赚1000
不管 Al 怎么做
Bob 的最佳策略都是欺骗——表演5场
那么作弊便成了他的优势策略
现在,我们从 Al 的角度再来看看
我敢打赌
你们已经知道结果会是怎样
如果 Bob 遵守诺言
每周只演出1场
那么 Al 最好的选择
是进行5场演出
与其赚10000
她会赚到15000
如果 Bob 失信
演出5场
Al 的最佳选择也是作弊
进行5场演出
因为她会赚6000
而不是1000
鉴于 Al 的最佳策略
是每周演出5场
无论 Bob 怎么做
这也成了她的优势策略
所以,如果 Bob 的优势策略
也是作弊
那么在这个游戏中的纳什均衡点
就是他俩都失信
在一周内都表演5场
各自赚取6000
请注意,这可不是一个最佳方案
如果每人每周只进行一场演出
那则会好很多
他们会赚到更多的钱
而且有一大堆闲暇时间
但是,如果我们只是评估
矩阵中列出的收益情况
Bob 和 Al 为了获得最大利益
则会一起作弊
这就是纳什均衡
当然,矩阵之外是
一个真实的世界
情况要错综复杂得多
人们注重信守诺言
长远地考虑问题
而不只是短视
把这个例子作为
简单而有力的出发点
从而更好地理解
人类如何做出决策
一如既往
请告诉我们你的想法
想练习更多的习题
在这个视频的结尾处
有更多挑战性问题等着你呢!
♪ [音乐] ♪