Return to Video

Office Hours: Game Theory

  • 0:00 - 0:04
    ♪[音乐]♪
  • 0:08 - 0:10
    - [Mary Clare] 今天
    我们将通过一个简单的例子
  • 0:10 - 0:13
    进一步理解博弈论
  • 0:13 - 0:16
    Bob 和 Al 是两个著名的魔术师
    也是竞争对手
  • 0:16 - 0:19
    他们都有自己的拿手好戏
  • 0:19 - 0:21
    为了利益最大化
  • 0:21 - 0:23
    他们同意限制各自的表演场数
  • 0:24 - 0:26
    如果一周内
    他们两个都只表演一场
  • 0:26 - 0:29
    那么,每人都将得到
    $10,000 的出场费
  • 0:30 - 0:32
    然而,如果有一个魔术师违反契约
  • 0:32 - 0:34
    每周演出五次
  • 0:34 - 0:37
    而另一个照旧演出一次的话 --
  • 0:37 - 0:40
    那个作弊者将赚到$15000
  • 0:40 - 0:43
    而另一个魔术师
    将只能赚到$1000
  • 0:44 - 0:46
    如果两个魔术师都违反契约
  • 0:46 - 0:50
    各演五场,那么将各赚$6000
  • 0:51 - 0:53
    那么,根据纳什均衡
  • 0:53 - 0:54
    他们各自会演几场呢?
  • 0:55 - 0:58
    纳什均衡是说
  • 0:58 - 1:00
    除非外部改变了他们的行为或策略
  • 1:00 - 1:04
    否则无一内部参与者
    可以通过独自的行为增加收益
  • 1:04 - 1:06
    为了找到Bob和Al
  • 1:06 - 1:08
    演出场数的纳什均衡点
  • 1:08 - 1:12
    我们必须在Al的行为基础上
    先分析一下Bob 的行为
  • 1:12 - 1:13
    反之亦然
  • 1:14 - 1:15
    我们画一个2乘2的矩阵
  • 1:15 - 1:17
    解释起来会比较容易
  • 1:18 - 1:21
    两个人各自有两个选项
  • 1:21 - 1:24
    在矩阵的每个格子中
  • 1:24 - 1:26
    我们列出了他们不同的状态
  • 1:26 - 1:30
    我们先来解释 Bob 的
    再来解释 Al 的
  • 1:30 - 1:33
    基于Al的行为
    我们先来看看
  • 1:33 - 1:34
    Bob的最佳策略
  • 1:35 - 1:38
    Al 要么遵守诺言
    每周表演一次
  • 1:38 - 1:41
    要么她违背诺言
    进行五场演出
  • 1:42 - 1:44
    如果她合作,只演一场
  • 1:44 - 1:46
    那么Bob最好的策略是什么呢?
  • 1:46 - 1:49
    请注意,我们只从Bob的角度看
  • 1:49 - 1:51
    那么他最好的选择是作弊
  • 1:51 - 1:53
    一周演出五场
  • 1:53 - 1:56
    赚取 $15000
  • 1:56 - 1:58
    而不是演一场,赚 $10000
  • 1:59 - 2:04
    现在,如果Al 背信弃义
    表演五场又会怎样呢?
  • 2:04 - 2:07
    Bob最好的策略依旧是
    每周演出五场
  • 2:07 - 2:11
    赚取 $6000
  • 2:11 - 2:13
    而不是每周演出一次,只赚$1000
  • 2:14 - 2:18
    不管Al怎么做
    Bob的最佳策略都是欺骗--表演五场
  • 2:18 - 2:23
    那么作弊便成了他显然的策略
  • 2:24 - 2:26
    现在,我们从Al的角度再来看看
  • 2:26 - 2:28
    我敢打赌
    你们已经知道结果会是怎样
  • 2:28 - 2:32
    如果Bob遵守诺言
    每周只演出一场
  • 2:32 - 2:36
    那么Al最好的选择
    是进行五场演出
  • 2:36 - 2:39
    与其赚$10,000
    她会赚到$15,000
  • 2:40 - 2:42
    如果Bob失信
  • 2:42 - 2:43
    演出五场
  • 2:43 - 2:47
    Al的最佳选择也是作弊
    进行五场演出
  • 2:47 - 2:50
    因为她会赚 $6,000
    而不是$1,000
  • 2:51 - 2:54
    鉴于Al的最佳策略
    是每周演出五场
  • 2:54 - 2:57
    无论Bob怎么做
  • 2:57 - 3:00
    这也成了她显然的策略
  • 3:01 - 3:04
    所以,如果Bob的主导策略也是作弊
  • 3:04 - 3:06
    那么在这个游戏中的纳什均衡点
  • 3:06 - 3:09
    就是他俩都失信
  • 3:09 - 3:12
    在一周内都表演五场
    各自赚取 $6,000
  • 3:13 - 3:16
    请注意,这可不是一个最佳方案
  • 3:16 - 3:18
    如果每人每周只进行一场演出
  • 3:18 - 3:20
    那则会好很多
  • 3:20 - 3:21
    他们会赚到更多的钱
  • 3:21 - 3:24
    而且有一大堆闲暇时间
  • 3:24 - 3:26
    但是,如果我们只是评估
  • 3:26 - 3:29
    矩阵中列出的收益情况
  • 3:29 - 3:33
    Bob 和Al 的最大利益则是一起作弊
  • 3:33 - 3:35
    这就是纳什均衡
  • 3:36 - 3:39
    当然,矩阵之外是一个真实的世界
  • 3:39 - 3:41
    情况要错综复杂得多
  • 3:41 - 3:43
    人们注重信守诺言
  • 3:43 - 3:45
    长远地考虑问题
  • 3:45 - 3:47
    而不只是短视
  • 3:47 - 3:49
    把这个例子作为
  • 3:49 - 3:50
    简单而有力的出发点
  • 3:50 - 3:53
    从而更好地理解
    人类如何做出决策
  • 3:54 - 3:56
    一如既往
    请告诉我们你的想法
  • 3:56 - 3:57
    想练习更多的习题
  • 3:57 - 3:59
    在这个视频的结尾处
  • 3:59 - 4:01
    有更多挑战性问题等着你呢!
  • 4:01 - 4:03
    ♪ [音乐] ♪
Title:
Office Hours: Game Theory
Description:

more » « less
Video Language:
English
Team:
Marginal Revolution University
Project:
Office Hours
Duration:
04:13

Chinese, Simplified subtitles

Revisions Compare revisions