Return to Video

Office Hours: Game Theory

  • 0:00 - 0:04
    ♪[音乐]♪
  • 0:04 - 0:07
    课后辅导时间:
    博弈论
  • 0:08 - 0:10
    - [Mary Clare] 今天
    我们将通过一个简单的例子
  • 0:10 - 0:13
    进一步理解博弈论
  • 0:13 - 0:16
    Bob 和 Al 是互为对手的
    著名的魔术师
  • 0:16 - 0:19
    他们研究出了一种
    颇受欢迎的新戏法
  • 0:19 - 0:21
    为了利益最大化
  • 0:21 - 0:24
    他们同意限制表演场数
  • 0:24 - 0:26
    如果一周内
    他们两个都只表演一场
  • 0:26 - 0:30
    他俩都将得到
    1万美元的出场费
  • 0:30 - 0:32
    然而,如果有一个
    魔术师违约
  • 0:32 - 0:34
    每周演出5次
  • 0:34 - 0:37
    而另一个照旧演出1次的话
  • 0:37 - 0:40
    那个作弊者将赚到15000块
  • 0:40 - 0:44
    而另一个魔术师
    将只能赚到1000块
  • 0:44 - 0:46
    如果两个魔术师都违反契约
  • 0:46 - 0:48
    各演5场
  • 0:48 - 0:51
    那么将各赚6000块
  • 0:51 - 0:53
    那么,他们各自演出场数的
  • 0:53 - 0:55
    纳什均衡是怎样的呢?
  • 0:55 - 0:56
    纳什均衡是说
  • 0:56 - 1:00
    除非别人改变了
    他们的行为或策略
  • 1:00 - 1:04
    否则无一参与者
    有理由改变自己的行为或策略
  • 1:04 - 1:06
    为了找到 Bob 和 Al
  • 1:06 - 1:08
    演出场数的纳什均衡点
  • 1:08 - 1:12
    我们必须在 Al 的行为基础上
    先分析一下 Bob 的行为
  • 1:12 - 1:13
    反之亦然
  • 1:14 - 1:15
    我们画一个2乘2的矩阵
  • 1:15 - 1:18
    解释起来会比较容易
  • 1:18 - 1:21
    两个人各自有两个选项
  • 1:21 - 1:23
    在矩阵的每个格子中
  • 1:23 - 1:26
    我们列出了不同状态下
    他们各自的收益
  • 1:26 - 1:30
    我们先来解释 Bob 的
    再来解释 Al 的
  • 1:30 - 1:33
    基于 Al 的行为
    我们先来看看
  • 1:33 - 1:34
    Bob 的最佳策略
  • 1:35 - 1:38
    Al 要么遵守诺言
    每周表演1次
  • 1:38 - 1:41
    要么她违背诺言
    进行5场演出
  • 1:42 - 1:44
    如果她合作,只演1场
  • 1:44 - 1:46
    那么 Bob 的最佳策略是什么呢?
  • 1:46 - 1:49
    请注意,我们只从
    Bob的角度看
  • 1:49 - 1:51
    那么他最好的选择是作弊
  • 1:51 - 1:53
    一周演出5场
  • 1:53 - 1:55
    赚取15000
  • 1:55 - 1:58
    而不是演1场,赚10000
  • 1:59 - 2:04
    现在,如果 Al 背信弃义
    表演5场又会怎样呢?
  • 2:04 - 2:07
    Bob 的最佳策略依旧是
    每周演出5场
  • 2:07 - 2:09
    赚取6000
  • 2:09 - 2:13
    而不是每周演出1次,只赚1000
  • 2:14 - 2:20
    不管 Al 怎么做
    Bob 的最佳策略都是欺骗——表演5场
  • 2:20 - 2:23
    那么作弊便成了他的优势策略
  • 2:24 - 2:26
    现在,我们从 Al 的角度再来看看
  • 2:26 - 2:28
    我敢打赌
    你们已经知道结果会是怎样
  • 2:28 - 2:32
    如果 Bob 遵守诺言
    每周只演出1场
  • 2:32 - 2:36
    那么 Al 最好的选择
    是进行5场演出
  • 2:36 - 2:39
    与其赚10000
    她会赚到15000
  • 2:40 - 2:42
    如果 Bob 失信
  • 2:42 - 2:43
    演出5场
  • 2:43 - 2:47
    Al 的最佳选择也是作弊
    进行5场演出
  • 2:47 - 2:50
    因为她会赚6000
    而不是1000
  • 2:51 - 2:55
    鉴于 Al 的最佳策略
    是每周演出5场
  • 2:55 - 2:57
    无论 Bob 怎么做
  • 2:57 - 3:00
    这也成了她的优势策略
  • 3:01 - 3:04
    所以,如果 Bob 的优势策略
    也是作弊
  • 3:04 - 3:07
    那么在这个游戏中的纳什均衡点
  • 3:07 - 3:09
    就是他俩都失信
  • 3:09 - 3:12
    在一周内都表演5场
    各自赚取6000
  • 3:13 - 3:16
    请注意,这可不是一个最佳方案
  • 3:16 - 3:18
    如果每人每周只进行一场演出
  • 3:18 - 3:20
    那则会好很多
  • 3:20 - 3:21
    他们会赚到更多的钱
  • 3:21 - 3:24
    而且有一大堆闲暇时间
  • 3:24 - 3:26
    但是,如果我们只是评估
  • 3:26 - 3:29
    矩阵中列出的收益情况
  • 3:29 - 3:33
    Bob 和 Al 为了获得最大利益
    则会一起作弊
  • 3:33 - 3:35
    这就是纳什均衡
  • 3:36 - 3:39
    当然,矩阵之外是
    一个真实的世界
  • 3:39 - 3:41
    情况要错综复杂得多
  • 3:41 - 3:43
    人们注重信守诺言
  • 3:43 - 3:45
    长远地考虑问题
  • 3:45 - 3:47
    而不只是短视
  • 3:47 - 3:49
    把这个例子作为
  • 3:49 - 3:51
    简单而有力的出发点
  • 3:51 - 3:53
    从而更好地理解
    人类如何做出决策
  • 3:54 - 3:56
    一如既往
    请告诉我们你的想法
  • 3:56 - 3:57
    想练习更多的习题
  • 3:57 - 3:59
    在这个视频的结尾处
  • 3:59 - 4:01
    有更多挑战性问题等着你呢!
  • 4:01 - 4:03
    ♪ [音乐] ♪
Title:
Office Hours: Game Theory
Description:

more » « less
Video Language:
English
Team:
Marginal Revolution University
Project:
Office Hours
Duration:
04:13

Chinese, Simplified subtitles

Revisions Compare revisions