< Return to Video

Visualizing a binomial distribution

  • 0:00 - 0:01
    在上一个视频,
  • 0:01 - 0:03
    我们建立了一个随机变量 x,
  • 0:03 - 0:04
    其定义是,当我们抛了五次硬币时,
  • 0:04 - 0:07
    得到正面的次数。
  • 0:07 - 0:09
    接着,我们可以算出
  • 0:09 - 0:11
    随机变量取值
  • 0:11 - 0:14
    0,1,2,3,4 或 5 的概率。
  • 0:14 - 0:16
    让我们来一起看看它们。
  • 0:16 - 0:17
    我们来把它们画出来,
  • 0:17 - 0:18
    我们就可以
  • 0:18 - 0:22
    了解这个随机变量的概率分部。
  • 0:22 - 0:24
    那我们来画一下吧。
  • 0:24 - 0:26
    我可能换一个方法,
  • 0:26 - 0:30
    这样我们能更好地看到概率。
  • 0:30 - 0:34
    我把这边的内容先都擦掉。
  • 0:34 - 0:37
    啊,有点失误。
  • 0:38 - 0:39
    这样有可能能行。
  • 0:43 - 0:44
    让我快速地把这些内容擦掉,
  • 0:44 - 0:45
    把这些笔记擦掉,
  • 0:45 - 0:49
    现在我们可以真正地开始绘制分布图。
  • 0:49 - 0:52
    好的,在这一条轴上,
  • 0:52 - 0:54
    我会放上所有不同的结果
  • 0:54 - 0:57
    让我来画一下
  • 0:57 - 1:01
    看起来还行,还像个直线。
  • 1:01 - 1:06
    我来开始在这个直线上绘制概率
  • 1:07 - 1:11
    不错,画的蛮直的。
  • 1:11 - 1:13
    我们来看看有哪些概率。
  • 1:13 - 1:16
    我们来看看,
  • 1:16 - 1:18
    所有的概率分母都是 32,
  • 1:18 - 1:20
    最高的概率是10/32。
  • 1:20 - 1:23
    那这里,就作为
  • 1:24 - 1:26
    10/32,
  • 1:28 - 1:32
    这里,有两个5/32,
  • 1:32 - 1:34
    我们来看看,这个位置看起来差不多是一半,
  • 1:34 - 1:39
    这里是5/32,
  • 1:39 - 1:42
    另外1/32差不多在这里
  • 1:42 - 1:44
    1,2,让我们来看看,
  • 1:44 - 1:47
    如果我把它分割开,分成1,2,3
  • 1:47 - 1:50
    好的,让我来分一下,
  • 1:50 - 1:53
    1,2,3,
  • 1:53 - 1:55
    4,5
  • 1:55 - 1:59
    好的,我们把这里称为1/32,
  • 1:59 - 2:03
    那么我们的可能性,在这里,
  • 2:03 - 2:06
    那么这就是随机变量
  • 2:06 - 2:09
    可能的数值。
  • 2:09 - 2:12
    让我在这里画一个小小的直方图,
  • 2:12 - 2:16
    x 等于 0,
  • 2:16 - 2:18
    在这里的概率,
  • 2:18 - 2:20
    其实,因为我会想去画一个直方图,
  • 2:20 - 2:23
    直方图会长这样,
  • 2:23 - 2:25
    让我来改改,
  • 2:25 - 2:28
    把它放在这里,
  • 2:28 - 2:30
    x 等于 0
  • 2:30 - 2:33
    那么在这里,概率是1/32,
  • 2:33 - 2:37
    我来上个颜色。
  • 2:37 - 2:39
    现在,x 等于1 的时候,
  • 2:39 - 2:42
    x 等于 1 的时候是 5/32,
  • 2:42 - 2:44
    那我来把它画出来,
  • 2:44 - 2:47
    所以5/32,
  • 2:47 - 2:50
    我把条形放在这里,
  • 2:50 - 2:53
    并给它上色,
  • 2:53 - 2:56
    因此这里,
  • 2:56 - 2:58
    代表着概率中 x等于 1,
  • 2:58 - 3:01
    因此我们能得到 1,正好在
  • 3:01 - 3:04
    5 次抛硬币中,能得到 1 次正面。
  • 3:04 - 3:08
    我们现在来看看概率 x 等于 2,
  • 3:08 - 3:11
    x 等于 2 是 10/32,
  • 3:11 - 3:13
    那会看起来这样。
  • 3:13 - 3:16
    让我来努力地画一下,
  • 3:25 - 3:28
    我其实还蛮喜欢自己徒手画出来的美感。
  • 3:28 - 3:32
    有时候你如果用电脑来画,
  • 3:32 - 3:34
    不知道,有时候,
  • 3:34 - 3:35
    画出来的东西就没有它自己的个性了。
  • 3:35 - 3:38
    好的,那这里代表着我们
  • 3:38 - 3:41
    随机变量等于 2。
  • 3:41 - 3:46
    现在我们来看看 x 等于 3 的概率,
  • 3:46 - 3:48
    也是10/32,
  • 3:48 - 3:50
    这里是 10/32,
  • 3:50 - 3:55
    我来画一下,
  • 3:55 - 3:57
    这里是10/32,
  • 3:58 - 4:01
    来上个色。
  • 4:02 - 4:04
    玛尼玛尼哄,好啦。
  • 4:05 - 4:08
    我觉得这个过程还挺治愈。(笑)
  • 4:08 - 4:13
    好的,那么这个是
  • 4:13 - 4:14
    x 等于 3 的概率。
  • 4:14 - 4:18
    那么x 等于 4,就是5/32。
  • 4:18 - 4:22
    我们回来这里,
  • 4:22 - 4:25
    这里是5/32。
  • 4:25 - 4:27
    我们来上个色,
  • 4:30 - 4:33
    那么这里代表 x 等于 4,
  • 4:33 - 4:34
    那么最后,
  • 4:34 - 4:38
    x 等于 5 的概率又是1/32,
  • 4:38 - 4:41
    和这里一样,
  • 4:41 - 4:45
    我们来上个色,那么这里代表
  • 4:45 - 4:49
    我们的随机变量 x 等于 5。
  • 4:49 - 4:51
    那么,当我们画出,
  • 4:51 - 4:53
    这个概率分布,要注意,
  • 4:53 - 4:54
    这是一个离散型概率分布。
  • 4:54 - 4:57
    这是一个离散型随机变量,
  • 4:57 - 4:59
    这个变量只能取
  • 4:59 - 5:01
    有限数量的值。
  • 5:01 - 5:04
    事实上,我应该说,它是一个
  • 5:04 - 5:05
    有限数量的离散型随机变量。
  • 5:05 - 5:07
    这个数值可以取离散变数,
  • 5:07 - 5:09
    但是理论上来说,它可以取
  • 5:09 - 5:10
    无限数量的离散型随机变量。
  • 5:10 - 5:12
    你可以越来越往上数,
  • 5:12 - 5:14
    但是这个是离散的,意味着,
  • 5:14 - 5:16
    它是这些特别的整数,
  • 5:16 - 5:18
    它无法取在这些整数之间的值,
  • 5:18 - 5:20
    并且它也是有限的。
  • 5:20 - 5:21
    它也可以取 x等于 0,x 等于 1,
  • 5:21 - 5:23
    x 等于 2,x 等于 3,x 等于 4,
  • 5:23 - 5:23
    或x 等于 5,
  • 5:23 - 5:27
    并且当你画出它的概率分布,
  • 5:27 - 5:30
    这个离散型概率分布,
  • 5:30 - 5:35
    它会从1/32开始,先往上,然后会回来往下,
  • 5:35 - 5:38
    它是对称的,
  • 5:38 - 5:40
    一个看起来如此的分布
  • 5:40 - 5:42
    一个像这样的离散型分布,
  • 5:42 - 5:45
    我们叫它”二项式分布“,
  • 5:45 - 5:47
    我们会在未来讲到,
  • 5:47 - 5:50
    为什么它叫”二项式分布“,
  • 5:50 - 5:51
    但是给个线索,
  • 5:51 - 5:53
    事实上,我来讲讲
  • 5:53 - 5:54
    它为什么叫”二项式分布“,
  • 5:54 - 5:57
    因为这些概率,
  • 5:57 - 5:58
    可以通过二项式系数,
  • 5:58 - 6:01
    和组合数学来得出。
  • 6:01 - 6:03
    在另一个视频中,我们会聊聊,
  • 6:03 - 6:04
    尤其是当我们聊到二项式定理,
  • 6:04 - 6:06
    我们为什么要把这些事物叫”二项式系数“。
  • 6:06 - 6:10
    它实际上是基于代数中二项式的幂,
  • 6:10 - 6:15
    但这是一个特别,特别,特别,特别重要的分布,
  • 6:15 - 6:18
    在统计学中特别重要,
  • 6:18 - 6:20
    但是对于很多离散过程,
  • 6:20 - 6:24
    你可能会假设基础分布,
  • 6:24 - 6:27
    是一个二项式分布,当我们
  • 6:27 - 6:29
    深入了解统计,
  • 6:29 - 6:31
    我们会在未来讨论人们为什么这样做。
  • 6:31 - 6:35
    如果你会有比像现在这个例子中的
  • 6:35 - 6:38
    5 个案例多得多的情况,
  • 6:38 - 6:40
    如果,不说从抛 5 次硬币中
  • 6:40 - 6:41
    得到正面的次数,取而代之说,
  • 6:41 - 6:43
    x 等于抛 500 万次硬币中
  • 6:43 - 6:44
    得到正面的次数,
  • 6:44 - 6:48
    你可以想想,你会有很多很多,
  • 6:48 - 6:51
    条形会相对于整个峰破越来越细,
  • 6:51 - 6:53
    它便会开始,
  • 6:53 - 6:56
    会开始接近一个看起来
  • 6:56 - 7:00
    很像一个钟形曲线的东西。
  • 7:00 - 7:03
    我来上个我还没用过的颜色,
  • 7:03 - 7:04
    让你看得更清楚一些,
  • 7:04 - 7:07
    那么它会看起来。。
  • 7:07 - 7:09
    如果你有更多的,
  • 7:09 - 7:11
    这些概率,
  • 7:11 - 7:14
    它会看起来
  • 7:14 - 7:17
    接近一个钟形曲线,
  • 7:17 - 7:19
    你可能原来听说过钟形曲线,
  • 7:19 - 7:21
    钟形曲线是一个常态分部。
  • 7:21 - 7:24
    所以有一种思考的方法,是
  • 7:24 - 7:27
    常态分布是一个概率密度函数。
  • 7:27 - 7:29
    是连续的。
  • 7:29 - 7:30
    那么,黄色的这个,
  • 7:30 - 7:32
    接近常态分布,
  • 7:32 - 7:35
    常态分布,在经典意义上,
  • 7:35 - 7:38
    会一直继续下去,
  • 7:38 - 7:42
    常态分部,与二项式分布有关联。
  • 7:42 - 7:46
    在统计学说,很多时候,
  • 7:46 - 7:48
    人们会假设常态分布的存在,
  • 7:48 - 7:50
    因为你可以说,好吧,它是一个
  • 7:50 - 7:52
    正在发生的,几乎无限数量的随机过程的产物。
  • 7:52 - 7:56
    在这里,我们抛了 5 次硬币,
  • 7:56 - 7:58
    但你可以想象,分子的相互作用
  • 7:58 - 8:01
    或人际交往,你可以说
  • 8:01 - 8:02
    噢,这些事物有无数次的交互,
  • 8:02 - 8:05
    因而会拥有一个常态分布,
  • 8:05 - 8:07
    这个概念在科学与统计中特别,特别重要。
  • 8:07 - 8:12
    二项分布是这个概念的离散型版本,
  • 8:12 - 8:15
    需要注意,
  • 8:15 - 8:17
    这是这些分布,
  • 8:17 - 8:19
    是这些分布的来源,
  • 8:19 - 8:20
    这是它们互相关联的由来。
  • 8:20 - 8:21
    你如果想,当你做了更多轮某件事情,
  • 8:21 - 8:23
    二项式分布会
  • 8:23 - 8:25
    非常地接近常态分布,
  • 8:25 - 8:27
    但是同样的也得考虑,
  • 8:27 - 8:28
    它们从哪里来。
  • 8:28 - 8:29
    我们会在统计学中更多地讨论它,
  • 8:29 - 8:31
    因为可以假设,
  • 8:31 - 8:33
    一个潜在的二项式分布,
  • 8:33 - 8:35
    或一个常态分布,
  • 8:35 - 8:36
    可以概括很多不同形态的过程,
  • 8:36 - 8:38
    但是有时候他它不是这样的,甚至对于经济学来说,
  • 8:38 - 8:41
    当在头或尾的事情
  • 8:41 - 8:43
    实际上更有可能发生,
  • 8:43 - 8:45
    有时候人们会直接假设有正态分布图,
  • 8:45 - 8:46
    但其实这样的假设会导致像经济危机
  • 8:46 - 8:49
    一样的事情发生
  • 8:49 - 8:50
    但无论如何,我不想再继续跑题了。
  • 8:50 - 8:52
    我想说的是,我们应该感激这个模型,
  • 8:52 - 8:54
    我们从随机变量开始,
  • 8:54 - 8:55
    到了抛 5 次硬币得到正面的次数,
  • 8:55 - 8:58
    然后我们画了图,
  • 8:58 - 9:00
    可以从视觉上看到这个二项式分布图,
  • 9:00 - 9:02
    我其实差不多在告诉你,
  • 9:02 - 9:03
    我还没有真正的让你看到,
  • 9:03 - 9:06
    如果你抛很多很多次硬币,
  • 9:06 - 9:08
    并用同样的方式定义一个变量,
  • 9:08 - 9:11
    那么这个直方图,这个条形图,
  • 9:11 - 9:16
    会看起来像一个钟形曲线,
  • 9:16 - 9:19
    如果你本质上有无数个它们,
  • 9:19 - 9:21
    你会有一个
  • 9:21 - 9:22
    连续概率分布,
  • 9:22 - 9:24
    或者,我也应该说,概率密度函数,
  • 9:24 - 9:26
    这会让我们接近一个常态分布。
Title:
Visualizing a binomial distribution
Description:

more » « less
Video Language:
English
Team:
Khan Academy
Duration:
09:27

Chinese, Simplified subtitles

Revisions Compare revisions