Expected Value of Binomial Distribution
-
0:00 - 0:02上一节 我讲到了随机变量期望值
-
0:01 - 0:15本字幕由网易公开课提供,更多课程请到http//open.163.com
-
0:02 - 0:06上一节 我讲到了随机变量期望值
-
0:06 - 0:09其实也就是总体均值
-
0:09 - 0:12只是随机变量的总体是无穷的
-
0:12 - 0:16无法全部求和然后取平均值
-
0:16 - 0:18于是我们需要用到频率进行加权平均
-
0:17 - 0:25网易公开课官方微博 http://t.163.com/163open
-
0:18 - 0:21于是我们需要用到频率进行加权平均
-
0:21 - 0:23于是我们需要用到频率进行加权平均
-
0:23 - 0:25这同老式的求平均方法其实没有本质区别
-
0:25 - 0:27这同老式的求平均方法其实没有本质区别
-
0:27 - 0:30但是可以用于求随机变量无穷总体的均值
-
0:30 - 0:33但是可以用于求随机变量无穷总体的均值
-
0:30 - 0:45oCourse字幕组翻译:只做公开课的字幕组 http://ocourse.org
-
0:33 - 0:37随机变量总体无穷是因为可以无止尽进行试验
-
0:37 - 0:38随机变量总体无穷是因为可以无止尽进行试验
-
0:38 - 0:41然后 我们计算了二项分布的期望值
-
0:41 - 0:46然后 我们计算了二项分布的期望值
-
0:46 - 0:50当时是以抛硬币为例
-
0:50 - 0:53这一节我将讲到二项分布期望值的一般公式
-
0:53 - 0:57这一节我将讲到二项分布期望值的一般公式
-
0:57 - 1:05假设有随机变量X
-
1:05 - 1:12表示n次试验成功的次数 其中每次成功的概率是p
-
1:12 - 1:30表示n次试验成功的次数 其中每次成功的概率是p
-
1:30 - 1:31这是更一般的情况 比如正面可以看作是成功
-
1:31 - 1:37这是更一般的情况 比如正面可以看作是成功
-
1:37 - 1:39而概率p是0.5 n是10次 这里只是更一般化了
-
1:39 - 1:41而概率p是0.5 n是10次 这里只是更一般化了
-
1:41 - 1:42而概率p是0.5 n是10次 这里只是更一般化了
-
1:42 - 1:47然后求这个X的期望值
-
1:47 - 1:50这个随机变量的概率分布将是很好的二项分布
-
1:50 - 1:52这个随机变量的概率分布将是很好的二项分布
-
1:52 - 1:55看起来有些像钟形曲线
-
1:55 - 1:58以后我们会更详细学到钟形曲线
-
1:58 - 2:01首先 我打算给出答案
-
2:01 - 2:05答案其实很直观
-
2:05 - 2:12随机变量X的期望值是n?p 有时也写成p?n
-
2:12 - 2:15随机变量X的期望值是n?p 有时也写成p?n
-
2:15 - 2:17我讲得更明白一些 先换个颜色
-
2:17 - 2:21我讲得更明白一些 先换个颜色
-
2:21 - 2:31X表示投进篮筐的次数
-
2:31 - 2:34X表示投进篮筐的次数
-
2:34 - 2:4310次投篮后进球的次数
-
2:43 - 2:48每一次进球的概率是40%
-
2:48 - 2:53投10次 命中率40% 那么表示进球次数的随机变量X
-
2:53 - 2:57投10次 命中率40% 那么表示进球次数的随机变量X
-
2:57 - 3:00其期望值就等于此命中率乘以投篮次数
-
3:00 - 3:04其期望值就等于此命中率乘以投篮次数
-
3:04 - 3:09也就是40%×10 也就是4
-
3:09 - 3:12也就是40%×10 也就是4
-
3:12 - 3:14当然 期望值并不一定是可能性最大的那个值
-
3:14 - 3:18当然 期望值并不一定是可能性最大的那个值
-
3:18 - 3:20因为概率分布可能会很怪
-
3:20 - 3:22因为概率分布可能会很怪
-
3:22 - 3:25不过在二项分布中
-
3:25 - 3:28期望值可以看成是最可能得到的那个结果
-
3:28 - 3:31期望值可以看成是最可能得到的那个结果
-
3:31 - 3:3540%命中率 投10次
-
3:35 - 3:38最可能的结果是中4次
-
3:38 - 3:41也可能进6次或3次 但4次的可能性最大
-
3:41 - 3:42也可能进6次或3次 但4次的可能性最大
-
3:42 - 3:45我一般是这样理解这个期望值的
-
3:45 - 3:51即每一次投篮有40%的几率命中
-
3:51 - 3:55可以理解为投篮总是中40%
-
3:55 - 3:58那么投10次 自然是4次投中
-
3:58 - 4:00可以这样来理解这个期望值
-
4:00 - 4:02可以这样来理解这个期望值
-
4:02 - 4:06下面来证明一下这就是二项分布的期望值
-
4:06 - 4:12下面来证明一下这就是二项分布的期望值
-
4:12 - 4:15想想 二项分布中 X=k的概率是多少
-
4:15 - 4:20想想 二项分布中 X=k的概率是多少
-
4:20 - 4:22我还是用这个篮球的例子来讲解
-
4:22 - 4:25我还是用这个篮球的例子来讲解
-
4:25 - 4:29k可以是投中3次或者多少次
-
4:29 - 4:31k可以是投中3次或者多少次
-
4:31 - 4:32k可以是投中3次或者多少次
-
4:32 - 4:37n次投篮 从中选k
-
4:37 - 4:39n次投篮 从中选k
-
4:39 - 4:42之前我们做过很多了
-
4:42 - 4:45后面还要乘以每一种基本情况的概率
-
4:45 - 4:47后面还要乘以每一种基本情况的概率
-
4:47 - 4:52基本情况也就是中k次 不中n-k次
-
4:52 - 4:57于是需要乘以命中率p的k次方 p自乘k次
-
4:57 - 5:00这是命中k次
-
5:00 - 5:02还需要射失剩下的n-k次 射失的概率是1-p
-
5:02 - 5:06还需要射失剩下的n-k次 射失的概率是1-p
-
5:06 - 5:08命中k次 射失次数就必然是n-k次
-
5:08 - 5:11命中k次 射失次数就必然是n-k次
-
5:11 - 5:14命中k次 射失次数就必然是n-k次
-
5:14 - 5:18总的来说 这就是二项分布中成功k次的概率
-
5:18 - 5:22总的来说 这就是二项分布中成功k次的概率
-
5:22 - 5:24我们知道 随机变量的期望值是概率加权平均值
-
5:24 - 5:27我们知道 随机变量的期望值是概率加权平均值
-
5:27 - 5:29我们知道 随机变量的期望值是概率加权平均值
-
5:29 - 5:33我可不希望这一节让你们感到迷惑
-
5:33 - 5:35这一节至少需要记住这个 就够了
-
5:35 - 5:36这一节至少需要记住这个 就够了
-
5:36 - 5:38后面的技术性比较强
-
5:38 - 5:41不过能够帮助熟悉Σ等符号
-
5:41 - 5:43同时也是对二项式系数的复习
-
5:43 - 5:46同时也是对二项式系数的复习
-
5:46 - 5:48总之 期望值就是这些经过概率加权之后的和
-
5:48 - 5:50总之 期望值就是这些经过概率加权之后的和
-
5:50 - 5:51也就是将X=k的概率乘以k 然后全部加起来
-
5:51 - 5:56也就是将X=k的概率乘以k 然后全部加起来
-
5:56 - 5:58对每一个k
-
5:58 - 6:04所以二项分布的随机变量X 其期望值是
-
6:04 - 6:07所以二项分布的随机变量X 其期望值是
-
6:07 - 6:10求和
-
6:10 - 6:13k从0一直到n 投篮中表示不中到全中
-
6:13 - 6:18k从0一直到n 投篮中表示不中到全中
-
6:18 - 6:23k从0一直到n 投篮中表示不中到全中
-
6:23 - 6:27每一个求和项是结果k乘以k次投中的概率
-
6:27 - 6:30每一个求和项是结果k乘以k次投中的概率
-
6:30 - 6:32k次投中的概率也就是这个
-
6:32 - 6:34k次投中的概率也就是这个
-
6:34 - 6:41即k乘以n选k乘以p的k次方乘以1-p的n-k次方
-
6:41 - 6:44即k乘以n选k乘以p的k次方乘以1-p的n-k次方
-
6:44 - 6:48然后进行一些代数求和运算
-
6:48 - 6:50然后进行一些代数求和运算
-
6:50 - 6:53首先我们可以这样处理一下这个求和式
-
6:53 - 6:54首先我们可以这样处理一下这个求和式
-
6:54 - 6:57第一项的k=0
-
6:57 - 7:00第一项的k=0
-
7:00 - 7:04所以第一项整个为0
-
7:04 - 7:07这一项对求和没有贡献
-
7:07 - 7:09这一项对求和没有贡献
-
7:09 - 7:12整个求和式可以写成
-
7:12 - 7:200乘以n选0乘以p的0次方乘以1-p的n-0次方
-
7:20 - 7:230乘以n选0乘以p的0次方乘以1-p的n-0次方
-
7:23 - 7:28加0乘以n选1乘以p的1次方乘以1-p的n-1次方
-
7:28 - 7:30加0乘以n选1乘以p的1次方乘以1-p的n-1次方
-
7:30 - 7:34一直加下去 直到k=n为止
-
7:34 - 7:39也就是n乘以n选n乘以p的n次方乘以1-p的n-n次方
-
7:39 - 7:42也就是n乘以n选n乘以p的n次方乘以1-p的n-n次方
-
7:42 - 7:44这是求和的展开式
-
7:44 - 7:47这第一项为0 因为k=0 0乘以任何数为0
-
7:47 - 7:49这第一项为0 因为k=0 0乘以任何数为0
-
7:49 - 7:52这第一项为0 因为k=0 0乘以任何数为0
-
7:52 - 7:55因此这一项可以在求和过程中忽略
-
7:55 - 8:02求和可以写成这个形式
-
8:02 - 8:03这和上面的求和是一样的
-
8:03 - 8:04这和上面的求和是一样的
-
8:04 - 8:10随机变量的期望值就是这个和
-
8:10 - 8:14k不需要从0开始 从1开始即可
-
8:14 - 8:20k=1一直到n k乘以n选k
-
8:20 - 8:28乘以p的k次方 乘以1-p的n-k次方
-
8:28 - 8:30以上只是将第一项去掉了
-
8:30 - 8:32以上只是将第一项去掉了
-
8:32 - 8:35这对后面的化简很有用处
-
8:35 - 8:38这对后面的化简很有用处
-
8:38 - 8:40下面把二项式系数写出来
-
8:40 - 8:41下面把二项式系数写出来
-
8:41 - 8:45哦 我的iPod同步弹出来了
-
8:45 - 8:50关掉它 然后回来
-
8:50 - 8:52下面把二项式系数写出来
-
8:52 - 8:53下面把二项式系数写出来
-
8:53 - 8:55k从1到n
-
8:55 - 9:03k乘以n!/[k!(n-k)!]
-
9:03 - 9:07k乘以n!/[k!(n-k)!]
-
9:07 - 9:13乘以p的k次方乘以1-p的n-k次方
-
9:13 - 9:16这里k/k!还可以进行一些化简
-
9:16 - 9:21这里k/k!还可以进行一些化简
-
9:21 - 9:24我可以重写一下k!
-
9:24 - 9:29k!也就是k?(k-1)?(k-2)…一直乘到1
-
9:29 - 9:33k!也就是k?(k-1)?(k-2)…一直乘到1
-
9:33 - 9:40k!也就是k?(k-1)!
-
9:40 - 9:43因为这是k乘以k-1一直到1
-
9:43 - 9:46因为这是k乘以k-1一直到1
-
9:46 - 9:52这个可以重写为k?(k-1)!
-
9:52 - 9:54这样k和k就可以消掉
-
9:54 - 9:57这样k和k就可以消掉
-
9:57 - 10:00于是整个式子又可以重写
-
10:00 - 10:01于是整个式子又可以重写
-
10:01 - 10:05这样就得到
-
10:05 - 10:17求和 k从1到n n!/[(k-1)!(n-k)!]
-
10:17 - 10:21求和 k从1到n n!/[(k-1)!(n-k)!]
-
10:21 - 10:28乘以p的k次方 乘以1-p的n-k次方
-
10:28 - 10:30继续进行化简 最后我们要化简成np
-
10:30 - 10:34继续进行化简 最后我们要化简成np
-
10:34 - 10:36继续进行化简 最后我们要化简成np
-
10:36 - 10:39我们可以提出一个np来
-
10:39 - 10:42然后看其它东西能否得到1
-
10:42 - 10:45n!可以用上面的技巧
-
10:45 - 10:52n!可以写成n?(n-1)!
-
10:52 - 11:01而p的k次方可以写成p乘p的k-1次方
-
11:01 - 11:05然后可以提出n和p
-
11:05 - 11:14有np乘以求和 k从1到n
-
11:14 - 11:16后面是(n-1)!/[(k-1)!(n-k)!]
-
11:16 - 11:28后面是(n-1)!/[(k-1)!(n-k)!]
-
11:28 - 11:33乘以p的k-1次方 乘以1-p的n-k次方
-
11:33 - 11:40乘以p的k-1次方 乘以1-p的n-k次方
-
11:40 - 11:43我们希望期望值是np
-
11:43 - 11:47也就是说 上面这个式子
-
11:47 - 11:50应该等于这个
-
11:50 - 11:54所以最终目的是让这个求和式等于1
-
11:54 - 11:57为了实现这个目的 我将进行换元
-
11:57 - 12:01令a=k-1
-
12:01 - 12:05令a=k-1
-
12:05 - 12:10b=n-1
-
12:10 - 12:14那么n-k等于多少
-
12:14 - 12:18a=k-1 则a+1=k
-
12:18 - 12:22然后b+1=n 那么n-k=a+1-(b+1)=a-b
-
12:22 - 12:28然后b+1=n 那么n-k=a+1-(b+1)=a-b
-
12:28 - 12:34然后b+1=n 那么n-k=a+1-(b+1)=a-b
-
12:34 - 12:36继续化简 有np乘以整个和
-
12:36 - 12:44继续化简 有np乘以整个和
-
12:44 - 12:48k从1到n
-
12:48 - 12:53k=1时 a等于0
-
12:53 - 13:02k=n时 a=n-1 所以a是从0到n-1
-
13:02 - 13:03k=n时 a=n-1 所以a是从0到n-1
-
13:03 - 13:09k=n时 a=n-1 所以a是从0到n-1
-
13:09 - 13:13k=n时 a=n-1 所以a是从0到n-1
-
13:13 - 13:15而n-1又等于b
-
13:15 - 13:19所以a是从0到b 有点绕
-
13:19 - 13:21你可以停下来琢磨琢磨
-
13:21 - 13:24我已经超时了 必须得加快
-
13:24 - 13:28b=n-1
-
13:28 - 13:33所以有b! 除以k-1的阶乘
-
13:33 - 13:37这也就是a!
-
13:37 - 13:47然后n-k=… 我写反了 应该是b-a
-
13:47 - 13:54然后n-k=… 我写反了 应该是b-a
-
13:54 - 14:01n-k=b+1-(a+1)=b-a
-
14:01 - 14:03n-k=b+1-(a+1)=b-a
-
14:03 - 14:09所以这里是(b-a)!
-
14:09 - 14:14后面是p的k-1次方 也就是p的a次方
-
14:14 - 14:19乘以1-p的n-k次方
-
14:19 - 14:23仍然有n-k=b-a
-
14:23 - 14:28基本完成 这个是什么
-
14:28 - 14:31基本完成 这个是什么
-
14:31 - 14:35我以一种更简单的方式重写一下
-
14:35 - 14:42这等于npΣ… a从0到b
-
14:42 - 14:44其中这是b选a 从b中选a的不同选法种数
-
14:44 - 14:48其中这是b选a 从b中选a的不同选法种数
-
14:48 - 14:56乘以p的a次方 乘以1-p的b-a次方
-
14:56 - 14:59这是什么
-
14:59 - 15:02这里是对二项分布的每一项求和
-
15:02 - 15:05比如a=0的概率是多少
-
15:05 - 15:08这是每一种a值的概率
-
15:08 - 15:12然后把所有放到一起求和
-
15:12 - 15:17我简单画个图
-
15:17 - 15:19a=0的概率是这么多
-
15:19 - 15:22a=1时是另外一个概率 一直下去 越来越高
-
15:22 - 15:23a=1时是另外一个概率 一直下去 越来越高
-
15:23 - 15:27最后得到一个接近钟形曲线的形状
-
15:27 - 15:31这一项对应于每一个概率
-
15:31 - 15:34每个长方形代表这其中一项
-
15:34 - 15:38a=0对应第一项 a=1对应第二项
-
15:38 - 15:41a=2对应第三项 一直到a=b
-
15:41 - 15:45所有这些相加 这些都是概率值
-
15:45 - 15:51这相当于随机变量取到任意一个值的概率
-
15:51 - 15:54随机变量取到任意某个值的概率
-
15:54 - 15:58也就是所有可能的概率加起来
-
15:58 - 16:01结果肯定等于1
-
16:01 - 16:04以投硬币为例
-
16:04 - 16:05以投硬币为例
-
16:05 - 16:08这等于0次正面的概率+1次正面概率
-
16:08 - 16:11这等于0次正面的概率+1次正面概率
-
16:11 - 16:14加2次正面的概率+3次正面的概率
-
16:14 - 16:16一直加到b次正面的概率
-
16:16 - 16:19所有情况中任意一种发生的概率
-
16:19 - 16:22也就是整个概率分布上的和 也就是1
-
16:22 - 16:27也就是整个概率分布上的和 也就是1
-
16:27 - 16:32这样随机变量X的期望值就是np了
-
16:32 - 16:36这样随机变量X的期望值就是np了
-
16:36 - 16:39其中n是试验次数 p是每次成功的概率
-
16:39 - 16:40其中n是试验次数 p是每次成功的概率
-
16:40 - 16:43该公式只针对二项分布 不针对其它分布的随机变量
-
16:43 - 16:45该公式只针对二项分布 不针对其它分布的随机变量
-
16:45 - 16:48只对二项分布的随机变量X成立
-
16:48 - 16:51只对二项分布的随机变量X成立
-
16:51 - 16:54这次超时太多了 下次见