Poisson Process 1
-
0:00 - 0:03假设你是一个交通工程师
-
0:01 - 0:15本字幕由网易公开课提供,更多课程请到http//open.163.com
-
0:03 - 0:06想知道任意时刻通过街上某一点的车辆数
-
0:06 - 0:08想知道任意时刻通过街上某一点的车辆数
-
0:08 - 0:10想确定某一小时内100辆车或5辆车通过的概率
-
0:10 - 0:14想确定某一小时内100辆车或5辆车通过的概率
-
0:14 - 0:15最好的方式是先定义一个相关的随机变量
-
0:15 - 0:20最好的方式是先定义一个相关的随机变量
-
0:17 - 0:25网易公开课官方微博 http://t.163.com/163open
-
0:20 - 0:27假设它表示一个小时内通过车辆数
-
0:27 - 0:30假设它表示一个小时内通过车辆数
-
0:30 - 0:45oCourse字幕组翻译:只做公开课的字幕组 http://ocourse.org
-
0:31 - 0:34然后求出该随机变量的概率分布
-
0:34 - 0:37然后求出该随机变量的概率分布
-
0:37 - 0:39这就能很容易求出
-
0:39 - 0:41一小时内100辆车
-
0:41 - 0:45或者其它数量的车经过的概率了
-
0:45 - 0:48在具体讲泊松分布之前 有两个假设要讲一下
-
0:48 - 0:50在具体讲泊松分布之前 有两个假设要讲一下
-
0:50 - 0:52在具体讲泊松分布之前 有两个假设要讲一下
-
0:52 - 0:54也就是
-
0:54 - 0:58街上此点任意时刻的情况没有差异
-
0:58 - 0:59街上此点任意时刻的情况没有差异
-
0:59 - 1:01这显然不是真实情况 高峰时间肯定比一般时间车多
-
1:01 - 1:03这显然不是真实情况 高峰时间肯定比一般时间车多
-
1:03 - 1:06这显然不是真实情况 高峰时间肯定比一般时间车多
-
1:06 - 1:08也许不用一小时 用一天更现实一点
-
1:08 - 1:12也许不用一小时 用一天更现实一点
-
1:12 - 1:14算了 不这么说
-
1:14 - 1:17这里假设任意时刻
-
1:17 - 1:19甚至每分每秒 在车流量方面都是没有差异的
-
1:19 - 1:22甚至每分每秒 在车流量方面都是没有差异的
-
1:22 - 1:25甚至每分每秒 在车流量方面都是没有差异的
-
1:25 - 1:27这是一种简化假设
-
1:27 - 1:32虽然不真实 但不妨就认为是这样
-
1:32 - 1:34另一个假设是
-
1:34 - 1:36一段时间的车流量对另一段时间没有影响
-
1:36 - 1:37一段时间的车流量对另一段时间没有影响
-
1:37 - 1:40就算一段时间的车流量少
-
1:40 - 1:44不会影响到下一段时间的车流量
-
1:44 - 1:47也就是说具有独立性
-
1:47 - 1:50这样 我们就能用所学知识
-
1:50 - 1:53对这种分布进行建模了
-
1:53 - 1:55对于任何分布 我们可以首先估计均值
-
1:55 - 1:59对于任何分布 我们可以首先估计均值
-
1:59 - 2:03我们可以坐在路边 观察几个小时的车流量
-
2:03 - 2:05然后平均起来
-
2:05 - 2:08这也许就是总体均值的很好估计值了
-
2:08 - 2:10这也许就是总体均值的很好估计值了
-
2:10 - 2:13这是一个随机变量 所以也就是期望值
-
2:13 - 2:16假设期望值的最好估计值是λ
-
2:16 - 2:24假设期望值的最好估计值是λ
-
2:24 - 2:27它可能是9辆车/小时
-
2:27 - 2:30或者9.3辆车/小时
-
2:30 - 2:32你可以在守候数百个小时 然后计数 取均值
-
2:32 - 2:34你可以在守候数百个小时 然后计数 取均值
-
2:34 - 2:37得到均值是9.3辆车/小时 这也许是很好的估计值
-
2:37 - 2:40得到均值是9.3辆车/小时 这也许是很好的估计值
-
2:40 - 2:45而我们已经知道二项分布
-
2:45 - 2:50二项分布的期望值我们已经知道
-
2:50 - 2:55它等于试验的次数n…
-
2:55 - 2:57这是随机变量的基本组成
-
2:57 - 2:59之前的视频中 我们用抛硬币的例子
-
2:59 - 3:00之前的视频中 我们用抛硬币的例子
-
3:00 - 3:03n也就是抛硬币的次数
-
3:03 - 3:07乘以每一次成功的概率p
-
3:07 - 3:09这是二项式分布 也许交通情况也可以类似建模
-
3:09 - 3:12这是二项式分布 也许交通情况也可以类似建模
-
3:12 - 3:15这是一小时内经过的车辆数
-
3:15 - 3:24也许我们可以说 λ辆车/小时等于…
-
3:26 - 3:29假设试验是每分钟内是否有车通过 就像投硬币
-
3:29 - 3:31假设试验是每分钟内是否有车通过 就像投硬币
-
3:31 - 3:40那么一小时有60分钟 总共60次试验
-
3:40 - 3:43然后每一次成功的概率
-
3:43 - 3:46由于这是二项分布
-
3:46 - 3:54所以是λ/60辆车/分钟
-
3:54 - 3:55前面这是n 后面是概率p
-
3:55 - 3:58前面这是n 后面是概率p
-
3:58 - 4:00前面这是n 后面是概率p
-
4:00 - 4:04这也许并非很糟糕的近似
-
4:04 - 4:07由于是二项分布
-
4:07 - 4:12随机变量得到某个k值的概率
-
4:12 - 4:16比如一小时内经过3辆车的概率
-
4:16 - 4:21这也就是n… 也就是60
-
4:21 - 4:27n选k 比如刚讲的3辆车经过 乘以成功概率
-
4:27 - 4:29即每分钟内有车经过的概率 也就是λ/60
-
4:29 - 4:35即每分钟内有车经过的概率 也就是λ/60
-
4:35 - 4:41该概率的k次方 乘以不成功
-
4:41 - 4:46或者说无车经过的概率 的n-k次方
-
4:46 - 4:50k次成功对应60-k次失败 或者说无车经过
-
4:50 - 4:52k次成功对应60-k次失败 或者说无车经过
-
4:52 - 4:55分成60个区间 然后看成二项分布是不错的近似
-
4:55 - 4:58分成60个区间 然后看成二项分布是不错的近似
-
4:58 - 5:00结果可能很合理 不过有个核心问题
-
5:00 - 5:02结果可能很合理 不过有个核心问题
-
5:02 - 5:06也就是 如果一分钟内不止一辆车通过怎么办
-
5:06 - 5:09也就是 如果一分钟内不止一辆车通过怎么办
-
5:09 - 5:11也就是 如果一分钟内不止一辆车通过怎么办
-
5:11 - 5:14之前我们把有一辆车通过叫成功
-
5:14 - 5:15之前我们把有一辆车通过叫成功
-
5:15 - 5:18但没有考虑到一分钟内同时5车通过这样的情况
-
5:18 - 5:21但没有考虑到一分钟内同时5车通过这样的情况
-
5:21 - 5:23解决办法是 分更多的区间
-
5:23 - 5:26解决办法是 分更多的区间
-
5:26 - 5:31如果分钟不行 我可以分成秒
-
5:31 - 5:36这样区间就不是60个 而是3600个
-
5:36 - 5:39这样区间就不是60个 而是3600个
-
5:39 - 5:43k次成功的概率
-
5:43 - 5:48成功也就是某一秒有车通过
-
5:48 - 5:52这等于3600选k乘以某一秒有车通过的几率…
-
5:52 - 5:54这等于3600选k乘以某一秒有车通过的几率…
-
5:54 - 5:57也就是一小时内车通过的期望数量λ
-
5:57 - 6:02除以一小时内的秒数 然后有k次成功
-
6:02 - 6:06然后还有失败 失败概率是这么多
-
6:06 - 6:12总共是3600-k次失败
-
6:12 - 6:13这是更好的近似
-
6:13 - 6:16这是更好的近似
-
6:16 - 6:19但也有可能一秒钟开过2辆车
-
6:19 - 6:21你可能会说 继续进行区间分割不就行了
-
6:21 - 6:23你可能会说 继续进行区间分割不就行了
-
6:23 - 6:27让这个数字越来越大 这种直观感觉很对
-
6:27 - 6:28让这个数字越来越大 这种直观感觉很对
-
6:28 - 6:33一直下去就能得到泊松分布
-
6:33 - 6:35一般而言 书本只会给出泊松分布的公式让你套
-
6:35 - 6:38一般而言 书本只会给出泊松分布的公式让你套
-
6:38 - 6:40一般而言 书本只会给出泊松分布的公式让你套
-
6:40 - 6:43而我这里告诉你们 它其实就是来自二项分布
-
6:43 - 6:45而我这里告诉你们 它其实就是来自二项分布
-
6:45 - 6:48而二项分布就是某种抛硬币 这是一切的源头
-
6:48 - 6:50而二项分布就是某种抛硬币 这是一切的源头
-
6:50 - 6:53在我证明… 先换个颜色
-
6:53 - 6:55在我证明… 先换个颜色
-
6:55 - 6:58在我证明区间个数趋近于无穷大时
-
6:58 - 7:01在我证明区间个数趋近于无穷大时
-
7:01 - 7:05这就是泊松分布之前
-
7:05 - 7:09首先来复习一下手头的数学工具
-
7:09 - 7:12首先这个你们可能比较熟悉 也就是
-
7:12 - 7:15首先这个你们可能比较熟悉 也就是
-
7:15 - 7:25x趋于无穷大时 (1+a/x)的x次方极限是e的a次方
-
7:25 - 7:31x趋于无穷大时 (1+a/x)的x次方极限是e的a次方
-
7:31 - 7:38为了证明这一点 我做一点简单换元
-
7:38 - 7:39为了证明这一点 我做一点简单换元
-
7:39 - 7:47令1/n=a/x
-
7:47 - 7:52于是x=na
-
7:52 - 7:55x?1=na
-
7:55 - 8:02因此x趋于无穷大时 n趋于什么
-
8:02 - 8:04因此x趋于无穷大时 n趋于什么
-
8:04 - 8:08n=x/a 所以n也趋于无穷
-
8:08 - 8:10因此换元后 这等价于 求极限 n趋于∞
-
8:10 - 8:16因此换元后 这等价于 求极限 n趋于∞
-
8:16 - 8:211+… a/x替换为1/n
-
8:21 - 8:26而x则替换为na
-
8:26 - 8:30于是这等价于 n趋于∞时
-
8:30 - 8:39(1+1/n)的n次方的a次方的极限
-
8:39 - 8:41a中不含n 所以也就是这个极限的a次方
-
8:41 - 8:43a中不含n 所以也就是这个极限的a次方
-
8:43 - 8:47也就是n趋于∞时(1+1/n)?的极限的a次方
-
8:47 - 8:53也就是n趋于∞时(1+1/n)?的极限的a次方
-
8:53 - 8:58(1+1/n)?的极限就是e的定义 讲复利时我讲过
-
8:58 - 9:00(1+1/n)?的极限就是e的定义 讲复利时我讲过
-
9:00 - 9:03你可以用计算器试试很大的n值 看是否得到e
-
9:03 - 9:07你可以用计算器试试很大的n值 看是否得到e
-
9:07 - 9:12里面这个等于e 然后取a次幂
-
9:12 - 9:14也就是e的a次方
-
9:14 - 9:16因此这个极限等于e的a次方
-
9:16 - 9:17因此这个极限等于e的a次方
-
9:17 - 9:19另外一个我要讲的工具也许要在下一节才能证明
-
9:19 - 9:22另外一个我要讲的工具也许要在下一节才能证明
-
9:22 - 9:32也就是x!/(x-k)!=x(x-1)(x-2)一直乘到(x-k+1)
-
9:32 - 9:42也就是x!/(x-k)!=x(x-1)(x-2)一直乘到(x-k+1)
-
9:42 - 9:50也就是x!/(x-k)!=x(x-1)(x-2)一直乘到(x-k+1)
-
9:50 - 9:51我们做过很多次 但没有写得这么抽象过
-
9:51 - 9:53我们做过很多次 但没有写得这么抽象过
-
9:53 - 9:55这里正好是k项
-
9:55 - 9:57这里正好是k项
-
9:57 - 10:011 2 3一直到第k项
-
10:01 - 10:041 2 3一直到第k项
-
10:04 - 10:07这对泊松分布的推导很重要
-
10:07 - 10:09这对泊松分布的推导很重要
-
10:09 - 10:16我举个实际例子 比如7!/(7-2)!
-
10:16 - 10:24这等于7?6?5?4?3?2?1
-
10:24 - 10:28除以5的阶乘
-
10:28 - 10:33即除以5?4?3?2?1
-
10:33 - 10:37约去后只剩下7?6
-
10:37 - 10:47首先是7 最后项是7-2+1 即6
-
10:47 - 10:51此时k=2 正好2项
-
10:51 - 10:53下一节再来推导泊松分布 再见
-
10:53 - 10:55下一节再来推导泊松分布 再见
-
10:55 - 10:59下一节再来推导泊松分布 再见