假設你是一個交通工程師
想知道任意時刻通過街上某一點的車輛數
想知道任意時刻通過街上某一點的車輛數
想確定某一小時內100輛車或5輛車通過的機率
想確定某一小時內100輛車或5輛車通過的機率
最好的方式是先定義一個相關的隨機變數
最好的方式是先定義一個相關的隨機變數
假設它表示一個小時內通過車輛數
假設它表示一個小時內通過車輛數
然後求出該隨機變數的機率分布
然後求出該隨機變數的機率分布
這就能很容易求出
一小時內100輛車
或者其它數量的車經過的機率了
在具體講泊松分布之前 有兩個假設要講一下
在具體講泊松分布之前 有兩個假設要講一下
在具體講泊松分布之前 有兩個假設要講一下
也就是
街上此點任意時刻的情況沒有差異
街上此點任意時刻的情況沒有差異
這顯然不是真實情況 高峰時間肯定比一般時間車多
這顯然不是真實情況 高峰時間肯定比一般時間車多
這顯然不是真實情況 高峰時間肯定比一般時間車多
也許不用一小時 用一天更現實一點
也許不用一小時 用一天更現實一點
算了 不這麽說
這裡假設任意時刻
甚至每分每秒 在車流量方面都是沒有差異的
甚至每分每秒 在車流量方面都是沒有差異的
甚至每分每秒 在車流量方面都是沒有差異的
這是一種簡化假設
雖然不真實 但不妨就認爲是這樣
另一個假設是
一段時間的車流量對另一段時間沒有影響
一段時間的車流量對另一段時間沒有影響
就算一段時間的車流量少
不會影響到下一段時間的車流量
也就是說具有獨立性
這樣 我們就能用所學知識
對這種分布進行建模了
對於任何分布 我們可以首先估計均值
對於任何分布 我們可以首先估計均值
我們可以坐在路邊 觀察幾個小時的車流量
然後平均起來
這也許就是總體均值的很好估計值了
這也許就是總體均值的很好估計值了
這是一個隨機變數 所以也就是預定值
假設預定值的最好估計值是λ
假設預定值的最好估計值是λ
它可能是9輛車/小時
或者9.3輛車/小時
你可以在守候數百個小時 然後計數 取均值
你可以在守候數百個小時 然後計數 取均值
得到均值是9.3輛車/小時 這也許是很好的估計值
得到均值是9.3輛車/小時 這也許是很好的估計值
而我們已經知道二項分布
二項分布的預定值我們已經知道
它等於試驗的次數n…
這是隨機變數的基本組成
之前的影片中 我們用抛硬幣的例子
之前的影片中 我們用抛硬幣的例子
n也就是抛硬幣的次數
乘以每一次成功的機率p
這是二項式分布 也許交通情況也可以類似建模
這是二項式分布 也許交通情況也可以類似建模
這是一小時內經過的車輛數
也許我們可以說 λ輛車/小時等於…
假設試驗是每分鍾內是否有車通過 就像投硬幣
假設試驗是每分鍾內是否有車通過 就像投硬幣
那麽一小時有60分鍾 總共60次試驗
然後每一次成功的機率
由於這是二項分布
所以是λ/60輛車/分鍾
前面這是n 後面是機率p
前面這是n 後面是機率p
前面這是n 後面是機率p
這也許並非很糟糕的近似
由於是二項分布
隨機變數得到某個k值的機率
比如一小時內經過3輛車的機率
這也就是n… 也就是60
n選k 比如剛講的3輛車經過 乘以成功機率
即每分鍾內有車經過的機率 也就是λ/60
即每分鍾內有車經過的機率 也就是λ/60
該機率的k次方 乘以不成功
或者說無車經過的機率 的n-k次方
k次成功對應60-k次失敗 或者說無車經過
k次成功對應60-k次失敗 或者說無車經過
分成60個區間 然後看成二項分布是不錯的近似
分成60個區間 然後看成二項分布是不錯的近似
結果可能很合理 不過有個核心問題
結果可能很合理 不過有個核心問題
也就是 如果一分鍾內不止一輛車通過怎麽辦
也就是 如果一分鍾內不止一輛車通過怎麽辦
也就是 如果一分鍾內不止一輛車通過怎麽辦
之前我們把有一輛車通過叫成功
之前我們把有一輛車通過叫成功
但沒有考慮到一分鍾內同時5車通過這樣的情況
但沒有考慮到一分鍾內同時5車通過這樣的情況
解決辦法是 分更多的區間
解決辦法是 分更多的區間
如果分鍾不行 我可以分成秒
這樣區間就不是60個 而是3600個
這樣區間就不是60個 而是3600個
k次成功的機率
成功也就是某一秒有車通過
這等於3600選k乘以某一秒有車通過的幾率…
這等於3600選k乘以某一秒有車通過的幾率…
也就是一小時內車通過的期望數量λ
除以一小時內的秒數 然後有k次成功
然後還有失敗 失敗機率是這麽多
總共是3600-k次失敗
這是更好的近似
這是更好的近似
但也有可能一秒鍾開過2輛車
你可能會說 繼續進行區間分割不就行了
你可能會說 繼續進行區間分割不就行了
讓這個數字越來越大 這種直觀感覺很對
讓這個數字越來越大 這種直觀感覺很對
一直下去就能得到泊松分布
一般而言 書本只會給出泊松分布的公式讓你套
一般而言 書本只會給出泊松分布的公式讓你套
一般而言 書本只會給出泊松分布的公式讓你套
而我這裡告訴你們 它其實就是來自二項分布
而我這裡告訴你們 它其實就是來自二項分布
而二項分布就是某種抛硬幣 這是一切的源頭
而二項分布就是某種抛硬幣 這是一切的源頭
在我證明… 先換個顏色
在我證明… 先換個顏色
在我證明區間個數趨近於無窮大時
在我證明區間個數趨近於無窮大時
這就是泊松分布之前
首先來複習一下手頭的數學工具
首先這個你們可能比較熟悉 也就是
首先這個你們可能比較熟悉 也就是
x趨於無窮大時 (1+a/x)的x次方極限是e的a次方
x趨於無窮大時 (1+a/x)的x次方極限是e的a次方
爲了證明這一點 我做一點簡單換元
爲了證明這一點 我做一點簡單換元
令1/n=a/x
於是x=na
x?1=na
因此x趨於無窮大時 n趨於什麽
因此x趨於無窮大時 n趨於什麽
n=x/a 所以n也趨於無窮
因此換元後 這等價於 求極限 n趨於∞
因此換元後 這等價於 求極限 n趨於∞
1+… a/x替換爲1/n
而x則替換爲na
於是這等價於 n趨於∞時
(1+1/n)的n次方的a次方的極限
a中不含n 所以也就是這個極限的a次方
a中不含n 所以也就是這個極限的a次方
也就是n趨於∞時(1+1/n)?的極限的a次方
也就是n趨於∞時(1+1/n)?的極限的a次方
(1+1/n)?的極限就是e的定義 講複利時我講過
(1+1/n)?的極限就是e的定義 講複利時我講過
你可以用計算器試試很大的n值 看是否得到e
你可以用計算器試試很大的n值 看是否得到e
裏面這個等於e 然後取a次冪
也就是e的a次方
因此這個極限等於e的a次方
因此這個極限等於e的a次方
另外一個我要講的工具也許要在下一節才能證明
另外一個我要講的工具也許要在下一節才能證明
也就是x!/(x-k)!=x(x-1)(x-2)一直乘到(x-k+1)
也就是x!/(x-k)!=x(x-1)(x-2)一直乘到(x-k+1)
也就是x!/(x-k)!=x(x-1)(x-2)一直乘到(x-k+1)
我們做過很多次 但沒有寫得這麽抽象過
我們做過很多次 但沒有寫得這麽抽象過
這裡正好是k項
這裡正好是k項
1 2 3一直到第k項
1 2 3一直到第k項
這對泊松分布的推導很重要
這對泊松分布的推導很重要
我舉個實際例子 比如7!/(7-2)!
這等於7?6?5?4?3?2?1
除以5的階乘
即除以5?4?3?2?1
約去後只剩下7?6
首先是7 最後項是7-2+1 即6
此時k=2 正好2項
下一節再來推導泊松分布 再見
下一節再來推導泊松分布 再見
下一節再來推導泊松分布 再見
本字幕由網易公開課提供,更多課程請到http//open.163.com
網易公開課官方微博 http://t.163.com/163open
oCourse字幕組翻譯:只做公開課的字幕組 http://ocourse.org