Digamos que eres una clase de "ingeniero del tráfico" y lo que
tu quieres saber es, ¿cuántos carros pasan por determinado
lugar en la calle en determinado momento?
Y quieres conocer las probabilidades de que
pasen cien carros o que pasen cinco en determinada hora.
Así que un buen punto de inicio es definir una
variable aleatoria que represente lo que a ti te interesa.
Así que digámos que el número de carros que pasan en
determinado tiempo, digámos, en una hora.
Y tu objetivo es descifrar la distribución de probabilidad
de esta variable aleatoria y una vez que conozcas
la distribución de la probabilidad podrás conocer cuál es la
probabilidad de que cien carros pasen en una hora, o la probabilidad
de que ningún carro pase en una hora y serías imparable.
Y sólo un poco de lado, sólo para seguir adelante con este video,
hay dos suposiciones que tenemos que hacer porque
vamos a estudiar la distribución Poisson.
Y para estudiarla hay dos suposiciones
que debemos hacer:
Que cualqueir hora en este lugar de la calle no es diferente
con cualquier otra hora.
Y sabemos que eso es probablemente falso.
A las horas pico en una situaicón real probablemente
tendrás más carros que a otra hora pico.
Y tu sabes, si quieres ser más realista quizás debamos
hacerlo de día porque en el día cualquier periodo de tiempo---
de hecho no,
no debería hacerlo de día.
Debemos aumir que cualquier hora es exactamente igual
a cualquier otra hora, y de hecho, incluso dentro de una hora
no hay diferencias de un segundo a otro segundo,
en términos de la probabilidad de que un carro llegue.
Así que ahí está un poco de los suposición que
quizás no apliquen totalmente al tráfico, pero creo que
podemos hacer esa suposición.
Y luego la otra suposición que tenemos que haces es que si
un grupo de carros pasan en una hora, eso no significa que menos
carros vayan a pasar en la siguiente.
De ninguna manera el númeo de carros que pasan en un periodo de tiempo
afectan o están correlacionados o de alguna manera afectan al número de carros
que pasen en el siguiente.
Son verdaderamente independientes.
Considerando eso, podemos al menos intentar usar las habilidades
para modelar algún tipo de distribución.
Lo primero que haces, y yo recomiendo hacer esto para cualquier
distribución, es quizás estimar la media.
Sentémonos en esa curva y midamos... qué variables es esta
sobre un grupo de horas y luego promediémosla, y eso va a
ser un muy buen estimador de la media real
de nuestra población.
O, puesto que es una variable aleatoria, el valor esperado
de esta variable aleatoria.
Digamos que haces eso y obtienes el mejor estimado del
valor esperado de la variable aleatoria es--- usaré
la letra lambda.
Tu sábes, que esto puede ser nueve carros por hora,
te sientas allá afuera--- puede ser 9.3 carros por hora,
te sentaste allá cientos de horas y tú sólo cuentas
el número de carros, cada hora, y los promedias todos.
Y dices, en promedio, hay 9.3 carros por hora y crees
que ese es un buena estimación.
Así que eso es lo que tienes.
Y veamos que podemos hacer,
conocemos la distribución binomial
La distribución binomial nos dice que el valor esperado de una
variable aleatoria es igual al número de eventos que
componen a esa variable aleatoria, cierto?
Antes, en videos anteriores estuvimos contando el número
de caras en un volado.
Asi que esto sería el número de volados, por la
probabilidad de éxito en cada volado.
Eso es lo que hicimos en la distribución binomial.
Así que quizás podamos modelar nuestra situación vehicular
haciendo algo similar.
Este es el número de carros que pasan en una hora.
Así que quizás podamos decir que carros-lambda por hora
es igual a--- no sé...
Hagamos cada experimento o cada volado igual a
si un carro pasa en determinado minuto.
Hay 60 minutos por cada hora, así que
serían 60 eventos.
Y luego, la probabilidad de que tengamos éxito en cada uno de
esos eventos, si modelamos esto como una distribución binomial
sería lambda sobre 60 carros por minuto.
Y esto sería una probabilidad.
Esto sería n, y esto sería la probabilidad, si nosotros decimos
que esto es una distribución binomial.
Y esto probablemente no sería una aproximación tan mala.
Si tu puedes decir, oh, esto es una distribución
binomial, así que la probabilidad de que nuestra variable
aleatoria se igual a un determinado valor, k.
Tu sabes, que la probabilidad de que 3 carros, exactamente tres carros pasen en
determinada hora, serían entonces iguales a n.
así que n sería 60.
Elige k, y bueno, tengo tres autos, multiplicado por
la probabilidad de éxito.
Así que la probabilidad de que un auto pase en cualquier minuto.
Sería lambda sobre 60 elevado a la potencia
del número de éxitos que necesitamos,
así que a la k potencia, por, la probabilidad de fracaso
o de que ningún auto pase, a la n menos k
Si tenemos k éxitos, el número de fracasos sería
60 menos k.
Hay 60 menos k minutos en donde no pasó auto alguno.
Esto no sería una aproximación tan mala, donde
tienes 60 intervalos y dices que esto es una distribución
binomial.
Y probablemente obtengas resultados rasonables,
pero hay un asunto importante aquí,
en este modelo donde lo que modelamos tiene una distriución binomial,
qué pasaría si más de un auto pasa en una hora?
o más de un auto pasa en un minuto?
De la manera en la que lo tenemos ahora, le llamamos éxito si un
auto pasa en un minuto.
Y si tienes cuidado de contar, cuenta como un éxito, incluso
si 5 autos pasaran en un minuto.
Así que dices, oh, OK Sal, veo la solución ahí,
Sólo debo ser más específico,
En vez de dividirlo en minutos, ¿por qué no
dividirlo en segundos?
Así que la probabilidad de que tenga k éxitos, en vez de tener
60 intervalos, haré 3600 intervalos.
Así que la probabilidad de k segundos éxitosos, así que el segundo
en el que pase un auto, en ese momento, de 3,600 segundos.
Eso es k de 3,600, por la probabilidad de que un auto
pase en cualquier segundo.
Eso es el esperado número de autos que pasen una hora, dividido por
el número de segundos en una hora.
Vamos a tener k éxitos,
y éstos son los fracasos, la probabilidad de un fracaso
y vas a tener 3,600 menos k fracasos.
Y esto sería incluso una mejor aproximación.
De hecho esto no estaría tan mal, pero de todas formas, tu tienes esta
situación donde dos autos pueden pasar a medio
segundo de diferencia.
Y entonces me dices, oh, OK Sal, veo el patrón aquí,
solo debemos ser más y más específicos.
Solo tenemos que hacer este número más grande y
más grande y más grande.
Y tu intuición es correcta.
Y si tu haces eso, terminarás obteniendo la
distribución Poisson.
Y esto es muy interesante porque muchas veces la gente
te da la fórmula de la distribución Poisson y tú
puedes sólo meter los números y usarla,
pero es bonito saber que en realidad es sólo la distribución
binomial, y la distribución binomial realmente vino
del sentido común de hacer volados.
De ahí es de donde todo viene,
pero antes de probar que si tomamos el límite
como --- déjenme cambiar de colores---
Antes de que probemos que