0:00:00.860,0:00:03.540 Digamos que eres una clase de "ingeniero del tráfico" y lo que 0:00:03.540,0:00:06.810 tu quieres saber es, ¿cuántos carros pasan por determinado 0:00:06.810,0:00:08.320 lugar en la calle en determinado momento? 0:00:08.320,0:00:10.210 Y quieres conocer las probabilidades de que 0:00:10.210,0:00:14.010 pasen cien carros o que pasen cinco en determinada hora. 0:00:14.010,0:00:15.810 Así que un buen punto de inicio es definir una 0:00:15.810,0:00:20.530 variable aleatoria que represente lo que a ti te interesa. 0:00:20.530,0:00:27.350 Así que digámos que el número de carros que pasan en 0:00:27.350,0:00:30.407 determinado tiempo, digámos, en una hora. 0:00:31.710,0:00:34.510 Y tu objetivo es descifrar la distribución de probabilidad 0:00:34.510,0:00:37.050 de esta variable aleatoria y una vez que conozcas 0:00:37.050,0:00:39.450 la distribución de la probabilidad podrás conocer cuál es la 0:00:39.450,0:00:41.790 probabilidad de que cien carros pasen en una hora, o la probabilidad 0:00:41.790,0:00:45.890 de que ningún carro pase en una hora y serías imparable. 0:00:45.890,0:00:48.290 Y sólo un poco de lado, sólo para seguir adelante con este video, 0:00:48.290,0:00:50.540 hay dos suposiciones que tenemos que hacer porque 0:00:50.540,0:00:52.235 vamos a estudiar la distribución Poisson. 0:00:52.235,0:00:54.110 Y para estudiarla hay dos suposiciones 0:00:54.110,0:00:54.630 que debemos hacer: 0:00:54.630,0:00:58.770 Que cualqueir hora en este lugar de la calle no es diferente 0:00:58.770,0:00:59.650 con cualquier otra hora. 0:00:59.650,0:01:01.340 Y sabemos que eso es probablemente falso. 0:01:01.340,0:01:03.750 A las horas pico en una situaicón real probablemente 0:01:03.750,0:01:06.640 tendrás más carros que a otra hora pico. 0:01:06.640,0:01:08.640 Y tu sabes, si quieres ser más realista quizás debamos 0:01:08.640,0:01:12.370 hacerlo de día porque en el día cualquier periodo de tiempo--- 0:01:12.370,0:01:12.750 de hecho no, 0:01:12.750,0:01:14.120 no debería hacerlo de día. 0:01:14.120,0:01:17.750 Debemos aumir que cualquier hora es exactamente igual 0:01:17.750,0:01:19.650 a cualquier otra hora, y de hecho, incluso dentro de una hora 0:01:19.650,0:01:22.990 no hay diferencias de un segundo a otro segundo, 0:01:22.990,0:01:25.820 en términos de la probabilidad de que un carro llegue. 0:01:25.820,0:01:27.950 Así que ahí está un poco de los suposición que 0:01:27.950,0:01:29.950 quizás no apliquen totalmente al tráfico, pero creo que 0:01:29.950,0:01:32.270 podemos hacer esa suposición. 0:01:32.270,0:01:34.160 Y luego la otra suposición que tenemos que haces es que si 0:01:34.160,0:01:36.690 un grupo de carros pasan en una hora, eso no significa que menos 0:01:36.690,0:01:37.820 carros vayan a pasar en la siguiente. 0:01:37.820,0:01:40.630 De ninguna manera el númeo de carros que pasan en un periodo de tiempo 0:01:40.630,0:01:44.860 afectan o están correlacionados o de alguna manera afectan al número de carros 0:01:44.860,0:01:45.380 que pasen en el siguiente. 0:01:45.380,0:01:47.370 Son verdaderamente independientes. 0:01:47.370,0:01:50.670 Considerando eso, podemos al menos intentar usar las habilidades 0:01:50.670,0:01:53.480 para modelar algún tipo de distribución. 0:01:53.480,0:01:55.770 Lo primero que haces, y yo recomiendo hacer esto para cualquier 0:01:55.770,0:01:59.090 distribución, es quizás estimar la media. 0:01:59.090,0:02:03.040 Sentémonos en esa curva y midamos... qué variables es esta 0:02:03.040,0:02:05.170 sobre un grupo de horas y luego promediémosla, y eso va a 0:02:05.170,0:02:08.890 ser un muy buen estimador de la media real 0:02:08.890,0:02:09.880 de nuestra población. 0:02:09.880,0:02:12.270 O, puesto que es una variable aleatoria, el valor esperado 0:02:12.270,0:02:13.010 de esta variable aleatoria. 0:02:13.010,0:02:16.660 Digamos que haces eso y obtienes el mejor estimado del 0:02:16.660,0:02:22.270 valor esperado de la variable aleatoria es--- usaré 0:02:22.270,0:02:24.850 la letra lambda. 0:02:24.850,0:02:27.380 Tu sábes, que esto puede ser nueve carros por hora, 0:02:27.380,0:02:30.190 te sientas allá afuera--- puede ser 9.3 carros por hora, 0:02:30.190,0:02:32.670 te sentaste allá cientos de horas y tú sólo cuentas 0:02:32.670,0:02:34.590 el número de carros, cada hora, y los promedias todos. 0:02:34.590,0:02:37.250 Y dices, en promedio, hay 9.3 carros por hora y crees 0:02:37.250,0:02:38.680 que ese es un buena estimación. 0:02:38.680,0:02:40.080 Así que eso es lo que tienes. 0:02:40.080,0:02:42.000 Y veamos que podemos hacer, 0:02:42.000,0:02:45.560 conocemos la distribución binomial 0:02:45.560,0:02:50.650 La distribución binomial nos dice que el valor esperado de una 0:02:50.650,0:02:55.220 variable aleatoria es igual al número de eventos que 0:02:55.220,0:02:57.460 componen a esa variable aleatoria, cierto? 0:02:57.460,0:02:59.490 Antes, en videos anteriores estuvimos contando el número 0:02:59.490,0:03:00.500 de caras en un volado. 0:03:00.500,0:03:03.070 Asi que esto sería el número de volados, por la 0:03:03.070,0:03:07.290 probabilidad de éxito en cada volado. 0:03:07.290,0:03:09.000 Eso es lo que hicimos en la distribución binomial. 0:03:09.000,0:03:11.670 Así que quizás podamos modelar nuestra situación vehicular 0:03:11.670,0:03:12.780 haciendo algo similar. 0:03:12.780,0:03:15.400 Este es el número de carros que pasan en una hora. 0:03:15.400,0:03:22.800 Así que quizás podamos decir que carros-lambda por hora 0:03:22.800,0:03:24.330 es igual a--- no sé... 0:03:26.850,0:03:29.880 Hagamos cada experimento o cada volado igual a 0:03:29.880,0:03:31.780 si un carro pasa en determinado minuto. 0:03:31.780,0:03:37.980 Hay 60 minutos por cada hora, así que 0:03:37.980,0:03:40.870 serían 60 eventos. 0:03:40.870,0:03:43.190 Y luego, la probabilidad de que tengamos éxito en cada uno de 0:03:43.190,0:03:46.990 esos eventos, si modelamos esto como una distribución binomial 0:03:46.990,0:03:54.450 sería lambda sobre 60 carros por minuto. 0:03:54.450,0:03:55.660 Y esto sería una probabilidad. 0:03:55.660,0:03:58.640 Esto sería n, y esto sería la probabilidad, si nosotros decimos 0:03:58.640,0:04:00.270 que esto es una distribución binomial. 0:04:00.270,0:04:04.030 Y esto probablemente no sería una aproximación tan mala. 0:04:04.030,0:04:06.130 Si tu puedes decir, oh, esto es una distribución 0:04:06.130,0:04:10.380 binomial, así que la probabilidad de que nuestra variable 0:04:10.380,0:04:12.940 aleatoria se igual a un determinado valor, k. 0:04:12.940,0:04:16.170 Tu sabes, que la probabilidad de que 3 carros, exactamente tres carros pasen en 0:04:16.170,0:04:19.750 determinada hora, serían entonces iguales a n. 0:04:19.750,0:04:21.890 así que n sería 60. 0:04:21.890,0:04:26.010 Elige k, y bueno, tengo tres autos, multiplicado por 0:04:26.010,0:04:27.190 la probabilidad de éxito. 0:04:27.190,0:04:29.570 Así que la probabilidad de que un auto pase en cualquier minuto. 0:04:29.570,0:04:34.770 Sería lambda sobre 60 elevado a la potencia 0:04:34.770,0:04:35.980 del número de éxitos que necesitamos, 0:04:35.980,0:04:41.660 así que a la k potencia, por, la probabilidad de fracaso 0:04:41.660,0:04:46.560 o de que ningún auto pase, a la n menos k 0:04:46.560,0:04:50.230 Si tenemos k éxitos, el número de fracasos sería[br]60 menos k. 0:04:50.230,0:04:52.950 Hay 60 menos k minutos en donde no pasó auto alguno. 0:04:52.950,0:04:55.270 Esto no sería una aproximación tan mala, donde 0:04:55.270,0:04:57.250 tienes 60 intervalos y dices que esto es una distribución 0:04:57.250,0:04:58.560 binomial. 0:04:58.560,0:05:00.310 Y probablemente obtengas resultados rasonables, 0:05:00.310,0:05:02.600 pero hay un asunto importante aquí, 0:05:02.600,0:05:06.580 en este modelo donde lo que modelamos tiene una distriución binomial, 0:05:06.580,0:05:09.980 qué pasaría si más de un auto pasa en una hora? 0:05:09.980,0:05:11.630 o más de un auto pasa en un minuto? 0:05:11.630,0:05:14.270 De la manera en la que lo tenemos ahora, le llamamos éxito si un 0:05:14.270,0:05:15.320 auto pasa en un minuto. 0:05:15.320,0:05:18.790 Y si tienes cuidado de contar, cuenta como un éxito, incluso 0:05:18.790,0:05:21.190 si 5 autos pasaran en un minuto. 0:05:21.190,0:05:23.390 Así que dices, oh, OK Sal, veo la solución ahí, 0:05:23.390,0:05:26.040 Sólo debo ser más específico, 0:05:26.040,0:05:28.870 En vez de dividirlo en minutos, ¿por qué no 0:05:28.870,0:05:31.050 dividirlo en segundos? 0:05:31.050,0:05:36.210 Así que la probabilidad de que tenga k éxitos, en vez de tener 0:05:36.210,0:05:39.820 60 intervalos, haré 3600 intervalos. 0:05:39.820,0:05:43.170 Así que la probabilidad de k segundos éxitosos, así que el segundo 0:05:43.170,0:05:48.610 en el que pase un auto, en ese momento, de 3,600 segundos. 0:05:48.610,0:05:52.190 Eso es k de 3,600, por la probabilidad de que un auto 0:05:52.190,0:05:55.210 pase en cualquier segundo. 0:05:55.210,0:05:57.930 Eso es el esperado número de autos que pasen una hora, dividido por 0:05:57.930,0:06:00.430 el número de segundos en una hora. 0:06:00.430,0:06:01.403 Vamos a tener k éxitos, 0:06:03.990,0:06:06.270 y éstos son los fracasos, la probabilidad de un fracaso 0:06:06.270,0:06:12.050 y vas a tener 3,600 menos k fracasos. 0:06:12.050,0:06:13.910 Y esto sería incluso una mejor aproximación. 0:06:13.910,0:06:16.770 De hecho esto no estaría tan mal, pero de todas formas, tu tienes esta 0:06:16.770,0:06:19.100 situación donde dos autos pueden pasar a medio 0:06:19.100,0:06:19.980 segundo de diferencia. 0:06:19.980,0:06:21.910 Y entonces me dices, oh, OK Sal, veo el patrón aquí, 0:06:21.910,0:06:23.650 solo debemos ser más y más específicos. 0:06:23.650,0:06:26.170 Solo tenemos que hacer este número más grande y 0:06:26.170,0:06:27.400 más grande y más grande. 0:06:27.400,0:06:28.950 Y tu intuición es correcta. 0:06:28.950,0:06:31.340 Y si tu haces eso, terminarás obteniendo la 0:06:31.340,0:06:33.860 distribución Poisson. 0:06:33.860,0:06:35.620 Y esto es muy interesante porque muchas veces la gente 0:06:35.620,0:06:38.600 te da la fórmula de la distribución Poisson y tú 0:06:38.600,0:06:40.420 puedes sólo meter los números y usarla, 0:06:40.420,0:06:43.250 pero es bonito saber que en realidad es sólo la distribución 0:06:43.250,0:06:45.790 binomial, y la distribución binomial realmente vino 0:06:45.790,0:06:48.590 del sentido común de hacer volados. 0:06:48.590,0:06:50.500 De ahí es de donde todo viene, 0:06:50.500,0:06:53.710 pero antes de probar que si tomamos el límite 0:06:53.710,0:06:55.670 como --- déjenme cambiar de colores--- 0:06:55.670,0:06:58.470 Antes de que probemos que