WEBVTT 00:00:00.860 --> 00:00:03.540 Vamos supor que você seja alguém como um engenheiro de tráfego e 00:00:03.540 --> 00:00:06.810 que você está tentando resolver isso, quantos carros passam por 00:00:06.810 --> 00:00:08.320 um determinado ponto da estrada em um determinado período de tempo? 00:00:08.320 --> 00:00:10.210 E você está tentando descobrir a probabilidade de que 00:00:10.210 --> 00:00:14.010 100 carros passem ou 5 carros passem em uma dada hora. 00:00:14.010 --> 00:00:15.810 Então um bom modo de começar é justamente definir uma variável 00:00:15.810 --> 00:00:20.530 aleatória que essencialmente representará o foco do seu problema. 00:00:20.530 --> 00:00:27.350 Então digamos o número de carros que passa em certo 00:00:27.350 --> 00:00:30.407 período de tempo, digamos, em uma hora. 00:00:31.710 --> 00:00:34.510 E o seu objetivo é determinar a distribuição de probabilidades 00:00:34.510 --> 00:00:37.050 desta variável aleatória e uma vez que você conhecer a 00:00:37.050 --> 00:00:39.450 distribuição de probabilidades então você poderá determinar 00:00:39.450 --> 00:00:41.790 qual a probabilidade de que 100 carros passem em 1 hora ou a probabilidade 00:00:41.790 --> 00:00:45.890 de que nenhum carro passe em uma hora e você será demais! 00:00:45.890 --> 00:00:48.290 E um pouco fora do assunto, apenas para avançar com este 00:00:48.290 --> 00:00:50.540 vídeo, porquê há duas pressuposições que nós teremos que fazer porquê 00:00:50.540 --> 00:00:52.235 nós estamos estudando a distribuição de Possion. 00:00:52.235 --> 00:00:54.110 E para estudá-la há duas pressuposições que 00:00:54.110 --> 00:00:54.630 nós precisamos fazer: 00:00:54.630 --> 00:00:58.770 Que em qualquer horário neste ponto da estrada não há 00:00:58.770 --> 00:00:59.650 diferença para qualquer outro horário. 00:00:59.650 --> 00:01:01.340 E nós sabemos o quanto esta pressuposição é falsa. 00:01:01.340 --> 00:01:03.750 Durante o horário de pico você provavelmente terá 00:01:03.750 --> 00:01:06.640 muito mais carros do que em qualquer outro horário. 00:01:06.640 --> 00:01:08.640 E você sabe, se você quiser ser mais realista provavelmente 00:01:08.640 --> 00:01:12.370 você o fará por dia dia porquê em um dia qualquer período de tempo -- 00:01:12.370 --> 00:01:12.750 neste caso, não. 00:01:12.750 --> 00:01:14.120 Eu não poderia fazer por dia. 00:01:14.120 --> 00:01:17.750 Nós teremos que assumir que cada hora é exatamente como 00:01:17.750 --> 00:01:19.650 qualquer outra hora e neste caso, mesmo dentro de uma hora 00:01:19.650 --> 00:01:22.990 que não existe nenhuma diferença de um segundo para outro em 00:01:22.990 --> 00:01:25.820 termos das probabilidades de que passe um carro. 00:01:25.820 --> 00:01:27.950 Isso é uma hipótese simplificora muito forte que 00:01:27.950 --> 00:01:29.950 provavelmente não se aplica ao tráfego, mas eu penso 00:01:29.950 --> 00:01:32.270 que teremos que fazer esta presunção. 00:01:32.270 --> 00:01:34.160 E outra coisa que nós teremos que presumir é a de que se 00:01:34.160 --> 00:01:36.690 um bocado de carros passar em determinada hora isso não significará que menos 00:01:36.690 --> 00:01:37.820 carros passarão na próxima. 00:01:37.820 --> 00:01:40.630 De que de nenhuma maneira o número de carros que passa em um período 00:01:40.630 --> 00:01:44.860 afeta ou está relacionado ou de alguma maneira influencia o número de carros 00:01:44.860 --> 00:01:45.380 que passará no próximo. 00:01:45.380 --> 00:01:47.370 Que eles sejam realmente independentes. 00:01:47.370 --> 00:01:50.670 Dado isso, nós podemos ao menos tentar usar a proficiência 00:01:50.670 --> 00:01:53.480 que temos para modelar algum tipo de distribuição. 00:01:53.480 --> 00:01:55.770 A primeira coisa que eu faço é recomendar que você proceda assim para qualquer 00:01:55.770 --> 00:01:59.090 distribuição é que talvez nós possamos estimar a média. 00:01:59.090 --> 00:02:03.040 Vamos nos ater nesta curva e mensurar quanto é o valor desta variável 00:02:03.040 --> 00:02:05.170 depois de um bocado de horas e depois tirar a média disso, e isso será 00:02:05.170 --> 00:02:08.890 um ótimo estimador para a média existente 00:02:08.890 --> 00:02:09.880 da nossa população. 00:02:09.880 --> 00:02:12.270 Ou, uma vez que isto é uma variável aleatória, o valor da esperança 00:02:12.270 --> 00:02:13.010 desta variável aleatória. 00:02:13.010 --> 00:02:16.660 Digamos que você fez isso e que você obteve que melhor estimativa para o 00:02:16.660 --> 00:02:22.270 valor da esperança da sua variável aleatória é -- eu usarei 00:02:22.270 --> 00:02:24.850 a letra [grega] lambda. 00:02:24.850 --> 00:02:27.380 Você sabe, isso podem ser 9 carros por hora. 00:02:27.380 --> 00:02:30.190 Você se sentou lá -- isso pode ser 9,3 carros por hora. 00:02:30.190 --> 00:02:32.670 Você se sentou lá por horas e você apenas contou 00:02:32.670 --> 00:02:34.590 o número de carros há cada hora e você tirou a média disso tudo. 00:02:34.590 --> 00:02:37.250 Você diz, na média, são 9,3 carros por hora e você sente 00:02:37.250 --> 00:02:38.680 que esta é uma estimativa bastante boa. 00:02:38.680 --> 00:02:40.080 Então é isso que você tem aqui. 00:02:40.080 --> 00:02:42.000 E vamos dizer que isso nós possamos fazer. 00:02:42.000 --> 00:02:45.560 Nós conhecemos da distribuição binomial. 00:02:45.560 --> 00:02:50.650 A distribuição binomial nos diz que o valor de esperança de 00:02:50.650 --> 00:02:55.220 uma variável aleatória é igual ao número de tentativas da qual 00:02:55.220 --> 00:02:57.460 esta variável aleatória é composta por, correto? 00:02:57.460 --> 00:02:59.490 Antes, em vídeos anteriores nós estivemos contando o número 00:02:59.490 --> 00:03:00.500 de caras em lançamentos de moedas. 00:03:00.500 --> 00:03:03.070 Então isso poderia ser o número de lançamentos de moedas, vezes 00:03:03.070 --> 00:03:07.290 a probabilidade de sucesso em cada lançamento. 00:03:07.290 --> 00:03:09.000 E isso é o que nós fizemos na distribuição binomial. 00:03:09.000 --> 00:03:11.670 Então talvez nós possamos modelar nossa situação de tráfego 00:03:11.670 --> 00:03:12.780 de uma maneira similar. 00:03:12.780 --> 00:03:15.400 Este é o número de carros que passa em uma hora. 00:03:15.400 --> 00:03:22.800 Então talvez possamos dizer lambda carros por hora é igual 00:03:22.800 --> 00:03:24.330 a -- eu não sei. 00:03:26.850 --> 00:03:29.880 Vamos fazer cada experimento ou cada lançamento da moeda igual a 00:03:29.880 --> 00:03:31.780 quando passar um carro em um dado minuto. 00:03:31.780 --> 00:03:37.980 Então como há 60 minutos numa hora, então 00:03:37.980 --> 00:03:40.870 haverão 60 tentativas. 00:03:40.870 --> 00:03:43.190 E então, a probabilidade que nós tenhamos sucesso em cada uma 00:03:43.190 --> 00:03:46.990 dessas tentativas, se nós modelarmos isso como uma distribuição binomial 00:03:46.990 --> 00:03:54.450 será lambda sobre 60 carros por minuto. 00:03:54.450 --> 00:03:55.660 E isso poderá ser uma probabilidade. 00:03:55.660 --> 00:03:58.640 Isso poderá ser n, e isso poderá ser a probabilidade, se dissermos 00:03:58.640 --> 00:04:00.270 que isso é uma distribuição binomial. 00:04:00.270 --> 00:04:04.030 E esta probabilidade não poderá ser uma aproximação tão má assim. 00:04:04.030 --> 00:04:06.130 Se você neste caso disser, oh, esta é uma distribuição 00:04:06.130 --> 00:04:10.380 binomial, então a probabilidade da nossa variável 00:04:10.380 --> 00:04:12.940 aleatória irá ser igual a algum valor dado, k. 00:04:12.940 --> 00:04:16.170 Você sabe, a probabilidade de que 3 carros, exatamente 3 carros passem 00:04:16.170 --> 00:04:19.750 em uma dada hora, nós poderíamos igualar isso a n. 00:04:19.750 --> 00:04:21.890 Então n seria 60. 00:04:21.890 --> 00:04:26.010 Escolhido k, e como você sabe, eu tenho 3 carros vezes a 00:04:26.010 --> 00:04:27.190 probabilidade de sucesso. 00:04:27.190 --> 00:04:29.570 Então é a probabilidade de que um carro passe em qualquer minuto. 00:04:29.570 --> 00:04:34.770 Então isso será lambda sobre 60 elevado ao número de 00:04:34.770 --> 00:04:35.980 sussessos que nós precisamos. 00:04:35.980 --> 00:04:41.660 Então à potência de k, vezes a probabilidade de não haver sucesso ou 00:04:41.660 --> 00:04:46.560 de que nenhum carro passe, elevado a n menos k. 00:04:46.560 --> 00:04:50.230 Se nós tivermos k sucessos nós teremos 60 menos k insucessos. 00:04:50.230 --> 00:04:52.950 Haverá 60 menos k minutos nos quais nenhum carro passou. 00:04:52.950 --> 00:04:55.270 Isso realmente não será nada mal para uma aproximação na qual 00:04:55.270 --> 00:04:57.250 você possui 60 intervalos e você afirma que isso é uma distribuição 00:04:57.250 --> 00:04:58.560 binomial. 00:04:58.560 --> 00:05:00.310 E você provavelmente terá resultados razoáveis. 00:05:00.310 --> 00:05:02.600 Mas á uma questão chave aqui. 00:05:02.600 --> 00:05:06.580 Neste modelo em que nos a modelamos como uma distribuição binomial, 00:05:06.580 --> 00:05:09.980 o que acontece se mais de um carro passar em determinada hora? 00:05:09.980 --> 00:05:11.630 Ou se mais de um carro passar em determinado minuto? 00:05:11.630 --> 00:05:14.270 Uma maneira que nós temos agora é chamar de sucesso se um 00:05:14.270 --> 00:05:15.320 carro passar em um determinado minuto. 00:05:15.320 --> 00:05:18.790 E você terá que realizar uma contagem do tipo, um sucesso mesmo 00:05:18.790 --> 00:05:21.190 que 5 carros passarem naquele minuto. 00:05:21.190 --> 00:05:23.390 Então você dirá, ok, OK Sal, eu sei a solução aqui. 00:05:23.390 --> 00:05:26.040 Eu apenas tenho que trabalhar com grãos mais finos. 00:05:26.040 --> 00:05:28.870 Ao invés de dividir por minutos porquê eu não 00:05:28.870 --> 00:05:31.050 divido isso por segundos? 00:05:31.050 --> 00:05:36.210 Então a probabilidade de que eu tenha k sucessos -- ao invés de 60 00:05:36.210 --> 00:05:39.820 intervalos, eu terei agora 3.600 intervalos. 00:05:39.820 --> 00:05:43.170 Então a probabilidade de k segundos com sucesso, então em um segundo 00:05:43.170 --> 00:05:48.610 ocorreu de um carro passar naquele instante entre 3.600 segundos. 00:05:48.610 --> 00:05:52.190 Então isto é 3.600 escolhido k, vezes a probabilidade de que um carro 00:05:52.190 --> 00:05:55.210 passou em qualquer dado segundo. 00:05:55.210 --> 00:05:57.930 Isso será o número esperado de carros numa hora dividido por 00:05:57.930 --> 00:06:00.430 tantos segundos em uma hora. 00:06:00.430 --> 00:06:01.403 Nós iremos ter k sucessos. 00:06:03.990 --> 00:06:06.270 E isso são os insucessos, a probabilidade de um insucesso 00:06:06.270 --> 00:06:12.050 e nós iremos ter 3.600 menos k insucessos. 00:06:12.050 --> 00:06:13.910 E isso será uma aproximação ainda melhor. 00:06:13.910 --> 00:06:16.770 Isso aqui não será tão ruim assim, mas ainda, você terá esta 00:06:16.770 --> 00:06:19.100 situação na qual 2 carros podem vir num intervalo de meio 00:06:19.100 --> 00:06:19.980 segundo um do outro. 00:06:19.980 --> 00:06:21.910 E você irá dizer, oh, OK Sal, eu vejo o padrão aqui. 00:06:21.910 --> 00:06:23.650 Nós apenas temos que tornar isso mais e mais granular. 00:06:23.650 --> 00:06:26.170 Nós apenas temos que tornar este número grande e 00:06:26.170 --> 00:06:27.400 sempre maior e maior. 00:06:27.400 --> 00:06:28.950 E a sua intuição está correta. 00:06:28.950 --> 00:06:31.340 E o que você terá no final será a 00:06:31.340 --> 00:06:33.860 distribuição de Poisson. 00:06:33.860 --> 00:06:35.620 E isso é realmente interessante porque por muitas vezes o pessoal 00:06:35.620 --> 00:06:38.600 lhe dará a fórmula da distribuição de Poisson e você 00:06:38.600 --> 00:06:40.420 poderá fazer algo como acrescentar os números a a utilizar. 00:06:40.420 --> 00:06:43.250 Mas é muito interessante saber que isso é realmente apenas a distribuição 00:06:43.250 --> 00:06:45.790 binomial e a distribuição binomial realmente vem 00:06:45.790 --> 00:06:48.590 de algo como o senso comum de lançar moedas. 00:06:48.590 --> 00:06:50.500 É disso que tudo isso está vindo. 00:06:50.500 --> 00:06:53.710 Mas antes disso fizemos uma prova de como trabalhar com limites 00:06:53.710 --> 00:06:55.670 de maneira a -- deixe-me mudar de cor. 00:06:55.670 --> 00:06:58.470 Anteriormente nós provamos que se pegássemos o limite como este número 00:06:58.470 --> 00:07:01.270 aqui, o número de intervalos aproxima o infinito 00:07:01.270 --> 00:07:04.070 e isso se torna a distribuição de Poisson. 00:07:04.070 --> 00:07:07.290 Estou me assegurando de que temos um bocado de ferramentas 00:07:07.290 --> 00:07:09.150 matemátcas no nosso cinto de trabalho. 00:07:09.150 --> 00:07:12.760 Assim a primeira é algo que você já está razoavelmente 00:07:12.760 --> 00:07:15.860 familiarizado, mas eu apenas gostaria de assegurar que 00:07:15.860 --> 00:07:25.680 o limite quando x se aproxima do infinito de 1 mais a/x à potência de x é 00:07:25.680 --> 00:07:31.020 igual a e elevado a ax -- não, desculpe-me. 00:07:31.020 --> 00:07:38.020 É igual a e elevado a a e agora apenas para provar isso para você, 00:07:38.020 --> 00:07:39.260 deixe-me fazer uma pequena substituição aqui. 00:07:39.260 --> 00:07:43.640 Digamos que este n é igual a -- deixe-me dizer 1 sobre 00:07:43.640 --> 00:07:47.880 n é igual a a sobre x. 00:07:47.880 --> 00:07:52.890 E isso então será x que irá equivaler a na. 00:07:52.890 --> 00:07:55.290 x vezes 1 é igual a n vezes a. 00:07:55.290 --> 00:08:00.050 E então o limite com x convergindo ao infinito, 00:08:00.050 --> 00:08:02.045 o que a converge? 00:08:02.045 --> 00:08:02.885 a é -- desculpe-me. 00:08:02.885 --> 00:08:04.920 Com x indo ao infinito para onde n converge? 00:08:04.920 --> 00:08:07.350 Bem n é x dividido por a. 00:08:07.350 --> 00:08:08.710 Então n pode também convergir ao infinito. 00:08:08.710 --> 00:08:10.810 Então isso será a mesma coisa que simplesmente fazer nossa 00:08:10.810 --> 00:08:16.460 substituição do limite com n aproximando o infinito de 1 00:08:16.460 --> 00:08:21.390 mais -- a/x, eu fiz a substituição como 1/n. 00:08:21.390 --> 00:08:26.720 E x é, por esta substituição, n vezes a. 00:08:26.720 --> 00:08:30.500 E isso está para ser a mesma cosa que o limete com n 00:08:30.500 --> 00:08:36.090 indo ao infinito de 1 mais 1/n elevado a n, tudo 00:08:36.090 --> 00:08:39.390 isso elevado a a. 00:08:39.390 --> 00:08:41.760 E uma vez que não há n aqui nós podemos simplesmente pegar o limite 00:08:41.760 --> 00:08:43.450 disso e então pegar isso à potência de a. 00:08:43.450 --> 00:08:47.690 Então isso irá ser igual ao limite com n indo ao 00:08:47.690 --> 00:08:52.600 infinito de 1 mais 1/n elevado à enésima potência, tudo 00:08:52.600 --> 00:08:53.780 isso elevado a a. 00:08:53.780 --> 00:08:58.040 E essa é a nossa definição, ou uma das maneiras de se chegar a 00:08:58.040 --> 00:09:00.820 se você for assistir aos vídeos de interesse composto e tudo isso. 00:09:00.820 --> 00:09:01.880 Isso é como nós chegamos ao e. 00:09:01.880 --> 00:09:03.460 E se você testar isso na sua calculadora, apenas tente n´s 00:09:03.460 --> 00:09:07.260 maiores e maiores aqui e você chegará a e. 00:09:07.260 --> 00:09:12.010 Esta parte interna é igual a e, e nós elevamos isso à potência 00:09:12.010 --> 00:09:14.060 de a, então isso será igual a e elevado a a. 00:09:14.060 --> 00:09:16.240 Então espero que você fique bastante satisfeito de que este 00:09:16.240 --> 00:09:17.860 limite seja igual a e elevado a a. 00:09:17.860 --> 00:09:19.860 E então uma outra ferramenta que eu gostaria de colocar no seu cinto de trabalho, e eu irei 00:09:19.860 --> 00:09:22.340 provavelmente realizar a prova no próximo vídeo. 00:09:22.340 --> 00:09:32.950 A outra ferramenta é reconhecer que x fatorial sobre 00:09:32.950 --> 00:09:42.860 x menos k fatorial é igual a x vezes x menos 1 vezes x 00:09:42.860 --> 00:09:50.030 menos 2, por todo o caminho de vezes x menos k mais 1. 00:09:50.030 --> 00:09:51.880 E nós fizemos isso por muitas vezes, mas isso é da maneira 00:09:51.880 --> 00:09:53.060 mais abstrata que nós já escrevemos. 00:09:53.060 --> 00:09:55.580 Eu posso lhe dar um bocado de -- e apenas para você saber, 00:09:55.580 --> 00:09:57.330 haverão exatamente k termos aqui. 00:09:57.330 --> 00:10:01.700 1, 2, 3 -- Então o primeiro termo, o segundo termo, o terceiro termo, por todo 00:10:01.700 --> 00:10:04.310 sempre, e este é o k-gésimo termo. 00:10:04.310 --> 00:10:07.210 E isso é importante para nossa dedução da 00:10:07.210 --> 00:10:09.160 distribuição de Poisson. 00:10:09.160 --> 00:10:13.870 Mas apenas para fazer isso em números reais, se eu tiver 7 fatorial 00:10:13.870 --> 00:10:20.110 sobre 7 menos 2 fatorila, isso será igual a 7 vezes 6 00:10:20.110 --> 00:10:24.070 vezes 5 vezes 4 vezes 3 vezes 2 vezes 1. 00:10:24.070 --> 00:10:27.360 Sobre 2 vezes -- não desculpe-me. 00:10:27.360 --> 00:10:28.940 7 menos 2, isso é 5. 00:10:28.940 --> 00:10:33.500 Então iso sobre 5 vezes 4 vezes 3 vezes 2 vezes 1. 00:10:33.500 --> 00:10:37.190 Isso se cancela e você terá apenas 7 vezes 6. 00:10:37.190 --> 00:10:40.990 E então isso são 7 e então o último termo é 7 menos 00:10:40.990 --> 00:10:43.045 2 mais 1, que é 6. 00:10:47.560 --> 00:10:51.290 Neste exemplo, k era 2 e você teve exatamente 2 termos. 00:10:51.290 --> 00:10:53.230 E uma vez que nós saibamos estas duas coisas agora estamos 00:10:53.230 --> 00:10:55.710 prontos para deduizir a distribuição de Possion e isso eu farei 00:10:55.710 --> 00:10:58.415 no próximo vídeo. 00:10:58.415 --> 00:10:59.980 O vejo em breve.