[Script Info] Title: [Events] Format: Layer, Start, End, Style, Name, MarginL, MarginR, MarginV, Effect, Text Dialogue: 0,0:00:01.10,0:00:03.32,Default,,0000,0000,0000,,Este aqui é um vídeo "revolucionário" Dialogue: 0,0:00:03.32,0:00:05.34,Default,,0000,0000,0000,,por vários motivos. Dialogue: 0,0:00:05.34,0:00:09.91,Default,,0000,0000,0000,,Primeiro, porque farei uma introdução à VARIÂNCIA de uma amostra, Dialogue: 0,0:00:09.91,0:00:11.75,Default,,0000,0000,0000,,o que só por si já é deveras interessante. Dialogue: 0,0:00:11.75,0:00:14.52,Default,,0000,0000,0000,,E segundo, porque estou a tentar gravar em HD (Alta Definição) Dialogue: 0,0:00:14.52,0:00:16.37,Default,,0000,0000,0000,,E, espero eu, poderão agora ver o vídeo maior e mais nitidamente Dialogue: 0,0:00:16.37,0:00:17.03,Default,,0000,0000,0000,,que nunca. Dialogue: 0,0:00:17.03,0:00:19.15,Default,,0000,0000,0000,,Mas vamos ver como corre. Dialogue: 0,0:00:19.15,0:00:22.06,Default,,0000,0000,0000,,É uma experiência, espero que consigam acompanhar. Dialogue: 0,0:00:22.06,0:00:25.18,Default,,0000,0000,0000,,Mas pronto, antes de começarmos com a variância de uma amostra, Dialogue: 0,0:00:25.18,0:00:28.09,Default,,0000,0000,0000,,considero ser importante rever o conceito de VARIÂNCIA Dialogue: 0,0:00:28.09,0:00:28.87,Default,,0000,0000,0000,,de uma população. Dialogue: 0,0:00:28.87,0:00:32.18,Default,,0000,0000,0000,,E podemos comparar as fórmulas. Dialogue: 0,0:00:32.18,0:00:34.79,Default,,0000,0000,0000,,A variância de uma população -- É esta Dialogue: 0,0:00:34.79,0:00:36.10,Default,,0000,0000,0000,,letra Grega sigma Dialogue: 0,0:00:36.10,0:00:37.42,Default,,0000,0000,0000,,este sigma minúsculo e ao quadrado. Dialogue: 0,0:00:37.42,0:00:38.50,Default,,0000,0000,0000,,Isto simboliza a variância. Dialogue: 0,0:00:38.50,0:00:41.01,Default,,0000,0000,0000,,Sei que é estranho uma variável já Dialogue: 0,0:00:41.01,0:00:41.71,Default,,0000,0000,0000,,apresentar um quadrado(^2) nela. Dialogue: 0,0:00:41.71,0:00:42.84,Default,,0000,0000,0000,,Mas não estamos a colocar uma variável ao quadrado. Dialogue: 0,0:00:42.84,0:00:44.24,Default,,0000,0000,0000,,Esta é MESMO a variável. Dialogue: 0,0:00:44.24,0:00:45.78,Default,,0000,0000,0000,,Sigma ao quadrado significa VARIÂNCIA. Dialogue: 0,0:00:45.78,0:00:46.84,Default,,0000,0000,0000,,Aliás, vou apontar aqui. Dialogue: 0,0:00:46.84,0:00:48.00,Default,,0000,0000,0000,,Isto é igual à variância. Dialogue: 0,0:00:51.55,0:00:55.43,Default,,0000,0000,0000,,E isto é igual a -- Podemos retirar cada ponto de dados -- E Dialogue: 0,0:00:55.43,0:00:58.80,Default,,0000,0000,0000,,vamos chamá-los de x menos i. Dialogue: 0,0:00:58.80,0:01:01.70,Default,,0000,0000,0000,,Pega-se em cada um dos dados de ponto, descobrimos o quão afastado o valor está Dialogue: 0,0:01:01.70,0:01:08.75,Default,,0000,0000,0000,,da média da população, coloca-se ao quadrado e depois vamos para Dialogue: 0,0:01:08.75,0:01:11.16,Default,,0000,0000,0000,,a média de todos eles. Dialogue: 0,0:01:11.16,0:01:12.90,Default,,0000,0000,0000,,Portanto pega-se na média, somam-se os valores todos Dialogue: 0,0:01:12.90,0:01:14.20,Default,,0000,0000,0000,,vamos de "i", que é igual a 1. Dialogue: 0,0:01:14.20,0:01:17.70,Default,,0000,0000,0000,,E do primeiro ponto, até ao ponto "n". Dialogue: 0,0:01:17.70,0:01:19.94,Default,,0000,0000,0000,,e depois, para se obter uma média final, soma-se tudo e Dialogue: 0,0:01:19.94,0:01:21.97,Default,,0000,0000,0000,,depois dividimos por "N". Dialogue: 0,0:01:21.97,0:01:25.97,Default,,0000,0000,0000,,Portanto a variância é a média destas distâncias ao quadrado, Dialogue: 0,0:01:25.97,0:01:27.39,Default,,0000,0000,0000,,de cada ponto até à média. Dialogue: 0,0:01:27.39,0:01:29.70,Default,,0000,0000,0000,,Para se tornar mais intuitivo, a variância diz, basicamente Dialogue: 0,0:01:29.70,0:01:32.92,Default,,0000,0000,0000,,o quão afastado cada valor dos pontos está, em média, Dialogue: 0,0:01:32.92,0:01:34.42,Default,,0000,0000,0000,,afastado do valor meio. Dialogue: 0,0:01:34.42,0:01:36.25,Default,,0000,0000,0000,,Esta é a melhor maneira de pensarmos sobre a variância. Dialogue: 0,0:01:36.25,0:01:37.64,Default,,0000,0000,0000,,E agora que lidamos com -- isto foi tudo para Dialogue: 0,0:01:37.64,0:01:39.14,Default,,0000,0000,0000,,uma população, correcto? Dialogue: 0,0:01:39.14,0:01:42.05,Default,,0000,0000,0000,,E dissémos que se queríamos descobrir a variância da Dialogue: 0,0:01:42.05,0:01:44.58,Default,,0000,0000,0000,,altura dos homens num país, seria muito difícil Dialogue: 0,0:01:44.58,0:01:46.48,Default,,0000,0000,0000,,descobrir a variância de uma população. Dialogue: 0,0:01:46.48,0:01:48.91,Default,,0000,0000,0000,,Teríamos de, praticamente, medir Dialogue: 0,0:01:48.91,0:01:49.79,Default,,0000,0000,0000,,a altura de todos eles. Dialogue: 0,0:01:49.79,0:01:51.36,Default,,0000,0000,0000,,250 milhões de pessoas. Dialogue: 0,0:01:51.36,0:01:55.08,Default,,0000,0000,0000,,E como seria para uma população para a qual seja Dialogue: 0,0:01:55.08,0:01:56.86,Default,,0000,0000,0000,,completamente impossível obter os dados ou Dialogue: 0,0:01:56.86,0:01:57.64,Default,,0000,0000,0000,,alguma variável aleatória. Dialogue: 0,0:01:57.64,0:01:59.10,Default,,0000,0000,0000,,Abordaremos isto mais tarde. Dialogue: 0,0:01:59.10,0:02:02.66,Default,,0000,0000,0000,,Portanto, uma boa parte das vezes, o que queremos é ESTIMAR a variância Dialogue: 0,0:02:02.66,0:02:04.69,Default,,0000,0000,0000,,através de uma amostra. Dialogue: 0,0:02:04.69,0:02:07.42,Default,,0000,0000,0000,,Do mesmo modo que nunca conseguiríamos obter a média de uma população, Dialogue: 0,0:02:07.42,0:02:09.57,Default,,0000,0000,0000,,mas poderíamos querer estimá-la por intermédio Dialogue: 0,0:02:09.57,0:02:11.06,Default,,0000,0000,0000,,da média de uma amostra. Dialogue: 0,0:02:11.06,0:02:13.89,Default,,0000,0000,0000,,E já aprendemos isto no primeiro vídeo. Dialogue: 0,0:02:13.89,0:02:17.52,Default,,0000,0000,0000,,Se isto é -- se isto é a população total Dialogue: 0,0:02:17.52,0:02:20.28,Default,,0000,0000,0000,,Sendo isto milhões de pontos de dados, ou mesmo pontos de dados no Dialogue: 0,0:02:20.28,0:02:21.87,Default,,0000,0000,0000,,futuro e que nunca conseguiremos obter porque Dialogue: 0,0:02:21.87,0:02:23.29,Default,,0000,0000,0000,,são variáveis aleatórias, Dialogue: 0,0:02:23.29,0:02:24.24,Default,,0000,0000,0000,,Então esta é a nossa população. Dialogue: 0,0:02:26.92,0:02:32.39,Default,,0000,0000,0000,,Poderemos querer apenas estimar as coisas analisando uma amostra. Dialogue: 0,0:02:32.39,0:02:35.02,Default,,0000,0000,0000,,E é essencialmente nisto que consiste Dialogue: 0,0:02:35.02,0:02:36.36,Default,,0000,0000,0000,,a Estatística Inferencial, afinal de contas: Dialogue: 0,0:02:36.36,0:02:38.72,Default,,0000,0000,0000,,a obtenção de estatísticas descritivas de uma amostra Dialogue: 0,0:02:38.72,0:02:40.89,Default,,0000,0000,0000,,e fazer inferências sobre a população total. Dialogue: 0,0:02:40.89,0:02:44.61,Default,,0000,0000,0000,,Vou por exemplo testar esta droga em 100 pessoas e se tiver Dialogue: 0,0:02:44.61,0:02:46.88,Default,,0000,0000,0000,,surtido efeitos significativos, estatisticamente, esta droga Dialogue: 0,0:02:46.88,0:02:48.85,Default,,0000,0000,0000,,irá provavelmente funcionar na população em geral. Dialogue: 0,0:02:48.85,0:02:49.80,Default,,0000,0000,0000,,É nisto que consiste a Estatística Inferencial. Dialogue: 0,0:02:49.80,0:02:51.92,Default,,0000,0000,0000,,Portanto é muito importante compreender a noção de Dialogue: 0,0:02:51.92,0:02:53.58,Default,,0000,0000,0000,,uma amostra e diferenciá-la da de população, Dialogue: 0,0:02:53.58,0:02:57.51,Default,,0000,0000,0000,,e de sermos capazes de descobrir estatísticas sobre uma amostra que, Dialogue: 0,0:02:57.51,0:03:00.16,Default,,0000,0000,0000,,caso geral, consiga descrever uma população ou ajudar-nos Dialogue: 0,0:03:00.16,0:03:03.72,Default,,0000,0000,0000,,a estimar, como dizem, parâmetros para a população. Dialogue: 0,0:03:03.72,0:03:07.33,Default,,0000,0000,0000,,Então qual é a média de uma -- Vou apenas re-escrever estas definições. Dialogue: 0,0:03:07.33,0:03:08.83,Default,,0000,0000,0000,,Qual é a média de uma população? Dialogue: 0,0:03:08.83,0:03:09.94,Default,,0000,0000,0000,,Vou escrever em roxo. Dialogue: 0,0:03:09.94,0:03:11.63,Default,,0000,0000,0000,,Roxo para a população. Dialogue: 0,0:03:11.63,0:03:13.68,Default,,0000,0000,0000,,A média da população. Dialogue: 0,0:03:13.68,0:03:19.70,Default,,0000,0000,0000,,Pegamos apenas em cada um dos pontos de dados: "x(i)"... Dialogue: 0,0:03:19.70,0:03:21.85,Default,,0000,0000,0000,,Somam-se todos... Dialogue: 0,0:03:21.85,0:03:23.83,Default,,0000,0000,0000,,começamos com o primeiro ponto e fazemos o processo Dialogue: 0,0:03:23.83,0:03:25.62,Default,,0000,0000,0000,,até ao ponto "N" dos dados. Dialogue: 0,0:03:25.62,0:03:26.74,Default,,0000,0000,0000,,E finalmente dividimos por "N". Dialogue: 0,0:03:26.74,0:03:27.80,Default,,0000,0000,0000,,Soma-se tudo e divide-se por "N". Dialogue: 0,0:03:27.80,0:03:28.92,Default,,0000,0000,0000,,Isto é a média. Dialogue: 0,0:03:28.92,0:03:30.50,Default,,0000,0000,0000,,Então seguimos agora esta fórmula Dialogue: 0,0:03:30.50,0:03:33.06,Default,,0000,0000,0000,,e podemos ver o quão afastado está cada ponto deste mesmo Dialogue: 0,0:03:33.06,0:03:34.27,Default,,0000,0000,0000,,ponto central, que é a MÉDIA. Dialogue: 0,0:03:34.27,0:03:36.26,Default,,0000,0000,0000,,E assim obtemos a variância. Dialogue: 0,0:03:36.26,0:03:39.67,Default,,0000,0000,0000,,Mas o que acontece se o fizermos para uma amostra? Dialogue: 0,0:03:39.67,0:03:43.35,Default,,0000,0000,0000,,Bem, se quisermos estimar a média de uma população pelo Dialogue: 0,0:03:43.35,0:03:46.60,Default,,0000,0000,0000,,cálculo de uma média para uma amostra, o melhor método que Dialogue: 0,0:03:46.60,0:03:49.17,Default,,0000,0000,0000,,estou a ver -- E isto são apenas fórmulas "engenhadas" Dialogue: 0,0:03:49.17,0:03:51.14,Default,,0000,0000,0000,,que representam pessoas a dizer: "bem, qual é a Dialogue: 0,0:03:51.14,0:03:51.71,Default,,0000,0000,0000,,melhor maneira de "amostrar" isto tudo? Dialogue: 0,0:03:51.71,0:03:54.55,Default,,0000,0000,0000,,Bem, o que conseguimos é pegar na média da nossa amostra. Dialogue: 0,0:03:54.55,0:03:56.82,Default,,0000,0000,0000,,E isto é a MÉDIA AMOSTRAL. Dialogue: 0,0:03:56.82,0:03:58.92,Default,,0000,0000,0000,,E aprendemos no primeiro vídeo que a notação Dialogue: 0,0:03:58.92,0:04:00.45,Default,,0000,0000,0000,,-- A fórmula é quase idêntica a esta, Dialogue: 0,0:04:00.45,0:04:01.54,Default,,0000,0000,0000,,é apenas a notação que muda. Dialogue: 0,0:04:01.54,0:04:04.99,Default,,0000,0000,0000,,Em vez de escrevermos "myu", escrevemos um "x" com uma linha em cima. Dialogue: 0,0:04:04.99,0:04:08.62,Default,,0000,0000,0000,,Média Amostral é igual a -- Uma vez mais, pega-se em cada um dos Dialogue: 0,0:04:08.62,0:04:12.10,Default,,0000,0000,0000,,pontos de dados... os da amostra desta vez, não os da população toda... Dialogue: 0,0:04:12.10,0:04:16.37,Default,,0000,0000,0000,,soma-se tudo desde o primeiro valor até Dialogue: 0,0:04:16.37,0:04:17.38,Default,,0000,0000,0000,,ao valor "n", correcto? Dialogue: 0,0:04:17.38,0:04:20.64,Default,,0000,0000,0000,,Está-se basicamente a dizer que há "n" pontos de dados nesta amostra. Dialogue: 0,0:04:20.64,0:04:23.39,Default,,0000,0000,0000,,E depois divide-se pelo número de pontos de dados que se tem. Dialogue: 0,0:04:23.39,0:04:24.32,Default,,0000,0000,0000,,Parece justo. Dialogue: 0,0:04:24.32,0:04:25.66,Default,,0000,0000,0000,,É, aliás, praticamente a mesma fórmula. Dialogue: 0,0:04:25.66,0:04:27.50,Default,,0000,0000,0000,,O modo como peguei na média de uma população e disse: Dialogue: 0,0:04:27.50,0:04:29.59,Default,,0000,0000,0000,,"bem, já que tenho apenas a amostra, vou calcular a sua média do mesmo modo." Dialogue: 0,0:04:29.59,0:04:32.56,Default,,0000,0000,0000,,E é provavelmente uma boa estimativa da média Dialogue: 0,0:04:32.56,0:04:33.93,Default,,0000,0000,0000,,da população total. Dialogue: 0,0:04:33.93,0:04:36.34,Default,,0000,0000,0000,,E agora é que fica interessante, ao inserirmos a variância nestes dados. Dialogue: 0,0:04:36.34,0:04:39.25,Default,,0000,0000,0000,,A reacção normal de uma pessoa seria: "OK, tenho esta amostra. Dialogue: 0,0:04:39.25,0:04:43.26,Default,,0000,0000,0000,,E se quero estimar a variância da população, Dialogue: 0,0:04:43.26,0:04:45.23,Default,,0000,0000,0000,,porque não apenas aplicar a mesma fórmula Dialogue: 0,0:04:45.23,0:04:46.15,Default,,0000,0000,0000,,à amostra em questão?" Dialogue: 0,0:04:46.15,0:04:49.33,Default,,0000,0000,0000,,E eu poderia dizer -- E isto é de facto uma Variância Amostral. Dialogue: 0,0:04:49.33,0:04:54.57,Default,,0000,0000,0000,,Usa-se a fórmula: S ao quadrado. Dialogue: 0,0:04:54.57,0:04:58.22,Default,,0000,0000,0000,,Já agora, "sigma" é basicamente a letra Grega equivalente ao "S". Dialogue: 0,0:04:58.22,0:04:59.98,Default,,0000,0000,0000,,E agora, quando lidarmos com a amostra, iremos Dialogue: 0,0:04:59.98,0:05:01.00,Default,,0000,0000,0000,,apenas escrever o "S". Dialogue: 0,0:05:01.00,0:05:02.32,Default,,0000,0000,0000,,E isto é a VARIÂNCIA AMOSTRAL. Dialogue: 0,0:05:02.32,0:05:03.07,Default,,0000,0000,0000,,Vou apenas escrever aqui... Dialogue: 0,0:05:03.07,0:05:03.95,Default,,0000,0000,0000,,Variância Amostral. Dialogue: 0,0:05:11.86,0:05:15.87,Default,,0000,0000,0000,,Isto é -- Portanto poderíamos dizer: "bem, talvez uma boa forma de pegar na Dialogue: 0,0:05:15.87,0:05:17.34,Default,,0000,0000,0000,,variância amostral é obtendo-a nela do mesmo modo. Dialogue: 0,0:05:17.34,0:05:23.67,Default,,0000,0000,0000,,Vamos buscar a distância de cada ponto na amostra Dialogue: 0,0:05:23.67,0:05:26.60,Default,,0000,0000,0000,,descobrir o quão afastada está da nossa média amostral, Dialogue: 0,0:05:26.60,0:05:29.23,Default,,0000,0000,0000,,aqui usou-se a média da população, mas agora iremos usar Dialogue: 0,0:05:29.23,0:05:31.45,Default,,0000,0000,0000,,a média da amostra, porque é tudo o que temos. Dialogue: 0,0:05:31.45,0:05:33.16,Default,,0000,0000,0000,,Não é possível saber a média da população Dialogue: 0,0:05:33.16,0:05:35.51,Default,,0000,0000,0000,,sem olhar para TODA a população. Dialogue: 0,0:05:35.51,0:05:36.40,Default,,0000,0000,0000,,Calcula-se o quadrado disto tudo. Dialogue: 0,0:05:36.40,0:05:38.16,Default,,0000,0000,0000,,Para o tornar positivo, entre outros motivos Dialogue: 0,0:05:38.16,0:05:40.16,Default,,0000,0000,0000,,que serão abordados depois. Dialogue: 0,0:05:40.16,0:05:42.73,Default,,0000,0000,0000,,E depois pega-se na média de todas estas distâncias ao quadrado. Dialogue: 0,0:05:42.73,0:05:44.97,Default,,0000,0000,0000,,E obtém-se do -- Somamos tudo Dialogue: 0,0:05:44.97,0:05:47.43,Default,,0000,0000,0000,,e há "n" valores para somar, certo? Dialogue: 0,0:05:47.43,0:05:48.40,Default,,0000,0000,0000,,n minúsculo. Dialogue: 0,0:05:48.40,0:05:51.82,Default,,0000,0000,0000,,e dividimos pelo "n" minúsculo Dialogue: 0,0:05:51.82,0:05:53.23,Default,,0000,0000,0000,,E dirão: "Bem, isto é uma boa estimativa." Dialogue: 0,0:05:53.23,0:05:55.58,Default,,0000,0000,0000,,Qualquer que seja a variância, esta será uma boa estimativa Dialogue: 0,0:05:55.58,0:05:56.72,Default,,0000,0000,0000,,para o total da população. Dialogue: 0,0:05:56.72,0:06:00.62,Default,,0000,0000,0000,,Por acaso, é a isto que algumas pessoas se referem quando Dialogue: 0,0:06:00.62,0:06:01.98,Default,,0000,0000,0000,,falam de variância amostral. Dialogue: 0,0:06:01.98,0:06:05.26,Default,,0000,0000,0000,,E, às vezes, esta pode ser referida deste modo: Dialogue: 0,0:06:05.26,0:06:07.52,Default,,0000,0000,0000,,coloca-se um "n" minúsculo aqui... Dialogue: 0,0:06:07.52,0:06:09.84,Default,,0000,0000,0000,,Faz-se isto porque dividimos tudo por "n". Dialogue: 0,0:06:09.84,0:06:11.84,Default,,0000,0000,0000,,E pegungam vocês: "Sal, qual é o problema aqui?" Dialogue: 0,0:06:11.84,0:06:14.00,Default,,0000,0000,0000,,E o problema -- Explicar-vos-ei o raciocínio porque eu Dialogue: 0,0:06:14.00,0:06:16.18,Default,,0000,0000,0000,,costumava reflectir muito sobre isto. Dialogue: 0,0:06:16.18,0:06:19.34,Default,,0000,0000,0000,,E, francamente, ainda penso muito sobre Dialogue: 0,0:06:19.34,0:06:21.53,Default,,0000,0000,0000,,a intuição por detrás do seguinte. Dialogue: 0,0:06:21.53,0:06:24.51,Default,,0000,0000,0000,,Bem, eu já tenho o raciocínio, mas de certo modo porque Dialogue: 0,0:06:24.51,0:06:26.95,Default,,0000,0000,0000,,este se foi rigorosamente confirmando-se como sendo verídico, para mim. Dialogue: 0,0:06:26.95,0:06:28.28,Default,,0000,0000,0000,,Mas pensem deste modo: Dialogue: 0,0:06:28.28,0:06:29.90,Default,,0000,0000,0000,,Se tiver uns quantos números, e vou desenhar Dialogue: 0,0:06:29.90,0:06:32.74,Default,,0000,0000,0000,,uma linha de números... Dialogue: 0,0:06:32.74,0:06:35.74,Default,,0000,0000,0000,,Se desenhar uma linha de números aqui. Suponhamos que sabemos -- Dialogue: 0,0:06:35.74,0:06:39.43,Default,,0000,0000,0000,,E digamos que tenho uns quantos números sobre a minha população. Dialogue: 0,0:06:39.43,0:06:41.66,Default,,0000,0000,0000,,Digamos que -- vou apenas colocar aleatoriamente uns quantos Dialogue: 0,0:06:41.66,0:06:44.28,Default,,0000,0000,0000,,números na minha população... Dialogue: 0,0:06:44.28,0:06:45.93,Default,,0000,0000,0000,,E aqueles à direita são maiores que os Dialogue: 0,0:06:45.93,0:06:46.36,Default,,0000,0000,0000,,do lado esquerdo. Dialogue: 0,0:06:48.90,0:06:52.99,Default,,0000,0000,0000,,E se fôssemos retirar uma amostra deles, talvez eu retire -- Dialogue: 0,0:06:52.99,0:06:54.82,Default,,0000,0000,0000,,A amostra, ela deve ser aleatória Dialogue: 0,0:06:54.82,0:06:56.21,Default,,0000,0000,0000,,Precisamos de retirar uma amostra aleatoriamente. Dialogue: 0,0:06:56.21,0:06:57.32,Default,,0000,0000,0000,,Não queremos que seja enviesada Dialogue: 0,0:06:57.32,0:07:02.90,Default,,0000,0000,0000,,E vou então talvez retirar este, este, este... Dialogue: 0,0:07:02.90,0:07:05.42,Default,,0000,0000,0000,,e este aqui, não? Dialogue: 0,0:07:05.42,0:07:07.48,Default,,0000,0000,0000,,E depois se fosse calcular a média daquele, Dialogue: 0,0:07:07.48,0:07:08.46,Default,,0000,0000,0000,,daquele, daquele, daquele... Dialogue: 0,0:07:08.46,0:07:09.32,Default,,0000,0000,0000,,Estaria localizada (a média) algures no meio... Dialogue: 0,0:07:09.32,0:07:11.01,Default,,0000,0000,0000,,poderá ser algures por aqui. Dialogue: 0,0:07:11.01,0:07:13.24,Default,,0000,0000,0000,,E depois se quisesse descobrir a variância amostral por Dialogue: 0,0:07:13.24,0:07:16.78,Default,,0000,0000,0000,,esta fórmula, diria: "Ok, a distância ao quadrado mais esta Dialogue: 0,0:07:16.78,0:07:21.06,Default,,0000,0000,0000,,distância quadrada mais esta distância quadrada mais Dialogue: 0,0:07:21.06,0:07:23.52,Default,,0000,0000,0000,,esta distância quadrada e faz-se a média de todas. Dialogue: 0,0:07:23.52,0:07:24.70,Default,,0000,0000,0000,,E iria obter este número. Dialogue: 0,0:07:24.70,0:07:27.82,Default,,0000,0000,0000,,E isto provavelmente seria uma aproximação boa para Dialogue: 0,0:07:27.82,0:07:30.26,Default,,0000,0000,0000,,a variância de toda esta população. Dialogue: 0,0:07:30.26,0:07:32.07,Default,,0000,0000,0000,,A população da média será provavelmente... Dialogue: 0,0:07:32.07,0:07:33.03,Default,,0000,0000,0000,,sei lá Dialogue: 0,0:07:33.03,0:07:35.02,Default,,0000,0000,0000,,poderá estar muito próxima deste valor Dialogue: 0,0:07:35.02,0:07:37.15,Default,,0000,0000,0000,,Se porventura retirássemos todos estes valores e calculássemos a média Dialogue: 0,0:07:37.15,0:07:39.06,Default,,0000,0000,0000,,talvez estivessem... aqui algures. Dialogue: 0,0:07:39.06,0:07:40.66,Default,,0000,0000,0000,,E depois se se descobrir a variância, estaria provavelmente Dialogue: 0,0:07:40.66,0:07:43.59,Default,,0000,0000,0000,,muito próxima da média de todas estas linhas, certo? Dialogue: 0,0:07:43.59,0:07:46.81,Default,,0000,0000,0000,,De todas as distâncias de variância amostral, certo? Dialogue: 0,0:07:46.81,0:07:47.25,Default,,0000,0000,0000,,Parece justo. Dialogue: 0,0:07:47.25,0:07:47.90,Default,,0000,0000,0000,,Então agora dizem: "Ei, Sal Dialogue: 0,0:07:47.90,0:07:49.71,Default,,0000,0000,0000,,Isto agora parece estar bem!" Dialogue: 0,0:07:49.71,0:07:51.94,Default,,0000,0000,0000,,Mas há um problema. Dialogue: 0,0:07:51.94,0:07:54.56,Default,,0000,0000,0000,,Então e se -- Há sempre a probabilidade de, Dialogue: 0,0:07:54.56,0:07:56.99,Default,,0000,0000,0000,,em vez de pegarmos nestes números bem distribuídos Dialogue: 0,0:07:56.99,0:08:00.80,Default,,0000,0000,0000,,na minha amostra, e se pegasse neste número, neste número, Dialogue: 0,0:08:00.80,0:08:03.92,Default,,0000,0000,0000,,e neste número para definir -- e também aquele número -- Dialogue: 0,0:08:03.92,0:08:05.40,Default,,0000,0000,0000,,a minha amostra? Dialogue: 0,0:08:05.40,0:08:08.37,Default,,0000,0000,0000,,Bem, seja qual for a amostra, a média amostral estará Dialogue: 0,0:08:08.37,0:08:10.21,Default,,0000,0000,0000,,sempre no meio, correcto? Dialogue: 0,0:08:10.21,0:08:12.96,Default,,0000,0000,0000,,Bem, neste caso, a média amostral poderá estar AQUI MESMO. Dialogue: 0,0:08:12.96,0:08:15.01,Default,,0000,0000,0000,,E todos estes números... poderão aliás dizer: "Ok, este número não Dialogue: 0,0:08:15.01,0:08:17.81,Default,,0000,0000,0000,,está demasiado afastado deste, aquele não está demasiado afastado, e depois Dialogue: 0,0:08:17.81,0:08:19.10,Default,,0000,0000,0000,,aquele número também não." Dialogue: 0,0:08:19.10,0:08:21.79,Default,,0000,0000,0000,,Portanto a variância amostral, quando efectuada deste modo, Dialogue: 0,0:08:21.79,0:08:23.61,Default,,0000,0000,0000,,poderá ser relativamente baixa Dialogue: 0,0:08:23.61,0:08:26.92,Default,,0000,0000,0000,,porque todos estes números, estão muito -- vão Dialogue: 0,0:08:26.92,0:08:28.92,Default,,0000,0000,0000,,praticamente, ficar muito próximos da Dialogue: 0,0:08:28.92,0:08:30.35,Default,,0000,0000,0000,,média uns dos outros. Dialogue: 0,0:08:30.35,0:08:34.60,Default,,0000,0000,0000,,Mas neste caso, a amostra está algo enviezada e Dialogue: 0,0:08:34.60,0:08:37.98,Default,,0000,0000,0000,,a média da população estará algures afastada por aqui. Dialogue: 0,0:08:37.98,0:08:40.80,Default,,0000,0000,0000,,Então a variância da amostra, se pudéssemos Dialogue: 0,0:08:40.80,0:08:43.67,Default,,0000,0000,0000,,de facto saber a média -- sei que isto é algo confuso -- Dialogue: 0,0:08:43.67,0:08:44.98,Default,,0000,0000,0000,,se tivéssemos sabido mesmo a média, Dialogue: 0,0:08:44.98,0:08:46.83,Default,,0000,0000,0000,,teríamos dito "Uau!! Dialogue: 0,0:08:46.83,0:08:48.39,Default,,0000,0000,0000,,Teríamos descoberto estas distâncias, das quais Dialogue: 0,0:08:48.39,0:08:51.32,Default,,0000,0000,0000,,haveriam tantas outras. Dialogue: 0,0:08:51.32,0:08:53.64,Default,,0000,0000,0000,,Essencialmente, o que digo é que, quando se pega Dialogue: 0,0:08:53.64,0:08:58.28,Default,,0000,0000,0000,,numa amostra, há a probabilidade que a média amostral Dialogue: 0,0:08:58.28,0:09:00.38,Default,,0000,0000,0000,,seja bastante próxima da média populacional, certo? Dialogue: 0,0:09:00.38,0:09:02.61,Default,,0000,0000,0000,,Talvez a média amostral seja aqui e a Dialogue: 0,0:09:02.61,0:09:03.36,Default,,0000,0000,0000,,média populacional aqui. Dialogue: 0,0:09:03.36,0:09:05.77,Default,,0000,0000,0000,,E depois esta fórmula irá funcionar, provavelmente, muito bem, Dialogue: 0,0:09:05.77,0:09:07.77,Default,,0000,0000,0000,,ao menos dados estes pontos amostrais e descobrindo Dialogue: 0,0:09:07.77,0:09:09.28,Default,,0000,0000,0000,,qual é a variância. Dialogue: 0,0:09:09.28,0:09:14.24,Default,,0000,0000,0000,,Mas também há uma hipótese considerável da nossa média amostral Dialogue: 0,0:09:14.24,0:09:16.73,Default,,0000,0000,0000,,-- a nossa amostra estará sempre dentro dos dados da amostra, certo? Dialogue: 0,0:09:16.73,0:09:18.74,Default,,0000,0000,0000,,Estará sempre no meio da amostra de dados. -- Dialogue: 0,0:09:18.74,0:09:21.47,Default,,0000,0000,0000,,Mas é inteiramente possível que a média populacional Dialogue: 0,0:09:21.47,0:09:22.59,Default,,0000,0000,0000,,esteja fora da amostra de dados. Dialogue: 0,0:09:22.59,0:09:24.75,Default,,0000,0000,0000,,Poderemos ter pegado nos dados Dialogue: 0,0:09:24.75,0:09:28.11,Default,,0000,0000,0000,,não representativos da média populacional. Dialogue: 0,0:09:28.11,0:09:31.67,Default,,0000,0000,0000,,E depois, esta variância amostral calculada assim irá Dialogue: 0,0:09:31.67,0:09:34.99,Default,,0000,0000,0000,,de facto subestimar a verdadeira Dialogue: 0,0:09:34.99,0:09:36.24,Default,,0000,0000,0000,,variância populacional, certo? Dialogue: 0,0:09:36.24,0:09:38.23,Default,,0000,0000,0000,,Porque irão sempre estar mais próximo da sua própria média Dialogue: 0,0:09:38.23,0:09:39.96,Default,,0000,0000,0000,,do que da média populacional. Dialogue: 0,0:09:39.96,0:09:43.46,Default,,0000,0000,0000,,E se estiverem a perceber, francamente, até 10% Dialogue: 0,0:09:43.46,0:09:45.77,Default,,0000,0000,0000,,disto tudo, então são alunos muito avançados de estatística Dialogue: 0,0:09:45.77,0:09:49.12,Default,,0000,0000,0000,,mas só digo isto tudo para, espero eu, Dialogue: 0,0:09:49.12,0:09:53.50,Default,,0000,0000,0000,,vos estimular o raciocínio sobre como estes dados irão ocasionalmente subestimar -- Dialogue: 0,0:09:53.50,0:09:57.24,Default,,0000,0000,0000,,Como esta fórmula irá ocasionalmente subestimar Dialogue: 0,0:09:57.24,0:09:59.11,Default,,0000,0000,0000,,a variância populacional propriamente dita. Dialogue: 0,0:09:59.11,0:10:01.42,Default,,0000,0000,0000,,E existe uma fórmula -- e isto é comprovado mais rigorosamente Dialogue: 0,0:10:01.42,0:10:04.74,Default,,0000,0000,0000,,do que irei fazer aqui -- que é considerada melhor, Dialogue: 0,0:10:04.74,0:10:08.00,Default,,0000,0000,0000,,-- ou como dizem "não-enviesada" -- estimativa da Dialogue: 0,0:10:08.00,0:10:09.03,Default,,0000,0000,0000,,variância populacional. Dialogue: 0,0:10:09.03,0:10:11.39,Default,,0000,0000,0000,,Ou a variância populacional não-enviesada. Dialogue: 0,0:10:11.39,0:10:14.16,Default,,0000,0000,0000,,E por vezes é representada pelo "S ao quadrado" outra vez Dialogue: 0,0:10:14.16,0:10:18.93,Default,,0000,0000,0000,,E outra vezes por isto: "S n menos 1 ao quadrado". Dialogue: 0,0:10:18.93,0:10:20.72,Default,,0000,0000,0000,,E vou explicar porquê. Dialogue: 0,0:10:20.72,0:10:22.34,Default,,0000,0000,0000,,É praticamente o mesmo: Dialogue: 0,0:10:22.34,0:10:24.73,Default,,0000,0000,0000,,Pega-se em cada um dos pontos de dados, descobre-se o quão afastados Dialogue: 0,0:10:24.73,0:10:28.17,Default,,0000,0000,0000,,estão da média amostral Dialogue: 0,0:10:28.17,0:10:28.90,Default,,0000,0000,0000,,Faz-se o quadrado. Dialogue: 0,0:10:28.90,0:10:31.83,Default,,0000,0000,0000,,E depois, pega-se na média destes quadrados, excepto Dialogue: 0,0:10:31.83,0:10:33.43,Default,,0000,0000,0000,,por uma ligeira diferença: Dialogue: 0,0:10:33.43,0:10:35.72,Default,,0000,0000,0000,,de i=1 até i=n Dialogue: 0,0:10:35.72,0:10:39.37,Default,,0000,0000,0000,,Em vez de se dividir por "n", divide-se por um número Dialogue: 0,0:10:39.37,0:10:41.92,Default,,0000,0000,0000,,ligeiramente menor. Dialogue: 0,0:10:41.92,0:10:44.35,Default,,0000,0000,0000,,divide-se por "n" menos 1. Dialogue: 0,0:10:44.35,0:10:46.88,Default,,0000,0000,0000,,E quando se divide o "n" menos 1 em vez de se dividir por Dialogue: 0,0:10:46.88,0:10:49.59,Default,,0000,0000,0000,,"n", ir-se-á obter um número um pouco maior. Dialogue: 0,0:10:49.59,0:10:51.06,Default,,0000,0000,0000,,E ao que parece esta é de facto Dialogue: 0,0:10:51.06,0:10:52.26,Default,,0000,0000,0000,,uma estimativa muito melhor. Dialogue: 0,0:10:52.26,0:10:54.81,Default,,0000,0000,0000,,-- Um dia, irei escrever um programa de computador para, pelo menos, Dialogue: 0,0:10:54.81,0:10:57.43,Default,,0000,0000,0000,,conseguir convencer-me a mim próprio e experimentalmente Dialogue: 0,0:10:57.43,0:11:01.75,Default,,0000,0000,0000,,de que isto é uma estimativa melhor para a variância populacional. -- Dialogue: 0,0:11:01.75,0:11:03.43,Default,,0000,0000,0000,,E depois calcular-se-ia da mesma maneira, Dialogue: 0,0:11:03.43,0:11:05.27,Default,,0000,0000,0000,,apenas se divide por (n-1) Dialogue: 0,0:11:05.27,0:11:07.45,Default,,0000,0000,0000,,A outra maneira de pensar sobre isto -- E não, calma. Dialogue: 0,0:11:07.45,0:11:08.34,Default,,0000,0000,0000,,Já não tenho tempo. Dialogue: 0,0:11:08.34,0:11:09.50,Default,,0000,0000,0000,,Por agora, ficamos por aqui. Dialogue: 0,0:11:09.50,0:11:10.71,Default,,0000,0000,0000,,E depois no próximo vídeo, faremos uns quantos Dialogue: 0,0:11:10.71,0:11:12.59,Default,,0000,0000,0000,,cálculos para não ficarem muito sobrecarregados Dialogue: 0,0:11:12.59,0:11:13.27,Default,,0000,0000,0000,,com estas ideias. Dialogue: 0,0:11:13.27,0:11:14.81,Default,,0000,0000,0000,,Porque isto está a ficar um pouco abstracto. Dialogue: 0,0:11:14.81,0:11:16.66,Default,,0000,0000,0000,,Ver-nos-emos no próximo vídeo, até então!