1 00:00:01,100 --> 00:00:03,320 Este aqui é um vídeo "revolucionário" 2 00:00:03,320 --> 00:00:05,340 por vários motivos. 3 00:00:05,340 --> 00:00:09,910 Primeiro, porque farei uma introdução à VARIÂNCIA de uma amostra, 4 00:00:09,910 --> 00:00:11,750 o que só por si já é deveras interessante. 5 00:00:11,750 --> 00:00:14,520 E segundo, porque estou a tentar gravar em HD (Alta Definição) 6 00:00:14,520 --> 00:00:16,370 E, espero eu, poderão agora ver o vídeo maior e mais nitidamente 7 00:00:16,370 --> 00:00:17,030 que nunca. 8 00:00:17,030 --> 00:00:19,150 Mas vamos ver como corre. 9 00:00:19,150 --> 00:00:22,060 É uma experiência, espero que consigam acompanhar. 10 00:00:22,060 --> 00:00:25,180 Mas pronto, antes de começarmos com a variância de uma amostra, 11 00:00:25,180 --> 00:00:28,090 considero ser importante rever o conceito de VARIÂNCIA 12 00:00:28,090 --> 00:00:28,870 de uma população. 13 00:00:28,870 --> 00:00:32,180 E podemos comparar as fórmulas. 14 00:00:32,180 --> 00:00:34,790 A variância de uma população -- É esta 15 00:00:34,790 --> 00:00:36,100 letra Grega sigma 16 00:00:36,100 --> 00:00:37,420 este sigma minúsculo e ao quadrado. 17 00:00:37,420 --> 00:00:38,500 Isto simboliza a variância. 18 00:00:38,500 --> 00:00:41,010 Sei que é estranho uma variável já 19 00:00:41,010 --> 00:00:41,710 apresentar um quadrado(^2) nela. 20 00:00:41,710 --> 00:00:42,840 Mas não estamos a colocar uma variável ao quadrado. 21 00:00:42,840 --> 00:00:44,240 Esta é MESMO a variável. 22 00:00:44,240 --> 00:00:45,780 Sigma ao quadrado significa VARIÂNCIA. 23 00:00:45,780 --> 00:00:46,840 Aliás, vou apontar aqui. 24 00:00:46,840 --> 00:00:48,005 Isto é igual à variância. 25 00:00:51,550 --> 00:00:55,430 E isto é igual a -- Podemos retirar cada ponto de dados -- E 26 00:00:55,430 --> 00:00:58,800 vamos chamá-los de x menos i. 27 00:00:58,800 --> 00:01:01,700 Pega-se em cada um dos dados de ponto, descobrimos o quão afastado o valor está 28 00:01:01,700 --> 00:01:08,750 da média da população, coloca-se ao quadrado e depois vamos para 29 00:01:08,750 --> 00:01:11,160 a média de todos eles. 30 00:01:11,160 --> 00:01:12,900 Portanto pega-se na média, somam-se os valores todos 31 00:01:12,900 --> 00:01:14,200 vamos de "i", que é igual a 1. 32 00:01:14,200 --> 00:01:17,700 E do primeiro ponto, até ao ponto "n". 33 00:01:17,700 --> 00:01:19,940 e depois, para se obter uma média final, soma-se tudo e 34 00:01:19,940 --> 00:01:21,970 depois dividimos por "N". 35 00:01:21,970 --> 00:01:25,970 Portanto a variância é a média destas distâncias ao quadrado, 36 00:01:25,970 --> 00:01:27,390 de cada ponto até à média. 37 00:01:27,390 --> 00:01:29,700 Para se tornar mais intuitivo, a variância diz, basicamente 38 00:01:29,700 --> 00:01:32,920 o quão afastado cada valor dos pontos está, em média, 39 00:01:32,920 --> 00:01:34,420 afastado do valor meio. 40 00:01:34,420 --> 00:01:36,250 Esta é a melhor maneira de pensarmos sobre a variância. 41 00:01:36,250 --> 00:01:37,640 E agora que lidamos com -- isto foi tudo para 42 00:01:37,640 --> 00:01:39,140 uma população, correcto? 43 00:01:39,140 --> 00:01:42,050 E dissémos que se queríamos descobrir a variância da 44 00:01:42,050 --> 00:01:44,580 altura dos homens num país, seria muito difícil 45 00:01:44,580 --> 00:01:46,480 descobrir a variância de uma população. 46 00:01:46,480 --> 00:01:48,910 Teríamos de, praticamente, medir 47 00:01:48,910 --> 00:01:49,790 a altura de todos eles. 48 00:01:49,790 --> 00:01:51,360 250 milhões de pessoas. 49 00:01:51,360 --> 00:01:55,080 E como seria para uma população para a qual seja 50 00:01:55,080 --> 00:01:56,860 completamente impossível obter os dados ou 51 00:01:56,860 --> 00:01:57,640 alguma variável aleatória. 52 00:01:57,640 --> 00:01:59,100 Abordaremos isto mais tarde. 53 00:01:59,100 --> 00:02:02,660 Portanto, uma boa parte das vezes, o que queremos é ESTIMAR a variância 54 00:02:02,660 --> 00:02:04,690 através de uma amostra. 55 00:02:04,690 --> 00:02:07,420 Do mesmo modo que nunca conseguiríamos obter a média de uma população, 56 00:02:07,420 --> 00:02:09,570 mas poderíamos querer estimá-la por intermédio 57 00:02:09,570 --> 00:02:11,064 da média de uma amostra. 58 00:02:11,064 --> 00:02:13,890 E já aprendemos isto no primeiro vídeo. 59 00:02:13,890 --> 00:02:17,520 Se isto é -- se isto é a população total 60 00:02:17,520 --> 00:02:20,280 Sendo isto milhões de pontos de dados, ou mesmo pontos de dados no 61 00:02:20,280 --> 00:02:21,870 futuro e que nunca conseguiremos obter porque 62 00:02:21,870 --> 00:02:23,290 são variáveis aleatórias, 63 00:02:23,290 --> 00:02:24,243 Então esta é a nossa população. 64 00:02:26,920 --> 00:02:32,390 Poderemos querer apenas estimar as coisas analisando uma amostra. 65 00:02:32,390 --> 00:02:35,020 E é essencialmente nisto que consiste 66 00:02:35,020 --> 00:02:36,360 a Estatística Inferencial, afinal de contas: 67 00:02:36,360 --> 00:02:38,720 a obtenção de estatísticas descritivas de uma amostra 68 00:02:38,720 --> 00:02:40,890 e fazer inferências sobre a população total. 69 00:02:40,890 --> 00:02:44,610 Vou por exemplo testar esta droga em 100 pessoas e se tiver 70 00:02:44,610 --> 00:02:46,880 surtido efeitos significativos, estatisticamente, esta droga 71 00:02:46,880 --> 00:02:48,850 irá provavelmente funcionar na população em geral. 72 00:02:48,850 --> 00:02:49,800 É nisto que consiste a Estatística Inferencial. 73 00:02:49,800 --> 00:02:51,920 Portanto é muito importante compreender a noção de 74 00:02:51,920 --> 00:02:53,580 uma amostra e diferenciá-la da de população, 75 00:02:53,580 --> 00:02:57,510 e de sermos capazes de descobrir estatísticas sobre uma amostra que, 76 00:02:57,510 --> 00:03:00,160 caso geral, consiga descrever uma população ou ajudar-nos 77 00:03:00,160 --> 00:03:03,720 a estimar, como dizem, parâmetros para a população. 78 00:03:03,720 --> 00:03:07,330 Então qual é a média de uma -- Vou apenas re-escrever estas definições. 79 00:03:07,330 --> 00:03:08,830 Qual é a média de uma população? 80 00:03:08,830 --> 00:03:09,940 Vou escrever em roxo. 81 00:03:09,940 --> 00:03:11,630 Roxo para a população. 82 00:03:11,630 --> 00:03:13,680 A média da população. 83 00:03:13,680 --> 00:03:19,700 Pegamos apenas em cada um dos pontos de dados: "x(i)"... 84 00:03:19,700 --> 00:03:21,850 Somam-se todos... 85 00:03:21,850 --> 00:03:23,830 começamos com o primeiro ponto e fazemos o processo 86 00:03:23,830 --> 00:03:25,620 até ao ponto "N" dos dados. 87 00:03:25,620 --> 00:03:26,740 E finalmente dividimos por "N". 88 00:03:26,740 --> 00:03:27,800 Soma-se tudo e divide-se por "N". 89 00:03:27,800 --> 00:03:28,920 Isto é a média. 90 00:03:28,920 --> 00:03:30,500 Então seguimos agora esta fórmula 91 00:03:30,500 --> 00:03:33,060 e podemos ver o quão afastado está cada ponto deste mesmo 92 00:03:33,060 --> 00:03:34,270 ponto central, que é a MÉDIA. 93 00:03:34,270 --> 00:03:36,260 E assim obtemos a variância. 94 00:03:36,260 --> 00:03:39,670 Mas o que acontece se o fizermos para uma amostra? 95 00:03:39,670 --> 00:03:43,350 Bem, se quisermos estimar a média de uma população pelo 96 00:03:43,350 --> 00:03:46,600 cálculo de uma média para uma amostra, o melhor método que 97 00:03:46,600 --> 00:03:49,170 estou a ver -- E isto são apenas fórmulas "engenhadas" 98 00:03:49,170 --> 00:03:51,140 que representam pessoas a dizer: "bem, qual é a 99 00:03:51,140 --> 00:03:51,710 melhor maneira de "amostrar" isto tudo? 100 00:03:51,710 --> 00:03:54,550 Bem, o que conseguimos é pegar na média da nossa amostra. 101 00:03:54,550 --> 00:03:56,820 E isto é a MÉDIA AMOSTRAL. 102 00:03:56,820 --> 00:03:58,920 E aprendemos no primeiro vídeo que a notação 103 00:03:58,920 --> 00:04:00,450 -- A fórmula é quase idêntica a esta, 104 00:04:00,450 --> 00:04:01,540 é apenas a notação que muda. 105 00:04:01,540 --> 00:04:04,990 Em vez de escrevermos "myu", escrevemos um "x" com uma linha em cima. 106 00:04:04,990 --> 00:04:08,620 Média Amostral é igual a -- Uma vez mais, pega-se em cada um dos 107 00:04:08,620 --> 00:04:12,100 pontos de dados... os da amostra desta vez, não os da população toda... 108 00:04:12,100 --> 00:04:16,370 soma-se tudo desde o primeiro valor até 109 00:04:16,370 --> 00:04:17,380 ao valor "n", correcto? 110 00:04:17,380 --> 00:04:20,640 Está-se basicamente a dizer que há "n" pontos de dados nesta amostra. 111 00:04:20,640 --> 00:04:23,390 E depois divide-se pelo número de pontos de dados que se tem. 112 00:04:23,390 --> 00:04:24,320 Parece justo. 113 00:04:24,320 --> 00:04:25,660 É, aliás, praticamente a mesma fórmula. 114 00:04:25,660 --> 00:04:27,500 O modo como peguei na média de uma população e disse: 115 00:04:27,500 --> 00:04:29,590 "bem, já que tenho apenas a amostra, vou calcular a sua média do mesmo modo." 116 00:04:29,590 --> 00:04:32,560 E é provavelmente uma boa estimativa da média 117 00:04:32,560 --> 00:04:33,930 da população total. 118 00:04:33,930 --> 00:04:36,340 E agora é que fica interessante, ao inserirmos a variância nestes dados. 119 00:04:36,340 --> 00:04:39,250 A reacção normal de uma pessoa seria: "OK, tenho esta amostra. 120 00:04:39,250 --> 00:04:43,260 E se quero estimar a variância da população, 121 00:04:43,260 --> 00:04:45,230 porque não apenas aplicar a mesma fórmula 122 00:04:45,230 --> 00:04:46,150 à amostra em questão?" 123 00:04:46,150 --> 00:04:49,330 E eu poderia dizer -- E isto é de facto uma Variância Amostral. 124 00:04:49,330 --> 00:04:54,570 Usa-se a fórmula: S ao quadrado. 125 00:04:54,570 --> 00:04:58,220 Já agora, "sigma" é basicamente a letra Grega equivalente ao "S". 126 00:04:58,220 --> 00:04:59,980 E agora, quando lidarmos com a amostra, iremos 127 00:04:59,980 --> 00:05:01,000 apenas escrever o "S". 128 00:05:01,000 --> 00:05:02,320 E isto é a VARIÂNCIA AMOSTRAL. 129 00:05:02,320 --> 00:05:03,070 Vou apenas escrever aqui... 130 00:05:03,070 --> 00:05:03,950 Variância Amostral. 131 00:05:11,860 --> 00:05:15,870 Isto é -- Portanto poderíamos dizer: "bem, talvez uma boa forma de pegar na 132 00:05:15,870 --> 00:05:17,340 variância amostral é obtendo-a nela do mesmo modo. 133 00:05:17,340 --> 00:05:23,670 Vamos buscar a distância de cada ponto na amostra 134 00:05:23,670 --> 00:05:26,600 descobrir o quão afastada está da nossa média amostral, 135 00:05:26,600 --> 00:05:29,230 aqui usou-se a média da população, mas agora iremos usar 136 00:05:29,230 --> 00:05:31,450 a média da amostra, porque é tudo o que temos. 137 00:05:31,450 --> 00:05:33,160 Não é possível saber a média da população 138 00:05:33,160 --> 00:05:35,510 sem olhar para TODA a população. 139 00:05:35,510 --> 00:05:36,400 Calcula-se o quadrado disto tudo. 140 00:05:36,400 --> 00:05:38,160 Para o tornar positivo, entre outros motivos 141 00:05:38,160 --> 00:05:40,160 que serão abordados depois. 142 00:05:40,160 --> 00:05:42,730 E depois pega-se na média de todas estas distâncias ao quadrado. 143 00:05:42,730 --> 00:05:44,970 E obtém-se do -- Somamos tudo 144 00:05:44,970 --> 00:05:47,430 e há "n" valores para somar, certo? 145 00:05:47,430 --> 00:05:48,400 n minúsculo. 146 00:05:48,400 --> 00:05:51,820 e dividimos pelo "n" minúsculo 147 00:05:51,820 --> 00:05:53,230 E dirão: "Bem, isto é uma boa estimativa." 148 00:05:53,230 --> 00:05:55,580 Qualquer que seja a variância, esta será uma boa estimativa 149 00:05:55,580 --> 00:05:56,720 para o total da população. 150 00:05:56,720 --> 00:06:00,620 Por acaso, é a isto que algumas pessoas se referem quando 151 00:06:00,620 --> 00:06:01,980 falam de variância amostral. 152 00:06:01,980 --> 00:06:05,260 E, às vezes, esta pode ser referida deste modo: 153 00:06:05,260 --> 00:06:07,520 coloca-se um "n" minúsculo aqui... 154 00:06:07,520 --> 00:06:09,840 Faz-se isto porque dividimos tudo por "n". 155 00:06:09,840 --> 00:06:11,840 E pegungam vocês: "Sal, qual é o problema aqui?" 156 00:06:11,840 --> 00:06:14,000 E o problema -- Explicar-vos-ei o raciocínio porque eu 157 00:06:14,000 --> 00:06:16,180 costumava reflectir muito sobre isto. 158 00:06:16,180 --> 00:06:19,340 E, francamente, ainda penso muito sobre 159 00:06:19,340 --> 00:06:21,530 a intuição por detrás do seguinte. 160 00:06:21,530 --> 00:06:24,510 Bem, eu já tenho o raciocínio, mas de certo modo porque 161 00:06:24,510 --> 00:06:26,950 este se foi rigorosamente confirmando-se como sendo verídico, para mim. 162 00:06:26,950 --> 00:06:28,280 Mas pensem deste modo: 163 00:06:28,280 --> 00:06:29,905 Se tiver uns quantos números, e vou desenhar 164 00:06:29,905 --> 00:06:32,740 uma linha de números... 165 00:06:32,740 --> 00:06:35,740 Se desenhar uma linha de números aqui. Suponhamos que sabemos -- 166 00:06:35,740 --> 00:06:39,430 E digamos que tenho uns quantos números sobre a minha população. 167 00:06:39,430 --> 00:06:41,660 Digamos que -- vou apenas colocar aleatoriamente uns quantos 168 00:06:41,660 --> 00:06:44,280 números na minha população... 169 00:06:44,280 --> 00:06:45,928 E aqueles à direita são maiores que os 170 00:06:45,928 --> 00:06:46,355 do lado esquerdo. 171 00:06:48,900 --> 00:06:52,990 E se fôssemos retirar uma amostra deles, talvez eu retire -- 172 00:06:52,990 --> 00:06:54,820 A amostra, ela deve ser aleatória 173 00:06:54,820 --> 00:06:56,210 Precisamos de retirar uma amostra aleatoriamente. 174 00:06:56,210 --> 00:06:57,320 Não queremos que seja enviesada 175 00:06:57,320 --> 00:07:02,900 E vou então talvez retirar este, este, este... 176 00:07:02,900 --> 00:07:05,420 e este aqui, não? 177 00:07:05,420 --> 00:07:07,480 E depois se fosse calcular a média daquele, 178 00:07:07,480 --> 00:07:08,460 daquele, daquele, daquele... 179 00:07:08,460 --> 00:07:09,320 Estaria localizada (a média) algures no meio... 180 00:07:09,320 --> 00:07:11,010 poderá ser algures por aqui. 181 00:07:11,010 --> 00:07:13,240 E depois se quisesse descobrir a variância amostral por 182 00:07:13,240 --> 00:07:16,780 esta fórmula, diria: "Ok, a distância ao quadrado mais esta 183 00:07:16,780 --> 00:07:21,060 distância quadrada mais esta distância quadrada mais 184 00:07:21,060 --> 00:07:23,520 esta distância quadrada e faz-se a média de todas. 185 00:07:23,520 --> 00:07:24,700 E iria obter este número. 186 00:07:24,700 --> 00:07:27,820 E isto provavelmente seria uma aproximação boa para 187 00:07:27,820 --> 00:07:30,260 a variância de toda esta população. 188 00:07:30,260 --> 00:07:32,070 A população da média será provavelmente... 189 00:07:32,070 --> 00:07:33,030 sei lá 190 00:07:33,030 --> 00:07:35,020 poderá estar muito próxima deste valor 191 00:07:35,020 --> 00:07:37,150 Se porventura retirássemos todos estes valores e calculássemos a média 192 00:07:37,150 --> 00:07:39,060 talvez estivessem... aqui algures. 193 00:07:39,060 --> 00:07:40,660 E depois se se descobrir a variância, estaria provavelmente 194 00:07:40,660 --> 00:07:43,590 muito próxima da média de todas estas linhas, certo? 195 00:07:43,590 --> 00:07:46,810 De todas as distâncias de variância amostral, certo? 196 00:07:46,810 --> 00:07:47,250 Parece justo. 197 00:07:47,250 --> 00:07:47,900 Então agora dizem: "Ei, Sal 198 00:07:47,900 --> 00:07:49,710 Isto agora parece estar bem!" 199 00:07:49,710 --> 00:07:51,940 Mas há um problema. 200 00:07:51,940 --> 00:07:54,560 Então e se -- Há sempre a probabilidade de, 201 00:07:54,560 --> 00:07:56,990 em vez de pegarmos nestes números bem distribuídos 202 00:07:56,990 --> 00:08:00,800 na minha amostra, e se pegasse neste número, neste número, 203 00:08:00,800 --> 00:08:03,920 e neste número para definir -- e também aquele número -- 204 00:08:03,920 --> 00:08:05,400 a minha amostra? 205 00:08:05,400 --> 00:08:08,370 Bem, seja qual for a amostra, a média amostral estará 206 00:08:08,370 --> 00:08:10,210 sempre no meio, correcto? 207 00:08:10,210 --> 00:08:12,960 Bem, neste caso, a média amostral poderá estar AQUI MESMO. 208 00:08:12,960 --> 00:08:15,010 E todos estes números... poderão aliás dizer: "Ok, este número não 209 00:08:15,010 --> 00:08:17,810 está demasiado afastado deste, aquele não está demasiado afastado, e depois 210 00:08:17,810 --> 00:08:19,100 aquele número também não." 211 00:08:19,100 --> 00:08:21,790 Portanto a variância amostral, quando efectuada deste modo, 212 00:08:21,790 --> 00:08:23,610 poderá ser relativamente baixa 213 00:08:23,610 --> 00:08:26,920 porque todos estes números, estão muito -- vão 214 00:08:26,920 --> 00:08:28,920 praticamente, ficar muito próximos da 215 00:08:28,920 --> 00:08:30,350 média uns dos outros. 216 00:08:30,350 --> 00:08:34,600 Mas neste caso, a amostra está algo enviezada e 217 00:08:34,600 --> 00:08:37,980 a média da população estará algures afastada por aqui. 218 00:08:37,980 --> 00:08:40,800 Então a variância da amostra, se pudéssemos 219 00:08:40,800 --> 00:08:43,670 de facto saber a média -- sei que isto é algo confuso -- 220 00:08:43,670 --> 00:08:44,980 se tivéssemos sabido mesmo a média, 221 00:08:44,980 --> 00:08:46,830 teríamos dito "Uau!! 222 00:08:46,830 --> 00:08:48,386 Teríamos descoberto estas distâncias, das quais 223 00:08:48,386 --> 00:08:51,320 haveriam tantas outras. 224 00:08:51,320 --> 00:08:53,640 Essencialmente, o que digo é que, quando se pega 225 00:08:53,640 --> 00:08:58,280 numa amostra, há a probabilidade que a média amostral 226 00:08:58,280 --> 00:09:00,380 seja bastante próxima da média populacional, certo? 227 00:09:00,380 --> 00:09:02,610 Talvez a média amostral seja aqui e a 228 00:09:02,610 --> 00:09:03,360 média populacional aqui. 229 00:09:03,360 --> 00:09:05,770 E depois esta fórmula irá funcionar, provavelmente, muito bem, 230 00:09:05,770 --> 00:09:07,770 ao menos dados estes pontos amostrais e descobrindo 231 00:09:07,770 --> 00:09:09,280 qual é a variância. 232 00:09:09,280 --> 00:09:14,240 Mas também há uma hipótese considerável da nossa média amostral 233 00:09:14,240 --> 00:09:16,730 -- a nossa amostra estará sempre dentro dos dados da amostra, certo? 234 00:09:16,730 --> 00:09:18,740 Estará sempre no meio da amostra de dados. -- 235 00:09:18,740 --> 00:09:21,470 Mas é inteiramente possível que a média populacional 236 00:09:21,470 --> 00:09:22,590 esteja fora da amostra de dados. 237 00:09:22,590 --> 00:09:24,750 Poderemos ter pegado nos dados 238 00:09:24,750 --> 00:09:28,110 não representativos da média populacional. 239 00:09:28,110 --> 00:09:31,670 E depois, esta variância amostral calculada assim irá 240 00:09:31,670 --> 00:09:34,990 de facto subestimar a verdadeira 241 00:09:34,990 --> 00:09:36,240 variância populacional, certo? 242 00:09:36,240 --> 00:09:38,230 Porque irão sempre estar mais próximo da sua própria média 243 00:09:38,230 --> 00:09:39,960 do que da média populacional. 244 00:09:39,960 --> 00:09:43,460 E se estiverem a perceber, francamente, até 10% 245 00:09:43,460 --> 00:09:45,770 disto tudo, então são alunos muito avançados de estatística 246 00:09:45,770 --> 00:09:49,120 mas só digo isto tudo para, espero eu, 247 00:09:49,120 --> 00:09:53,500 vos estimular o raciocínio sobre como estes dados irão ocasionalmente subestimar -- 248 00:09:53,500 --> 00:09:57,240 Como esta fórmula irá ocasionalmente subestimar 249 00:09:57,240 --> 00:09:59,110 a variância populacional propriamente dita. 250 00:09:59,110 --> 00:10:01,420 E existe uma fórmula -- e isto é comprovado mais rigorosamente 251 00:10:01,420 --> 00:10:04,740 do que irei fazer aqui -- que é considerada melhor, 252 00:10:04,740 --> 00:10:08,000 -- ou como dizem "não-enviesada" -- estimativa da 253 00:10:08,000 --> 00:10:09,030 variância populacional. 254 00:10:09,030 --> 00:10:11,390 Ou a variância populacional não-enviesada. 255 00:10:11,390 --> 00:10:14,160 E por vezes é representada pelo "S ao quadrado" outra vez 256 00:10:14,160 --> 00:10:18,930 E outra vezes por isto: "S n menos 1 ao quadrado". 257 00:10:18,930 --> 00:10:20,720 E vou explicar porquê. 258 00:10:20,720 --> 00:10:22,340 É praticamente o mesmo: 259 00:10:22,340 --> 00:10:24,730 Pega-se em cada um dos pontos de dados, descobre-se o quão afastados 260 00:10:24,730 --> 00:10:28,170 estão da média amostral 261 00:10:28,170 --> 00:10:28,900 Faz-se o quadrado. 262 00:10:28,900 --> 00:10:31,830 E depois, pega-se na média destes quadrados, excepto 263 00:10:31,830 --> 00:10:33,430 por uma ligeira diferença: 264 00:10:33,430 --> 00:10:35,720 de i=1 até i=n 265 00:10:35,720 --> 00:10:39,370 Em vez de se dividir por "n", divide-se por um número 266 00:10:39,370 --> 00:10:41,920 ligeiramente menor. 267 00:10:41,920 --> 00:10:44,350 divide-se por "n" menos 1. 268 00:10:44,350 --> 00:10:46,880 E quando se divide o "n" menos 1 em vez de se dividir por 269 00:10:46,880 --> 00:10:49,590 "n", ir-se-á obter um número um pouco maior. 270 00:10:49,590 --> 00:10:51,060 E ao que parece esta é de facto 271 00:10:51,060 --> 00:10:52,260 uma estimativa muito melhor. 272 00:10:52,260 --> 00:10:54,810 -- Um dia, irei escrever um programa de computador para, pelo menos, 273 00:10:54,810 --> 00:10:57,430 conseguir convencer-me a mim próprio e experimentalmente 274 00:10:57,430 --> 00:11:01,750 de que isto é uma estimativa melhor para a variância populacional. -- 275 00:11:01,750 --> 00:11:03,430 E depois calcular-se-ia da mesma maneira, 276 00:11:03,430 --> 00:11:05,270 apenas se divide por (n-1) 277 00:11:05,270 --> 00:11:07,450 A outra maneira de pensar sobre isto -- E não, calma. 278 00:11:07,450 --> 00:11:08,340 Já não tenho tempo. 279 00:11:08,340 --> 00:11:09,500 Por agora, ficamos por aqui. 280 00:11:09,500 --> 00:11:10,710 E depois no próximo vídeo, faremos uns quantos 281 00:11:10,710 --> 00:11:12,590 cálculos para não ficarem muito sobrecarregados 282 00:11:12,590 --> 00:11:13,270 com estas ideias. 283 00:11:13,270 --> 00:11:14,810 Porque isto está a ficar um pouco abstracto. 284 00:11:14,810 --> 00:11:16,660 Ver-nos-emos no próximo vídeo, até então!