1 00:00:01,425 --> 00:00:05,015 -[Sensei] Em sua jornada para dominar a econometria, 2 00:00:05,015 --> 00:00:08,813 o nosso gafanhoto Kamal fez um grande progresso, 3 00:00:08,813 --> 00:00:13,662 aprimorando suas habilidades e ludibriando seus oponentes. 4 00:00:14,223 --> 00:00:16,640 Lamentavelmente, hoje ele está abatido, 5 00:00:16,640 --> 00:00:19,614 pois ainda precisa encarar um desafio. 6 00:00:19,614 --> 00:00:24,230 Kamal ainda não consegue decifrar as mensagens das pesquisas acadêmicas -- 7 00:00:24,230 --> 00:00:27,347 periódicos como "The American Economic Review" 8 00:00:27,347 --> 00:00:29,317 e "Econometrica". 9 00:00:29,317 --> 00:00:33,811 Para ele, eles parecem escritos em uma espécie de idioma misterioso. 10 00:00:33,841 --> 00:00:35,418 - [Kamal] Ué, mas que... ? 11 00:00:36,711 --> 00:00:40,069 Esses textos são impenetráveis para o aprendiz, 12 00:00:40,069 --> 00:00:42,205 mas Kamal pode decifrá-los com estudo. 13 00:00:42,467 --> 00:00:45,109 Vamos aprender a lê-los juntos. 14 00:00:52,657 --> 00:00:55,317 Vamos destrinchar o estudo da West Point, 15 00:00:55,317 --> 00:00:58,278 publicado em "Economics of Education Review." 16 00:00:58,658 --> 00:01:01,688 O artigo apresenta uma avaliação randomizada 17 00:01:01,688 --> 00:01:05,859 do uso de equipamento eletrônicos para os alunos nas aulas 101 de economia. 18 00:01:06,485 --> 00:01:09,192 Antes, uma breve revisão do modelo da pesquisa 19 00:01:09,423 --> 00:01:10,523 - OK. 20 00:01:11,553 --> 00:01:13,630 Mestres da econometria em West Point, 21 00:01:13,630 --> 00:01:17,029 o colégio militar que treina os oficiais do Exército americano; 22 00:01:17,029 --> 00:01:19,854 criaram um estudo randomizado para responder a questão. 23 00:01:20,582 --> 00:01:23,233 Os cadetes foram aleatoriamente distribuídos 24 00:01:23,233 --> 00:01:26,574 em turmas de Economia, cada uma com uma regra diferente. 25 00:01:27,116 --> 00:01:28,962 Diferente da maioria das faculdades, 26 00:01:28,962 --> 00:01:31,945 West Point proibe os eletrônicos na sala de aula. 27 00:01:32,482 --> 00:01:35,784 Para o experimento dar certo, alguns alunos foram alocados 28 00:01:35,784 --> 00:01:38,679 em turmas com a tradicional regra de proibir 29 00:01:38,679 --> 00:01:41,911 laptops, tablets e CELULARES! 30 00:01:41,911 --> 00:01:43,324 [eco] 31 00:01:43,324 --> 00:01:45,743 Esse é o grupo de controle, ou grupo de comparação. 32 00:01:46,372 --> 00:01:49,292 O outro grupo recebeu permissão para usar seus aparelhos. 33 00:01:49,292 --> 00:01:52,704 Este é o grupo de tratamento, submetido à um ambiente diferente. 34 00:01:53,313 --> 00:01:56,000 O tratamento neste caso é o uso livre 35 00:01:56,000 --> 00:01:58,107 de laptopts ou tablets em sala de aula. 36 00:01:59,195 --> 00:02:01,972 Toda questão causal tem um resultado claro -- 37 00:02:01,972 --> 00:02:05,379 as variáveis que esperamos influir definidas com o avanço do estudo. 38 00:02:06,058 --> 00:02:08,375 Os resultados dos estudos na West Point 39 00:02:08,375 --> 00:02:10,535 são as notas dos exames finais. 40 00:02:10,535 --> 00:02:13,810 O estudo busca responder a seguinte questão: 41 00:02:13,810 --> 00:02:17,629 Qual é o efeito do aprendizado de turmas com eletrônicos na aula 42 00:02:17,629 --> 00:02:19,765 medidas pelas notas dos exames? 43 00:02:20,852 --> 00:02:24,199 Artigos de economia em jornais geralmente começam com uma tabela 44 00:02:24,199 --> 00:02:25,994 de estatísticas descritivas, 45 00:02:25,994 --> 00:02:28,694 dando fatos chave sobre a amostra do estudo. 46 00:02:28,694 --> 00:02:32,129 Meu Deus, lembro-me dessa tabela -- muito confusa! 47 00:02:32,129 --> 00:02:37,224 As colunas de 1 a 3 relatam média e características. 48 00:02:37,224 --> 00:02:40,089 Isso nos dá um senso do que estamos estudando. 49 00:02:40,089 --> 00:02:43,736 Vamos começar com a coluna 1 que descreve covariáveis 50 00:02:43,736 --> 00:02:45,438 no grupo de controle. 51 00:02:45,438 --> 00:02:49,183 As covariáveis são características dos grupos de controle e tratamento 52 00:02:49,183 --> 00:02:52,091 medidas antes do iníco do experimento. 53 00:02:52,091 --> 00:02:57,514 Por exemplo, vemos que o grupo de controle tem uma média de idade acima de 20. 54 00:02:57,514 --> 00:03:00,339 Muitas dessas covariáveis são variáveis fictícias. 55 00:03:00,997 --> 00:03:06,087 Uma variável fictícia apenas pode ter dois valores - 0 ou 1. 56 00:03:06,087 --> 00:03:10,298 Por exemplo, o gênero do aluno é obtido por uma variável fictícia 57 00:03:10,298 --> 00:03:13,386 que iguala 1 para as mulheres e 0 para os homens. 58 00:03:13,386 --> 00:03:17,104 A média dessa variável é a proporção de mulheres. 59 00:03:17,104 --> 00:03:20,651 Também vemos que 13% do grupo de controle é hispânico 60 00:03:20,651 --> 00:03:23,905 e 19% têm precedentes em serviços militares. 61 00:03:25,035 --> 00:03:26,635 As notas da tabela são chave. 62 00:03:26,635 --> 00:03:29,218 Consulte-as enquanto analisa a tablea. 63 00:03:29,218 --> 00:03:33,534 Essas notas explicam o que é mostrado em cada coluna e painel. 64 00:03:39,485 --> 00:03:41,858 As notas nos mostra, por exemplo, 65 00:03:41,858 --> 00:03:45,175 que desvios padrões são relatados entre parênteses. 66 00:03:45,947 --> 00:03:49,598 Os desvios padrões nos mostra o quão difundidos são os dados. 67 00:03:50,448 --> 00:03:54,887 Por exemplo, um desvio padrão de 0.52 nos mostra que a maioria 68 00:03:54,887 --> 00:03:59,397 das médias de notas escolares do grupo de controle cai entre 2.35, 69 00:03:59,397 --> 00:04:03,454 que é 0.52 abaixo da média das notas escolares de 2.87, 70 00:04:03,454 --> 00:04:08,337 e 3.39, que é 0.52 sobre 2.87. 71 00:04:09,337 --> 00:04:12,122 Um desvio padrão menor significaria que as médias 72 00:04:12,122 --> 00:04:14,706 estavam mais agrupadas ao redor da média. 73 00:04:14,706 --> 00:04:17,543 -[Kamal] Sim, mas elas não estão na maioria das variáveis. 74 00:04:17,543 --> 00:04:18,600 -[Sensei] É isso aí. 75 00:04:18,600 --> 00:04:22,497 Os mestres geralmente omitem os desvios padrões por fictícios, 76 00:04:22,497 --> 00:04:26,500 porque a média da variável determina seu desvio padrão. 77 00:04:27,542 --> 00:04:30,102 Este estudo compara dois grupos de tratamento 78 00:04:30,102 --> 00:04:32,078 com o grupo de controle. 79 00:04:32,078 --> 00:04:35,886 O primeiro teve livre acesso ao uso de laptops ou tablets. 80 00:04:35,886 --> 00:04:38,252 O segundo tratamento foi mais restritivo, 81 00:04:38,252 --> 00:04:41,713 permitindo apenas tablets sobre a mesa. 82 00:04:42,152 --> 00:04:45,238 Os grupos de tratamento se parecem muito com o de controle. 83 00:04:46,694 --> 00:04:51,443 Isso nos leva ao próximo elemento dessa tabela, as colunas 4 a 6 84 00:04:51,443 --> 00:04:54,558 usam testes estatísticos para comparar as características 85 00:04:54,558 --> 00:04:57,591 dos grupos de controle e tratamento antes do experimento. 86 00:04:58,158 --> 00:05:01,991 Na coluna 4, os dois grupos de tratamento são combinados. 87 00:05:01,991 --> 00:05:04,998 Vocês podem ver que a diferença em proporção feminina 88 00:05:04,998 --> 00:05:09,690 entre os grupos de controle e tratamento é apenas 0.03. 89 00:05:10,508 --> 00:05:13,740 A diferença não é estatisticamente significante -- 90 00:05:14,290 --> 00:05:17,440 é o tipo de diferença que podemos facilmente colocar 91 00:05:17,440 --> 00:05:20,623 para causar resultados em nosso processo de seleção de amostra. 92 00:05:20,623 --> 00:05:22,133 -[Kamal] Como saberemos isso? 93 00:05:22,133 --> 00:05:23,790 Você se lembra da regra de ouro? 94 00:05:23,790 --> 00:05:27,122 Estimativas estatísticas que excedem o erro padrão 95 00:05:27,122 --> 00:05:30,108 por um múltiplo de 2 em valor absoluto, 96 00:05:30,108 --> 00:05:33,997 geralmente são chamadas de estatísticamente significantes. 97 00:05:35,132 --> 00:05:38,766 O erro padrão é 0.03, 98 00:05:38,766 --> 00:05:41,483 o mesmo da diferença de proporção feminina. 99 00:05:42,244 --> 00:05:46,132 Então a proporção do primeiro para o segundo é apenas 1, 100 00:05:46,132 --> 00:05:48,607 que, é claro, é menor que 2. 101 00:05:48,607 --> 00:05:51,191 -[Kamal] Oh! Então nenhuma das diferenças dos grupos 102 00:05:51,191 --> 00:05:54,455 da tabela são mais que o dobro de seus erros padrões. 103 00:05:54,455 --> 00:05:55,997 Correto. 104 00:05:55,997 --> 00:05:59,081 A divisão aleatória dos estudantes parece ter tido sucesso 105 00:05:59,081 --> 00:06:01,945 na criação dos grupos que são de fato comparáveis. 106 00:06:02,846 --> 00:06:05,008 Portanto, podemos ficar confiantes 107 00:06:05,008 --> 00:06:07,774 de que nenhuma diferença posterior no sucesso das turmas 108 00:06:07,774 --> 00:06:11,073 sejam o resultado de intervenções experimentais, 109 00:06:11,073 --> 00:06:14,754 ao invés da reflexão de diferenças pré-existentes. 110 00:06:14,754 --> 00:06:17,454 Ceteris Paribus alcançada! 111 00:06:17,454 --> 00:06:20,934 -[Kamal] Legal. Espera ái, e a parte inferior, 112 00:06:20,934 --> 00:06:22,833 os números com as estrelas? 113 00:06:22,833 --> 00:06:25,589 Aquelas diferenças são mais do que o dobro do erro padrão. 114 00:06:25,589 --> 00:06:27,402 Bem observado, Kamal! 115 00:06:27,402 --> 00:06:29,386 A tabela tem muitos números. 116 00:06:29,386 --> 00:06:32,246 Aqueles no painel B são importantes também. 117 00:06:32,246 --> 00:06:35,715 Essse painel mede a proporção do uso de computadores 118 00:06:35,715 --> 00:06:39,139 que os grupos de tratamento e controle de fato usaram em aula. 119 00:06:39,754 --> 00:06:42,873 O grupo de tratamento pôde usar computadores. 120 00:06:43,278 --> 00:06:44,873 Os pesquisadores devem mostrar 121 00:06:44,873 --> 00:06:47,079 que os estudantes que usaram computadores 122 00:06:47,079 --> 00:06:49,448 aproveitaram a oportunidade. 123 00:06:50,072 --> 00:06:53,033 Se eles não aproveitaram, então não há tratamento. 124 00:06:53,867 --> 00:06:57,799 felizmente, 81% daqueles no primeiro grupo de tratamento 125 00:06:57,799 --> 00:06:59,472 usaram computadores; 126 00:06:59,472 --> 00:07:02,178 comparados com nenhum do grupo de controle. 127 00:07:02,178 --> 00:07:05,216 E muitos no segundo bloco do grupo de tratamento 128 00:07:05,216 --> 00:07:07,264 também usaram computadores. 129 00:07:07,264 --> 00:07:09,879 Essas diferenças no uso de computadores são grandes 130 00:07:09,879 --> 00:07:11,798 e estatísticamente significantes. 131 00:07:12,081 --> 00:07:15,428 Também podemos ver o tamanho da amostra em cada grupo. 132 00:07:15,428 --> 00:07:18,098 -[Kamal] As estrelas são só decoração? 133 00:07:18,098 --> 00:07:21,748 Alguns papéis acadêmicos usam as estrelas para indicar diferenças 134 00:07:21,748 --> 00:07:23,983 que são estatísticamente significantes. 135 00:07:23,983 --> 00:07:26,925 Isso é para chamar a sua atenção. 136 00:07:26,925 --> 00:07:31,621 Aqui, 3 estrelas indicam que o resultado é estatísticamente diferente 137 00:07:31,621 --> 00:07:34,942 de 0 com um valor-p menor que 1%. 138 00:07:35,672 --> 00:07:39,436 Ou seja, a chance é menos que 1 em 100 139 00:07:39,436 --> 00:07:42,171 de que esse resultado seja uma descoberta causal. 140 00:07:42,171 --> 00:07:43,181 [aplauso] 141 00:07:43,181 --> 00:07:48,997 2 estrelas indicam 1 em 20 ou 5% de chance de uma descoberta causal. 142 00:07:48,997 --> 00:07:52,469 1 estrela mostra os resultados que vemos tão frequentemente 143 00:07:52,469 --> 00:07:56,036 quanto 10% das vezes, meramente devido à causa. 144 00:07:56,473 --> 00:07:59,957 Hoje, as estrelas são vistas como um pouco foras de moda. 145 00:07:59,957 --> 00:08:01,606 Alguns jornais as omitem. 146 00:08:01,606 --> 00:08:03,894 -[Kamal] E as últimas duas colunas? 147 00:08:03,894 --> 00:08:06,007 Ao contrário da coluna 4, que combina 148 00:08:06,007 --> 00:08:09,689 os grupos de controle e tratamento em um, essas duas últimas colunas 149 00:08:09,689 --> 00:08:12,357 buscam as diferenças nos grupos separadamente 150 00:08:12,357 --> 00:08:14,572 para cada grupo de tratamento. 151 00:08:14,572 --> 00:08:17,441 Isso fornece uma análise mais detalhada do balanço. 152 00:08:18,295 --> 00:08:21,288 E por agora, você também pode ignorar essa linha 153 00:08:21,288 --> 00:08:24,205 que fornece outro teste de significância. 154 00:08:24,755 --> 00:08:29,062 E agora chegamos ao ponto alto do artigo, a tabela 4. 155 00:08:30,075 --> 00:08:32,993 Essa tabela mostra as estimativas de regressão 156 00:08:32,993 --> 00:08:37,273 dos efeitos do uso de eletrônicos em medidas do aprendizado do estudante. 157 00:08:37,273 --> 00:08:40,258 -[Kamal] Por que o estudo relata estimativa de regressão? 158 00:08:40,258 --> 00:08:42,529 Está vendo,é por isso que ficamos perdidos. 159 00:08:42,529 --> 00:08:44,806 A razão para gostarmos de ensaios randomizados 160 00:08:44,806 --> 00:08:47,260 é porque os usamos para obter efeitos causais 161 00:08:47,260 --> 00:08:50,479 simplesmente comparando os grupos de controle e tratamento. 162 00:08:50,479 --> 00:08:53,883 Já que os grupos são equilibrados, não há necessidae de regressão. 163 00:08:53,883 --> 00:08:55,492 Bem observado, Kamal. 164 00:08:55,492 --> 00:08:59,272 Na prática, é comum relatar as estimativas de regressão 165 00:08:59,272 --> 00:09:01,013 por duas razões. 166 00:09:01,013 --> 00:09:04,448 Primeiro, evidência de equilíbrio apesar de tudo. 167 00:09:04,448 --> 00:09:07,349 Uma abundância de precaução pode levar o analista 168 00:09:07,349 --> 00:09:09,678 a admitir diferenças causais. 169 00:09:09,678 --> 00:09:13,622 Segundo, as estimativas de regressão provavelmente são mais precisas -- 170 00:09:13,622 --> 00:09:16,509 isto é, elas têm menos padrões de erros 171 00:09:16,509 --> 00:09:18,943 do que simples comparações de controle e tratamento. 172 00:09:20,129 --> 00:09:22,526 A variável dependente neste estudo 173 00:09:22,526 --> 00:09:24,305 é o resultado do interesse. 174 00:09:24,652 --> 00:09:26,192 Já que a questão aqui 175 00:09:26,192 --> 00:09:29,068 é como aulas com eletrônicos afetam o aprendizado, 176 00:09:29,068 --> 00:09:32,845 um bom resultado é a nota do exame final de Economia. 177 00:09:33,406 --> 00:09:37,650 Cada coluna mostra resultados de um modelo de regressão diferente. 178 00:09:37,650 --> 00:09:40,476 Os modelos são distinguidos pelas variáveis de controle 179 00:09:40,476 --> 00:09:44,453 ou pelas covariáveis incluídas, além do status do tratamento. 180 00:09:44,934 --> 00:09:48,425 Estimativas sem covariáveis são comparações simples 181 00:09:48,425 --> 00:09:50,677 de grupos de controle e tratamento. 182 00:09:50,677 --> 00:09:53,169 -[Kamal] Eu achei que eles esqueceram de preencher. 183 00:09:53,169 --> 00:09:56,228 A coluna 1 indica que o uso de eletrônicos 184 00:09:56,228 --> 00:10:00,835 reduziu as notas dos exames finais por 0.28 deviações padrões. 185 00:10:01,547 --> 00:10:02,940 Em nossa última aula, 186 00:10:02,940 --> 00:10:07,237 O mestre Joshway explicou que usamos unidades de deviações padrões, 187 00:10:07,237 --> 00:10:10,672 porque essas unidades são facilmente comparadas entre estudos. 188 00:10:11,352 --> 00:10:13,193 A coluna 2 mostra resultados 189 00:10:13,193 --> 00:10:16,082 de um modelo que adiciona controles demográficos. 190 00:10:16,082 --> 00:10:19,907 Aqui, estamos comparando notas, mas lidando com fatores constantes 191 00:10:19,907 --> 00:10:21,435 como idade e sexo. 192 00:10:21,886 --> 00:10:25,602 A coluna 3 mostra resultados de um modelo que adicona média de nota escolar 193 00:10:25,602 --> 00:10:27,186 junto com a lista de covariáveis. 194 00:10:27,603 --> 00:10:30,822 A coluna 4 adicona notas do teste ACT. 195 00:10:30,822 --> 00:10:33,503 Analistas geralmente mostram os resultados desse jeito, 196 00:10:33,503 --> 00:10:36,992 começando com modelos que incluem poucas ou nenhuma covariável; 197 00:10:36,992 --> 00:10:39,667 e então mostrando as estimativas de modelos 198 00:10:39,667 --> 00:10:43,586 que adicionam mais e mais covariáveis conforme nos movemos pelas colunas. 199 00:10:44,035 --> 00:10:46,802 O que você percebe olhando as colunas? 200 00:10:47,252 --> 00:10:49,919 -[Kamal] Bom, o coeficiente do uso de computadores 201 00:10:49,919 --> 00:10:51,635 sempre é um número bem negativo. 202 00:10:51,635 --> 00:10:53,002 Exatamente! 203 00:10:53,002 --> 00:10:56,455 Também podemos ver que os erros padrões são pequenos o bastante 204 00:10:56,455 --> 00:11:00,561 para tornar esses resultados negativos estatísticamente significantes. 205 00:11:00,561 --> 00:11:04,446 Ou seja, a primeira coisa que levamos desse experimento 206 00:11:04,446 --> 00:11:08,381 é que os eletrônicos nas aulas reduzem o aprendizado do estudante. 207 00:11:09,000 --> 00:11:12,283 -[Kamal] As notas da média escolar e da ACT também são importantes. 208 00:11:12,283 --> 00:11:13,750 Por que é assim? 209 00:11:13,750 --> 00:11:15,423 Boa observação! 210 00:11:15,423 --> 00:11:16,866 Isso não é surpreendente. 211 00:11:16,866 --> 00:11:20,473 Esperamos que essas variáveis estimem a performance na faculdade. 212 00:11:20,473 --> 00:11:22,190 -[Kamal] Ah sim, é claro. 213 00:11:22,190 --> 00:11:24,026 Os que conseguiram melhores notas antes 214 00:11:24,026 --> 00:11:26,317 têm mais chance de conseguir melhores notas neste curso. 215 00:11:26,317 --> 00:11:30,226 Vocês também verão muitas outras informações nessa tabela. 216 00:11:30,226 --> 00:11:34,515 Os painéis restantes na tabela mostram efeitos do uso de eletrônicos 217 00:11:34,515 --> 00:11:36,933 em componentes do exame final, 218 00:11:36,933 --> 00:11:39,816 tais como as múltiplas questões de escolha. 219 00:11:39,816 --> 00:11:43,371 Esses resultados são mais consistentes com efeito de uso de coputadores 220 00:11:43,371 --> 00:11:45,360 nas notas médias. 221 00:11:45,360 --> 00:11:47,740 -[Kamal] E essas linhas que não estão em inglês? 222 00:11:47,740 --> 00:11:50,994 Essas linhas fornecem informação estatística adicional. 223 00:11:50,994 --> 00:11:54,247 R² é uma medida de bondade de ajuste. 224 00:11:54,714 --> 00:11:56,009 Isso não é tão importante, 225 00:11:56,009 --> 00:11:58,190 ainda que alguns leitores queiram saber disso. 226 00:11:58,660 --> 00:12:02,950 As outras linhas mostram testes alternativos de significância estatística 227 00:12:02,950 --> 00:12:05,028 que vocês podem ignonar por agora. 228 00:12:05,028 --> 00:12:07,934 -[Kamal] Meu Deus, essas tabelas não são tão complicadas! 229 00:12:07,934 --> 00:12:09,488 Muito obrigado. 230 00:12:09,488 --> 00:12:11,787 A próxima aula é sobre regressão. 231 00:12:11,787 --> 00:12:13,179 Vejo vocês lá! 232 00:12:15,974 --> 00:12:17,263 ♪ [música] ♪ 233 00:12:17,263 --> 00:12:20,575 Você está no caminho certo para dominar a econometria. 234 00:12:20,834 --> 00:12:22,783 Fixe o que aprendeu neste vídeo 235 00:12:22,783 --> 00:12:25,467 fazendo algumas questões práticas. 236 00:12:25,467 --> 00:12:29,003 Ou, caso esteja pronto, clique no próximo vídeo. 237 00:12:29,003 --> 00:12:32,901 Você também pode visitar o site da MRU para mais cursos, 238 00:12:32,901 --> 00:12:35,298 materias de professores e mais. 239 00:12:35,651 --> 00:12:38,111 Tradução: John Silva.