WEBVTT 00:00:01.425 --> 00:00:05.015 -[Sensei] Em sua jornada para dominar a econometria, 00:00:05.015 --> 00:00:08.813 o nosso gafanhoto Kamal fez um grande progresso, 00:00:08.813 --> 00:00:13.662 aprimorando suas habilidades e ludibriando seus oponentes. 00:00:14.223 --> 00:00:16.640 Lamentavelmente, hoje ele está abatido, 00:00:16.640 --> 00:00:19.614 pois ainda precisa encarar um desafio. 00:00:19.614 --> 00:00:24.230 Kamal ainda não consegue decifrar as mensagens das pesquisas acadêmicas -- 00:00:24.230 --> 00:00:27.347 periódicos como "The American Economic Review" 00:00:27.347 --> 00:00:29.317 e "Econometrica". 00:00:29.317 --> 00:00:33.811 Para ele, eles parecem escritos em uma espécie de idioma misterioso. 00:00:33.841 --> 00:00:35.418 - [Kamal] Ué, mas que... ? 00:00:36.711 --> 00:00:40.069 Esses textos são impenetráveis para o aprendiz, 00:00:40.069 --> 00:00:42.205 mas Kamal pode decifrá-los com estudo. 00:00:42.467 --> 00:00:45.109 Vamos aprender a lê-los juntos. 00:00:52.657 --> 00:00:55.317 Vamos destrinchar o estudo da West Point, 00:00:55.317 --> 00:00:58.278 publicado em "Economics of Education Review." 00:00:58.658 --> 00:01:01.688 O artigo apresenta uma avaliação randomizada 00:01:01.688 --> 00:01:05.859 do uso de equipamento eletrônicos para os alunos nas aulas 101 de economia. 00:01:06.485 --> 00:01:09.192 Antes, uma breve revisão do modelo da pesquisa 00:01:09.423 --> 00:01:10.523 - OK. 00:01:11.553 --> 00:01:13.630 Mestres da econometria em West Point, 00:01:13.630 --> 00:01:17.029 o colégio militar que treina os oficiais do Exército americano; 00:01:17.029 --> 00:01:19.854 criaram um estudo randomizado para responder a questão. 00:01:20.582 --> 00:01:23.233 Os cadetes foram aleatoriamente distribuídos 00:01:23.233 --> 00:01:26.574 em turmas de Economia, cada uma com uma regra diferente. 00:01:27.116 --> 00:01:28.962 Diferente da maioria das faculdades, 00:01:28.962 --> 00:01:31.945 West Point proibe os eletrônicos na sala de aula. 00:01:32.482 --> 00:01:35.784 Para o experimento dar certo, alguns alunos foram alocados 00:01:35.784 --> 00:01:38.679 em turmas com a tradicional regra de proibir 00:01:38.679 --> 00:01:41.911 laptops, tablets e CELULARES! 00:01:41.911 --> 00:01:43.324 [eco] 00:01:43.324 --> 00:01:45.743 Esse é o grupo de controle, ou grupo de comparação. 00:01:46.372 --> 00:01:49.292 O outro grupo recebeu permissão para usar seus aparelhos. 00:01:49.292 --> 00:01:52.704 Este é o grupo de tratamento, submetido à um ambiente diferente. 00:01:53.313 --> 00:01:56.000 O tratamento neste caso é o uso livre 00:01:56.000 --> 00:01:58.107 de laptopts ou tablets em sala de aula. 00:01:59.195 --> 00:02:01.972 Toda questão causal tem um resultado claro -- 00:02:01.972 --> 00:02:05.379 as variáveis que esperamos influir definidas com o avanço do estudo. 00:02:06.058 --> 00:02:08.375 Os resultados dos estudos na West Point 00:02:08.375 --> 00:02:10.535 são as notas dos exames finais. 00:02:10.535 --> 00:02:13.810 O estudo busca responder a seguinte questão: 00:02:13.810 --> 00:02:17.629 Qual é o efeito do aprendizado de turmas com eletrônicos na aula 00:02:17.629 --> 00:02:19.765 medidas pelas notas dos exames? 00:02:20.852 --> 00:02:24.199 Artigos de economia em jornais geralmente começam com uma tabela 00:02:24.199 --> 00:02:25.994 de estatísticas descritivas, 00:02:25.994 --> 00:02:28.694 dando fatos chave sobre a amostra do estudo. 00:02:28.694 --> 00:02:32.129 Meu Deus, lembro-me dessa tabela -- muito confusa! 00:02:32.129 --> 00:02:37.224 As colunas de 1 a 3 relatam média e características. 00:02:37.224 --> 00:02:40.089 Isso nos dá um senso do que estamos estudando. 00:02:40.089 --> 00:02:43.736 Vamos começar com a coluna 1 que descreve covariáveis 00:02:43.736 --> 00:02:45.438 no grupo de controle. 00:02:45.438 --> 00:02:49.183 As covariáveis são características dos grupos de controle e tratamento 00:02:49.183 --> 00:02:52.091 medidas antes do iníco do experimento. 00:02:52.091 --> 00:02:57.514 Por exemplo, vemos que o grupo de controle tem uma média de idade acima de 20. 00:02:57.514 --> 00:03:00.339 Muitas dessas covariáveis são variáveis fictícias. 00:03:00.997 --> 00:03:06.087 Uma variável fictícia apenas pode ter dois valores - 0 ou 1. 00:03:06.087 --> 00:03:10.298 Por exemplo, o gênero do aluno é obtido por uma variável fictícia 00:03:10.298 --> 00:03:13.386 que iguala 1 para as mulheres e 0 para os homens. 00:03:13.386 --> 00:03:17.104 A média dessa variável é a proporção de mulheres. 00:03:17.104 --> 00:03:20.651 Também vemos que 13% do grupo de controle é hispânico 00:03:20.651 --> 00:03:23.905 e 19% têm precedentes em serviços militares. 00:03:25.035 --> 00:03:26.635 As notas da tabela são chave. 00:03:26.635 --> 00:03:29.218 Consulte-as enquanto analisa a tablea. 00:03:29.218 --> 00:03:33.534 Essas notas explicam o que é mostrado em cada coluna e painel. 00:03:39.485 --> 00:03:41.858 As notas nos mostra, por exemplo, 00:03:41.858 --> 00:03:45.175 que desvios padrões são relatados entre parênteses. 00:03:45.947 --> 00:03:49.598 Os desvios padrões nos mostra o quão difundidos são os dados. 00:03:50.448 --> 00:03:54.887 Por exemplo, um desvio padrão de 0.52 nos mostra que a maioria 00:03:54.887 --> 00:03:59.397 das médias de notas escolares do grupo de controle cai entre 2.35, 00:03:59.397 --> 00:04:03.454 que é 0.52 abaixo da média das notas escolares de 2.87, 00:04:03.454 --> 00:04:08.337 e 3.39, que é 0.52 sobre 2.87. 00:04:09.337 --> 00:04:12.122 Um desvio padrão menor significaria que as médias 00:04:12.122 --> 00:04:14.706 estavam mais agrupadas ao redor da média. 00:04:14.706 --> 00:04:17.543 -[Kamal] Sim, mas elas não estão na maioria das variáveis. 00:04:17.543 --> 00:04:18.600 -[Sensei] É isso aí. 00:04:18.600 --> 00:04:22.497 Os mestres geralmente omitem os desvios padrões por fictícios, 00:04:22.497 --> 00:04:26.500 porque a média da variável determina seu desvio padrão. 00:04:27.542 --> 00:04:30.102 Este estudo compara dois grupos de tratamento 00:04:30.102 --> 00:04:32.078 com o grupo de controle. 00:04:32.078 --> 00:04:35.886 O primeiro teve livre acesso ao uso de laptops ou tablets. 00:04:35.886 --> 00:04:38.252 O segundo tratamento foi mais restritivo, 00:04:38.252 --> 00:04:41.713 permitindo apenas tablets sobre a mesa. 00:04:42.152 --> 00:04:45.238 Os grupos de tratamento se parecem muito com o de controle. 00:04:46.694 --> 00:04:51.443 Isso nos leva ao próximo elemento dessa tabela, as colunas 4 a 6 00:04:51.443 --> 00:04:54.558 usam testes estatísticos para comparar as características 00:04:54.558 --> 00:04:57.591 dos grupos de controle e tratamento antes do experimento. 00:04:58.158 --> 00:05:01.991 Na coluna 4, os dois grupos de tratamento são combinados. 00:05:01.991 --> 00:05:04.998 Vocês podem ver que a diferença em proporção feminina 00:05:04.998 --> 00:05:09.690 entre os grupos de controle e tratamento é apenas 0.03. 00:05:10.508 --> 00:05:13.740 A diferença não é estatisticamente significante -- 00:05:14.290 --> 00:05:17.440 é o tipo de diferença que podemos facilmente colocar 00:05:17.440 --> 00:05:20.623 para causar resultados em nosso processo de seleção de amostra. 00:05:20.623 --> 00:05:22.133 -[Kamal] Como saberemos isso? 00:05:22.133 --> 00:05:23.790 Você se lembra da regra de ouro? 00:05:23.790 --> 00:05:27.122 Estimativas estatísticas que excedem o erro padrão 00:05:27.122 --> 00:05:30.108 por um múltiplo de 2 em valor absoluto, 00:05:30.108 --> 00:05:33.997 geralmente são chamadas de estatísticamente significantes. 00:05:35.132 --> 00:05:38.766 O erro padrão é 0.03, 00:05:38.766 --> 00:05:41.483 o mesmo da diferença de proporção feminina. 00:05:42.244 --> 00:05:46.132 Então a proporção do primeiro para o segundo é apenas 1, 00:05:46.132 --> 00:05:48.607 que, é claro, é menor que 2. 00:05:48.607 --> 00:05:51.191 -[Kamal] Oh! Então nenhuma das diferenças dos grupos 00:05:51.191 --> 00:05:54.455 da tabela são mais que o dobro de seus erros padrões. 00:05:54.455 --> 00:05:55.997 Correto. 00:05:55.997 --> 00:05:59.081 A divisão aleatória dos estudantes parece ter tido sucesso 00:05:59.081 --> 00:06:01.945 na criação dos grupos que são de fato comparáveis. 00:06:02.846 --> 00:06:05.008 Portanto, podemos ficar confiantes 00:06:05.008 --> 00:06:07.774 de que nenhuma diferença posterior no sucesso das turmas 00:06:07.774 --> 00:06:11.073 sejam o resultado de intervenções experimentais, 00:06:11.073 --> 00:06:14.754 ao invés da reflexão de diferenças pré-existentes. 00:06:14.754 --> 00:06:17.454 Ceteris Paribus alcançada! 00:06:17.454 --> 00:06:20.934 -[Kamal] Legal. Espera ái, e a parte inferior, 00:06:20.934 --> 00:06:22.833 os números com as estrelas? 00:06:22.833 --> 00:06:25.589 Aquelas diferenças são mais do que o dobro do erro padrão. 00:06:25.589 --> 00:06:27.402 Bem observado, Kamal! 00:06:27.402 --> 00:06:29.386 A tabela tem muitos números. 00:06:29.386 --> 00:06:32.246 Aqueles no painel B são importantes também. 00:06:32.246 --> 00:06:35.715 Essse painel mede a proporção do uso de computadores 00:06:35.715 --> 00:06:39.139 que os grupos de tratamento e controle de fato usaram em aula. 00:06:39.754 --> 00:06:42.873 O grupo de tratamento pôde usar computadores. 00:06:43.278 --> 00:06:44.873 Os pesquisadores devem mostrar 00:06:44.873 --> 00:06:47.079 que os estudantes que usaram computadores 00:06:47.079 --> 00:06:49.448 aproveitaram a oportunidade. 00:06:50.072 --> 00:06:53.033 Se eles não aproveitaram, então não há tratamento. NOTE Paragraph 00:06:53.867 --> 00:06:57.799 felizmente, 81% daqueles no primeiro grupo de tratamento 00:06:57.799 --> 00:06:59.472 usaram computadores; 00:06:59.472 --> 00:07:02.178 comparados com nenhum do grupo de controle. 00:07:02.178 --> 00:07:05.216 E muitos no segundo bloco do grupo de tratamento 00:07:05.216 --> 00:07:07.264 também usaram computadores. 00:07:07.264 --> 00:07:09.879 Essas diferenças no uso de computadores são grandes 00:07:09.879 --> 00:07:11.798 e estatísticamente significantes. 00:07:12.081 --> 00:07:15.428 Também podemos ver o tamanho da amostra em cada grupo. 00:07:15.428 --> 00:07:18.098 -[Kamal] As estrelas são só decoração? 00:07:18.098 --> 00:07:21.748 Alguns papéis acadêmicos usam as estrelas para indicar diferenças 00:07:21.748 --> 00:07:23.983 que são estatísticamente significantes. 00:07:23.983 --> 00:07:26.925 Isso é para chamar a sua atenção. 00:07:26.925 --> 00:07:31.621 Aqui, 3 estrelas indicam que o resultado é estatísticamente diferente 00:07:31.621 --> 00:07:34.942 de 0 com um valor-p menor que 1%. 00:07:35.672 --> 00:07:39.436 Ou seja, a chance é menos que 1 em 100 00:07:39.436 --> 00:07:42.171 de que esse resultado seja uma descoberta causal. 00:07:42.171 --> 00:07:43.181 [aplauso] 00:07:43.181 --> 00:07:48.997 2 estrelas indicam 1 em 20 ou 5% de chance de uma descoberta causal. 00:07:48.997 --> 00:07:52.469 1 estrela mostra os resultados que vemos tão frequentemente 00:07:52.469 --> 00:07:56.036 quanto 10% das vezes, meramente devido à causa. 00:07:56.473 --> 00:07:59.957 Hoje, as estrelas são vistas como um pouco foras de moda. 00:07:59.957 --> 00:08:01.606 Alguns jornais as omitem. 00:08:01.606 --> 00:08:03.894 -[Kamal] E as últimas duas colunas? 00:08:03.894 --> 00:08:06.007 Ao contrário da coluna 4, que combina 00:08:06.007 --> 00:08:09.689 os grupos de controle e tratamento em um, essas duas últimas colunas 00:08:09.689 --> 00:08:12.357 buscam as diferenças nos grupos separadamente 00:08:12.357 --> 00:08:14.572 para cada grupo de tratamento. 00:08:14.572 --> 00:08:17.441 Isso fornece uma análise mais detalhada do balanço. 00:08:18.295 --> 00:08:21.288 E por agora, você também pode ignorar essa linha 00:08:21.288 --> 00:08:24.205 que fornece outro teste de significância. 00:08:24.755 --> 00:08:29.062 E agora chegamos ao ponto alto do artigo, a tabela 4. 00:08:30.075 --> 00:08:32.993 Essa tabela mostra as estimativas de regressão 00:08:32.993 --> 00:08:37.273 dos efeitos do uso de eletrônicos em medidas do aprendizado do estudante. 00:08:37.273 --> 00:08:40.258 -[Kamal] Por que o estudo relata estimativa de regressão? 00:08:40.258 --> 00:08:42.529 Está vendo,é por isso que ficamos perdidos. 00:08:42.529 --> 00:08:44.806 A razão para gostarmos de ensaios randomizados 00:08:44.806 --> 00:08:47.260 é porque os usamos para obter efeitos causais 00:08:47.260 --> 00:08:50.479 simplesmente comparando os grupos de controle e tratamento. 00:08:50.479 --> 00:08:53.883 Já que os grupos são equilibrados, não há necessidae de regressão. 00:08:53.883 --> 00:08:55.492 Bem observado, Kamal. 00:08:55.492 --> 00:08:59.272 Na prática, é comum relatar as estimativas de regressão 00:08:59.272 --> 00:09:01.013 por duas razões. 00:09:01.013 --> 00:09:04.448 Primeiro, evidência de equilíbrio apesar de tudo. 00:09:04.448 --> 00:09:07.349 Uma abundância de precaução pode levar o analista 00:09:07.349 --> 00:09:09.678 a admitir diferenças causais. 00:09:09.678 --> 00:09:13.622 Segundo, as estimativas de regressão provavelmente são mais precisas -- 00:09:13.622 --> 00:09:16.509 isto é, elas têm menos padrões de erros 00:09:16.509 --> 00:09:18.943 do que simples comparações de controle e tratamento. 00:09:20.129 --> 00:09:22.526 A variável dependente neste estudo 00:09:22.526 --> 00:09:24.305 é o resultado do interesse. 00:09:24.652 --> 00:09:26.192 Já que a questão aqui 00:09:26.192 --> 00:09:29.068 é como aulas com eletrônicos afetam o aprendizado, 00:09:29.068 --> 00:09:32.845 um bom resultado é a nota do exame final de Economia. 00:09:33.406 --> 00:09:37.650 Cada coluna mostra resultados de um modelo de regressão diferente. 00:09:37.650 --> 00:09:40.476 Os modelos são distinguidos pelas variáveis de controle 00:09:40.476 --> 00:09:44.453 ou pelas covariáveis incluídas, além do status do tratamento. 00:09:44.934 --> 00:09:48.425 Estimativas sem covariáveis são comparações simples 00:09:48.425 --> 00:09:50.677 de grupos de controle e tratamento. 00:09:50.677 --> 00:09:53.169 -[Kamal] Eu achei que eles esqueceram de preencher. 00:09:53.169 --> 00:09:56.228 A coluna 1 indica que o uso de eletrônicos 00:09:56.228 --> 00:10:00.835 reduziu as notas dos exames finais por 0.28 deviações padrões. 00:10:01.547 --> 00:10:02.940 Em nossa última aula, 00:10:02.940 --> 00:10:07.237 O mestre Joshway explicou que usamos unidades de deviações padrões, 00:10:07.237 --> 00:10:10.672 porque essas unidades são facilmente comparadas entre estudos. 00:10:11.352 --> 00:10:13.193 A coluna 2 mostra resultados 00:10:13.193 --> 00:10:16.082 de um modelo que adiciona controles demográficos. 00:10:16.082 --> 00:10:19.907 Aqui, estamos comparando notas, mas lidando com fatores constantes 00:10:19.907 --> 00:10:21.435 como idade e sexo. 00:10:21.886 --> 00:10:25.602 A coluna 3 mostra resultados de um modelo que adicona média de nota escolar 00:10:25.602 --> 00:10:27.186 junto com a lista de covariáveis. 00:10:27.603 --> 00:10:30.822 A coluna 4 adicona notas do teste ACT. 00:10:30.822 --> 00:10:33.503 Analistas geralmente mostram os resultados desse jeito, 00:10:33.503 --> 00:10:36.992 começando com modelos que incluem poucas ou nenhuma covariável; 00:10:36.992 --> 00:10:39.667 e então mostrando as estimativas de modelos 00:10:39.667 --> 00:10:43.586 que adicionam mais e mais covariáveis conforme nos movemos pelas colunas. 00:10:44.035 --> 00:10:46.802 O que você percebe olhando as colunas? 00:10:47.252 --> 00:10:49.919 -[Kamal] Bom, o coeficiente do uso de computadores 00:10:49.919 --> 00:10:51.635 sempre é um número bem negativo. 00:10:51.635 --> 00:10:53.002 Exatamente! 00:10:53.002 --> 00:10:56.455 Também podemos ver que os erros padrões são pequenos o bastante 00:10:56.455 --> 00:11:00.561 para tornar esses resultados negativos estatísticamente significantes. 00:11:00.561 --> 00:11:04.446 Ou seja, a primeira coisa que levamos desse experimento 00:11:04.446 --> 00:11:08.381 é que os eletrônicos nas aulas reduzem o aprendizado do estudante. 00:11:09.000 --> 00:11:12.283 -[Kamal] As notas da média escolar e da ACT também são importantes. 00:11:12.283 --> 00:11:13.750 Por que é assim? 00:11:13.750 --> 00:11:15.423 Boa observação! 00:11:15.423 --> 00:11:16.866 Isso não é surpreendente. 00:11:16.866 --> 00:11:20.473 Esperamos que essas variáveis estimem a performance na faculdade. 00:11:20.473 --> 00:11:22.190 -[Kamal] Ah sim, é claro. 00:11:22.190 --> 00:11:24.026 Os que conseguiram melhores notas antes 00:11:24.026 --> 00:11:26.317 têm mais chance de conseguir melhores notas neste curso. 00:11:26.317 --> 00:11:30.226 Vocês também verão muitas outras informações nessa tabela. 00:11:30.226 --> 00:11:34.515 Os painéis restantes na tabela mostram efeitos do uso de eletrônicos 00:11:34.515 --> 00:11:36.933 em componentes do exame final, 00:11:36.933 --> 00:11:39.816 tais como as múltiplas questões de escolha. 00:11:39.816 --> 00:11:43.371 Esses resultados são mais consistentes com efeito de uso de coputadores 00:11:43.371 --> 00:11:45.360 nas notas médias. 00:11:45.360 --> 00:11:47.740 -[Kamal] E essas linhas que não estão em inglês? 00:11:47.740 --> 00:11:50.994 Essas linhas fornecem informação estatística adicional. 00:11:50.994 --> 00:11:54.247 R² é uma medida de bondade de ajuste. 00:11:54.714 --> 00:11:56.009 Isso não é tão importante, 00:11:56.009 --> 00:11:58.190 ainda que alguns leitores queiram saber disso. 00:11:58.660 --> 00:12:02.950 As outras linhas mostram testes alternativos de significância estatística 00:12:02.950 --> 00:12:05.028 que vocês podem ignonar por agora. 00:12:05.028 --> 00:12:07.934 -[Kamal] Meu Deus, essas tabelas não são tão complicadas! 00:12:07.934 --> 00:12:09.488 Muito obrigado. 00:12:09.488 --> 00:12:11.787 A próxima aula é sobre regressão. 00:12:11.787 --> 00:12:13.179 Vejo vocês lá! 00:12:15.974 --> 00:12:17.263 ♪ [música] ♪ 00:12:17.263 --> 00:12:20.575 Você está no caminho certo para dominar a econometria. 00:12:20.834 --> 00:12:22.783 Fixe o que aprendeu neste vídeo 00:12:22.783 --> 00:12:25.467 fazendo algumas questões práticas. 00:12:25.467 --> 00:12:29.003 Ou, caso esteja pronto, clique no próximo vídeo. 00:12:29.003 --> 00:12:32.901 Você também pode visitar o site da MRU para mais cursos, 00:12:32.901 --> 00:12:35.298 materias de professores e mais. 00:12:35.651 --> 00:12:38.111 Tradução: John Silva.