YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

Portuguese, Brazilian subtitles

← K-Fold Cross Validation - Intro to Machine Learning

Get Embed Code
4 Languages

Showing Revision 8 created 06/20/2016 by Udacity Robot.

  1. Katie, você falou sobre conjuntos de treinamento e
  2. de testes. Espero que as pessoas treinem isso um pouco.
  3. É isso mesmo? >> Sim, está certo.
  4. >> Agora, falarei sobre algo que generaliza um pouco essa
  5. validação cruzada.
  6. Vamos falar primeiro sobre problemas
  7. com a divisão de conjuntos de dados em dados de treinamento e de testes.
  8. Imagine que estes sejam seus dados.
  9. Ao fazer o que a Katie falou,
  10. agora, você precisa dizer qual fração de dados está testando e o que está treinando.
  11. Seu dilema é que você gosta de minimizar os dois conjuntos.
  12. Você quer o máximo de pontos de dados nos conjuntos de treinamento
  13. para obter os melhores resultados de aprendizado e o mínimo número de
  14. itens de dados no conjunto de testes para obter a melhor validação.
  15. Mas, obviamente, há uma troca inerente aqui: cada ponto de dados removido
  16. do conjunto de treinamento para o teste é perdido para o conjunto de treinamento.
  17. Por isso, redefinimos essa troca.
  18. É aqui que a validação cruzada entra.
  19. A ideia básica é que você solicite o conjunto de dados em k colunas de igual tamanho.
  20. Por exemplo, se você tiver 200 pontos de dados
  21. e dez colunas.
  22. Rápido!
  23. Qual é o número de pontos de dados por coluna?
  24. Obviamente, é 20.
  25. Você terá 20 pontos de dados em cada 10 colunas.
  26. Aqui está a imagem.
  27. Enquanto que, como mostrou a Katie, você escolhe apenas uma coluna
  28. como teste e a outra como treinamento,
  29. na validação cruzada k-fold, k experimentos de aprendizado separados são executados.
  30. Em cada um deles, você escolhe um subconjunto k como conjunto de testes.
  31. O restante, k menos uma coluna, é reunido no conjunto de treinamento.
  32. Depois, você treina o algoritmo de aprendizado de
  33. máquina e, como antes, testa o desempenho no conjunto de testes.
  34. O segredo na validação cruzada é fazer isso várias vezes.
  35. Neste caso, dez. Depois, você calcula a média dos desempenhos
  36. dos dez conjuntos de testes diferentes mantidos,
  37. calculando a média dos resultados de testes desses experimentos k.
  38. Obviamente, leva mais tempo de cálculo, porque agora você tem que executar
  39. k experimentos de aprendizado separados,
  40. mas a avaliação do algoritmo de aprendizado será mais preciso.
  41. De certa forma, você usou todos os dados para
  42. treinamento e testes, o que é legal.
  43. Temos apenas uma pergunta.
  44. Imagine que você tenha a opção de fazer a metodologia de teste de treinamento estático
  45. sobre o qual a Katie falou ou a validação cruzada 10-fold, CV,
  46. e quer minimizar o tempo de treinamento.
  47. Minimize o tempo de execução depois do treinamento usando o algoritmo
  48. de aprendizado de máquina para obter resultados depois do tempo de treinamento e maximizar a precisão.
  49. Em cada uma dessas três situações, você pode escolher treinar/testar ou
  50. validação cruzada 10-fold.
  51. Dê um seu melhor palpite.
  52. Qual você escolheria?
  53. Para cada tempo mínimo de treinamento,
  54. escolha um destes aqui, à direita.