Return to Video

R Squared in SKlearn - Intro to Machine Learning

  • 0:00 - 0:03
    Agora que já expliquei o que é a r-squared, você deve estar se
  • 0:03 - 0:07
    perguntando: Mas, Katie, mas como obtenho essas informações?
  • 0:07 - 0:10
    Você não me deu uma equação para isso ou algo do tipo.
  • 0:10 - 0:14
    E o que quero fazer, em vez de dar a você uma grande equação matemática,
  • 0:14 - 0:17
    o que não acho tão interessante e que você mesmo poderia procurar,
  • 0:17 - 0:20
    é mostrar como obter essas informações no scikit-learn.
  • 0:20 - 0:23
    Este é o código que analisamos alguns vídeos atrás, quando estávamos criando nosso
  • 0:23 - 0:24
    previsor de patrimônio líquido.
  • 0:24 - 0:29
    Agora, eu preenchi estas linhas que estão importando a progressão linear e
  • 0:29 - 0:30
    fazendo algumas previsões.
  • 0:30 - 0:34
    Eu também exibi algumas informações na tela,
  • 0:34 - 0:35
    você talvez se lembre.
  • 0:35 - 0:36
    Duas delas eu já expliquei para você:
  • 0:36 - 0:38
    o slope e o intercept.
  • 0:38 - 0:41
    Eu acesso essas informações buscando os coeficientes e
  • 0:41 - 0:42
    a interceptação da regressão.
  • 0:42 - 0:46
    Estas são apenas linhas de código que encontrei em um exemplo online.
  • 0:46 - 0:48
    Mas, prometi que voltaríamos a abordar este r-squared score
  • 0:48 - 0:51
    que exibi e estou cumprindo a promessa.
  • 0:51 - 0:56
    Acessamos isso por meio da medida de reg.score.
  • 0:56 - 1:00
    Isso é bem parecido com o modo como computamos a precisão em
  • 1:00 - 1:01
    nosso classificador supervisionado.
  • 1:01 - 1:06
    O que fazemos é informar os valores de ages, que são as características neste caso,
  • 1:06 - 1:07
    as entradas, e
  • 1:07 - 1:10
    os valores de net_worths, que são as saídas, o que estamos tentando prever.
  • 1:10 - 1:14
    E, como a regressão já foi ajustada, aqui em cima,
  • 1:14 - 1:17
    ela já sabe o que acredita ser a relação entre essas duas quantidades.
  • 1:17 - 1:21
    Então, essas são as informações necessárias para computar um r-squared score.
  • 1:21 - 1:22
    E, então, posso exibi-la.
  • 1:22 - 1:26
    Vamos voltar aqui e mostrar novamente sua aparência.
  • 1:26 - 1:28
    Temos a mesma saída de antes, e
  • 1:28 - 1:31
    isso pode parecer um pouco familiar; por isso, estou prevendo meu próprio patrimônio líquido.
  • 1:31 - 1:33
    Tenho meu slope, meu intercept.
  • 1:33 - 1:35
    Mas, agora, você entenderá a importância do r-squared score.
  • 1:35 - 1:40
    Meu r-squared score está em torno de 0,86, o que é muito bom.
  • 1:40 - 1:45
    Estou prevendo que estou fazendo 85% do melhor que eu poderia estar fazendo.
  • 1:45 - 1:48
    Diria que 86% é próximo a 1.
  • 1:48 - 1:54
    Pode ser um pouco difícil dizer se um r-squared numérico
  • 1:54 - 1:55
    é bom ou não.
  • 1:55 - 1:58
    Essa é uma intuição que você ganha com
  • 1:58 - 2:01
    o tempo, à medida que faz experimentos.
  • 2:01 - 2:07
    Eu diria, com certeza, que 0,857 é um bom r-squared.
  • 2:07 - 2:11
    Estamos fazendo um bom trabalho de captura da relação entre a idade e
  • 2:11 - 2:13
    o patrimônio líquido das pessoas aqui.
  • 2:13 - 2:16
    Eu também já vi r-squareds maiores.
  • 2:16 - 2:19
    Por isso, é possível que ainda haja variáveis por aí.
  • 2:19 - 2:23
    Por exemplo, características. Se conseguirmos incorporar as informações de
  • 2:23 - 2:27
    características adicionais, talvez seja melhor prever o patrimônio líquido de uma pessoa.
  • 2:27 - 2:30
    Em outras palavras, se conseguirmos usar mais de uma característica,
  • 2:30 - 2:33
    talvez consigamos aumentar ainda mais este r squared.
  • 2:33 - 2:36
    Por outro lado, às vezes surgem problemas realmente complicados em que é
  • 2:36 - 2:40
    quase impossível obter um r squared próximo a esse valor.
  • 2:40 - 2:43
    Por isso que, nas ciências políticas, por exemplo, eles estão tentando
  • 2:43 - 2:47
    executar uma regressão que preveja se um país entrará em guerra.
Title:
R Squared in SKlearn - Intro to Machine Learning
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
ud120 - Intro to Machine Learning
Duration:
02:47

Portuguese, Brazilian subtitles

Revisions Compare revisions