Return to Video

Regularization - Intro to Machine Learning

  • 0:01 - 0:05
    Um excelente lugar em que você pode usar a regularização é na regressão.
  • 0:05 - 0:07
    Regularização é um método de
  • 0:07 - 0:11
    penalizar automaticamente os recursos extras que usar em seu modelo.
  • 0:11 - 0:13
    Então, deixe-me concretizar isso um pouco mais.
  • 0:13 - 0:17
    Existe um tipo de regressão regularizada chamada de regressão Lasso.
  • 0:17 - 0:20
    E esta é a fórmula bruta da regressão Lasso.
  • 0:21 - 0:22
    Uma regressão linear comum diria:
  • 0:22 - 0:28
    eu apenas quero minimizar a soma dos erros ao quadrado em meu ajuste.
  • 0:28 - 0:31
    Quero minimizar a distância entre meu ajuste e
  • 0:31 - 0:35
    qualquer outro ponto de dados, ou o quadrado dessa distância.
  • 0:35 - 0:40
    O que a regressão Lasso diz é: sim, queremos uma pequena soma do erro ao quadrado.
  • 0:40 - 0:43
    Mas, além de minimizar a soma dos erros ao quadrado,
  • 0:43 - 0:46
    também quero minimizar o número de recursos que estou usando.
  • 0:46 - 0:49
    E, por isso, vamos adicionar um segundo termo aqui, no qual
  • 0:49 - 0:54
    temos um parâmetro de penalidade e os coeficientes da minha regressão.
  • 0:54 - 0:58
    Portanto, isso é basicamente o termo que descreve quantos recursos estou usando.
  • 0:58 - 1:00
    E este é resultado desta fórmula.
  • 1:00 - 1:05
    Quando estou executando meu ajuste, considero ambos os erros provenientes desse
  • 1:05 - 1:09
    ajuste e, também, o número de recursos que estão sendo usados.
  • 1:09 - 1:11
    Então, vamos supor que estamos comparando dois ajustes diferentes
  • 1:11 - 1:13
    que têm quantidades diferentes de recursos.
  • 1:14 - 1:16
    O que tem mais recursos incluídos
  • 1:16 - 1:19
    quase certamente terá uma soma menor do erro ao quadrado,
  • 1:19 - 1:23
    pois pode se ajustar com mais precisão aos pontos.
  • 1:23 - 1:25
    Mas pagamos uma penalidade por usar esse recurso extra.
  • 1:25 - 1:29
    E isso está no segundo termo com o termo de penalidade e
  • 1:29 - 1:31
    os coeficientes de regressão que obteremos para
  • 1:31 - 1:34
    esse recurso adicional que estamos usando.
  • 1:34 - 1:37
    E o que isso está dizendo é que o ganho obtido
  • 1:37 - 1:39
    em termos de precisão,
  • 1:39 - 1:44
    a adequação do ajuste da minha regressão, deve ser um ganho maior do que a perda
  • 1:44 - 1:48
    obtida como resultado de ter esse recurso adicional em minha regressão.
  • 1:49 - 1:53
    Isso formula precisamente de modo matemático a compensação entre
  • 1:53 - 1:59
    ter pequenos erros e ter um ajuste mais simples que usa menos recursos.
  • 1:59 - 2:01
    Portanto, o que a regressão Lasso faz
  • 2:01 - 2:05
    é considerar automaticamente este parâmetro de penalidade.
  • 2:05 - 2:09
    E, ao fazer isso, ela ajuda você a descobrir, de fato, quais são os recursos
  • 2:09 - 2:12
    que têm um efeito mais importante em sua regressão.
  • 2:12 - 2:15
    Depois de esses recursos serem encontrados, ela pode realmente eliminar, ou
  • 2:15 - 2:20
    definir como zero, os coeficientes dos recursos que, essencialmente, não ajudam
Title:
Regularization - Intro to Machine Learning
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
ud120 - Intro to Machine Learning
Duration:
02:21

Portuguese, Brazilian subtitles

Revisions Compare revisions