< Return to Video

Prova (Parte 4) Minimizando a soma dos quadrados residuais para regressão linear

  • 0:01 - 0:03
    Se você chegou até aqui
  • 0:03 - 0:07
    deve estar ansioso para descobrir
    a linha ótima
  • 0:07 - 0:10
    que minimiza a soma dos quadrados
    residuais de todos estes pontos.
  • 0:10 - 0:12
    Então vamos lá:
  • 0:12 - 0:14
    vamos resolver a equação para
    m e b ótimos.
  • 0:14 - 0:16
    Baseado no que já aprendemos

  • 0:16 - 0:17
    existem duas soluções
  • 0:17 - 0:19
    conhecemos dois pontos
  • 0:19 - 0:20
    contidos nesta reta
  • 0:20 - 0:22
    e assim podemos:
    (1) encontrar a inclinação da reta
  • 0:22 - 0:24
    e o ponto em que a reta
    intercepta o y
  • 0:24 - 0:26
    ou (2) podemos dizer que esta é a solução
    deste sistema de equações
  • 0:26 - 0:28
    Na verdade, os dois modos
    são equivalentes
  • 0:28 - 0:31
    Então vamos começar pelo m. Para
    encontrarmos o m,
  • 0:31 - 0:33
    precisamos cancelar os "b"s.
  • 0:33 - 0:36
    Então vamos reescrever a equação superior
    aqui embaixo:
  • 0:36 - 0:39
    temos m multiplicado pela média
  • 0:39 - 0:43
    dos quadrados de x mais b
  • 0:43 - 0:48
    multiplicado pela média dos...
    Na verdade, podemos fazer ainda
  • 0:48 - 0:49
    melhor que isto.
  • 0:49 - 0:52
    Baseados no que aprendemos no último vídeo
  • 0:52 - 0:56
    podemos simplesmente
    subtrair a equação inferior
  • 0:56 - 0:58
    da equação superior.
  • 0:58 - 0:59
    Então vamos lá:
  • 0:59 - 1:01
    Multiplicamos a equação
    inferior por menos 1.
  • 1:01 - 1:02
    Então isto é negativo,
    isto também
  • 1:02 - 1:03
    e isto é negativo
  • 1:03 - 1:05
    O que temos aqui?
  • 1:05 - 1:13
    m multiplicado pela média dos "x"s
    menos a média de x ao quadrado
  • 1:13 - 1:16
    sobre a média de x.
  • 1:18 - 1:21
    O b positivo e negativo se cancelam
  • 1:21 - 1:28
    e o resultado é igual a média dos
    "y"s menos a média dos "xy"s
  • 1:28 - 1:31
    sobre a media dos "x"s.
  • 1:31 - 1:35
    Agora podemos dividir os dois lados
    da equação por isto.
  • 1:35 - 1:42
    E então temos m igual à média dos "y"s
    menos a
  • 1:44 - 1:49
    média dos "xy"s sobre a média dos "x"s
    sobre isto:
  • 1:50 - 1:54
    a média dos "x"s menos a média
    dos quadrados de x
  • 1:54 - 1:55
    sobre a média dos "x"s.
  • 1:55 - 1:58
    Note que isto é exatamente o mesmo que
    você teria
  • 1:58 - 2:02
    se você encontrasse a inclinação
    entre este dois pontos aqui.
  • 2:02 - 2:05
    Uma modificação em y, então
    a diferença entre este y e este y
  • 2:05 - 2:07
    representado aqui
  • 2:07 - 2:08
    sobre a mudança nos "x"s.
  • 2:08 - 2:11
    A mudança neste x menos este x
    é exatamente esta aqui.
  • 2:12 - 2:15
    Agora, para simplificar, podemos
    multiplicar o numerador
  • 2:15 - 2:19
    e o denominador pela média dos "x"s.
  • 2:19 - 2:20
    Vou fazer isto para não termos
    este denominador
  • 2:20 - 2:22
    nos dois lados
  • 2:22 - 2:24
    Então, se multiplicarmos o numerador
    pela média dos "x"s,
  • 2:24 - 2:31
    temos a média dos "x"s multiplicados
    pela média dos "y"s menos,
  • 2:31 - 2:34
    este e este se cancelam
  • 2:34 - 2:36
    menos a média dos "xy"s
  • 2:39 - 2:42
    tudo isto sobre: média dos "x"s multiplicados pela média dos "x"s
  • 2:42 - 2:51
    resulta na média dos "x"s ao quadrado, menos
  • 2:52 - 2:57
    a média do quadrado de x
  • 2:57 - 3:01
    e isto é igual a m!
  • 3:01 - 3:05
    Se nós quisermos resolver para b,
    basta substituir
  • 3:06 - 3:09
    este m em qualquer das equações.
    Vamos fazer a substituição na
  • 3:10 - 3:13
    equação roxa que é mais simples.
  • 3:13 - 3:16
    Agora, como nós queremos resolver para o b
    nesta equação,
  • 3:16 - 3:18
    podemos resolver para b
    em relação à m.
  • 3:18 - 3:21
    Para isto basta subtrair m multiplicado
    pela média dos "x"s em ambos os lados.
  • 3:21 - 3:30
    Daí temos que b é igual à média dos "y"s
    menos m multiplicados pela
  • 3:30 - 3:31
    média dos "x"s.
  • 3:32 - 3:34
    O que fizemos foi: a partir de
    um conjunto de pontos,
  • 3:34 - 3:36
    encontramos a média dos "x"s,
    a média dos "y"s
  • 3:36 - 3:40
    a média dos "xy"s e a média dos
    quadrados dos "x"s,
  • 3:40 - 3:42
    encontramos o m.
  • 3:42 - 3:45
    Uma vez tendo encontrado o m,
    substituimos ele de volta
  • 3:45 - 3:46
    para encontrar o b.
  • 3:46 - 3:49
    Então temos nossa linha ótima.
  • 3:49 - 3:50
    E finalizamos.
  • 3:50 - 3:53
    Então esta são as duas grandes
    fórmulas prontas
  • 3:53 - 3:55
    para encontrar a linha ótima.
  • 3:55 - 3:56
    No próximo vídeo,
  • 3:56 - 3:59
    se alguém não estava acompanhando,
  • 3:59 - 4:02
    este é o ponto onde você deve
    voltar a acompanhar
  • 4:02 - 4:05
    pois nele vamos usar as fórmulas
    deduzidas até aqui
  • 4:05 - 4:06
    para encontrarmos a chamada
  • 4:06 - 4:07
    linha de tendência.
  • 4:07 - 4:10
    Pelo menos, quando você mede o erro
    pelo quadrado das distâncias
  • 4:10 - 4:12
    dos pontos.
  • 4:12 - 4:14
    Nós usaremos estas fórmulas para encontrar a
  • 4:14 - 4:17
    linha de tendência para alguns dados.
  • 4:17 - 4:22
    Legendado por [José Irigon]
    Revisado por [Cainã Perri]
Title:
Prova (Parte 4) Minimizando a soma dos quadrados residuais para regressão linear
Description:

Prova (Parte 4) Minimizando a soma dos quadrados residuais para regressão linear
Este é o último vídeo da série de deduções para chegar à fórmula utilizada para realizar minimização dos quadrados residuas em regressão linear.

more » « less
Video Language:
English
Duration:
04:18

Portuguese, Brazilian subtitles

Revisions