Return to Video

New Enron Feature Solution - Intro to Machine Learning

  • 0:00 - 0:03
    Esta é uma visualização do novo recurso.
  • 0:03 - 0:06
    Ao longo do eixo x aqui, eu tenho o número de emails de uma pessoa de
  • 0:06 - 0:09
    interesse para uma determinada pessoa no conjunto de dados.
  • 0:09 - 0:10
    Ao longo do eixo y,
  • 0:10 - 0:14
    eu tenho algo mais alguma coisa que acredito também me fornecerá alguma distinção.
  • 0:14 - 0:18
    Que é o número de emails que esta pessoa envia para pessoas de interesse.
  • 0:18 - 0:23
    O que eu também fiz foi colorir minhas pessoas de interesse de vermelho no gráfico de dispersão,
  • 0:23 - 0:26
    para poder identificar facilmente se há algum tipo de padrão neste recurso que eu
  • 0:26 - 0:30
    comece a ver grupos de pontos vermelhos todos juntos, por exemplo.
  • 0:30 - 0:32
    Isso seria uma indicação de algo que um algoritmo de aprendizado
  • 0:32 - 0:37
    supervisionado poderia explorar para tentar prever pessoas de interesse.
  • 0:37 - 0:41
    E o que eu vejo é que essa não parece ser uma tendência muito forte aqui.
  • 0:41 - 0:45
    Os pontos vermelhos parecem estar misturados uniformemente com os pontos azuis.
  • 0:45 - 0:48
    Outra coisa que observo é que há alguns outliers.
  • 0:48 - 0:52
    Para a maioria das pessoas, nós temos apenas menos que 100 emails enviados ou
  • 0:52 - 0:55
    recebidos, mas algumas pessoas têm muito, muito mais que isso.
  • 0:55 - 1:00
    Portanto, esta visualização me leva para a próxima etapa de repetição deste processo.
  • 1:00 - 1:05
    Usando minha intuição humana para pensar sobre quais recursos podem ser valiosos aqui.
  • 1:05 - 1:08
    O que eu estou pensando neste ponto é que talvez o recurso de que eu
  • 1:08 - 1:13
    preciso não seja o número absoluto de emails de uma pessoa de interesse para uma...
  • 1:13 - 1:14
    uma determinada pessoa.
  • 1:14 - 1:18
    Mas a fração de emails que uma pessoa recebe
  • 1:18 - 1:19
    de uma pessoa de interesse.
  • 1:19 - 1:24
    Em outras palavras, se você obtiver 80% de seus emails de pessoas de interesse,
  • 1:24 - 1:27
    minha intuição poderá ser que você é uma delas.
  • 1:27 - 1:30
    Mas, é claro, eu preciso realmente codificar o recurso para testar essa hipótese.
Title:
New Enron Feature Solution - Intro to Machine Learning
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
ud120 - Intro to Machine Learning
Duration:
01:31

Portuguese, Brazilian subtitles

Revisions Compare revisions