Return to Video

Why Upweight Rare Words - Intro to Machine Learning

  • 0:00 - 0:05
    Vamos imaginar que você tenha alguns emails: alguns deles enviados por mim,
  • 0:05 - 0:06
    outros por Sebastian.
  • 0:06 - 0:08
    Talvez tenhamos sobreposição.
  • 0:08 - 0:11
    Nós dois podemos estar falando sobre aprendizado de máquina e a Udacity.
  • 0:11 - 0:13
    Mas alguns deles podem ser sobre, por exemplo, física,
  • 0:13 - 0:16
    porque sou formado nisso.
  • 0:16 - 0:17
    Isso será comparativamente raro.
  • 0:17 - 0:18
    Não haverá muitos emails
  • 0:18 - 0:22
    no corpus sobre física,
  • 0:22 - 0:26
    porque nenhum email do Sebastian será sobre física.
  • 0:26 - 0:27
    Todos serão meus.
  • 0:27 - 0:28
    De forma semelhante,
  • 0:28 - 0:31
    talvez haja vários emails sobre o robô Stanley,
  • 0:31 - 0:33
    que é um dos projetos de Sebastian, mas
  • 0:33 - 0:35
    não algo no qual eu seja especialista.
  • 0:35 - 0:40
    O fato de palavras como física e Stanley serem raras no corpus,
  • 0:40 - 0:44
    comparadas a palavras como Udacity ou aprendizado de máquina,
  • 0:44 - 0:47
    significa que elas podem ser palavras com as informações mais
  • 0:47 - 0:49
    importantes sobre o que está acontecendo.
  • 0:49 - 0:51
    Quem pode ser o autor de uma mensagem?
  • 0:51 - 0:54
    Isso é chamado de frequência inversa do documento,
  • 0:54 - 0:56
    outra forma de chamar esse processo.
  • 0:56 - 1:00
    Você pode pesar as palavras pelo inverso da frequência em que
  • 1:00 - 1:02
    aparecem no corpus como um todo.
  • 1:02 - 1:07
    Não pedirei que você codifique um exemplo de Tf Idf agora como teste,
  • 1:07 - 1:09
    mas isso é algo que abordaremos no
  • 1:09 - 1:12
    miniprojeto que teremos em breve, no fim desta lição.
  • 1:12 - 1:15
    Você trabalhará com essa representação um pouco.
Title:
Why Upweight Rare Words - Intro to Machine Learning
Description:

more » « less
Video Language:
English
Team:
Udacity
Project:
ud120 - Intro to Machine Learning
Duration:
01:16

Portuguese, Brazilian subtitles

Revisions Compare revisions