Return to Video

Twitter Data Set - Data Wranging with MongoDB

  • 0:00 - 0:03
    Certo. Espero que esteja gostando do curso.
  • 0:03 - 0:05
    Nesta lição, vamos trabalhar com um conjunto de
  • 0:05 - 0:08
    tweets. É preciso deixar claro que, já que esse
  • 0:08 - 0:11
    conjunto foi reunido há um tempo, ele não
  • 0:11 - 0:13
    reflete o estado dos feeds do Twitter no
  • 0:13 - 0:17
    momento. É uma pequena captura do tempo. Nossos tweets tinham
  • 0:17 - 0:21
    a seguinte forma. É possível ver aqui que há um
  • 0:21 - 0:25
    identificador exclusivo. Haverá texto para o tweet em si e
  • 0:25 - 0:28
    um campo de entidades. Agora, o campo de entidades está dividido
  • 0:28 - 0:30
    entre user_mentions, urls e hashtags.
  • 0:30 - 0:33
    Na última lição, demos uma olhada em um tweet,
  • 0:33 - 0:36
    então você deve estar familiarizado com isso.
  • 0:36 - 0:40
    Menções de usuário, urls e hashtags representam esse tipo de dados
  • 0:40 - 0:43
    e onde eles são encontrados no texto de um tweet.
  • 0:43 - 0:46
    Ele foi extraído para nós e armazenado nestes campos
  • 0:46 - 0:50
    individuais. Ok. Então, com cada tweet há informações sobre o
  • 0:50 - 0:52
    usuário no momento em que o tweet foi criado. Como
  • 0:52 - 0:55
    você verá, nossos documentos de tweet, na verdade, têm muito mais
  • 0:55 - 0:58
    campos. Estamos os representando com as elipses vistas
  • 0:58 - 1:01
    neste exemplo. Assim como nos outros conjuntos de dados que
  • 1:01 - 1:05
    consideramos, este tipo de dados representa o que
  • 1:05 - 1:08
    você irá trabalhar como cientista de dados. Muitos cientistas de
  • 1:08 - 1:11
    dados são funcionários de espaços que trabalham bastante com
  • 1:11 - 1:15
    mídia social. Google, Facebook e Twitter são algumas das empresas
  • 1:15 - 1:19
    mais proeminentes, dentre milhares, que empregam pessoas para analisar este
  • 1:19 - 1:22
    tipo de dados. Agora, imagine por um segundo os tipos de
  • 1:22 - 1:25
    análises que você pode fazer em tweets. É comum neste tipo
  • 1:25 - 1:29
    de dados entender o comportamento dos usuários e das redes envolvidas.
  • 1:29 - 1:31
    Há muitas formas de se fazer isso. Uma das
  • 1:31 - 1:35
    coisas mais poderosas em relação a colocar nossos dados em um banco de dados
  • 1:35 - 1:39
    é que a maior parte deles fornece ferramentas de análise built-in, que permitem
  • 1:39 - 1:41
    explorar os dados e ter uma ideia da história
  • 1:41 - 1:45
    que eles contam. Na MongoDB, as ferramentas de análise built-in tomam
  • 1:45 - 1:47
    a forma do que chamamos de framework de agregação.
  • 1:48 - 1:50
    Mesmo não substituindo o MapReduce em
  • 1:50 - 1:53
    várias situações, ele fornece uma ferramenta poderosa para
  • 1:53 - 1:57
    a exploração de dados ao auditar
  • 1:57 - 2:00
    a qualidade dos nossos dados ou ao analisá-los.
  • 2:00 - 2:03
    E, junto com cada grande lançamento da MongoDB, isso se torna
  • 2:03 - 2:06
    uma ferramenta poderosa. Há vários aprimoramentos valiosos
  • 2:06 - 2:08
    de recursos na versão 2.6.
Tytuł:
Twitter Data Set - Data Wranging with MongoDB
Video Language:
English
Team:
Udacity
Projekt:
UD032: Data Wrangling with MongoDB
Duration:
02:08

Portuguese, Brazilian subtitles

Revisions Compare revisions