Return to Video

Pandas Vectorized Methods - Intro to Data Science

  • 0:02 - 0:06
    Também permite que você opere em sua estrutura de dados de uma forma vetorizada e item por item.
  • 0:07 - 0:09
    O que significa operar em estrutura de dados de uma forma vetorizada?
  • 0:10 - 0:12
    Digamos que temos a seguinte estrutura de dados.
  • 0:12 - 0:15
    Esta estrutura de dados tem 2 colunas, 1 e 2.
  • 0:17 - 0:19
    E 4 linhas, a, b, c e d.
  • 0:21 - 0:23
    Todos os valores são inteiros.
  • 0:23 - 0:24
    Podemos chamar a estrutura de dados que se aplica e
  • 0:24 - 0:27
    fornecer a função arbitrária de soma do argumento.
  • 0:27 - 0:28
    Neste caso,
  • 0:28 - 0:33
    numpy.mean para executar essa função no vetor que está em cada coluna simples.
  • 0:33 - 0:36
    Quando chamamos df.apply numpy.mean.
  • 0:36 - 0:39
    O que recebemos é a média de cada coluna simples no df.
  • 0:39 - 0:41
    Esta é a própria estrutura de dados.
  • 0:41 - 0:45
    Há também algumas operações que simplesmente não podem ser vetorizadas dessa forma.
  • 0:45 - 0:48
    Isto é, pegam um array NumPy como sua entrada e,
  • 0:48 - 0:50
    em seguida, retornam outro array ou valor.
  • 0:51 - 0:54
    Também podemos, neste caso, chamar o mapa em colunas específicas.
  • 0:54 - 0:56
    Ou aplicar o mapa em estrutura de dados completas.
  • 0:58 - 1:01
    Estes métodos aceitarão funções que utilizam um valor único e
  • 1:01 - 1:03
    retornam um valor único.
  • 1:03 - 1:08
    Por exemplo, suponha que dissemos df one.map lambda x x >=
  • 1:08 - 1:09
    1.
  • 1:09 - 1:13
    O que ele faz é passar por cada valor único na coluna 1 e
  • 1:13 - 1:17
    avaliar se esse valor é maior ou igual a 1.
  • 1:17 - 1:24
    Se chamarmos df.applymap lambda x x >=1.
  • 1:24 - 1:28
    A mesma função será avaliada em cada valor único da estrutura de dados.
  • 1:28 - 1:30
    Em vez de apenas na coluna 1.
タイトル:
Pandas Vectorized Methods - Intro to Data Science
概説:

more » « less
Video Language:
English
Team:
Udacity
プロジェクト:
ud359: Intro to Data Science
Duration:
01:32

Portuguese, Brazilian subtitles

改訂 Compare revisions