Return to Video

Auditing Completeness - Data Wranging with MongoDB

  • 0:00 - 0:03
    A integridade pode ser difícil de avaliar. Como meu
  • 0:03 - 0:06
    amigo David Silverman adora dizer, você não sabe
  • 0:06 - 0:08
    o que não conhece. Mas nesta discussão, não vamos
  • 0:08 - 0:11
    falar sobre campos individuais ausentes em um registro. Em vez disso,
  • 0:11 - 0:15
    falaremos sobre registros ausentes. Ou
  • 0:15 - 0:18
    seja, tentar descobrir quando um registro inteiro
  • 0:18 - 0:21
    desaparece. A solução aqui é muito semelhante
  • 0:21 - 0:26
    à solução para precisão. Essencialmente, precisamos de dados de referência.
  • 0:26 - 0:28
    Deixe-me dar um exemplo de algo com que
  • 0:28 - 0:31
    trabalho regularmente. Sou diretor de
  • 0:31 - 0:34
    ensino na MongoDB. E, como parte da minha função, sou
  • 0:34 - 0:38
    responsável por nosso programa de certificação. Nós fazemos as coisas
  • 0:38 - 0:41
    de forma um pouco diferente de algumas outras empresas de tecnologia, já que
  • 0:41 - 0:45
    nossos exames de certificação são realizados totalmente online. Sendo assim, além
  • 0:45 - 0:49
    de um registro de exame completo para cada um dos examinados, ao
  • 0:49 - 0:51
    realizar nossos exames online, devemos ter uma maneira
  • 0:51 - 0:54
    supervisioná-los a fim de garantir a segurança do
  • 0:54 - 0:57
    exame. Nós fazemos isso por meio de uma
  • 0:57 - 1:00
    solução de supervisão na Web, em que capturamos o vídeo da sessão
  • 1:00 - 1:04
    do examinado. Capturamos um vídeo do próprio examinado,
  • 1:04 - 1:08
    usando uma webcam, e também uma captura de tela
  • 1:08 - 1:11
    de tudo o que está acontecendo na tela do computador
  • 1:11 - 1:13
    do examinado durante a realização do exame. Portanto, isso significa
  • 1:13 - 1:16
    que temos três armazenamentos de dados separados que
  • 1:16 - 1:18
    precisam estar de acordo entre si em relação a alguns
  • 1:18 - 1:21
    pontos diferentes. Aqui chegamos ao ponto do exemplo de
  • 1:21 - 1:25
    integridade. Eles devem estar de acordo em relação à lista de examinados, ou
  • 1:25 - 1:27
    seja, se houver um registro de um
  • 1:27 - 1:31
    examinado em qualquer um desses bancos de dados, deverá haver um
  • 1:31 - 1:34
    registro desse mesmo examinado nos outros dois. A
  • 1:34 - 1:37
    duração da sessão do exame também deve ser correspondente entre eles.
  • 1:37 - 1:42
    Por isso, os vídeos, aqui e aqui, devem ter, aproximadamente, a mesma
  • 1:42 - 1:45
    duração e devem ser correspondentes ao tempo decorrido que
  • 1:45 - 1:49
    registramos para um examinado. E, é claro, eles devem
  • 1:49 - 1:53
    ser, aproximadamente, correspondentes. Dentro da soma de Epsílon. Agora, provavelmente,
  • 1:53 - 1:56
    você está pensando: e se alguém fez o exame e não há registro
  • 1:56 - 1:59
    em nenhum destes três bancos de dados? Bem, você
  • 1:59 - 2:02
    está certo. Como mencionei no início, esse é um problema
  • 2:02 - 2:04
    difícil de resolver porque não sabemos
  • 2:04 - 2:07
    o que não conhecemos. Nesse caso, usando a solução que
  • 2:07 - 2:10
    acabamos de descrever, não conseguiríamos detectar o registro de exame
  • 2:10 - 2:12
    ausente. Por isso, na verdade, nós fazemos algumas
  • 2:12 - 2:15
    coisas além disso para garantir a integridade de nossos
  • 2:15 - 2:18
    registros de exames. São medidas essencialmente preventivas para assegurar
  • 2:18 - 2:21
    que não tenhamos uma situação na qual os dados apropriados
  • 2:21 - 2:25
    do exame de um determinado examinado não sejam capturados. Portanto, para
  • 2:25 - 2:28
    concluir, assim como com a limpeza de dados, os meios
  • 2:28 - 2:32
    de auditar a integridade são específicos para cada situação. Ela realmente depende de quais são
  • 2:32 - 2:36
    os dados que estão sendo auditados e quais são as fontes de referência às quais você tem acesso.
タイトル:
Auditing Completeness - Data Wranging with MongoDB
概説:

PMbcv9AYQT4

more » « less
Video Language:
English
Team:
Udacity
プロジェクト:
UD032: Data Wrangling with MongoDB
Duration:
02:36

Portuguese, Brazilian subtitles

改訂 Compare revisions