Portuguese, Brazilian subtitles

← Intro to XML - Data Wranging with MongoDB

Get Embed Code
5 Languages

Showing Revision 8 created 06/20/2016 by Udacity Robot.

  1. Ótimo. Vamos mergulhar no XML. Durante o toda a minha
  2. carreira, eu usei o XML em um vários projetos de ciência
  3. de dados diferentes. Um deles foi trabalhar com uma grande
  4. coleção de artigos de pesquisa. Apenas como um exemplo, aqui está o
  5. artigo original do Google de Brin e Page quando eles ainda
  6. eram alunos de graduação em Stanford. Agora, o que eu fazia
  7. neste projeto é o que conhecemos como uma análise de citações. Na análise
  8. de citações, o que fazemos é comparar a importância relativa de artigos
  9. com base no número de vezes eles são citados em outros artigos de pesquisa. Então,
  10. por exemplo, você poderia comparar o artigo do Google com alguns de
  11. meus trabalhos. Que recebe um número bem mais modesto de
  12. citações em comparação às 11.000 que o artigo de Brin e Page recebeu.
  13. Quando eu estava trabalhando, a maioria dos
  14. dados que usei não estava publicamente disponível. Mas hoje em dia os
  15. mesmos tipos de dados estão disponíveis e codificados como XML.
  16. Há bem poucos editores de acesso aberto, como a bio-med central.
  17. Esses editores produzem cada artigo que publicam em forma
  18. impressa como esta e em .xml. Agora, para
  19. fazer algo como análise de citações, o que precisamos fazer
  20. é acessar a bibliografia de cada artigo. Então, o que quero
  21. mostrar como exemplo, é como é fácil,
  22. quando você tem seus dados codificados como .xml, extrair
  23. esses tipos de dados e usá-los de forma programática.
  24. Vejamos as referências deste artigo.
  25. Aqui estão todos outros artigos que esta pesquisa
  26. em particular de artigo cita, agora vamos dar uma olhada na versão em
  27. XML deste artigo. Aqui está aquele mesmo artigo
  28. , mas, em vez de ser destinado à leitura, ele está
  29. codificado como dados, mas vamos pular para a bibliografia deste
  30. artigo. E aqui está, o início da
  31. bibliografia. Se olharmos na versão para impressão do
  32. artigo novamente, podemos ver que ele, na realidade,
  33. se alinha com o que estamos vendo aqui. Então, este tipo
  34. de uso de XML é bem parecido com o que os criadores
  35. do XML tinham em mente, onde você tem documentos que
  36. contêm muitos textos, mas texto que você deseja
  37. codificar para que partes dele, pelo menos, possam
  38. ser usadas de forma programática, como podemos querer fazer com
  39. uma bibliografia de artigo de pesquisa. Ou a lista de autores
  40. e outros dados que ocorrem dentro de um documento como este.