Return to Video

Como criei uma máquina do tempo de informação

  • 0:00 - 0:03
    Esta é uma imagem do planeta Terra.
  • 0:03 - 0:06
    Parece demais
    com as fotos tiradas da Apollo,
  • 0:06 - 0:08
    que são bastante conhecidas.
  • 0:08 - 0:10
    Há uma novidade:
  • 0:10 - 0:11
    você pode clicar nela
  • 0:11 - 0:13
    e, se você clicar nela,
  • 0:13 - 0:16
    você pode ver de perto
    quase qualquer lugar da Terra.
  • 0:16 - 0:18
    Por exemplo, esta é uma visão panorâmica
  • 0:18 - 0:20
    do campus da EPFL.
  • 0:20 - 0:22
    Em muitos casos,
    também é possível ver de perto
  • 0:22 - 0:26
    um prédio de uma rua próxima.
  • 0:26 - 0:28
    É incrível.
  • 0:28 - 0:31
    Mas há algo faltando
    nesta maravilhosa viagem:
  • 0:31 - 0:33
    o tempo.
  • 0:33 - 0:36
    Não tenho certeza
    de quando esta foto foi tirada.
  • 0:36 - 0:38
    Nem mesmo de que tenha sido tirada
  • 0:38 - 0:44
    no mesmo instante que a vista panorâmica.
  • 0:44 - 0:46
    Em meu laboratório,
    desenvolvemos ferramentas
  • 0:46 - 0:48
    para viajar não somente no espaço,
  • 0:48 - 0:50
    mas também no tempo.
  • 0:50 - 0:52
    A dúvida que temos é:
  • 0:52 - 0:54
    seria possível criar algo
  • 0:54 - 0:56
    como um Google Mapas do passado?
  • 0:56 - 0:59
    Posso adicionar uma barra deslizante
    no Google Mapas
  • 0:59 - 1:01
    e simplesmente mudar o ano,
  • 1:01 - 1:03
    vendo como era 100 anos antes,
  • 1:03 - 1:04
    mil anos antes?
  • 1:04 - 1:06
    Isso seria possível?
  • 1:06 - 1:09
    Posso recuperar redes sociais do passado?
  • 1:09 - 1:12
    É possível criar um Facebook
    da Idade Média?
  • 1:12 - 1:16
    Então, posso criar maquinas do tempo?
  • 1:16 - 1:18
    Talvez simplesmente digamos:
    "Não, isso não é possível".
  • 1:18 - 1:22
    Ou, talvez, possamos pensar nisso
    do ponto de vista da informação.
  • 1:22 - 1:25
    Isso é o que eu chamo
    de cogumelo de informação.
  • 1:25 - 1:27
    Verticalmente, temos o tempo,
  • 1:27 - 1:29
    e, horizontalmente, a quantidade
    de informação digital disponível.
  • 1:29 - 1:33
    Obviamente, nos últimos dez anos,
    temos muita informação.
  • 1:33 - 1:36
    E, é claro, quanto mais no passado,
    menos informação temos.
  • 1:36 - 1:39
    Se quisermos criar
    um Google Mapas do passado,
  • 1:39 - 1:40
    ou um Facebook do passado,
  • 1:40 - 1:42
    precisamos ampliar esse espaço,
  • 1:42 - 1:44
    precisamos transformá-lo em um retângulo.
  • 1:44 - 1:45
    Como fazemos isso?
  • 1:45 - 1:47
    A digitalização é uma maneira.
  • 1:47 - 1:49
    Existe muito material disponível:
  • 1:49 - 1:55
    jornais, milhares de livros impressos.
  • 1:55 - 1:57
    Posso digitalizá-los todos.
  • 1:57 - 2:00
    Posso extrair informações deles.
  • 2:00 - 2:04
    É claro que, quanto mais no passado,
    menos informações teremos.
  • 2:04 - 2:06
    Então, talvez isso não seja suficiente.
  • 2:06 - 2:09
    Aí, posso fazer
    o que os historiadores fazem.
  • 2:09 - 2:10
    Posso pensar de forma mais ampla.
  • 2:10 - 2:15
    É o que chamamos,
    em ciência da computação, de simulação.
  • 2:15 - 2:16
    Se eu pegar um diário de bordo,
  • 2:16 - 2:19
    posso considerá-lo não apenas
    como um diário de bordo
  • 2:19 - 2:22
    de um capitão veneziano, saindo
    em uma jornada em particular.
  • 2:22 - 2:23
    Posso considerar que seja,
    de fato, um diário de bordo
  • 2:23 - 2:26
    que representa muitas viagens
    daquele período.
  • 2:26 - 2:28
    Estou pensando de forma mais ampla.
  • 2:28 - 2:30
    Se tenho uma pintura de uma fachada,
  • 2:30 - 2:33
    posso considerar que não seja apenas
    de um prédio em particular,
  • 2:33 - 2:37
    mas que, provavelmente,
    também compartilhe da mesma gramática
  • 2:37 - 2:41
    de prédios dos quais
    não tenhamos informação.
  • 2:41 - 2:44
    Então, se quisermos criar
    uma máquina do tempo,
  • 2:44 - 2:45
    precisamos de duas coisas.
  • 2:45 - 2:47
    Precisamos de arquivos bem grandes
  • 2:47 - 2:50
    e de especialistas excelentes.
  • 2:50 - 2:52
    A Máquina do Tempo de Veneza,
  • 2:52 - 2:54
    o projeto sobre o qual vou falar,
  • 2:54 - 2:57
    é um projeto conjunto entre a EPFL
  • 2:57 - 3:00
    e a Universidade Ca'Foscari de Veneza.
  • 3:00 - 3:02
    Veneza tem algo bem peculiar:
  • 3:02 - 3:05
    sua administração tem sido
  • 3:05 - 3:07
    bem, bem burocrática.
  • 3:07 - 3:09
    Eles têm informações sobre tudo,
  • 3:09 - 3:12
    quase que como a Google de hoje.
  • 3:12 - 3:13
    No Archivio di Stato,
  • 3:13 - 3:15
    existem 80 km de arquivos
  • 3:15 - 3:17
    que documentam cada aspecto
  • 3:17 - 3:19
    da vida de Veneza,
    num período de mais de mil anos.
  • 3:19 - 3:21
    Você tem cada navio que parte,
  • 3:21 - 3:22
    cada navio que chega.
  • 3:22 - 3:25
    Você tem cada mudança
    que foi feita na cidade.
  • 3:25 - 3:29
    Está tudo lá.
  • 3:29 - 3:32
    Estamos instalando um programa
    de digitalização de dez anos,
  • 3:32 - 3:34
    que tem por objetivo transformar
  • 3:34 - 3:35
    esse imenso arquivo
  • 3:35 - 3:38
    em um sistema gigante de informação.
  • 3:38 - 3:40
    Nosso objetivo é chegar
  • 3:40 - 3:45
    a 450 livros sendo digitalizados por dia.
  • 3:45 - 3:47
    É claro, ao digitalizar, isso não é suficiente,
  • 3:47 - 3:48
    porque a maioria desses documentos
  • 3:48 - 3:51
    está escrita em latim, em toscano,
  • 3:51 - 3:52
    em dialeto veneziano.
  • 3:52 - 3:54
    Então, é necessário transcrevê-los,
  • 3:54 - 3:56
    em alguns casos traduzi-los,
  • 3:56 - 3:57
    indexá-los,
  • 3:57 - 3:59
    e é claro que isso não é fácil.
  • 3:59 - 4:03
    Em particular, o método tradicional
    de reconhecimento óptico de caracteres,
  • 4:03 - 4:04
    que pode ser usado
    para documentos impressos,
  • 4:04 - 4:08
    não funciona bem
    para documentos manuscritos.
  • 4:08 - 4:10
    Então, a solução é, na verdade,
    pegar inspiração
  • 4:10 - 4:13
    de outra área: o reconhecimento de fala.
  • 4:13 - 4:15
    Este é um campo que parece impossível,
  • 4:15 - 4:18
    mas que, na verdade, pode ser feito
  • 4:18 - 4:20
    simplesmente adicionando limites,
  • 4:20 - 4:22
    se você tiver um modelo muito bom
  • 4:22 - 4:23
    de uma linguagem que seja usada,
  • 4:23 - 4:25
    se tiver um modelo
    muito bom de documento,
  • 4:25 - 4:27
    a forma como são estruturados.
  • 4:27 - 4:28
    E esses são documentos administrativos.
  • 4:28 - 4:30
    São bem estruturados em muitos casos.
  • 4:30 - 4:33
    Se você dividir esse enorme arquivo
    em subgrupos,
  • 4:33 - 4:36
    que, na verdade,
    compartilhem das mesmas características,
  • 4:36 - 4:40
    então, existe uma chance de dar certo.
  • 4:43 - 4:45
    Se chegarmos a esse estágio,
    então, há outra coisa:
  • 4:45 - 4:49
    podemos extrair eventos desse documento.
  • 4:49 - 4:51
    Na verdade,
    provavelmente 10 bilhões de eventos
  • 4:51 - 4:53
    podem ser extraídos desse arquivo.
  • 4:53 - 4:55
    E esse sistema de informação gigante
  • 4:55 - 4:56
    pode ser pesquisado de várias formas.
  • 4:56 - 4:58
    Você pode perguntar coisas como:
  • 4:58 - 5:01
    "Quem vivia nesse palácio em 1323?"
  • 5:01 - 5:03
    "Quanto custava uma brema
    no mercado Realto
  • 5:03 - 5:05
    em 1434?"
  • 5:05 - 5:06
    "Quanto ganhava
  • 5:06 - 5:08
    um vidraceiro em Murano,
  • 5:08 - 5:09
    talvez, durante uma década?"
  • 5:09 - 5:11
    Você pode até fazer perguntas maiores
  • 5:11 - 5:14
    porque tudo estará
    semanticamente codificado.
  • 5:14 - 5:16
    Então, você pode
    transformar isso em espaço,
  • 5:16 - 5:18
    porque muito dessa informação é espacial.
  • 5:18 - 5:20
    E, a partir disso, você pode, por exemplo,
  • 5:20 - 5:22
    reconstruir uma jornada extraordinária
  • 5:22 - 5:25
    dessa cidade que conseguiu
    se desenvolver de forma sustentável,
  • 5:25 - 5:27
    ao longo de mil anos,
  • 5:27 - 5:29
    conseguindo ter sempre
  • 5:29 - 5:32
    uma certa harmonia com o ambiente.
  • 5:32 - 5:33
    Você pode reconstruir essa jornada
  • 5:33 - 5:36
    e visualizá-la de diferentes maneiras.
  • 5:36 - 5:39
    Mas, é claro, não é possível entender Veneza
    se apenas observar a cidade.
  • 5:39 - 5:41
    É preciso colocar isso
    em um contexto europeu maior.
  • 5:41 - 5:44
    Então, a ideia é também documentar tudo
  • 5:44 - 5:46
    que funcionava em termos de Europa.
  • 5:46 - 5:48
    Podemos reconstruir também a jornada
  • 5:48 - 5:50
    do império marítimo veneziano,
  • 5:50 - 5:54
    como, progressivamente,
    controlou o Mar Adriático,
  • 5:54 - 5:57
    como se tornou o império medieval
    mais poderoso
  • 5:57 - 5:59
    de sua época,
  • 5:59 - 6:01
    controlando a maior parte
    das rotas marítimas
  • 6:01 - 6:04
    do leste ao sul.
  • 6:05 - 6:08
    Mas você pode até fazer outras coisas,
  • 6:08 - 6:10
    porque, nessas rotas marítimas,
  • 6:10 - 6:12
    existem padrões regulares.
  • 6:12 - 6:14
    Você pode dar um passo além
  • 6:14 - 6:17
    e, na verdade,
    criar um sistema de simulação,
  • 6:17 - 6:19
    criar um simulador mediterrâneo
  • 6:19 - 6:22
    que seja capaz de reconstruir
  • 6:22 - 6:24
    até informações que não tenhamos,
  • 6:24 - 6:27
    o que possibilitaria que houvesse perguntas
    que você pudesse fazer,
  • 6:27 - 6:30
    como se estivesse usando
    um planejador de rotas.
  • 6:30 - 6:33
    "Se eu estiver em Corfu,
    em junho de 1323,
  • 6:33 - 6:36
    e quiser ir a Constantinopla,
  • 6:36 - 6:38
    onde posso pegar um navio?"
  • 6:38 - 6:39
    É provável que possamos
    responder essa pergunta
  • 6:39 - 6:44
    com um, dois ou três dias de precisão.
  • 6:44 - 6:45
    "Quanto vai custar?"
  • 6:45 - 6:49
    "Quais são as chances
    de encontrarmos piratas?"
  • 6:49 - 6:51
    É claro, vocês entendem,
  • 6:51 - 6:53
    o principal desafio científico
    de um projeto como este
  • 6:53 - 6:57
    é qualificar, quantificar e representar
  • 6:57 - 7:00
    a incerteza e a inconsistência
    a cada passo desse processo.
  • 7:00 - 7:03
    Há muitos erros.
  • 7:03 - 7:06
    Erros no documento,
    o nome errado do capitão.
  • 7:06 - 7:09
    Alguns dos barcos, na verdade,
    nunca viram o mar.
  • 7:09 - 7:14
    Há erros de tradução,
    interpretações tendenciosas,
  • 7:14 - 7:17
    e, além disso,
    se adicionar processos algorítmicos,
  • 7:17 - 7:20
    você vai ter erros de reconhecimento,
  • 7:20 - 7:22
    erros de extração.
  • 7:22 - 7:26
    Então, você tem dados bem incertos.
  • 7:26 - 7:30
    Então, como podemos detectar
    e corrigir essas inconsistências?
  • 7:30 - 7:34
    Como podemos representar
    essa forma de incerteza?
  • 7:34 - 7:36
    É difícil. Uma coisa que você pode fazer
  • 7:36 - 7:38
    é documentar cada passo do processo,
  • 7:38 - 7:41
    não apenas codificando
    a informação histórica,
  • 7:41 - 7:43
    mas aquilo que chamamos
    de informação meta-histórica,
  • 7:43 - 7:46
    como o conhecimento histórico
    é construído,
  • 7:46 - 7:48
    documentando cada passo.
  • 7:48 - 7:50
    Isso não vai garantir que, de fato,
    vamos convergir
  • 7:50 - 7:52
    para uma única história de Veneza,
  • 7:52 - 7:54
    mas talvez possamos reconstruir
  • 7:54 - 7:57
    uma história em potencial de Veneza,
    inteiramente documentada.
  • 7:57 - 7:59
    Talvez não haja nenhum mapa sequer.
  • 7:59 - 8:01
    Talvez haja diversos mapas.
  • 8:01 - 8:03
    O sistema deve permitir isso,
  • 8:03 - 8:06
    porque temos de lidar
    com uma nova forma de incerteza,
  • 8:06 - 8:11
    que é realmente nova para esse tipo
    de bancos de dados gigantes.
  • 8:11 - 8:13
    E como devemos comunicar
  • 8:13 - 8:17
    essa nova pesquisa a um grande público?
  • 8:17 - 8:19
    Novamente,
    Veneza é extraordinária por isso.
  • 8:19 - 8:22
    Com os milhões de visitantes
    que vêm todos os anos,
  • 8:22 - 8:23
    é um dos melhores lugares
  • 8:23 - 8:26
    para se tentar criar o museu do futuro.
  • 8:26 - 8:30
    Imagine que, horizontalmente,
    você veja o mapa reconstruído
  • 8:30 - 8:31
    de um determinado ano,
  • 8:31 - 8:34
    e, verticalmente, você veja o documento
  • 8:34 - 8:35
    que serviu de base para a reconstrução.
  • 8:35 - 8:39
    Pinturas, por exemplo.
  • 8:39 - 8:41
    Imagine um sistema imersivo
    que nos permita
  • 8:41 - 8:45
    mergulhar e reconstruir a Veneza
    de um determinado ano,
  • 8:45 - 8:48
    experiências que você possa
    compartilhar com um grupo.
  • 8:48 - 8:50
    Ao contrário, imagine, na verdade,
    que você comece
  • 8:50 - 8:52
    a partir de um documento,
    um manuscrito veneziano,
  • 8:52 - 8:55
    e você mostre o que
    pode criar a partir dele,
  • 8:55 - 8:57
    como ele é decodificado,
  • 8:57 - 8:59
    e como o contexto desse documento
    pode ser recriado.
  • 8:59 - 9:01
    Esta é uma imagem de uma exposição
  • 9:01 - 9:03
    que está sendo conduzida em Genebra,
  • 9:03 - 9:06
    com esse tipo de sistema.
  • 9:06 - 9:08
    Então, para concluir, podemos dizer
  • 9:08 - 9:11
    que a pesquisa na área de humanas
    está prestes a passar
  • 9:11 - 9:13
    por uma evolução que, talvez, seja similar
  • 9:13 - 9:17
    ao que aconteceu com as ciências da vida,
    trinta anos atrás.
  • 9:17 - 9:22
    É realmente uma questão de escala.
  • 9:22 - 9:25
    Vemos projetos
  • 9:25 - 9:29
    que estão muito além do que
    qualquer equipe de pesquisa pode fazer,
  • 9:29 - 9:32
    e isso é muito novo
    para a área de humanas,
  • 9:32 - 9:35
    que, com frequência,
    tem o hábito de trabalhar
  • 9:35 - 9:39
    em grupos pequenos
    ou com apenas dois pesquisadores.
  • 9:39 - 9:42
    Ao visitar o Archivio di Stato,
  • 9:42 - 9:44
    você percebe que isso está além
    do qualquer equipe possa realizar,
  • 9:44 - 9:48
    e que esse deve ser
    um esforço comum e em conjunto.
  • 9:48 - 9:51
    Então, o que precisamos fazer
    para essa mudança de paradigma
  • 9:51 - 9:53
    é, na verdade, promover uma nova geração
  • 9:53 - 9:55
    de "humanistas digitais"
  • 9:55 - 9:57
    que vão estar prontos para essa mudança.
  • 9:57 - 9:59
    Muito obrigado.
  • 9:59 - 10:03
    (Aplausos)
Title:
Como criei uma máquina do tempo de informação
Speaker:
Frederic Kaplan
Description:

Imagine se você pudesse navegar no Facebook... da Idade Média. Bem, talvez isso não esteja tão distante quanto parece. Em uma palestra divertida e interessante, o pesquisador e engenheiro Frederic Kaplan exibe a Máquina do Tempo de Veneza, um projeto que visa digitalizar 80 km de livros para criar uma simulação histórica e geográfica de Veneza, de um período de tempo de mil anos. (Filmado no TEDxCaFoscariU)

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20

Portuguese, Brazilian subtitles

Revisions