Return to Video

Comment j'ai construit une machine à remonter le temps de l'information

  • 0:00 - 0:03
    Voici une image de la planète Terre.
  • 0:03 - 0:06
    Elle ressemble beaucoup
    aux images d'Apollo,
  • 0:06 - 0:08
    très célèbres.
  • 0:08 - 0:10
    Il y a une différence :
  • 0:10 - 0:11
    on peut cliquer sur cette image,
  • 0:11 - 0:13
    et si on le fait,
  • 0:13 - 0:16
    on peut zoomer sur quasiment
    n'importe quel endroit du globe.
  • 0:16 - 0:18
    Par exemple, cette vue du ciel
  • 0:18 - 0:20
    du campus de l'EPFL.
  • 0:20 - 0:22
    Souvent, on peut voir également
  • 0:22 - 0:26
    à quoi ressemble un bâtiment
    vu d'une rue à proximité.
  • 0:26 - 0:28
    C'est incroyable.
  • 0:28 - 0:31
    Mais il manque quelque chose
    à cette belle visite :
  • 0:31 - 0:33
    le temps.
  • 0:33 - 0:36
    Je ne sais pas trop quand
    cette photo a été prise.
  • 0:36 - 0:38
    Je ne suis même pas sûr
    si elle a été prise
  • 0:38 - 0:44
    en même temps
    que la vue du ciel.
  • 0:44 - 0:46
    Dans mon laboratoire,
    nous développons des outils
  • 0:46 - 0:48
    pour voyager non seulement dans l'espace
  • 0:48 - 0:50
    mais aussi dans le temps.
  • 0:50 - 0:52
    La question que l'on se pose est
  • 0:52 - 0:54
    s'il est possible de construire
    quelque chose
  • 0:54 - 0:56
    comme un Google Maps du passé ?
  • 0:56 - 0:59
    Peut-on ajouter un curseur
    en haut de Google Maps
  • 0:59 - 1:01
    et changer l'année,
  • 1:01 - 1:03
    pour voir comment c'était
    il y a 100 ans,
  • 1:03 - 1:04
    ou il y a 1000 ans ?
  • 1:04 - 1:06
    Est-ce que c'est possible ?
  • 1:06 - 1:09
    Peut-on reconstruire
    des réseaux sociaux du passé ?
  • 1:09 - 1:12
    Peut-on créer un Facebook
    du Moyen Age ?
  • 1:12 - 1:16
    En fait, peut-on créer
    des machines à remonter le temps ?
  • 1:16 - 1:18
    On peut répondre simplement :
    « Non, c'est impossible. »
  • 1:18 - 1:22
    Ou alors, on peut y réfléchir
    du point de vue de l'information.
  • 1:22 - 1:25
    C'est ce que j'appelle
    le champignon de l'information.
  • 1:25 - 1:27
    Verticalement, voici le temps,
  • 1:27 - 1:29
    et horizontalement, le nombre
    d'informations numériques disponibles.
  • 1:29 - 1:33
    Evidemment, dans les 10 dernières années,
    il y a beaucoup d'informations.
  • 1:33 - 1:36
    Et bien sûr, plus nous retournons vers le passé,
    moins il y a d'informations.
  • 1:36 - 1:39
    Si nous voulons construire quelque chose
    comme Google Maps du passé,
  • 1:39 - 1:40
    ou Facebook du passé,
  • 1:40 - 1:42
    il faut élargir cet espace,
  • 1:42 - 1:44
    il faut le faire comme un rectangle.
  • 1:44 - 1:45
    Comment s'y prend-on ?
  • 1:45 - 1:47
    Une façon, c'est la numérisation.
  • 1:47 - 1:49
    Il y a beaucoup de matériel disponible,
  • 1:49 - 1:55
    des journaux, des livres imprimés,
    des milliers de livres imprimés.
  • 1:55 - 1:57
    Je peux tous les numériser.
  • 1:57 - 2:00
    Je peux en extraire les informations.
  • 2:00 - 2:04
    Bien sûr, plus on retourne dans le passé,
    moins il y a d'informations.
  • 2:04 - 2:06
    Ce n'est peut-être pas suffisant.
  • 2:06 - 2:09
    Je peux alors faire ce que font
    les historiens.
  • 2:09 - 2:10
    Je peux extrapoler.
  • 2:10 - 2:15
    C'est ce qu'on appelle, en informatique,
    la simulation.
  • 2:15 - 2:16
    Si je prends un journal de bord,
  • 2:16 - 2:19
    je peux estimer que ce n'est pas
    qu'un journal de bord
  • 2:19 - 2:22
    d'un capitaine vénitien
    partant vers un voyage précis.
  • 2:22 - 2:23
    Je peux estimer que c'est un journal de bord
  • 2:23 - 2:26
    représentatif d'un grand nombre
    de voyages de cette époque.
  • 2:26 - 2:28
    J'extrapole.
  • 2:28 - 2:30
    Si j'ai la peinture d'une façade,
  • 2:30 - 2:33
    je peux envisager que ce n'est pas
    que ce bâtiment en particulier,
  • 2:33 - 2:37
    mais qu'il partage probablement
    la même grammaire
  • 2:37 - 2:41
    que d'autres bâtiments
    dont les informations ont été perdues.
  • 2:41 - 2:44
    Si on veut construire
    une machine à remonter le temps,
  • 2:44 - 2:45
    il faut deux choses.
  • 2:45 - 2:47
    Il faut des archives très grandes,
  • 2:47 - 2:50
    et d'excellents experts.
  • 2:50 - 2:52
    La machine à remonter le temps
    de Venise,
  • 2:52 - 2:54
    le projet dont je vais vous parler,
  • 2:54 - 2:57
    est un projet commun entre l'EPFL
  • 2:57 - 3:00
    et l'Université de Venise Ca' Foscari.
  • 3:00 - 3:02
    Il y a quelque chose
    de très particulier au sujet de Venise,
  • 3:02 - 3:05
    c'est que son administration est
  • 3:05 - 3:07
    très, très bureaucratique.
  • 3:07 - 3:09
    Ils ont gardé trace de tout,
  • 3:09 - 3:12
    presque comme Google aujourd'hui.
  • 3:12 - 3:13
    Aux Archives d'Etat,
  • 3:13 - 3:15
    il y a 80 kilomètres d'archives
  • 3:15 - 3:17
    retraçant chaque aspect
  • 3:17 - 3:19
    de la vie de Venise
    sur plus de 1000 ans.
  • 3:19 - 3:21
    Il y a chaque bateau qui part,
  • 3:21 - 3:22
    chaque bateau qui arrive.
  • 3:22 - 3:25
    Il y a chaque changement
    fait dans la ville.
  • 3:25 - 3:29
    Tout est là dedans.
  • 3:29 - 3:32
    Nous sommes en train de créer un programme
    de numérisation de 10 ans
  • 3:32 - 3:34
    qui a pour objectif de transformer
  • 3:34 - 3:35
    ces énormes archives
  • 3:35 - 3:38
    en un système gigantesque d'information.
  • 3:38 - 3:40
    Nous avons pour type d'objectif
  • 3:40 - 3:45
    de pouvoir numériser 450 livres par jour.
  • 3:45 - 3:47
    Bien sûr, quand on numérise,
    ce n'est pas suffisant,
  • 3:47 - 3:48
    car ces documents,
  • 3:48 - 3:51
    la plupart d'entre eux sont en latin,
    en toscan,
  • 3:51 - 3:52
    en dialecte vénitien,
  • 3:52 - 3:54
    il faut donc les transcrire,
  • 3:54 - 3:56
    les traduire dans certains cas,
  • 3:56 - 3:57
    les indexer,
  • 3:57 - 3:59
    et évidemment, ce n'est pas simple.
  • 3:59 - 4:03
    La méthode de reconnaissance de caractère
    optique traditionnelle, notamment,
  • 4:03 - 4:04
    qu'on peut utiliser
    pour des manuscrits imprimés,
  • 4:04 - 4:08
    ne fonctionne pas bien
    sur des documents écrits à la main.
  • 4:08 - 4:10
    La solution en fait, c'est de s'inspirer
  • 4:10 - 4:13
    d'un autre domaine : la reconnaissance vocale.
  • 4:13 - 4:15
    C'est un domaine d'une chose
    qui semble impossible
  • 4:15 - 4:18
    mais qui peut être réalisée
  • 4:18 - 4:20
    en ajoutant simplement
    des contraintes supplémentaires.
  • 4:20 - 4:22
    Si on a un très bon modèle
  • 4:22 - 4:23
    d'un langage utilisé,
  • 4:23 - 4:25
    si on a un très bon modèle d'un document,
  • 4:25 - 4:27
    bien structuré.
  • 4:27 - 4:28
    Ce sont des documents administratifs.
  • 4:28 - 4:30
    Ils sont bien structurés
    la plupart du temps.
  • 4:30 - 4:33
    Si on divise ces immenses archives
    en de petits sous-ensembles,
  • 4:33 - 4:36
    où un petit sous-ensemble
    partage des aspects similaires,
  • 4:36 - 4:40
    alors il y a un chance de réussite.
  • 4:43 - 4:45
    Si cette étape est atteinte,
    alors il y a autre chose :
  • 4:45 - 4:49
    on peut extraire des événements
    de ces documents.
  • 4:49 - 4:51
    En fait, probablement
    10 milliards d'événements
  • 4:51 - 4:53
    peuvent être extraits
    de ces archives.
  • 4:53 - 4:55
    Et ce système d'information
    gigantesque
  • 4:55 - 4:56
    peut être observé de
    nombreuses manières.
  • 4:56 - 4:58
    On peut poser des questions comme :
  • 4:58 - 5:01
    « Qui vivait dans ce palais en 1323 ? »
  • 5:01 - 5:03
    « Combien coûte une dorade au marché de Realto
  • 5:03 - 5:05
    en 1434 ? »
  • 5:05 - 5:06
    « Quel était le salaire
  • 5:06 - 5:08
    d'un verrier à Murano
  • 5:08 - 5:09
    sur, disons, une décennie ? »
  • 5:09 - 5:11
    On peut même poser
    des questions plus longues
  • 5:11 - 5:14
    car elles seront codées
    sémantiquement.
  • 5:14 - 5:16
    Ce qu'on peut ensuite faire,
    c'est de mettre tout cela dans l'espace,
  • 5:16 - 5:18
    car beaucoup d'informations
    sont spatiales.
  • 5:18 - 5:20
    A partir de là, on peut faire des choses comme
  • 5:20 - 5:22
    reconstruire ce voyage extraordinaire
  • 5:22 - 5:25
    de cette ville qui a réussi à avoir
    un développement durable
  • 5:25 - 5:27
    sur un millier d'années,
  • 5:27 - 5:29
    parvenant ainsi à avoir tout le temps
  • 5:29 - 5:32
    une forme d'équilibre avec son environnement.
  • 5:32 - 5:33
    On peut reconstruire ce voyage,
  • 5:33 - 5:36
    le visualiser de nombreuses
    et différentes manières.
  • 5:36 - 5:39
    Mais bien évidemment, on ne peut pas comprendre
    Venise seulement en la regardant.
  • 5:39 - 5:41
    Il faut la placer dans un contexte
    européen plus vaste.
  • 5:41 - 5:44
    L'idée, c'est aussi de documenter
    toutes les choses
  • 5:44 - 5:46
    qui ont fonctionné au niveau européen.
  • 5:46 - 5:48
    On peut aussi reconstruire le voyage
  • 5:48 - 5:50
    de l'empire maritime vénitien,
  • 5:50 - 5:54
    comment il a conquis progressivement
    la Mer Adriatique,
  • 5:54 - 5:57
    comment il est devenu l'empire
    médiéval le plus puissant
  • 5:57 - 5:59
    de son époque,
  • 5:59 - 6:01
    en prenant le contrôle de la plupart
    des routes maritimes
  • 6:01 - 6:04
    de l'est au sud.
  • 6:05 - 6:08
    Mais on peut faire même
    d'autres choses,
  • 6:08 - 6:10
    car dans ces routes maritimes,
  • 6:10 - 6:12
    il y a des schémas récurrents.
  • 6:12 - 6:14
    On peut aller plus loin
  • 6:14 - 6:17
    et créer un système de simulation,
  • 6:17 - 6:19
    créer un simulateur méditerranéen
  • 6:19 - 6:22
    capable de reconstruire
  • 6:22 - 6:24
    même les informations manquantes,
  • 6:24 - 6:27
    ce qui nous permettrait
    d'avoir des questions qu'on pourrait poser
  • 6:27 - 6:30
    comme si on utilisait un planificateur routier.
  • 6:30 - 6:33
    « Si je suis à Corfou en juin 1323
  • 6:33 - 6:36
    et que je veux aller à Constantinople,
  • 6:36 - 6:38
    où puis-je prendre un bateau ? »
  • 6:38 - 6:39
    On peut probablement répondre
    à cette question
  • 6:39 - 6:44
    avec une précision d'un, deux, ou trois jours.
  • 6:44 - 6:45
    « Combien ça va coûter ? »
  • 6:45 - 6:49
    « Quels sont les risques
    de rencontrer des pirates ? »
  • 6:49 - 6:51
    Bien sûr, vous comprenez que
  • 6:51 - 6:53
    le défi scientifique central
    d'un projet comme celui-ci,
  • 6:53 - 6:57
    c'est de qualifier, de quantifier
    et de représenter
  • 6:57 - 7:00
    l'incertitude et les incohérences
    à chaque étape du processus.
  • 7:00 - 7:03
    Il y a des erreurs partout,
  • 7:03 - 7:06
    des erreurs dans le document,
    c'est le nom erroné du capitaine,
  • 7:06 - 7:09
    ou certains bateaux n'ont
    jamais pris la mer.
  • 7:09 - 7:14
    Il y a des erreurs de traduction,
    des partis pris dans l'interprétation,
  • 7:14 - 7:17
    et de surcroît,
    si on ajoute les processus d'algorithme,
  • 7:17 - 7:20
    il y aura des erreurs dans la reconnaissance,
  • 7:20 - 7:22
    des erreurs dans l'extraction,
  • 7:22 - 7:26
    et on obtient donc des données
    très, très incertaines.
  • 7:26 - 7:30
    Alors, comment peut-on détecter et
    corriger ces incohérences ?
  • 7:30 - 7:34
    Comment peut-on représenter
    cette forme d'incertitude ?
  • 7:34 - 7:36
    C'est difficile. Une chose qu'on peut faire,
  • 7:36 - 7:38
    c'est documenter
    chaque étape du processus,
  • 7:38 - 7:41
    non seulement en codant
    les informations historiques
  • 7:41 - 7:43
    mais aussi ce qu'on appelle les informations
    méta-historiques,
  • 7:43 - 7:46
    comment les connaissances historiques
    sont construites,
  • 7:46 - 7:48
    en documentant chaque étape.
  • 7:48 - 7:50
    Ça ne nous assure pas
    que l'on se dirige vraiment
  • 7:50 - 7:52
    vers une histoire unique de Venise,
  • 7:52 - 7:54
    mais certainement que l'on peut
    vraiment reconstruire
  • 7:54 - 7:57
    une histoire potentielle de Venise
    complètement documentée.
  • 7:57 - 7:59
    Il n'y a peut-être pas une seule carte.
  • 7:59 - 8:01
    Il y a peut-être plusieurs cartes.
  • 8:01 - 8:03
    Le système devrait nous le permettre
  • 8:03 - 8:06
    car on doit faire face à une nouvelle
    forme d'incertitude
  • 8:06 - 8:11
    qui est réellement nouvelle
    pour ce type de base de données immenses.
  • 8:11 - 8:13
    Comment doit-on communiquer
  • 8:13 - 8:17
    sur cette nouvelle recherche
    vers un public large ?
  • 8:17 - 8:19
    Encore une fois, Venise
    est extraordinaire en la matière.
  • 8:19 - 8:22
    Avec ses millions de visiteurs chaque année,
  • 8:22 - 8:23
    elle est vraiment un des meilleurs endroits
  • 8:23 - 8:26
    pour essayer d'inventer le musée de l'avenir.
  • 8:26 - 8:30
    Imaginez, horizontalement,
    on voit la carte reconstruite
  • 8:30 - 8:31
    d'une année donnée,
  • 8:31 - 8:34
    et verticalement, on voit le document
  • 8:34 - 8:35
    qui a permis la reconstruction,
  • 8:35 - 8:39
    des peintures, par exemple.
  • 8:39 - 8:41
    Imaginez un système immersif qui permet
  • 8:41 - 8:45
    d'aller, de plonger et de reconstruire
    la Venise d'une année donnée,
  • 8:45 - 8:48
    une expérience qu'on peut partager
    en groupe.
  • 8:48 - 8:50
    A l'inverse, imaginez qu'on démarre
  • 8:50 - 8:52
    par un document, un manuscrit vénitien,
  • 8:52 - 8:55
    et on montre ce qu'on peut en tirer,
  • 8:55 - 8:57
    comment il est décodé,
  • 8:57 - 8:59
    comment le contexte de ce document
    peut être recréé.
  • 8:59 - 9:01
    Voici une image d'une exposition
  • 9:01 - 9:03
    qui se tient actuellement à Genève
  • 9:03 - 9:06
    avec ce genre de système.
  • 9:06 - 9:08
    En conclusion, on peut dire que
  • 9:08 - 9:11
    la recherche dans les humanités
    est sur le point de subir
  • 9:11 - 9:13
    une évolution à peu près similaire
  • 9:13 - 9:17
    à ce qui s'est passé dans les sciences
    de la vie il y a 30 ans.
  • 9:17 - 9:22
    C'est en fait une question d'échelle.
  • 9:22 - 9:25
    On voit des projets qui sont
  • 9:25 - 9:29
    bien au-delà de ce qu'une seule équipe
    de recherche peut réaliser,
  • 9:29 - 9:32
    et ça, c'est vraiment nouveau
    dans les humanités,
  • 9:32 - 9:35
    où on a souvent pour habitude de travailler
  • 9:35 - 9:39
    en petits groupes ou seulement
    avec deux chercheurs.
  • 9:39 - 9:42
    Lorsqu'on visite les Archives d'Etat à Venise,
  • 9:42 - 9:44
    on sent que c'est au-delà
    de ce qu'une simple équipe peut réaliser,
  • 9:44 - 9:48
    et qu'il faut un effort partagé et commun.
  • 9:48 - 9:51
    Ce qu'il faut
    pour ce changement de modèle,
  • 9:51 - 9:53
    c'est promouvoir une nouvelle génération
  • 9:53 - 9:55
    d' « humanistes numériques »
  • 9:55 - 9:57
    qui seront prêts pour ce changement.
  • 9:57 - 9:59
    Je vous remercie beaucoup.
  • 9:59 - 10:03
    (Applaudissements)
Title:
Comment j'ai construit une machine à remonter le temps de l'information
Speaker:
Frederic Kaplan
Description:

Imaginez que l'on puisse naviguer sur Facebook... depuis le Moyen Age. Eh bien, ce n'est peut-être pas aussi loin que ça en a l'air. Dans cette conférence drôle et intéressante, le chercheur et ingénieur Frederic Kaplan nous montre la Machine à Remonter le Temps de Venise, un projet de numérisation de 80 kilomètres de livres afin de créer une simulation historique et géographique de Venise sur 1000 ans. (Filmé à TEDxCaFoscariU.)

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20

French subtitles

Revisions

  • Revision 6 Edited (legacy editor)
    Anna Cristiana Minoli