1 00:00:00,285 --> 00:00:03,178 Voici une image de la planète Terre. 2 00:00:03,178 --> 00:00:06,271 Elle ressemble beaucoup aux images d'Apollo, 3 00:00:06,271 --> 00:00:07,882 très célèbres. 4 00:00:07,882 --> 00:00:09,952 Il y a une différence : 5 00:00:09,952 --> 00:00:11,399 on peut cliquer sur cette image, 6 00:00:11,399 --> 00:00:12,597 et si on le fait, 7 00:00:12,597 --> 00:00:15,669 on peut zoomer sur quasiment n'importe quel endroit du globe. 8 00:00:15,669 --> 00:00:17,668 Par exemple, cette vue du ciel 9 00:00:17,668 --> 00:00:20,334 du campus de l'EPFL. 10 00:00:20,334 --> 00:00:22,442 Souvent, on peut voir également 11 00:00:22,442 --> 00:00:26,182 à quoi ressemble un bâtiment vu d'une rue à proximité. 12 00:00:26,182 --> 00:00:27,604 C'est incroyable. 13 00:00:27,604 --> 00:00:31,031 Mais il manque quelque chose à cette belle visite : 14 00:00:31,031 --> 00:00:33,219 le temps. 15 00:00:33,219 --> 00:00:36,289 Je ne sais pas trop quand cette photo a été prise. 16 00:00:36,289 --> 00:00:37,701 Je ne suis même pas sûr si elle a été prise 17 00:00:37,701 --> 00:00:43,784 en même temps que la vue du ciel. 18 00:00:43,784 --> 00:00:45,993 Dans mon laboratoire, nous développons des outils 19 00:00:45,993 --> 00:00:47,757 pour voyager non seulement dans l'espace 20 00:00:47,757 --> 00:00:50,315 mais aussi dans le temps. 21 00:00:50,315 --> 00:00:52,185 La question que l'on se pose est 22 00:00:52,185 --> 00:00:53,578 s'il est possible de construire quelque chose 23 00:00:53,578 --> 00:00:55,756 comme un Google Maps du passé ? 24 00:00:55,756 --> 00:00:59,066 Peut-on ajouter un curseur en haut de Google Maps 25 00:00:59,066 --> 00:01:00,869 et changer l'année, 26 00:01:00,869 --> 00:01:02,660 pour voir comment c'était il y a 100 ans, 27 00:01:02,660 --> 00:01:04,329 ou il y a 1000 ans ? 28 00:01:04,329 --> 00:01:06,452 Est-ce que c'est possible ? 29 00:01:06,452 --> 00:01:08,704 Peut-on reconstruire des réseaux sociaux du passé ? 30 00:01:08,704 --> 00:01:11,753 Peut-on créer un Facebook du Moyen Age ? 31 00:01:11,753 --> 00:01:15,529 En fait, peut-on créer des machines à remonter le temps ? 32 00:01:15,529 --> 00:01:18,094 On peut répondre simplement : « Non, c'est impossible. » 33 00:01:18,094 --> 00:01:21,904 Ou alors, on peut y réfléchir du point de vue de l'information. 34 00:01:21,904 --> 00:01:25,094 C'est ce que j'appelle le champignon de l'information. 35 00:01:25,094 --> 00:01:26,677 Verticalement, voici le temps, 36 00:01:26,677 --> 00:01:29,417 et horizontalement, le nombre d'informations numériques disponibles. 37 00:01:29,417 --> 00:01:32,899 Evidemment, dans les 10 dernières années, il y a beaucoup d'informations. 38 00:01:32,899 --> 00:01:36,447 Et bien sûr, plus nous retournons vers le passé, moins il y a d'informations. 39 00:01:36,447 --> 00:01:38,765 Si nous voulons construire quelque chose comme Google Maps du passé, 40 00:01:38,765 --> 00:01:40,259 ou Facebook du passé, 41 00:01:40,259 --> 00:01:41,833 il faut élargir cet espace, 42 00:01:41,833 --> 00:01:43,771 il faut le faire comme un rectangle. 43 00:01:43,771 --> 00:01:45,281 Comment s'y prend-on ? 44 00:01:45,281 --> 00:01:47,379 Une façon, c'est la numérisation. 45 00:01:47,395 --> 00:01:49,174 Il y a beaucoup de matériel disponible, 46 00:01:49,190 --> 00:01:55,460 des journaux, des livres imprimés, des milliers de livres imprimés. 47 00:01:55,460 --> 00:01:57,228 Je peux tous les numériser. 48 00:01:57,228 --> 00:01:59,965 Je peux en extraire les informations. 49 00:01:59,965 --> 00:02:03,508 Bien sûr, plus on retourne dans le passé, moins il y a d'informations. 50 00:02:03,508 --> 00:02:06,154 Ce n'est peut-être pas suffisant. 51 00:02:06,154 --> 00:02:08,562 Je peux alors faire ce que font les historiens. 52 00:02:08,562 --> 00:02:10,086 Je peux extrapoler. 53 00:02:10,086 --> 00:02:14,556 C'est ce qu'on appelle, en informatique, la simulation. 54 00:02:14,556 --> 00:02:16,307 Si je prends un journal de bord, 55 00:02:16,307 --> 00:02:18,711 je peux estimer que ce n'est pas qu'un journal de bord 56 00:02:18,711 --> 00:02:21,683 d'un capitaine vénitien partant vers un voyage précis. 57 00:02:21,683 --> 00:02:23,326 Je peux estimer que c'est un journal de bord 58 00:02:23,326 --> 00:02:25,908 représentatif d'un grand nombre de voyages de cette époque. 59 00:02:25,908 --> 00:02:28,153 J'extrapole. 60 00:02:28,153 --> 00:02:30,191 Si j'ai la peinture d'une façade, 61 00:02:30,191 --> 00:02:32,942 je peux envisager que ce n'est pas que ce bâtiment en particulier, 62 00:02:32,942 --> 00:02:36,874 mais qu'il partage probablement la même grammaire 63 00:02:36,874 --> 00:02:40,915 que d'autres bâtiments dont les informations ont été perdues. 64 00:02:40,915 --> 00:02:43,773 Si on veut construire une machine à remonter le temps, 65 00:02:43,773 --> 00:02:45,112 il faut deux choses. 66 00:02:45,112 --> 00:02:47,346 Il faut des archives très grandes, 67 00:02:47,346 --> 00:02:50,088 et d'excellents experts. 68 00:02:50,088 --> 00:02:51,962 La machine à remonter le temps de Venise, 69 00:02:51,962 --> 00:02:53,767 le projet dont je vais vous parler, 70 00:02:53,767 --> 00:02:56,787 est un projet commun entre l'EPFL 71 00:02:56,787 --> 00:02:59,765 et l'Université de Venise Ca' Foscari. 72 00:02:59,765 --> 00:03:01,930 Il y a quelque chose de très particulier au sujet de Venise, 73 00:03:01,930 --> 00:03:04,604 c'est que son administration est 74 00:03:04,604 --> 00:03:06,798 très, très bureaucratique. 75 00:03:06,798 --> 00:03:08,991 Ils ont gardé trace de tout, 76 00:03:08,991 --> 00:03:11,906 presque comme Google aujourd'hui. 77 00:03:11,906 --> 00:03:13,420 Aux Archives d'Etat, 78 00:03:13,420 --> 00:03:15,184 il y a 80 kilomètres d'archives 79 00:03:15,184 --> 00:03:17,193 retraçant chaque aspect 80 00:03:17,193 --> 00:03:19,439 de la vie de Venise sur plus de 1000 ans. 81 00:03:19,439 --> 00:03:21,359 Il y a chaque bateau qui part, 82 00:03:21,359 --> 00:03:22,435 chaque bateau qui arrive. 83 00:03:22,435 --> 00:03:25,232 Il y a chaque changement fait dans la ville. 84 00:03:25,232 --> 00:03:28,523 Tout est là dedans. 85 00:03:28,523 --> 00:03:32,431 Nous sommes en train de créer un programme de numérisation de 10 ans 86 00:03:32,431 --> 00:03:34,108 qui a pour objectif de transformer 87 00:03:34,108 --> 00:03:35,492 ces énormes archives 88 00:03:35,492 --> 00:03:37,918 en un système gigantesque d'information. 89 00:03:37,918 --> 00:03:39,775 Nous avons pour type d'objectif 90 00:03:39,775 --> 00:03:44,501 de pouvoir numériser 450 livres par jour. 91 00:03:44,501 --> 00:03:46,748 Bien sûr, quand on numérise, ce n'est pas suffisant, 92 00:03:46,748 --> 00:03:48,035 car ces documents, 93 00:03:48,035 --> 00:03:50,674 la plupart d'entre eux sont en latin, en toscan, 94 00:03:50,689 --> 00:03:52,204 en dialecte vénitien, 95 00:03:52,204 --> 00:03:53,879 il faut donc les transcrire, 96 00:03:53,879 --> 00:03:55,560 les traduire dans certains cas, 97 00:03:55,560 --> 00:03:56,680 les indexer, 98 00:03:56,680 --> 00:03:58,844 et évidemment, ce n'est pas simple. 99 00:03:58,844 --> 00:04:02,688 La méthode de reconnaissance de caractère optique traditionnelle, notamment, 100 00:04:02,688 --> 00:04:04,112 qu'on peut utiliser pour des manuscrits imprimés, 101 00:04:04,112 --> 00:04:08,116 ne fonctionne pas bien sur des documents écrits à la main. 102 00:04:08,116 --> 00:04:10,246 La solution en fait, c'est de s'inspirer 103 00:04:10,246 --> 00:04:13,147 d'un autre domaine : la reconnaissance vocale. 104 00:04:13,147 --> 00:04:15,202 C'est un domaine d'une chose qui semble impossible 105 00:04:15,202 --> 00:04:17,739 mais qui peut être réalisée 106 00:04:17,739 --> 00:04:19,933 en ajoutant simplement des contraintes supplémentaires. 107 00:04:19,933 --> 00:04:21,519 Si on a un très bon modèle 108 00:04:21,519 --> 00:04:23,045 d'un langage utilisé, 109 00:04:23,045 --> 00:04:25,131 si on a un très bon modèle d'un document, 110 00:04:25,131 --> 00:04:26,563 bien structuré. 111 00:04:26,563 --> 00:04:27,916 Ce sont des documents administratifs. 112 00:04:27,931 --> 00:04:30,063 Ils sont bien structurés la plupart du temps. 113 00:04:30,063 --> 00:04:33,371 Si on divise ces immenses archives en de petits sous-ensembles, 114 00:04:33,371 --> 00:04:36,248 où un petit sous-ensemble partage des aspects similaires, 115 00:04:36,248 --> 00:04:40,279 alors il y a un chance de réussite. 116 00:04:42,761 --> 00:04:45,196 Si cette étape est atteinte, alors il y a autre chose : 117 00:04:45,196 --> 00:04:48,718 on peut extraire des événements de ces documents. 118 00:04:48,718 --> 00:04:51,016 En fait, probablement 10 milliards d'événements 119 00:04:51,016 --> 00:04:52,947 peuvent être extraits de ces archives. 120 00:04:52,947 --> 00:04:54,671 Et ce système d'information gigantesque 121 00:04:54,671 --> 00:04:56,487 peut être observé de nombreuses manières. 122 00:04:56,487 --> 00:04:57,855 On peut poser des questions comme : 123 00:04:57,855 --> 00:05:00,615 « Qui vivait dans ce palais en 1323 ? » 124 00:05:00,615 --> 00:05:02,837 « Combien coûte une dorade au marché de Realto 125 00:05:02,837 --> 00:05:04,561 en 1434 ? » 126 00:05:04,561 --> 00:05:06,021 « Quel était le salaire 127 00:05:06,021 --> 00:05:08,066 d'un verrier à Murano 128 00:05:08,066 --> 00:05:09,472 sur, disons, une décennie ? » 129 00:05:09,472 --> 00:05:10,894 On peut même poser des questions plus longues 130 00:05:10,894 --> 00:05:13,632 car elles seront codées sémantiquement. 131 00:05:13,632 --> 00:05:15,772 Ce qu'on peut ensuite faire, c'est de mettre tout cela dans l'espace, 132 00:05:15,772 --> 00:05:17,945 car beaucoup d'informations sont spatiales. 133 00:05:17,945 --> 00:05:19,880 A partir de là, on peut faire des choses comme 134 00:05:19,880 --> 00:05:21,993 reconstruire ce voyage extraordinaire 135 00:05:21,993 --> 00:05:25,349 de cette ville qui a réussi à avoir un développement durable 136 00:05:25,349 --> 00:05:27,475 sur un millier d'années, 137 00:05:27,475 --> 00:05:29,095 parvenant ainsi à avoir tout le temps 138 00:05:29,095 --> 00:05:31,956 une forme d'équilibre avec son environnement. 139 00:05:31,956 --> 00:05:33,204 On peut reconstruire ce voyage, 140 00:05:33,204 --> 00:05:36,100 le visualiser de nombreuses et différentes manières. 141 00:05:36,100 --> 00:05:38,799 Mais bien évidemment, on ne peut pas comprendre Venise seulement en la regardant. 142 00:05:38,799 --> 00:05:41,195 Il faut la placer dans un contexte européen plus vaste. 143 00:05:41,195 --> 00:05:44,016 L'idée, c'est aussi de documenter toutes les choses 144 00:05:44,016 --> 00:05:46,439 qui ont fonctionné au niveau européen. 145 00:05:46,439 --> 00:05:48,403 On peut aussi reconstruire le voyage 146 00:05:48,403 --> 00:05:50,393 de l'empire maritime vénitien, 147 00:05:50,393 --> 00:05:53,559 comment il a conquis progressivement la Mer Adriatique, 148 00:05:53,559 --> 00:05:57,305 comment il est devenu l'empire médiéval le plus puissant 149 00:05:57,305 --> 00:05:58,866 de son époque, 150 00:05:58,866 --> 00:06:01,038 en prenant le contrôle de la plupart des routes maritimes 151 00:06:01,038 --> 00:06:03,971 de l'est au sud. 152 00:06:05,305 --> 00:06:07,621 Mais on peut faire même d'autres choses, 153 00:06:07,621 --> 00:06:09,898 car dans ces routes maritimes, 154 00:06:09,898 --> 00:06:11,873 il y a des schémas récurrents. 155 00:06:11,889 --> 00:06:14,382 On peut aller plus loin 156 00:06:14,382 --> 00:06:16,502 et créer un système de simulation, 157 00:06:16,502 --> 00:06:19,317 créer un simulateur méditerranéen 158 00:06:19,317 --> 00:06:21,910 capable de reconstruire 159 00:06:21,910 --> 00:06:24,112 même les informations manquantes, 160 00:06:24,112 --> 00:06:27,100 ce qui nous permettrait d'avoir des questions qu'on pourrait poser 161 00:06:27,100 --> 00:06:30,088 comme si on utilisait un planificateur routier. 162 00:06:30,088 --> 00:06:33,159 « Si je suis à Corfou en juin 1323 163 00:06:33,159 --> 00:06:35,685 et que je veux aller à Constantinople, 164 00:06:35,685 --> 00:06:37,828 où puis-je prendre un bateau ? » 165 00:06:37,828 --> 00:06:39,195 On peut probablement répondre à cette question 166 00:06:39,195 --> 00:06:43,668 avec une précision d'un, deux, ou trois jours. 167 00:06:43,668 --> 00:06:45,275 « Combien ça va coûter ? » 168 00:06:45,275 --> 00:06:48,867 « Quels sont les risques de rencontrer des pirates ? » 169 00:06:48,867 --> 00:06:50,678 Bien sûr, vous comprenez que 170 00:06:50,678 --> 00:06:53,287 le défi scientifique central d'un projet comme celui-ci, 171 00:06:53,287 --> 00:06:57,016 c'est de qualifier, de quantifier et de représenter 172 00:06:57,016 --> 00:07:00,346 l'incertitude et les incohérences à chaque étape du processus. 173 00:07:00,346 --> 00:07:03,058 Il y a des erreurs partout, 174 00:07:03,058 --> 00:07:05,547 des erreurs dans le document, c'est le nom erroné du capitaine, 175 00:07:05,547 --> 00:07:08,760 ou certains bateaux n'ont jamais pris la mer. 176 00:07:08,760 --> 00:07:13,617 Il y a des erreurs de traduction, des partis pris dans l'interprétation, 177 00:07:13,624 --> 00:07:17,090 et de surcroît, si on ajoute les processus d'algorithme, 178 00:07:17,090 --> 00:07:20,039 il y aura des erreurs dans la reconnaissance, 179 00:07:20,039 --> 00:07:22,000 des erreurs dans l'extraction, 180 00:07:22,000 --> 00:07:26,481 et on obtient donc des données très, très incertaines. 181 00:07:26,481 --> 00:07:30,238 Alors, comment peut-on détecter et corriger ces incohérences ? 182 00:07:30,238 --> 00:07:33,898 Comment peut-on représenter cette forme d'incertitude ? 183 00:07:33,898 --> 00:07:35,995 C'est difficile. Une chose qu'on peut faire, 184 00:07:35,995 --> 00:07:38,221 c'est documenter chaque étape du processus, 185 00:07:38,221 --> 00:07:40,669 non seulement en codant les informations historiques 186 00:07:40,669 --> 00:07:43,348 mais aussi ce qu'on appelle les informations méta-historiques, 187 00:07:43,348 --> 00:07:46,011 comment les connaissances historiques sont construites, 188 00:07:46,011 --> 00:07:48,009 en documentant chaque étape. 189 00:07:48,009 --> 00:07:49,654 Ça ne nous assure pas que l'on se dirige vraiment 190 00:07:49,654 --> 00:07:52,104 vers une histoire unique de Venise, 191 00:07:52,104 --> 00:07:54,242 mais certainement que l'on peut vraiment reconstruire 192 00:07:54,242 --> 00:07:57,290 une histoire potentielle de Venise complètement documentée. 193 00:07:57,290 --> 00:07:58,749 Il n'y a peut-être pas une seule carte. 194 00:07:58,749 --> 00:08:00,869 Il y a peut-être plusieurs cartes. 195 00:08:00,869 --> 00:08:03,085 Le système devrait nous le permettre 196 00:08:03,085 --> 00:08:05,944 car on doit faire face à une nouvelle forme d'incertitude 197 00:08:05,944 --> 00:08:10,585 qui est réellement nouvelle pour ce type de base de données immenses. 198 00:08:10,585 --> 00:08:12,775 Comment doit-on communiquer 199 00:08:12,790 --> 00:08:16,769 sur cette nouvelle recherche vers un public large ? 200 00:08:16,769 --> 00:08:19,432 Encore une fois, Venise est extraordinaire en la matière. 201 00:08:19,432 --> 00:08:21,603 Avec ses millions de visiteurs chaque année, 202 00:08:21,603 --> 00:08:23,366 elle est vraiment un des meilleurs endroits 203 00:08:23,366 --> 00:08:26,354 pour essayer d'inventer le musée de l'avenir. 204 00:08:26,354 --> 00:08:29,658 Imaginez, horizontalement, on voit la carte reconstruite 205 00:08:29,658 --> 00:08:30,944 d'une année donnée, 206 00:08:30,944 --> 00:08:33,902 et verticalement, on voit le document 207 00:08:33,902 --> 00:08:35,413 qui a permis la reconstruction, 208 00:08:35,413 --> 00:08:38,813 des peintures, par exemple. 209 00:08:38,813 --> 00:08:41,393 Imaginez un système immersif qui permet 210 00:08:41,393 --> 00:08:44,895 d'aller, de plonger et de reconstruire la Venise d'une année donnée, 211 00:08:44,895 --> 00:08:47,610 une expérience qu'on peut partager en groupe. 212 00:08:47,610 --> 00:08:49,856 A l'inverse, imaginez qu'on démarre 213 00:08:49,856 --> 00:08:52,063 par un document, un manuscrit vénitien, 214 00:08:52,063 --> 00:08:55,112 et on montre ce qu'on peut en tirer, 215 00:08:55,112 --> 00:08:56,884 comment il est décodé, 216 00:08:56,884 --> 00:08:59,299 comment le contexte de ce document peut être recréé. 217 00:08:59,299 --> 00:09:01,184 Voici une image d'une exposition 218 00:09:01,184 --> 00:09:03,460 qui se tient actuellement à Genève 219 00:09:03,460 --> 00:09:05,814 avec ce genre de système. 220 00:09:05,814 --> 00:09:07,989 En conclusion, on peut dire que 221 00:09:07,989 --> 00:09:11,068 la recherche dans les humanités est sur le point de subir 222 00:09:11,068 --> 00:09:12,870 une évolution à peu près similaire 223 00:09:12,870 --> 00:09:17,452 à ce qui s'est passé dans les sciences de la vie il y a 30 ans. 224 00:09:17,452 --> 00:09:22,128 C'est en fait une question d'échelle. 225 00:09:22,130 --> 00:09:25,433 On voit des projets qui sont 226 00:09:25,433 --> 00:09:29,276 bien au-delà de ce qu'une seule équipe de recherche peut réaliser, 227 00:09:29,276 --> 00:09:31,519 et ça, c'est vraiment nouveau dans les humanités, 228 00:09:31,519 --> 00:09:35,388 où on a souvent pour habitude de travailler 229 00:09:35,388 --> 00:09:39,396 en petits groupes ou seulement avec deux chercheurs. 230 00:09:39,396 --> 00:09:41,514 Lorsqu'on visite les Archives d'Etat à Venise, 231 00:09:41,514 --> 00:09:44,336 on sent que c'est au-delà de ce qu'une simple équipe peut réaliser, 232 00:09:44,336 --> 00:09:48,170 et qu'il faut un effort partagé et commun. 233 00:09:48,170 --> 00:09:51,276 Ce qu'il faut pour ce changement de modèle, 234 00:09:51,276 --> 00:09:53,178 c'est promouvoir une nouvelle génération 235 00:09:53,178 --> 00:09:54,715 d' « humanistes numériques » 236 00:09:54,715 --> 00:09:56,805 qui seront prêts pour ce changement. 237 00:09:56,805 --> 00:09:58,764 Je vous remercie beaucoup. 238 00:09:58,764 --> 00:10:02,764 (Applaudissements)