0:00:00.285,0:00:03.178 Voici une image de la planète Terre. 0:00:03.178,0:00:06.271 Elle ressemble beaucoup [br]aux images d'Apollo, 0:00:06.271,0:00:07.882 très célèbres. 0:00:07.882,0:00:09.952 Il y a une différence : 0:00:09.952,0:00:11.399 on peut cliquer sur cette image, 0:00:11.399,0:00:12.597 et si on le fait, 0:00:12.597,0:00:15.669 on peut zoomer sur quasiment [br]n'importe quel endroit du globe. 0:00:15.669,0:00:17.668 Par exemple, cette vue du ciel 0:00:17.668,0:00:20.334 du campus de l'EPFL. 0:00:20.334,0:00:22.442 Souvent, on peut voir également 0:00:22.442,0:00:26.182 à quoi ressemble un bâtiment [br]vu d'une rue à proximité. 0:00:26.182,0:00:27.604 C'est incroyable. 0:00:27.604,0:00:31.031 Mais il manque quelque chose [br]à cette belle visite : 0:00:31.031,0:00:33.219 le temps. 0:00:33.219,0:00:36.289 Je ne sais pas trop quand [br]cette photo a été prise. 0:00:36.289,0:00:37.701 Je ne suis même pas sûr [br]si elle a été prise 0:00:37.701,0:00:43.784 en même temps [br]que la vue du ciel. 0:00:43.784,0:00:45.993 Dans mon laboratoire, [br]nous développons des outils 0:00:45.993,0:00:47.757 pour voyager non seulement dans l'espace 0:00:47.757,0:00:50.315 mais aussi dans le temps. 0:00:50.315,0:00:52.185 La question que l'on se pose est 0:00:52.185,0:00:53.578 s'il est possible de construire [br]quelque chose 0:00:53.578,0:00:55.756 comme un Google Maps du passé ? 0:00:55.756,0:00:59.066 Peut-on ajouter un curseur [br]en haut de Google Maps 0:00:59.066,0:01:00.869 et changer l'année, 0:01:00.869,0:01:02.660 pour voir comment c'était [br]il y a 100 ans, 0:01:02.660,0:01:04.329 ou il y a 1000 ans ? 0:01:04.329,0:01:06.452 Est-ce que c'est possible ? 0:01:06.452,0:01:08.704 Peut-on reconstruire [br]des réseaux sociaux du passé ? 0:01:08.704,0:01:11.753 Peut-on créer un Facebook [br]du Moyen Age ? 0:01:11.753,0:01:15.529 En fait, peut-on créer [br]des machines à remonter le temps ? 0:01:15.529,0:01:18.094 On peut répondre simplement : [br]« Non, c'est impossible. » 0:01:18.094,0:01:21.904 Ou alors, on peut y réfléchir [br]du point de vue de l'information. 0:01:21.904,0:01:25.094 C'est ce que j'appelle [br]le champignon de l'information. 0:01:25.094,0:01:26.677 Verticalement, voici le temps, 0:01:26.677,0:01:29.417 et horizontalement, le nombre [br]d'informations numériques disponibles. 0:01:29.417,0:01:32.899 Evidemment, dans les 10 dernières années, [br]il y a beaucoup d'informations. 0:01:32.899,0:01:36.447 Et bien sûr, plus nous retournons vers le passé, [br]moins il y a d'informations. 0:01:36.447,0:01:38.765 Si nous voulons construire quelque chose [br]comme Google Maps du passé, 0:01:38.765,0:01:40.259 ou Facebook du passé, 0:01:40.259,0:01:41.833 il faut élargir cet espace, 0:01:41.833,0:01:43.771 il faut le faire comme un rectangle. 0:01:43.771,0:01:45.281 Comment s'y prend-on ? 0:01:45.281,0:01:47.379 Une façon, c'est la numérisation. 0:01:47.395,0:01:49.174 Il y a beaucoup de matériel disponible, 0:01:49.190,0:01:55.460 des journaux, des livres imprimés, [br]des milliers de livres imprimés. 0:01:55.460,0:01:57.228 Je peux tous les numériser. 0:01:57.228,0:01:59.965 Je peux en extraire les informations. 0:01:59.965,0:02:03.508 Bien sûr, plus on retourne dans le passé, [br]moins il y a d'informations. 0:02:03.508,0:02:06.154 Ce n'est peut-être pas suffisant. 0:02:06.154,0:02:08.562 Je peux alors faire ce que font [br]les historiens. 0:02:08.562,0:02:10.086 Je peux extrapoler. 0:02:10.086,0:02:14.556 C'est ce qu'on appelle, en informatique, [br]la simulation. 0:02:14.556,0:02:16.307 Si je prends un journal de bord, 0:02:16.307,0:02:18.711 je peux estimer que ce n'est pas [br]qu'un journal de bord 0:02:18.711,0:02:21.683 d'un capitaine vénitien [br]partant vers un voyage précis. 0:02:21.683,0:02:23.326 Je peux estimer que c'est un journal de bord 0:02:23.326,0:02:25.908 représentatif d'un grand nombre [br]de voyages de cette époque. 0:02:25.908,0:02:28.153 J'extrapole. 0:02:28.153,0:02:30.191 Si j'ai la peinture d'une façade, 0:02:30.191,0:02:32.942 je peux envisager que ce n'est pas [br]que ce bâtiment en particulier, 0:02:32.942,0:02:36.874 mais qu'il partage probablement [br]la même grammaire 0:02:36.874,0:02:40.915 que d'autres bâtiments [br]dont les informations ont été perdues. 0:02:40.915,0:02:43.773 Si on veut construire [br]une machine à remonter le temps, 0:02:43.773,0:02:45.112 il faut deux choses. 0:02:45.112,0:02:47.346 Il faut des archives très grandes, 0:02:47.346,0:02:50.088 et d'excellents experts. 0:02:50.088,0:02:51.962 La machine à remonter le temps [br]de Venise, 0:02:51.962,0:02:53.767 le projet dont je vais vous parler, 0:02:53.767,0:02:56.787 est un projet commun entre l'EPFL 0:02:56.787,0:02:59.765 et l'Université de Venise Ca' Foscari. 0:02:59.765,0:03:01.930 Il y a quelque chose [br]de très particulier au sujet de Venise, 0:03:01.930,0:03:04.604 c'est que son administration est 0:03:04.604,0:03:06.798 très, très bureaucratique. 0:03:06.798,0:03:08.991 Ils ont gardé trace de tout, 0:03:08.991,0:03:11.906 presque comme Google aujourd'hui. 0:03:11.906,0:03:13.420 Aux Archives d'Etat, 0:03:13.420,0:03:15.184 il y a 80 kilomètres d'archives 0:03:15.184,0:03:17.193 retraçant chaque aspect 0:03:17.193,0:03:19.439 de la vie de Venise [br]sur plus de 1000 ans. 0:03:19.439,0:03:21.359 Il y a chaque bateau qui part, 0:03:21.359,0:03:22.435 chaque bateau qui arrive. 0:03:22.435,0:03:25.232 Il y a chaque changement [br]fait dans la ville. 0:03:25.232,0:03:28.523 Tout est là dedans. 0:03:28.523,0:03:32.431 Nous sommes en train de créer un programme [br]de numérisation de 10 ans 0:03:32.431,0:03:34.108 qui a pour objectif de transformer 0:03:34.108,0:03:35.492 ces énormes archives 0:03:35.492,0:03:37.918 en un système gigantesque d'information. 0:03:37.918,0:03:39.775 Nous avons pour type d'objectif 0:03:39.775,0:03:44.501 de pouvoir numériser 450 livres par jour. 0:03:44.501,0:03:46.748 Bien sûr, quand on numérise, [br]ce n'est pas suffisant, 0:03:46.748,0:03:48.035 car ces documents, 0:03:48.035,0:03:50.674 la plupart d'entre eux sont en latin, [br]en toscan, 0:03:50.689,0:03:52.204 en dialecte vénitien, 0:03:52.204,0:03:53.879 il faut donc les transcrire, 0:03:53.879,0:03:55.560 les traduire dans certains cas, 0:03:55.560,0:03:56.680 les indexer, 0:03:56.680,0:03:58.844 et évidemment, ce n'est pas simple. 0:03:58.844,0:04:02.688 La méthode de reconnaissance de caractère [br]optique traditionnelle, notamment, 0:04:02.688,0:04:04.112 qu'on peut utiliser [br]pour des manuscrits imprimés, 0:04:04.112,0:04:08.116 ne fonctionne pas bien [br]sur des documents écrits à la main. 0:04:08.116,0:04:10.246 La solution en fait, c'est de s'inspirer 0:04:10.246,0:04:13.147 d'un autre domaine : la reconnaissance vocale. 0:04:13.147,0:04:15.202 C'est un domaine d'une chose [br]qui semble impossible 0:04:15.202,0:04:17.739 mais qui peut être réalisée 0:04:17.739,0:04:19.933 en ajoutant simplement [br]des contraintes supplémentaires. 0:04:19.933,0:04:21.519 Si on a un très bon modèle 0:04:21.519,0:04:23.045 d'un langage utilisé, 0:04:23.045,0:04:25.131 si on a un très bon modèle d'un document, 0:04:25.131,0:04:26.563 bien structuré. 0:04:26.563,0:04:27.916 Ce sont des documents administratifs. 0:04:27.931,0:04:30.063 Ils sont bien structurés[br]la plupart du temps. 0:04:30.063,0:04:33.371 Si on divise ces immenses archives [br]en de petits sous-ensembles, 0:04:33.371,0:04:36.248 où un petit sous-ensemble [br]partage des aspects similaires, 0:04:36.248,0:04:40.279 alors il y a un chance de réussite. 0:04:42.761,0:04:45.196 Si cette étape est atteinte, [br]alors il y a autre chose : 0:04:45.196,0:04:48.718 on peut extraire des événements [br]de ces documents. 0:04:48.718,0:04:51.016 En fait, probablement [br]10 milliards d'événements 0:04:51.016,0:04:52.947 peuvent être extraits [br]de ces archives. 0:04:52.947,0:04:54.671 Et ce système d'information [br]gigantesque 0:04:54.671,0:04:56.487 peut être observé de [br]nombreuses manières. 0:04:56.487,0:04:57.855 On peut poser des questions comme : 0:04:57.855,0:05:00.615 « Qui vivait dans ce palais en 1323 ? » 0:05:00.615,0:05:02.837 « Combien coûte une dorade au marché de Realto 0:05:02.837,0:05:04.561 en 1434 ? » 0:05:04.561,0:05:06.021 « Quel était le salaire 0:05:06.021,0:05:08.066 d'un verrier à Murano 0:05:08.066,0:05:09.472 sur, disons, une décennie ? » 0:05:09.472,0:05:10.894 On peut même poser [br]des questions plus longues 0:05:10.894,0:05:13.632 car elles seront codées [br]sémantiquement. 0:05:13.632,0:05:15.772 Ce qu'on peut ensuite faire, [br]c'est de mettre tout cela dans l'espace, 0:05:15.772,0:05:17.945 car beaucoup d'informations [br]sont spatiales. 0:05:17.945,0:05:19.880 A partir de là, on peut faire des choses comme 0:05:19.880,0:05:21.993 reconstruire ce voyage extraordinaire 0:05:21.993,0:05:25.349 de cette ville qui a réussi à avoir [br]un développement durable 0:05:25.349,0:05:27.475 sur un millier d'années, 0:05:27.475,0:05:29.095 parvenant ainsi à avoir tout le temps 0:05:29.095,0:05:31.956 une forme d'équilibre avec son environnement. 0:05:31.956,0:05:33.204 On peut reconstruire ce voyage, 0:05:33.204,0:05:36.100 le visualiser de nombreuses [br]et différentes manières. 0:05:36.100,0:05:38.799 Mais bien évidemment, on ne peut pas comprendre[br]Venise seulement en la regardant. 0:05:38.799,0:05:41.195 Il faut la placer dans un contexte [br]européen plus vaste. 0:05:41.195,0:05:44.016 L'idée, c'est aussi de documenter [br]toutes les choses 0:05:44.016,0:05:46.439 qui ont fonctionné au niveau européen. 0:05:46.439,0:05:48.403 On peut aussi reconstruire le voyage 0:05:48.403,0:05:50.393 de l'empire maritime vénitien, 0:05:50.393,0:05:53.559 comment il a conquis progressivement [br]la Mer Adriatique, 0:05:53.559,0:05:57.305 comment il est devenu l'empire [br]médiéval le plus puissant 0:05:57.305,0:05:58.866 de son époque, 0:05:58.866,0:06:01.038 en prenant le contrôle de la plupart [br]des routes maritimes 0:06:01.038,0:06:03.971 de l'est au sud. 0:06:05.305,0:06:07.621 Mais on peut faire même [br]d'autres choses, 0:06:07.621,0:06:09.898 car dans ces routes maritimes, 0:06:09.898,0:06:11.873 il y a des schémas récurrents. 0:06:11.889,0:06:14.382 On peut aller plus loin 0:06:14.382,0:06:16.502 et créer un système de simulation, 0:06:16.502,0:06:19.317 créer un simulateur méditerranéen 0:06:19.317,0:06:21.910 capable de reconstruire 0:06:21.910,0:06:24.112 même les informations manquantes, 0:06:24.112,0:06:27.100 ce qui nous permettrait [br]d'avoir des questions qu'on pourrait poser 0:06:27.100,0:06:30.088 comme si on utilisait un planificateur routier. 0:06:30.088,0:06:33.159 « Si je suis à Corfou en juin 1323 0:06:33.159,0:06:35.685 et que je veux aller à Constantinople, 0:06:35.685,0:06:37.828 où puis-je prendre un bateau ? » 0:06:37.828,0:06:39.195 On peut probablement répondre [br]à cette question 0:06:39.195,0:06:43.668 avec une précision d'un, deux, ou trois jours. 0:06:43.668,0:06:45.275 « Combien ça va coûter ? » 0:06:45.275,0:06:48.867 « Quels sont les risques [br]de rencontrer des pirates ? » 0:06:48.867,0:06:50.678 Bien sûr, vous comprenez que 0:06:50.678,0:06:53.287 le défi scientifique central [br]d'un projet comme celui-ci, 0:06:53.287,0:06:57.016 c'est de qualifier, de quantifier [br]et de représenter 0:06:57.016,0:07:00.346 l'incertitude et les incohérences [br]à chaque étape du processus. 0:07:00.346,0:07:03.058 Il y a des erreurs partout, 0:07:03.058,0:07:05.547 des erreurs dans le document, [br]c'est le nom erroné du capitaine, 0:07:05.547,0:07:08.760 ou certains bateaux n'ont [br]jamais pris la mer. 0:07:08.760,0:07:13.617 Il y a des erreurs de traduction, [br]des partis pris dans l'interprétation, 0:07:13.624,0:07:17.090 et de surcroît, [br]si on ajoute les processus d'algorithme, 0:07:17.090,0:07:20.039 il y aura des erreurs dans la reconnaissance, 0:07:20.039,0:07:22.000 des erreurs dans l'extraction, 0:07:22.000,0:07:26.481 et on obtient donc des données [br]très, très incertaines. 0:07:26.481,0:07:30.238 Alors, comment peut-on détecter et [br]corriger ces incohérences ? 0:07:30.238,0:07:33.898 Comment peut-on représenter [br]cette forme d'incertitude ? 0:07:33.898,0:07:35.995 C'est difficile. Une chose qu'on peut faire, 0:07:35.995,0:07:38.221 c'est documenter[br]chaque étape du processus, 0:07:38.221,0:07:40.669 non seulement en codant [br]les informations historiques 0:07:40.669,0:07:43.348 mais aussi ce qu'on appelle les informations [br]méta-historiques, 0:07:43.348,0:07:46.011 comment les connaissances historiques [br]sont construites, 0:07:46.011,0:07:48.009 en documentant chaque étape. 0:07:48.009,0:07:49.654 Ça ne nous assure pas [br]que l'on se dirige vraiment 0:07:49.654,0:07:52.104 vers une histoire unique de Venise, 0:07:52.104,0:07:54.242 mais certainement que l'on peut [br]vraiment reconstruire 0:07:54.242,0:07:57.290 une histoire potentielle de Venise [br]complètement documentée. 0:07:57.290,0:07:58.749 Il n'y a peut-être pas une seule carte. 0:07:58.749,0:08:00.869 Il y a peut-être plusieurs cartes. 0:08:00.869,0:08:03.085 Le système devrait nous le permettre 0:08:03.085,0:08:05.944 car on doit faire face à une nouvelle [br]forme d'incertitude 0:08:05.944,0:08:10.585 qui est réellement nouvelle [br]pour ce type de base de données immenses. 0:08:10.585,0:08:12.775 Comment doit-on communiquer 0:08:12.790,0:08:16.769 sur cette nouvelle recherche[br]vers un public large ? 0:08:16.769,0:08:19.432 Encore une fois, Venise [br]est extraordinaire en la matière. 0:08:19.432,0:08:21.603 Avec ses millions de visiteurs chaque année, 0:08:21.603,0:08:23.366 elle est vraiment un des meilleurs endroits 0:08:23.366,0:08:26.354 pour essayer d'inventer le musée de l'avenir. 0:08:26.354,0:08:29.658 Imaginez, horizontalement, [br]on voit la carte reconstruite 0:08:29.658,0:08:30.944 d'une année donnée, 0:08:30.944,0:08:33.902 et verticalement, on voit le document 0:08:33.902,0:08:35.413 qui a permis la reconstruction, 0:08:35.413,0:08:38.813 des peintures, par exemple. 0:08:38.813,0:08:41.393 Imaginez un système immersif qui permet 0:08:41.393,0:08:44.895 d'aller, de plonger et de reconstruire [br]la Venise d'une année donnée, 0:08:44.895,0:08:47.610 une expérience qu'on peut partager [br]en groupe. 0:08:47.610,0:08:49.856 A l'inverse, imaginez qu'on démarre 0:08:49.856,0:08:52.063 par un document, un manuscrit vénitien, 0:08:52.063,0:08:55.112 et on montre ce qu'on peut en tirer, 0:08:55.112,0:08:56.884 comment il est décodé, 0:08:56.884,0:08:59.299 comment le contexte de ce document [br]peut être recréé. 0:08:59.299,0:09:01.184 Voici une image d'une exposition 0:09:01.184,0:09:03.460 qui se tient actuellement à Genève 0:09:03.460,0:09:05.814 avec ce genre de système. 0:09:05.814,0:09:07.989 En conclusion, on peut dire que 0:09:07.989,0:09:11.068 la recherche dans les humanités [br]est sur le point de subir 0:09:11.068,0:09:12.870 une évolution à peu près similaire 0:09:12.870,0:09:17.452 à ce qui s'est passé dans les sciences [br]de la vie il y a 30 ans. 0:09:17.452,0:09:22.128 C'est en fait une question d'échelle. 0:09:22.130,0:09:25.433 On voit des projets qui sont 0:09:25.433,0:09:29.276 bien au-delà de ce qu'une seule équipe [br]de recherche peut réaliser, 0:09:29.276,0:09:31.519 et ça, c'est vraiment nouveau [br]dans les humanités, 0:09:31.519,0:09:35.388 où on a souvent pour habitude de travailler 0:09:35.388,0:09:39.396 en petits groupes ou seulement [br]avec deux chercheurs. 0:09:39.396,0:09:41.514 Lorsqu'on visite les Archives d'Etat à Venise, 0:09:41.514,0:09:44.336 on sent que c'est au-delà [br]de ce qu'une simple équipe peut réaliser, 0:09:44.336,0:09:48.170 et qu'il faut un effort partagé et commun. 0:09:48.170,0:09:51.276 Ce qu'il faut [br]pour ce changement de modèle, 0:09:51.276,0:09:53.178 c'est promouvoir une nouvelle génération 0:09:53.178,0:09:54.715 d' « humanistes numériques » 0:09:54.715,0:09:56.805 qui seront prêts pour ce changement. 0:09:56.805,0:09:58.764 Je vous remercie beaucoup. 0:09:58.764,0:10:02.764 (Applaudissements)