Notre monde se transforme de multiples façons et un des éléments qui auront un impact important sur notre avenir est l'intelligence artificielle, IA, à l'origine d'une nouvelle révolution industrielle. Les révolutions industrielles précédentes ont rehaussé la force mécanique de l'homme mais cette révolution-ci, la deuxième ère de la machine, va rehausser nos capacités cognitives, notre force mentale. Les ordinateurs ne vont plus se limiter à remplacer le travail manuel, ils vont aussi s'emparer du travail intellectuel. Où en sommes-nous aujourd'hui ? Vous avez probablement entendu parler en mars dernier [2016] du système d'apprentissage automatique appelé AlphaGo qui a utilisé l'apprentissage profond pour vaincre le champion du monde de go. Le go est un ancien jeu chinois bien plus complexe à maîtriser pour un ordinateur que les échecs. Comment cela fut-il possible maintenant, après des décennies de recherche en IA ? On a entraîné AlphaGo à jouer au go. D'abord, en observant encore et encore des dizaines de millions de mouvements de joueurs humains très doués. Ensuite, en le faisant jouer des millions de parties contre lui-même. L'apprentissage automatique est une méthode d'apprentissage par l'exemple. Les ordinateurs apprennent des données. L'apprentissage automatique est devenu un élément clé pour emmagasiner de la connaissance dans les ordinateurs. C'est fondamental car la connaissance conduit à l'intelligence. Intégrer la connaissance dans les ordinateurs s'est avéré être le défi dans les approches précédentes de l'IA. Pourquoi ? Il y a de nombreuses choses que nous savons intuitivement. Nous sommes donc incapables de les communiquer verbalement. Nous n'avons pas un accès conscient à ce savoir intuitif. Comment programmer un ordinateur sans connaissance ? Comment résoudre ça ? La solution est de faire apprendre aux machines ce savoir par elles-mêmes, comme nous le faisons. C'est important car la connaissance conduit à l'intelligence. Ma mission est de contribuer à la découverte et à la compréhension des principes qui soutiennent l'intelligence par l'apprentissage. Qu'il s'agisse de l'apprentissage par l'animal, l'homme ou la machine. Avec d'autres, je suis convaincu qu'il y a quelques principes fondamentaux comme les lois de la physique. Des principes simples capables d'expliquer notre propre intelligence et de nous aider à concevoir des machines intelligentes. Prenez par exemple les lois de l'aérodynamique : suffisamment générales pour expliquer le vol des oiseaux et des avions. Ne serait-ce pas incroyable de découvrir des principes simples mais puissants qui expliqueraient l'intelligence, rien de moins ? Nous avons fait des progrès. Mes collaborateurs et moi avons contribué à révolutionner l'IA ces dernières années avec nos recherches sur les réseaux neuronaux et l'apprentissage profond, une approche de l'apprentissage automatique inspirée du cerveau. Tout a commencé avec la reconnaissance vocale dans vos téléphones avec les réseaux neuronaux depuis 2012. Peu après, on a fait des avancées dans la vision par ordinateur. Les ordinateurs sont devenus assez bons pour reconnaître le contenu d'images. Ils sont même proches des performances de l'homme depuis cinq ans environ. Un ordinateur a atteint le niveau de compréhension intuitif de l’apparence visuelle d’un plateau de go comparable à celui des meilleurs joueurs humains. Plus récemment, et suite à des découvertes réalisées dans mon labo, l’apprentissage profond est exploité pour traduire d’une langue vers une autre et cela va bientôt apparaître dans Google Traduction. Ceci élargit les capacités des machines à comprendre et générer un langage naturel. Mais ne vous laissez pas aveugler ! Nous sommes encore très loin d’une machine aussi capable qu’un être humain d’apprendre à maîtriser les nombreux aspects de notre monde. Prenons un exemple. Même un enfant de deux ans est capable d’apprendre des choses d’une manière que les ordinateurs ne peuvent pas encore reproduire. Un enfant de deux ans a une compréhension intuitive de la physique. Il sait qu’en lâchant une balle, celle-ci va tomber. Quand il renverse du liquide, il s’attend au résultat final. Ses parents n’ont pas besoin de lui expliquer la loi de Newton ou les équations différentielles. L’enfant apprend seul ces choses, sans supervision. L’apprentissage sans supervision reste un des défis cruciaux de l’IA. Ça pourrait requérir plusieurs décennies de recherche fondamentale pour dénouer ce nœud. L’apprentissage sans supervision cherche à traduire des données en représentation. Je vais illustrer cela pour vous. Imaginez regarder, avec vos yeux, une page sur votre écran. L’ordinateur voit ça comme une image, un amas de pixels. Pour répondre à une question sur le contenu de cette image, vous avez besoin de comprendre sa signification de haut-niveau. La signification de haut niveau correspond au plus haut niveau cognitif de représentation dans le cerveau. À un niveau bas, on a la signification individuelle des mots et plus bas encore, on a les signes qui composent les mots. Ces signes peuvent être représentés de diverses manières, avec des traits différents qui les composent. Ces traits sont composés par des arêtes et ces arêtes sont composées de pixels. Il s’agit donc de différents niveaux de représentation. Toutefois, les pixels seuls ne sont pas suffisants pour faire sens de l’image, pour répondre à la question de haut niveau sur le contenu de la page. Votre cerveau possède ces différents niveaux de représentation depuis les neurones dans la zone visuelle du cortex, V1, qui reconnaît les arêtes. Ensuite, les neurones dans la deuxième région visuelle du cortex, V2, reconnaissent les traits et les petites formes. Plus haut, des neurones détectent les parts constitutives des objets et ensuite les objets et un paysage dans son intégralité. Quand on entraîne les réseaux neuronaux à reconnaître des images, ils sont capables de découvrir ces niveaux de représentation d’une manière correspondant à ce que nous observons dans le cerveau. Les réseaux neuronaux biologiques, qui existent dans notre cerveau, et les réseaux neuronaux profonds, que nous entraînons sur nos machines, peuvent apprendre à transformer un niveau de représentation en le suivant, les niveaux les plus élevés correspondant à des notions progressivement abstraites. Prenons un exemple : la notion abstraite de la lettre A peut être rendue de diverses manières aux niveaux les plus bas, autant de manières que de configurations différentes de pixels selon leur position, leur rotation ou leur police. Comment apprenons-nous ces hauts niveaux de représentation ? Un des modes qui rencontrent du succès jusqu'à présent dans les applications d'apprentissage profond est un mode appelé apprentissage supervisé. Le principe de ce mode est que l'humain prend l'ordinateur par la main et lui donne les réponses à un grand nombre de questions. Par exemple, les hommes doivent dire à la machine pour des millions d'images que sur cette image-ci, on a un chat. Sur cette image-là, on a un chien. Et sur cette autre image, un ordinateur. Sur cette image, c'est un clavier, et ainsi de suite, des millions de fois. C'est un processus douloureux et on a recours au crowdsourcing. Même si ce mode est très puissant et nous permet de résoudre de nombreux problèmes intéressants, l'homme est bien plus fort et peut apprendre davantage d'aspects différents du monde de façon autonome, comme l'enfant qui a une compréhension intuitive de la physique. L'apprentissage non supervisé pourrait aider à aborder la conduite autonome. Je veux dire en fait que l'apprentissage non supervisé permet aux machines de se projeter dans l'avenir pour générer des futurs plausibles conditionnés par la situation actuelle. Ceci permet aux ordinateurs de raisonner, anticiper et planifier. Même pour des circonstances pour lesquelles ils n'ont pas été entraînés. C'est important car avec l'apprentissage supervisé, nous devrons expliciter aux ordinateurs toutes les circonstances dans lesquelles peut se trouver un véhicule et comment un humain réagirait pour chacune d'elles. Comment ai-je appris à ne pas conduire dangereusement ? Ai-je dû mourir mille fois dans un accident ? (Rires) C'est pourtant ainsi que nous entraînons les machines actuellement. Donc, elles ne vont pas voler ou ne pas rouler. (Rires) Nous devons donc entraîner nos modèles à devenir capables de générer des images ou des futurs plausibles, à être créatifs. On fait des progrès dans ce domaine. Nous entraînons ces réseaux neuronaux profonds à transiter d'une signification de haut niveau vers le pixel plutôt que l'inverse, de traverser les niveaux de représentation dans l'autre direction. Ainsi, l'ordinateur peut générer des images qui sont nouvelles et différentes de ce qu'il a déjà vu auparavant pendant son apprentissage, mais qui sont plausibles et ressemblent à des images naturelles. On peut également utiliser ces images pour rêver des images étranges, parfois même effrayantes, comme nos propres rêves et cauchemars. Voici quelques images synthétisées par un ordinateur en utilisant ces modèles d'apprentissage profond. Cela ressemble à des images naturelles mais un observateur attentif décèlera qu'il s'agit d'autre chose et qu'il manque à ces images des détails importants pour rendre ces illustrations naturelles à nos yeux. Il y a environ 10 ans, l'apprentissage non supervisé a joué un rôle crucial dans l'avancée que nous avons réalisée dans l'apprentissage profond. Seuls quelques rares laboratoires s'y intéressaient, dont le mien, à une époque où les réseaux neuronaux n'étaient pas répandus. La communauté scientifique les avait presque abandonnés. Mais les choses ont beaucoup changé. C'est devenu un domaine très concurrentiel. Des centaines d'étudiants envoient leur candidature pour continuer leurs études avec les collaborateurs de mon laboratoire. Aujourd'hui, Montréal attire la plus grande concentration académique de chercheurs dans l'apprentissage profond dans le monde. Nous venons d'obtenir un financement de recherche de 94 millions de dollars pour repousser les frontières de l'IA et de la science des données et pour transférer vers l'industrie les technologies issues de l'apprentissage profond et de la science des données. Des entrepreneurs y trouvent une source d'émulation et créent des start-ups ou des laboratoires industriels souvent proches des universités. Par exemple, nous venons d'annoncer il y a quelques semaines le lancement d'une start-up appelée : « Element AI » qui se concentre sur les applications d'apprentissage profond. Il n'y a pas assez de spécialistes en apprentissage profond. Les salaires sont extravagants, conduisant de nombreux anciens collègues à accepter des offres généreuses d'entreprises pour travailler dans leurs laboratoires. J'ai toutefois décidé de rester à l'université, de travailler pour le bien public, de travailler avec les étudiants, de rester indépendant et de montrer la voie à la nouvelle génération de spécialistes en apprentissage profond. Au-delà de la valeur commerciale de l'IA, nous réfléchissons à ses implications sociales. Nous sommes nombreux à nous intéresser aux applications qui créent de la valeur sociale, comme la santé. Nous pensons pouvoir utiliser l'apprentissage profond pour améliorer les traitements et vraiment personnaliser la médecine. Je suis convaincu qu'à l'avenir, la collecte de données sur des milliards de personnes dans le monde nous permettra d'offrir un conseil médical à des milliards de personnes qui n'ont pas encore accès aux soins de santé. On peut imaginer beaucoup d'autres applications avec une valeur sociale. Par exemple, notre laboratoire va prochainement sortir un produit lié à la compréhension du langage naturel qui offre une palette de services comme des services légaux, à ceux qui ne peuvent pas se le permettre. Nous nous intéressons aussi aux implications sociales de l'IA dans ma communauté. Mais cette question ne devrait pas intéresser seulement les spécialistes. En dépit des mathématiques et du jargon, les citoyens peuvent suffisamment appréhender ce qu'il se passe sous le capot pour participer aux décisions fondamentales qui seront prises prochainement et dans les décennies à venir au sujet de l'IA. Je vous invite donc à mettre de côté vos peurs et à ménager un peu d'espace pour vous renseigner. Avec mes collaborateurs, nous avons écrit plusieurs articles d'introduction et un livre intitulé : « L'apprentissage profond » pour inciter étudiants et ingénieurs à s'engager dans ce domaine passionnant. Il y a aussi de nombreuses ressources en ligne : logiciels, tutoriels ou vidéos. De nombreux étudiants étudient ce domaine de recherche sur l'apprentissage profond de manière autodidacte afin de rejoindre des laboratoires comme le mien. L'impact de l'IA sur notre société sera important. Il est donc crucial de se demander : qu'allons-nous en faire ? Des bénéfices incalculables peuvent en émaner comme des impacts négatifs : des applications militaires ou des changements disruptifs sur le marché de l'emploi. Pour nous assurer que les choix collectifs qui seront pris au sujet de l'IA dans les années à venir soient bénéfiques à tous, tous les citoyens doivent devenir les protagonistes pour définir comment l'IA va modeler notre avenir. Merci. (Applaudissements)