YouTube

Got a YouTube account?

New: enable viewer-created translations and captions on your YouTube channel!

French subtitles

← Les conséquences à la fois merveilleuses et effrayantes des machines qui apprennent.

Get Embed Code
30 Languages

Showing Revision 59 created 08/09/2015 by eric vautier.

  1. Avant, si vous vouliez qu'un ordinateur
    fasse quelque chose de nouveau,
  2. vous deviez le programmer.
  3. La programmation, pour ceux
    d'entre vous qui n'en ont jamais fait,
  4. nécessite de décrire,
    à un niveau de détail effrayant,
  5. chaque étape que vous voulez
    que l'ordinateur fasse
  6. pour atteindre votre but.
  7. Mais si ce que vous voulez,
    vous ne savez pas le faire vous-même,
  8. la programmation devient un immense défi.
  9. C'est à ce défi que se confronta
    cet homme, Arthur Samuel.

  10. En 1956, il voulut que cet ordinateur
  11. soit capable de le battre au jeu de dames.
  12. Comment écrire un programme,
  13. décrire, en d'effrayants détails, comment
    être meilleur que vous aux dames ?
  14. Il eut une idée :
  15. faire jouer l'ordinateur contre
    lui-même des milliers de fois
  16. et lui faire apprendre à jouer aux dames.
  17. Ça a si bien fonctionné que dès 1962
  18. l'ordinateur avait battu
    le champion du Connecticut.
  19. Arthur Samuel est le père
    de la machine apprenante,

  20. et j'ai une grande dette envers lui,
  21. parce que je travaille dans ce secteur.
  22. J'ai été président de Kaggle,
  23. une communauté de 200 000 praticiens
    de l'apprentissage automatique.
  24. Kaggle met en place des compétitions
  25. pour les amener à résoudre
    des problèmes jusque là non résolus,
  26. et ça a été un succès
    des centaines de fois.
  27. De ce point de vue privilégié,
    j'ai pu découvrir
  28. beaucoup sur ce que l'apprentissage
    automatique pouvait et peut faire,
  29. et sur ce qu'il pourra faire demain.
  30. Le premier grand succès commercial,
    c'est peut-être Google.
  31. Google a montré qu'il était possible
    de trouver des informations
  32. en utilisant un algorithme,
  33. et cet algorithme est basé
    sur l'apprentissage automatique.
  34. L'apprentissage automatique a depuis connu
    beaucoup d'autres succès commerciaux
  35. Des sociétés comme Amazon ou Netflix
  36. l'utilisent pour suggérer des produits
    que vous pourriez vouloir acheter,
  37. des films que vous pourriez aimer voir.
  38. Parfois, c'en est presque effrayant.
  39. Des entreprises comme LinkedIn et Facebook
  40. vous disent parfois qui
    pourraient être vos amis
  41. et vous ne savez pas comment elles font,
  42. car elles utilisent le pouvoir
    de l'apprentissage automatique.
  43. Ces algorithmes ont appris à le faire
    à partir de données
  44. plutôt que d'être programmés manuellement.
  45. De la même manière,
    IBM a pu faire en sorte

  46. que Watson batte les champions du monde
    de « Jeopardy »,
  47. en répondant à des questions
    très difficiles comme :
  48. « Le "Lion de Nimrud" a disparu
    en 2003 du musée de cette ville »
  49. C'est aussi pourquoi nous voyons
    les premières voitures autonomes.
  50. Être capable de faire
    la différence entre, disons,
  51. un arbre et un piéton,
    est plutôt important.
  52. Nous ne savons pas écrire
    de tels programmes manuellement,
  53. mais l'apprentissage automatique
    rend la chose possible.
  54. Cette voiture a roulé
    plus de 1,6 millions de km
  55. sur des routes ordinaires,
    sans le moindre accident.
  56. Nous savons maintenant que les ordinateurs
    peuvent apprendre,

  57. et apprendre à faire des choses
  58. que nous ne savons pas
    toujours faire nous-mêmes,
  59. ou qu'ils peuvent peut-être
    faire mieux que nous.
  60. Un des cas les plus étonnants
    d'apprentissage automatique que j'ai vu
  61. s'est produit lors d'un projet de Kaggle,
  62. où une équipe dirigée par Geoffrey Hinton,
  63. de l'Université de Toronto,
  64. a gagné un concours de
    découverte de la drogue.
  65. Ce qui est extraordinaire n'est
    pas juste qu'ils aient battu
  66. tous les algorithmes de Merck ou de la
    communauté universitaire internationale,
  67. mais que personne de l'équipe n'ait de
    formation en chimie ou biologie,
  68. et qu'ils l'aient fait en deux semaines.
  69. Comment ont-ils fait ?
  70. Avec un algorithme génial
    appelé apprentissage profond.
  71. Ça a été si important
    que leur succès donna lieu
  72. à un article en une du New York Times
    quelques semaines plus tard.
  73. Il s'agit de Geoffrey Hinton,
    là, à gauche, sur l'écran.
  74. L'apprentissage profond s'inspire
    du fonctionnement du cerveau :
  75. c'est un algorithme qui n'a donc
    aucune limite théorique.
  76. Plus vous lui donnez de données,
    et de temps de calcul,
  77. plus il devient meilleur.
  78. Le New York Times montra
    aussi dans son article

  79. un autre résultat inouï
    de l'apprentissage profond,
  80. que je vais maintenant vous montrer.
  81. Il montre que les ordinateurs
    sont capables d'écouter et comprendre.
  82. (Vidéo) Richard Rashid:
    La dernière étape

  83. que je voudrais pouvoir atteindre,
  84. c'est de vous parler en chinois.
  85. L'élément-clé ici, c'est
  86. que nous avons pu collecter beaucoup
    de données auprès de nombreux sinophones
  87. et produire un système de vocalisation
  88. qui convertit du texte chinois
    en parole chinoise,
  89. puis nous avons pris environ une heure
    d'enregistrement de ma propre voix,
  90. et nous l'avons utilisé pour moduler
  91. le système de vocalisation,
    afin que la voix ressemble à la mienne.
  92. Le résultat n'est pas parfait.
  93. Il y a un certain nombre d'erreurs.
  94. (En chinois)
  95. (Applaudissements)
  96. Il y a encore beaucoup de travail à faire
  97. (En chinois)
  98. (Applaudissements)
  99. J. H. : C'était une conférence en
    Chine sur l'apprentissage automatique.

  100. Il est rare,
    lors de conférences universitaires,
  101. d'entendre des applaudissements spontanés,
  102. quoique cela arrive parfois aux
    conférences TEDx. N'hésitez pas.
  103. L'apprentissage profond était
    derrière tout ça.
  104. (Applaudissements)
    Merci.
  105. La transcription en anglais,
  106. la traduction en chinois
  107. et la construction de la voix étaient
    tous de l'apprentissage profond.
  108. L'apprentissage profond est
    cette chose extraordinaire.

  109. C'est un seul algorithme qui semble
    pouvoir presque tout faire,
  110. et j'ai découvert qu'un an plus tôt,
    il avait aussi appris à voir.
  111. Dans une obscure compétition en Allemagne,
  112. le « Test de Reconnaissance
    de Panneaux Routiers »,
  113. l'apprentissage profond a appris à
    reconnaître des panneaux,
  114. non seulement mieux
    que tous les autres algorithmes,
  115. mais également mieux
    que les humains -
  116. environ deux fois mieux :
  117. dès 2011, nous avions un exemple
  118. d'ordinateurs pouvant voir
    mieux qu'un être humain.
  119. Depuis, beaucoup de choses
    se sont passées.
  120. En 2012, Google a annoncé qu'un
    algorithme d'apprentissage profond,
  121. regardant des vidéos YouTube
  122. et analysant les données sur
    16 000 ordinateurs pendant un mois,
  123. a pu apprendre, de lui-même, les concepts
    de « chat » ou encore d'« être humain »,
  124. juste en regardant ces vidéos.
  125. Les êtres humains apprennent
    de la même manière :
  126. on n'apprend pas une chose
    par explication,
  127. mais on l'apprend par
    les perceptions individuelles.
  128. En 2012 également, Geoffrey Hinton,
    dont nous avons déjà parlé,
  129. a gagné le très réputé
    concours « ImageNet »,
  130. où il s'agit d'identifier,
    au sein d'un million et demi d'images,
  131. les images en question.
  132. En 2014, nous sommes tombés
    à un taux d'erreur de 6%
  133. en reconnaissance visuelle.
  134. C'est, de nouveau,
    mieux qu'un être humain.
  135. Les machines font vraiment
    ici un travail extraordinaire,

  136. avec, désormais, des
    applications industrielles.
  137. Par exemple, Google a annoncé l'an dernier
  138. qu'ils avaient cartographié l'ensemble
    des lieux de France en deux heures,
  139. en fournissant des images
    de Street View
  140. à un algorithme d'apprentissage profond,
    pour qu'il reconnaisse les numéros de rue.
  141. Imaginez le temps
    qu'il aurait fallu avant :
  142. des dizaines de personnes,
    plusieurs années.
  143. C'est la même histoire en Chine.
  144. Baidu est, on peut dire,
    une sorte de Google chinois.
  145. Ce que vous voyez en haut à gauche,
  146. est une photo que j'ai chargée sur le
    système d'apprentissage profond de Baidu,
  147. et, dessous, vous voyez que le système
    a compris ce qui était sur la photo,
  148. et trouvé des images similaires.
  149. Les images similaires ont le
    même arrière-plan,
  150. la tête dans le même sens,
  151. certaines même avec la langue sortie.
  152. Ce n'est pas une recherche
    sur le texte d'une page web.
  153. Je n'ai chargé qu'une image.
  154. Les ordinateurs peuvent donc désormais
    vraiment comprendre ce qu'ils voient,
  155. et consulter une base de données
  156. de centaines de millions d'images
    en temps réel.
  157. Quelles conséquences, maintenant que
    les ordinateurs peuvent voir ?

  158. Les machines ne savent pas seulement voir.
  159. L'apprentissage profond va plus loin.
  160. Une phrase complexe et
    nuancée comme celle-ci,
  161. est maintenant compréhensible
    par ces algorithmes.
  162. Comme vous pouvez le voir,
  163. ce système de Stanford,
    avec le point rouge en haut,
  164. a compris que la phrase
    comportait un jugement négatif.
  165. L'apprentissage profond est désormais
    proche des performances humaines
  166. pour comprendre le sujet d'une phrase,
    et le jugement qui y est exprimé.
  167. Il a aussi été utilisé
    pour lire le chinois,
  168. à un niveau proche de
    celui d'un locuteur natif.
  169. Cet algorithme a été développé en Suisse
  170. par des personnes dont aucune ne parlait
    ni ne comprenait le chinois.
  171. Utiliser l'apprentissage profond
  172. constitue le meilleur système
    dans ce cas,
  173. même comparé
    à la compréhension humaine.
  174. Il s'agit ici d'un système
    mis en place dans mon entreprise,

  175. qui regroupe tout ça.
  176. Ce sont des images qui ne sont
    pas liées à du texte,
  177. et, alors que j'écris ici des phrases,
  178. en temps réel, le système comprend
    les images,
  179. identifie leur sujet,
  180. et trouve des images correspondant au
    texte que j'écris.
  181. Il comprend véritablement mes phrases,
  182. et comprend véritablement ces images.
  183. Je sais que vous voyez
    ça sur Google,
  184. où l'on peut trouver des images
    en tapant un texte,
  185. mais ce n'est qu'une recherche
    dans le texte de la page web.
  186. C'est très différent de comprendre
    vraiment les images.
  187. C'est quelque chose que
    les ordinateurs n'ont pu faire
  188. pour la première fois
    que très récemment.
  189. Les ordinateurs peuvent donc
    non seulement voir, mais aussi lire,

  190. et, bien sûr, nous avons montré qu'ils
    peuvent comprendre ce qu'ils entendent.
  191. Pas très surprenant si je vous
    dis maintenant qu'ils peuvent écrire.
  192. A partir d'un algorithme d'apprentissage
    profond, j'ai généré ce texte hier.
  193. Ici, ce sont des textes générés par un
    algorithme de Stanford.
  194. Chacune de ces phrases a été générée
  195. par un algorithme d'apprentissage profond
    décrivant l'image au-dessus.
  196. Cet algorithme n'avait jamais vu un homme
    habillé en noir jouant de la guitare.
  197. Il avait vu déjà vu un homme,
    déjà vu du noir,
  198. déjà vu une guitare,
  199. mais a généré de manière autonome
    cette nouvelle description de cette photo.
  200. Nous n'atteignons pas encore
    les performances humaines, mais presque.
  201. Dans les tests réalisés, les personnes
    préfèrent la légende de l'ordinateur
  202. une fois sur quatre.
  203. Ce système n'a que deux semaines,
  204. et l'on peut supposer que d'ici un an,
  205. l'algorithme aurait surpassé
    les performances humaines
  206. - au rythme où ça va.
  207. Les ordinateurs peuvent donc aussi écrire.
  208. Si l'on rassemble tout ça, les
    perspectives deviennent prometteuses.

  209. Par exemple, en médecine,
  210. une équipe de Boston a annoncé
    qu'elle avait découvert
  211. des dizaines de nouveaux signes cliniques
  212. de tumeurs, qui aident les docteurs
    à diagnostiquer un cancer.
  213. De façon très proche, à Stanford,
  214. une équipe a annoncé qu'en
    observant des tissus au microscope,
  215. ils ont développé un système
    de machine apprenante
  216. qui est vraiment meilleur
    qu'un pathologiste
  217. pour prédire les taux de survie
    de personnes atteintes de cancer.
  218. Dans ces deux cas, non seulement
    les prévisions étaient meilleures,
  219. mais elles ont aussi permis
    des découvertes majeures.
  220. Dans l'exemple en radiologie,
  221. de nouveaux signes cliniques
    compréhensibles par l'homme.
  222. Dans l'exemple en pathologie,
  223. le système informatique a découvert
    que les cellules autour du cancer
  224. étaient aussi importantes que les cellules
    cancéreuses elles-mêmes
  225. pour porter un diagnostic,
  226. à rebours de ce qui a été enseigné
    aux pathologistes pendant des décennies.
  227. Dans ces deux cas, les systèmes
    ont été développés
  228. en associant experts médicaux et
    experts de l'apprentissage automatique,
  229. mais, depuis l'an dernier,
    un nouveau cap a été franchi.
  230. Il s'agit ici d'un exemple
    d'identification de zones cancéreuses
  231. d'un tissu humain au microscope.
  232. Ce système peut identifier ces zones
    avec plus de précisions,
  233. ou, du moins, avec autant de précision
    qu'un pathologiste,
  234. mais a été entièrement créé par
    l'apprentissage profond créé
  235. par des personnes n'ayant
    pas de formation médicale.
  236. De même, pour cette
    classification de neurones.
  237. On peut désormais classer les neurones
    avec autant de précisions qu'un humain,
  238. et ce système a été créé
    avec l'apprentissage profond,
  239. par des gens n'ayant pas de
    connaissance médicale antérieure.
  240. Moi-même, sans connaissance
    médicale antérieure,

  241. je semble être pleinement qualifié
    pour créer une entreprise dans la santé
  242. - ce que j'ai fait.
  243. J'étais terrifié à cette idée,
  244. mais, la théorie suggérait
    qu'il devait être possible
  245. d'être utile dans ce secteur en ne maniant
    que ces moyens d'analyse de données.
  246. Et, heureusement, les retours
    ont été fabuleux,
  247. ceux des médias,
    mais aussi ceux du corps médical,
  248. qui a été d'un grand soutien.
  249. La théorie, c'est que l'on peut isoler
    la partie centrale du processus médical,
  250. pour procéder, autant que possible,
    à des analyses de données,
  251. et laisser les médecins se consacrer
    sur leurs forces.
  252. Je veux vous donner un exemple.
  253. Il nous faut désormais environ 15 minutes
    pour faire un nouveau diagnostic médical,
  254. et je vais vous le montrer en temps réel,
  255. même si je l'ai réduit à trois minutes
    en supprimant certaines parties.
  256. Plutôt que de vous montrer la création
    d'un diagnostic médical,
  257. je vais vous montrer un diagnostic
    d'images de voitures :
  258. c'est quelque chose que
    tout le monde comprend.
  259. Nous commençons avec environ
    1,5 million d'images de voitures,

  260. et ce que je veux, c'est les organiser
    selon l'angle selon lequel
  261. la photo a été prise.
  262. Ces images ne sont pas cataloguées :
    je dois partir de zéro.
  263. Notre algorithme
    d'apprentissage profond
  264. permet d'identifier les structures
    dans ces images.
  265. L'être humain et l'ordinateur peuvent
    maintenant travailler ensemble.
  266. L'être humain, comme vous le voyez ici,
  267. indique à la machine
    les zones d'intérêt,
  268. celles à lesquelles il veut qu'elle
    s'intéresse pour améliorer son algorithme.
  269. Les systèmes d'apprentissage profond sont
    des espaces à 16 000 dimensions [sic],
  270. et vous pouvez voir ici l'ordinateur qui
    pivote au sein de cet espace,
  271. pour trouver de nouvelles structures.
  272. Quand il y arrive,
  273. l'être humain peut ensuite lui signaler
    les zones intéressantes.
  274. Ici, l'ordinateur a pu trouver
    une zone avec,
  275. par exemple, des angles.
  276. Au fur et à mesure,
  277. nous en disons de plus en plus
    à l'ordinateur
  278. sur le type de structures
    que l'on recherche.
  279. Imaginez un diagnostic médical,
  280. par exemple un pathologiste identifiant
    des zones malades,
  281. ou un radiologue montrant
    des nodules potentiellement inquiétants.
  282. Parfois, cela devient difficile
    pour l'algorithme.
  283. Ici, il s'est un peu emmêlé les pinceaux.
  284. L'avant et l'arrière des voitures
    sont mêlés.
  285. Nous devons faire
    un peu plus attention,
  286. et dissocier manuellement les avants
    des arrières,
  287. puis dire à l'ordinateur que
    cette classification nous importe.
  288. Nous continuons comme ça,
    et, un peu plus tard,

  289. nous allons former l'algorithme
  290. sur la base de ces classifications,
  291. et espérer qu'il s'est amélioré.
  292. Comme vous le voyez, il a commencé à
    estomper certaines photos,
  293. montrant qu'il sait déjà comment
    comprendre certaines d'entre elles.
  294. Nous pouvons ensuite utiliser ce
    concept d'images similaires,
  295. et, voir que, en s'en servant,
  296. l'ordinateur est désormais capable de
    trouver seulement les avants de voiture.
  297. A ce stade, l'être humain
    peut dire à l'ordinateur :
  298. «Ok, tu t'en es bien sorti. »
  299. Bien sûr, parfois, même à ce stade,
  300. il est encore difficile
    de faire des groupes.

  301. Ici, même après avoir laissé l'ordinateur
    pivoter pendant un moment,
  302. les photos de voitures vues de droite
    et celles vues de gauche sont
  303. encore toutes mêlées.
  304. Nous lui donnons de nouveau
    des indications,
  305. puis lui disons de chercher
    une projection qui fait le tri
  306. entre les photos de droite et de gauche -
  307. avec l'algorithme d'apprentissage profond.
  308. Avec ces indications, nous avons réussi.
  309. Il a trouvé une manière de considérer
    ces objets qui en permet le tri.
  310. Vous avez saisi l'idée.

  311. Nous ne somme pas ici dans une
    substitution de l'homme par la machine,
  312. mais dans un travail conjoint.
  313. Ce que nous faisons, c'est prendre
    quelque chose qui mobilisait une équipe
  314. de cinq ou six personnes pendant sept ans
  315. et y substituer quelque chose qui
    prend 15 minutes à une seule personne.
  316. Cette méthode nécessite quatre
    ou cinq itérations,

  317. et nous avons maintenant 62%
  318. de nos 1,5 million d'images
    classifiées correctement.
  319. A ce stade, nous pouvons
    commencer à prendre
  320. des parties entières,
  321. et vérifier rapidement
    qu'il n'y a pas d'erreurs.
  322. Quand il y a des erreurs, nous en
    informons l'ordinateur,
  323. et, en utilisant cette méthode
    pour tous les groupes,
  324. nous en arrivons à un
    taux de réussite de 80%
  325. dans la classification de ces images.
  326. A partir de là, il s'agit juste
  327. de trouver le petit nombre d'images
    mal classées,
  328. et à essayer de comprendre pourquoi.
  329. Avec cette approche,
  330. en 15 minutes, nous parvenons à un
    taux de classification de 97%.
  331. Ce type de méthode pourrait nous
    permettre de régler un problème majeur :

  332. le manque d'expertise médicale
    dans le monde.
  333. Le Forum économique mondial estime
    qu'il faudrait 10 à 20 fois plus
  334. de médecins dans les pays
    en voie de développement
  335. et qu'il faudrait 300 ans
  336. pour former suffisamment de personnes
    et régler ce problème.
  337. Imaginez alors que nous puissions
    accroître leur productivité
  338. avec ces méthodes d'apprentissage profond.
  339. Les opportunités m'enchantent.

  340. Mais les dangers m’inquiètent.
  341. Le problème, c'est que dans tous les pays
    en bleu sur la carte,
  342. le secteur tertiaire représente
    plus de 80% de l'emploi.
  343. C'est quoi le secteur tertiaire ?
  344. C'est ça.
  345. Ce sont exactement ces choses que les
    ordinateurs viennent d'apprendre à faire.
  346. 80% des emplois dans les pays développés
  347. consiste en ce qu'une machine
    sait désormais faire.
  348. Qu'est-ce que cela veut dire ?
  349. Tout ira bien.
    D'autres emplois les remplaceront,
  350. par exemple, dans l'analyse de données.
  351. Pas vraiment.
  352. Ce n'est pas long pour un analyste de
    données de construire ça.
  353. Par exemple, ces quatre algorithmes
    sont tous de la même personne.
  354. Vous pensez peut-être
    que c'est du déjà-vu,
  355. que nous connaissons les conséquences
    de l'arrivée de nouvelles choses,
  356. de nouveaux emplois qui
    remplacent les anciens.
  357. Que seront ces nouveaux emplois ?
  358. C'est très dur à estimer :
  359. l'amélioration des performances
    humaines est graduelle,
  360. tandis que ce système,
    l'apprentissage profond,
  361. s'améliore de façon exponentielle.
  362. Et nous en sommes là.
  363. En regardant autour de nous,
    nous pensons :
  364. « Les machines sont
    toujours idiotes ». Pas vrai ?
  365. Mais d'ici cinq ans, elles seront
    bien plus haut dans la courbe.
  366. Nous devons commencer à penser
    dès maintenant à ces capacités futures.
  367. Ce n'est pas la première fois, bien sûr.

  368. Les machines de la Révolution Industrielle
    augmentèrent nos capacités.
  369. Mais, au bout d'un moment,
    les choses se calmèrent.
  370. Il y eut des troubles sociaux, mais
  371. une fois les machines utilisées
    pour la plupart des cas utiles,
  372. les choses s'apaisèrent.
  373. La Révolution des Machines Apprenantes
  374. sera très différente
    de la Révolution Industrielle,
  375. parce que dans son cas, les choses
    ne se calmeront pas.
  376. Plus les ordinateurs progressent
    dans les activités cérébrales,
  377. plus ils peuvent créer de meilleurs
    ordinateurs, et progresser encore.
  378. Nous sommes devant un type d'évolution
  379. que le monde n'a jamais
    expérimentée auparavant :
  380. notre compréhension antérieure
    des possibles n'est pas adaptée.
  381. Nous en subissons déjà les impacts.

  382. Ces 25 dernières années, alors que
    la productivité du capital augmentait,
  383. la productivité du travail restait stable,
    était même légèrement en baisse.
  384. Je voudrais lancer
    ce débat dès maintenant.

  385. Je sais d'expérience que lorsque
    je parle de ça aux gens,
  386. ils peuvent être sceptiques.
  387. Les machines ne peuvent pas penser,
  388. elles n'ont pas d'émotions,
    ne comprennent pas la poésie.
  389. Nous ne comprenons pas
    comment elles fonctionnent.
  390. Et alors ?
  391. Elles peuvent dès maintenant faire
    ce pour quoi les hommes sont payés.
  392. C'est le moment de commencer
  393. à réfléchir à la façon d'ajuster nos
    structures sociales et économiques,
  394. d'être au fait de cette nouvelle réalité.
  395. Merci.
  396. (Applaudissements)