Portuguese subtitles

← As maravilhosas e aterradoras implicações de computadores que conseguem aprender

Get Embed Code
30 Languages

Showing Revision 27 created 03/30/2015 by Margarida Ferreira.

  1. Era habitual, quando queríamos
    que um computador fizesse algo novo,
  2. termos que o programar.
  3. Para aqueles que nunca programaram,
  4. a programação requer especificar
    com enorme detalhe,
  5. todos os passos que queremos
    que o computador execute
  6. para alcançarmos o nosso objetivo.
  7. Se queremos fazer algo que não
    sabemos fazer nós próprios,
  8. será um grande desafio.
  9. Este foi o desafio enfrentado
    por este homem, Arthur Samuel.

  10. Em 1965, ele queria que um computador
  11. o vencesse nas damas.
  12. Como podemos escrever um programa,
  13. com grande detalhe, que seja melhor
    do que nós nas damas?
  14. Ele teve uma ideia:
  15. pôs o computador a jogar contra
    si próprio, milhares de vezes,
  16. para aprender a jogar damas.
  17. Funcionou e, em 1962,
  18. o computador venceu o campeão
    do estado do Connecticut.
  19. Arthur Samuel foi, assim, o pai
    da aprendizagem automática

  20. e tenho uma grande dívida para com ele,
  21. porque sou um profissional
    da aprendizagem automática.
  22. Fui o presidente da Kaggle,
  23. uma comunidade de cerca de 200 000
    profissionais da aprendizagem automática.
  24. A Kaggle estabelece competições,
  25. em que se tenta resolver problemas
    ainda não resolvidos,
  26. e teve sucesso centenas de vezes.
  27. Desta posição vantajosa
    pude descobrir muito
  28. sobre o que a aprendizagem automática
    pode fazer no passado, no presente
  29. e o que poderá fazer no futuro.
  30. O primeiro grande sucesso comercial da
    aprendizagem automática foi a Google.
  31. A Google mostrou que é possível
    encontrar informação
  32. usando o algoritmo de um computador,
  33. e este algoritmo é baseado
    em aprendizagem automática.
  34. Desde então, houve muitos sucessos
    comerciais da aprendizagem automática.
  35. Empresas como a Amazon e a Netflix
  36. usam a aprendizagem automática para
    sugerir produtos que talvez compremos,
  37. filmes que talvez gostemos de ver.
  38. Por vezes, é quase assustador.
  39. Empresas como o LinkedIn e o Facebook
  40. por vezes dizem-nos quem poderão
    ser os nossos amigos
  41. e não temos ideia de como
    elas fizeram isso,
  42. porque estão a usar o poder
    da aprendizagem automática.
  43. Estes algoritmos aprenderam a fazer
    isto a partir de dados
  44. em vez de serem programados à mão.
  45. Esta foi também a razão do sucesso da IBM

  46. ao conseguir que o Watson ganhasse
    a dois campeões mundiais no "Jeopardy",
  47. respondendo a questões incrivelmente
    subtis e complexas.
  48. Esta é também a razão de podermos ver
    os primeiros carros autónomos.
  49. É bastante importante podermos distinguir
  50. uma árvore de um peão.
  51. Não sabemos como escrever
    esses programas à mão,
  52. mas isso é agora possível
    com a aprendizagem automática.
  53. Este carro conduziu mais
    de um milhão de quilómetros
  54. em estradas normais,
    sem qualquer acidente.
  55. Sabemos agora que os computadores
    conseguem aprender.

  56. Conseguem aprender a fazer coisas
  57. que nós, por vezes, não sabemos
    fazer sozinhos,
  58. ou fazem-no melhor do que nós.
  59. Um dos exemplos mais fantásticos
    da aprendizagem automática que eu vi
  60. surgiu num projeto
    que desenvolvi na Kaggle
  61. em que uma equipa liderada
    por um tipo chamado Geoffrey Hinton
  62. da Universidade de Toronto,
    venceu uma competição
  63. sobre descoberta automática
    de medicamentos.
  64. O mais extraordinário não foi terem
    vencido todos os algoritmos
  65. desenvolvidos pela Merck ou pela
    comunidade académica internacional,
  66. mas ninguém na equipa ter formação
    em química, biologia ou ciências naturais
  67. e fizeram-no em duas semanas.
  68. Como fizeram isto?
  69. Usaram um algoritmo extraordinário
    chamado aprendizagem profunda.
  70. Isso foi tão importante que saiu
    num artigo na primeira página
  71. no New York Times, algumas semanas depois.
  72. Este do lado esquerdo
    é o Geoffrey Hinton.
  73. A aprendizagem profunda é um algoritmo
    inspirado no cérebro humano.
  74. e, como resultado, é um algoritmo
  75. que não tem limitações teóricas
    em relação ao que pode fazer.
  76. Quanto mais dados e tempo
    de computação fornecermos
  77. melhor ele fica.
  78. O New York Times também
    mostrou, nesse artigo,

  79. outro resultado extraordinário
    da aprendizagem profunda
  80. que vou agora mostrar-vos.
  81. Mostra que os computadores
    conseguem ouvir e compreender
  82. (Vídeo) Richard Rashid: O último passo

  83. que quero poder dar neste processo
  84. é falar-vos em chinês.
  85. O segredo para isso
  86. é que conseguimos reunir muita
    informação de oradores chineses
  87. e produzir um sistema texto-fala
  88. que converte texto em chinês
    para a língua chinesa.
  89. Depois usámos cerca de uma hora
    da minha própria voz
  90. para modular o sistema texto-fala padrão
  91. para que falasse como eu.
  92. O resultado não é perfeito.
  93. Há ainda alguns erros.
  94. (Em chinês)
  95. (Aplausos)
  96. Há muito trabalho a fazer nesta área.
  97. (Em chinês)
  98. (Aplausos)
  99. Isto foi numa conferência sobre
    aprendizagem automática na China.

  100. Não é frequente ouvir,
    em conferências académicas,
  101. aplausos espontâneos.
  102. embora aconteça, por vezes,
    em conferências TEDx.
  103. Todo o que vimos foi devido
    a aprendizagem profunda.
  104. (Aplausos)
    Obrigado.
  105. A transcrição para inglês foi feita
    com aprendizagem profunda,
  106. assim como a tradução para chinês,
    no texto em cima, à direita,
  107. e a construção da voz.
  108. A aprendizagem profunda
    é algo extraordinário.

  109. É um único algoritmo que parece
    poder fazer quase tudo.
  110. Descobri que, um ano antes, também
    tinha aprendido a ver.
  111. Nesta competição obscura, na Alemanha,
  112. — Referência Alemã para Reconhecimento
    de Sinais de Trânsito —
  113. a aprendizagem profunda conseguiu
    reconhecer sinais de trânsito.
  114. Conseguiu reconhecer sinais de trânsito,
    melhor do que qualquer outro algoritmo,
  115. e a avaliação mostrou que era cerca de
    duas vezes melhor do que as pessoas.
  116. Por volta de 2011,
    tivemos o primeiro exemplo
  117. de computadores que conseguem
    ver melhor do que as pessoas.
  118. Desde então, muito aconteceu.
  119. Em 2012, a Google anunciou que tinham
    um algoritmo de aprendizagem profunda
  120. a observar vídeos no Youtube
  121. e a processar dados de 16 000
    computadores por mês,
  122. O computador conseguiu de forma autónoma
    aprender conceitos como pessoas e gatos
  123. apenas observando os vídeos.
  124. Isto é semelhante ao modo
    como os humanos aprendem.
  125. Não aprendem dizendo-lhes
    o que estão a ver,
  126. mas aprendendo por si
    o que estas coisas são.
  127. Também em 2012, o Geoffrey Hinton,
    que vimos antes,
  128. venceu a competição muito
    popular ImageNet,
  129. ao tentar identificar, num conjunto
    de 1,5 milhões de imagens,
  130. o que elas representavam.
  131. Em 2014, reduzimos para 6% a taxa de erro
  132. no reconhecimento de imagem.
  133. Isto é melhor do que as
    pessoas conseguem fazer.
  134. As máquinas estão realmente a fazer
    um trabalho extraordinário

  135. que está agora a ser usado na indústria.
  136. Por exemplo, a Google
    anunciou, no ano passado,
  137. que mapearam todos os locais
    de França, em duas horas.
  138. Processaram imagens de rua com um
    algoritmo de aprendizagem profunda,
  139. para que reconhecesse
    e lesse números de ruas.
  140. Imaginem quanto tempo
    isto teria demorado antes:
  141. dúzias de pessoas, durante muitos anos.
  142. Isto também está a acontecer na China.
  143. Baidu é uma espécie de
    Google chinesa, acho eu.
  144. O que veem aqui em cima, à esquerda,
    é um exemplo de uma imagem
  145. que transferi para o sistema
    de aprendizagem profunda da Baidu.
  146. Em baixo, podem ver que o sistema
    percebeu o que a imagem era
  147. e encontrou imagens semelhantes.
  148. As imagens semelhantes têm,
    na verdade, fundos idênticos,
  149. direções semelhantes das faces
  150. e algumas até com a língua de fora.
  151. Isto não é evidente no texto
    de uma página "web".
  152. Só transferi uma imagem.
  153. Temos, agora, computadores que
    compreendem realmente o que veem
  154. e que podem, por isso, procurar
    nas bases de dados
  155. de centenas de milhões
    de imagens, em tempo real.
  156. O que significa realmente os computadores
    conseguirem agora ver?

  157. Não se trata apenas de conseguirem ver.
  158. De facto, a aprendizagem profunda
    tem feito mais do que isso.
  159. Frases complexas, com nuances, como esta
  160. são agora percetíveis, com os algoritmos
    de aprendizagem profunda.
  161. Como podem ver aqui,
  162. este sistema de Stanford,
    com o ponto vermelho no topo,
  163. percebeu que esta frase expressa
    um sentimento negativo.
  164. A aprendizagem profunda está agora
    próxima do desempenho humano,
  165. na perceção do sentido das frases
    e no que diz sobre essas coisas.
  166. A aprendizagem profunda também
    tem sido usada para ler chinês,
  167. a um nível próximo de um chinês nativo.
  168. Este algoritmo foi desenvolvido na Suíça
  169. por pessoas que não falam
    nem percebem chinês.
  170. Como disse, a aprendizagem profunda
  171. é o melhor sistema do mundo para isto
  172. comparado até com a compreensão
    de um ser humano.
  173. Este é um sistema que desenvolvemos
    na minha empresa

  174. que mostra como juntar tudo isto.
  175. Estas imagens não têm texto associado.
  176. À medida que vou escrevendo estas frases
  177. estas imagens vão sendo
    compreendidas em tempo real,
  178. percebendo o que significam,
  179. e descobrindo imagens de acordo
    com o texto que vou escrevendo.
  180. Como podem ver, está de facto
    a perceber as minhas frases
  181. e a perceber estas imagens.
  182. Sei que viram algo parecido na Google,
  183. em que podem escrever coisas
    e são-vos mostradas imagens.
  184. Na realidade, o que está a fazer
    é pesquisar o vosso texto na "web".
  185. Isso é muito diferente de perceber
    realmente as imagens.
  186. Isto é algo que os computadores
    só começaram a fazer
  187. há alguns meses, pela primeira vez.
  188. Os computadores conseguem
    não apenas ver, mas também ler.

  189. Já mostrámos, claro, que conseguem
    perceber o que ouvem.
  190. Talvez não fiquem surpreendidos
    se vos disser que conseguem escrever.
  191. Aqui está um texto que gerei ontem
    com um algoritmo de aprendizagem profunda.
  192. E aqui está um texto gerado
    por um algoritmo de Stanford.
  193. Cada uma destas frases foi gerada
  194. por um algoritmo de aprendizagem profunda
    para descrever cada uma destas imagens.
  195. Este algoritmo nunca tinha visto antes um
    homem de T-shirt preta a tocar guitarra.
  196. Já tinha visto um homem e a cor preta.
  197. Já tinha visto uma guitarra.
  198. Mas gerou de forma independente
    esta nova descrição da imagem.
  199. Ainda não estamos bem ao nível do
    desempenho humano, mas perto.
  200. Em testes, os humanos preferem
    a descrição gerada pelo computador,
  201. uma em cada quatro vezes.
  202. Este sistema tem apenas duas semanas,
    por isso, provavelmente, no próximo ano,
  203. o algoritmo estará bem à frente
    do desempenho humano,
  204. tendo em conta a rapidez destas coisas.
  205. Os computadores também conseguem escrever.
  206. Juntamos tudo isto e obtemos
    oportunidades muito excitantes.

  207. Por exemplo, na medicina,
  208. uma equipa de Boston anunciou
    que descobriu
  209. dúzias de novas características de
    tumores, clinicamente relevantes,
  210. que ajudam os médicos a fazer
    prognósticos em relação a um cancro.
  211. De igual modo, em Stanford,
  212. um grupo anunciou que,
    observando tecidos ampliados,
  213. desenvolveu um sistema baseado
    na aprendizagem automática
  214. que supera os patologistas humanos
  215. na previsão de taxas de sobrevivência
    de pacientes de cancro.
  216. Em ambos os casos,
    as previsões foram mais precisas,
  217. e também geraram novas
    perspetivas científicas.
  218. No caso da radiologia,
  219. revelaram-se novos indicadores clínicos
    que os humanos podem perceber.
  220. Neste caso da patologia,
  221. o sistema computacional descobriu
    que as células em torno do cancro
  222. são tão importantes quanto
    as próprias células cancerígenas
  223. na realização de um diagnóstico.
  224. Isto é o contrário do que os patologistas
    têm aprendido ao longo de décadas.
  225. Em ambos os casos, estes sistemas
    foram desenvolvidos
  226. por especialistas médicos
    e de aprendizagem automática.
  227. No último ano, fomos também além disso.
  228. Isto é um exemplo de identificação
    de áreas cancerígenas,
  229. em tecido humano, ao microscópio.
  230. O sistema aqui apresentado consegue
    identificar essas áreas
  231. de forma mais precisa, ou tão precisa
    quanto os patologistas humanos,
  232. mas foi construído com aprendizagem
    profunda, sem conhecimentos médicos,
  233. por pessoas sem formação na área.
  234. De modo semelhante, nesta
    segmentação neuronal.
  235. Podemos agora segmentar neurónios
    de forma tão precisa quanto um humano,
  236. mas este sistema foi desenvolvido
    com aprendizagem profunda
  237. com pessoas sem formação
    prévia em medicina.
  238. Eu próprio, sendo alguém sem
    formação prévia em medicina

  239. sou perfeitamente qualificado para abrir
    uma nova empresa médica,
  240. Foi o que fiz.
  241. Estava aterrorizado em relação a isso
  242. mas a teoria sugeria ser possível
  243. fazer medicina muito útil usando apenas
    estas técnicas de análise de dados.
  244. Felizmente, a resposta
    tem sido fantástica.
  245. Não apenas dos "media", mas também
    da comunidade médica,
  246. que tem dado muito apoio.
  247. A teoria é que podemos considerar
    a fase intermédia do processo médico
  248. e transformá-la em análise de dados,
    tanto quanto possível,
  249. deixando os médicos fazer
    aquilo em que são bons.
  250. Quero dar-vos um exemplo.
  251. Bastam 15 minutos para gerar um novo
    teste diagnóstico médico.
  252. Vou mostrar-vos agora em tempo real,
  253. mas comprimi para três minutos,
    cortando algumas partes.
  254. Em vez de vos mostrar a criação de um
    novo teste diagnóstico médico,
  255. vou mostrar-vos um teste diagnóstico
    de imagens de carros,
  256. porque é algo fácil de perceber.
  257. Começamos com cerca de 1,5 milhões
    de imagens de carros.

  258. Quero criar algo que consiga dividi-las
  259. segundo o ângulo em que a foto foi tirada.
  260. Estas imagens não estão catalogadas,
    tenho de começar do zero.
  261. Com o nosso algoritmo,
  262. podem identificar-se automaticamente
    áreas de estruturas nestas imagens.
  263. O interessante é o homem e o computador
    poderem agora trabalhar em conjunto.
  264. O humano, como podem ver aqui,
  265. está a dizer ao computador
    quais as áreas de interesse
  266. que quer que o computador use
    para melhorar o seu algoritmo.
  267. Estes sistemas de aprendizagem profunda
    estão em espaços de dimensão 16 000.
  268. Podem ver aqui o computador a rodar
    isto através desse espaço,
  269. tentando encontrar novas
    áreas de estrutura.
  270. Quando consegue fazê-lo com sucesso,
  271. o humano que está a comandá-lo
    pode indicar áreas de interesse.
  272. Aqui o computador encontrou
    áreas, com sucesso.
  273. Ângulos, por exemplo.
  274. Ao longo deste processo,
  275. vamos dizendo mais coisas ao computador
  276. sobre o tipo de estruturas que procuramos.
  277. Podem imaginar que, num diagnóstico,
    isto seria o patologista a identificar
  278. áreas patológicas, por exemplo.
  279. Ou o radiologista a indicar nódulos
    potencialmente problemáticos.
  280. Por vezes pode ser difícil,
    para o algoritmo.
  281. Neste caso, ficou algo confuso.
  282. As frentes e as traseiras dos carros
    estão todas misturadas.
  283. Aqui temos que ser um
    pouco mais cuidadosos,
  284. selecionado manualmente estas frentes
    por oposição às traseiras,
  285. dizendo depois ao computador
    que isto é o tipo de grupo
  286. em que estamos interessados.
  287. Fazemos isto durante algum tempo,
    avançamos um pouco,

  288. e depois treinamos o algoritmo
    de aprendizagem automática,
  289. baseados nestas centenas de coisas,
  290. e esperamos que fique bastante melhor.
  291. Podem ver que algumas imagens
    estão a começar a desvanecer,
  292. mostrando-nos que já está a descobrir
    como perceber algumas destas sozinho.
  293. Podemos, então, usar o conceito
    de imagens semelhantes.
  294. Usando imagens semelhantes,
    podemos ver que o computador
  295. é capaz, neste ponto, de identificar
    apenas as frentes dos carros.
  296. Neste ponto, o humano pode
    dizer ao computador:
  297. "Fizeste aqui um bom trabalho!"
  298. Por vezes, claro, mesmo neste ponto,

  299. ainda é difícil distinguir os grupos.
  300. Neste caso, mesmo depois de deixarmos o
    computador rodar isto durante algum tempo,
  301. ainda vemos que as imagens
    dos lados esquerdo e direito
  302. estão todas misturadas.
  303. Podemos dar, de novo, algumas
    pistas ao computador.
  304. Dizemos: "Tenta descobrir uma
    projeção que separe,
  305. "o lado esquerdo do direito,
    o mais possível,
  306. "usando este algoritmo
    de aprendizagem profunda."
  307. Dando-lhe esta pista, ele tem sucesso.
  308. Conseguiu descobrir um modo
    de pensar neste objetos
  309. que permitiu separá-los.
  310. Percebem a ideia.

  311. Neste caso, o humano não está
    a ser substituído pelo computador.
  312. Estão a trabalhar em conjunto.
  313. O que estamos a fazer é substituir
    algo que exigia uma equipa
  314. de cinco ou seis pessoas,
    durante sete anos,
  315. por algo que demora 15 minutos,
  316. com uma pessoa a trabalhar sozinha.
  317. Este processo demora
    quatro ou cinco iterações.

  318. Podem ver que temos agora 62%
  319. dos nossos 1,5 milhões de imagens,
    classificadas corretamente.
  320. Neste ponto, podemos começar rapidamente
  321. a trabalhar grandes secções,
  322. e a verificar se não há erros.
  323. Se houver erros, podemos fazer
    com que o computador o saiba.
  324. Usando este processo, para cada
    um dos diferentes grupos,
  325. temos agora uma taxa
    de sucesso de 80%,
  326. na classificação de 1,5 milhões
    de imagens.
  327. Neste ponto, trata-se de descobrir
  328. as poucas que não estão
    classificadas corretamente,
  329. e tentar perceber porquê.
  330. Utilizando esta abordagem
  331. conseguimos uma taxa de classificação
    de 97% em 15 minutos.
  332. Esta técnica pode permitir-nos
    resolver um grande problema

  333. que é a falta de especialistas
    médicos no mundo.
  334. O Fórum Económico Mundial refere
    que há 10 a 20 vezes menos médicos
  335. do que o necessário,
    nos países em desenvolvimento.
  336. E que serão necessários 300 anos
  337. para formar as pessoas necessárias
    para resolver o problema.
  338. Imaginem que podemos ajudar
    a melhorar a sua eficiência
  339. usando esta abordagem
    de aprendizagem profunda.
  340. Estou muito entusiasmado
    com as oportunidades,

  341. mas também estou preocupado
    em relação aos problemas.
  342. O problema é que as áreas
    a azul, neste mapa,
  343. são locais onde os serviços representam
    mais de 80% dos empregos.
  344. O que são os serviços?
  345. Isto são serviços.
  346. São também as coisas que
    os computadores aprenderam a fazer.
  347. 80% dos postos de trabalho,
    no mundo desenvolvido,
  348. são coisas que os computadores
    aprenderam a fazer.
  349. O que significa isto?
  350. Não há problema. Serão substituídos
    por outros empregos.
  351. Por exemplo, haverá mais empregos
    para especialistas em dados.
  352. Bem, não exatamente.
  353. Os especialistas não demoram muito
    tempo a construir estas coisas.
  354. Estes quatro algoritmos foram
    desenvolvidos pela mesma pessoa.
  355. Se pensarmos bem, isto já aconteceu antes.
  356. Já vimos, no passado, o resultado
    de surgirem coisas novas
  357. que são substituídas por novos empregos.
  358. O que serão estes novos empregos?
  359. É muito difícil fazermos previsões,
  360. porque o desempenho humano
    cresce a um ritmo gradual,
  361. mas temos agora um sistema
    de aprendizagem profunda,
  362. cuja capacidade cresce exponencialmente.
  363. Estamos neste ponto.
  364. Atualmente, vemos as coisas
    à nossa volta e pensamos:
  365. "Os computadores ainda são muito burros."
  366. Mas em cinco anos os computadores
    estarão fora deste gráfico.
  367. Temos que começar já
    a pensar nesta capacidade.
  368. É claro que já vimos isto.

  369. Na Revolução Industrial,
  370. vimos uma grande avanço na capacidade,
    graças às máquinas.
  371. A questão é que, passado algum tempo,
    as coisas estabilizaram.
  372. Houve ruturas sociais.
  373. Mas quando as máquinas foram usadas
    para gerar poder em todas as situações,
  374. as coisas acalmaram.
  375. A Revolução da Aprendizagem Automática
    será muito diferente

  376. da Revolução Industrial,
  377. porque a Revolução da Aprendizagem
    Automática nunca estabilizará.
  378. Quanto melhores forem os computadores
    em atividades intelectuais,
  379. melhores computadores se construirão,
    com mais capacidades intelectuais.
  380. Isto será um tipo de mudança
  381. que o mundo nunca presenciou antes.
  382. A nossa perceção do que é
    possível é diferente.
  383. Isto já está a afetar-nos.

  384. Nos últimos 25 anos, à medida que a
    produtividade do capital aumentou,
  385. a produtividade laboral manteve-se,
    na verdade até desceu um pouco.
  386. Quero que tenhamos esta discussão agora.

  387. Sei que, quando falo disto às pessoas,
  388. elas mostram algum desdém.
  389. "Os computadores não conseguem pensar."
  390. "Eles não se emocionam,
    nem percebem poesia."
  391. "Não percebemos, na verdade,
    como funcionam."
  392. E depois?
  393. Os computadores conseguem
    fazer as coisas
  394. que os humanos são pagos para fazer,
    na maior parte do seu tempo.
  395. Este é o tempo para começar a pensar
  396. como vamos ajustar as nossas
    estruturas sociais e económicas
  397. para fazer face a esta nova realidade.
  398. Obrigado.
  399. (Aplausos)