Portuguese, Brazilian subtitles

← As maravilhosas e aterradoras implicações de computadores que conseguem aprender

Get Embed Code
30 Languages

Showing Revision 104 created 02/08/2015 by Elena Crescia.

  1. Antigamente se você quisesse que um
    computador fizesse algo novo,
  2. você teria que programar.
  3. Pois então, para quem aqui
    que nunca fez isso,
  4. programação é algo que requer
    estabelecer com riqueza de detalhe
  5. cada passo do que você quer
    que o computador faça
  6. para atingir o seu objetivo.
  7. Se você quiser fazer algo que
    ainda não sabe fazer sozinho,
  8. isso se torna um grande desafio.
  9. E esse foi o desafio enfrentado
    por este homem, Arthur Samuel.

  10. Em 1956 ele queria que esse computador
  11. fosse capaz de vencê-lo no jogo de damas.
  12. Como você faz para escrever um programa,
  13. estabelecer com riqueza de detalhe,
    que ele jogue damas melhor que você?
  14. Então ele teve uma ideia:
  15. ele fez o computador jogar
    contra si próprio milhares de vezes
  16. para aprender a jogar damas.
  17. E realmente funcionou,
    de fato em 1962
  18. esse computador venceu
    o campeão estadual de Connecticut.
  19. Arthur Samuel foi o pai
    do aprendizado de máquina,

  20. e eu devo muito a ele,
  21. porque eu sou um profissional
    de aprendizado de máquina.
  22. Eu fui o presidente da Kaggle,
  23. uma comunidade de mais de 200 mil
    profissionais dessa área.
  24. A Kaggle organiza competições
  25. para tentar resolver problemas
    até então sem solução,
  26. e tem sido bem sucedida
    centenas de vezes.
  27. Então desse ponto de vista,
    eu pude descobrir muito
  28. sobre o que o aprendizado de máquina
    conseguiu no passado, hoje,
  29. e o que poderia fazer no futuro.
  30. Talvez o primeiro grande sucesso comercial
    de aprendizado de máquina foi o Google.
  31. O Google mostrou que é possível
    encontrar informação
  32. usando um algoritmo de computador,
  33. e esse algoritmo é baseado
    no aprendizado de máquina.
  34. Desde então houve muitos casos de sucesso
    comercial de aprendizado de máquina.
  35. Empresas como Amazon e Netflix
  36. usam aprendizado de máquina para sugerir
    produtos que você poderia querer,
  37. filmes que você poderia querer assistir.
  38. Às vezes é quase assustador.
  39. Empresas como LinkedIn e Facebook
  40. às vezes te dirão quem deveria
    ser seu amigo
  41. e você não tem ideia de como,
  42. e isso é porque está usando
    o poder do aprendizado de máquina.
  43. São algoritmos que aprenderam
    como fazer isso a partir de dados
  44. ao invés de serem programados à mão.
  45. Foi assim que a IBM foi bem sucedida

  46. em fazer que Watson vencesse
    dois campeões mundiais em Jeopardy,
  47. respondendo questões incrivelmente
    sutis e complexas como essa:
  48. ["O antigo 'Leão de Nimrud' desapareceu
    do museu nacional dessa cidade em 2003
    (junto com um monte de outras coisas)"]
  49. Também por isso que agora vemos
    os primeiros carros auto-guiados.
  50. Se você quiser poder diferenciar entre, digamos,
  51. uma árvore e um pedestre,
    bem, isso é muito importante.
  52. Não sabemos como escrever
    esses programas à mão,
  53. mas com o aprendizado de máquina
    isso agora é possível.
  54. De fato esse carro já dirigiu
    mais de um milhão de quilômetros
  55. sem qualquer acidente em estradas normais.
  56. Pois bem, agora sabemos que
    computadores conseguem aprender,

  57. e podem aprender a fazer coisas
  58. que inclusive nós mesmos
    não sabemos fazer,
  59. ou então fazer melhor que nós.
  60. Um dos exemplos mais surpreendentes
    de aprendizado de máquina que eu já vi
  61. aconteceu num projeto
    que eu organizei na Kaggle
  62. onde um time coordenado por alguém
    chamado Geoffrey Hinton
  63. da Universidade de Toronto
  64. venceu a competição de
    descoberta automática de fármacos.
  65. O extraordinário aqui não é apenas
    que eles bateram
  66. todos os algoritmos desenvolvidos pela
    Merck ou a comunidade acadêmica,
  67. mas que ninguém no time tinha qualquer
    antecedente em biologia ou química,
  68. e fizeram isso em duas semanas.
  69. Como eles fizeram isso?
  70. Usaram um algoritmo singular
    chamado aprendizado profundo.
  71. Isso foi tão importante que de fato
    o sucesso foi noticiado
  72. no The New York Times num artigo
    de página frontal semanas depois.
  73. Esse é Geoffrey Hinton,
    aqui no lado esquerdo.
  74. Aprendizado profundo é um algoritmo
    inspirado no cérebro humano,
  75. ou seja, é um algoritmo
  76. que não tem limitações teóricas
    para o que pode fazer.
  77. Quanto mais dados e tempo você der a ele,
  78. melhor ele fica.
  79. O The New York Times mostrou
    nesse artigo também

  80. outro resultado singular do
    aprendizado profundo
  81. que eu vou mostrar para vocês agora.
  82. Mostra que os computadores
    conseguem escutar e entender.
  83. (Vídeo) Richard Rashid:
    Agora, o último passo

  84. que eu pretendo dar nesse processo
  85. é realmente falar com vocês em chinês.
  86. A chave aqui é que
  87. conseguimos levantar uma vasta quantidade
    de informação de muitos falantes do chinês
  88. e produzir um sistema texto-para-fala
  89. que pega o texto em chinês e
    converte para a linguagem chinesa,
  90. e então pegamos mais ou menos uma hora
    da minha própria voz
  91. e usamos para modular
  92. o sistema texto-para-fala padrão
    para que possa parecer a minha voz.
  93. O resultado não é perfeito.
  94. Na verdade há alguns erros.
  95. (Em chinês)
  96. (Aplausos)
  97. Há muito trabalho pela frente nessa área.
  98. (Em chinês)
  99. (Aplausos)
  100. J. Howard: Isso foi num congresso
    de aprendizado de máquina na China.

  101. Na verdade não é comum escutar aplausos
  102. espontâneos em congressos acadêmicos,
  103. embora obviamente às vezes acontecer
    em conferências TEDx, fiquem à vontade.
  104. Tudo que vocês viram lá aconteceu
    com aprendizado profundo.
  105. (Aplausos) Obrigado.
  106. A transcrição em inglês foi
    aprendizado profundo.
  107. A tradução para chinês e o texto na
    direita superior, também,
  108. e a construção da voz também
    foi aprendizado profundo.
  109. Então, aprendizado profundo é
    essa coisa extraordinária.

  110. É um único algoritmo que parece
    fazer quase tudo,
  111. e um ano antes eu descobri que
    ele também aprendeu a ver.
  112. Nessa competição desconhecida
    alemã, chamada
  113. Modelo de Reconhecimento de
    Sinais de Trânsito Alemães
  114. aprendizado profundo aprendeu a
    reconhecer sinais de trânsito como esse.
  115. Não apenas conseguiu reconhecer os sinais
  116. melhor que qualquer outro algoritmo,
  117. o ranking na verdade mostrou que
    era melhor do que gente,
  118. quase duas vezes melhor do que gente.
  119. Então em 2011 tivemos o primeiro exemplo
  120. de computadores que conseguem ver
    melhor do que pessoas.
  121. Desde então muito aconteceu.
  122. Em 2012 Google anunciou que havia
    um algoritmo de aprendizado profundo
  123. assistindo vídeos do YouTube
  124. e remoendo os dados em 16 mil
    computadores por mês,
  125. e o computador aprendeu sozinho
    conceitos como pessoas e gatos
  126. apenas assistindo aos vídeos.
  127. É desse jeito que os humanos aprendem.
  128. Os humanos não aprendem com alguém
    explicando o que viram,
  129. aprendem por si próprios.
  130. Também em 2012, Geoffrey Hinton,
    a quem vimos antes,
  131. venceu a conhecida competição ImageNet,
  132. tentando descobrir a partir de
    um milhão e meio de imagens
  133. o que elas retratam.
  134. A partir de 2014 estamos
    com uma taxa de erro de 6%
  135. em reconhecimento de imagem.
  136. De novo, isso é melhor que gente.
  137. Então, máquinas estão fazendo
    um ótimo trabalho

  138. e agora está sendo usado na indústria.
  139. Por exemplo, o Google anunciou ano passado
  140. que mapearam cada local
    da França em duas horas,
  141. e fizeram isso fornecendo imagens das ruas
  142. para o algoritmo de aprendizado profundo
    reconhecer e ler os números das ruas.
  143. Imaginem quanto levaria
    do jeito que era antes:
  144. dúzias de pessoas, muitos anos.
  145. Também está acontecendo na China.
  146. Baidu é tipo o Google chinês, eu acho,
  147. e o que vocês podem ver acima à esquerda
  148. é um exemplo de uma imagem que eu subi ao
    sistema de aprendizado profundo do Baidu,
  149. e abaixo você pode ver que o sistema
    entendeu que imagem é
  150. e encontrou imagens similares.
  151. As imagens similares de fato
    têm fundos similares,
  152. direções de rostos similares,
  153. algumas até com a língua para fora.
  154. Claramente não está olhando
    para o texto da página.
  155. Tudo que eu forneci foi uma imagem.
  156. Agora temos computadores que
    realmente entendem o que veem
  157. e então buscam em bancos de dados
  158. de centenas de milhões
    de imagens em tempo real.
  159. Então o que significa o fato dos
    computadores conseguirem ver?

  160. Bem, não é só que conseguem ver.
  161. De fato, o aprendizado profundo fez mais.
  162. Frases matizadas e complexas
    como esta agora são
  163. compreensíveis com algoritmos
    de aprendizado profundo.
  164. Como vocês podem ver aqui,
  165. esse sistema de Stanford com
    o ponto vermelho acima
  166. descobriu que esta frase expressa
    um sentimento negativo.
  167. Na verdade o aprendizado profundo
    está alcançando a performance humana
  168. ao entender sobre o que as frases são e
    o que dizem sobre as coisas.
  169. Além disso o aprendizado profundo
    é usado para ler chinês,
  170. de novo no nível do falante nativo.
  171. Esse algoritmo, desenvolvido na Suíça
  172. por pessoas que não falam chinês.
  173. Como eu digo, usar aprendizado profundo
  174. é o melhor sistema no mundo para isso,
  175. até mesmo comparando ao entendimento
    do humano nativo.
  176. Esse é um sistema que montamos
    na minha empresa

  177. que mostra tudo isso colocado junto.
  178. Essas são imagens sem texto,
  179. e enquanto digito frases aqui,
  180. ele entende essas imagens em tempo real
  181. e descobre sobre o que elas são
  182. e encontram imagens similares ao
    texto que estou escrevendo.
  183. Vocês podem ver, está realmente
    entendendo minhas frases
  184. e entendendo essas imagens.
  185. Sei que vocês viram algo assim no Google,
  186. onde você digita coisas e
    aparecem imagens,
  187. mas na verdade o que acontece é que
    está buscando o texto na página.
  188. Isso é muito diferente de
    realmente entender as imagens.
  189. Isso foi possível acontecer
    para computadores
  190. pela primeira vez somente
    há alguns poucos meses.
  191. Vemos que agora os computadores conseguem
    não apenas ver, mas ler também,

  192. e claro, mostramos aqui que podem
    entender o que escutam.
  193. Talvez não seja surpresa o que vou
    dizer agora: eles sabem escrever.
  194. Aqui um texto que eu gerei usando um
    algoritmo de aprendizado profundo ontem.
  195. E aqui um texto que um algoritmo
    de Stanford criou.
  196. Cada uma dessas frases foi criada
  197. por um algoritmo de aprendizado profundo
    para descrever cada uma dessas imagens.
  198. Esse algoritmo nunca tinha visto um homem
    de camiseta preta tocando violão.
  199. Ele já viu um homem antes,
    já viu a cor preta,
  200. já viu um violão antes,
  201. mas criou independentemente
    essa descrição inédita para essa imagem.
  202. Ainda não chegamos ao patamar
    do desempenho humano, mas estamos perto.
  203. Em testes, humanos preferem a legenda
    gerada por computador
  204. uma a cada quatro vezes.
  205. Agora esse sistema tem apenas
    duas semanas,
  206. então provavelmente dentro de um ano,
  207. o algoritmo de computador estará
    além do desempenho humano
  208. no ritmo que as coisas vão.
  209. E é isso, os computadores
    conseguem escrever.
  210. Quando juntamos isso tudo,
    oportunidades muito empolgantes aparecem.

  211. Por exemplo, na medicina,
  212. uma equipe em Boston anunciou
    a descoberta de
  213. dúzias de novas características
    clinicamente relevantes
  214. de tumores que ajudam os médicos
    em prognósticos de câncer.
  215. De modo semelhante, em Stanford,
  216. um grupo lá anunciou que,
    observando tecidos sob ampliação,
  217. desenvolveu um sistema
    com base em aprendizado de máquina
  218. que de fato é melhor que
    patologistas humanos
  219. ao prever índices de sobrevivência
    para pacientes de câncer.
  220. Em ambos os casos, não apenas
    as previsões eram mais precisas,
  221. mas criaram ciência perspicaz.
  222. No caso da radiologia,
  223. foram indicadores clínicos novos
    que humanos conseguem entender.
  224. Nesse caso de patologia,
  225. o sistema de computador descobriu que
    as células ao redor do câncer
  226. são tão importantes quanto as
    próprias células cancerígenas
  227. para se fazer um diagnóstico.
  228. Isso é o oposto do que os patologistas
    tinham aprendido por décadas.
  229. Em cada um desses dois casos, foram
    sistemas desenvolvidos por um
  230. grupo de especialistas médicos e
    especialistas em aprendizado de máquina,
  231. mas desde ano passado,
    estamos além disso também.
  232. Esse é um exemplo de identificação
    de áreas cancerígenas
  233. em tecido humano sob um microscópio.
  234. O sistema aqui consegue identificar
    essas áreas com mais precisão,
  235. ou com a mesma precisão,
    do que patologistas humanos,
  236. mas foi construido com aprendizado
    profundo sem conhecimento médico
  237. por pessoas sem antecedentes na área.
  238. De modo similar, aqui,
    essa segmentação de neurônios.
  239. Agora podemos segmentar neurônios
    tão precisamente quanto os humanos,
  240. mas esse sistema foi desenvolvido
    com aprendizado profundo
  241. por pessoas sem antecedentes em medicina.
  242. Então eu mesmo, que não tenho
    antecedentes em medicina,

  243. posso parecer inteiramente qualificado
    para iniciar uma empresa médica,
  244. que foi o que eu fiz.
  245. Eu estava meio aterrorizado,
  246. mas a teoria sugeria que era possível
  247. fazer medicina muito útil usando
    apenas essas técnicas analíticas de dados.
  248. E ainda bem, a reação tem sido fantástica,
  249. não apenas da mídia mas da
    comunidade médica,
  250. que tem sido muito favorável.
  251. A teoria é que podemos pegar a parte
    intermediária do precesso médico
  252. e torná-la em análise de dados
    tanto quanto possível,
  253. deixando aos médicos o que
    eles fazem de melhor.
  254. Quero dar uma exemplo a vocês.
  255. Hoje um novo teste de diagnóstico médico
    leva uns 15 minutos para ser feito
  256. e vou mostrar em tempo real para vocês,
  257. mas eu comprimi para três minutos,
    cortando alguns pedaços.
  258. Ao invés de um teste de
    diagnóstico médico,
  259. vou mostrar um teste de diagnóstico
    de imagens de carros,
  260. pois é algo que todos podem entender.
  261. Então aqui estamos iniciando com
    1,5 milhão de imagens de carro,

  262. e eu quero criar algo que pode
    separar num ângulo
  263. da foto que está sendo tirada.
  264. Essas imagens são inteiramente não
    marcadas, então preciso começar do zero.
  265. Com o algoritmo de
    aprendizado profundo,
  266. pode-se automaticamente identificar áreas
    de estrutura nessas imagens.
  267. O legal é que o humano e o computador
    agora podem trabalhar juntos.
  268. Então o humano, como podem ver,
  269. diz ao computador as áreas de interesse
  270. que o computador então usa para
    melhorar o algoritmo.
  271. Esses sistemas de aprendizado profundo
    agem num espaço de 16 mil dimensões,
  272. dá para ver aqui o computador
    girando através do espaço,
  273. tentando encontrar novas
    áreas de estrutura.
  274. E quando consegue,
  275. o humano que está no controle então
    aponta as áreas de interesse.
  276. Aqui o computador encontrou as
    áreas com sucesso,
  277. por exemplo, ângulos.
  278. Enquanto seguimos o processo,
  279. gradualmente dizendo mais e mais
    ao computador
  280. sobre os tipos de estruturas que
    estamos buscando.
  281. Se fosse um teste diagnóstico, seria
  282. um patologista identificando áreas
    de condição patológica, por exemplo,
  283. ou um radiologista indicando nódulos
    potencialmente problemáticos.
  284. E às vezes pode ser difícil
    para o algoritmo.
  285. Nesse caso, ficou um pouco confuso.
  286. As frentes e as traseiras estão
    todas misturadas.
  287. Então temos que ser cuidadosos,
  288. manualmente separando as frentes e
    as traseiras,
  289. e dizer ao computador que isso é
    o tipo de grupo
  290. que nos interessa.
  291. Então fizemos isso por um tempo,
    adiantamos um pouco, e

  292. treinamos o algoritmo de
    aprendizado de máquina
  293. com base em algumas centenas de coisas,
  294. e esperamos que tenha ficado melhor.
  295. Podem ver que agora algumas dessas
    imagens desapareceram,
  296. mostrando que já consegue entender
    algumas por si próprio.
  297. Podemos então usar esse conceito
    para imagens similares,
  298. e usando imagens similares,
    vocês podem ver,
  299. o computador nesse ponto consegue
    encontrar somente as frentes dos carros.
  300. Nesse ponto o humano pode
    dizer ao computador,
  301. "ok, sim, você fez um bom trabalho".
  302. Claro que às vezes ainda é difícil

  303. separar grupos.
  304. Nesse caso mesmo depois
    do computador girar um pouco,
  305. ainda vemos que imagens
    do lado esquerdo e do lado direito
  306. estão todas misturadas.
  307. Podemos novamente dar
    dicas ao computador,
  308. e dizer, certo, encontre
    uma projeção que separe
  309. os lados esquerdo e direito
    o melhor possível
  310. usando o algoritmo de
    aprendizado profundo.
  311. E dando aquela dica, ah, certo, conseguiu.
  312. Encontrou um jeito de pensar
    nesses objetos
  313. que acabou agrupando.
  314. Vocês podem pegar a ideia aqui.

  315. Não é o caso de substituir
    o humano pelo computador,
  316. mas sim de trabalharem juntos.
  317. O que fazemos aqui é substituir algo
    que costumava demandar de uma equipe
  318. de cinco ou seis pessoas
    cerca de sete anos
  319. com algo que leva apenas 15 minutos
  320. para uma pessoa só.
  321. Esse processo demanda
    cerca de quatro ou cinco iterações.

  322. Podemos ver que agora temos 62%
  323. de nossas 1,5 milhão de imagens
    classificadas corretamente.
  324. Nesse ponto podemos rapidamente
  325. pegar seções inteiras
  326. e checar se não há erros.
  327. Onde encontramos erros,
    podemos avisar o computador.
  328. Usando esse tipo de processo para
    cada um dos diferentes grupos,
  329. temos agora 80% de índice de sucesso
  330. classificando 1,5 milhão de imagens.
  331. Nesse ponto é só o caso de
  332. encontrar o pequeno número que ainda
    não está classificado corretamente,
  333. e tentar entender o motivo.
  334. E com essa abordagem,
  335. em 15 minutos temos 97%
    de índice de classificação.
  336. Então esse tipo de técnica nos permite
    resolver um grande problema,

  337. que é a falta de especialização
    médica no mundo.
  338. O Fórum Econômico Mundial diz que há
    escassez de algo entre 10 e 20 vezes
  339. de médicos no mundo em desenvolvimento,
  340. e que levaria cerca de 300 anos
  341. para treinar gente suficiente para
    resolver o problema.
  342. Imaginem conseguirmos
    aumentar a eficiência
  343. usando essas abordagens
    de aprendizado profundo?
  344. Por isso estou empolgado
    com as oportunidades.

  345. E estou preocupado com os problemas.
  346. O problema aqui é que cada área
    em azul no mapa
  347. é um lugar onde os serviços estão
    com mais de 80% de emprego.
  348. O que são serviços?
  349. São esses.
  350. São também exatamente o que
    os computadores aprenderam a fazer.
  351. Então 80% do emprego no mundo
    no mundo desenvolvido
  352. é algo que computadores já
    aprenderam a fazer.
  353. O que isso significa?
  354. Ficaremos bem. Serão substituídos
    por outros empregos.
  355. Por exemplo serão mais empregos
    para cientistas de dados.
  356. Na verdade não.
  357. Não demora muito para cientistas
    de dados fazerem essas coisas.
  358. Por exemplo, os quatro algoritmos
    foram construídos pelo mesmo cara.
  359. Então você pensa, oh,
    isso já aconteceu antes,
  360. já vimos isso antes,
    quando coisas novas chegam
  361. e novos empregos aparecem,
  362. como serão esses novos empregos?
  363. É muito difícil estimar isso,
  364. porque o desempenho humano
    cresce nesse ritmo gradual,
  365. mas agora temos um sistema,
    o aprendizado profundo,
  366. que sabemos crescer em ritmo exponencial.
  367. E nós estamos aqui.
  368. Então hoje vemos as coisas ao redor
  369. e dizemos: "Oh, os computadores são
    tão burros". Certo?
  370. Mas dentro de cinco anos os computadores
    estarão fora desse gráfico.
  371. Então precisamos começar a pensar
    nessa capacidade agora mesmo.
  372. Já vimos isso antes, claro.

  373. Na Revolução Industrial,
  374. vimos uma mudança na capacidade
    graças aos motores.
  375. Acontece que, as coisas foram
    se achatando.
  376. Houve distúrbio social,
  377. mas quando os motores foram usados para
    gerar força em todas as situações
  378. as coisas se acalmaram.
  379. A Revolução do Aprendizado de Máquina
  380. será bem diferente,
  381. porque ela nunca se acalma.
  382. Quanto mais os computadores
    conseguem melhorar,
  383. mais eles podem construir
    outros computadores, melhores,
  384. então esse será um tipo de mudança
  385. que o mundo nunca viveu antes,
  386. então sua compreensão anterior do
    que é possível é diferente.
  387. Isso já está nos afetando.

  388. Nos últimos 25 anos, como
    a produtividade de capital aumentou,
  389. a produtividade de mão de obra estacionou,
    de fato até caiu um pouco.
  390. Então quero que comecemos
    essa discussão já.

  391. Sei que quando eu conto isso
    para as pessoas,
  392. elas podem acabar desdenhando.
  393. "Os computadores não sabem pensar,
  394. eles não se emocionam,
    não entendem poesia,
  395. nós não sabemos como eles funcionam".
  396. E daí?
  397. Hoje computadores fazem coisas
  398. que passamos a maior parte
    do tempo sendo pagos pra fazer,
  399. então chegou a hora de pensar
  400. em como vamos ajustar nossas
    estruturas sociais e econômicas
  401. para essa nova realidade.
  402. Obrigado.
  403. (Aplausos)