Nosso mundo está mudando de várias formas e uma das coisas que terá enorme impacto em nosso futuro é a inteligência artificial, IA, que trará outra revolução industrial. As revoluções industriais anteriores expandiram o poder mecânico dos humanos. Essa nova revolução, essa segunda era das máquinas, expandirá nossas habilidades cognitivas, nosso poder mental. Os computadores não irão substituir apenas o trabalho manual, mas também o trabalho mental. Então, em que ponto estamos atualmente? Vocês podem ter ouvido sobre o que aconteceu em março de 2016, quando um sistema de aprendizado de máquina chamado AlphaGo utilizou a aprendizagem profunda para derrotar o campeão mundial do jogo Go. O Go é um jogo chinês antigo que apresentava maior dificuldade para os computadores dominarem do que o jogo de xadrez. Como conseguimos isso agora, após décadas de pesquisas de IA? O AlphaGo foi treinado para jogar Go. Primeiramente, assistindo várias vezes a dezenas de milhões de jogadas feitas por jogadores humanos muito fortes. Depois, jogando milhões de partidas contra si mesmo. O aprendizado de máquina permite que computadores aprendam pelo exemplo, que aprendam pelos dados. O aprendizado de máquina acabou se tornando uma chave para preencher os computadores de conhecimento. E isso é importante porque o conhecimento é o que possibilita a inteligência. Pôr conhecimento em computadores era um desafio para abordagens anteriores de IA. Por quê? Há muitas coisas que sabemos intuitivamente, então não conseguimos comunicá-las verbalmente. Não temos acesso consciente àquele conhecimento intuitivo. Como podemos programar computadores sem conhecimento? Qual é a solução? A solução é que as máquinas aprendam esse conhecimento sozinhas, assim como nós fazemos. E isso é importante porque conhecimento é o que possibilita a inteligência. Minha missão tem sido contribuir para descobrir e entender os princípios da inteligência por meio do aprendizado, seja ele animal, humano ou de máquina. Eu e outros acreditamos que há alguns princípios-chave, como as leis da física, princípios simples que poderiam explicar a nossa própria inteligência e nos ajudar a construir máquinas inteligentes. Por exemplo, pensem nas leis da aerodinâmica, que são gerais o bastante para explicarem o voo dos pássaros e o dos aviões. Não seria maravilhoso descobrir princípios igualmente simples e poderosos que explicariam a própria inteligência? Bem, fizemos algum progresso. Meus colaboradores e eu trabalhamos nos últimos anos em uma revolução da IA com nossa pesquisa sobre as redes neurais e a aprendizagem profunda, uma abordagem do aprendizado de máquina inspirada pelo cérebro. Começou com o reconhecimento de fala em seus celulares, com redes neurais, desde 2012. Pouco tempo depois, veio um avanço na visão computacional. Os computadores agora fazem bom trabalho no reconhecimento do conteúdo de imagens. Eles se aproximaram do desempenho humano em alguns indicadores nos últimos cinco anos. Um computador agora pode ter um entendimento intuitivo da aparência visual de um tabuleiro de Go comparável ao dos melhores jogadores humanos. Mais recentemente, após algumas descobertas feitas em meu laboratório, a aprendizagem profunda foi usada para traduzir de uma língua para outra e vocês começarão a ver isso no Google Tradutor. Isso está expandindo a habilidade computacional para entender e gerar linguagem natural. Mas não se enganem: ainda estamos muito longe de uma máquina que seja tão capaz quanto os humanos de aprender a dominar vários aspectos de nosso mundo. Então, vejamos um exemplo. Até mesmo uma criança de dois anos é capaz de aprender coisas de uma forma que os computadores não conseguem atualmente. Uma criança de dois anos, na verdade, domina física intuitiva. Ela sabe que uma bola cairá ao ser largada. Quando derrama algum líquido, ela sabe que haverá sujeira. Seus pais não precisam ensinar as leis de Newton ou equações diferenciais à criança. Ela descobre todas essas coisas sozinha, de forma não supervisionada. A aprendizagem não supervisionada ainda é um dos principais desafios para a IA e pode levar várias décadas de pesquisas básicas a mais para desfazer esse nó. Aprendizagem não supervisionada está tentando descobrir representações dos dados. Deixem-me mostrar-lhes um exemplo. Considerem uma página na tela que veem com seus olhos ou que o computador vê como uma imagem, um monte de pixels. Para responder uma pergunta sobre o conteúdo da imagem, é necessário entender seu significado de alto nível, que corresponde ao nível mais elevado de representação em seu cérebro. Abaixo dele, temos o significado individual das palavras e, ainda mais abaixo, temos caracteres que compõem as palavras. Esses caracteres podem ser renderizados de formas diferentes, feitos de traços diferentes. E esses traços são feitos de arestas, que são feitas de pixels. Então são níveis diferentes de representação. Mas os pixels não são suficientes por si sós para que a imagem faça sentido, para responder uma questão de alto nível sobre o conteúdo da página. Nosso cérebro tem esses níveis diferentes de representação, começando pelos neurônios na primeira área visual do córtex, V1, que reconhece os contornos. Depois, os neurônios na segunda área visual do córtex, V2, que reconhece traços e formas pequenas. Mais acima, temos os neurônios que detectam partes de objetos e depois objetos e cenas completas. As redes neurais, quando treinadas com imagens, podem de fato descobrir esses tipos de níveis de representação que correspondem muito bem ao que observamos no cérebro. Tanto as redes neurais biológicas, que são as que existem no cérebro, como as redes neurais profundas que treinamos em nossas máquinas podem aprender a transformar de um nível de representação ao seguinte, com os altos níveis correspondendo a noções mais abstratas. Por exemplo, a noção abstrata do caractere A pode ser renderizada de muitas formas diferentes nos níveis mais baixos como muitas configurações diferentes de pixels dependendo da posição, rotação, fonte, e assim por diante. Então, como aprendemos esses altos níveis de representações? Até agora uma coisa que foi muito bem-sucedida nas aplicações da aprendizagem profunda é o que chamamos de aprendizagem supervisionada. Na aprendizagem supervisionada, o computador deve ser "levado pela mão" e humanos precisam dizer ao computador a resposta para várias perguntas. Por exemplo, em milhões de imagens, humanos têm que dizer à máquina: "Bem... nessa imagem, isso é um gato. Nessa imagem, isso é um cachorro". "Nessa imagem, isso é um laptop. Nessa imagem, isso é um teclado", e assim por diante, milhões de vezes. O que é muito penoso e usamos o crowdsourcing para conseguir fazer isso. Embora seja muito poderoso e possamos resolver vários problemas interessantes, humanos são muito mais fortes e podem aprender sobre muitos aspectos diferentes a mais do mundo de uma forma muito mais autônoma, como vimos com a criança aprendendo sobre física intuitiva. A aprendizagem não supervisionada poderia nos ajudar com os carros sem condutor. Deixem-me explicar: a aprendizagem não supervisionada permite que computadores se projetem ao futuro para gerarem futuros plausíveis condicionados à situação atual. E isso permite que os computadores raciocinem e planejem adiante, até para circunstâncias para as quais não tenham sido treinados. Isso é importante porque se usássemos a aprendizagem supervisionada, teríamos que dizer aos computadores todas as circunstâncias onde o carro poderia estar e como os humanos reagiriam àquela situação. Como eu aprendi a evitar comportamentos perigosos dirigindo? Eu precisei morrer mil vezes em acidentes? (Risos) Bem, é assim que treinamos as máquinas agora. Então não vai decolar, ou pelo menos não vai dirigir. (Risos) Precisamos treinar nossos modelos para serem capazes de gerar imagens ou futuros plausíveis, de serem criativos, e estamos progredindo com isso. Então, estamos treinando essas redes neurais profundas para irem do significado de alto nível aos pixels e não dos pixels aos significados de alto nível, indo na outra direção por meio dos níveis de representação. E, desse jeito, o computador pode gerar imagens que sejam novas e diferentes daquelas que o computador viu enquanto era treinado, mas que sejam plausíveis e pareçam imagens naturais. Também podemos usar esses modelos para conceber imagens estranhas, por vezes assustadoras, como os nossos sonhos e pesadelos. Aqui estão algumas imagens que foram sintetizadas pelo computador utilizando esses modelos de mapeamento profundo. Elas parecem imagens naturais, mas, se observarem com atenção, perceberão que são diferentes e que lhes faltam alguns dos detalhes importantes que nós reconheceríamos como naturais. Dez anos atrás, a aprendizagem não supervisionada era a chave para a inovação que conquistamos ao descobrirmos a aprendizagem profunda. Isso acontecia só em alguns laboratórios, incluindo o meu na época, em um momento em que as redes neurais não eram populares. Elas quase foram abandonadas pela comunidade científica. Agora, as coisas mudaram bastante. Esse campo se tornou muito difícil. Agora há, todos os anos, centenas de estudantes se candidatando para a graduação no meu laboratório, com meus colaboradores. Montreal se tornou a maior concentração acadêmica de pesquisadores da aprendizagem profunda no mundo. Acabamos de receber uma enorme bolsa de pesquisa de 94 milhões de dólares para ultrapassar os limites da IA e da ciência dos dados e também para transferir a tecnologia da aprendizagem profunda à indústria. Pessoas de negócios estimuladas por tudo isso estão criando start-ups e laboratórios industriais, muitos deles perto das universidades. Por exemplo, algumas semanas atrás, anunciamos o lançamento de uma fábrica de start-ups chamada "Element AI" que focará as aplicações da aprendizagem profunda. Simplesmente não há especialistas suficientes em aprendizagem profunda, então eles ganham salários absurdos e muitos dos meus antigos colegas acadêmicos aceitaram ofertas generosas de empresas para trabalharem em laboratórios industriais. Eu escolhi permanecer na universidade, para trabalhar pelo bem comum, para trabalhar com os estudantes e permanecer independente. Para guiar a próxima geração de especialistas em aprendizagem profunda. Uma coisa que estamos fazendo que ultrapassa o valor comercial é pensar sobre as implicações sociais da IA. Muitos de nós começamos agora a voltar nossa atenção a programas que possuem valor social, como a saúde. Achamos que podemos usar a aprendizagem profunda para melhorar tratamentos com uma medicina personalizada. Acredito que, no futuro, conforme coletamos mais dados de bilhões de pessoas ao redor da Terra, conseguiremos fornecer aconselhamento médico a bilhões de pessoas que não têm acesso a isso atualmente. E podemos imaginar muitos outros usos para o valor social da IA. Por exemplo, algo que resultará de nossa pesquisa sobre o entendimento da linguagem natural é o fornecimento de vários serviços, como os serviços legais para quem não puder pagar por eles. Agora também estamos virando nossa atenção para as implicações sociais da IA na minha comunidade. Mas não são só os especialistas que devem pensar sobre isso. Acredito que, para além da matemática e do jargão, as pessoas comuns podem ter uma noção do que ocorre sob a superfície o bastante para participarem nas decisões importantes que ocorrerão nos próximos anos e décadas sobre a IA. Então, por favor, deixem seu medo de lado e deem-se o espaço para aprender sobre isso. Meus colaboradores e eu escrevemos vários artigos introdutórios e um livro chamado "Aprendizagem Profunda" para ajudar estudantes e engenheiros a entrarem nesse estimulante campo. Também há muitos recursos on-line: softwares, tutoriais, vídeos, etc. e muitos estudantes universitários estão aprendendo sozinhos vários desses tópicos sobre pesquisas na aprendizagem profunda, para depois se juntarem a laboratórios como o meu. A IA terá um impacto significativo na nossa sociedade. Então, é importante perguntar: como iremos usá-la? Benefícios imensos poderão ser acompanhados por um lado negativo, como o uso militar, ou mudanças rápidas e turbulentas no mercado de trabalho. Para garantir que as escolhas coletivas que serão feitas sobre a IA nos próximos anos sejam para o benefício de todos, todo cidadão deveria assumir um papel ativo na definição de como a IA moldará nosso futuro. Obrigado. (Aplausos)