Nosso mundo está mudando
de várias formas
e uma das coisas que terá enorme
impacto em nosso futuro
é a inteligência artificial, IA,
que trará outra revolução industrial.
As revoluções industriais anteriores
expandiram o poder mecânico dos humanos.
Essa nova revolução,
essa segunda era das máquinas,
expandirá nossas habilidades cognitivas,
nosso poder mental.
Os computadores não irão substituir
apenas o trabalho manual,
mas também o trabalho mental.
Então, em que ponto estamos atualmente?
Vocês podem ter ouvido
sobre o que aconteceu em março de 2016,
quando um sistema de aprendizado
de máquina chamado AlphaGo
utilizou a aprendizagem profunda para
derrotar o campeão mundial do jogo Go.
O Go é um jogo chinês antigo
que apresentava maior dificuldade
para os computadores dominarem
do que o jogo de xadrez.
Como conseguimos isso agora,
após décadas de pesquisas de IA?
O AlphaGo foi treinado para jogar Go.
Primeiramente, assistindo várias vezes
a dezenas de milhões de jogadas feitas
por jogadores humanos muito fortes.
Depois, jogando milhões de partidas
contra si mesmo.
O aprendizado de máquina permite
que computadores aprendam pelo exemplo,
que aprendam pelos dados.
O aprendizado de máquina
acabou se tornando uma chave
para preencher os computadores
de conhecimento.
E isso é importante
porque o conhecimento
é o que possibilita a inteligência.
Pôr conhecimento em computadores era um
desafio para abordagens anteriores de IA.
Por quê?
Há muitas coisas
que sabemos intuitivamente,
então não conseguimos
comunicá-las verbalmente.
Não temos acesso consciente
àquele conhecimento intuitivo.
Como podemos programar
computadores sem conhecimento?
Qual é a solução?
A solução é que as máquinas aprendam
esse conhecimento sozinhas,
assim como nós fazemos.
E isso é importante porque conhecimento
é o que possibilita a inteligência.
Minha missão tem sido
contribuir para descobrir
e entender os princípios da inteligência
por meio do aprendizado,
seja ele animal, humano ou de máquina.
Eu e outros acreditamos
que há alguns princípios-chave,
como as leis da física,
princípios simples que poderiam explicar
a nossa própria inteligência
e nos ajudar a construir
máquinas inteligentes.
Por exemplo, pensem
nas leis da aerodinâmica,
que são gerais o bastante para explicarem
o voo dos pássaros e o dos aviões.
Não seria maravilhoso descobrir
princípios igualmente simples e poderosos
que explicariam a própria inteligência?
Bem, fizemos algum progresso.
Meus colaboradores e eu trabalhamos
nos últimos anos em uma revolução da IA
com nossa pesquisa sobre as redes neurais
e a aprendizagem profunda,
uma abordagem do aprendizado de máquina
inspirada pelo cérebro.
Começou com o reconhecimento de fala
em seus celulares,
com redes neurais, desde 2012.
Pouco tempo depois, veio um avanço
na visão computacional.
Os computadores agora fazem bom trabalho
no reconhecimento do conteúdo de imagens.
Eles se aproximaram do desempenho
humano em alguns indicadores
nos últimos cinco anos.
Um computador agora pode
ter um entendimento intuitivo
da aparência visual de um tabuleiro de Go
comparável ao dos melhores
jogadores humanos.
Mais recentemente,
após algumas descobertas
feitas em meu laboratório,
a aprendizagem profunda foi usada
para traduzir de uma língua para outra
e vocês começarão a ver isso
no Google Tradutor.
Isso está expandindo
a habilidade computacional
para entender e gerar linguagem natural.
Mas não se enganem:
ainda estamos muito longe de uma máquina
que seja tão capaz quanto os humanos
de aprender a dominar
vários aspectos de nosso mundo.
Então, vejamos um exemplo.
Até mesmo uma criança de dois anos
é capaz de aprender coisas
de uma forma que os computadores
não conseguem atualmente.
Uma criança de dois anos,
na verdade, domina física intuitiva.
Ela sabe que uma bola
cairá ao ser largada.
Quando derrama algum líquido,
ela sabe que haverá sujeira.
Seus pais não precisam ensinar
as leis de Newton ou equações
diferenciais à criança.
Ela descobre todas essas coisas sozinha,
de forma não supervisionada.
A aprendizagem não supervisionada ainda é
um dos principais desafios para a IA
e pode levar várias décadas
de pesquisas básicas a mais
para desfazer esse nó.
Aprendizagem não supervisionada
está tentando descobrir
representações dos dados.
Deixem-me mostrar-lhes um exemplo.
Considerem uma página na tela
que veem com seus olhos
ou que o computador vê como
uma imagem, um monte de pixels.
Para responder uma pergunta
sobre o conteúdo da imagem,
é necessário entender
seu significado de alto nível,
que corresponde ao nível mais elevado
de representação em seu cérebro.
Abaixo dele, temos o significado
individual das palavras
e, ainda mais abaixo, temos caracteres
que compõem as palavras.
Esses caracteres podem ser renderizados
de formas diferentes,
feitos de traços diferentes.
E esses traços são feitos de arestas,
que são feitas de pixels.
Então são níveis diferentes
de representação.
Mas os pixels não são
suficientes por si sós
para que a imagem faça sentido,
para responder uma questão de alto nível
sobre o conteúdo da página.
Nosso cérebro tem esses níveis
diferentes de representação,
começando pelos neurônios
na primeira área visual do córtex, V1,
que reconhece os contornos.
Depois, os neurônios
na segunda área visual do córtex, V2,
que reconhece traços e formas pequenas.
Mais acima, temos os neurônios
que detectam partes de objetos
e depois objetos e cenas completas.
As redes neurais,
quando treinadas com imagens,
podem de fato descobrir esses tipos
de níveis de representação
que correspondem muito bem
ao que observamos no cérebro.
Tanto as redes neurais biológicas,
que são as que existem no cérebro,
como as redes neurais profundas
que treinamos em nossas máquinas
podem aprender a transformar
de um nível de representação ao seguinte,
com os altos níveis correspondendo
a noções mais abstratas.
Por exemplo, a noção
abstrata do caractere A
pode ser renderizada de muitas formas
diferentes nos níveis mais baixos
como muitas configurações
diferentes de pixels
dependendo da posição, rotação,
fonte, e assim por diante.
Então, como aprendemos
esses altos níveis de representações?
Até agora uma coisa
que foi muito bem-sucedida
nas aplicações da aprendizagem profunda
é o que chamamos de
aprendizagem supervisionada.
Na aprendizagem supervisionada,
o computador deve ser "levado pela mão"
e humanos precisam dizer ao computador
a resposta para várias perguntas.
Por exemplo, em milhões de imagens,
humanos têm que dizer à máquina:
"Bem... nessa imagem, isso é um gato.
Nessa imagem, isso é um cachorro".
"Nessa imagem, isso é um laptop.
Nessa imagem, isso é um teclado",
e assim por diante, milhões de vezes.
O que é muito penoso e usamos
o crowdsourcing para conseguir fazer isso.
Embora seja muito poderoso
e possamos resolver
vários problemas interessantes,
humanos são muito mais fortes
e podem aprender sobre muitos aspectos
diferentes a mais do mundo
de uma forma muito mais autônoma,
como vimos com a criança aprendendo
sobre física intuitiva.
A aprendizagem não supervisionada poderia
nos ajudar com os carros sem condutor.
Deixem-me explicar:
a aprendizagem não supervisionada permite
que computadores se projetem ao futuro
para gerarem futuros plausíveis
condicionados à situação atual.
E isso permite que os computadores
raciocinem e planejem adiante,
até para circunstâncias para as quais
não tenham sido treinados.
Isso é importante
porque se usássemos a aprendizagem
supervisionada, teríamos que dizer
aos computadores todas as circunstâncias
onde o carro poderia estar
e como os humanos
reagiriam àquela situação.
Como eu aprendi a evitar
comportamentos perigosos dirigindo?
Eu precisei morrer mil vezes em acidentes?
(Risos)
Bem, é assim que treinamos
as máquinas agora.
Então não vai decolar,
ou pelo menos não vai dirigir.
(Risos)
Precisamos treinar nossos modelos
para serem capazes de gerar imagens
ou futuros plausíveis, de serem criativos,
e estamos progredindo com isso.
Então, estamos treinando
essas redes neurais profundas
para irem do significado
de alto nível aos pixels
e não dos pixels
aos significados de alto nível,
indo na outra direção por meio
dos níveis de representação.
E, desse jeito, o computador
pode gerar imagens
que sejam novas e diferentes
daquelas que o computador viu
enquanto era treinado,
mas que sejam plausíveis
e pareçam imagens naturais.
Também podemos usar esses modelos
para conceber imagens estranhas,
por vezes assustadoras,
como os nossos sonhos e pesadelos.
Aqui estão algumas imagens
que foram sintetizadas pelo computador
utilizando esses modelos
de mapeamento profundo.
Elas parecem imagens naturais,
mas, se observarem com atenção,
perceberão que são diferentes
e que lhes faltam alguns
dos detalhes importantes
que nós reconheceríamos como naturais.
Dez anos atrás,
a aprendizagem não supervisionada
era a chave para a inovação
que conquistamos ao descobrirmos
a aprendizagem profunda.
Isso acontecia só em alguns laboratórios,
incluindo o meu na época,
em um momento em que as redes neurais
não eram populares.
Elas quase foram abandonadas
pela comunidade científica.
Agora, as coisas mudaram bastante.
Esse campo se tornou muito difícil.
Agora há, todos os anos, centenas
de estudantes se candidatando
para a graduação no meu laboratório,
com meus colaboradores.
Montreal se tornou
a maior concentração acadêmica
de pesquisadores da aprendizagem
profunda no mundo.
Acabamos de receber uma enorme bolsa
de pesquisa de 94 milhões de dólares
para ultrapassar os limites
da IA e da ciência dos dados
e também para transferir a tecnologia
da aprendizagem profunda à indústria.
Pessoas de negócios estimuladas
por tudo isso estão criando start-ups
e laboratórios industriais,
muitos deles perto das universidades.
Por exemplo,
algumas semanas atrás, anunciamos
o lançamento de uma fábrica de start-ups
chamada "Element AI"
que focará as aplicações
da aprendizagem profunda.
Simplesmente não há especialistas
suficientes em aprendizagem profunda,
então eles ganham salários absurdos
e muitos dos meus antigos colegas
acadêmicos aceitaram ofertas generosas
de empresas para trabalharem
em laboratórios industriais.
Eu escolhi permanecer na universidade,
para trabalhar pelo bem comum,
para trabalhar com os estudantes
e permanecer independente.
Para guiar a próxima geração
de especialistas em aprendizagem profunda.
Uma coisa que estamos fazendo
que ultrapassa o valor comercial
é pensar sobre
as implicações sociais da IA.
Muitos de nós começamos agora
a voltar nossa atenção
a programas que possuem
valor social, como a saúde.
Achamos que podemos usar
a aprendizagem profunda
para melhorar tratamentos
com uma medicina personalizada.
Acredito que, no futuro,
conforme coletamos mais dados
de bilhões de pessoas ao redor da Terra,
conseguiremos fornecer
aconselhamento médico
a bilhões de pessoas que não têm
acesso a isso atualmente.
E podemos imaginar muitos outros usos
para o valor social da IA.
Por exemplo, algo que resultará
de nossa pesquisa
sobre o entendimento da linguagem natural
é o fornecimento de vários serviços,
como os serviços legais
para quem não puder pagar por eles.
Agora também estamos virando nossa atenção
para as implicações sociais
da IA na minha comunidade.
Mas não são só os especialistas
que devem pensar sobre isso.
Acredito que, para além
da matemática e do jargão,
as pessoas comuns podem ter uma noção
do que ocorre sob a superfície
o bastante para participarem
nas decisões importantes
que ocorrerão nos próximos
anos e décadas sobre a IA.
Então, por favor,
deixem seu medo de lado e deem-se
o espaço para aprender sobre isso.
Meus colaboradores e eu escrevemos
vários artigos introdutórios
e um livro chamado "Aprendizagem Profunda"
para ajudar estudantes e engenheiros
a entrarem nesse estimulante campo.
Também há muitos recursos on-line:
softwares, tutoriais, vídeos, etc.
e muitos estudantes universitários estão
aprendendo sozinhos vários desses tópicos
sobre pesquisas na aprendizagem profunda,
para depois se juntarem
a laboratórios como o meu.
A IA terá um impacto significativo
na nossa sociedade.
Então, é importante perguntar:
como iremos usá-la?
Benefícios imensos poderão ser
acompanhados por um lado negativo,
como o uso militar,
ou mudanças rápidas e turbulentas
no mercado de trabalho.
Para garantir que as escolhas coletivas
que serão feitas sobre a IA
nos próximos anos
sejam para o benefício de todos,
todo cidadão deveria
assumir um papel ativo
na definição de como a IA
moldará nosso futuro.
Obrigado.
(Aplausos)