WEBVTT

00:00:00.000 --> 00:00:04.904
O que é aprendizagem de máquina? Neste vídeo nós tentaremos definir o que é e também tentar

00:00:04.904 --> 00:00:09.520
dar a vocês um senso que quando usar aprendizagem de máquina. Mesmo entre praticantes de

00:00:09.520 --> 00:00:14.252
aprendizagem de máquina não há uma definição bem aceita do que é e o que

00:00:14.252 --> 00:00:18.926
não é aprendizagem de máquina. Mas deixem-me mostrar a vocês alguns exemplos de formas que

00:00:18.926 --> 00:00:23.600
pessoas tentaram definí-la. Aqui está a definição do que é aprendizagem de máquina

00:00:23.600 --> 00:00:28.520
para Arthur Samuel. Ele definiu aprendizagem de máquina como o campo de estudo que dá

00:00:31.037 --> 00:00:33.554
aos computadores a habilidade de aprender sem ser programado explicitamente. O aparecimento de Samuel

00:00:33.554 --> 00:00:38.452
para a fama foi que nos anos 50, ele escreveu um programa jogador de damas. E a

00:00:38.452 --> 00:00:43.603
coisa incrível sobre este programa é que o próprio Arthur Samuel

00:00:43.603 --> 00:00:48.268
não era um bom jogador de damas. Mas o que ele fez foi, ele teve que programar para que o programa jogasse

00:00:48.268 --> 00:00:52.245
10 de 1000 games contra ele mesmo. E assistindo quais tipos de posições

00:00:52.245 --> 00:00:56.698
de tabuleiro tendiam a levar a vitórias, e quais tipos de posições de tabuleiro tendiam a levar a

00:00:56.698 --> 00:01:00.725
derrotas. O programa jogador de damas aprendeu com o tempo quais são as posições de

00:01:00.725 --> 00:01:04.713
tabuleiro boas e quais são as posições de tabuleiro ruins. E eventualmente aprendeu a jogar

00:01:04.713 --> 00:01:09.514
damas melhor que o próprio Arthur Samuel era capaz. Isto foi um resultado notável.

00:01:09.514 --> 00:01:14.535
Mesmo Samuel não sendo um bom jogador de damas. Mas porque o

00:01:14.535 --> 00:01:19.254
computador teve a paciência de jogar milhares de jogos sozinho. Nenhum

00:01:19.254 --> 00:01:24.275
humano tem a paciência de jogar tantos jogos. Mas fazendo isto o computador foi capaz

00:01:24.275 --> 00:01:29.235
de conseguir tanta experiência em jogos de dama que ele eventualmente se tornou um

00:01:29.235 --> 00:01:33.817
jogador melhor do que o próprio Arthur Samuel. Isto é uma definição um

00:01:33.817 --> 00:01:38.547
pouco informal ,e antiga. Aqui há uma definição mais recente por Tom

00:01:38.547 --> 00:01:43.607
Mitchell, que é um amigo da Carnegie Mellon. Então Tom define aprendizagem de máquina

00:01:43.607 --> 00:01:48.819
dizendo isso, um problema de aprendizagem bem colocado e definido como segue. Ele diz, um programa

00:01:48.819 --> 00:01:53.843
de computador é orientado para aprender da experiência E, com respeito a alguma tarefa T, e alguma

00:01:53.843 --> 00:01:58.678
medida de performance P, se sua performance em T como medida por P melhora

00:01:58.678 --> 00:02:03.764
com a experiência E. Eu atualmente acho que ele criou esta definição apenas para deixá-la com

00:02:03.764 --> 00:02:08.346
rima. Para o exemplo do jogo de damas a experiência E será a

00:02:08.346 --> 00:02:13.253
experiência de fazer o programa jogar 10000 jogos contra ele mesmo. A

00:02:13.253 --> 00:02:17.735
tarefa T será a tarefa de jogar damas. E a medida de performance P

00:02:17.735 --> 00:02:22.399
será a probabilidade que ele ganhe o próximo jogo de damas contra

00:02:22.399 --> 00:02:27.157
algum novo oponente. Durante esses vídeos, além de tentar ensinar a vocês,

00:02:27.157 --> 00:02:32.291
eu irei ocasionalmente fazer perguntas a vocês para assegurar que vocês entenderam o

00:02:32.291 --> 00:02:36.891
conteúdo. Aqui está uma, no topo está a definição de aprendizagem de máquina de Tom

00:02:36.891 --> 00:02:42.292
Mitchell. Vamos dizer que seu programa de email observa quais email você assinala ou não

00:02:42.292 --> 00:02:47.826
como spam. Então em um cliente de email como este você pode clicar neste botão de spam para reportar

00:02:47.826 --> 00:02:53.263
algum email como spam, mas não outros emails. E baseado em quais emails você marca como

00:02:53.263 --> 00:02:59.046
spam, seu programa de email aprende melhor como filtrar email de spam. O que é a

00:02:59.046 --> 00:03:04.290
tarefa T neste caso? Em poucos segundos, o vídeo irá pausar. E quando isso acontecer

00:03:04.290 --> 00:03:09.598
você pode usar seu mouse para selecionar um destas quatro opções para me informar

00:03:09.598 --> 00:03:40.190
qual destes quatro você acha que é a resposta certa para esta questão.

00:03:40.190 --> 00:03:45.747
Isso pode ser uma medida de performance P. E então, nossa performance na tarefa T

00:03:45.747 --> 00:03:50.529
irá melhorar depois da

00:03:50.529 --> 00:03:55.957
experiência E. Neste curso eu espero ensinar a vocês sobre vários tipos diferentes de

00:03:55.957 --> 00:04:00.933
algoritmos de aprendizagem de máquina. Há vários tipos de algoritmos de aprendizagem.

00:04:00.933 --> 00:04:05.650
Os dois tipos principais são os que chamados de aprendizagem supervisionada e aprendizagem

00:04:05.650 --> 00:04:10.690
não-supervisionada. Eu definirei o que esses termos significam nos próximos vídeos. Mas

00:04:10.690 --> 00:04:16.028
em aprendizagem supervisionada a idéia é que nos vamos ensinar o

00:04:16.028 --> 00:04:20.513
computador como fazer alguma coisa, já em aprendizagem não-supervisionada nós vamos permitir

00:04:20.513 --> 00:04:25.016
que ele aprenda sozinho. Não se preocupe se estes dois termos não fazem sentido ainda, nos

00:04:25.016 --> 00:04:29.739
próximos dois vídeos eu vou dizer exatamente o que são estes dois tipos de aprendizagem. Você

00:04:29.739 --> 00:04:34.070
também irá ouvir outros termos tais como aprendizagem por reforço e sistemas

00:04:34.070 --> 00:04:38.621
recomendadores. Há outros tipos de algoritmos de aprendizagem que nós falaremos

00:04:38.621 --> 00:04:42.460
mais tarde mas os dois tipos mais usados são provavelmente

00:04:42.460 --> 00:04:46.791
o de aprendizagem supervisionado e o de aprendizagem não-supervisionada e eu irei definí-las nos próximos

00:04:46.791 --> 00:04:51.123
dois vídeos e gastaremos a maior parte da aula falando sobre estes dois tipos de

00:04:51.123 --> 00:04:55.720
algoritmos de aprendizagem. Acontece que uma das coisas em que gastaremos muito tempo

00:04:55.720 --> 00:05:00.054
neste curso é o conselho prático para aplicar algoritmos de aprendizagem. Isto é

00:05:00.054 --> 00:05:04.444
algo que eu sinto ser muito forte sobre isso, e é atualmente algo que eu

00:05:04.444 --> 00:05:08.167
não sei de qualquer outra universidade que ensine. Ensinar algoritmos de

00:05:08.167 --> 00:05:12.509
aprendizagem é como dar a você um conjunto de ferramentas, e igualmente importante ou mais

00:05:12.509 --> 00:05:17.616
importante que dar a você as ferramentas é ensinar a você como aplicar estas ferramentas. Eu gosto

00:05:17.616 --> 00:05:22.413
de fazer uma analogia com aprender a se tornar um carpinteiro. Imagine que alguém está

00:05:22.413 --> 00:05:26.959
ensinado a você como ser um carpinteiro e eles dizem: aqui está um martelo, aqui está uma

00:05:26.959 --> 00:05:31.077
chave de fenda, aqui está um serrote, boa sorte. Bem, isso não é bom, certo? Você, você, você

00:05:31.077 --> 00:05:34.799
tem todas estas ferramentas, mas a coisa mais importante é aprender como usar

00:05:34.799 --> 00:05:38.927
estas ferramenras apropriadamente. Há uma grande diferença entre, entre pessoas que

00:05:38.927 --> 00:05:43.456
sabem como usar estes algoritmos de aprendizagem, contra pessoas que não sabem

00:05:43.456 --> 00:05:47.626
como usar estas ferramentas bem. Aqui no Vale do Silício onde eu vivo, quando eu vou

00:05:47.626 --> 00:05:52.328
visitar diferentes companhias mesmo as melhores companhias do Vale do Silício muitas vezes eu vejo

00:05:52.328 --> 00:05:56.428
que pessoas estão tentando aplicar algoritmos de aprendizagem de máquina para alguns problemas e

00:05:56.428 --> 00:06:00.857
algumas vezes eles ficam nisso por seis meses. Mas algumas vezes quando eu olho para

00:06:00.857 --> 00:06:05.121
o que eles estão fazendo eu, eu, eu digo, você sabe, eu poderia dizer a eles, Jesus, eu poderia

00:06:05.121 --> 00:06:09.714
ter dito a vocês seis meses atrás que vocês deveriam ter pego um algoritmo de aprendizagem e

00:06:09.714 --> 00:06:14.470
aplicado de uma forma ligeiramente modificada e sua chance de sucesso teria sido

00:06:14.470 --> 00:06:19.648
muito maior. Então o que nós vamos fazer neste curso é atualmente gastar muito

00:06:19.648 --> 00:06:23.523
tempo falando sobre como, se você atualmente tentou desenvolver um sistema de

00:06:23.523 --> 00:06:27.596
aprendizagem de máquina, como fazer aquelas decisões do tipo de melhores práticas sobre a forma na qual você

00:06:27.596 --> 00:06:31.321
constrói o seu sistema então, quando você aplica algoritmo de aprendizagem, você terá

00:06:31.321 --> 00:06:35.394
menos chance de terminar como aquelas pessoas que perseguiam algum caminho por seis meses

00:06:35.394 --> 00:06:39.373
que, você sabe, alguém mais poderia ter visto que não funcionaria de

00:06:39.373 --> 00:06:43.515
modo algum e é só uma perda de tempo por seis meses. Então eu atualmente vou gastar

00:06:43.515 --> 00:06:47.707
muito tempo ensinando a você esses tipos de melhores práticas em aprendizagem de máquina e

00:06:47.707 --> 00:06:52.052
IA e como fazer essa coisa funcionar e como nós fazemos isso, como as melhores pessoas fazem no

00:06:52.052 --> 00:06:56.143
Vale do Silício e pelo mundo. Eu espero tornar você um dos melhores em

00:06:56.143 --> 00:06:59.905
saber como projetar e construir sistemas sérios de aprendizagem de máquina e IA. Então,

00:06:59.905 --> 00:07:04.698
isso é aprendizagem de máquina e estes são os tópicos principais que eu espero ensinar. No próximo

00:07:04.698 --> 00:07:09.023
vídeo eu vou definir o que é aprendizagem supervisionada e depois disso, o que

00:07:09.023 --> 00:07:13.757
é aprendizagem não-supervisionada. E também, começar a falar quando você poderia usar cada uma delas.