0:00:00.000,0:00:04.904 O que é aprendizagem de máquina? Neste vídeo nós tentaremos definir o que é e também tentar 0:00:04.904,0:00:09.520 dar a vocês um senso que quando usar aprendizagem de máquina. Mesmo entre praticantes de 0:00:09.520,0:00:14.252 aprendizagem de máquina não há uma definição bem aceita do que é e o que 0:00:14.252,0:00:18.926 não é aprendizagem de máquina. Mas deixem-me mostrar a vocês alguns exemplos de formas que 0:00:18.926,0:00:23.600 pessoas tentaram definí-la. Aqui está a definição do que é aprendizagem de máquina 0:00:23.600,0:00:28.520 para Arthur Samuel. Ele definiu aprendizagem de máquina como o campo de estudo que dá 0:00:31.037,0:00:33.554 aos computadores a habilidade de aprender sem ser programado explicitamente. O aparecimento de Samuel 0:00:33.554,0:00:38.452 para a fama foi que nos anos 50, ele escreveu um programa jogador de damas. E a 0:00:38.452,0:00:43.603 coisa incrível sobre este programa é que o próprio Arthur Samuel 0:00:43.603,0:00:48.268 não era um bom jogador de damas. Mas o que ele fez foi, ele teve que programar para que o programa jogasse 0:00:48.268,0:00:52.245 10 de 1000 games contra ele mesmo. E assistindo quais tipos de posições 0:00:52.245,0:00:56.698 de tabuleiro tendiam a levar a vitórias, e quais tipos de posições de tabuleiro tendiam a levar a 0:00:56.698,0:01:00.725 derrotas. O programa jogador de damas aprendeu com o tempo quais são as posições de 0:01:00.725,0:01:04.713 tabuleiro boas e quais são as posições de tabuleiro ruins. E eventualmente aprendeu a jogar 0:01:04.713,0:01:09.514 damas melhor que o próprio Arthur Samuel era capaz. Isto foi um resultado notável. 0:01:09.514,0:01:14.535 Mesmo Samuel não sendo um bom jogador de damas. Mas porque o 0:01:14.535,0:01:19.254 computador teve a paciência de jogar milhares de jogos sozinho. Nenhum 0:01:19.254,0:01:24.275 humano tem a paciência de jogar tantos jogos. Mas fazendo isto o computador foi capaz 0:01:24.275,0:01:29.235 de conseguir tanta experiência em jogos de dama que ele eventualmente se tornou um 0:01:29.235,0:01:33.817 jogador melhor do que o próprio Arthur Samuel. Isto é uma definição um 0:01:33.817,0:01:38.547 pouco informal ,e antiga. Aqui há uma definição mais recente por Tom 0:01:38.547,0:01:43.607 Mitchell, que é um amigo da Carnegie Mellon. Então Tom define aprendizagem de máquina 0:01:43.607,0:01:48.819 dizendo isso, um problema de aprendizagem bem colocado e definido como segue. Ele diz, um programa 0:01:48.819,0:01:53.843 de computador é orientado para aprender da experiência E, com respeito a alguma tarefa T, e alguma 0:01:53.843,0:01:58.678 medida de performance P, se sua performance em T como medida por P melhora 0:01:58.678,0:02:03.764 com a experiência E. Eu atualmente acho que ele criou esta definição apenas para deixá-la com 0:02:03.764,0:02:08.346 rima. Para o exemplo do jogo de damas a experiência E será a 0:02:08.346,0:02:13.253 experiência de fazer o programa jogar 10000 jogos contra ele mesmo. A 0:02:13.253,0:02:17.735 tarefa T será a tarefa de jogar damas. E a medida de performance P 0:02:17.735,0:02:22.399 será a probabilidade que ele ganhe o próximo jogo de damas contra 0:02:22.399,0:02:27.157 algum novo oponente. Durante esses vídeos, além de tentar ensinar a vocês, 0:02:27.157,0:02:32.291 eu irei ocasionalmente fazer perguntas a vocês para assegurar que vocês entenderam o 0:02:32.291,0:02:36.891 conteúdo. Aqui está uma, no topo está a definição de aprendizagem de máquina de Tom 0:02:36.891,0:02:42.292 Mitchell. Vamos dizer que seu programa de email observa quais email você assinala ou não 0:02:42.292,0:02:47.826 como spam. Então em um cliente de email como este você pode clicar neste botão de spam para reportar 0:02:47.826,0:02:53.263 algum email como spam, mas não outros emails. E baseado em quais emails você marca como 0:02:53.263,0:02:59.046 spam, seu programa de email aprende melhor como filtrar email de spam. O que é a 0:02:59.046,0:03:04.290 tarefa T neste caso? Em poucos segundos, o vídeo irá pausar. E quando isso acontecer 0:03:04.290,0:03:09.598 você pode usar seu mouse para selecionar um destas quatro opções para me informar 0:03:09.598,0:03:40.190 qual destes quatro você acha que é a resposta certa para esta questão. 0:03:40.190,0:03:45.747 Isso pode ser uma medida de performance P. E então, nossa performance na tarefa T 0:03:45.747,0:03:50.529 irá melhorar depois da 0:03:50.529,0:03:55.957 experiência E. Neste curso eu espero ensinar a vocês sobre vários tipos diferentes de 0:03:55.957,0:04:00.933 algoritmos de aprendizagem de máquina. Há vários tipos de algoritmos de aprendizagem. 0:04:00.933,0:04:05.650 Os dois tipos principais são os que chamados de aprendizagem supervisionada e aprendizagem 0:04:05.650,0:04:10.690 não-supervisionada. Eu definirei o que esses termos significam nos próximos vídeos. Mas 0:04:10.690,0:04:16.028 em aprendizagem supervisionada a idéia é que nos vamos ensinar o 0:04:16.028,0:04:20.513 computador como fazer alguma coisa, já em aprendizagem não-supervisionada nós vamos permitir 0:04:20.513,0:04:25.016 que ele aprenda sozinho. Não se preocupe se estes dois termos não fazem sentido ainda, nos 0:04:25.016,0:04:29.739 próximos dois vídeos eu vou dizer exatamente o que são estes dois tipos de aprendizagem. Você 0:04:29.739,0:04:34.070 também irá ouvir outros termos tais como aprendizagem por reforço e sistemas 0:04:34.070,0:04:38.621 recomendadores. Há outros tipos de algoritmos de aprendizagem que nós falaremos 0:04:38.621,0:04:42.460 mais tarde mas os dois tipos mais usados são provavelmente 0:04:42.460,0:04:46.791 o de aprendizagem supervisionado e o de aprendizagem não-supervisionada e eu irei definí-las nos próximos 0:04:46.791,0:04:51.123 dois vídeos e gastaremos a maior parte da aula falando sobre estes dois tipos de 0:04:51.123,0:04:55.720 algoritmos de aprendizagem. Acontece que uma das coisas em que gastaremos muito tempo 0:04:55.720,0:05:00.054 neste curso é o conselho prático para aplicar algoritmos de aprendizagem. Isto é 0:05:00.054,0:05:04.444 algo que eu sinto ser muito forte sobre isso, e é atualmente algo que eu 0:05:04.444,0:05:08.167 não sei de qualquer outra universidade que ensine. Ensinar algoritmos de 0:05:08.167,0:05:12.509 aprendizagem é como dar a você um conjunto de ferramentas, e igualmente importante ou mais 0:05:12.509,0:05:17.616 importante que dar a você as ferramentas é ensinar a você como aplicar estas ferramentas. Eu gosto 0:05:17.616,0:05:22.413 de fazer uma analogia com aprender a se tornar um carpinteiro. Imagine que alguém está 0:05:22.413,0:05:26.959 ensinado a você como ser um carpinteiro e eles dizem: aqui está um martelo, aqui está uma 0:05:26.959,0:05:31.077 chave de fenda, aqui está um serrote, boa sorte. Bem, isso não é bom, certo? Você, você, você 0:05:31.077,0:05:34.799 tem todas estas ferramentas, mas a coisa mais importante é aprender como usar 0:05:34.799,0:05:38.927 estas ferramenras apropriadamente. Há uma grande diferença entre, entre pessoas que 0:05:38.927,0:05:43.456 sabem como usar estes algoritmos de aprendizagem, contra pessoas que não sabem 0:05:43.456,0:05:47.626 como usar estas ferramentas bem. Aqui no Vale do Silício onde eu vivo, quando eu vou 0:05:47.626,0:05:52.328 visitar diferentes companhias mesmo as melhores companhias do Vale do Silício muitas vezes eu vejo 0:05:52.328,0:05:56.428 que pessoas estão tentando aplicar algoritmos de aprendizagem de máquina para alguns problemas e 0:05:56.428,0:06:00.857 algumas vezes eles ficam nisso por seis meses. Mas algumas vezes quando eu olho para 0:06:00.857,0:06:05.121 o que eles estão fazendo eu, eu, eu digo, você sabe, eu poderia dizer a eles, Jesus, eu poderia 0:06:05.121,0:06:09.714 ter dito a vocês seis meses atrás que vocês deveriam ter pego um algoritmo de aprendizagem e 0:06:09.714,0:06:14.470 aplicado de uma forma ligeiramente modificada e sua chance de sucesso teria sido 0:06:14.470,0:06:19.648 muito maior. Então o que nós vamos fazer neste curso é atualmente gastar muito 0:06:19.648,0:06:23.523 tempo falando sobre como, se você atualmente tentou desenvolver um sistema de 0:06:23.523,0:06:27.596 aprendizagem de máquina, como fazer aquelas decisões do tipo de melhores práticas sobre a forma na qual você 0:06:27.596,0:06:31.321 constrói o seu sistema então, quando você aplica algoritmo de aprendizagem, você terá 0:06:31.321,0:06:35.394 menos chance de terminar como aquelas pessoas que perseguiam algum caminho por seis meses 0:06:35.394,0:06:39.373 que, você sabe, alguém mais poderia ter visto que não funcionaria de 0:06:39.373,0:06:43.515 modo algum e é só uma perda de tempo por seis meses. Então eu atualmente vou gastar 0:06:43.515,0:06:47.707 muito tempo ensinando a você esses tipos de melhores práticas em aprendizagem de máquina e 0:06:47.707,0:06:52.052 IA e como fazer essa coisa funcionar e como nós fazemos isso, como as melhores pessoas fazem no 0:06:52.052,0:06:56.143 Vale do Silício e pelo mundo. Eu espero tornar você um dos melhores em 0:06:56.143,0:06:59.905 saber como projetar e construir sistemas sérios de aprendizagem de máquina e IA. Então, 0:06:59.905,0:07:04.698 isso é aprendizagem de máquina e estes são os tópicos principais que eu espero ensinar. No próximo 0:07:04.698,0:07:09.023 vídeo eu vou definir o que é aprendizagem supervisionada e depois disso, o que 0:07:09.023,0:07:13.757 é aprendizagem não-supervisionada. E também, começar a falar quando você poderia usar cada uma delas.