WEBVTT 00:00:00.000 --> 00:00:04.904 Que é a aprendizaxe automática? Neste video tentaremos definir que é e tamén tentar 00:00:04.904 --> 00:00:09.520 ofrecervos unha idea de cando hai que empregar aprendizaxe automática. Incluso dentro dos 00:00:09.520 --> 00:00:14.252 profesionais da aprendizaxe automática non hai unha definición ben aceptada do que é e do que 00:00:14.252 --> 00:00:18.926 non é a aprendizaxe automática. Pero deixádeme amosarvos un par de exemplos de como a 00:00:18.926 --> 00:00:23.600 xente tentou definila. Aquí vai a definición do que é aprendizaxe automática 00:00:23.600 --> 00:00:28.520 segundo Arthur Samuel. El define a aprendizaxe automática coma o campo de estudo que dá 00:00:31.037 --> 00:00:33.554 ás computadoras a habilidade de aprender sen ter sido explicitamente programadas. O salto á fama de Samuel 00:00:33.554 --> 00:00:38.452 foi nos anos 50, cando escribiu un programa do xogo das damas. E o 00:00:38.452 --> 00:00:43.603 sorprendente deste programa do xogo das damas, foi que o mesmo Arthur Samuel 00:00:43.603 --> 00:00:48.268 non era un bo xogador de damas. Mais o que fixo foi programar a computadora para xogar 00:00:48.268 --> 00:00:52.245 decenas de milleiros de partidas contra si mesma, observando que tipos de posicións no 00:00:52.245 --> 00:00:56.698 taboleiro levaban á vitoria e que tipos de posicións levaban a derrotas. 00:00:56.698 --> 00:01:00.725 O programa do xogo de damas aprende co tempo cales son as 00:01:00.725 --> 00:01:04.713 boas posicións no taboleiro e cales son as malas. E finalmente aprende a xogar 00:01:04.713 --> 00:01:09.514 ás damas mellor do que Arthur Samuel é capaz el mesmo. Isto foi un resultado salientable. 00:01:09.514 --> 00:01:14.535 Aínda que Samuel non era un bo xogador de damas. Pero grazas 00:01:14.535 --> 00:01:19.254 a que a computadora ten a paciencia de xogar decenas de milleiros de veces contar si mesma. 00:01:19.254 --> 00:01:24.275 Ningún humano ten a paciencia de xogar tal cantidade de partidas. Facendo isto a computadora foi capaz 00:01:24.275 --> 00:01:29.235 de ter moita máis experiencia no xogo e finalmente converterse 00:01:29.235 --> 00:01:33.817 nun xogador de damas mellor ca Arthur Samuel mesmo. Esta é dalgunha maneira unha definición 00:01:33.817 --> 00:01:38.547 informal, e vella. Velaiquí outra definición algo máis recente de 00:01:38.547 --> 00:01:43.607 Tom Mitchell, que é un amigo, en Carnegie Mellon. Tom define a aprendizaxe automática dicindo 00:01:43.607 --> 00:01:48.819 que un problema de aprendizaxe ben proposto defínese do seguinte xeito. El di, 00:01:48.819 --> 00:01:53.843 un programa de computadora dise que aprende da experiencia E con respecto de certa tarefa T e cunha medida 00:01:53.843 --> 00:01:58.678 do rendemento P se esta medida sobre T medida por P mellora 00:01:58.678 --> 00:02:03.764 a experiencia E. Creo que chegou a esta definición para facer que rimase. 00:02:03.764 --> 00:02:08.346 Para o exemplo do xogo das damas, a experiencia E sería a 00:02:08.346 --> 00:02:13.253 experiencia de ter o programa xogando decenas de milleiros de partidas contra si mesmo. 00:02:13.253 --> 00:02:17.735 A tarefa T sería a tarefa de xogar ás damas. E a medida do rendemento P 00:02:17.735 --> 00:02:22.399 sería a probabilidade de gañar a seguinte partida de damas contra 00:02:22.399 --> 00:02:27.157 algún novo opoñente. A través destes vídeos, ademáis de tentar aprendervos a materia, 00:02:27.157 --> 00:02:32.291 ocasionalmente fareivos algunha pregunta para estar seguro de que entendedes 00:02:32.291 --> 00:02:36.891 o contido. Aquí vai unha. Na parte superior está a definición de aprendizaxe automática dada por Tom Michell 00:02:36.891 --> 00:02:42.292 Supoñamos que o voso xestor de correo electrónico observa que correos marcades ou non 00:02:42.292 --> 00:02:47.826 coma correo lixo. Nun cliente de correo coma este poderiades premer no botón de corro lixo para informar 00:02:47.826 --> 00:02:53.263 de que un correo é correo lixo pero outros non. E baseándose nos correos marcados coma 00:02:53.263 --> 00:02:59.046 lixo o voso programa aprende mellor como filtrar o correo lixo. 00:02:59.046 --> 00:03:04.290 Cal sería a tarefa T neste caso? Nuns intres o video parará. Cando o faga, 00:03:04.290 --> 00:03:09.598 podedes empregar o voso rato para seleccionar unha destas catro opcións para 00:03:09.598 --> 00:03:40.190 facerme saber cal destas catro pensades que é a resposta correcta a esta pregunta. 00:03:40.190 --> 00:03:45.747 Esa podería ser unha medida do rendemento P. E polo tanto, o rendemento da tarefa sobre a tarefa do noso sistema de 00:03:45.747 --> 00:03:50.529 rendemento sobre a tarefa T, con respecto da medida do rendemento P mellorará despois 00:03:50.529 --> 00:03:55.957 a experiencia E. Nesta clase espero aprendervos sobre diferentes tipos 00:03:55.957 --> 00:04:00.933 de algoritmos de aprendizaxe. Hai moitos tipos diferentes de algoritmos de aprendizaxe. 00:04:00.933 --> 00:04:05.650 Os dous principais son os chamados "aprendizaxe supervisada" e "aprendizaxe non supervisada" 00:04:05.650 --> 00:04:10.690 Definirei mellor o que significan estes termos no próximo par de videos. 00:04:10.690 --> 00:04:16.028 Pero dedúcese que na aprendizaxe supervisada, a idea, si, é que imos ensinar á 00:04:16.028 --> 00:04:20.513 computadora a facer algo, mentres que na aprendizaxe non supervisada imos deixar 00:04:20.513 --> 00:04:25.016 que aprenda por si mesma. Non vos preocupedes se estes dous termos non teñen sentido aínda, nos 00:04:25.016 --> 00:04:29.739 próximos dous vídeos heivos dicir exactamente que é o que son estes dous tipos de aprendizaxe. 00:04:29.739 --> 00:04:34.070 Escoitaredes tamén outros termos de moda coma aprendizaxe pro reforzo e sistemas 00:04:34.070 --> 00:04:38.621 de recomendación. Estes son outros tipos de algoritmos de aprendizaxe automática dos que falaremos 00:04:38.621 --> 00:04:42.460 máis adiante, pero os dous tipos de algoritmos de aprendizaxe máis empregados son probablemente 00:04:42.460 --> 00:04:46.791 aprendizaxe supervisada e aprendizaxe non supervisada e heinos definir nos dous 00:04:46.791 --> 00:04:51.123 próximos videos. E pasaremos a maior parte desta clase falando destes dous tipos de 00:04:51.123 --> 00:04:55.720 algoritmos de aprendizaxe. Resulta que unha das outras cousas coas pasaremos moito tempo 00:04:55.720 --> 00:05:00.054 nesta clase será o consello práctico de aplicación dos algoritmos de aprendizaxe. Isto 00:05:00.054 --> 00:05:04.444 é algo que me parece moi importante e que realmente é algo que 00:05:04.444 --> 00:05:08.167 non sei se se ensina noutras universidades. Ensinar sobre algoritmos de 00:05:08.167 --> 00:05:12.509 aprendizaxe é coma dar unha serie de ferramentas. E igual de importante ou 00:05:12.509 --> 00:05:17.616 máis importante ca dar ferramentas é ensinar como aplicar estas ferramentas. Gustaríame 00:05:17.616 --> 00:05:22.413 facer unha analoxía coa aprendizaxe para ser carpinteiro. Imaxinade que alguén vos 00:05:22.413 --> 00:05:26.959 está aprendendo como ser carpinteiro a divos "isto é un martelo, isto é 00:05:26.959 --> 00:05:31.077 un desparafusador, isto é unha serra... boa sorte". Ben, non é bo, ou? Vos 00:05:31.077 --> 00:05:34.799 tedes todas estas ferramentas, pero o máis importante é aprender como empregalas 00:05:34.799 --> 00:05:38.927 axeitadamente. Hai unha gran diferenza entre a xente que 00:05:38.927 --> 00:05:43.456 sabe como empregar estes algoritmos de aprendizaxe automática e aqueles qeu non 00:05:43.456 --> 00:05:47.626 saben como empregalos ben. Aquí en Silicon Valley onde vivimos, cando vou 00:05:47.626 --> 00:05:52.328 visitar diferentes compañías, incluso algusnhas das mási importantes de silicon Valley, a miudo vexo 00:05:52.328 --> 00:05:56.428 xente tentando aplicar algoritmos de aprendizaxe automática a algún problema e 00:05:56.428 --> 00:06:00.857 ás veces facéndoo durante seis meses. Pero ás veces cando vexo 00:06:00.857 --> 00:06:05.121 o que están a facer, eu dígo, sabes? podería terlles dito, carai! 00:06:05.121 --> 00:06:09.714 podería tervos dito hai seis meses que deberiades empregar un algoritmo de aprendizaxe e 00:06:09.714 --> 00:06:14.470 aplicalo deste xeito un pouco modificado, e as vosas probabilidades de éxito terían 00:06:14.470 --> 00:06:19.648 sido moito máis altas. Asi que o que imos facer nesta clase é realmente pasar moito 00:06:19.648 --> 00:06:23.523 tempo falando de como, se realmente tentades desenvolver un sistema de aprendizaxe 00:06:23.523 --> 00:06:27.596 automática, como facer que estas boas prácticas tipos decisión sobre o xeito no cal 00:06:27.596 --> 00:06:31.321 construides o voso sistema para que cando esteades cosntruindo o voso algoritmo por primeira vez 00:06:35.394 --> 00:06:39.373 Alguén podería terse decatado de que non ía funcionar 00:06:39.373 --> 00:06:43.515 en absoluto e é unha perda de tempo de seis meses. Asi qeu vou pasar realmente 00:06:43.515 --> 00:06:47.707 moito tempo aprendéndovos ese tipo de boas prácticas en aprendizaxe automática e 00:06:47.707 --> 00:06:52.052 IA e como facer que esta materia funcione e como facemos, como os mellores o fan 00:06:52.052 --> 00:06:56.143 en Silicon Valley e no mundo enteiro. Espero convertervos nuns dos mellores en 00:06:56.143 --> 00:06:59.905 saber como deseñar e construír sistemas de aprendizaxe automática e IA serios. Asi que, 00:06:59.905 --> 00:07:04.698 isto é aprendizaxe automática e estes son os prncipais temas que espero ensinar. No seguinte 00:07:04.698 --> 00:07:09.023 video vou definir que é aprendizaxe supervisada e despois diso, 00:07:09.023 --> 00:07:13.757 que é aprendizaxe non supervisada. E tamén empezar a falar de cando debedes empregar cada unha delas.