1 00:00:00,000 --> 00:00:04,904 Que é a aprendizaxe automática? Neste video tentaremos definir que é e tamén tentar 2 00:00:04,904 --> 00:00:09,520 ofrecervos unha idea de cando hai que empregar aprendizaxe automática. Incluso dentro dos 3 00:00:09,520 --> 00:00:14,252 profesionais da aprendizaxe automática non hai unha definición ben aceptada do que é e do que 4 00:00:14,252 --> 00:00:18,926 non é a aprendizaxe automática. Pero deixádeme amosarvos un par de exemplos de como a 5 00:00:18,926 --> 00:00:23,600 xente tentou definila. Aquí vai a definición do que é aprendizaxe automática 6 00:00:23,600 --> 00:00:28,520 segundo Arthur Samuel. El define a aprendizaxe automática coma o campo de estudo que dá 7 00:00:31,037 --> 00:00:33,554 ás computadoras a habilidade de aprender sen ter sido explicitamente programadas. O salto á fama de Samuel 8 00:00:33,554 --> 00:00:38,452 foi nos anos 50, cando escribiu un programa do xogo das damas. E o 9 00:00:38,452 --> 00:00:43,603 sorprendente deste programa do xogo das damas, foi que o mesmo Arthur Samuel 10 00:00:43,603 --> 00:00:48,268 non era un bo xogador de damas. Mais o que fixo foi programar a computadora para xogar 11 00:00:48,268 --> 00:00:52,245 decenas de milleiros de partidas contra si mesma, observando que tipos de posicións no 12 00:00:52,245 --> 00:00:56,698 taboleiro levaban á vitoria e que tipos de posicións levaban a derrotas. 13 00:00:56,698 --> 00:01:00,725 O programa do xogo de damas aprende co tempo cales son as 14 00:01:00,725 --> 00:01:04,713 boas posicións no taboleiro e cales son as malas. E finalmente aprende a xogar 15 00:01:04,713 --> 00:01:09,514 ás damas mellor do que Arthur Samuel é capaz el mesmo. Isto foi un resultado salientable. 16 00:01:09,514 --> 00:01:14,535 Aínda que Samuel non era un bo xogador de damas. Pero grazas 17 00:01:14,535 --> 00:01:19,254 a que a computadora ten a paciencia de xogar decenas de milleiros de veces contar si mesma. 18 00:01:19,254 --> 00:01:24,275 Ningún humano ten a paciencia de xogar tal cantidade de partidas. Facendo isto a computadora foi capaz 19 00:01:24,275 --> 00:01:29,235 de ter moita máis experiencia no xogo e finalmente converterse 20 00:01:29,235 --> 00:01:33,817 nun xogador de damas mellor ca Arthur Samuel mesmo. Esta é dalgunha maneira unha definición 21 00:01:33,817 --> 00:01:38,547 informal, e vella. Velaiquí outra definición algo máis recente de 22 00:01:38,547 --> 00:01:43,607 Tom Mitchell, que é un amigo, en Carnegie Mellon. Tom define a aprendizaxe automática dicindo 23 00:01:43,607 --> 00:01:48,819 que un problema de aprendizaxe ben proposto defínese do seguinte xeito. El di, 24 00:01:48,819 --> 00:01:53,843 un programa de computadora dise que aprende da experiencia E con respecto de certa tarefa T e cunha medida 25 00:01:53,843 --> 00:01:58,678 do rendemento P se esta medida sobre T medida por P mellora 26 00:01:58,678 --> 00:02:03,764 a experiencia E. Creo que chegou a esta definición para facer que rimase. 27 00:02:03,764 --> 00:02:08,346 Para o exemplo do xogo das damas, a experiencia E sería a 28 00:02:08,346 --> 00:02:13,253 experiencia de ter o programa xogando decenas de milleiros de partidas contra si mesmo. 29 00:02:13,253 --> 00:02:17,735 A tarefa T sería a tarefa de xogar ás damas. E a medida do rendemento P 30 00:02:17,735 --> 00:02:22,399 sería a probabilidade de gañar a seguinte partida de damas contra 31 00:02:22,399 --> 00:02:27,157 algún novo opoñente. A través destes vídeos, ademáis de tentar aprendervos a materia, 32 00:02:27,157 --> 00:02:32,291 ocasionalmente fareivos algunha pregunta para estar seguro de que entendedes 33 00:02:32,291 --> 00:02:36,891 o contido. Aquí vai unha. Na parte superior está a definición de aprendizaxe automática dada por Tom Michell 34 00:02:36,891 --> 00:02:42,292 Supoñamos que o voso xestor de correo electrónico observa que correos marcades ou non 35 00:02:42,292 --> 00:02:47,826 coma correo lixo. Nun cliente de correo coma este poderiades premer no botón de corro lixo para informar 36 00:02:47,826 --> 00:02:53,263 de que un correo é correo lixo pero outros non. E baseándose nos correos marcados coma 37 00:02:53,263 --> 00:02:59,046 lixo o voso programa aprende mellor como filtrar o correo lixo. 38 00:02:59,046 --> 00:03:04,290 Cal sería a tarefa T neste caso? Nuns intres o video parará. Cando o faga, 39 00:03:04,290 --> 00:03:09,598 podedes empregar o voso rato para seleccionar unha destas catro opcións para 40 00:03:09,598 --> 00:03:40,190 facerme saber cal destas catro pensades que é a resposta correcta a esta pregunta. 41 00:03:40,190 --> 00:03:45,747 Esa podería ser unha medida do rendemento P. E polo tanto, o rendemento da tarefa sobre a tarefa do noso sistema de 42 00:03:45,747 --> 00:03:50,529 rendemento sobre a tarefa T, con respecto da medida do rendemento P mellorará despois 43 00:03:50,529 --> 00:03:55,957 a experiencia E. Nesta clase espero aprendervos sobre diferentes tipos 44 00:03:55,957 --> 00:04:00,933 de algoritmos de aprendizaxe. Hai moitos tipos diferentes de algoritmos de aprendizaxe. 45 00:04:00,933 --> 00:04:05,650 Os dous principais son os chamados "aprendizaxe supervisada" e "aprendizaxe non supervisada" 46 00:04:05,650 --> 00:04:10,690 Definirei mellor o que significan estes termos no próximo par de videos. 47 00:04:10,690 --> 00:04:16,028 Pero dedúcese que na aprendizaxe supervisada, a idea, si, é que imos ensinar á 48 00:04:16,028 --> 00:04:20,513 computadora a facer algo, mentres que na aprendizaxe non supervisada imos deixar 49 00:04:20,513 --> 00:04:25,016 que aprenda por si mesma. Non vos preocupedes se estes dous termos non teñen sentido aínda, nos 50 00:04:25,016 --> 00:04:29,739 próximos dous vídeos heivos dicir exactamente que é o que son estes dous tipos de aprendizaxe. 51 00:04:29,739 --> 00:04:34,070 Escoitaredes tamén outros termos de moda coma aprendizaxe pro reforzo e sistemas 52 00:04:34,070 --> 00:04:38,621 de recomendación. Estes son outros tipos de algoritmos de aprendizaxe automática dos que falaremos 53 00:04:38,621 --> 00:04:42,460 máis adiante, pero os dous tipos de algoritmos de aprendizaxe máis empregados son probablemente 54 00:04:42,460 --> 00:04:46,791 aprendizaxe supervisada e aprendizaxe non supervisada e heinos definir nos dous 55 00:04:46,791 --> 00:04:51,123 próximos videos. E pasaremos a maior parte desta clase falando destes dous tipos de 56 00:04:51,123 --> 00:04:55,720 algoritmos de aprendizaxe. Resulta que unha das outras cousas coas pasaremos moito tempo 57 00:04:55,720 --> 00:05:00,054 nesta clase será o consello práctico de aplicación dos algoritmos de aprendizaxe. Isto 58 00:05:00,054 --> 00:05:04,444 é algo que me parece moi importante e que realmente é algo que 59 00:05:04,444 --> 00:05:08,167 non sei se se ensina noutras universidades. Ensinar sobre algoritmos de 60 00:05:08,167 --> 00:05:12,509 aprendizaxe é coma dar unha serie de ferramentas. E igual de importante ou 61 00:05:12,509 --> 00:05:17,616 máis importante ca dar ferramentas é ensinar como aplicar estas ferramentas. Gustaríame 62 00:05:17,616 --> 00:05:22,413 facer unha analoxía coa aprendizaxe para ser carpinteiro. Imaxinade que alguén vos 63 00:05:22,413 --> 00:05:26,959 está aprendendo como ser carpinteiro a divos "isto é un martelo, isto é 64 00:05:26,959 --> 00:05:31,077 un desparafusador, isto é unha serra... boa sorte". Ben, non é bo, ou? Vos 65 00:05:31,077 --> 00:05:34,799 tedes todas estas ferramentas, pero o máis importante é aprender como empregalas 66 00:05:34,799 --> 00:05:38,927 axeitadamente. Hai unha gran diferenza entre a xente que 67 00:05:38,927 --> 00:05:43,456 sabe como empregar estes algoritmos de aprendizaxe automática e aqueles qeu non 68 00:05:43,456 --> 00:05:47,626 saben como empregalos ben. Aquí en Silicon Valley onde vivimos, cando vou 69 00:05:47,626 --> 00:05:52,328 visitar diferentes compañías, incluso algusnhas das mási importantes de silicon Valley, a miudo vexo 70 00:05:52,328 --> 00:05:56,428 xente tentando aplicar algoritmos de aprendizaxe automática a algún problema e 71 00:05:56,428 --> 00:06:00,857 ás veces facéndoo durante seis meses. Pero ás veces cando vexo 72 00:06:00,857 --> 00:06:05,121 o que están a facer, eu dígo, sabes? podería terlles dito, carai! 73 00:06:05,121 --> 00:06:09,714 podería tervos dito hai seis meses que deberiades empregar un algoritmo de aprendizaxe e 74 00:06:09,714 --> 00:06:14,470 aplicalo deste xeito un pouco modificado, e as vosas probabilidades de éxito terían 75 00:06:14,470 --> 00:06:19,648 sido moito máis altas. Asi que o que imos facer nesta clase é realmente pasar moito 76 00:06:19,648 --> 00:06:23,523 tempo falando de como, se realmente tentades desenvolver un sistema de aprendizaxe 77 00:06:23,523 --> 00:06:27,596 automática, como facer que estas boas prácticas tipos decisión sobre o xeito no cal 78 00:06:27,596 --> 00:06:31,321 construides o voso sistema para que cando esteades cosntruindo o voso algoritmo por primeira vez 79 00:06:35,394 --> 00:06:39,373 Alguén podería terse decatado de que non ía funcionar 80 00:06:39,373 --> 00:06:43,515 en absoluto e é unha perda de tempo de seis meses. Asi qeu vou pasar realmente 81 00:06:43,515 --> 00:06:47,707 moito tempo aprendéndovos ese tipo de boas prácticas en aprendizaxe automática e 82 00:06:47,707 --> 00:06:52,052 IA e como facer que esta materia funcione e como facemos, como os mellores o fan 83 00:06:52,052 --> 00:06:56,143 en Silicon Valley e no mundo enteiro. Espero convertervos nuns dos mellores en 84 00:06:56,143 --> 00:06:59,905 saber como deseñar e construír sistemas de aprendizaxe automática e IA serios. Asi que, 85 00:06:59,905 --> 00:07:04,698 isto é aprendizaxe automática e estes son os prncipais temas que espero ensinar. No seguinte 86 00:07:04,698 --> 00:07:09,023 video vou definir que é aprendizaxe supervisada e despois diso, 87 00:07:09,023 --> 00:07:13,757 que é aprendizaxe non supervisada. E tamén empezar a falar de cando debedes empregar cada unha delas.