WEBVTT 00:00:00.000 --> 00:00:04.090 Шта је машинско учење? У овом видеу ћемо покушати да дефинишемо шта је то и покушати 00:00:04.090 --> 00:00:09.051 да вам дамо осећај када желите да користите машинско учење. Чак и међу 00:00:09.051 --> 00:00:14.025 онима који се баве машинским учењем не постоји опште прихваћена дефиниција шта је а шта 00:00:14.025 --> 00:00:18.092 није машинско учење. Али дозволите ми да вам покажем пар примера на који начин 00:00:18.092 --> 00:00:23.060 су људи покушали да га дефинишу. Ево дефиниције шта је машинско учење 00:00:23.060 --> 00:00:28.051 по Артуру Семјуелу. Он је дефинисао машинско учење као студијско поље које даје 00:00:28.051 --> 00:00:33.055 рачунарима могућност да уче без да бивају експлицитно програмирани. Семјуелов тренутак 00:00:33.055 --> 00:00:38.045 славе се збио 1950-их, када је наприсао програм за играње даме. И 00:00:38.045 --> 00:00:43.060 запањујућа ствар у вези са програмом за играње даме, је била да сам Артур Семјуел 00:00:43.060 --> 00:00:48.026 није био веома добар играч даме. Али оно што је он урадио, је да је програмирао рачунар да игра 00:00:48.026 --> 00:00:52.024 десетине хиљада игара против себе. А такође гледањем које врсте позиција 00:00:52.024 --> 00:00:56.069 на табли су склони да воде до победе, и која врста позиција на табли је склона да води ка 00:00:56.069 --> 00:01:00.072 поразима. Програм за играње даме, учи током времена шта су добре позиције 00:01:00.072 --> 00:01:04.071 на табли а шта су лоше позиције на табли. И као исход, научио је да игра 00:01:04.071 --> 00:01:09.051 даму боље него је што Артур Семјуел био у стању да игра. Ово је био изванредан резултат. 00:01:09.051 --> 00:01:14.053 Испоставило да сам Артур Семјуел није био нарочито добар играч даме, али зато је 00:01:14.053 --> 00:01:19.025 рачунар имао стрпљења да игра десетине хиљада игара самостално. Ниједан 00:01:19.025 --> 00:01:24.027 човек нема стрпљења да игра толико пуно игара. На тај начин рачунар је био у стању 00:01:24.027 --> 00:01:29.023 да стекне пуно искуства у игрању даме, тако да је коначно постао 00:01:29.023 --> 00:01:33.081 бољи играч даме од самог Артура Семјуела. Ово је више неформална 00:01:33.081 --> 00:01:38.054 и једна од старијих дефиниција. Ево нешто новије дефиниције од Тома 00:01:38.054 --> 00:01:43.060 Мичела, који је пријатељ са Карнеги Мелон универзитета. Том дефинише машинско учење 00:01:43.060 --> 00:01:48.081 говорећи да је добро постављен проблем машинског учења дефинисан на следећи начин. Каже се да рачунарски 00:01:48.081 --> 00:01:53.084 програм учи из искуства E, у односу на неки задатак T, и неку 00:01:53.084 --> 00:01:58.067 меру учинка P, ако се тај учинак задатка Т мерен са P побољшава 00:01:58.067 --> 00:02:03.076 искуством E. У ствари ја мислим да је он у ствари смислио ову дефиницију само да би се 00:02:03.076 --> 00:02:08.034 римовала. За пример играња даме, искуство E би било 00:02:08.034 --> 00:02:13.025 искуство које програм стиче играјући десетине хиљада игара против себе. 00:02:13.025 --> 00:02:17.073 Задатак T, би био задатак играња даме. А мера учинка P 00:02:17.073 --> 00:02:22.039 би била вероватноћа да ће добити следећу игру даме против 00:02:22.039 --> 00:02:27.015 неког новог противника. Кроз ове видео снимке, поред тога што ћу пробати да вас научим 00:02:27.015 --> 00:02:32.029 новим стварима, повремено ћу вас питати питање да бих био сигуран да разумете 00:02:32.029 --> 00:02:36.089 садржај. Ево и једне од најбољих дефиниција машинског учења од стране Тома 00:02:36.089 --> 00:02:42.029 Мичела. Рецимо да ваш и-мејл програм гледа и-мејлове које ви означавате или не означавате 00:02:42.029 --> 00:02:47.082 као спам. Тако у и-мејл клијенту као што је овај можете кликнти ово спам дугме да означите 00:02:47.082 --> 00:02:53.026 неке и-мејлове као спам, а остале не. На основу тога које и-мејлове сте означили као 00:02:53.026 --> 00:02:59.004 спам, ваш и-мејл програм боље учи како да филтрира спам и-мејлове. Шта је 00:02:59.004 --> 00:03:04.028 задатак T у овој ситуацији? За пар секунди, видео ће се зауставити. Када се то деси, 00:03:04.028 --> 00:03:09.059 можете користити вашег миша да селектујете једну од четири опције, да ми кажете 00:03:09.059 --> 00:03:40.018 за који од ових четири мислите да је прави одговор на питање. То би могло 00:03:40.018 --> 00:03:45.074 да буде мера учинковитости P. Према томе, учинковитост нашег задатка, системска 00:03:45.074 --> 00:03:50.052 учинковитости на задатку T, тј. мера учинковитости P, ће се побољшати након 00:03:50.052 --> 00:03:55.095 искуства E. Надам се да ћу вас на овом часу научити о различитим типовима 00:03:55.095 --> 00:04:00.093 алгоритама машинског учења. Постоји неколико различитих типова алгоритама машинског учења. 00:04:00.093 --> 00:04:05.065 Два главна типа су оно што називамо надзирано и ненадзирано 00:04:05.065 --> 00:04:10.068 учење. У следећих неколико видео снимака ћу дефинисати шта ови термини значе. Али 00:04:10.068 --> 00:04:16.002 у надзираном учењу, идеја је да ћемо ми научити 00:04:16.002 --> 00:04:20.051 рачунар како да уради нешто, док ћемо у ненадзираном учењу пустити 00:04:20.051 --> 00:04:25.001 рачунар да то ради сам. Не брините уколико вам ова два термина тренутно немају смисла, у 00:04:25.001 --> 00:04:29.073 следећа два видео снимка ја ћу вам тачно рећи шта су ова два типа машинског учења. 00:04:29.073 --> 00:04:34.006 Такође ћете чути остале актуелне термине као што су учење условљавањем (енг. reinforcement learning) и 00:04:34.006 --> 00:04:38.062 системи за препоручивање (recommender systems). Ово су други типови алгоритама машинског учења о којима ћемо говорити 00:04:38.062 --> 00:04:42.045 касније а два најкоришћенија типа алгоритама за машинско учење су вероватно 00:04:42.045 --> 00:04:46.079 надзирано (supervised) и ненадзирано учење (unsupervised learning) и ја ћу их дефинисати у следећа 00:04:46.079 --> 00:04:51.012 два видео снимка и провешћу већину часа говорећи о ова два типа 00:04:51.012 --> 00:04:55.072 алгоритма машинског учења. Једна од ствари на коју ћу потрошити доста времена 00:04:55.072 --> 00:05:00.005 на овом часу су практични савети за примену алгоритама за машинско учење. Ово је 00:05:00.005 --> 00:05:04.044 нешто што ми је врло битно, и то је заправо нешто за што 00:05:04.044 --> 00:05:08.016 не знам да се учи на било ком другом универзитету. Учење о алгоритмима машинског учења 00:05:08.016 --> 00:05:12.050 је као да вам неко да сет алата. Једнако важено или још 00:05:12.050 --> 00:05:17.061 важније од тога да вам неко да алате, јесте да вас научи како да примените те алате. Ја волим да 00:05:17.061 --> 00:05:22.041 направим аналогију са учењем за столара. Замислите да вас неко 00:05:22.041 --> 00:05:26.095 учи како да постанете столар и он вам каже ево чекић, ево 00:05:31.007 --> 00:05:34.079 Имате све те алате, али још важнија ствар је да научите како да користите 00:05:34.079 --> 00:05:38.092 ове алате на прави начин. Постоји огромна разлика између људи који 00:05:38.092 --> 00:05:43.045 знају како да користе алгоритме за машинско учење, наспрам људи који не знају 00:05:43.045 --> 00:05:47.062 како да користе ове алате на прави начин. Овде у Силицијумској долини где ја живи, када идем да 00:05:47.062 --> 00:05:52.032 посетим различите компаније, чак и у најбољим компанијама у Силицијумској долини веома често видим 00:05:52.032 --> 00:05:56.042 да људи покушавају да примене алгоритме машинског учења на неки проблем и 00:05:56.042 --> 00:06:00.085 понекад то раде по шест месеци. Али понекад када погледам на 00:06:00.085 --> 00:06:05.012 то шта су урадили, кажем им - забога, могао сам 00:06:05.012 --> 00:06:09.071 да вам кажем шест пре месеци да је требало да узмете алгоритам за машинско учење и 00:06:09.071 --> 00:06:14.047 да га примените на незнатно модификован начин и ваше шансе за успех би биле 00:06:14.047 --> 00:06:19.064 много веће. Према томе оно што ћемо урадити на овом часу је заправо да потрошимо много 00:06:19.064 --> 00:06:23.052 времена причајући о томе како, уколико покушате да развијете систем за машинско учење, 00:06:23.052 --> 00:06:27.059 како да направите одлуке у складу са најбољом праксом, о начину на који да 00:06:27.059 --> 00:06:31.032 изградите ваш систем тако да, када примените алгоритам машинског учења, буде мање 00:06:31.032 --> 00:06:35.039 вероватно да ћете завршити као један од тих људи који су завршили шест месеци тражећи 00:06:35.039 --> 00:06:39.037 прави пут. Неко други би могао помислити да то једноставно уопште неће радити 00:06:39.037 --> 00:06:43.051 и да је то само протраћених шест месеци. Зато намеравам да потрошим 00:06:43.051 --> 00:06:47.070 доста времена учећи вас тим врстама најбољих пракси у машинском учењу и 00:06:47.070 --> 00:06:52.005 ВИ (вештачкој интелигенцији) и како да натерате те ствари да раде и како ми то радимо, како најбољи људи то раде у 00:06:52.005 --> 00:06:56.014 Силицијумској долини и у целом свету. Надам се да ћу направити од вас неке од најбољих стручњака 00:06:56.014 --> 00:06:59.090 који ће знати како да дизајнирају и праве озбиљне системе машинског учења и АИ системе. Дакле, 00:06:59.090 --> 00:07:04.069 ово је машинско учење и ово су главне теме за које се надам да ћу да вас научим. У следећем 00:07:04.069 --> 00:07:09.002 видеу ћу дефинисати шта је надгледано учење а после тога, шта 00:07:09.002 --> 00:07:13.075 је ненадгледано учење. Након тога, причаћу о томе када би се могло употребити свако од њих.