0:00:00.000,0:00:04.090 Шта је машинско учење? У овом видеу ћемо покушати да дефинишемо шта је то и покушати 0:00:04.090,0:00:09.051 да вам дамо осећај када желите да користите машинско учење. Чак и међу 0:00:09.051,0:00:14.025 онима који се баве машинским учењем не постоји опште прихваћена дефиниција шта је а шта 0:00:14.025,0:00:18.092 није машинско учење. Али дозволите ми да вам покажем пар примера на који начин 0:00:18.092,0:00:23.060 су људи покушали да га дефинишу. Ево дефиниције шта је машинско учење 0:00:23.060,0:00:28.051 по Артуру Семјуелу. Он је дефинисао машинско учење као студијско поље које даје 0:00:28.051,0:00:33.055 рачунарима могућност да уче без да бивају експлицитно програмирани. Семјуелов тренутак 0:00:33.055,0:00:38.045 славе се збио 1950-их, када је наприсао програм за играње даме. И 0:00:38.045,0:00:43.060 запањујућа ствар у вези са програмом за играње даме, је била да сам Артур Семјуел 0:00:43.060,0:00:48.026 није био веома добар играч даме. Али оно што је он урадио, је да је програмирао рачунар да игра 0:00:48.026,0:00:52.024 десетине хиљада игара против себе. А такође гледањем које врсте позиција 0:00:52.024,0:00:56.069 на табли су склони да воде до победе, и која врста позиција на табли је склона да води ка 0:00:56.069,0:01:00.072 поразима. Програм за играње даме, учи током времена шта су добре позиције 0:01:00.072,0:01:04.071 на табли а шта су лоше позиције на табли. И као исход, научио је да игра 0:01:04.071,0:01:09.051 даму боље него је што Артур Семјуел био у стању да игра. Ово је био изванредан резултат. 0:01:09.051,0:01:14.053 Испоставило да сам Артур Семјуел није био нарочито добар играч даме, али зато је 0:01:14.053,0:01:19.025 рачунар имао стрпљења да игра десетине хиљада игара самостално. Ниједан 0:01:19.025,0:01:24.027 човек нема стрпљења да игра толико пуно игара.[br]На тај начин рачунар је био у стању 0:01:24.027,0:01:29.023 да стекне пуно искуства у игрању даме, тако да је коначно постао 0:01:29.023,0:01:33.081 бољи играч даме од самог Артура Семјуела. Ово је више неформална 0:01:33.081,0:01:38.054 и једна од старијих дефиниција. Ево нешто новије дефиниције од Тома 0:01:38.054,0:01:43.060 Мичела, који је пријатељ са Карнеги Мелон универзитета. Том дефинише машинско учење 0:01:43.060,0:01:48.081 говорећи да је добро постављен проблем машинског учења дефинисан на следећи начин. Каже се да рачунарски 0:01:48.081,0:01:53.084 програм учи из искуства E, у односу на неки задатак T, и неку 0:01:53.084,0:01:58.067 меру учинка P, ако се тај учинак задатка Т мерен са P побољшава 0:01:58.067,0:02:03.076 искуством E. У ствари ја мислим да је он у ствари смислио ову дефиницију само да би се 0:02:03.076,0:02:08.034 римовала. За пример играња даме, искуство E би било 0:02:08.034,0:02:13.025 искуство које програм стиче играјући десетине хиљада игара против себе. 0:02:13.025,0:02:17.073 Задатак T, би био задатак играња даме. А мера учинка P 0:02:17.073,0:02:22.039 би била вероватноћа да ће добити следећу игру даме против 0:02:22.039,0:02:27.015 неког новог противника. Кроз ове видео снимке, поред тога што ћу пробати да вас научим 0:02:27.015,0:02:32.029 новим стварима, повремено ћу вас питати питање да бих био сигуран да разумете 0:02:32.029,0:02:36.089 садржај. Ево и једне од најбољих дефиниција машинског учења од стране Тома 0:02:36.089,0:02:42.029 Мичела. Рецимо да ваш и-мејл програм гледа и-мејлове које ви означавате или не означавате 0:02:42.029,0:02:47.082 као спам. Тако у и-мејл клијенту као што је овај можете кликнти ово спам дугме да означите 0:02:47.082,0:02:53.026 неке и-мејлове као спам, а остале не.[br]На основу тога које и-мејлове сте означили као 0:02:53.026,0:02:59.004 спам, ваш и-мејл програм боље учи како да филтрира спам и-мејлове. Шта је 0:02:59.004,0:03:04.028 задатак T у овој ситуацији? За пар секунди, видео ће се зауставити. Када се то деси, 0:03:04.028,0:03:09.059 можете користити вашег миша да селектујете једну од четири опције, да ми кажете 0:03:09.059,0:03:40.018 за који од ових четири мислите да је прави одговор на питање. То би могло 0:03:40.018,0:03:45.074 да буде мера учинковитости P. Према томе, учинковитост нашег задатка, системска 0:03:45.074,0:03:50.052 учинковитости на задатку T, тј. мера учинковитости P, ће се побољшати након 0:03:50.052,0:03:55.095 искуства E. Надам се да ћу вас на овом часу научити о различитим типовима 0:03:55.095,0:04:00.093 алгоритама машинског учења. Постоји неколико различитих типова алгоритама машинског учења. 0:04:00.093,0:04:05.065 Два главна типа су оно што називамо надзирано и ненадзирано 0:04:05.065,0:04:10.068 учење. У следећих неколико видео снимака ћу дефинисати шта ови термини значе. Али 0:04:10.068,0:04:16.002 у надзираном учењу, идеја је да ћемо ми научити 0:04:16.002,0:04:20.051 рачунар како да уради нешто, док ћемо у ненадзираном учењу пустити 0:04:20.051,0:04:25.001 рачунар да то ради сам. Не брините уколико вам ова два термина тренутно немају смисла, у 0:04:25.001,0:04:29.073 следећа два видео снимка ја ћу вам тачно рећи шта су ова два типа машинског учења. 0:04:29.073,0:04:34.006 Такође ћете чути остале актуелне термине као што су учење условљавањем (енг. reinforcement learning) и 0:04:34.006,0:04:38.062 системи за препоручивање (recommender systems). Ово су други типови алгоритама машинског учења о којима ћемо говорити 0:04:38.062,0:04:42.045 касније а два најкоришћенија типа алгоритама за машинско учење су вероватно 0:04:42.045,0:04:46.079 надзирано (supervised) и ненадзирано учење (unsupervised learning) и ја ћу их дефинисати у следећа 0:04:46.079,0:04:51.012 два видео снимка и провешћу већину часа говорећи о ова два типа 0:04:51.012,0:04:55.072 алгоритма машинског учења. Једна од ствари на коју ћу потрошити доста времена 0:04:55.072,0:05:00.005 на овом часу су практични савети за примену алгоритама за машинско учење. Ово је 0:05:00.005,0:05:04.044 нешто што ми је врло битно, и то је заправо нешто за што 0:05:04.044,0:05:08.016 не знам да се учи на било ком другом универзитету.[br]Учење о алгоритмима машинског учења 0:05:08.016,0:05:12.050 је као да вам неко да сет алата.[br]Једнако важено или још 0:05:12.050,0:05:17.061 важније од тога да вам неко да алате, јесте да вас научи како да примените те алате. Ја волим да 0:05:17.061,0:05:22.041 направим аналогију са учењем за столара. Замислите да вас неко 0:05:22.041,0:05:26.095 учи како да постанете столар и он вам каже ево чекић, ево 0:05:31.007,0:05:34.079 Имате све те алате, али још важнија ствар је да научите како да користите 0:05:34.079,0:05:38.092 ове алате на прави начин. Постоји огромна разлика између људи који 0:05:38.092,0:05:43.045 знају како да користе алгоритме за машинско учење, наспрам људи који не знају 0:05:43.045,0:05:47.062 како да користе ове алате на прави начин. Овде у Силицијумској долини где ја живи, када идем да 0:05:47.062,0:05:52.032 посетим различите компаније, чак и у најбољим компанијама у Силицијумској долини веома често видим 0:05:52.032,0:05:56.042 да људи покушавају да примене алгоритме машинског учења на неки проблем и 0:05:56.042,0:06:00.085 понекад то раде по шест месеци. Али понекад када погледам на 0:06:00.085,0:06:05.012 то шта су урадили, кажем им - забога, могао сам 0:06:05.012,0:06:09.071 да вам кажем шест пре месеци да је требало да узмете алгоритам за машинско учење и 0:06:09.071,0:06:14.047 да га примените на незнатно модификован начин и ваше шансе за успех би биле 0:06:14.047,0:06:19.064 много веће. Према томе оно што ћемо урадити на овом часу је заправо да потрошимо много 0:06:19.064,0:06:23.052 времена причајући о томе како, уколико покушате да развијете систем за машинско учење, 0:06:23.052,0:06:27.059 како да направите одлуке у складу са најбољом праксом, о начину на који да 0:06:27.059,0:06:31.032 изградите ваш систем тако да, када примените алгоритам машинског учења, буде мање 0:06:31.032,0:06:35.039 вероватно да ћете завршити као један од тих људи који су завршили шест месеци тражећи 0:06:35.039,0:06:39.037 прави пут. Неко други би могао помислити да то једноставно уопште неће радити 0:06:39.037,0:06:43.051 и да је то само протраћених шест месеци. Зато намеравам да потрошим 0:06:43.051,0:06:47.070 доста времена учећи вас тим врстама најбољих пракси у машинском учењу и 0:06:47.070,0:06:52.005 ВИ (вештачкој интелигенцији) и како да натерате те ствари да раде и како ми то радимо, како најбољи људи то раде у 0:06:52.005,0:06:56.014 Силицијумској долини и у целом свету. Надам се да ћу направити од вас неке од најбољих стручњака 0:06:56.014,0:06:59.090 који ће знати како да дизајнирају и праве озбиљне системе машинског учења и АИ системе. Дакле, 0:06:59.090,0:07:04.069 ово је машинско учење и ово су главне теме за које се надам да ћу да вас научим. У следећем 0:07:04.069,0:07:09.002 видеу ћу дефинисати шта је надгледано учење а после тога, шта 0:07:09.002,0:07:13.075 је ненадгледано учење. Након тога, причаћу о томе када би се могло употребити свако од њих.