1 00:00:00,000 --> 00:00:04,090 Шта је машинско учење? У овом видеу ћемо покушати да дефинишемо шта је то и покушати 2 00:00:04,090 --> 00:00:09,051 да вам дамо осећај када желите да користите машинско учење. Чак и међу 3 00:00:09,051 --> 00:00:14,025 онима који се баве машинским учењем не постоји опште прихваћена дефиниција шта је а шта 4 00:00:14,025 --> 00:00:18,092 није машинско учење. Али дозволите ми да вам покажем пар примера на који начин 5 00:00:18,092 --> 00:00:23,060 су људи покушали да га дефинишу. Ево дефиниције шта је машинско учење 6 00:00:23,060 --> 00:00:28,051 по Артуру Семјуелу. Он је дефинисао машинско учење као студијско поље које даје 7 00:00:28,051 --> 00:00:33,055 рачунарима могућност да уче без да бивају експлицитно програмирани. Семјуелов тренутак 8 00:00:33,055 --> 00:00:38,045 славе се збио 1950-их, када је наприсао програм за играње даме. И 9 00:00:38,045 --> 00:00:43,060 запањујућа ствар у вези са програмом за играње даме, је била да сам Артур Семјуел 10 00:00:43,060 --> 00:00:48,026 није био веома добар играч даме. Али оно што је он урадио, је да је програмирао рачунар да игра 11 00:00:48,026 --> 00:00:52,024 десетине хиљада игара против себе. А такође гледањем које врсте позиција 12 00:00:52,024 --> 00:00:56,069 на табли су склони да воде до победе, и која врста позиција на табли је склона да води ка 13 00:00:56,069 --> 00:01:00,072 поразима. Програм за играње даме, учи током времена шта су добре позиције 14 00:01:00,072 --> 00:01:04,071 на табли а шта су лоше позиције на табли. И као исход, научио је да игра 15 00:01:04,071 --> 00:01:09,051 даму боље него је што Артур Семјуел био у стању да игра. Ово је био изванредан резултат. 16 00:01:09,051 --> 00:01:14,053 Испоставило да сам Артур Семјуел није био нарочито добар играч даме, али зато је 17 00:01:14,053 --> 00:01:19,025 рачунар имао стрпљења да игра десетине хиљада игара самостално. Ниједан 18 00:01:19,025 --> 00:01:24,027 човек нема стрпљења да игра толико пуно игара. На тај начин рачунар је био у стању 19 00:01:24,027 --> 00:01:29,023 да стекне пуно искуства у игрању даме, тако да је коначно постао 20 00:01:29,023 --> 00:01:33,081 бољи играч даме од самог Артура Семјуела. Ово је више неформална 21 00:01:33,081 --> 00:01:38,054 и једна од старијих дефиниција. Ево нешто новије дефиниције од Тома 22 00:01:38,054 --> 00:01:43,060 Мичела, који је пријатељ са Карнеги Мелон универзитета. Том дефинише машинско учење 23 00:01:43,060 --> 00:01:48,081 говорећи да је добро постављен проблем машинског учења дефинисан на следећи начин. Каже се да рачунарски 24 00:01:48,081 --> 00:01:53,084 програм учи из искуства E, у односу на неки задатак T, и неку 25 00:01:53,084 --> 00:01:58,067 меру учинка P, ако се тај учинак задатка Т мерен са P побољшава 26 00:01:58,067 --> 00:02:03,076 искуством E. У ствари ја мислим да је он у ствари смислио ову дефиницију само да би се 27 00:02:03,076 --> 00:02:08,034 римовала. За пример играња даме, искуство E би било 28 00:02:08,034 --> 00:02:13,025 искуство које програм стиче играјући десетине хиљада игара против себе. 29 00:02:13,025 --> 00:02:17,073 Задатак T, би био задатак играња даме. А мера учинка P 30 00:02:17,073 --> 00:02:22,039 би била вероватноћа да ће добити следећу игру даме против 31 00:02:22,039 --> 00:02:27,015 неког новог противника. Кроз ове видео снимке, поред тога што ћу пробати да вас научим 32 00:02:27,015 --> 00:02:32,029 новим стварима, повремено ћу вас питати питање да бих био сигуран да разумете 33 00:02:32,029 --> 00:02:36,089 садржај. Ево и једне од најбољих дефиниција машинског учења од стране Тома 34 00:02:36,089 --> 00:02:42,029 Мичела. Рецимо да ваш и-мејл програм гледа и-мејлове које ви означавате или не означавате 35 00:02:42,029 --> 00:02:47,082 као спам. Тако у и-мејл клијенту као што је овај можете кликнти ово спам дугме да означите 36 00:02:47,082 --> 00:02:53,026 неке и-мејлове као спам, а остале не. На основу тога које и-мејлове сте означили као 37 00:02:53,026 --> 00:02:59,004 спам, ваш и-мејл програм боље учи како да филтрира спам и-мејлове. Шта је 38 00:02:59,004 --> 00:03:04,028 задатак T у овој ситуацији? За пар секунди, видео ће се зауставити. Када се то деси, 39 00:03:04,028 --> 00:03:09,059 можете користити вашег миша да селектујете једну од четири опције, да ми кажете 40 00:03:09,059 --> 00:03:40,018 за који од ових четири мислите да је прави одговор на питање. То би могло 41 00:03:40,018 --> 00:03:45,074 да буде мера учинковитости P. Према томе, учинковитост нашег задатка, системска 42 00:03:45,074 --> 00:03:50,052 учинковитости на задатку T, тј. мера учинковитости P, ће се побољшати након 43 00:03:50,052 --> 00:03:55,095 искуства E. Надам се да ћу вас на овом часу научити о различитим типовима 44 00:03:55,095 --> 00:04:00,093 алгоритама машинског учења. Постоји неколико различитих типова алгоритама машинског учења. 45 00:04:00,093 --> 00:04:05,065 Два главна типа су оно што називамо надзирано и ненадзирано 46 00:04:05,065 --> 00:04:10,068 учење. У следећих неколико видео снимака ћу дефинисати шта ови термини значе. Али 47 00:04:10,068 --> 00:04:16,002 у надзираном учењу, идеја је да ћемо ми научити 48 00:04:16,002 --> 00:04:20,051 рачунар како да уради нешто, док ћемо у ненадзираном учењу пустити 49 00:04:20,051 --> 00:04:25,001 рачунар да то ради сам. Не брините уколико вам ова два термина тренутно немају смисла, у 50 00:04:25,001 --> 00:04:29,073 следећа два видео снимка ја ћу вам тачно рећи шта су ова два типа машинског учења. 51 00:04:29,073 --> 00:04:34,006 Такође ћете чути остале актуелне термине као што су учење условљавањем (енг. reinforcement learning) и 52 00:04:34,006 --> 00:04:38,062 системи за препоручивање (recommender systems). Ово су други типови алгоритама машинског учења о којима ћемо говорити 53 00:04:38,062 --> 00:04:42,045 касније а два најкоришћенија типа алгоритама за машинско учење су вероватно 54 00:04:42,045 --> 00:04:46,079 надзирано (supervised) и ненадзирано учење (unsupervised learning) и ја ћу их дефинисати у следећа 55 00:04:46,079 --> 00:04:51,012 два видео снимка и провешћу већину часа говорећи о ова два типа 56 00:04:51,012 --> 00:04:55,072 алгоритма машинског учења. Једна од ствари на коју ћу потрошити доста времена 57 00:04:55,072 --> 00:05:00,005 на овом часу су практични савети за примену алгоритама за машинско учење. Ово је 58 00:05:00,005 --> 00:05:04,044 нешто што ми је врло битно, и то је заправо нешто за што 59 00:05:04,044 --> 00:05:08,016 не знам да се учи на било ком другом универзитету. Учење о алгоритмима машинског учења 60 00:05:08,016 --> 00:05:12,050 је као да вам неко да сет алата. Једнако важено или још 61 00:05:12,050 --> 00:05:17,061 важније од тога да вам неко да алате, јесте да вас научи како да примените те алате. Ја волим да 62 00:05:17,061 --> 00:05:22,041 направим аналогију са учењем за столара. Замислите да вас неко 63 00:05:22,041 --> 00:05:26,095 учи како да постанете столар и он вам каже ево чекић, ево 64 00:05:31,007 --> 00:05:34,079 Имате све те алате, али још важнија ствар је да научите како да користите 65 00:05:34,079 --> 00:05:38,092 ове алате на прави начин. Постоји огромна разлика између људи који 66 00:05:38,092 --> 00:05:43,045 знају како да користе алгоритме за машинско учење, наспрам људи који не знају 67 00:05:43,045 --> 00:05:47,062 како да користе ове алате на прави начин. Овде у Силицијумској долини где ја живи, када идем да 68 00:05:47,062 --> 00:05:52,032 посетим различите компаније, чак и у најбољим компанијама у Силицијумској долини веома често видим 69 00:05:52,032 --> 00:05:56,042 да људи покушавају да примене алгоритме машинског учења на неки проблем и 70 00:05:56,042 --> 00:06:00,085 понекад то раде по шест месеци. Али понекад када погледам на 71 00:06:00,085 --> 00:06:05,012 то шта су урадили, кажем им - забога, могао сам 72 00:06:05,012 --> 00:06:09,071 да вам кажем шест пре месеци да је требало да узмете алгоритам за машинско учење и 73 00:06:09,071 --> 00:06:14,047 да га примените на незнатно модификован начин и ваше шансе за успех би биле 74 00:06:14,047 --> 00:06:19,064 много веће. Према томе оно што ћемо урадити на овом часу је заправо да потрошимо много 75 00:06:19,064 --> 00:06:23,052 времена причајући о томе како, уколико покушате да развијете систем за машинско учење, 76 00:06:23,052 --> 00:06:27,059 како да направите одлуке у складу са најбољом праксом, о начину на који да 77 00:06:27,059 --> 00:06:31,032 изградите ваш систем тако да, када примените алгоритам машинског учења, буде мање 78 00:06:31,032 --> 00:06:35,039 вероватно да ћете завршити као један од тих људи који су завршили шест месеци тражећи 79 00:06:35,039 --> 00:06:39,037 прави пут. Неко други би могао помислити да то једноставно уопште неће радити 80 00:06:39,037 --> 00:06:43,051 и да је то само протраћених шест месеци. Зато намеравам да потрошим 81 00:06:43,051 --> 00:06:47,070 доста времена учећи вас тим врстама најбољих пракси у машинском учењу и 82 00:06:47,070 --> 00:06:52,005 ВИ (вештачкој интелигенцији) и како да натерате те ствари да раде и како ми то радимо, како најбољи људи то раде у 83 00:06:52,005 --> 00:06:56,014 Силицијумској долини и у целом свету. Надам се да ћу направити од вас неке од најбољих стручњака 84 00:06:56,014 --> 00:06:59,090 који ће знати како да дизајнирају и праве озбиљне системе машинског учења и АИ системе. Дакле, 85 00:06:59,090 --> 00:07:04,069 ово је машинско учење и ово су главне теме за које се надам да ћу да вас научим. У следећем 86 00:07:04,069 --> 00:07:09,002 видеу ћу дефинисати шта је надгледано учење а после тога, шта 87 00:07:09,002 --> 00:07:13,075 је ненадгледано учење. Након тога, причаћу о томе када би се могло употребити свако од њих.