1 00:00:00,000 --> 00:00:04,904 מהי למידה חישובית? בסרטון זה ננסה להגדיר את המונח וגם ננסה 2 00:00:04,904 --> 00:00:09,520 לתת תחושה מתי נרצה להשתמש בלמידה חישובית. אפילו בקרב העוסקים 3 00:00:09,520 --> 00:00:14,252 בתחום למידה חישובית, אין הגדרה מוסכמת על כולם של 4 00:00:14,252 --> 00:00:18,926 מהי למידה חישובית. אבל תנו לי להראות לכם מספר דוגמאות לדרכים 5 00:00:18,926 --> 00:00:23,600 שבהן אנשים ניסו להגדיר את המונח. זו ההגדרה של מהי למידה חישובית 6 00:00:23,600 --> 00:00:28,520 לפי ארתור סמואל. הוא הגדיר את הלמידה החישובית כתחום מחקר שנותן 7 00:00:31,037 --> 00:00:33,554 למחשבים את היכולת ללמוד מבלי להיות מתוכנתים באופן מפורש. סמואל זכה 8 00:00:33,554 --> 00:00:38,452 להכרה אי-שם בשנות ה-50, כשכתב תוכנה שמשחקת דמקה. 9 00:00:38,452 --> 00:00:43,603 העובדה המדהימה לגבי התוכנה ההיא הייתה שארתור סמואל בעצמו 10 00:00:43,603 --> 00:00:48,268 לא היה שחקן דמקה כל כך טוב. אבל הוא תיכנת את התוכנה כך שתשחק 11 00:00:48,268 --> 00:00:52,245 עשרות אלפי משחקים נגד עצמה. על ידי צפייה באילו מהלכים 12 00:00:52,245 --> 00:00:56,698 על הלוח הובילו בדר"כ לניצחון, ואילו מהלכים הובילו בדר"כ להפסד. 13 00:00:56,698 --> 00:01:00,725 תוכנת הדמקה למדה במשך הזמן אילו מהלכים טובים 14 00:01:00,725 --> 00:01:04,713 ואילו מהלכים גרועים. בסופו של דבר היא למדה 15 00:01:04,713 --> 00:01:09,514 לשחק דמקה יותר טוב מארתור סמואל בעצמו. זו הייתה תוצאה מדהימה. 16 00:01:09,514 --> 00:01:14,535 לא בגלל שארתור סמואל לא היה שחקן דמקה כל כך טוב, אלא מכיוון 17 00:01:14,535 --> 00:01:19,254 שלמחשב היתה סבלנות לשחק עשרות אלפי משחקים נגד עצמו. 18 00:01:19,254 --> 00:01:24,275 לאף אדם אין סבלנות לשחק כל כך הרבה משחקים. באופן זה המחשב יכל 19 00:01:24,275 --> 00:01:29,235 לצבור המון נסיון במשחק דמקה, כך שבסופו של דבר הוא הפך 20 00:01:29,235 --> 00:01:33,817 לשחקן דמקה טוב יותר מארתור סמואל. זוהי הגדרה 21 00:01:33,817 --> 00:01:38,547 לא רשמית וישנה. הנה הגדרה קצת יותר מעודכנת 22 00:01:38,547 --> 00:01:43,607 של טום מיטצ'ל, שהוא חבר שלי מקרנגי-מלון. טום הגדיר למידה חישובית 23 00:01:43,607 --> 00:01:48,819 כך שבעיית למידה מנוסחת היטב מוגדרת באופן הבא: תוכנת מחשב 24 00:01:48,819 --> 00:01:53,843 לומדת מנסיון E ביחס למטלה מסויימת T 25 00:01:53,843 --> 00:01:58,678 וקריטריון ביצועים כלשהו P, אם הביצועים שלה ב-T כפי שנמדד על ידי P משתפרים 26 00:01:58,678 --> 00:02:03,764 ביחס לנסיון שנצבר E. אני חושב שהוא הגיע להגדרה הזו רק 27 00:02:03,764 --> 00:02:08,346 כדי שתהיה חריזה. לדוגמא במשחק הדמקה הנסיון E יהיה 28 00:02:08,346 --> 00:02:13,253 הנסיון שצברה התוכנה מעשרות אלפי משחקים נגד עצמה. 29 00:02:13,253 --> 00:02:17,735 המטלה T היא המטלה של משחק הדמקה. וקריטריון הביצועים P 30 00:02:17,735 --> 00:02:22,399 יהיה ההסתברות שהיא תזכה במשחק דמקה הבא נגד 31 00:02:22,399 --> 00:02:27,157 מתחרה חדש כלשהו. במהלך הסרטונים הקרובים, מלבד לנסות ללמד אתכם דברים, 32 00:02:27,157 --> 00:02:32,291 אני אשאל אתכם שאלות מדי פעם, כדי לוודא שהבנתם את תוכן השיעור. 33 00:02:32,291 --> 00:02:36,891 הנה שאלה אחת, למעלה מופיעה ההגדרה של למידה חישובית לפי 34 00:02:36,891 --> 00:02:42,292 טום מיטצ'ל. בואו נגיד שתוכנת הדוא"ל שלכם רואה אילו הודעות אתה מסמן כדואר זבל. 35 00:02:42,292 --> 00:02:47,826 אז בשרת דוא"ל כזה אתה יכול ללחוץ על כפתור דואר זבל כדי לדווח 36 00:02:47,826 --> 00:02:53,263 על חלק מההודעות כדואר זבל. בהתבסס על אילו הודעות סימנת 37 00:02:53,263 --> 00:02:59,046 כדואר זבל, תוכנת הדוא"ל שלך לומדת איך לסנן הודעות זבל בצורה טובה יותר. 38 00:02:59,046 --> 00:03:04,290 מהי המטלה T במקרה זה? בעוד מספר שניות הסרטון ייעצר וכשזה יקרה 39 00:03:04,290 --> 00:03:09,598 תוכל להשתמש בעכבר כדי לבחור אחת מתוך ארבע אפשרויות, כדי 40 00:03:09,598 --> 00:03:40,190 לאפשר לי לדעת אילו מארבעת האפשרויות היא התשובה הנכונה לדעתך לשאלה זו. 41 00:03:40,190 --> 00:03:45,747 זה יכול להיות מדד ביצועים P. וכך, הביצועים של המטלה שלנו... המטלה שביצועי 42 00:03:45,747 --> 00:03:50,529 המערכת במטלה T, לפי קריטריון הביצועים P ישתפרו לאחר 43 00:03:50,529 --> 00:03:55,957 הנסיון שנצבר E. בהרצאה זו אני מקווה שתלמדו על מגוון סוגים שונים של 44 00:03:55,957 --> 00:04:00,933 אלגוריתמי למידה. ישנם מספר סוגים שונים של אלגוריתמי למידה. 45 00:04:00,933 --> 00:04:05,650 שני הסוגים העיקריים הם אלגוריתמי למידה מודרכת 46 00:04:05,650 --> 00:04:10,690 ולמידה בלתי-מודרכת. אני אגדיר מונחים אלו ביתר פירוט בסרטונים הבאים, אבל 47 00:04:10,690 --> 00:04:16,028 מתברר כי בלמידה מודרכת, הרעיון הוא שאנו נלמד את 48 00:04:16,028 --> 00:04:20,513 המחשב כיצד לעשות משהו, בעוד שבלמידה בלתי-מודרכת אנו ניתן 49 00:04:20,513 --> 00:04:25,016 לו ללמוד בעצמו. אל תדאגו אם שני המונחים האלו עדיין לא ברורים, 50 00:04:25,016 --> 00:04:29,739 בשני הסרטונים הבאים אני הולך להגדיר בדיוק מה שני סוגים אלה של למידה. 51 00:04:29,739 --> 00:04:34,070 אתם גם תשמעו מונחים מפוצצים כמו למידה מחיזוקים ומערכות 52 00:04:34,070 --> 00:04:38,621 המלצה. אלה הם סוגים אחרים של אלגוריתמי למידה חישובית, אשר נדון 53 00:04:38,621 --> 00:04:42,460 בהם מאוחר יותר. אך שני הסוגים הנפוצים ביותר של אלגוריתמי למידה הם 54 00:04:42,460 --> 00:04:46,791 למידה מודרכת ובלתי-מודרכת ואני אגדיר אותם בשני הסרטונים 55 00:04:46,791 --> 00:04:51,123 הבאים ואנו נשקיע את רוב הקורס בשני סוגים אלו 56 00:04:51,123 --> 00:04:55,720 של אלגוריתמי למידה. מתברר שאחד הדברים האחרים שנשקיע בהם המון זמן 57 00:04:55,720 --> 00:05:00,054 בקורס זה, הוא עצות מעשיות איך ליישם אלגוריתמי למידה. 58 00:05:00,054 --> 00:05:04,444 זה משהו שאני מרגיש צורך חזק לעשות אותו וזה משהו שאני 59 00:05:04,444 --> 00:05:08,167 למעשה לא יודע על אף אוניברסיטה אחרת שמלמדת את זה. לימוד של 60 00:05:08,167 --> 00:05:12,509 אלגוריתמי למידה זה כמו לתת לך מגוון של כלים וחשוב באותה מידה או 61 00:05:12,509 --> 00:05:17,616 יותר חשוב מלתת את הכלים, זה ללמד אותך איך להשתמש בכלים האלו. 62 00:05:17,616 --> 00:05:22,413 אני אוהב להשתמש באנלוגיה של למידה להיות נגר. תדמיינו שמישהו 63 00:05:22,413 --> 00:05:26,959 מלמד אותך כיצד להיות נגר והוא אומר לך הנה פטיש, הנה 64 00:05:26,959 --> 00:05:31,077 מברג, הנה מסור, בהצלחה. ובכן, זה לא טוב, נכון? יש לך את 65 00:05:31,077 --> 00:05:34,799 כל הכלים אלה, אך הדבר החשוב יותר, הוא ללמוד כיצד להשתמש 66 00:05:34,799 --> 00:05:38,927 כמו שצריך בכלים האלה. יש הבדל עצום בין אנשים 67 00:05:38,927 --> 00:05:43,456 שיודעים כיצד להשתמש באלגוריתמי למידה חישובית, לעומת אנשים שלא יודעים 68 00:05:43,456 --> 00:05:47,626 כיצד להשתמש בכלים אלה כמו שצריך. כאן בעמק הסיליקון, בו אני חי, כשאני הולך 69 00:05:47,626 --> 00:05:52,328 לבקר חברות שונות אפילו בחברות מובילות בתחומן, לעיתים קרובות אני רואה 70 00:05:52,328 --> 00:05:56,428 אנשים שמנסים להפעיל אלגוריתמי למידה חישובית על בעיה כלשהי 71 00:05:56,428 --> 00:06:00,857 ולפעמים הם עושים את זה במשך שישה חודשים. אך לעתים, כאשר אני מסתכל 72 00:06:00,857 --> 00:06:05,121 מה הם עושים, אני אומר: אתם יודעים, הייתי יכול להגיד לכם 73 00:06:05,121 --> 00:06:09,714 לפני שישה חודשים שאתם צריכים לקחת אלגוריתם למידה חישובית 74 00:06:09,714 --> 00:06:14,470 ולהפעיל אותו קצת בדרך אחרת והסיכויים שלכם להצליח היו 75 00:06:14,470 --> 00:06:19,648 גבוהים בהרבה. אז מה שאנחנו הולכים לעשות בקורס הזה הוא למעשה להשקיע הרבה 76 00:06:19,648 --> 00:06:23,523 זמן לדבר על איך, אם באמת תנסו לפתח מערכת לומדת, 77 00:06:23,523 --> 00:06:27,596 איך לקבל החלטות על שיטות העבודה הטובות ביותר על הדרך שבה 78 00:06:27,596 --> 00:06:31,321 נבנה את המערכת, כך כשתפעיל אלגוריתם לומד סביר פחות 79 00:06:31,321 --> 00:06:35,394 שתגמור כמו אחד מהאנשים האלו שמנסים כבר חצי שנה דרך מסויימת 80 00:06:35,394 --> 00:06:39,373 שאתה יודע שמישהו אחר היה יודע מיד שזה פשוט לא יעבוד 81 00:06:39,373 --> 00:06:43,515 וזה פשוט בזבוז של חצי שנה. אז אני למעשה הולך להשקיע 82 00:06:43,515 --> 00:06:47,707 הרבה זמן ללמד אתכם כל מיני שיטות עבודה מומלצות בלמידה חישובית 83 00:06:47,707 --> 00:06:52,052 ואינטליגנציה מלאכותית, וכיצד לגרום לדברים לעבוד, ואיך אנו עושים זאת, כיצד האנשים הטובים ביותר עושים את זה 84 00:06:52,052 --> 00:06:56,143 בעמק הסיליקון וברחבי העולם. אני מקווה להפוך אותך לאחד האנשים הטובים ביותר 85 00:06:56,143 --> 00:06:59,905 שיודעים כיצד לתכנן ולבנות מערכת לומדת רצינית ומערכות אינטליגנציה מלאכותית. אז, 86 00:06:59,905 --> 00:07:04,698 זו למידה חישובית ואלה הם הנושאים העיקריים שאני מקווה ללמד. 87 00:07:04,698 --> 00:07:09,023 בסרטון הבא אני הולך להגדיר מהי למידה מודרכת ולאחר מכן 88 00:07:09,023 --> 00:07:13,757 מהי למידה בלתי-מודרכת. כמו כן, אתחיל להסביר מתי צריך להשתמש בכל אחד מהם.