WEBVTT 00:00:00.000 --> 00:00:04.904 מהי למידה חישובית? בסרטון זה ננסה להגדיר את המונח וגם ננסה 00:00:04.904 --> 00:00:09.520 לתת תחושה מתי נרצה להשתמש בלמידה חישובית. אפילו בקרב העוסקים 00:00:09.520 --> 00:00:14.252 בתחום למידה חישובית, אין הגדרה מוסכמת על כולם של 00:00:14.252 --> 00:00:18.926 מהי למידה חישובית. אבל תנו לי להראות לכם מספר דוגמאות לדרכים 00:00:18.926 --> 00:00:23.600 שבהן אנשים ניסו להגדיר את המונח. זו ההגדרה של מהי למידה חישובית 00:00:23.600 --> 00:00:28.520 לפי ארתור סמואל. הוא הגדיר את הלמידה החישובית כתחום מחקר שנותן 00:00:31.037 --> 00:00:33.554 למחשבים את היכולת ללמוד מבלי להיות מתוכנתים באופן מפורש. סמואל זכה 00:00:33.554 --> 00:00:38.452 להכרה אי-שם בשנות ה-50, כשכתב תוכנה שמשחקת דמקה. 00:00:38.452 --> 00:00:43.603 העובדה המדהימה לגבי התוכנה ההיא הייתה שארתור סמואל בעצמו 00:00:43.603 --> 00:00:48.268 לא היה שחקן דמקה כל כך טוב. אבל הוא תיכנת את התוכנה כך שתשחק 00:00:48.268 --> 00:00:52.245 עשרות אלפי משחקים נגד עצמה. על ידי צפייה באילו מהלכים 00:00:52.245 --> 00:00:56.698 על הלוח הובילו בדר"כ לניצחון, ואילו מהלכים הובילו בדר"כ להפסד. 00:00:56.698 --> 00:01:00.725 תוכנת הדמקה למדה במשך הזמן אילו מהלכים טובים 00:01:00.725 --> 00:01:04.713 ואילו מהלכים גרועים. בסופו של דבר היא למדה 00:01:04.713 --> 00:01:09.514 לשחק דמקה יותר טוב מארתור סמואל בעצמו. זו הייתה תוצאה מדהימה. 00:01:09.514 --> 00:01:14.535 לא בגלל שארתור סמואל לא היה שחקן דמקה כל כך טוב, אלא מכיוון 00:01:14.535 --> 00:01:19.254 שלמחשב היתה סבלנות לשחק עשרות אלפי משחקים נגד עצמו. 00:01:19.254 --> 00:01:24.275 לאף אדם אין סבלנות לשחק כל כך הרבה משחקים. באופן זה המחשב יכל 00:01:24.275 --> 00:01:29.235 לצבור המון נסיון במשחק דמקה, כך שבסופו של דבר הוא הפך 00:01:29.235 --> 00:01:33.817 לשחקן דמקה טוב יותר מארתור סמואל. זוהי הגדרה 00:01:33.817 --> 00:01:38.547 לא רשמית וישנה. הנה הגדרה קצת יותר מעודכנת 00:01:38.547 --> 00:01:43.607 של טום מיטצ'ל, שהוא חבר שלי מקרנגי-מלון. טום הגדיר למידה חישובית 00:01:43.607 --> 00:01:48.819 כך שבעיית למידה מנוסחת היטב מוגדרת באופן הבא: תוכנת מחשב 00:01:48.819 --> 00:01:53.843 לומדת מנסיון E ביחס למטלה מסויימת T 00:01:53.843 --> 00:01:58.678 וקריטריון ביצועים כלשהו P, אם הביצועים שלה ב-T כפי שנמדד על ידי P משתפרים 00:01:58.678 --> 00:02:03.764 ביחס לנסיון שנצבר E. אני חושב שהוא הגיע להגדרה הזו רק 00:02:03.764 --> 00:02:08.346 כדי שתהיה חריזה. לדוגמא במשחק הדמקה הנסיון E יהיה 00:02:08.346 --> 00:02:13.253 הנסיון שצברה התוכנה מעשרות אלפי משחקים נגד עצמה. 00:02:13.253 --> 00:02:17.735 המטלה T היא המטלה של משחק הדמקה. וקריטריון הביצועים P 00:02:17.735 --> 00:02:22.399 יהיה ההסתברות שהיא תזכה במשחק דמקה הבא נגד 00:02:22.399 --> 00:02:27.157 מתחרה חדש כלשהו. במהלך הסרטונים הקרובים, מלבד לנסות ללמד אתכם דברים, 00:02:27.157 --> 00:02:32.291 אני אשאל אתכם שאלות מדי פעם, כדי לוודא שהבנתם את תוכן השיעור. 00:02:32.291 --> 00:02:36.891 הנה שאלה אחת, למעלה מופיעה ההגדרה של למידה חישובית לפי 00:02:36.891 --> 00:02:42.292 טום מיטצ'ל. בואו נגיד שתוכנת הדוא"ל שלכם רואה אילו הודעות אתה מסמן כדואר זבל. 00:02:42.292 --> 00:02:47.826 אז בשרת דוא"ל כזה אתה יכול ללחוץ על כפתור דואר זבל כדי לדווח 00:02:47.826 --> 00:02:53.263 על חלק מההודעות כדואר זבל. בהתבסס על אילו הודעות סימנת 00:02:53.263 --> 00:02:59.046 כדואר זבל, תוכנת הדוא"ל שלך לומדת איך לסנן הודעות זבל בצורה טובה יותר. 00:02:59.046 --> 00:03:04.290 מהי המטלה T במקרה זה? בעוד מספר שניות הסרטון ייעצר וכשזה יקרה 00:03:04.290 --> 00:03:09.598 תוכל להשתמש בעכבר כדי לבחור אחת מתוך ארבע אפשרויות, כדי 00:03:09.598 --> 00:03:40.190 לאפשר לי לדעת אילו מארבעת האפשרויות היא התשובה הנכונה לדעתך לשאלה זו. 00:03:40.190 --> 00:03:45.747 זה יכול להיות מדד ביצועים P. וכך, הביצועים של המטלה שלנו... המטלה שביצועי 00:03:45.747 --> 00:03:50.529 המערכת במטלה T, לפי קריטריון הביצועים P ישתפרו לאחר 00:03:50.529 --> 00:03:55.957 הנסיון שנצבר E. בהרצאה זו אני מקווה שתלמדו על מגוון סוגים שונים של 00:03:55.957 --> 00:04:00.933 אלגוריתמי למידה. ישנם מספר סוגים שונים של אלגוריתמי למידה. 00:04:00.933 --> 00:04:05.650 שני הסוגים העיקריים הם אלגוריתמי למידה מודרכת 00:04:05.650 --> 00:04:10.690 ולמידה בלתי-מודרכת. אני אגדיר מונחים אלו ביתר פירוט בסרטונים הבאים, אבל 00:04:10.690 --> 00:04:16.028 מתברר כי בלמידה מודרכת, הרעיון הוא שאנו נלמד את 00:04:16.028 --> 00:04:20.513 המחשב כיצד לעשות משהו, בעוד שבלמידה בלתי-מודרכת אנו ניתן 00:04:20.513 --> 00:04:25.016 לו ללמוד בעצמו. אל תדאגו אם שני המונחים האלו עדיין לא ברורים, 00:04:25.016 --> 00:04:29.739 בשני הסרטונים הבאים אני הולך להגדיר בדיוק מה שני סוגים אלה של למידה. 00:04:29.739 --> 00:04:34.070 אתם גם תשמעו מונחים מפוצצים כמו למידה מחיזוקים ומערכות 00:04:34.070 --> 00:04:38.621 המלצה. אלה הם סוגים אחרים של אלגוריתמי למידה חישובית, אשר נדון 00:04:38.621 --> 00:04:42.460 בהם מאוחר יותר. אך שני הסוגים הנפוצים ביותר של אלגוריתמי למידה הם 00:04:42.460 --> 00:04:46.791 למידה מודרכת ובלתי-מודרכת ואני אגדיר אותם בשני הסרטונים 00:04:46.791 --> 00:04:51.123 הבאים ואנו נשקיע את רוב הקורס בשני סוגים אלו 00:04:51.123 --> 00:04:55.720 של אלגוריתמי למידה. מתברר שאחד הדברים האחרים שנשקיע בהם המון זמן 00:04:55.720 --> 00:05:00.054 בקורס זה, הוא עצות מעשיות איך ליישם אלגוריתמי למידה. 00:05:00.054 --> 00:05:04.444 זה משהו שאני מרגיש צורך חזק לעשות אותו וזה משהו שאני 00:05:04.444 --> 00:05:08.167 למעשה לא יודע על אף אוניברסיטה אחרת שמלמדת את זה. לימוד של 00:05:08.167 --> 00:05:12.509 אלגוריתמי למידה זה כמו לתת לך מגוון של כלים וחשוב באותה מידה או 00:05:12.509 --> 00:05:17.616 יותר חשוב מלתת את הכלים, זה ללמד אותך איך להשתמש בכלים האלו. 00:05:17.616 --> 00:05:22.413 אני אוהב להשתמש באנלוגיה של למידה להיות נגר. תדמיינו שמישהו 00:05:22.413 --> 00:05:26.959 מלמד אותך כיצד להיות נגר והוא אומר לך הנה פטיש, הנה 00:05:26.959 --> 00:05:31.077 מברג, הנה מסור, בהצלחה. ובכן, זה לא טוב, נכון? יש לך את 00:05:31.077 --> 00:05:34.799 כל הכלים אלה, אך הדבר החשוב יותר, הוא ללמוד כיצד להשתמש 00:05:34.799 --> 00:05:38.927 כמו שצריך בכלים האלה. יש הבדל עצום בין אנשים 00:05:38.927 --> 00:05:43.456 שיודעים כיצד להשתמש באלגוריתמי למידה חישובית, לעומת אנשים שלא יודעים 00:05:43.456 --> 00:05:47.626 כיצד להשתמש בכלים אלה כמו שצריך. כאן בעמק הסיליקון, בו אני חי, כשאני הולך 00:05:47.626 --> 00:05:52.328 לבקר חברות שונות אפילו בחברות מובילות בתחומן, לעיתים קרובות אני רואה 00:05:52.328 --> 00:05:56.428 אנשים שמנסים להפעיל אלגוריתמי למידה חישובית על בעיה כלשהי 00:05:56.428 --> 00:06:00.857 ולפעמים הם עושים את זה במשך שישה חודשים. אך לעתים, כאשר אני מסתכל 00:06:00.857 --> 00:06:05.121 מה הם עושים, אני אומר: אתם יודעים, הייתי יכול להגיד לכם 00:06:05.121 --> 00:06:09.714 לפני שישה חודשים שאתם צריכים לקחת אלגוריתם למידה חישובית 00:06:09.714 --> 00:06:14.470 ולהפעיל אותו קצת בדרך אחרת והסיכויים שלכם להצליח היו 00:06:14.470 --> 00:06:19.648 גבוהים בהרבה. אז מה שאנחנו הולכים לעשות בקורס הזה הוא למעשה להשקיע הרבה 00:06:19.648 --> 00:06:23.523 זמן לדבר על איך, אם באמת תנסו לפתח מערכת לומדת, 00:06:23.523 --> 00:06:27.596 איך לקבל החלטות על שיטות העבודה הטובות ביותר על הדרך שבה 00:06:27.596 --> 00:06:31.321 נבנה את המערכת, כך כשתפעיל אלגוריתם לומד סביר פחות 00:06:31.321 --> 00:06:35.394 שתגמור כמו אחד מהאנשים האלו שמנסים כבר חצי שנה דרך מסויימת 00:06:35.394 --> 00:06:39.373 שאתה יודע שמישהו אחר היה יודע מיד שזה פשוט לא יעבוד 00:06:39.373 --> 00:06:43.515 וזה פשוט בזבוז של חצי שנה. אז אני למעשה הולך להשקיע 00:06:43.515 --> 00:06:47.707 הרבה זמן ללמד אתכם כל מיני שיטות עבודה מומלצות בלמידה חישובית 00:06:47.707 --> 00:06:52.052 ואינטליגנציה מלאכותית, וכיצד לגרום לדברים לעבוד, ואיך אנו עושים זאת, כיצד האנשים הטובים ביותר עושים את זה 00:06:52.052 --> 00:06:56.143 בעמק הסיליקון וברחבי העולם. אני מקווה להפוך אותך לאחד האנשים הטובים ביותר 00:06:56.143 --> 00:06:59.905 שיודעים כיצד לתכנן ולבנות מערכת לומדת רצינית ומערכות אינטליגנציה מלאכותית. אז, 00:06:59.905 --> 00:07:04.698 זו למידה חישובית ואלה הם הנושאים העיקריים שאני מקווה ללמד. 00:07:04.698 --> 00:07:09.023 בסרטון הבא אני הולך להגדיר מהי למידה מודרכת ולאחר מכן 00:07:09.023 --> 00:07:13.757 מהי למידה בלתי-מודרכת. כמו כן, אתחיל להסביר מתי צריך להשתמש בכל אחד מהם.