WEBVTT

00:00:00.000 --> 00:00:04.904
מהי למידה חישובית? בסרטון זה ננסה להגדיר את המונח וגם ננסה

00:00:04.904 --> 00:00:09.520
לתת תחושה מתי נרצה להשתמש בלמידה חישובית. אפילו בקרב העוסקים

00:00:09.520 --> 00:00:14.252
בתחום למידה חישובית, אין הגדרה מוסכמת על כולם של

00:00:14.252 --> 00:00:18.926
מהי למידה חישובית. אבל תנו לי להראות לכם מספר דוגמאות לדרכים

00:00:18.926 --> 00:00:23.600
שבהן אנשים ניסו להגדיר את המונח. זו ההגדרה של מהי למידה חישובית

00:00:23.600 --> 00:00:28.520
לפי ארתור סמואל. הוא הגדיר את הלמידה החישובית כתחום מחקר שנותן

00:00:31.037 --> 00:00:33.554
למחשבים את היכולת ללמוד מבלי להיות מתוכנתים באופן מפורש. סמואל זכה

00:00:33.554 --> 00:00:38.452
להכרה אי-שם בשנות ה-50, כשכתב תוכנה שמשחקת דמקה.

00:00:38.452 --> 00:00:43.603
העובדה המדהימה לגבי התוכנה ההיא הייתה שארתור סמואל בעצמו

00:00:43.603 --> 00:00:48.268
לא היה שחקן דמקה כל כך טוב. אבל הוא תיכנת את התוכנה כך שתשחק

00:00:48.268 --> 00:00:52.245
עשרות אלפי משחקים נגד עצמה. על ידי צפייה באילו מהלכים

00:00:52.245 --> 00:00:56.698
על הלוח הובילו בדר"כ לניצחון, ואילו מהלכים הובילו בדר"כ להפסד.

00:00:56.698 --> 00:01:00.725
תוכנת הדמקה למדה במשך הזמן אילו מהלכים טובים

00:01:00.725 --> 00:01:04.713
ואילו מהלכים גרועים. בסופו של דבר היא למדה

00:01:04.713 --> 00:01:09.514
לשחק דמקה יותר טוב מארתור סמואל בעצמו. זו הייתה תוצאה מדהימה.

00:01:09.514 --> 00:01:14.535
לא בגלל שארתור סמואל לא היה שחקן דמקה כל כך טוב, אלא מכיוון

00:01:14.535 --> 00:01:19.254
שלמחשב היתה סבלנות לשחק עשרות אלפי משחקים נגד עצמו.

00:01:19.254 --> 00:01:24.275
לאף אדם אין סבלנות לשחק כל כך הרבה משחקים. באופן זה המחשב יכל

00:01:24.275 --> 00:01:29.235
לצבור המון נסיון במשחק דמקה, כך שבסופו של דבר הוא הפך

00:01:29.235 --> 00:01:33.817
לשחקן דמקה טוב יותר מארתור סמואל. זוהי הגדרה

00:01:33.817 --> 00:01:38.547
לא רשמית וישנה. הנה הגדרה קצת יותר מעודכנת

00:01:38.547 --> 00:01:43.607
של טום מיטצ'ל, שהוא חבר שלי מקרנגי-מלון. טום הגדיר למידה חישובית

00:01:43.607 --> 00:01:48.819
כך שבעיית למידה מנוסחת היטב מוגדרת באופן הבא: תוכנת מחשב

00:01:48.819 --> 00:01:53.843
לומדת מנסיון E ביחס למטלה מסויימת T

00:01:53.843 --> 00:01:58.678
וקריטריון ביצועים כלשהו P, אם הביצועים שלה ב-T כפי שנמדד על ידי P משתפרים

00:01:58.678 --> 00:02:03.764
ביחס לנסיון שנצבר E. אני חושב שהוא הגיע להגדרה הזו רק

00:02:03.764 --> 00:02:08.346
כדי שתהיה חריזה. לדוגמא במשחק הדמקה הנסיון E יהיה

00:02:08.346 --> 00:02:13.253
הנסיון שצברה התוכנה מעשרות אלפי משחקים נגד עצמה.

00:02:13.253 --> 00:02:17.735
המטלה T היא המטלה של משחק הדמקה. וקריטריון הביצועים P

00:02:17.735 --> 00:02:22.399
יהיה ההסתברות שהיא תזכה במשחק דמקה הבא נגד

00:02:22.399 --> 00:02:27.157
מתחרה חדש כלשהו. במהלך הסרטונים הקרובים, מלבד לנסות ללמד אתכם דברים,

00:02:27.157 --> 00:02:32.291
אני אשאל אתכם שאלות מדי פעם, כדי לוודא שהבנתם את תוכן השיעור.

00:02:32.291 --> 00:02:36.891
הנה שאלה אחת, למעלה מופיעה ההגדרה של למידה חישובית לפי

00:02:36.891 --> 00:02:42.292
טום מיטצ'ל. בואו נגיד שתוכנת הדוא"ל שלכם רואה אילו הודעות אתה מסמן כדואר זבל.

00:02:42.292 --> 00:02:47.826
אז בשרת דוא"ל כזה אתה יכול ללחוץ על כפתור דואר זבל כדי לדווח

00:02:47.826 --> 00:02:53.263
על חלק מההודעות כדואר זבל. בהתבסס על אילו הודעות סימנת

00:02:53.263 --> 00:02:59.046
כדואר זבל, תוכנת הדוא"ל שלך לומדת איך לסנן הודעות זבל בצורה טובה יותר.

00:02:59.046 --> 00:03:04.290
מהי המטלה T במקרה זה? בעוד מספר שניות הסרטון ייעצר וכשזה יקרה

00:03:04.290 --> 00:03:09.598
תוכל להשתמש בעכבר כדי לבחור אחת מתוך ארבע אפשרויות, כדי

00:03:09.598 --> 00:03:40.190
לאפשר לי לדעת אילו מארבעת האפשרויות היא התשובה הנכונה לדעתך לשאלה זו.

00:03:40.190 --> 00:03:45.747
זה יכול להיות מדד ביצועים P. וכך, הביצועים של המטלה שלנו... המטלה שביצועי

00:03:45.747 --> 00:03:50.529
המערכת במטלה T, לפי קריטריון הביצועים P ישתפרו לאחר

00:03:50.529 --> 00:03:55.957
הנסיון שנצבר E. בהרצאה זו אני מקווה שתלמדו על מגוון סוגים שונים של

00:03:55.957 --> 00:04:00.933
אלגוריתמי למידה. ישנם מספר סוגים שונים של אלגוריתמי למידה.

00:04:00.933 --> 00:04:05.650
שני הסוגים העיקריים הם אלגוריתמי למידה מודרכת

00:04:05.650 --> 00:04:10.690
ולמידה בלתי-מודרכת. אני אגדיר מונחים אלו ביתר פירוט בסרטונים הבאים, אבל

00:04:10.690 --> 00:04:16.028
מתברר כי בלמידה מודרכת, הרעיון הוא שאנו נלמד את

00:04:16.028 --> 00:04:20.513
המחשב כיצד לעשות משהו, בעוד שבלמידה בלתי-מודרכת אנו ניתן

00:04:20.513 --> 00:04:25.016
לו ללמוד בעצמו. אל תדאגו אם שני המונחים האלו עדיין לא ברורים,

00:04:25.016 --> 00:04:29.739
בשני הסרטונים הבאים אני הולך להגדיר בדיוק מה שני סוגים אלה של למידה.

00:04:29.739 --> 00:04:34.070
אתם גם תשמעו מונחים מפוצצים כמו למידה מחיזוקים ומערכות

00:04:34.070 --> 00:04:38.621
המלצה. אלה הם סוגים אחרים של אלגוריתמי למידה חישובית, אשר נדון

00:04:38.621 --> 00:04:42.460
בהם מאוחר יותר. אך שני הסוגים הנפוצים ביותר של אלגוריתמי למידה הם

00:04:42.460 --> 00:04:46.791
למידה מודרכת ובלתי-מודרכת ואני אגדיר אותם בשני הסרטונים

00:04:46.791 --> 00:04:51.123
הבאים ואנו נשקיע את רוב הקורס בשני סוגים אלו

00:04:51.123 --> 00:04:55.720
של אלגוריתמי למידה. מתברר שאחד הדברים האחרים שנשקיע בהם המון זמן

00:04:55.720 --> 00:05:00.054
בקורס זה, הוא עצות מעשיות איך ליישם אלגוריתמי למידה.

00:05:00.054 --> 00:05:04.444
זה משהו שאני מרגיש צורך חזק לעשות אותו וזה משהו שאני

00:05:04.444 --> 00:05:08.167
למעשה לא יודע על אף אוניברסיטה אחרת שמלמדת את זה. לימוד של

00:05:08.167 --> 00:05:12.509
אלגוריתמי למידה זה כמו לתת לך מגוון של כלים וחשוב באותה מידה או

00:05:12.509 --> 00:05:17.616
יותר חשוב מלתת את הכלים, זה ללמד אותך איך להשתמש בכלים האלו.

00:05:17.616 --> 00:05:22.413
אני אוהב להשתמש באנלוגיה של למידה להיות נגר. תדמיינו שמישהו

00:05:22.413 --> 00:05:26.959
מלמד אותך כיצד להיות נגר והוא אומר לך הנה פטיש, הנה

00:05:26.959 --> 00:05:31.077
מברג, הנה מסור, בהצלחה. ובכן, זה לא טוב, נכון? יש לך את

00:05:31.077 --> 00:05:34.799
כל הכלים אלה, אך הדבר החשוב יותר, הוא ללמוד כיצד להשתמש

00:05:34.799 --> 00:05:38.927
כמו שצריך בכלים האלה. יש הבדל עצום בין אנשים

00:05:38.927 --> 00:05:43.456
שיודעים כיצד להשתמש באלגוריתמי למידה חישובית, לעומת אנשים שלא יודעים

00:05:43.456 --> 00:05:47.626
כיצד להשתמש בכלים אלה כמו שצריך. כאן בעמק הסיליקון, בו אני חי, כשאני הולך

00:05:47.626 --> 00:05:52.328
לבקר חברות שונות אפילו בחברות מובילות בתחומן, לעיתים קרובות אני רואה

00:05:52.328 --> 00:05:56.428
אנשים שמנסים להפעיל אלגוריתמי למידה חישובית על בעיה כלשהי

00:05:56.428 --> 00:06:00.857
ולפעמים הם עושים את זה במשך שישה חודשים. אך לעתים, כאשר אני מסתכל

00:06:00.857 --> 00:06:05.121
מה הם עושים, אני אומר: אתם יודעים, הייתי יכול להגיד לכם

00:06:05.121 --> 00:06:09.714
לפני שישה חודשים שאתם צריכים לקחת אלגוריתם למידה חישובית

00:06:09.714 --> 00:06:14.470
ולהפעיל אותו קצת בדרך אחרת והסיכויים שלכם להצליח היו

00:06:14.470 --> 00:06:19.648
גבוהים בהרבה. אז מה שאנחנו הולכים לעשות בקורס הזה הוא למעשה להשקיע הרבה

00:06:19.648 --> 00:06:23.523
זמן לדבר על איך, אם באמת תנסו לפתח מערכת לומדת,

00:06:23.523 --> 00:06:27.596
איך לקבל החלטות על שיטות העבודה הטובות ביותר על הדרך שבה

00:06:27.596 --> 00:06:31.321
נבנה את המערכת, כך כשתפעיל אלגוריתם לומד סביר פחות

00:06:31.321 --> 00:06:35.394
שתגמור כמו אחד מהאנשים האלו שמנסים כבר חצי שנה דרך מסויימת

00:06:35.394 --> 00:06:39.373
שאתה יודע שמישהו אחר היה יודע מיד שזה פשוט לא יעבוד

00:06:39.373 --> 00:06:43.515
וזה פשוט בזבוז של חצי שנה. אז אני למעשה הולך להשקיע

00:06:43.515 --> 00:06:47.707
הרבה זמן ללמד אתכם כל מיני שיטות עבודה מומלצות בלמידה חישובית

00:06:47.707 --> 00:06:52.052
ואינטליגנציה מלאכותית, וכיצד לגרום לדברים לעבוד, ואיך אנו עושים זאת, כיצד האנשים הטובים ביותר עושים את זה

00:06:52.052 --> 00:06:56.143
בעמק הסיליקון וברחבי העולם. אני מקווה להפוך אותך לאחד האנשים הטובים ביותר

00:06:56.143 --> 00:06:59.905
שיודעים כיצד לתכנן ולבנות מערכת לומדת רצינית ומערכות אינטליגנציה מלאכותית. אז,

00:06:59.905 --> 00:07:04.698
זו למידה חישובית ואלה הם הנושאים העיקריים שאני מקווה ללמד.

00:07:04.698 --> 00:07:09.023
בסרטון הבא אני הולך להגדיר מהי למידה מודרכת ולאחר מכן

00:07:09.023 --> 00:07:13.757
מהי למידה בלתי-מודרכת. כמו כן, אתחיל להסביר מתי צריך להשתמש בכל אחד מהם.