מהי למידה חישובית? בסרטון זה ננסה להגדיר את המונח וגם ננסה
לתת תחושה מתי נרצה להשתמש בלמידה חישובית. אפילו בקרב העוסקים
בתחום למידה חישובית, אין הגדרה מוסכמת על כולם של
מהי למידה חישובית. אבל תנו לי להראות לכם מספר דוגמאות לדרכים
שבהן אנשים ניסו להגדיר את המונח. זו ההגדרה של מהי למידה חישובית
לפי ארתור סמואל. הוא הגדיר את הלמידה החישובית כתחום מחקר שנותן
למחשבים את היכולת ללמוד מבלי להיות מתוכנתים באופן מפורש. סמואל זכה
להכרה אי-שם בשנות ה-50, כשכתב תוכנה שמשחקת דמקה.
העובדה המדהימה לגבי התוכנה ההיא הייתה שארתור סמואל בעצמו
לא היה שחקן דמקה כל כך טוב. אבל הוא תיכנת את התוכנה כך שתשחק
עשרות אלפי משחקים נגד עצמה. על ידי צפייה באילו מהלכים
על הלוח הובילו בדר"כ לניצחון, ואילו מהלכים הובילו בדר"כ להפסד.
תוכנת הדמקה למדה במשך הזמן אילו מהלכים טובים
ואילו מהלכים גרועים. בסופו של דבר היא למדה
לשחק דמקה יותר טוב מארתור סמואל בעצמו. זו הייתה תוצאה מדהימה.
לא בגלל שארתור סמואל לא היה שחקן דמקה כל כך טוב, אלא מכיוון
שלמחשב היתה סבלנות לשחק עשרות אלפי משחקים נגד עצמו.
לאף אדם אין סבלנות לשחק כל כך הרבה משחקים. באופן זה המחשב יכל
לצבור המון נסיון במשחק דמקה, כך שבסופו של דבר הוא הפך
לשחקן דמקה טוב יותר מארתור סמואל. זוהי הגדרה
לא רשמית וישנה. הנה הגדרה קצת יותר מעודכנת
של טום מיטצ'ל, שהוא חבר שלי מקרנגי-מלון. טום הגדיר למידה חישובית
כך שבעיית למידה מנוסחת היטב מוגדרת באופן הבא: תוכנת מחשב
לומדת מנסיון E ביחס למטלה מסויימת T
וקריטריון ביצועים כלשהו P, אם הביצועים שלה ב-T כפי שנמדד על ידי P משתפרים
ביחס לנסיון שנצבר E. אני חושב שהוא הגיע להגדרה הזו רק
כדי שתהיה חריזה. לדוגמא במשחק הדמקה הנסיון E יהיה
הנסיון שצברה התוכנה מעשרות אלפי משחקים נגד עצמה.
המטלה T היא המטלה של משחק הדמקה. וקריטריון הביצועים P
יהיה ההסתברות שהיא תזכה במשחק דמקה הבא נגד
מתחרה חדש כלשהו. במהלך הסרטונים הקרובים, מלבד לנסות ללמד אתכם דברים,
אני אשאל אתכם שאלות מדי פעם, כדי לוודא שהבנתם את תוכן השיעור.
הנה שאלה אחת, למעלה מופיעה ההגדרה של למידה חישובית לפי
טום מיטצ'ל. בואו נגיד שתוכנת הדוא"ל שלכם רואה אילו הודעות אתה מסמן כדואר זבל.
אז בשרת דוא"ל כזה אתה יכול ללחוץ על כפתור דואר זבל כדי לדווח
על חלק מההודעות כדואר זבל. בהתבסס על אילו הודעות סימנת
כדואר זבל, תוכנת הדוא"ל שלך לומדת איך לסנן הודעות זבל בצורה טובה יותר.
מהי המטלה T במקרה זה? בעוד מספר שניות הסרטון ייעצר וכשזה יקרה
תוכל להשתמש בעכבר כדי לבחור אחת מתוך ארבע אפשרויות, כדי
לאפשר לי לדעת אילו מארבעת האפשרויות היא התשובה הנכונה לדעתך לשאלה זו.
זה יכול להיות מדד ביצועים P. וכך, הביצועים של המטלה שלנו... המטלה שביצועי
המערכת במטלה T, לפי קריטריון הביצועים P ישתפרו לאחר
הנסיון שנצבר E. בהרצאה זו אני מקווה שתלמדו על מגוון סוגים שונים של
אלגוריתמי למידה. ישנם מספר סוגים שונים של אלגוריתמי למידה.
שני הסוגים העיקריים הם אלגוריתמי למידה מודרכת
ולמידה בלתי-מודרכת. אני אגדיר מונחים אלו ביתר פירוט בסרטונים הבאים, אבל
מתברר כי בלמידה מודרכת, הרעיון הוא שאנו נלמד את
המחשב כיצד לעשות משהו, בעוד שבלמידה בלתי-מודרכת אנו ניתן
לו ללמוד בעצמו. אל תדאגו אם שני המונחים האלו עדיין לא ברורים,
בשני הסרטונים הבאים אני הולך להגדיר בדיוק מה שני סוגים אלה של למידה.
אתם גם תשמעו מונחים מפוצצים כמו למידה מחיזוקים ומערכות
המלצה. אלה הם סוגים אחרים של אלגוריתמי למידה חישובית, אשר נדון
בהם מאוחר יותר. אך שני הסוגים הנפוצים ביותר של אלגוריתמי למידה הם
למידה מודרכת ובלתי-מודרכת ואני אגדיר אותם בשני הסרטונים
הבאים ואנו נשקיע את רוב הקורס בשני סוגים אלו
של אלגוריתמי למידה. מתברר שאחד הדברים האחרים שנשקיע בהם המון זמן
בקורס זה, הוא עצות מעשיות איך ליישם אלגוריתמי למידה.
זה משהו שאני מרגיש צורך חזק לעשות אותו וזה משהו שאני
למעשה לא יודע על אף אוניברסיטה אחרת שמלמדת את זה. לימוד של
אלגוריתמי למידה זה כמו לתת לך מגוון של כלים וחשוב באותה מידה או
יותר חשוב מלתת את הכלים, זה ללמד אותך איך להשתמש בכלים האלו.
אני אוהב להשתמש באנלוגיה של למידה להיות נגר. תדמיינו שמישהו
מלמד אותך כיצד להיות נגר והוא אומר לך הנה פטיש, הנה
מברג, הנה מסור, בהצלחה. ובכן, זה לא טוב, נכון? יש לך את
כל הכלים אלה, אך הדבר החשוב יותר, הוא ללמוד כיצד להשתמש
כמו שצריך בכלים האלה. יש הבדל עצום בין אנשים
שיודעים כיצד להשתמש באלגוריתמי למידה חישובית, לעומת אנשים שלא יודעים
כיצד להשתמש בכלים אלה כמו שצריך. כאן בעמק הסיליקון, בו אני חי, כשאני הולך
לבקר חברות שונות אפילו בחברות מובילות בתחומן, לעיתים קרובות אני רואה
אנשים שמנסים להפעיל אלגוריתמי למידה חישובית על בעיה כלשהי
ולפעמים הם עושים את זה במשך שישה חודשים. אך לעתים, כאשר אני מסתכל
מה הם עושים, אני אומר: אתם יודעים, הייתי יכול להגיד לכם
לפני שישה חודשים שאתם צריכים לקחת אלגוריתם למידה חישובית
ולהפעיל אותו קצת בדרך אחרת והסיכויים שלכם להצליח היו
גבוהים בהרבה. אז מה שאנחנו הולכים לעשות בקורס הזה הוא למעשה להשקיע הרבה
זמן לדבר על איך, אם באמת תנסו לפתח מערכת לומדת,
איך לקבל החלטות על שיטות העבודה הטובות ביותר על הדרך שבה
נבנה את המערכת, כך כשתפעיל אלגוריתם לומד סביר פחות
שתגמור כמו אחד מהאנשים האלו שמנסים כבר חצי שנה דרך מסויימת
שאתה יודע שמישהו אחר היה יודע מיד שזה פשוט לא יעבוד
וזה פשוט בזבוז של חצי שנה. אז אני למעשה הולך להשקיע
הרבה זמן ללמד אתכם כל מיני שיטות עבודה מומלצות בלמידה חישובית
ואינטליגנציה מלאכותית, וכיצד לגרום לדברים לעבוד, ואיך אנו עושים זאת, כיצד האנשים הטובים ביותר עושים את זה
בעמק הסיליקון וברחבי העולם. אני מקווה להפוך אותך לאחד האנשים הטובים ביותר
שיודעים כיצד לתכנן ולבנות מערכת לומדת רצינית ומערכות אינטליגנציה מלאכותית. אז,
זו למידה חישובית ואלה הם הנושאים העיקריים שאני מקווה ללמד.
בסרטון הבא אני הולך להגדיר מהי למידה מודרכת ולאחר מכן
מהי למידה בלתי-מודרכת. כמו כן, אתחיל להסביר מתי צריך להשתמש בכל אחד מהם.