0:00:02.155,0:00:05.935
האינטרנט:[br]איך עובד החיפוש
0:00:06.045,0:00:10.520
היי, קוראים לי ג'ון. אני מוביל את תחומי[br]החיפוש והלמידה החישובית ב-Google.
0:00:12.100,0:00:16.363
אני חושב שזה מעורר השראה באופן מדהים,[br]האופן שבו אנשים בכל רחבי העולם
0:00:16.363,0:00:19.758
פונים למנועי חיפוש כדי[br]לשאול שאלות טריוויאליות
0:00:19.758,0:00:21.704
לצד שאלות חשובות.[br]אז זו אחריות
0:00:21.704,0:00:24.972
ענקית, לתת להם את התשובות[br]הטובות ביותר שאנחנו מסוגלים.
0:00:26.725,0:00:30.758
היי! קוראים לי אקשאייה,[br]ואני עובדת בצוות של מנוע החיפוש בינג[br]
0:00:30.959,0:00:35.860
פעמים רבות, כאשר אנו באים לבחון[br]אינטליגנציה מלאכותית ולמידה חישובית,
0:00:35.885,0:00:39.185
עלינו לחשוב על האופן שבו[br]המשתמשים ישתמשו בהם.
0:00:39.185,0:00:42.257
כי בסופו של יום,[br]אנחנו רוצים להשאיר חותם על החברה.
0:00:43.267,0:00:45.833
בואו נשאל שאלה פשוטה:
0:00:45.833,0:00:49.406
כמה זמן לוקח לטוס למאדים?
0:00:49.406,0:00:51.507
מאיפה באו התוצאות הללו?
0:00:51.507,0:00:54.995
ולמה התוצאה הראשונה ממוקמת[br]לפני התוצאה השנייה?
0:00:55.655,0:01:00.234
אוקיי, בואו נצלול פנימה ונראה כיצד מנוע[br]החיפוש הופך את הבקשה שלכם לתוצאה.
0:01:00.974,0:01:06.213
הדבר הראשון שעליכם לדעת הוא שבזמן החיפוש,[br]מנוע החיפוש לא באמת מתחבר לרשת הכלל-עולמית
0:01:06.213,0:01:08.599
כדי להריץ את החיפוש שלכם בזמן אמת.
0:01:08.739,0:01:14.738
וזה בגלל שיש מיליארדים של אתרים ברחבי הרשת,[br]ומאות חדשים מצטרפים אליהם מדי דקה.
0:01:14.738,0:01:18.670
אז אם מנוע החיפוש היה צריך לחפש בכל האתרים[br]כדי למצוא את זה שאתם רציתם
0:01:18.670,0:01:20.689
זה בטח היה לוקח נצח נצחים.
0:01:20.689,0:01:25.767
אז כדי להפוך את החיפוש שלכם למהיר יותר,[br]מנועי החיפוש סורקים את הרשת מבעוד מועד
0:01:25.767,0:01:28.984
כדי לשמור את המידע שאולי יעזור[br]לחיפוש שלכם מאוחר יותר.
0:01:28.984,0:01:32.721
באופן הזה, כשאתם מחפשים מידע על טיסה[br]למאדים, למנוע החיפוש יש כבר
0:01:32.721,0:01:35.568
את כל מה שהוא צריך כדי לתת לכם[br]תשובה בזמן אמת.
0:01:36.388,0:01:38.044
ככה זה עובד:[br]
0:01:38.044,0:01:41.980
האינטרנט הוא בעצם רשת של דפים[br]המחוברים ביניהם באמצעות היפר-קישורים.
0:01:41.980,0:01:45.895
מנועי החיפוש מריצים באופן רציף תוכנה[br]הנקראת עכביש (Spider).
0:01:45.895,0:01:49.854
העכביש עובר על הדפים[br]ואוסף מידע עליהם.
0:01:49.854,0:01:55.519
כל פעם שהוא מוצא היפר-קישור, הוא עוקב[br]אחריו עד שהוא מבקר בכל עמוד שהוא מוצא
0:01:55.519,0:01:59.382
בכל רחבי האינטרנט.[br]בכל עמוד שהעכביש מבקר בו,
0:01:59.382,0:02:02.515
הוא אוסף כל מידע לו הוא[br]עלול להזדקק בחיפוש
0:02:02.515,0:02:06.026
ומוסיף אותו למסד נתונים מיוחד[br]בשם אינדקס חיפוש (Search Index).
0:02:07.446,0:02:10.817
עכשיו, בואו נחזור לחיפוש שביצענו מקודם[br]ונראה אם אנחנו יכולים להבין
0:02:10.817,0:02:13.417
איך מנוע החיפוש מצא את התוצאות.
0:02:13.417,0:02:17.286
כשאתם שואלים "כמה זמן לוקח להגיע למאדים?"
0:02:17.286,0:02:20.505
מנוע החיפוש מחפש אחר כל מילה בנפרד[br]בתוך אינדקס החיפוש
0:02:20.505,0:02:25.092
ומיד מקבל רשימה של כל האתרים באינטרנט[br]שמכילים את המילים הללו.
0:02:25.092,0:02:29.797
אבל רק חיפוש אחר המינוחים הללו[br]יכול להחזיר מיליוני דפים, כך שמנוע החיפוש
0:02:29.797,0:02:33.576
חייב להיות מסוגל להכריע אילו תוצאות[br]להראות לכם קודם
0:02:33.576,0:02:38.984
כאן זה נהיה מסובך: מנוע החיפוש[br]צריך לפעמים לנחש מה אתם רוצים למצוא.
0:02:38.984,0:02:43.560
כל מנוע חיפוש משתמש באלגוריתם משלו[br]כדי לדרג את העמודים שלו בהתבסס על
0:02:43.560,0:02:45.343
מה שהוא חושב שאתם רוצים למצוא.
0:02:45.343,0:02:50.997
אלגוריתם הדירוג של מנועי החיפוש יבדוק[br]אם מינוח החיפוש שלכם מופיע בכותרת הדף.
0:02:50.997,0:02:58.902
הוא עשוי לבדוק גם אם כל המילים מופיעות[br]זו לצד זו, או כל מספר אחר של חישובים
0:02:58.902,0:03:03.089
שיעזרו לקבוע טוב יותר אילו אתרים[br]ברצונכם לראות - ואילו לא.
0:03:03.089,0:03:07.944
גוגל המציאה את האלגוריתם המפורסם ביותר[br]לבחירת התוצאות הרלוונטיות ביותר לכל חיפוש,
0:03:07.944,0:03:12.166
בכך שהיא משקללת כמה דפי אינטרנט[br]אחרים מקשרים לכל עמוד נתון.
0:03:12.166,0:03:15.783
הרעיון הוא שאם אתרים רבים חושבים[br]שדף האינטרנט הוא מעניין,
0:03:15.783,0:03:18.399
אז ככל הנראה זה הדף[br]שאותו אתם מחפשים.
0:03:18.399,0:03:22.579
האלגוריתם הזה נקרא דירוג פייג'[br](Page Rank) אבל לא בגלל שהוא מדרג דפי אינטרנט,
0:03:22.579,0:03:28.007
אלא כי הוא נקרא על שם הממציא שלו,[br]לארי פייג', שהוא גם אחד ממקימי גוגל.
0:03:28.007,0:03:30.871
בגלל שהאתר לרוב מרוויח[br]כסף כשאתם מבקרים בו,
0:03:30.871,0:03:34.589
ספאמרים תמיד מנסים למצוא דרכים[br]לעבוד על אלגוריתם החיפוש
0:03:34.589,0:03:38.521
כך שהעמודים שלהם יופיעו[br]גבוה יותר ברשימת התוצאות.
0:03:38.521,0:03:42.163
מנועי חיפוש מעדכנים את האלגוריתמים שלהם
0:03:42.163,0:03:44.767
כדי למנוע מאתרים מפוקפקים[br]ומזויפים מלהגיע לראש התוצאות.
0:03:44.767,0:03:50.164
בסופו של דבר, זה תלוי גם בכם: היזהרו מאתרים מפוקפקים כאלה.
0:03:50.164,0:03:54.014
הביטו בכתובתו של האתר[br]ווודאו שהוא אכן מקור אמין.
0:03:54.014,0:03:56.548
תוכנות החיפוש משתכללות כל הזמן[br]ומנסות לשפר את האלגוריתמים
0:03:56.548,0:04:01.231
כך שיחזירו תוצאות טובות יותר[br]ומהירות יותר מאשר המתחרים.
0:04:01.231,0:04:04.943
מנועי החיפוש משתמשים כיום במידע[br]שלא בהכרח סיפקתם להם
0:04:04.943,0:04:07.463
כדי לעזור לכם בצמצום ודיוק[br]החיפושים שלכם.
0:04:07.463,0:04:10.897
אז לדוגמה, אם ברצונכם לחפש[br]אחר "פארקים לכלבים",
0:04:10.897,0:04:14.155
מנועי חיפוש רבים ייתנו לכם את התוצאות[br]לכל הפארקים שבסביבה
0:04:14.155,0:04:18.233
גם אם לא סיפקתם להם את מיקומכם.
0:04:18.233,0:04:22.481
מנועי חיפוש מודרניים גם מבינים יותר[br]מהמילים המופיעות בדפים.
0:04:22.481,0:04:27.348
הם מבינים ממש מה הן אומרות, וכל זאת כדי למצוא את אלה שהכי תואמות את החיפוש שלכם.
0:04:27.348,0:04:31.756
לדוגמה, אם תחפשו אחר מגיש מהיר (Fast [br]Pitcher), הוא יבין שאתם מחפשים ספורטאי.
0:04:31.756,0:04:34.590
אבל אם תחפשו אחר [br]קנקן גדול (Large Pitcher),
0:04:34.680,0:04:37.840
הוא ימצא עבורכם תוצאות[br]הקשורות למטבח שלכם.
0:04:38.824,0:04:41.435
כדי להבין את המילים טוב יותר, אנו[br]משתמשים בלמידה חישובית,
0:04:41.895,0:04:43.659
שהיא סוג של[br]אינטליגנציה מלאכותית.
0:04:43.737,0:04:48.233
היא מאפשרת לאלגוריתמים של חיפוש[br]לחפש לא רק אותיות או מילים בדף,
0:04:48.433,0:04:52.062
אלא להבין גם את המשמעות מאחוריהן.
0:04:53.372,0:05:00.234
האינטרנט גדל בקצב מסחרר,[br]אבל אם צוותי החיפוש יקלו על עבודתנו,
0:05:00.234,0:05:04.766
המידע שאתם מחפשים יישאר תמיד[br]במרחק כמה לחיצות מקשים בלבד.