0:00:02.155,0:00:05.935 האינטרנט:[br]איך עובד החיפוש 0:00:06.045,0:00:10.520 היי, קוראים לי ג'ון. אני מוביל את תחומי[br]החיפוש והלמידה החישובית ב-Google. 0:00:12.100,0:00:16.363 אני חושב שזה מעורר השראה באופן מדהים,[br]האופן שבו אנשים בכל רחבי העולם 0:00:16.363,0:00:19.758 פונים למנועי חיפוש כדי[br]לשאול שאלות טריוויאליות 0:00:19.758,0:00:21.704 לצד שאלות חשובות.[br]אז זו אחריות 0:00:21.704,0:00:24.972 ענקית, לתת להם את התשובות[br]הטובות ביותר שאנחנו מסוגלים. 0:00:26.725,0:00:30.758 היי! קוראים לי אקשאייה,[br]ואני עובדת בצוות של מנוע החיפוש בינג[br] 0:00:30.959,0:00:35.860 פעמים רבות, כאשר אנו באים לבחון[br]אינטליגנציה מלאכותית ולמידה חישובית, 0:00:35.885,0:00:39.185 עלינו לחשוב על האופן שבו[br]המשתמשים ישתמשו בהם. 0:00:39.185,0:00:42.257 כי בסופו של יום,[br]אנחנו רוצים להשאיר חותם על החברה. 0:00:43.267,0:00:45.833 בואו נשאל שאלה פשוטה: 0:00:45.833,0:00:49.406 כמה זמן לוקח לטוס למאדים? 0:00:49.406,0:00:51.507 מאיפה באו התוצאות הללו? 0:00:51.507,0:00:54.995 ולמה התוצאה הראשונה ממוקמת[br]לפני התוצאה השנייה? 0:00:55.655,0:01:00.234 אוקיי, בואו נצלול פנימה ונראה כיצד מנוע[br]החיפוש הופך את הבקשה שלכם לתוצאה. 0:01:00.974,0:01:06.213 הדבר הראשון שעליכם לדעת הוא שבזמן החיפוש,[br]מנוע החיפוש לא באמת מתחבר לרשת הכלל-עולמית 0:01:06.213,0:01:08.599 כדי להריץ את החיפוש שלכם בזמן אמת. 0:01:08.739,0:01:14.738 וזה בגלל שיש מיליארדים של אתרים ברחבי הרשת,[br]ומאות חדשים מצטרפים אליהם מדי דקה. 0:01:14.738,0:01:18.670 אז אם מנוע החיפוש היה צריך לחפש בכל האתרים[br]כדי למצוא את זה שאתם רציתם 0:01:18.670,0:01:20.689 זה בטח היה לוקח נצח נצחים. 0:01:20.689,0:01:25.767 אז כדי להפוך את החיפוש שלכם למהיר יותר,[br]מנועי החיפוש סורקים את הרשת מבעוד מועד 0:01:25.767,0:01:28.984 כדי לשמור את המידע שאולי יעזור[br]לחיפוש שלכם מאוחר יותר. 0:01:28.984,0:01:32.721 באופן הזה, כשאתם מחפשים מידע על טיסה[br]למאדים, למנוע החיפוש יש כבר 0:01:32.721,0:01:35.568 את כל מה שהוא צריך כדי לתת לכם[br]תשובה בזמן אמת. 0:01:36.388,0:01:38.044 ככה זה עובד:[br] 0:01:38.044,0:01:41.980 האינטרנט הוא בעצם רשת של דפים[br]המחוברים ביניהם באמצעות היפר-קישורים. 0:01:41.980,0:01:45.895 מנועי החיפוש מריצים באופן רציף תוכנה[br]הנקראת עכביש (Spider). 0:01:45.895,0:01:49.854 העכביש עובר על הדפים[br]ואוסף מידע עליהם. 0:01:49.854,0:01:55.519 כל פעם שהוא מוצא היפר-קישור, הוא עוקב[br]אחריו עד שהוא מבקר בכל עמוד שהוא מוצא 0:01:55.519,0:01:59.382 בכל רחבי האינטרנט.[br]בכל עמוד שהעכביש מבקר בו, 0:01:59.382,0:02:02.515 הוא אוסף כל מידע לו הוא[br]עלול להזדקק בחיפוש 0:02:02.515,0:02:06.026 ומוסיף אותו למסד נתונים מיוחד[br]בשם אינדקס חיפוש (Search Index). 0:02:07.446,0:02:10.817 עכשיו, בואו נחזור לחיפוש שביצענו מקודם[br]ונראה אם אנחנו יכולים להבין 0:02:10.817,0:02:13.417 איך מנוע החיפוש מצא את התוצאות. 0:02:13.417,0:02:17.286 כשאתם שואלים "כמה זמן לוקח להגיע למאדים?" 0:02:17.286,0:02:20.505 מנוע החיפוש מחפש אחר כל מילה בנפרד[br]בתוך אינדקס החיפוש 0:02:20.505,0:02:25.092 ומיד מקבל רשימה של כל האתרים באינטרנט[br]שמכילים את המילים הללו. 0:02:25.092,0:02:29.797 אבל רק חיפוש אחר המינוחים הללו[br]יכול להחזיר מיליוני דפים, כך שמנוע החיפוש 0:02:29.797,0:02:33.576 חייב להיות מסוגל להכריע אילו תוצאות[br]להראות לכם קודם 0:02:33.576,0:02:38.984 כאן זה נהיה מסובך: מנוע החיפוש[br]צריך לפעמים לנחש מה אתם רוצים למצוא. 0:02:38.984,0:02:43.560 כל מנוע חיפוש משתמש באלגוריתם משלו[br]כדי לדרג את העמודים שלו בהתבסס על 0:02:43.560,0:02:45.343 מה שהוא חושב שאתם רוצים למצוא. 0:02:45.343,0:02:50.997 אלגוריתם הדירוג של מנועי החיפוש יבדוק[br]אם מינוח החיפוש שלכם מופיע בכותרת הדף. 0:02:50.997,0:02:58.902 הוא עשוי לבדוק גם אם כל המילים מופיעות[br]זו לצד זו, או כל מספר אחר של חישובים 0:02:58.902,0:03:03.089 שיעזרו לקבוע טוב יותר אילו אתרים[br]ברצונכם לראות - ואילו לא. 0:03:03.089,0:03:07.944 גוגל המציאה את האלגוריתם המפורסם ביותר[br]לבחירת התוצאות הרלוונטיות ביותר לכל חיפוש, 0:03:07.944,0:03:12.166 בכך שהיא משקללת כמה דפי אינטרנט[br]אחרים מקשרים לכל עמוד נתון. 0:03:12.166,0:03:15.783 הרעיון הוא שאם אתרים רבים חושבים[br]שדף האינטרנט הוא מעניין, 0:03:15.783,0:03:18.399 אז ככל הנראה זה הדף[br]שאותו אתם מחפשים. 0:03:18.399,0:03:22.579 האלגוריתם הזה נקרא דירוג פייג'[br](Page Rank) אבל לא בגלל שהוא מדרג דפי אינטרנט, 0:03:22.579,0:03:28.007 אלא כי הוא נקרא על שם הממציא שלו,[br]לארי פייג', שהוא גם אחד ממקימי גוגל. 0:03:28.007,0:03:30.871 בגלל שהאתר לרוב מרוויח[br]כסף כשאתם מבקרים בו, 0:03:30.871,0:03:34.589 ספאמרים תמיד מנסים למצוא דרכים[br]לעבוד על אלגוריתם החיפוש 0:03:34.589,0:03:38.521 כך שהעמודים שלהם יופיעו[br]גבוה יותר ברשימת התוצאות. 0:03:38.521,0:03:42.163 מנועי חיפוש מעדכנים את האלגוריתמים שלהם 0:03:42.163,0:03:44.767 כדי למנוע מאתרים מפוקפקים[br]ומזויפים מלהגיע לראש התוצאות. 0:03:44.767,0:03:50.164 בסופו של דבר, זה תלוי גם בכם: היזהרו מאתרים מפוקפקים כאלה. 0:03:50.164,0:03:54.014 הביטו בכתובתו של האתר[br]ווודאו שהוא אכן מקור אמין. 0:03:54.014,0:03:56.548 תוכנות החיפוש משתכללות כל הזמן[br]ומנסות לשפר את האלגוריתמים 0:03:56.548,0:04:01.231 כך שיחזירו תוצאות טובות יותר[br]ומהירות יותר מאשר המתחרים. 0:04:01.231,0:04:04.943 מנועי החיפוש משתמשים כיום במידע[br]שלא בהכרח סיפקתם להם 0:04:04.943,0:04:07.463 כדי לעזור לכם בצמצום ודיוק[br]החיפושים שלכם. 0:04:07.463,0:04:10.897 אז לדוגמה, אם ברצונכם לחפש[br]אחר "פארקים לכלבים", 0:04:10.897,0:04:14.155 מנועי חיפוש רבים ייתנו לכם את התוצאות[br]לכל הפארקים שבסביבה 0:04:14.155,0:04:18.233 גם אם לא סיפקתם להם את מיקומכם. 0:04:18.233,0:04:22.481 מנועי חיפוש מודרניים גם מבינים יותר[br]מהמילים המופיעות בדפים. 0:04:22.481,0:04:27.348 הם מבינים ממש מה הן אומרות, וכל זאת כדי למצוא את אלה שהכי תואמות את החיפוש שלכם. 0:04:27.348,0:04:31.756 לדוגמה, אם תחפשו אחר מגיש מהיר (Fast [br]Pitcher), הוא יבין שאתם מחפשים ספורטאי. 0:04:31.756,0:04:34.590 אבל אם תחפשו אחר [br]קנקן גדול (Large Pitcher), 0:04:34.680,0:04:37.840 הוא ימצא עבורכם תוצאות[br]הקשורות למטבח שלכם. 0:04:38.824,0:04:41.435 כדי להבין את המילים טוב יותר, אנו[br]משתמשים בלמידה חישובית, 0:04:41.895,0:04:43.659 שהיא סוג של[br]אינטליגנציה מלאכותית. 0:04:43.737,0:04:48.233 היא מאפשרת לאלגוריתמים של חיפוש[br]לחפש לא רק אותיות או מילים בדף, 0:04:48.433,0:04:52.062 אלא להבין גם את המשמעות מאחוריהן. 0:04:53.372,0:05:00.234 האינטרנט גדל בקצב מסחרר,[br]אבל אם צוותי החיפוש יקלו על עבודתנו, 0:05:00.234,0:05:04.766 המידע שאתם מחפשים יישאר תמיד[br]במרחק כמה לחיצות מקשים בלבד.