1 00:00:02,155 --> 00:00:05,935 האינטרנט: איך עובד החיפוש 2 00:00:06,045 --> 00:00:10,520 היי, קוראים לי ג'ון. אני מוביל את תחומי החיפוש והלמידה החישובית ב-Google. 3 00:00:12,100 --> 00:00:16,363 אני חושב שזה מעורר השראה באופן מדהים, האופן שבו אנשים בכל רחבי העולם 4 00:00:16,363 --> 00:00:19,758 פונים למנועי חיפוש כדי לשאול שאלות טריוויאליות 5 00:00:19,758 --> 00:00:21,704 לצד שאלות חשובות. אז זו אחריות 6 00:00:21,704 --> 00:00:24,972 ענקית, לתת להם את התשובות הטובות ביותר שאנחנו מסוגלים. 7 00:00:26,725 --> 00:00:30,758 היי! קוראים לי אקשאייה, ואני עובדת בצוות של מנוע החיפוש בינג 8 00:00:30,959 --> 00:00:35,860 הרבה פעמים, כשאנחנו באים לבחון אינטליגנציה מלאכותית ולמידה חישובית, 9 00:00:35,885 --> 00:00:39,185 עלינו לדבר על האופן שבו המשתמשים ישתמשו בכך. 10 00:00:39,185 --> 00:00:42,257 כי בסופו של יום, אנחנו רוצים להשאיר חותם על החברה. 11 00:00:43,267 --> 00:00:45,833 בואו נשאל שאלה פשוטה: 12 00:00:45,833 --> 00:00:49,406 כמה זמן לוקח לטוס למאדים? 13 00:00:49,406 --> 00:00:51,507 מאיפה באו התוצאות הללו? 14 00:00:51,507 --> 00:00:54,995 ולמה התוצאה הראשונה ממוקמת לפני התוצאה השנייה? 15 00:00:55,655 --> 00:01:00,234 אוקיי, בואו נצלול פנימה ונראה כיצד מנוע החיפוש הופך את הבקשה שלכם - לתוצאה. 16 00:01:00,974 --> 00:01:06,213 הדבר הראשון שעליכם לדעת הוא שבזמן החיפוש, מנוע החיפוש לא באמת מתחבר לרשת הכלל-עולמית. 17 00:01:06,213 --> 00:01:08,599 כדי להריץ את החיפוש שלכם בזמן-אמת. 18 00:01:08,739 --> 00:01:14,738 וזה בגלל שיש מיליארדים של אתרים ברחבי הרשת, ועוד כמה מאות חדשים מצטרפים אליהם מדי דקה. 19 00:01:14,738 --> 00:01:18,670 אז אם מנוע החיפוש היה צריך לחפש בכל האתרים כדי למצוא את זה שאתם רציתם 20 00:01:18,670 --> 00:01:20,689 זה בטח היה לוקח נצח נצחים. 21 00:01:20,689 --> 00:01:25,767 אז כדי להפוך את החיפוש שלכם למהיר יותר, מנועי החיפוש סורקים את הרשת מבעוד מועד 22 00:01:25,767 --> 00:01:28,984 כדי להשיג את המידע שאולי יעזור עם החיפוש שלכם מאוחר יותר. 23 00:01:28,984 --> 00:01:32,721 באופן הזה, כשאתם מחפשים מידע על טיסה למאדים, למנוע החיפוש יש כבר 24 00:01:32,721 --> 00:01:35,568 את כל מה שהוא צריך כדי לתת לכם תשובה בזמן אמת. 25 00:01:36,388 --> 00:01:38,044 ככה זה עובד: 26 00:01:38,044 --> 00:01:41,980 האינטרנט הוא בעצם רשת של דפים המחוברים ביניהם באמצעות היפר-קישורים. 27 00:01:41,980 --> 00:01:45,895 מנועי החיפוש מריצים באופן רציף תוכנה, הנקראת עכביש (Spider) 28 00:01:45,895 --> 00:01:49,854 שתפקידו לעבור בין הדפים ולאסוף מידע עליהם. 29 00:01:49,854 --> 00:01:55,519 כל פעם שהוא מוצא היפר-קישור, הוא עוקב אחריו עד שהוא מבקר בכל עמוד שהוא מוצא 30 00:01:55,519 --> 00:01:59,382 בכל רחבי האינטרנט. בכל עמוד בו מבקר העכביש, 31 00:01:59,382 --> 00:02:02,515 הוא אוסף כל מידע לו הוא עלול להזדקק בחיפוש 32 00:02:02,515 --> 00:02:06,026 ומוסיף אותו למסד נתונים מיוחד בשם אינדקס חיפוש (Search Index). 33 00:02:07,446 --> 00:02:10,817 עכשיו, בואו נחזור לחיפוש שביצענו מקודם ונראה אם אנחנו יכולים להבין 34 00:02:10,817 --> 00:02:13,417 איך מנוע החיפוש מצא את התוצאות. 35 00:02:13,417 --> 00:02:17,286 כשאתם שואלים "כמה זמן לוקח להגיע למאדים?" 36 00:02:17,286 --> 00:02:20,505 מנוע החיפוש מחפש אחר כל מילה בנפרד בתוך אינדקס החיפוש 37 00:02:20,505 --> 00:02:25,092 ומיד מקבל רשימה של כל האתרים באינטרנט שמכילים את המילים הללו. 38 00:02:25,092 --> 00:02:29,797 אבל רק חיפוש אחר המינוחים הללו יכול להחזיר מיליוני דפים, כך שמנוע החיפוש 39 00:02:29,797 --> 00:02:33,576 חייב להיות מסוגל להכריע אילו תוצאות להראות לכם קודם 40 00:02:33,576 --> 00:02:38,984 כאן זה נהיה מסובך: מנוע החיפוש צריך לפעמים לנחש מה אתם רוצים למצוא. 41 00:02:38,984 --> 00:02:43,560 כל מנוע חיפוש משתמש באלגוריתם משלו כדי לדרג את העמודים שלו בהתבסס על 42 00:02:43,560 --> 00:02:45,343 מה שהוא חושב שאתם רוצים למצוא. 43 00:02:45,343 --> 00:02:50,997 אלגוריתם הדירוג של מנועי החיפוש יבדוק אם מינוח החיפוש שלכם מופיע בכותרת הדף. 44 00:02:50,997 --> 00:02:58,902 הוא עלול לבדוק גם אם כל המילים מופיעות זו לצד זו, או כל מספר אחר של חישובים 45 00:02:58,902 --> 00:03:03,089 שיעזרו לקבוע טוב יותר אילו אתרים ברצונכם לראות - ואילו לא. 46 00:03:03,089 --> 00:03:07,944 גוגל המציאה את האלגוריתם המפורסם ביותר לבחירת התוצאות הרלוונטיות ביותר לכל חיפוש, 47 00:03:07,944 --> 00:03:12,166 בכך שלקחה בחשבון כמה דפי אינטרנט אחרים מקשרים לכל עמוד נתון. 48 00:03:12,166 --> 00:03:15,783 הרעיון הוא שאתרים רבים חושבים שדף האינטרנט הוא מעניין, 49 00:03:15,783 --> 00:03:18,399 אז ככל הנראה זה הדף שאותו אתם מחפשים. 50 00:03:18,399 --> 00:03:22,579 האלגוריתם הזה נקרא דירוג פייג' (Page Rank) אבל לא בגלל שהוא מדרג דפים, 51 00:03:22,579 --> 00:03:28,007 אלא כי הוא נקרא על שם הממציא שלו, לארי פייג', שהוא גם אחד ממקימי גוגל. 52 00:03:28,007 --> 00:03:30,871 בגלל שהאתר לרוב מרוויח כסף כשאתם מבקרים בו, 53 00:03:30,871 --> 00:03:34,589 ספאמרים תמיד מנסים למצוא דרכים לעבוד על אלגוריתם החיפוש 54 00:03:34,589 --> 00:03:38,521 כך שהעמודים שלהם יופיעו גבוה יותר ברשימת התוצאות. 55 00:03:38,521 --> 00:03:42,163 מנועי חיפוש מעדכנים את האלגוריתמים שלהם 56 00:03:42,163 --> 00:03:44,767 כדי למנוע מאתרים מפוקפקים ומזויפים מלהגיע לראש התוצאות. 57 00:03:44,767 --> 00:03:50,164 לבסוף, זה תלוי גם בכם: היזהרו מאתרים מפוקפקים כאלה 58 00:03:50,164 --> 00:03:54,014 על ידי כך שתביטו בכתובתו של האתר ותוודאו שהוא אכן מקור אמין. 59 00:03:54,014 --> 00:03:56,548 תוכנות החיפוש משתכללות תמיד ומנסות לשפר את האלגוריתמים 60 00:03:56,548 --> 00:04:01,231 כך שיחזירו תוצאות טובות יותר ומהירות יותר מאשר המתחרים. 61 00:04:01,231 --> 00:04:04,943 מנועי החיפוש משתמשים כיום במידע שלא בהכרח סיפקתם להם 62 00:04:04,943 --> 00:04:07,463 כדי לעזור לכם בצמצום ודיוק החיפושים שלכם. 63 00:04:07,463 --> 00:04:10,897 אז לדוגמה, אם ברצונכם לחפש אחר "פארקים לכלבים" - 64 00:04:10,897 --> 00:04:14,155 מנועי חיפוש רבים ייתנו לכם את התוצאות לכל הפארקים שבסביבה 65 00:04:14,155 --> 00:04:18,233 אפילו שלא סיפקתם להם את מיקומכם. 66 00:04:18,233 --> 00:04:22,481 מנועי חיפוש מודרניים מבינים יותר מאשר המילים המופיעות בדפים, 67 00:04:22,481 --> 00:04:27,348 אלא ממש מה הן אומרות, וכל זאת כדי למצוא את אלה שהכי תואמות את החיפוש שלכם. 68 00:04:27,348 --> 00:04:31,756 לדוגמה, אם תחפשו אחר מגיש מהיר (Fast Pitcher), הוא יבין שאתם מחפשים ספורטאי. 69 00:04:31,756 --> 00:04:34,590 אבל אם תחפשו אחר קנקן גדול (Large Pitcher), 70 00:04:34,680 --> 00:04:37,840 הוא ימצא עבורכם תוצאות הקשורות למטבח שלכם. 71 00:04:38,824 --> 00:04:41,435 כדי להבין את המילים טוב יותר, אנו משתמשים בלמידה חישובית, 72 00:04:41,895 --> 00:04:43,659 שהיא סוג של אינטליגנציה מלאכותית. 73 00:04:43,737 --> 00:04:48,233 היא מאפשרת לאלגוריתמים של חיפוש לחפש לא רק אותיות או מילים בדף, 74 00:04:48,433 --> 00:04:52,062 אלא להבין גם את המשמעות מאחוריהן. 75 00:04:53,372 --> 00:05:00,234 האינטרנט גדל בקצב מסחרר, אבל אם צוותי החיפוש יקלו על עבודתנו, 76 00:05:00,234 --> 00:05:04,766 המידע שאתם מחפשים יישאר תמיד במרחק כמה לחיצות מקשים בלבד.