1 00:00:00,000 --> 00:00:02,018 ובכן מה דעתך על אופן בניית מנוע חיפוש 2 00:00:02,018 --> 00:00:03,077 בנית כבר אחד, נכון? 3 00:00:03,077 --> 00:00:06,008 כן. אני חושב שהדבר החשוב ביותר 4 00:00:06,008 --> 00:00:08,013 אם הנך מתכוון לבנות מנוע חיפוש 5 00:00:08,013 --> 00:00:12,051 זה להכיל מצבור ממש מתאים כדי להתחיל בו 6 00:00:12,051 --> 00:00:19,020 במקרה שלנו השתמשנו ברשת האינטרנט, אשר בזמנו הייתה לבטח קטנה יותר מאשר היום. 7 00:00:19,020 --> 00:00:21,036 אבל זה היה חדיש ומרגש 8 00:00:21,036 --> 00:00:23,081 היו כל מיני דברים בלתי צפויים שם. 9 00:00:23,081 --> 00:00:26,099 ובכן, המטרה של שלושת היחידות הראשונות של הקורס היא לבנות מצבור כזה. 10 00:00:27,003 --> 00:00:30,009 ואנו רוצים לבנות את המצבור עבור מנוע החיפוש שלנו 11 00:00:30,009 --> 00:00:32,090 על-ידי סריקת הרשת, וזה מה שסורק רשת עושה. 12 00:00:32,090 --> 00:00:36,038 מהו סורק רשת? זוהי תוכנת מחשב האוספת תוכן מהרשת. 13 00:00:36,038 --> 00:00:40,054 אם תחשבו על דף שרואים בדפדפן, יש לכם דף מעין זה. 14 00:00:40,054 --> 00:00:43,099 ואנו נשתמש באתר הקורס כדוגמה לדף רשת. 15 00:00:43,099 --> 00:00:47,097 יש בו הרבה תוכן, יש בו תמונות, יש בו קצת טקסט. 16 00:00:47,097 --> 00:00:51,038 כל זה מגיע לדפדפן כאשר מבקשים את הדף . 17 00:00:51,038 --> 00:00:53,066 הדבר החשוב שיש לו הם הקישורים. 18 00:00:53,066 --> 00:00:57,093 ומהו קישור? זהו משהו שמפנה לדף אחר. 19 00:00:57,093 --> 00:01:00,050 ובכן יש לנו קישור לשאילתות שנשאלות לעתים קרובות, 20 00:01:00,050 --> 00:01:02,046 יש לנו קישור לדף: cs 101 21 00:01:02,046 --> 00:01:04,043 יש גם כמה קישורים נוספים בדף הזה. 22 00:01:04,043 --> 00:01:07,054 וקישור זה יתכן ויופיע בדפדפן עם קו תחתי 23 00:01:07,054 --> 00:01:09,094 ייתכן ולא, תלוי כיצד הדפדפן שלך מוגדר. 24 00:01:09,094 --> 00:01:11,095 אבל הדבר החשוב הוא, 25 00:01:11,095 --> 00:01:13,088 קישור שהוא מצביע לדף רשת אחר . 26 00:01:13,088 --> 00:01:16,043 והדפים האחרים ייתכן ויהיו להם גם קישורים 27 00:01:16,043 --> 00:01:19,073 ובכן יש לנו קישור נוסף בדף זה 28 00:01:19,073 --> 00:01:23,052 ייתכן וזה קישור לשמי, ושניתן להגיע בעקבותיו לדף הבית שלי. 29 00:01:23,052 --> 00:01:26,091 וכל הדפים שאנו יכולים למצוא בעזרת סורק הרשת שלנו 30 00:01:26,091 --> 00:01:29,009 הנם מאותרים על-ידי מעקב אחר הקישורים. 31 00:01:29,009 --> 00:01:31,067 כך שלא בהכרח ימצא כל דף ברשת 32 00:01:31,067 --> 00:01:33,059 אם נתחיל בדף גרעיני טוב 33 00:01:33,059 --> 00:01:35,003 נמצא הרבה דפים 34 00:01:35,003 --> 00:01:37,050 ומה שהסורק יעשה, הוא להתחיל בדף אחד, 35 00:01:37,050 --> 00:01:41,056 מציאת את כל הקישורים בדף זה, לעקוב אחריהם כדי למצוא דפים אחרים 36 00:01:41,056 --> 00:01:45,013 ואז בדפים האחרים הוא יעקוב אחר הקישורים שלהם 37 00:01:45,013 --> 00:01:48,031 כדי למצוא דפים אחרים ובהם יהיו עוד הרבה קישורים. 38 00:01:48,031 --> 00:01:51,043 ובסופו של דבר יהיה לנו אוסף של הרבה דפים ברשת. 39 00:01:51,043 --> 00:01:54,007 ובכן זהו מה שאנו רוצים לעשות, לבנות סורק רשת. 40 00:01:54,007 --> 00:01:56,095 אנו רוצים למצוא דרך כלשהי שמתחילה מדף גרעיני, 41 00:01:56,095 --> 00:01:59,056 מחלצת את כל הקישורים בדף 42 00:01:59,056 --> 00:02:01,078 עוקבת אחר קישורים אלה לדפים אחרים 43 00:02:01,078 --> 00:02:03,067 ואז לאסוף את הקישורים של דפים אחרים אלה, 44 00:02:03,067 --> 00:02:05,024 לעקוב אחריהם, לאסוף אותם. 45 00:02:05,024 --> 00:02:07,038 ובכן זה נשמע כמו הרבה עבודה. 46 00:02:07,038 --> 00:02:09,014 אנו לא נעשה זאת בשיעור הראשון. 47 00:02:09,014 --> 00:02:12,072 ביחידה הראשונה אנו רק נחלץ קישור אחד. 48 00:02:12,072 --> 00:02:14,058 ובכן אנו נתחיל עם מקבץ טקסטואלי 49 00:02:14,058 --> 00:02:17,033 יהיה בו קישור עם URL 50 00:02:17,033 --> 00:02:19,064 מה שאנו רוצים למצוא הוא את ה-יו.אר.אל הזה (URL = יו.אר.אל) 51 00:02:19,064 --> 00:02:21,089 כך שנוכל לבקש את הדף הבא. 52 00:02:21,089 --> 00:02:23,082 המטרה של היחידה השנייה 53 00:02:23,082 --> 00:02:25,016 הנה להמשיך בחיפוש 54 00:02:25,016 --> 00:02:28,049 אם יש הרבה קישורים בדף אחד, נרצה למצוא את כולם. 55 00:02:28,049 --> 00:02:30,014 וזה מה שנעשה ביחידה השנייה, 56 00:02:30,014 --> 00:02:32,069 נגלה כיצד להמשיך בחיפוש ולחלץ את כל הקישורים הללו. 57 00:02:32,069 --> 00:02:36,061 ביחידה שלוש נרצה להמשיך מעבר לדף אחד. 58 00:02:36,061 --> 00:02:40,033 בסיום היחידה השנייה נוכל להדפיס את כל הקישורים שבדף. 59 00:02:40,033 --> 00:02:44,002 ביחידה שלוש אנו רוצים לאסוף את כל הקישורים, כך שנוכל להמשיך, 60 00:02:44,002 --> 00:02:47,018 לסיים את המעקב, ולאסף הרבה דפים. 61 00:02:47,018 --> 00:02:50,013 בסיומה של יחידה שלוש יהיה לנו סורק רשת בנוי. 62 00:02:50,013 --> 00:02:52,033 תהיה לנו דרך לבנות את המצבור שלנו. 63 00:02:52,033 --> 00:02:57,079 בשלושת היחידות הנותרות נראה כיצד נענים לשאילתות. 64 00:02:57,079 --> 00:03:01,034 וביחידה ארבע נסיק כיצד לתת תגובה טובה. 65 00:03:01,034 --> 00:03:08,022 כך שאם הנך מחפש/ת מלת מפתח תתקבל בתגובה רשימת דפים 66 00:03:08,022 --> 00:03:10,063 השייכים למלת המפתח הזו. 67 00:03:10,063 --> 00:03:15,090 וביחידה חמש נמצא דרך לעשות זאת יחסית לגודל, במקרה שיש לנו מצבור גדול. 68 00:03:15,090 --> 00:03:19,083 וביחידה שש אנו לא רק רוצים למצוא רשימה 69 00:03:19,083 --> 00:03:21,069 אנו רוצים למצוא את הרשימה הטובה ביותר. 70 00:03:21,069 --> 00:03:24,084 כך שנדע כיצד לדרג את כל הדפים בהם מלת המפתח מופיעה. 71 00:03:24,084 --> 00:03:27,068 אנו מעט מקדימים, 72 00:03:27,068 --> 00:03:30,035 מאחר וכל מה שאנו עומדים לעשות ביחידה אחת, 73 00:03:30,035 --> 00:03:32,064 הוא להבין כיצד לחלץ קישור אחד מדף. 74 00:03:32,064 --> 00:03:35,073 ומנוע החיפוש שנבנה בסוף התהליך 75 00:03:35,073 --> 00:03:37,034 יהיה מנוע חיפוש מתפקד. 76 00:03:37,034 --> 00:03:40,061 יהיו לו את המרכיבים העיקריים של מנוע חיפוש כמו שיש לגוגל. 77 00:03:40,061 --> 00:03:43,014 הוא בוודאי לא יהיה חזק כמו המנוע של גוגל 78 00:03:43,014 --> 00:03:44,029 אנו רוצים לשמור על פשטות. 79 00:03:44,029 --> 00:03:46,060 אנו רוצים לכתוב מעט קוד 80 00:03:46,060 --> 00:03:48,010 ועלינו לזכור שמטרתנו העקרית 81 00:03:48,010 --> 00:03:50,024 אינה לבנות מנוע חיפוש, 82 00:03:50,024 --> 00:03:52,078 אלא שימוש, בתהליך בניית מנוע חיפוש, ככלי עזר 83 00:03:52,078 --> 00:03:55,018 ללימוד מדעי המחשב. 84 00:03:55,018 --> 00:03:56,075 וגם ללמוד תכנות 85 00:03:56,075 --> 00:03:58,018 כך שלמידה תוך כדי עשייה 86 00:03:58,018 --> 99:59:59,999 תאפשר לנו לפתור הרבה בעיות אחרות.