1 00:00:14,641 --> 00:00:16,809 בסדר גמור, תודה כריס ותודה שאתם מארחים אותי פה. 2 00:00:16,809 --> 00:00:19,441 האם כולם שומעים אותי טוב? 3 00:00:21,665 --> 00:00:24,825 אז, היום אני הולך לדבר 4 00:00:24,825 --> 00:00:27,094 על סוג של מידע שמוכר לכולנו 5 00:00:27,094 --> 00:00:30,861 ואני חושב שכולנו, לפחות רובנו, באופן מהותי. 6 00:00:30,861 --> 00:00:34,878 וזה מידע גאוגרפי ובמיוחד תמונות של כדור הארץ. 7 00:00:34,878 --> 00:00:38,131 ואנחנו כבר ראינו כמה דוגמאות לזה היום. 8 00:00:38,131 --> 00:00:41,839 אני אתחיל פה עם תצוגה וסיפור קטן. 9 00:00:41,845 --> 00:00:44,305 הייתי חייב להביא אביזר, לא יכולתי להתאפק. 10 00:00:44,305 --> 00:00:51,144 המקינטוש פאואר בוק 145 הישן שלי מ 1992. 11 00:00:51,144 --> 00:00:56,052 זה המחשב הראשון שהיה לי עם דיסק קשיח. 12 00:00:56,052 --> 00:00:58,747 הוא הגיע עם 4, זה היה 4? 13 00:00:58,747 --> 00:01:03,534 למעשה כ 6 מגה בייט של זיכרון. 14 00:01:03,534 --> 00:01:07,434 זה היה עניין גדול ואני הייתי המום מזה. 15 00:01:07,434 --> 00:01:09,376 לא יכולתי להאמין שהיה לי כל כך הרבה זיכרון. 16 00:01:09,376 --> 00:01:11,240 אני פשוט אניח את זה כאן. 17 00:01:11,240 --> 00:01:14,610 אני לא האמנתי שהיה לי כל כך הרבה זיכרון בקצות האצבעות שלי. 18 00:01:14,610 --> 00:01:16,953 היום, לכולנו יש מחשבים. 19 00:01:16,979 --> 00:01:19,178 אני יכול לרדת לסטייפלס ולקנות מחשב 20 00:01:19,178 --> 00:01:22,143 שיש לו רבע מיליון פעמים יותר זיכרון מזה 21 00:01:22,143 --> 00:01:25,149 בעבור 400$ או 600$ או משהו כזה. 22 00:01:25,149 --> 00:01:27,930 זמנים השתנו וזה היה לפני 20 שנה. 23 00:01:27,930 --> 00:01:31,726 כתוצאה מכך, עם כל כוח המחשוב הגדל, 24 00:01:31,726 --> 00:01:34,393 אנחנו טובעים במידע. 25 00:01:34,393 --> 00:01:36,236 אנחנו פשוט לחלוטין טובעים במידע. 26 00:01:36,236 --> 00:01:38,775 ואחד מסוגי המידע שאנחנו הכי טובעים בו 27 00:01:38,775 --> 00:01:41,931 היא חישה מרחוק או נתוני תמונות, נתוני לווין, 28 00:01:41,931 --> 00:01:44,127 נתוני תצלומי אוויר, דברים כאלה. 29 00:01:44,127 --> 00:01:46,345 וכולנו שיחקנו עם זה, אני בטוח. 30 00:01:46,345 --> 00:01:49,015 כולנו אוהבים גוגל כדור הארץ, זה חינם וזה כיף. 31 00:01:49,015 --> 00:01:51,728 וזה פשוט מלא בתמונות. 32 00:01:51,728 --> 00:01:54,276 אז, מה אנחנו עושים עם כל הדברים האלה? 33 00:01:54,276 --> 00:01:56,065 איך אנחנו עושים שימוש בזה? 34 00:01:56,065 --> 00:01:59,014 הנה תמונה של בולטימור. זאת בולטימור העירונית. 35 00:01:59,061 --> 00:02:00,856 יש בה את כל האובייקטים הנפלאים האלה. 36 00:02:00,856 --> 00:02:02,675 אני יכול להסתכל שם ולראות, 37 00:02:02,675 --> 00:02:04,140 זה קשה עם המקרן הזה, 38 00:02:04,163 --> 00:02:06,525 אבל אני יכול לראות עצים ובניינים, ודברים כאלה. 39 00:02:06,549 --> 00:02:07,890 ובואו נגיד 40 00:02:07,916 --> 00:02:12,144 שרציתי בעצם לעשות איזשהו מחקר כמותי עם זה. 41 00:02:12,144 --> 00:02:14,262 נגיד שהייתי צריך לעשות משהו שדורש לדעת 42 00:02:14,262 --> 00:02:15,580 היכן בעצם היו העצים. 43 00:02:15,580 --> 00:02:17,200 אני יכול לראות איפה נמצאים העצים, 44 00:02:17,200 --> 00:02:20,392 אבל המחשב לא יודע, אין לו מושג מהו עץ. 45 00:02:20,392 --> 00:02:23,021 בואו נגיד שאני רציתי לעשות משהו כמו, 46 00:02:23,021 --> 00:02:25,114 אלה למעשה המקומות של פשעים, 47 00:02:25,114 --> 00:02:29,114 נגיד שרציתי לדעת אם צפיפות של עצים משפיעה על פשע. 48 00:02:29,114 --> 00:02:32,291 אין שום דרך שאני יכול לעשות את זה עם תמונה בדרך שיש לנו את זה עכשיו, 49 00:02:32,291 --> 00:02:35,894 בסביבת מחשוב. 50 00:02:35,894 --> 00:02:38,645 וחלק מהסיבה לזה 51 00:02:38,645 --> 00:02:41,395 היא שמחשבים לא באמת טובים בלזהות דברים 52 00:02:41,395 --> 00:02:43,348 כמו שאנחנו טובים בלזהות דברים. 53 00:02:43,348 --> 00:02:47,911 אנחנו מצויינים בזיהוי דברים עם הבדלים קלים מאוד. 54 00:02:47,911 --> 00:02:50,572 אני יכול להגיד לכם בתוך שתי שניות 55 00:02:50,572 --> 00:02:53,359 שזה ג'ורג' קרלין וזה זיגמונד פרויד. 56 00:02:53,359 --> 00:02:56,148 שזה הוא ביג לבובסקי וזה אדי וודר. 57 00:02:56,148 --> 00:02:59,896 עבורי לאמן את המחשב לזהות את ההבדלים 58 00:02:59,896 --> 00:03:03,644 בין ביג לבובסקי, א.ק.א. הברנש ואדי וודר, 59 00:03:03,644 --> 00:03:07,394 היה לוקח לי כמויות זמן שלא ייאמנו. 60 00:03:07,394 --> 00:03:11,648 ועדיין אני יכול לעשות זאת מיידית, אז זה בעיה כאן. 61 00:03:11,648 --> 00:03:14,866 אז, בואו ניגש לעניין כאן. 62 00:03:14,866 --> 00:03:17,798 משמאל יש לי מידע גולמי. 63 00:03:17,824 --> 00:03:20,510 צילום אינפרארד צבעוני של חישה מרחוק. 64 00:03:20,510 --> 00:03:26,557 בצד ימין יש לי שכבת מערכת מידע גיאוגרפית מסווגת. 65 00:03:26,573 --> 00:03:29,644 זהו מידע שימושי. 66 00:03:29,644 --> 00:03:33,944 המחשב יודע מה זה דשא, מהם בניינים ויודע מהם עצים. 67 00:03:33,944 --> 00:03:36,976 איך אני מגיע מאחד לשני? 68 00:03:36,976 --> 00:03:41,223 זו חידה גדולה גדולה בעולם של היום של נתונים ברזולוציה גבוהה. 69 00:03:41,223 --> 00:03:44,192 הנה תמונה של אזור עירוני טיפוסי. 70 00:03:44,192 --> 00:03:46,144 אני מסתכל על זה ורואה כל מיני תכונות 71 00:03:46,160 --> 00:03:48,325 ואני רואה שזה ברזולוציה ממש טובה. 72 00:03:48,325 --> 00:03:52,063 אם הייתי צריך לעבוד עם נתוני חישה מרחוק לפני 15 שנה, 73 00:03:52,063 --> 00:03:54,785 היו לי תמונות ברזולוציה גסה. 74 00:03:54,811 --> 00:03:57,224 זהו אותו המיקום המדויק באמצעות פיקסלים של 30 מטר. 75 00:03:57,224 --> 00:04:01,980 אז, סיווג החומר הזה היה דבר שונה באופן מהותי, 76 00:04:01,980 --> 00:04:05,509 משום שכל מה שבאמת הייתי צריך לעשות הוא להכנס לאזור הכללי של המגרש. 77 00:04:05,509 --> 00:04:08,315 הפיקסלים האלו כאן הם בגדול סוג של עירוניים, 78 00:04:08,315 --> 00:04:11,121 הפיקסלים האלו בגדול סוג של יער. 79 00:04:11,121 --> 00:04:14,707 אני לא באמת הייתי צריך לדעת את הזהות המסויימת של חפצים. 80 00:04:14,707 --> 00:04:18,587 עכשיו בהרצה קדימה להיום ויש לי תמונה שאני יכול לעשות לה זום 81 00:04:18,587 --> 00:04:23,472 ואני יכול לראות מיליון סוגים שונים של דברים. 82 00:04:23,472 --> 00:04:29,917 ממכוניות במגרש חנייה למכולות, 83 00:04:29,917 --> 00:04:33,818 למנופים במתקן המכולות 84 00:04:33,858 --> 00:04:37,556 למכונות על גבי בניין 85 00:04:37,937 --> 00:04:39,270 עד ל.., אני אוהב את זה, 86 00:04:39,270 --> 00:04:42,908 זה הספינקס במלון לוקסור בלאס וגאס. 87 00:04:42,908 --> 00:04:45,088 תנסו להגיד למחשב מה זה. 88 00:04:45,088 --> 00:04:48,504 הינה עוד אחד בלאס וגאס, אני אוהבת את גוגל כדור הארץ בלאס וגאס, 89 00:04:48,504 --> 00:04:50,024 זה הכי טוב, זה כל כך כיף. 90 00:04:50,024 --> 00:04:52,746 זוהי בריכה טרופית בצורת דג. 91 00:04:52,793 --> 00:04:56,218 שוב, לא כל כך קל להגיד למחשב מה זה. 92 00:04:56,250 --> 00:04:57,710 וזה הטוב מכולם. 93 00:04:57,757 --> 00:05:03,103 אני מאמין שזאת תמונת לווין ברזולוציה גבוהה 94 00:05:03,103 --> 00:05:07,496 של גמלים באמצע אפריקה וזה חלק מפרויקט מגה טיסה מעל אפריקה 95 00:05:07,496 --> 00:05:11,889 של גוגל ונשיונל גאוגרפיק, 96 00:05:11,889 --> 00:05:14,056 המספר של דברים אפשריים 97 00:05:14,082 --> 00:05:16,282 שאני צריך להכין מחשבים להיות מוכנים להם, 98 00:05:16,282 --> 00:05:18,687 הסוגים של אובייקטים על גבי שטח כדור הארץ 99 00:05:18,713 --> 00:05:20,345 שטח כדור הארץ, הוא מדהים. 100 00:05:20,745 --> 00:05:25,208 וזה פרוייקט שלעולם לא נראה גמור, 101 00:05:25,208 --> 00:05:29,381 הפרוייקט הזה של ללמד מחשבים את הבינה מלאכותית, 102 00:05:29,381 --> 00:05:31,663 לתת להם את הבינה המלאכותית שהם צריכים 103 00:05:31,687 --> 00:05:33,885 לזהות את כל הוריאציות על כדור הארץ. 104 00:05:33,909 --> 00:05:35,353 הינה אחד אפילו יותר טוב. 105 00:05:35,369 --> 00:05:38,114 זהו למעשה דבר אמיתי, זהו הקולונל (KFC). 106 00:05:38,114 --> 00:05:42,733 מישהו באמת עשה מגה אמנות של הקולונל באמצע נבאדה. 107 00:05:43,233 --> 00:05:46,371 זה מעניין כמה רבים מאלו הגיעו מנבאדה. 108 00:05:46,400 --> 00:05:48,828 (צחוק) 109 00:05:49,471 --> 00:05:51,618 אז, בואו נסביר למה זה קשה 110 00:05:51,618 --> 00:05:55,125 להשתמש בשיטות שתמיד השתמשנו בהן בעבר 111 00:05:55,125 --> 00:05:58,302 עבור הדור הזה של תמונות ברזולוציה גבוהה. 112 00:05:58,302 --> 00:06:01,337 הנה תמונה ברזולוציה גבוהה של ברלינגטון. 113 00:06:01,337 --> 00:06:06,232 אם אני אנסה לסווג כל פיקסל, פיקסל אחרי פיקסל, 114 00:06:06,232 --> 00:06:10,710 אני אקבל קשקוש מפוקסל נוראי. 115 00:06:10,710 --> 00:06:14,370 אם אני מסתכל על אובייקט ספציפי כמו בית, הבית הזה עשוי, 116 00:06:14,370 --> 00:06:17,410 זה קשה לראות, אבל זה פשוט עשרות ערכי פיקסל שונים. 117 00:06:17,410 --> 00:06:19,005 שלא באמת אומרים שום דבר. 118 00:06:19,029 --> 00:06:23,784 אם אני לוקח עץ בודד, שוב, זה מומצא מקשקוש של פיקסלים. 119 00:06:23,784 --> 00:06:26,802 עכשיו, אם אני עושה זום על העץ הזה, למשל, 120 00:06:26,802 --> 00:06:33,312 אני אראה שזה עשוי מפיקסלים, הרבה סוגים של טונים, צבעים שונים, 121 00:06:33,312 --> 00:06:37,837 וזה הייצוג הישיר בפיקסלים מסווגים, 122 00:06:37,837 --> 00:06:39,332 זה חסר משמעות, נכון? 123 00:06:39,332 --> 00:06:40,949 זה לא למצוא אובייקטים. 124 00:06:40,949 --> 00:06:45,969 אז, אני צריך ללמד את המחשב לראות אובייקטים ולחשוב כמוני. 125 00:06:46,017 --> 00:06:48,795 זה אומר ללמד מחשב לחשוב כמו בן אנוש, 126 00:06:48,795 --> 00:06:52,148 מה שאומר לעבוד על בסיס גודל צורני, טון, דפוס, 127 00:06:52,148 --> 00:06:55,310 טקסטורה, ראייה ואסוציאציה, הרבה מזה זה מרחבי. 128 00:06:55,310 --> 00:07:00,450 אנחנו חייבים להפסיק לחשוב פיקסל פיקסל ולהתחיל לחשוב על דברים מרחבית. 129 00:07:00,450 --> 00:07:04,265 זה אומר לקחת תמונה ומה שנקרא, לפלח אותה, 130 00:07:04,265 --> 00:07:05,757 להפוך אותה לאובייקטים. 131 00:07:05,788 --> 00:07:08,694 והתהליך של הפילוח הזה הוא קשה מאוד. 132 00:07:08,694 --> 00:07:12,763 אתם צריכים לאמן מחשב לפלח בצורה נכונה. 133 00:07:12,763 --> 00:07:15,496 ואם אני מסתכל, הנה בית, הנה צד אחד של הגג 134 00:07:15,496 --> 00:07:17,911 וצד אחר של הגג, יש כביש פרטי, 135 00:07:17,939 --> 00:07:19,727 הם מפולחים כאובייקטים שונים 136 00:07:19,753 --> 00:07:21,702 ואז אני יכול לארגן את האובייקטים מחדש 137 00:07:21,702 --> 00:07:25,181 לתוך משהו שהוא רק בית ומשהו אחר שהוא רק כביש פרטי. 138 00:07:25,181 --> 00:07:27,761 ובסוף היום, מה שיהיה לי 139 00:07:27,787 --> 00:07:29,107 זה משהו כזה. 140 00:07:29,107 --> 00:07:31,829 אני אוכל להגיד לכם את ההבדלים. 141 00:07:31,845 --> 00:07:37,503 למרות שהחתימה הספקטרלית היא מאותו הגג הזה והכביש הזה, 142 00:07:37,598 --> 00:07:40,845 אני יודע שגורם הקומפקטיות שלהם הוא שונה, 143 00:07:40,845 --> 00:07:43,568 ובגלל זה, בגלל מדדי הצורה שלהם, 144 00:07:43,568 --> 00:07:46,291 אני יכול להגיד לכם מי מהם הוא גג ומי מהם הוא כביש, 145 00:07:46,291 --> 00:07:49,015 ואני יכול להתחיל לסווג דברים בצורה הזאת. 146 00:07:52,845 --> 00:07:55,646 בכדי לעשות זאת נדרשת מערכת חוקים עצומה. 147 00:07:55,646 --> 00:08:01,125 מערכת החוקים יכולה להיות עשרות על עשרות עד מעל מאה דפים. 148 00:08:01,125 --> 00:08:06,186 של כל חוקי הסיווג האלו ואני לא אשעמם אתכם עם הפרטים. 149 00:08:06,186 --> 00:08:09,687 אני גם אשתמש במידע מסייע. 150 00:08:09,687 --> 00:08:13,136 יש את כל סוגי מגדירי מערכות מידע גיאוגרפיות גדולים שעוזרים לי עכשיו לסווג דברים. 151 00:08:13,136 --> 00:08:16,174 רוב הערים אוספות דברים על עקבות בניין, 152 00:08:16,174 --> 00:08:18,721 אנחנו יודעים איפה נמצאות חלקות אדמה, אנחנו יודעים איפה הם קווי ביוב 153 00:08:18,737 --> 00:08:20,371 וכבישים וכל מיני דברים כאלה. 154 00:08:20,398 --> 00:08:21,806 אנחנו יכולים להשתמש בזה כדי לעזור לעצמנו, 155 00:08:21,806 --> 00:08:23,823 אבל הכי חשוב מהמידע המסייע 156 00:08:23,849 --> 00:08:27,767 שנמצא שם בחוץ היום נקרא ליידר: איתור אור בטווח. 157 00:08:27,767 --> 00:08:30,044 ובליידר משתמשים מזה זמן מה בהנדסה 158 00:08:30,060 --> 00:08:32,808 וזה מאפשר לנו במהות ליצור מודלים של פני השטח. 159 00:08:32,808 --> 00:08:35,566 זוהי כיכר קולומבוס בסנטרל פארק בניו יורק 160 00:08:35,566 --> 00:08:38,787 וזה גובה פני השטח של העצים. 161 00:08:38,787 --> 00:08:42,107 הליידר אומר לי היכן נמצאת החופה של העצים, 162 00:08:42,107 --> 00:08:47,580 היכן נמצאים גגות הבניינים, הוא אומר לי גם היכן פני הקרקע. 163 00:08:47,580 --> 00:08:50,702 ואני יכול ליצור מודלים מפורטים להפליא של העולם 164 00:08:50,702 --> 00:08:52,195 אז עכשיו אני לא רק עובד 165 00:08:52,195 --> 00:08:55,539 עם מידע ספקטרלי מרחבי, החזרת מידע, 166 00:08:55,539 --> 00:08:59,011 אני גם עובד עם מידע גובה, אני יודע את הגבהים של הדברים 167 00:08:59,011 --> 00:09:02,349 אז אני יכול לראות שני אובייקטים שהם ירוקים ועציים, 168 00:09:02,349 --> 00:09:05,687 אבל אני יכול להגיד שאחד מהם הוא שיח ואחד מהם הוא עץ. 169 00:09:05,687 --> 00:09:09,027 וזה רק זום על משטח שם. 170 00:09:09,027 --> 00:09:12,042 עכשיו הבעיה היא, זה מאוד עתיר נתונים 171 00:09:12,052 --> 00:09:17,757 ואף אחד לא הבין עד לא מזמן, ואני מתכוון שאולי לפני שנתיים, 172 00:09:17,757 --> 00:09:20,862 אנשים עשו את זה על בסיס של אריח אחרי אריח 173 00:09:20,862 --> 00:09:22,840 לעבוד על אריח אחד קטן של נתונים בכל פעם 174 00:09:22,866 --> 00:09:24,672 זה עלול להיות, אתם יודעים, 175 00:09:24,672 --> 00:09:28,552 אחד, שרק שקווי המתאר האדומים שאתם רואה שם, 176 00:09:28,576 --> 00:09:31,250 ושעשוי להיות חצי ג'יגה או משהו כזה. 177 00:09:31,250 --> 00:09:35,148 אז אנחנו כבר עובדים על להפוך את זה לסביבה ארגונית, 178 00:09:35,148 --> 00:09:38,397 זה מה שאנחנו צריכים לעשות, לעשות מזה סביבה ארגונית 179 00:09:38,397 --> 00:09:41,322 כך שנוכל להתחיל להסתכל על אלפי אריחים של נתונים בכל פעם, 180 00:09:41,322 --> 00:09:42,860 ועשינו את זה בהצלחה. 181 00:09:44,316 --> 00:09:48,088 המעבדה שלי, היא מעבדה לניתוח מרחבי. 182 00:09:48,114 --> 00:09:51,860 המעבדה לניתוח מרחבי היא המעבדה שאני מנהל, 183 00:09:51,860 --> 00:09:54,921 והם עושים את הדברים האלו כבר כמה שנים, 184 00:09:54,921 --> 00:09:59,142 והם אספו, מ 64 פרויקטים, 837 קהילות, 185 00:09:59,142 --> 00:10:03,895 כיסו 28 מיליון אנשים, כמעט 9000 קילומטרים רבועים של נתונים מופו, 186 00:10:03,895 --> 00:10:06,977 250 מיליארד פיקסלים של מוצרים שנוצרו מכיסוי הקרקע 187 00:10:06,977 --> 00:10:09,024 ו 110 טרה של נתונים. 188 00:10:09,064 --> 00:10:12,346 אז זו התחייבות גדולה אבל זו רק ההתחלה. 189 00:10:12,386 --> 00:10:15,578 נחזור לנתוני הפשיעה שסיפרתי לכם על העצים האלה, 190 00:10:15,578 --> 00:10:17,141 אז הנה שוב בולטימור. 191 00:10:17,181 --> 00:10:20,395 שימוש בשיטה הזאת, אנחנו הופכים נתונים למידע. 192 00:10:20,434 --> 00:10:22,640 אנחנו מקבלים עצים, אנחנו יודעים עכשיו איפה עצים נמצאים. 193 00:10:22,695 --> 00:10:24,274 אני מכסה את זה עם הפשיעה. 194 00:10:24,456 --> 00:10:28,479 אני מסיים עם מידע, אני עכשיו יכול לעשות מחקר, 195 00:10:28,532 --> 00:10:30,683 ורק הצענו את זה לפרסום. 196 00:10:30,707 --> 00:10:34,008 נודע לנו למעשה שיש קשר שלילי חזק 197 00:10:34,048 --> 00:10:35,437 בין עצים ופשיעה 198 00:10:35,460 --> 00:10:37,618 גם כשהתאמתי לכחמישים דברים אחרים. 199 00:10:37,658 --> 00:10:42,844 לא יכולנו לעשות את זה ללא סוג זה של מידע. 200 00:10:42,852 --> 00:10:45,352 אז עם זה, אני אגיד תודה לאנשים 201 00:10:45,391 --> 00:10:46,986 מהמעבדה לניתוח מרחבי, 202 00:10:47,031 --> 00:10:50,221 ובמיוחד לג'רלאט אוניל-דאן שעזר לי להכין את זה 203 00:10:50,222 --> 00:10:53,245 ועשה את המחקר הזה במשך זמן רב ותודה לכם. 204 00:10:53,250 --> 00:10:56,312 תודה לכם. (מחיאות כפיים)