בסדר גמור, תודה כריס
ותודה שאתם מארחים אותי פה.
האם כולם שומעים אותי טוב?
אז, היום אני הולך לדבר
על סוג של מידע
שמוכר לכולנו
ואני חושב שכולנו,
לפחות רובנו, באופן מהותי.
וזה מידע גאוגרפי
ובמיוחד תמונות של כדור הארץ.
ואנחנו כבר ראינו
כמה דוגמאות לזה היום.
אני אתחיל פה
עם תצוגה וסיפור קטן.
הייתי חייב להביא אביזר,
לא יכולתי להתאפק.
המקינטוש פאואר בוק 145 הישן שלי מ 1992.
זה המחשב הראשון
שהיה לי עם דיסק קשיח.
הוא הגיע עם 4, זה היה 4?
למעשה כ 6 מגה בייט של זיכרון.
זה היה עניין גדול
ואני הייתי המום מזה.
לא יכולתי להאמין שהיה לי כל כך הרבה זיכרון.
אני פשוט אניח את זה כאן.
אני לא האמנתי
שהיה לי כל כך הרבה זיכרון בקצות האצבעות שלי.
היום, לכולנו יש מחשבים.
אני יכול לרדת לסטייפלס
ולקנות מחשב
שיש לו רבע מיליון פעמים
יותר זיכרון מזה
בעבור 400$ או 600$
או משהו כזה.
זמנים השתנו
וזה היה לפני 20 שנה.
כתוצאה מכך,
עם כל כוח המחשוב הגדל,
אנחנו טובעים במידע.
אנחנו פשוט לחלוטין טובעים במידע.
ואחד מסוגי המידע
שאנחנו הכי טובעים בו
היא חישה מרחוק
או נתוני תמונות, נתוני לווין,
נתוני תצלומי אוויר, דברים כאלה.
וכולנו שיחקנו עם זה,
אני בטוח.
כולנו אוהבים גוגל כדור הארץ,
זה חינם וזה כיף.
וזה פשוט מלא בתמונות.
אז, מה אנחנו עושים עם כל הדברים האלה?
איך אנחנו עושים שימוש בזה?
הנה תמונה של בולטימור.
זאת בולטימור העירונית.
יש בה את כל האובייקטים הנפלאים האלה.
אני יכול להסתכל שם ולראות,
זה קשה עם המקרן הזה,
אבל אני יכול לראות עצים ובניינים,
ודברים כאלה.
ובואו נגיד
שרציתי בעצם לעשות איזשהו
מחקר כמותי עם זה.
נגיד שהייתי צריך לעשות משהו
שדורש לדעת
היכן בעצם היו העצים.
אני יכול לראות איפה נמצאים העצים,
אבל המחשב לא יודע,
אין לו מושג מהו עץ.
בואו נגיד שאני רציתי לעשות משהו כמו,
אלה למעשה המקומות של פשעים,
נגיד שרציתי לדעת
אם צפיפות של עצים משפיעה על פשע.
אין שום דרך שאני יכול לעשות את זה
עם תמונה בדרך שיש לנו את זה עכשיו,
בסביבת מחשוב.
וחלק מהסיבה לזה
היא שמחשבים
לא באמת טובים בלזהות דברים
כמו שאנחנו טובים בלזהות דברים.
אנחנו מצויינים בזיהוי
דברים עם הבדלים קלים מאוד.
אני יכול להגיד לכם בתוך שתי שניות
שזה ג'ורג' קרלין
וזה זיגמונד פרויד.
שזה הוא ביג לבובסקי
וזה אדי וודר.
עבורי לאמן את המחשב
לזהות את ההבדלים
בין ביג לבובסקי, א.ק.א. הברנש ואדי וודר,
היה לוקח לי כמויות זמן שלא ייאמנו.
ועדיין אני יכול לעשות זאת מיידית,
אז זה בעיה כאן.
אז, בואו ניגש לעניין כאן.
משמאל יש לי מידע גולמי.
צילום אינפרארד צבעוני של חישה מרחוק.
בצד ימין יש לי
שכבת מערכת מידע גיאוגרפית מסווגת.
זהו מידע שימושי.
המחשב יודע מה זה דשא,
מהם בניינים ויודע מהם עצים.
איך אני מגיע מאחד לשני?
זו חידה גדולה גדולה
בעולם של היום של נתונים ברזולוציה גבוהה.
הנה תמונה
של אזור עירוני טיפוסי.
אני מסתכל על זה ורואה
כל מיני תכונות
ואני רואה שזה ברזולוציה ממש טובה.
אם הייתי צריך לעבוד
עם נתוני חישה מרחוק לפני 15 שנה,
היו לי תמונות ברזולוציה גסה.
זהו אותו המיקום המדויק
באמצעות פיקסלים של 30 מטר.
אז, סיווג החומר הזה
היה דבר שונה באופן מהותי,
משום שכל מה שבאמת הייתי צריך לעשות
הוא להכנס לאזור הכללי של המגרש.
הפיקסלים האלו כאן
הם בגדול סוג של עירוניים,
הפיקסלים האלו בגדול סוג של יער.
אני לא באמת הייתי צריך לדעת
את הזהות המסויימת של חפצים.
עכשיו בהרצה קדימה להיום
ויש לי תמונה שאני יכול לעשות לה זום
ואני יכול לראות
מיליון סוגים שונים של דברים.
ממכוניות במגרש חנייה
למכולות,
למנופים במתקן המכולות
למכונות על גבי בניין
עד ל.., אני אוהב את זה,
זה הספינקס
במלון לוקסור בלאס וגאס.
תנסו להגיד למחשב מה זה.
הינה עוד אחד בלאס וגאס,
אני אוהבת את גוגל כדור הארץ בלאס וגאס,
זה הכי טוב, זה כל כך כיף.
זוהי בריכה טרופית בצורת דג.
שוב, לא כל כך קל להגיד למחשב
מה זה.
וזה הטוב מכולם.
אני מאמין שזאת תמונת לווין ברזולוציה גבוהה
של גמלים באמצע אפריקה
וזה חלק מפרויקט מגה טיסה מעל אפריקה
של גוגל ונשיונל גאוגרפיק,
המספר של דברים אפשריים
שאני צריך להכין מחשבים
להיות מוכנים להם,
הסוגים של אובייקטים
על גבי שטח כדור הארץ
שטח כדור הארץ,
הוא מדהים.
וזה פרוייקט
שלעולם לא נראה גמור,
הפרוייקט הזה של ללמד מחשבים
את הבינה מלאכותית,
לתת להם את הבינה המלאכותית
שהם צריכים
לזהות את כל הוריאציות על כדור הארץ.
הינה אחד אפילו יותר טוב.
זהו למעשה דבר אמיתי,
זהו הקולונל (KFC).
מישהו באמת עשה מגה אמנות
של הקולונל באמצע נבאדה.
זה מעניין
כמה רבים מאלו הגיעו מנבאדה.
(צחוק)
אז, בואו נסביר למה זה קשה
להשתמש בשיטות
שתמיד השתמשנו בהן בעבר
עבור הדור הזה
של תמונות ברזולוציה גבוהה.
הנה תמונה ברזולוציה גבוהה של ברלינגטון.
אם אני אנסה לסווג כל פיקסל,
פיקסל אחרי פיקסל,
אני אקבל קשקוש מפוקסל נוראי.
אם אני מסתכל על אובייקט ספציפי
כמו בית, הבית הזה עשוי,
זה קשה לראות, אבל זה פשוט עשרות
ערכי פיקסל שונים.
שלא באמת אומרים שום דבר.
אם אני לוקח עץ בודד, שוב,
זה מומצא מקשקוש של פיקסלים.
עכשיו, אם אני עושה זום על העץ הזה,
למשל,
אני אראה שזה עשוי מפיקסלים,
הרבה סוגים של טונים, צבעים שונים,
וזה הייצוג הישיר
בפיקסלים מסווגים,
זה חסר משמעות, נכון?
זה לא למצוא אובייקטים.
אז, אני צריך ללמד את המחשב
לראות אובייקטים ולחשוב כמוני.
זה אומר ללמד מחשב
לחשוב כמו בן אנוש,
מה שאומר לעבוד
על בסיס גודל צורני, טון, דפוס,
טקסטורה, ראייה ואסוציאציה,
הרבה מזה זה מרחבי.
אנחנו חייבים להפסיק לחשוב פיקסל פיקסל
ולהתחיל לחשוב על דברים מרחבית.
זה אומר לקחת תמונה
ומה שנקרא, לפלח אותה,
להפוך אותה לאובייקטים.
והתהליך של הפילוח הזה
הוא קשה מאוד.
אתם צריכים לאמן מחשב
לפלח בצורה נכונה.
ואם אני מסתכל, הנה בית,
הנה צד אחד של הגג
וצד אחר של הגג,
יש כביש פרטי,
הם מפולחים כאובייקטים שונים
ואז אני יכול לארגן את האובייקטים מחדש
לתוך משהו שהוא רק בית
ומשהו אחר שהוא רק כביש פרטי.
ובסוף היום, מה שיהיה לי
זה משהו כזה.
אני אוכל להגיד לכם את ההבדלים.
למרות שהחתימה הספקטרלית
היא מאותו הגג הזה והכביש הזה,
אני יודע שגורם הקומפקטיות שלהם
הוא שונה,
ובגלל זה,
בגלל מדדי הצורה שלהם,
אני יכול להגיד לכם מי מהם הוא גג
ומי מהם הוא כביש,
ואני יכול להתחיל
לסווג דברים בצורה הזאת.
בכדי לעשות זאת נדרשת
מערכת חוקים עצומה.
מערכת החוקים יכולה להיות עשרות על עשרות
עד מעל מאה דפים.
של כל חוקי הסיווג האלו
ואני לא אשעמם אתכם עם הפרטים.
אני גם אשתמש במידע מסייע.
יש את כל סוגי מגדירי מערכות מידע גיאוגרפיות גדולים
שעוזרים לי עכשיו לסווג דברים.
רוב הערים אוספות דברים
על עקבות בניין,
אנחנו יודעים איפה נמצאות חלקות אדמה,
אנחנו יודעים איפה הם קווי ביוב
וכבישים וכל מיני דברים כאלה.
אנחנו יכולים להשתמש בזה כדי לעזור לעצמנו,
אבל הכי חשוב
מהמידע המסייע
שנמצא שם בחוץ היום נקרא ליידר:
איתור אור בטווח.
ובליידר משתמשים
מזה זמן מה בהנדסה
וזה מאפשר לנו במהות ליצור
מודלים של פני השטח.
זוהי כיכר קולומבוס
בסנטרל פארק בניו יורק
וזה גובה פני השטח
של העצים.
הליידר אומר לי
היכן נמצאת החופה של העצים,
היכן נמצאים גגות הבניינים,
הוא אומר לי גם היכן פני הקרקע.
ואני יכול ליצור מודלים מפורטים להפליא
של העולם
אז עכשיו אני לא רק עובד
עם מידע ספקטרלי מרחבי,
החזרת מידע,
אני גם עובד עם מידע גובה,
אני יודע את הגבהים של הדברים
אז אני יכול לראות שני אובייקטים
שהם ירוקים ועציים,
אבל אני יכול להגיד שאחד מהם הוא שיח
ואחד מהם הוא עץ.
וזה רק זום על משטח שם.
עכשיו הבעיה היא,
זה מאוד עתיר נתונים
ואף אחד לא הבין עד לא מזמן,
ואני מתכוון שאולי לפני שנתיים,
אנשים עשו את זה
על בסיס של אריח אחרי אריח
לעבוד על אריח אחד קטן של נתונים
בכל פעם
זה עלול להיות, אתם יודעים,
אחד, שרק שקווי המתאר האדומים
שאתם רואה שם,
ושעשוי להיות חצי ג'יגה
או משהו כזה.
אז אנחנו כבר עובדים על להפוך את זה
לסביבה ארגונית,
זה מה שאנחנו צריכים לעשות,
לעשות מזה סביבה ארגונית
כך שנוכל להתחיל להסתכל
על אלפי אריחים של נתונים בכל פעם,
ועשינו את זה בהצלחה.
המעבדה שלי, היא מעבדה לניתוח מרחבי.
המעבדה לניתוח מרחבי היא המעבדה שאני מנהל,
והם עושים את הדברים האלו כבר כמה שנים,
והם אספו, מ 64 פרויקטים, 837 קהילות,
כיסו 28 מיליון אנשים,
כמעט 9000 קילומטרים רבועים של נתונים מופו,
250 מיליארד פיקסלים של מוצרים שנוצרו
מכיסוי הקרקע
ו 110 טרה של נתונים.
אז זו התחייבות גדולה
אבל זו רק ההתחלה.
נחזור לנתוני הפשיעה
שסיפרתי לכם על העצים האלה,
אז הנה שוב בולטימור.
שימוש בשיטה הזאת,
אנחנו הופכים נתונים למידע.
אנחנו מקבלים עצים,
אנחנו יודעים עכשיו איפה עצים נמצאים.
אני מכסה את זה עם הפשיעה.
אני מסיים עם מידע,
אני עכשיו יכול לעשות מחקר,
ורק הצענו את זה
לפרסום.
נודע לנו למעשה
שיש קשר שלילי חזק
בין עצים ופשיעה
גם כשהתאמתי לכחמישים דברים אחרים.
לא יכולנו לעשות את זה
ללא סוג זה של מידע.
אז עם זה, אני אגיד תודה לאנשים
מהמעבדה לניתוח מרחבי,
ובמיוחד לג'רלאט אוניל-דאן
שעזר לי להכין את זה
ועשה את המחקר הזה
במשך זמן רב ותודה לכם.
תודה לכם. (מחיאות כפיים)