1 00:00:00,000 --> 00:00:02,000 Έρεζ Λίμπερμαν Έιντεν: Είναι γνωστό 2 00:00:02,000 --> 00:00:05,000 ότι μια εικόνα αξίζει χίλιες λέξεις. 3 00:00:07,000 --> 00:00:09,000 Αλλά εμείς στο Χάρβαρντ 4 00:00:09,000 --> 00:00:12,000 αναρωτιόμασταν αν αυτό αληθεύει. 5 00:00:12,000 --> 00:00:14,000 (Γέλια) 6 00:00:14,000 --> 00:00:19,470 Έτσι, μαζέψαμε μια ομάδα ειδικών από το Χαρβαρντ, το ΜΙΤ, 7 00:00:19,540 --> 00:00:23,800 το Λεξικό Αμερικανικής Κληρονομιάς, την εγκυκλοπαίδεια Μπριτάνικα 8 00:00:23,800 --> 00:00:27,340 και τους περήφανους χορηγούς μας, την Google. 9 00:00:28,000 --> 00:00:30,000 Και πέσαμε σε βαθιά περισυλλογή 10 00:00:30,000 --> 00:00:32,000 για περίπου τέσσερα χρόνια. 11 00:00:33,400 --> 00:00:37,000 Καταλήξαμε σε ένα τρομακτικό συμπέρασμα. 12 00:00:37,000 --> 00:00:40,000 Κυρίες και κύριοι, μια εικόνα δεν αξίζει 1.000 λέξεις. 13 00:00:40,000 --> 00:00:42,000 Πράγματι, βρήκαμε εικόνες 14 00:00:42,000 --> 00:00:46,550 που αξίζουν 500 δις λέξεις. 15 00:00:46,860 --> 00:00:49,590 Ζαν-Μπατίστ Μισέλ: Πώς καταλήξαμε σε αυτό το συμπέρασμα; 16 00:00:49,590 --> 00:00:51,000 Ο Έρεζ και εγώ σκεφτόμασταν τρόπους 17 00:00:51,000 --> 00:00:53,230 για να δούμε μία συνολική εικόνα του ανθρώπινου πολιτισμού 18 00:00:53,230 --> 00:00:56,000 και της ανθρώπινης ιστορίας: αλλαγή μέσα στον χρόνο. 19 00:00:56,000 --> 00:00:58,000 Πάρα πολλά βιβλία γράφτηκαν στη διάρκεια των χρόνων 20 00:00:58,000 --> 00:01:01,020 Έτσι σκεφτήκαμε ότι ο καλύτερος τρόπος να μάθουμε κάτι από αυτά 21 00:01:01,020 --> 00:01:02,740 είναι να τα διαβάσουμε όλα. 22 00:01:02,740 --> 00:01:05,000 Τώρα βέβαια, αν υπάρχει μια κλίμακα για το πόσο "φανταστικό" είναι αυτό 23 00:01:05,000 --> 00:01:07,850 τότε πρέπει να φιγουράρει πολύ ψηλά. 24 00:01:07,850 --> 00:01:10,450 Τώρα το πρόβλημα εδώ είναι ότι υπάρχει ο άξονας του χ, 25 00:01:10,450 --> 00:01:12,480 ο οποίος είναι ο άξονας της πρακτικότητας. 26 00:01:12,480 --> 00:01:14,410 Αυτή βρίσκεται πολύ, πολύ χαμηλά. 27 00:01:14,410 --> 00:01:17,000 (Χειροκρότημα) 28 00:01:17,000 --> 00:01:20,000 Τώρα ο κόσμος τείνει να έχει μια διαφορετική προσέγγιση, 29 00:01:20,000 --> 00:01:22,000 η οποία είναι να παίρνεις μόνο μερικές πηγές και να τις διαβάζεις πολύ προσεκτικά. 30 00:01:22,000 --> 00:01:24,000 Αυτό είναι πολύ πρακτικό αλλά όχι "φανταστικό" 31 00:01:24,000 --> 00:01:27,000 Αυτό που πραγματικά θέλουμε να κάνουμε 32 00:01:27,000 --> 00:01:30,000 είναι να φτάσουμε στο πρακτικό και "φανταστικό" κομμάτι αυτού του μέρους. 33 00:01:30,000 --> 00:01:33,000 Λοιπόν, υπάρχει μια εταιρεία στην άλλη μεριά του ποταμού που λέγεται Google™ 34 00:01:33,000 --> 00:01:35,000 η οποία πριν από μερικά χρόνια ξεκίνησε ένα έργο ψηφιοποίησης 35 00:01:35,000 --> 00:01:37,000 το οποιό θα επέτρεπε αυτή την προσέγγιση. 36 00:01:37,000 --> 00:01:39,000 Ψηφιοποίησαν εκατομμύρια βιβλία. 37 00:01:39,000 --> 00:01:42,000 Αυτό σημαίνει ότι κάποιος θα μπορούσε να χρησιμοποιήσει υπολογιστικές μεθόδους 38 00:01:42,000 --> 00:01:44,000 για να διαβάσει όλα τα βιβλία με το πάτημα ενός κουμπιού. 39 00:01:44,000 --> 00:01:47,000 Αυτό είναι πολύ πρακτικό και πάρα πολύ "φανταστικό". 40 00:01:48,000 --> 00:01:50,000 ΕΛΕ: Επιτρέψτε μου να σας μιλήσω λίγο για την προέλευση των βιβλίων. 41 00:01:50,000 --> 00:01:53,000 Οι συγγραφείς υπάρχουν από αμνημονεύτων χρόνων. 42 00:01:53,000 --> 00:01:56,000 Αυτοί οι συγγραφείς προσπαθούσαν να γράψουν βιβλία. 43 00:01:56,000 --> 00:01:58,000 Αυτό έγινε πολύ ευκολότερο 44 00:01:58,000 --> 00:02:00,000 με την ανακάλυψη της τυπογραφίας πριν από μερικους αιώνες. 45 00:02:00,000 --> 00:02:03,000 Από τότε οι συγγραφείς κατάφεραν, 46 00:02:03,000 --> 00:02:05,000 σε 129 εκ. ξεχωριστές περιπτώσεις, 47 00:02:05,000 --> 00:02:07,000 να εκδώσουν βιβλία 48 00:02:07,000 --> 00:02:09,000 Αν τώρα, αυτά τα βιβλία δεν χάθηκαν κάπου μέσα στην ιστορία, 49 00:02:09,000 --> 00:02:11,000 τότε είναι σε κάποια βιβλιοθήκη 50 00:02:11,000 --> 00:02:14,000 και πολλά από αυτά τα βιβλία η Google τα πήρε από τη βιβλιοθήκη 51 00:02:14,000 --> 00:02:16,000 και τα ψηφιοποίησε, 52 00:02:16,000 --> 00:02:18,000 σαρώνοντας μέχρι σήμερα 15 εκατομμύρια βιβλία. 53 00:02:18,000 --> 00:02:21,000 Όταν η Google ψηφιοποιεί ένα βιβλίο, το μετατρέπει σε μια πολύ όμορφη μορφή. 54 00:02:21,000 --> 00:02:23,000 Έχουμε τα δεδομένα (data) και τα μεταδεδομένα (metadata) 55 00:02:23,000 --> 00:02:26,000 Έχουμε πληροφορίες για πράγματα όπως, τον τόπο έκδοσης, 56 00:02:26,000 --> 00:02:28,000 το συγγραφέα, την ημερομηνία έκδοσης. 57 00:02:28,000 --> 00:02:31,000 Και αυτό που κάνουμε είναι να περνάμε από όλα αυτα τα αρχεία 58 00:02:31,000 --> 00:02:35,000 και να αποκλείουμε οποιοδήποτε δεδομένο δεν είναι υψηλής ποιότητας. 59 00:02:35,000 --> 00:02:37,000 Στο τέλος μας μένει 60 00:02:37,000 --> 00:02:40,000 μια συλλογή από 5 εκατομμύρια βιβλία, 61 00:02:40,000 --> 00:02:43,000 500 δισεκατομμύρια λέξεις, 62 00:02:43,000 --> 00:02:45,000 μια αλυσίδα χαρακτήρων χίλιες φορές μεγαλύτερη 63 00:02:45,000 --> 00:02:48,000 από το ανθρώπινο γονιδίωμα. 64 00:02:48,000 --> 00:02:50,000 Ένα κείμενο το οποίο γραμμένο 65 00:02:50,000 --> 00:02:52,000 θα έφτανε από εδώ μέχρι το φεγγάρι και πάλι πίσω 66 00:02:52,000 --> 00:02:54,000 πάνω από 10 φορές -- 67 00:02:54,000 --> 00:02:58,000 ένα αληθινό κομμάτι του πολιτιστικού μας γονιδιώματος 68 00:02:58,000 --> 00:03:00,000 Βέβαια αυτό που κάναμε, 69 00:03:00,000 --> 00:03:03,000 όταν βρεθήκαμε αντιμέτωποι με μια τέτοια υπερβολή... 70 00:03:03,000 --> 00:03:05,000 (Γέλια) 71 00:03:05,000 --> 00:03:08,000 ήταν αυτό που θα έκανε 72 00:03:08,000 --> 00:03:11,000 οποιοσδήποτε ερευνητής σέβεται τον εαυτό του 73 00:03:11,000 --> 00:03:13,000 Διαλέξαμε μια σελιδα απο το XKCD, 74 00:03:13,000 --> 00:03:15,000 και είπαμε, "Σταθείτε. 75 00:03:15,000 --> 00:03:17,000 Θα εφαρμόσουμε επιστήμη." 76 00:03:17,000 --> 00:03:19,000 (Γέλια) 77 00:03:19,000 --> 00:03:21,000 ΖΜ: Βέβαια, σκεφτήκαμε, 78 00:03:21,000 --> 00:03:23,000 ας διαθέσουμε πρώτα τα δεδομένα σε όλους 79 00:03:23,000 --> 00:03:25,000 για να μπορέσουν να τα επεξεργαστούν επιστημονικά. 80 00:03:25,000 --> 00:03:27,000 Μετά σκεφτήκαμε, τι δεδομένα μπορούμε να διαθέσουμε; 81 00:03:27,000 --> 00:03:29,000 Αυτό που θέλεις να κάνεις, είναι να πάρεις τα βιβλία½ 82 00:03:29,000 --> 00:03:31,000 και να διαθέσεις το πλήρες κείμενο και των 5 εκ. βιβλίων 83 00:03:31,000 --> 00:03:33,000 Τώρα η Google, και συγκεκριμένα ο Τζον Όργουαντ, 84 00:03:33,000 --> 00:03:35,000 μας είπαν μια εξίσωση που έπρεπε να μάθουμε. 85 00:03:35,000 --> 00:03:38,000 Έχεις 5 εκατομμύρια βιβλία, δηλαδή 5 εκατομμύρια συγγραφείς 86 00:03:38,000 --> 00:03:41,000 και 5 εκατομμύρια ενάγοντες που σημαίνει μια τεράστια αγωγή. 87 00:03:41,000 --> 00:03:43,000 Έτσι, παρ' ότι αυτό θα ήταν πολύ, μα πολύ "φανταστικό" 88 00:03:43,000 --> 00:03:46,000 δεν θα ήταν καθόλου μα καθόλου πρακτικό. 89 00:03:46,000 --> 00:03:48,000 (Γέλια) 90 00:03:48,000 --> 00:03:50,000 Για άλλη μια φορά βεβαια, σχεδόν υποκύψαμε, 91 00:03:50,000 --> 00:03:53,000 και διαλέξαμε την πολύ πρακτική προσέγγιση, που ήταν λίγο λιγότερο "φανταστική". 92 00:03:53,000 --> 00:03:55,000 Είπαμε ότι αντί να διαθέσουμε το πλήρες κείμενο, 93 00:03:55,000 --> 00:03:57,000 θα διαθέσουμε στατιστικά για τα βιβλία. 94 00:03:57,000 --> 00:03:59,000 Έτσι για παράδειγμα, η φράση "A gleam of happiness." 95 00:03:59,000 --> 00:04:01,000 Έχει τέσσερεις λέξεις; το ονομάζουμε τετρ-ακολουθία. 96 00:04:01,000 --> 00:04:03,000 Θα σας πούμε πόσες φορές εμφανίστηκε μια συγκεκριμένη 97 00:04:03,000 --> 00:04:05,000 τετρ-ακολουθία σε βιβλία το 1801, 1802, 1803, 98 00:04:05,000 --> 00:04:07,000 μέχρι το 2008. 99 00:04:07,000 --> 00:04:09,000 Αυτό μας δίνει ένα χρονικό διάγραμμα 100 00:04:09,000 --> 00:04:11,000 για το πόσο συχνά χρησιμοποιήθηκε η συγκεκριμένη πρόταση μέσα στο χρόνο. 101 00:04:11,000 --> 00:04:14,000 Αυτό το κάνουμε για όλες τις λέξεις και προτάσεις που εμφανίζονταν σε αυτά τα βιβλία, 102 00:04:14,000 --> 00:04:17,000 και αυτό μας δίνει έναν μεγάλο πίνακα 2 δισεκατομμυρίων γραμμών 103 00:04:17,000 --> 00:04:19,000 που μας λέει τον τρόπο που μεταβάλλεται ο πολιτισμός μας. 104 00:04:19,000 --> 00:04:21,000 EΛΕ: Έτσι αυτές τις 2 δισεκατομμύρια γραμμές, 105 00:04:21,000 --> 00:04:23,000 τις ονομάζουμε 2 δις. ν-ακολουθίες. 106 00:04:23,000 --> 00:04:25,000 Τι μας λένε; 107 00:04:25,000 --> 00:04:27,000 Οι μεμονωμένες ν-ακολουθίες μετράνε πολιτιστικές τάσεις. 108 00:04:27,000 --> 00:04:29,000 Ας σας δώσω ένα παράδειγμα. 109 00:04:29,000 --> 00:04:31,000 Ας υποθέσουμε ότι σήμερα επιτυγχάνω, 110 00:04:31,000 --> 00:04:33,000 και αύριο θέλω να σας πω πόσο καλά τα πήγα. 111 00:04:33,000 --> 00:04:36,000 Έτσι μπορώ να πω, "Εχθές, πέτυχα" 112 00:04:36,000 --> 00:04:39,000 Ή εναλλακτικά μπορώ να πω, "Εχθές, επέτυχα" 113 00:04:39,000 --> 00:04:42,000 Ποιο πρέπει να χρησιμοποιήσω; 114 00:04:42,000 --> 00:04:44,000 Πώς να το ξέρω; 115 00:04:44,000 --> 00:04:46,000 Μέχρι πριν από έξι μήνες 116 00:04:46,000 --> 00:04:48,000 το καλύτερο που θα μπορούσες να κάνεις 117 00:04:48,000 --> 00:04:50,000 θα ήταν, για παράδειγμα, 118 00:04:50,000 --> 00:04:52,000 να πας στο συγκεκριμένο ψυχολόγο με τα καταπληκτικά μαλλιά, 119 00:04:52,000 --> 00:04:54,000 και να του πεις, 120 00:04:54,000 --> 00:04:57,000 "Στιβ, μιας και είσαι ειδήμων στα ανώμαλα ρήματα. 121 00:04:57,000 --> 00:04:59,000 τι πρέπει να κάνω;" 122 00:04:59,000 --> 00:05:01,000 Και αυτός θα σου έλεγε, "Οι περισσότεροι λένε πέτυχα, 123 00:05:01,000 --> 00:05:04,000 αλλά μερικοί λένε και επέτυχα." 124 00:05:04,000 --> 00:05:06,000 Και επίσης ήξερες, λίγο ή πολύ, 125 00:05:06,000 --> 00:05:09,000 ότι αν πας 200 χρόνια πίσω στο χρόνο, 126 00:05:09,000 --> 00:05:12,000 και ρωτήσεις το συγκεκριμένο πολιτικό με εξίσου καταπληκτικά μαλλιά 127 00:05:12,000 --> 00:05:15,000 (Γέλια) 128 00:05:15,000 --> 00:05:17,000 "Τομ, τι πρέπει να πω;" 129 00:05:17,000 --> 00:05:19,000 Θα έλεγε, "Στις μέρες μου, οι περισσότεροι επέτυχαν, 130 00:05:19,000 --> 00:05:22,000 αλλά κάποιοι πέτυχαν." 131 00:05:22,000 --> 00:05:24,000 Οπότε τώρα θα σας δείξω τα ακατέργαστα δεδομένα. 132 00:05:24,000 --> 00:05:28,000 Δύο γραμμές από τον πίνακα των 2 δις. γραμμών. 133 00:05:28,000 --> 00:05:30,000 Αυτό που βλέπετε είναι η συχνότητα ανά χρόνο που εμφανίζεται 134 00:05:30,000 --> 00:05:33,000 το "πέτυχα" (thrived) και το "επέτυχα" (throve) 135 00:05:34,000 --> 00:05:36,000 Αυτές είναι μόνο δύο 136 00:05:36,000 --> 00:05:39,000 από τις 2 δις. γραμμές. 137 00:05:39,000 --> 00:05:41,000 Έτσι το σύνολο των δεδομένων 138 00:05:41,000 --> 00:05:44,000 είναι ένα δις. φορές πιο "φανταστικό" από αυτό το γράφημα. 139 00:05:44,000 --> 00:05:46,000 (Γέλια) 140 00:05:46,000 --> 00:05:50,000 (Χειροκρότημα) 141 00:05:50,000 --> 00:05:52,000 ΖΜ: Τώρα, υπάρχουν πολλές άλλες φωτογραφίες που αξίζουν 500 δις. λέξεις. 142 00:05:52,000 --> 00:05:54,000 Για παράδειγμα, αυτή. 143 00:05:54,000 --> 00:05:56,000 Αν για παράδειγμα δείτε τη λέξη "γρίπη", 144 00:05:56,000 --> 00:05:58,000 θα δείτε ότι κορυφώνεται την περίοδο 145 00:05:58,000 --> 00:06:01,000 όπου οι μεγάλες επιδημίες της γρίπης, σκότωναν ανθρώπους ανά τον κόσμο 146 00:06:01,000 --> 00:06:04,000 EΛΕ: Αν δεν έχετε πεισθεί ακόμα, 147 00:06:04,000 --> 00:06:06,000 η στάθμη της θάλασσας ανεβαίνει, 148 00:06:06,000 --> 00:06:09,000 όπως και το ατμοσφαιρικό διοξείδιο του άνθρακα και η παγκόσμια θερμοκρασία. 149 00:06:09,000 --> 00:06:12,000 ΖΜ: Ίσως θα θέλατε να κοιτάξετε και αυτή τη συγκεκριμένη ν-ακολουθία, 150 00:06:12,000 --> 00:06:15,000 και αυτό για να πείτε στο Νίτσε ότι ο Θεός δεν έχει πεθάνει, 151 00:06:15,000 --> 00:06:18,000 παρ' ότι μπορεί να συμφωνήσετε ότι θα χρειαζόταν έναν καλύτερο εκδότη. 152 00:06:18,000 --> 00:06:20,000 (Γέλια) 153 00:06:20,000 --> 00:06:23,000 EΛΕ: Μπορείς να καταλήξεις σε πολύ αφηρημένες έννοιες με αυτή τη μέθοδο. 154 00:06:23,000 --> 00:06:25,000 Για παράδειγμα, να σας διηγηθώ την ιστορία 155 00:06:25,000 --> 00:06:27,000 του έτους 1950. 156 00:06:27,000 --> 00:06:29,000 Για το μεγαλύτερο διάστημα της παγκόσμιας ιστορίας, 157 00:06:29,000 --> 00:06:31,000 κανείς δεν νοιάστηκε για το 1950. 158 00:06:31,000 --> 00:06:33,000 Το 1700, το 1800, το 1900, 159 00:06:33,000 --> 00:06:36,000 κανείς δεν νοιάστηκε. 160 00:06:37,000 --> 00:06:39,000 Τις δεκαετίες του '30 και του '40 161 00:06:39,000 --> 00:06:41,000 κανείς δεν νοιάστηκε. 162 00:06:41,000 --> 00:06:43,000 Ξαφνικά, στα μέσα της δεκαετίας του '40 163 00:06:43,000 --> 00:06:45,000 άρχισε να δημιουργείται ένας θόρυβος. 164 00:06:45,000 --> 00:06:47,000 Οι άνθρωποι άρχισαν να πιστεύουν ότι το 1950 θα ερχόταν, 165 00:06:47,000 --> 00:06:49,000 και θα μπορούσε να είναι σημαντικό. 166 00:06:49,000 --> 00:06:52,000 (Γέλια) 167 00:06:52,000 --> 00:06:55,000 Αλλά τίποτα δεν απασχόλησε τους ανθρώπους για το 1950 168 00:06:55,000 --> 00:06:58,000 περισσότερο απο το έτος 1950. 169 00:06:58,000 --> 00:07:01,000 (Γέλια) 170 00:07:01,000 --> 00:07:03,000 Είχε γίνει πλέον εμμονή. 171 00:07:03,000 --> 00:07:05,000 Δεν μπορούσαν να σταματήσουν να μιλάνε 172 00:07:05,000 --> 00:07:08,000 για όλα τα πράγματα που έκαναν το 1950, 173 00:07:08,000 --> 00:07:11,000 όλα τα πράγματα που σκόπευαν να κάνουν το 1950, 174 00:07:11,000 --> 00:07:16,000 όλα τα όνειρα που ήθελαν να πραγματοποιήσουν το 1950. 175 00:07:16,000 --> 00:07:18,000 Στην πραγματικότητα το έτος 1950 ήταν τόσο συναρπαστικό, 176 00:07:18,000 --> 00:07:20,000 που για χρόνια αργότερα, 177 00:07:20,000 --> 00:07:23,000 οι άνθρωποι συνέχισαν να μιλάνε για τα εκπληκτικά πράγματα που συνέβησαν, 178 00:07:23,000 --> 00:07:25,000 το '51, '52, '53. 179 00:07:25,000 --> 00:07:27,000 Ξαφνικά το 1954, 180 00:07:27,000 --> 00:07:29,000 κάποιος ξύπνησε και συνειδητοποίησε 181 00:07:29,000 --> 00:07:33,000 ότι το 1950 με κάποιο τρόπο... είχε ξεπεραστεί. 182 00:07:33,000 --> 00:07:35,000 (Γέλια) 183 00:07:35,000 --> 00:07:37,000 Και κάπως έτσι, έσκασε η φούσκα. 184 00:07:37,000 --> 00:07:39,000 (Γέλια) 185 00:07:39,000 --> 00:07:41,000 Και η ιστορία του 1950, 186 00:07:41,000 --> 00:07:43,000 είναι η ιστορία κάθε χρόνου που έχουμε καταγράψει, 187 00:07:43,000 --> 00:07:46,000 με μικρές αλλαγές, αφού πλέον έχουμε αυτά τα όμορφα γραφήματα. 188 00:07:46,000 --> 00:07:49,000 Και επειδή έχουμε αυτά τα όμορφα γραφήματα, μπορούμε πλέον να μετρήσουμε. 189 00:07:49,000 --> 00:07:51,000 Μπορούμε να αναρωτηθούμε, "Πόσο γρήγορα σκάει η φούσκα?" 190 00:07:51,000 --> 00:07:54,000 Και φαίνεται ότι μπορούμε να το μετρήσουμε με μεγάλη ακρίβεια. 191 00:07:54,000 --> 00:07:57,000 Ανακαλύψαμε εξισώσεις, παρήγαμε γραφήματα, 192 00:07:57,000 --> 00:07:59,000 και το καθαρό αποτέλεσμα ήταν 193 00:07:59,000 --> 00:08:02,000 ότι η φούσκα σκάει όλο και γρηγορότερα 194 00:08:02,000 --> 00:08:04,000 χρόνο με τον χρόνο. 195 00:08:04,000 --> 00:08:09,000 Χάνουμε το ενδιαφέρον μας για το παρελθόν όλο και πιο γρήγορα. 196 00:08:09,000 --> 00:08:11,000 ΖM: Και τώρα μια μικρή επαγγελματική συμβουλή. 197 00:08:11,000 --> 00:08:13,000 Για εσάς που θέλετε να γίνεται διάσημοι, 198 00:08:13,000 --> 00:08:15,000 μπορείτε να συμβουλευθείτε τους 25 πιο διάσημους πολιτικούς, 199 00:08:15,000 --> 00:08:17,000 συγγραφείς, ηθοποιούς, κλπ. 200 00:08:17,000 --> 00:08:20,000 Έτσι αν θέλετε να γίνετε γρήγορα διάσημος, θα πρέπει να γίνετε ηθοποιός 201 00:08:20,000 --> 00:08:22,000 γιατί η φήμη αρχίζει να ανεβαίνει μέχρι το τέλος των 20 -- 202 00:08:22,000 --> 00:08:24,000 είστε ακόμα νέος και είναι καταπληκτικά. 203 00:08:24,000 --> 00:08:26,000 Τώρα, αν μπορείτε να περιμένετε λίγο, θα πρέπει να γίνετε συγγραφέας, 204 00:08:26,000 --> 00:08:28,000 γιατί μετά γίνεστε πολύ διάσημος, 205 00:08:28,000 --> 00:08:30,000 σαν τον Μαρκ Τουέϊν, για παράδειγμα, πολύ διάσημος. 206 00:08:30,000 --> 00:08:32,000 Αλλά αν θέλετε να φτάσετε στην κορυφή 207 00:08:32,000 --> 00:08:34,000 θα πρέπει να καθυστερήσετε την ικανοποίηση 208 00:08:34,000 --> 00:08:36,000 και φυσικά να γίνετε πολιτικός. 209 00:08:36,000 --> 00:08:38,000 Έτσι θα γίνετε διάσημος μέχρι το τέλος των 50, 210 00:08:38,000 --> 00:08:40,000 και θα γίνετε πολύ, πολύ διάσημος αργότερα. 211 00:08:40,000 --> 00:08:43,000 Επίσης οι επιστήμονες τείνουν να γίνονται διάσημοι όταν είναι πολύ μεγαλύτεροι. 212 00:08:43,000 --> 00:08:45,000 Για παράδειγμα οι βιολόγοι και οι φυσικοί, 213 00:08:45,000 --> 00:08:47,000 τείνουν να γίνονται σχεδόν όσο διάσημοι και οι ηθοποιοί. 214 00:08:47,000 --> 00:08:50,000 Ένα λάθος που δεν πρέπει να κάνετε είναι να γίνετε μαθηματικός. 215 00:08:50,000 --> 00:08:52,000 (Γέλια) 216 00:08:52,000 --> 00:08:54,000 Αν το κάνετε αυτό, 217 00:08:54,000 --> 00:08:57,000 θα πρέπει να σκεφθείτε, "Ωραία, θα κάνω την καλύτερή μου δουλειά στα 20 μου." 218 00:08:57,000 --> 00:08:59,000 Αλλά μαντέψτε! Δεν θα νοιάζει κανέναν. 219 00:08:59,000 --> 00:09:02,000 (Γέλια) 220 00:09:02,000 --> 00:09:04,000 EΛΕ: Υπάρχουν, όμως και πιο απογοητευτικά στοιχεία 221 00:09:04,000 --> 00:09:06,000 στις n-ακολουθίες (n-grams). 222 00:09:06,000 --> 00:09:08,000 Για παράδειγμα αυτό είναι το γράφημα του Μαρκ Σαγκάλ, 223 00:09:08,000 --> 00:09:10,000 ενός καλλιτέχνη γεννημένου το 1887. 224 00:09:10,000 --> 00:09:13,000 Και φαίνεται σαν ένα συνηθισμένο γράφημα διάσημου ανθρώπου. 225 00:09:13,000 --> 00:09:17,000 Γίνετε όλο και όλο πιο διάσημος, 226 00:09:17,000 --> 00:09:19,000 εκτός αν κοιτάξεις τα Γερμανικά. 227 00:09:19,000 --> 00:09:21,000 Αν κοιτάξεις τα Γερμανικά, βλέπεις κάτι πολύ περίεργο, 228 00:09:21,000 --> 00:09:23,000 κάτι που δεν βλέπεις σχεδόν ποτέ, 229 00:09:23,000 --> 00:09:25,000 το οποίο είναι ότι γίνεται υπερβολικά διάσημος, 230 00:09:25,000 --> 00:09:27,000 και μετά ξαφνικά πέφτει, 231 00:09:27,000 --> 00:09:30,000 βρισκόμενος στο ναδίρ μεταξύ 1933 και 1945, 232 00:09:30,000 --> 00:09:33,000 λίγο πριν ανακάμψει αμέσως μετά. 233 00:09:33,000 --> 00:09:35,000 Και φυσικά, αυτο που βλεπουμε, 234 00:09:35,000 --> 00:09:38,000 είναι ότι ο Μαρκ Σαγκάλ ήταν ένας Εβραίος καλλιτέχνης 235 00:09:38,000 --> 00:09:40,000 στην ναζιστική Γερμανία. 236 00:09:40,000 --> 00:09:42,000 Αυτά τα τρία σημάδια 237 00:09:42,000 --> 00:09:44,000 είναι τόσο δυνατά 238 00:09:44,000 --> 00:09:47,000 που δεν χρειάζεται καν να ξέρουμε ότι κάποιος λογοκρίθηκε. 239 00:09:47,000 --> 00:09:49,000 Μπορούμε να το συμπεράνουμε 240 00:09:49,000 --> 00:09:51,000 επεξεργαζόμενοι πολύ βασικα σήματα. 241 00:09:51,000 --> 00:09:53,000 Να ένας απλός τρόπος. 242 00:09:53,000 --> 00:09:55,000 Μια λογική προσδοκία είναι ότι 243 00:09:55,000 --> 00:09:57,000 η φήμη κάποιου σε μια δεδομένη στιγμή 244 00:09:57,000 --> 00:09:59,000 πρέπει να είναι ο μέσος όρος της φήμης του πριν 245 00:09:59,000 --> 00:10:01,000 και της φήμης του μετά. 246 00:10:01,000 --> 00:10:03,000 Οπότε περιμένουμε περίπου αυτό. 247 00:10:03,000 --> 00:10:06,000 Και το συγκρίνουμε με τη φήμη που παρατηρούμε. 248 00:10:06,000 --> 00:10:08,000 Και απλά διαιρούμε το ένα με το άλλο 249 00:10:08,000 --> 00:10:10,000 για να πάρουμε κάτι που το αποκαλούμε συντελεστή καταστολής. 250 00:10:10,000 --> 00:10:13,000 Αν ο συντελεστής καταστολής είναι πολύ, πολύ μικρος 251 00:10:13,000 --> 00:10:15,000 τότε πιθανότατα έχετε δεχθεί καταστολή. 252 00:10:15,000 --> 00:10:18,000 Αν είναι πολύ μεγάλος, τότε μάλλον έχετε επωφεληθεί από προπαγάνδα. 253 00:10:19,000 --> 00:10:21,000 ΖΜ: Τώρα μπορείτε να δείτε 254 00:10:21,000 --> 00:10:24,000 την κατανομή συντελεστών καταστολής σε ολόκληρους πληθυσμούς. 255 00:10:24,000 --> 00:10:26,000 Για παράδειγμα, εδώ -- 256 00:10:26,000 --> 00:10:28,000 αυτός ο συντελεστής καταστολής είναι για 5.000 ανθρώπους 257 00:10:28,000 --> 00:10:30,000 που διαλέχθηκαν από Αγγλικά βιβλία όπου δεν υπάρχει κάποιου είδους καταστολή -- 258 00:10:30,000 --> 00:10:32,000 θα ήταν έτσι, βασικά πιο επικεντρωμένο στο ένα. 259 00:10:32,000 --> 00:10:34,000 Αυτό που περιμένεις βασικά, είναι αυτό που παρατηρείς. 260 00:10:34,000 --> 00:10:36,000 Αυτή είναι η κατανομή στη Γερμανία -- 261 00:10:36,000 --> 00:10:38,000 πολύ διαφορετική, έχει μετακινηθεί αριστερά. 262 00:10:38,000 --> 00:10:41,000 Οι άνθρωποι μιλάνε δύο φορές λιγότερο γι' αυτό απ' ότι θα έπρεπε. 263 00:10:41,000 --> 00:10:43,000 Αλλά ακόμα πιο σημαντικό είναι ότι η κατανομή είναι πολύ πλατύτερη. 264 00:10:43,000 --> 00:10:46,000 Υπάρχουν πολλοί άνθρωποι που καταλήγουν τέρμα αριστερά στην κατανομή 265 00:10:46,000 --> 00:10:49,000 που αναφέρονται 10 φορές λιγότερο απ' ό,τι θα έπρεπε. 266 00:10:49,000 --> 00:10:51,000 Αλλά επίσης και πολύ άνθρωποι τέρμα δεξιά 267 00:10:51,000 --> 00:10:53,000 που φαίνεται να ευνοούνται από την προπαγάνδα. 268 00:10:53,000 --> 00:10:56,000 Αυτή η εικόνα είναι το σήμα κατατεθέν της λογοκρισίας στα βιβλία. 269 00:10:56,000 --> 00:10:58,000 ΕΛΕ: Οπότε, ονομάζουμε αυτή τη μέθοδο 270 00:10:58,000 --> 00:11:00,000 "πολιτιστικο-ματική" (culturomics). 271 00:11:00,000 --> 00:11:02,000 Είναι σαν τη γονιδιωματική. 272 00:11:02,000 --> 00:11:04,000 Εκτός του ότι η γονιδιωματική είναι μια ματιά στη βιολογία 273 00:11:04,000 --> 00:11:07,000 μέσα από το φακό της συχνότητας βάσης στο ανθρώπινο γονιδίωμα. 274 00:11:07,000 --> 00:11:09,000 Η "Πολιτιστικο-ματική" (culturomics) είναι παρόμοια. 275 00:11:09,000 --> 00:11:12,000 Είναι η εφαρμογή ανάλυσης σε συλλογές δεδομένων τεραστίων διαστάσεων 276 00:11:12,000 --> 00:11:14,000 για τη μελέτη του ανθρώπινου πολιτισμού. 277 00:11:14,000 --> 00:11:16,000 Εδώ αντί να κοιτάμε μέσα από τον φακό του γονιδιώματος 278 00:11:16,000 --> 00:11:19,000 κοιτάμε μέσα απο τον φακό ψηφιοποιημένων κομματιών των καταγραφών της ιστορίας. 279 00:11:19,000 --> 00:11:21,000 Το καλό με την "Πολιτιστικο-ματική" (culturomics) 280 00:11:21,000 --> 00:11:23,000 είναι οτι όλοι μπορούν να το κάνουν. 281 00:11:23,000 --> 00:11:25,000 Γιατί μπορούν όλοι να το κάνουν; 282 00:11:25,000 --> 00:11:27,000 Όλοι μπορούν να το κάνουν, επειδή αυτοί οι τρεις τύποι, 283 00:11:27,000 --> 00:11:30,000 ο Τζον Όρουαντ, ο Ματ Γκρέι και ο Ουίλ Μπρόκμαν στην Google, 284 00:11:30,000 --> 00:11:32,000 είδαν το πρωτότυπο του "προβολέα ν-ακολουθιών" (n-gram Viewer) 285 00:11:32,000 --> 00:11:34,000 και είπαν. "Αυτό είναι πολύ διασκεδαστικό. 286 00:11:34,000 --> 00:11:37,000 Πρέπει να το κάνουμε διαθέσιμο σε όλους." 287 00:11:37,000 --> 00:11:39,000 Έτσι μέσα σε μόλις δύο εβδομάδες -- δυο εβδομάδες πριν δημοσιευθεί η εργασία μας -- 288 00:11:39,000 --> 00:11:42,000 κατάφεραν να κρυπτογραφήσουν μια έκδοση του "προβολέα ν-ακολουθιών" (n-gram Viewer) για το κοινό. 289 00:11:42,000 --> 00:11:45,000 Κι έτσι μπορείτε να γράψετε οποιαδήποτε λέξη ή πρόταση θέλετε 290 00:11:45,000 --> 00:11:47,000 και να δείτε την ν-ακολουθία της (n-gram) αμέσως -- 291 00:11:47,000 --> 00:11:49,000 Επίσης μπορείτε να αναζητήσετε παραδείγματα από τα διάφορα βιβλία 292 00:11:49,000 --> 00:11:51,000 οπού η ν-ακολουθιά σας (n-gram) εμφανίζεται. 293 00:11:51,000 --> 00:11:53,000 JM: Αυτό χρησιμοποιήθηκε πάνω απο 1 εκ. φορες την πρώτη μέρα, 294 00:11:53,000 --> 00:11:55,000 και αυτή είναι η καλύτερη ερώτηση. 295 00:11:55,000 --> 00:11:58,000 Οι άνθρωποι θέλουν να προσπαθούν, συνέχεια για το καλύτερο. 296 00:11:58,000 --> 00:12:01,000 Απ' ότι φαίνετε όμως, οι άνθρωποι τον 18ο αιώνα δεν ενδιαφερόντουσαν πολύ γι' αυτό. 297 00:12:01,000 --> 00:12:04,000 Απ' ότι φαίνετε δεν ήθελαν να "προσπαθούν" (best), αλλά να "προσψαθούν" (beft) 298 00:12:04,000 --> 00:12:07,000 Βέβαια, αυτό που έγινε είναι απλά ένα λάθος. 299 00:12:07,000 --> 00:12:09,000 Δεν ήταν αγώνας για τη μετριότητα. 300 00:12:09,000 --> 00:12:12,000 απλά τότε το "π" (s) γραφότανε αλλιώς, κάπως σας "ψ" (f). 301 00:12:12,000 --> 00:12:15,000 Βέβαια η Google, δεν το εντόπισε τότε 302 00:12:15,000 --> 00:12:18,000 όποτε το αναφέραμε στο επιστημονικό άρθρο που δημοσιεύσαμε. 303 00:12:18,000 --> 00:12:20,000 Αλλά απ' ότι φαίνεται αυτό είναι μόνο μια υπενθύμιση 304 00:12:20,000 --> 00:12:22,000 οτι παρ' οτι είναι πολύ διασκεδαστικό, 305 00:12:22,000 --> 00:12:24,000 όταν ερμηνεύεις τα γραφήματα θα πρέπει να είσαι πολύ προσεκτικός 306 00:12:24,000 --> 00:12:27,000 και να υιοθετείς τις βασικές αρχές των επιστημών. 307 00:12:27,000 --> 00:12:30,000 ΕΛΕ: Οι άνθρωποι το χρησιμοποιούν για πολύ διασκεδαστικούς σκοπούς. 308 00:12:30,000 --> 00:12:37,000 (Γέλια) 309 00:12:37,000 --> 00:12:39,000 Βασικά θα σταματήσουμε να μιλάμε, 310 00:12:39,000 --> 00:12:42,000 και θα σας δείξουμε την υπόλοιπη παρουσίαση σιωπηλοί. 311 00:12:42,000 --> 00:12:45,000 Αυτός ο άνθρωπος ενδιαφερόταν για την ιστορία του εκνευρισμού. 312 00:12:45,000 --> 00:12:48,000 Υπάρχουν πολλοί τύποι εκνευρισμού. 313 00:12:48,000 --> 00:12:51,000 Άμα στραμπουλήξεις το δάχτυλό σου, υπάρχει ένα "argh" με μόνο ένα "α". 314 00:12:51,000 --> 00:12:53,000 Αν ο πλανήτης Γη εξολοθρευτεί από εξωγήινους 315 00:12:53,000 --> 00:12:55,000 για να κάνουν χώρο, για κάποιο διαστρικό ταξίδι, 316 00:12:55,000 --> 00:12:57,000 αυτό είναι "aaaaaaaargh" με οχτώ "α." 317 00:12:57,000 --> 00:12:59,000 Αυτός ο άνθρωπος μελετάει τα διάφορα "arghs" 318 00:12:59,000 --> 00:13:01,000 από ένα μέχρι οχτώ "α". 319 00:13:01,000 --> 00:13:03,000 Και απ' ότι φαίνεται 320 00:13:03,000 --> 00:13:05,000 τα λιγότερο συχνά "arghs" 321 00:13:05,000 --> 00:13:08,000 είναι αυτά που αντιστοιχούν σε περισσότερο εκνευρισμό -- 322 00:13:08,000 --> 00:13:11,000 εκτός, παραδόξως, από τις αρχές της δεκαετίας του '80. 323 00:13:11,000 --> 00:13:13,000 Πιστεύουμε πως αυτό έχει κάποια σχέση με τον Ρόναλντ Ρήγκαν 324 00:13:13,000 --> 00:13:15,000 (Γέλια) 325 00:13:15,000 --> 00:13:18,000 ΖΜ: Υπάρχουν πολλές χρήσεις για αυτά τα δεδομένα, 326 00:13:18,000 --> 00:13:21,000 αλλά η ουσία είναι ότι ψηφιοποιείται το ιστορικό μητρώο. 327 00:13:21,000 --> 00:13:23,000 Η Google έχει ψηφιοποιήσει 15 εκ. βιβλία. 328 00:13:23,000 --> 00:13:25,000 Αυτό είναι το 12% όλων των βιβλίων που έχουν ποτέ εκδοθεί. 329 00:13:25,000 --> 00:13:28,000 Είναι ένα μεγάλο κομμάτι του ανθρώπινου πολιτισμού. 330 00:13:28,000 --> 00:13:31,000 Υπάρχουν πολλά περισσότερα στον πολιτισμό: υπάρχουν χειρόγραφα, εφημερίδες, 331 00:13:31,000 --> 00:13:33,000 υπάρχουν πράγματα που δεν είναι κείμενο, όπως τέχνη και πίνακες. 332 00:13:33,000 --> 00:13:35,000 Όλα αυτά τυχαίνει να είναι στους υπολογιστές μας, 333 00:13:35,000 --> 00:13:37,000 σε υπολογιστές σε όλο το κόσμο. 334 00:13:37,000 --> 00:13:40,000 Και όταν αυτό συμβεί, θα αλλάξει τον τρόπο που αντιλαμβανόμαστε 335 00:13:40,000 --> 00:13:42,000 το παρελθόν μας, το παρόν μας και τον ανθρώπινο πολιτισμό. 336 00:13:42,000 --> 00:13:44,000 Ευχαριστούμε πολύ. 337 00:13:44,000 --> 00:13:47,000 (Χειροκρότημα)