1 00:00:00,800 --> 00:00:03,924 Ηγούμαι μιας ομάδας στην Google που ερευνά τη μηχανική ευφυΐα. 2 00:00:03,948 --> 00:00:08,598 Με άλλα λόγια, τον κλάδο της μηχανικής που κάνει υπολογιστές και συσκευές 3 00:00:08,622 --> 00:00:11,041 να μπορούν να κάνουν κάποια απ' όσα κάνει το μυαλό. 4 00:00:11,439 --> 00:00:14,262 Γι' αυτό ενδιαφερόμαστε για τους κανονικούς εγκεφάλους 5 00:00:14,262 --> 00:00:16,101 καθώς και για τη νευροεπιστήμη, 6 00:00:16,101 --> 00:00:20,047 και ειδικότερα για τα πράγματα που κάνει το μυαλό μας 7 00:00:20,047 --> 00:00:24,089 που ακόμα είναι πολύ ανώτερο από τις επιδόσεις των υπολογιστών. 8 00:00:25,209 --> 00:00:28,818 Ιστορικά, ένα από αυτά που μας ενδιέφεραν ήταν η αντίληψη, 9 00:00:28,842 --> 00:00:31,881 η διαδικασία με την οποία τα πράγματα εκεί έξω στον κόσμο 10 00:00:31,905 --> 00:00:33,489 -ήχοι και εικόνες- 11 00:00:33,513 --> 00:00:35,691 μετατρέπονται σε έννοιες μέσα στο μυαλό. 12 00:00:36,235 --> 00:00:38,752 Αυτό είναι ζωτικό για τον εγκέφαλό μας 13 00:00:38,776 --> 00:00:41,240 και επίσης είναι πολύ χρήσιμο για τον υπολογιστή. 14 00:00:41,636 --> 00:00:45,286 Για παράδειγμα, οι αλγόριθμοι μηχανικής αντίληψης που φτιάχνει η ομάδα μας 15 00:00:45,286 --> 00:00:48,884 κάνουν δυνατή την αναζήτηση στις φωτογραφίες του Google Photos 16 00:00:48,884 --> 00:00:50,911 βάσει του τι αυτές περιέχουν. 17 00:00:51,594 --> 00:00:55,087 Η άλλη πλευρά της αντίληψης είναι η δημιουργικότητα: 18 00:00:55,111 --> 00:00:58,149 το να μεταμορφώνετε μια έννοια σε κάτι εκεί έξω στον κόσμο. 19 00:00:58,173 --> 00:01:01,728 Έτσι τον τελευταίο χρόνο, η εργασία μας πάνω στη μηχανική αντίληψη 20 00:01:01,752 --> 00:01:06,515 συνδέθηκε απρόσμενα και με τον κόσμο της δημιουργικότητας 21 00:01:06,515 --> 00:01:07,965 και της τέχνης από μηχανές. 22 00:01:08,556 --> 00:01:11,930 Νομίζω ότι ο Μιχαήλ Αγγελος είδε πολύ διορατικά 23 00:01:11,930 --> 00:01:15,520 αυτή τη δυαδική σχέση μεταξύ αντίληψης και δημιουργικότητας. 24 00:01:16,023 --> 00:01:18,029 Ένα φημισμένο απόφθεγμά του λέει: 25 00:01:18,053 --> 00:01:21,756 «Κάθε κομμάτι πέτρας έχει μέσα του ένα άγαλμα 26 00:01:21,756 --> 00:01:25,178 και είναι δουλειά του γλύπτη να το αποκαλύψει». 27 00:01:26,029 --> 00:01:29,245 Νομίζω ότι ο Μιχαήλ Άγγελος εννοεί 28 00:01:29,269 --> 00:01:32,449 ότι δημιουργούμε μέσα από την αντίληψη, 29 00:01:32,473 --> 00:01:35,496 και η ίδια η αντίληψη είναι μια πράξη φαντασίας 30 00:01:35,520 --> 00:01:38,081 από την οποία είναι φτιαγμένη η δημιουργικότητα. 31 00:01:38,691 --> 00:01:42,616 Το όργανο που σκέφτεται, αντιλαμβάνεται και φαντάζεται 32 00:01:42,640 --> 00:01:44,228 είναι φυσικά ο εγκέφαλος. 33 00:01:45,089 --> 00:01:47,634 Θα ήθελα να αρχίσω με λίγη ιστορία 34 00:01:47,658 --> 00:01:49,960 σχετικά με το τι γνωρίζουμε για τον εγκέφαλό μας. 35 00:01:50,406 --> 00:01:53,026 Γιατί διαφορετικά, ας πούμε, από την καρδιά ή τα έντερα 36 00:01:53,026 --> 00:01:56,064 δεν μπορείς να πεις πολλά για τον εγκέφαλο απλώς κοιτώντας τον 37 00:01:56,064 --> 00:01:57,676 τουλάχιστον δια γυμνού οφθαλμού. 38 00:01:57,983 --> 00:02:00,399 Οι πρώτοι ανατόμοι που εξέτασαν τον εγκέφαλο 39 00:02:00,423 --> 00:02:04,230 έδωσαν στις εμφανείς δομές του κάθε είδους περίεργη ονομασία, 40 00:02:04,254 --> 00:02:06,687 όπως ιππόκαμπος, ένα είδος μικρής γαρίδας. 41 00:02:06,711 --> 00:02:09,459 Αλλά φυσικά αυτό δεν μας λέει πάρα πολλά 42 00:02:09,459 --> 00:02:12,057 σχετικά με το τι πραγματικά συμβαίνει στο εσωτερικό. 43 00:02:12,780 --> 00:02:16,393 Ο πρώτος που πιστεύω ότι κάπως μάντεψε 44 00:02:16,417 --> 00:02:18,347 τι περίπου συμβαίνει μέσα στον εγκέφαλο 45 00:02:18,371 --> 00:02:22,291 ήταν ο μεγάλος Ισπανός νευροανατόμος Σαντιάγο Ραμόν ι Καχάλ 46 00:02:22,315 --> 00:02:23,859 τον 19ο αιώνα, 47 00:02:23,883 --> 00:02:27,638 που χρησιμοποίησε μικροσκόπιο και ειδικές χρωστικές 48 00:02:27,662 --> 00:02:31,832 που μπορούσαν επιλεκτικά να εισχωρήσουν και να χρωματίσουν με μεγάλη αντίθεση 49 00:02:31,856 --> 00:02:33,864 τα επιμέρους κελιά του εγκεφάλου, 50 00:02:33,888 --> 00:02:37,042 ούτως ώστε να αρχίσουμε να καταλαβαίνουμε τη μορφολογία τους. 51 00:02:37,972 --> 00:02:42,023 Αυτά είναι τα σκίτσα νευρώνων που έφτιαξε τον 19ο αιώνα. 52 00:02:42,120 --> 00:02:44,004 Αυτό είναι από εγκέφαλο πουλιού. 53 00:02:44,028 --> 00:02:47,085 Βλέπετε αυτή την απίστευτη ποικιλία από διάφορα είδη κελιών, 54 00:02:47,109 --> 00:02:50,544 ακόμα και η ίδια η κυτταρική θεωρία ήταν αρκετά νέα εκείνον τον καιρό. 55 00:02:50,568 --> 00:02:51,846 Και αυτές οι δομές, 56 00:02:51,870 --> 00:02:54,129 τα κελιά που έχουν αυτές τις διακλαδώσεις 57 00:02:54,129 --> 00:02:56,737 που εκτείνονται σε πολύ μεγάλες αποστάσεις 58 00:02:56,737 --> 00:02:58,543 ήταν κάτι πολύ νέο εκείνη την εποχή. 59 00:02:58,779 --> 00:03:01,682 Φυσικά, μας θυμίζουν καλώδια. 60 00:03:01,706 --> 00:03:05,163 Αυτό θα καταλάβαιναν κάποιοι άνθρωποι τον 19ο αιώνα - 61 00:03:05,187 --> 00:03:09,501 η επανάσταση καλωδίων και ηλεκτρικού ήταν μόλις στο ξεκίνημά τους. 62 00:03:09,878 --> 00:03:11,166 Αλλά με διάφορους τρόπους, 63 00:03:11,166 --> 00:03:14,479 αυτά τα μικροανατομικά σκίτσα του Ραμόν ι Καχάλ, όπως αυτό, 64 00:03:14,503 --> 00:03:16,835 ακόμη παραμένουν αξεπέραστα με κάποιους τρόπους. 65 00:03:16,859 --> 00:03:18,713 Πάνω από έναν αιώνα αργότερα 66 00:03:18,737 --> 00:03:21,562 προσπαθούμε να τελείωσουμε αυτό που άρχισε ο Ραμόν ι Καχάλ. 67 00:03:21,586 --> 00:03:23,854 Αυτά είναι τα ακατέργαστα δεδομένα 68 00:03:23,854 --> 00:03:27,625 από τους συνεργάτες μας στο Ινστιτούτο Νευροεπιστήμης Μαξ Πλανκ. 69 00:03:27,649 --> 00:03:34,099 Οι συνεργάτες μας απεικόνισαν μικρά κομμάτια εγκεφαλικού ιστού. 70 00:03:34,099 --> 00:03:35,904 Το συνολικό δείγμα εδώ 71 00:03:35,904 --> 00:03:38,164 είναι περίπου ένα κυβικό χιλιοστό σε μέγεθος, 72 00:03:38,164 --> 00:03:40,459 κι εδώ σας δείχνω ένα πολύ μικρό κομμάτι. 73 00:03:40,483 --> 00:03:42,829 Η μπάρα αριστερά είναι περίπου ένα μικρόμετρο. 74 00:03:42,853 --> 00:03:45,262 Οι δομές που βλέπετε είναι μιτοχόνδρια 75 00:03:45,286 --> 00:03:47,330 που είναι στο μέγεθος βακτηρίων. 76 00:03:47,354 --> 00:03:48,905 Και αυτές είναι συνεχείς τομές 77 00:03:48,929 --> 00:03:52,077 αυτού του πολύ μικρού κομματιού ιστού. 78 00:03:52,101 --> 00:03:54,504 Απλώς για σύγκριση, 79 00:03:54,528 --> 00:03:58,320 η διάμετρος μιας μέσης τρίχας είναι περίπου 100 μικρόμετρα. 80 00:03:58,344 --> 00:04:00,618 Άρα κοιτάζουμε κάτι πολύ πολύ μικρότερο 81 00:04:00,642 --> 00:04:02,040 από μια τρίχα μαλλιών. 82 00:04:02,064 --> 00:04:06,095 Και από αυτές τις συνεχείς τομές από ηλεκτρονικό μικροσκόπιο 83 00:04:06,119 --> 00:04:11,127 κάποιος μπορεί να φτιάξει τρισδιάστατα νευρώνες που μοιάζουν έτσι. 84 00:04:11,151 --> 00:04:14,308 Έτσι είναι κάπως το ίδιο στυλ με αυτές του Ραμόν ι Καχάλ. 85 00:04:14,332 --> 00:04:15,824 Μόνο λίγοι νευρώνες άναψαν, 86 00:04:15,848 --> 00:04:18,629 γιατί αλλιώς δεν θα μπορούσαμε να δούμε τίποτα εδώ. 87 00:04:18,653 --> 00:04:19,965 Θα ήταν τόσο πυκνό, 88 00:04:19,989 --> 00:04:21,319 τόσο γεμάτο με δομές, 89 00:04:21,343 --> 00:04:24,387 με καλώδια που συνδέουν τους νευρώνες μεταξύ τους. 90 00:04:25,293 --> 00:04:28,097 Έτσι ο Ραμόν ι Καχάλ ήταν λίγο μπροστά από την εποχή του 91 00:04:28,121 --> 00:04:30,676 και η πρόοδος για την κατανόηση του εγκεφάλου 92 00:04:30,700 --> 00:04:32,971 προχώρησε αργά τις επόμενες λίγες δεκαετίες. 93 00:04:33,455 --> 00:04:36,308 Γνωρίζαμε όμως ότι οι νευρώνες χρησιμοποιούν ηλεκτρισμό 94 00:04:36,332 --> 00:04:39,232 και μέχρι τον Β΄ Παγκόσμιο Πόλεμο είχαμε κάνει αρκετή πρόοδο 95 00:04:39,232 --> 00:04:42,218 ώστε να κάνουμε ηλεκτρικά πειράματα σε νευρώνες υπό λειτουργία 96 00:04:42,218 --> 00:04:44,348 ώστε να καταλάβουμε καλύτερα πώς δούλευαν. 97 00:04:44,631 --> 00:04:48,987 Τότε ακριβώς εφευρέθηκαν οι υπολογιστές 98 00:04:49,011 --> 00:04:52,111 και βασίστηκαν κατά πολύ στη δομή του εγκεφάλου - 99 00:04:52,135 --> 00:04:55,220 του «ευφυούς μηχανισμού», όπως τα αποκαλούσε ο Άλαν Τιούρινγκ, 100 00:04:55,244 --> 00:04:57,235 ο πατέρας της επιστήμης των υπολογιστών. 101 00:04:57,923 --> 00:05:00,259 Οι Γουόρεν ΜακΚάλοκ και Γουόλτερ Πιτς 102 00:05:00,259 --> 00:05:03,896 είδαν τα σκίτσα του Ραμόν ι Καχάλ από τον φλοιό του εγκεφάλου 103 00:05:03,920 --> 00:05:05,482 που σας δείχνω εδώ. 104 00:05:05,506 --> 00:05:09,948 Αυτός είναι ο φλοιός που επεξεργάζεται εικόνες που φτάνουν από το μάτι. 105 00:05:10,424 --> 00:05:13,932 Και τους φάνηκε σαν διάγραμμα κυκλώματος. 106 00:05:14,353 --> 00:05:18,102 Υπάρχουν πολλές λεπτομέρειες στο διάγραμμα των ΜακΚάλοκ και Πιτς 107 00:05:18,102 --> 00:05:19,564 που δεν είναι ακριβώς σωστές. 108 00:05:19,588 --> 00:05:20,823 Αλλά αυτή η βασική ιδέα 109 00:05:20,847 --> 00:05:24,839 ότι ο εγκεφαλικός ιστός λειτουργεί σαν μια σειρά από υπολογιστικά στοιχεία 110 00:05:24,863 --> 00:05:27,609 που μεταβιβάζουν πληροφορίες συνεχώς ο ένας στον άλλον 111 00:05:27,633 --> 00:05:29,235 είναι κατά βάσην σωστή. 112 00:05:29,259 --> 00:05:31,609 Ας μιλήσουμε για μια στιγμή 113 00:05:31,633 --> 00:05:35,665 τι θα πρέπει να κάνει ένα μοντέλο επεξεργασίας οπτικών πληροφοριών. 114 00:05:36,228 --> 00:05:38,969 Το βασικό έργο της αντίληψης 115 00:05:38,993 --> 00:05:43,187 είναι να πάρει μια τέτοια φωτογραφία και να πει, 116 00:05:43,211 --> 00:05:44,387 «Αυτό είναι ένα πουλί», 117 00:05:44,411 --> 00:05:47,285 που είναι κάτι πολύ απλό να κάνουμε με τον εγκέφαλό μας. 118 00:05:47,309 --> 00:05:50,730 Αλλά πρέπει να καταλάβετε ότι για έναν υπολογιστή, 119 00:05:50,754 --> 00:05:53,841 αυτό ήταν μάλλον αδύνατον πριν από λίγα χρόνια. 120 00:05:53,865 --> 00:05:55,781 Η κλασική δομή του υπολογιστή 121 00:05:55,805 --> 00:05:58,582 δεν ευνοεί αυτή τη δουλειά. 122 00:05:59,366 --> 00:06:01,918 Έτσι λοιπόν, αυτό που συμβαίνει με τα πίξελ, 123 00:06:01,942 --> 00:06:05,924 ανάμεσα στην εικόνα του πουλιού και τη λέξη «πουλί», 124 00:06:05,924 --> 00:06:07,822 αφορά ουσιαστικά μια ομάδα νευρώνων 125 00:06:07,822 --> 00:06:09,987 που αλληλοσυνδέονται σε ένα νευρωνικό δίκτυο, 126 00:06:09,987 --> 00:06:11,198 όπως στο διάγραμμα. 127 00:06:11,198 --> 00:06:14,580 Μπορεί να είναι βιολογικό νευρωνικό δίκτυο μέσα στον εγκεφαλικό φλοιό, 128 00:06:14,580 --> 00:06:17,046 ή, στις μέρες μας, αρχίζουμε να έχουμε την ικανότητα 129 00:06:17,046 --> 00:06:19,544 να μοντελοποιήσουμε τέτοια δίκτυα στον υπολογιστή. 130 00:06:19,834 --> 00:06:22,187 Θα σας δείξω πώς μοιάζουν αυτά τα δίκτυα. 131 00:06:22,211 --> 00:06:25,627 Μπορείτε να σκεφτείτε τα πίξελ ως το πρώτο επίπεδο νευρώνων, 132 00:06:25,651 --> 00:06:27,754 και βασικά έτσι λειτουργεί το μάτι - 133 00:06:27,754 --> 00:06:29,727 είναι οι νευρώνες στον αμφιβληστροειδή. 134 00:06:29,727 --> 00:06:31,801 Και αυτοί μεταδίδουν την πληροφορία 135 00:06:31,801 --> 00:06:34,528 σε αλλεπάλληλα επίπεδα νευρώνων, 136 00:06:34,552 --> 00:06:37,265 που όλα συνδέονται από συνάψεις διαφορετικών βαρών. 137 00:06:37,609 --> 00:06:39,144 Η συμπεριφορά αυτού του δικτύου 138 00:06:39,144 --> 00:06:42,226 χαρακτηρίζεται από τις δυνάμεις όλων αυτών των συνάψεων. 139 00:06:42,226 --> 00:06:45,564 Αυτές χαρακτηρίζουν τις υπολογιστικές ιδιότητες αυτού του δικτύου. 140 00:06:45,588 --> 00:06:47,058 Και στη λήξη της διαδικασίας, 141 00:06:47,082 --> 00:06:49,529 έχετε έναν νευρώνα ή μια μικρή ομάδα νευρώνων 142 00:06:49,553 --> 00:06:51,280 που θα ανάψει και θα πει «πουλί». 143 00:06:51,824 --> 00:06:54,956 Τώρα θα αναπαραστήσω αυτά τα τρία πράγματα - 144 00:06:54,980 --> 00:06:59,676 τα πίξελ τροφοδοσίας και τις συνάψεις στο νευρωνικό δίκτυο, 145 00:06:59,700 --> 00:07:01,285 και το πουλί, το εξαγόμενο - 146 00:07:01,309 --> 00:07:04,366 με τρεις μεταβλητές: x, w και y 147 00:07:04,523 --> 00:07:06,664 Μπορεί να υπάρχουν περίπου ένα εκατομμύριο x - 148 00:07:06,688 --> 00:07:08,641 ένα εκατομμύριο πίξελ σε αυτή την εικόνα. 149 00:07:08,665 --> 00:07:11,111 Υπάρχουν δισεκατομμύρια ή τρισεκατομμύρια w, 150 00:07:11,135 --> 00:07:14,520 που αντιπροσωπεύουν τα βάρη όλων των συνάψεων του νευρωνικού δικτύου. 151 00:07:14,520 --> 00:07:16,805 Και μπορεί να υπάρχει ένα μικρός αριθμός από y, 152 00:07:16,805 --> 00:07:18,337 από εξαγόμενα του δικτύου. 153 00:07:18,361 --> 00:07:20,470 Το «πουλί» είναι μόνο πέντε γράμματα, σωστά; 154 00:07:21,088 --> 00:07:24,514 Ας υποθέσουμε ότι αυτός είναι ένας πολύ απλός μαθηματικός τύπος, 155 00:07:24,538 --> 00:07:26,701 x "x" w = y. 156 00:07:26,725 --> 00:07:28,761 Βάζω τις φορές σε εισαγωγικά 157 00:07:28,785 --> 00:07:31,065 επειδή αυτό που φυσικά συμβαίνει εκεί μέσα 158 00:07:31,089 --> 00:07:34,305 είναι μια σειρά από πολύπλοκες μαθηματικές λειτουργίες. 159 00:07:35,172 --> 00:07:36,393 Αυτή είναι μια εξίσωση. 160 00:07:36,417 --> 00:07:38,089 Υπάρχουν τρεις μεταβλητές. 161 00:07:38,113 --> 00:07:40,839 Και όλοι γνωρίζουμε ότι σε μια εξίσωση 162 00:07:40,863 --> 00:07:44,505 μπορείς να λύσεις ως προς τον έναν άγνωστο εάν γνωρίζεις τους άλλους δύο. 163 00:07:45,158 --> 00:07:48,122 Έτσι το πρόβλημα της συνεπαγωγής, 164 00:07:48,122 --> 00:07:51,435 δηλαδή του να συμπεράνουμε ότι πρόκειται για φωτογραφία πουλιού, 165 00:07:51,459 --> 00:07:52,733 είναι το εξής: 166 00:07:52,757 --> 00:07:56,150 είναι που ο άγνωστος είναι ο y και οι w και x είναι γνωστοί. 167 00:07:56,150 --> 00:07:58,769 Γνωρίζετε τα νευρωνικά δίκτυα, γνωρίζετε και τα πίξελ. 168 00:07:58,769 --> 00:08:02,050 Όπως βλέπετε είναι ένα σχετικά ξεκάθαρο πρόβλημα. 169 00:08:02,074 --> 00:08:04,260 Πολλαπλασιάζετε το 2 επί 3 και τελειώσατε. 170 00:08:04,862 --> 00:08:06,985 Θα σας δείξω ένα τεχνητό νευρωνικό δίκτυο 171 00:08:07,009 --> 00:08:09,305 που φτιάξαμε πρόσφατα, να κάνει ακριβώς αυτό. 172 00:08:09,634 --> 00:08:12,494 Δουλεύει σε πραγματικό χρόνο σε κινητό τηλέφωνο, 173 00:08:12,518 --> 00:08:15,831 και αυτό από μόνο του είναι αξιοθαύμαστο γεγονός, 174 00:08:15,855 --> 00:08:19,323 τα κινητά μπορούν να κάνουν δισεκατομμύρια και τρισεκατομμύρια λειτουργίες 175 00:08:19,347 --> 00:08:20,595 ανά δευτερόλεπτο. 176 00:08:20,619 --> 00:08:22,234 Αυτό που βλέπετε είναι ένα κινητό 177 00:08:22,258 --> 00:08:25,805 που κοιτάζει αλλεπάλληλες φωτογραφίες από πουλιά, 178 00:08:25,829 --> 00:08:28,544 και όχι μόνο λέει, «Ναι, είναι πουλί» 179 00:08:28,568 --> 00:08:31,979 αλλά αναγνωρίζει το είδος του πουλιού με ένα τέτοιο νευρωνικό δίκτυο. 180 00:08:32,890 --> 00:08:34,716 Έτσι σε αυτή την φωτογραφία, 181 00:08:34,740 --> 00:08:38,542 οι x και w είναι γνωστοί και ο y είναι ο άγνωστος. 182 00:08:38,566 --> 00:08:41,404 Φυσικά δεν μπαίνω σε λεπτομέρειες για το πολύ δύσκολο μέρος, 183 00:08:41,404 --> 00:08:44,959 το πώς στο καλό υπολογίσαμε το w, 184 00:08:44,983 --> 00:08:47,154 τον εγκέφαλο που μπορεί να κάνει κάτι τέτοιο; 185 00:08:47,154 --> 00:08:49,238 Πώς μπορεί να μάθαμε ένα τέτοιο μοντέλο; 186 00:08:49,418 --> 00:08:52,651 Αυτή λοιπόν η διαδικασία μάθησης, να λύνουμε ως προς w, 187 00:08:52,675 --> 00:08:55,322 αν το κάναμε με την απλή εξίσωση 188 00:08:55,346 --> 00:08:57,346 στην οποία τα βλέπουμε αυτά ως αριθμούς, 189 00:08:57,370 --> 00:09:00,057 ξέρουμε πώς ακριβώς να το κάνουμε: 6 = 2 x w, 190 00:09:00,081 --> 00:09:03,393 βασικά διαιρούμε διά 2 και τελειώσαμε. 191 00:09:04,001 --> 00:09:06,221 Το πρόβλημα είναι αυτή η πράξη. 192 00:09:06,823 --> 00:09:07,974 Διαίρεση λοιπόν - 193 00:09:07,998 --> 00:09:11,119 χρησιμοποιήσαμε τη διαίρεση ως το αντίθετο του πολλαπλασιασμού, 194 00:09:11,143 --> 00:09:12,583 αλλά όπως είπα μόλις, 195 00:09:12,607 --> 00:09:15,056 ο πολλαπλασιασμός είναι λίγο ψεύτικος. 196 00:09:15,080 --> 00:09:18,406 Αυτή είναι μια πολύ περίπλοκη, μια εντελώς μη γραμμική λειτουργία, 197 00:09:18,430 --> 00:09:20,134 δεν έχει αντίθετο. 198 00:09:20,158 --> 00:09:23,308 Έτσι πρέπει να βρούμε τρόπο να λύσουμε την εξίσωση 199 00:09:23,332 --> 00:09:25,356 χωρίς το σύμβολο της διαίρεσης. 200 00:09:25,380 --> 00:09:27,723 Και ο τρόπος να το κάνουμε είναι αρκετά ξεκάθαρος. 201 00:09:27,747 --> 00:09:30,418 Απλώς λέτε, ας κάνουμε ένα κόλπο της άλγεβρας 202 00:09:30,442 --> 00:09:33,348 και να μετακινήσουμε το 6 στη δεξιά πλευρά της εξίσωσης. 203 00:09:33,372 --> 00:09:35,198 Τώρα ακόμα έχουμε τον πολλαπλασιασμό. 204 00:09:35,675 --> 00:09:39,255 Και αυτό το μηδέν - ας το σκεφτούμε σαν ένα σφάλμα. 205 00:09:39,279 --> 00:09:41,794 Με άλλα λόγια, αν λύναμε σωστά ως προς w, 206 00:09:41,818 --> 00:09:43,474 τότε το σφάλμα θα ήταν μηδέν. 207 00:09:43,498 --> 00:09:45,290 Και αν δεν το κάναμε αρκετά σωστά, 208 00:09:45,290 --> 00:09:47,249 το σφάλμα θα είναι μεγαλύτερο από μηδέν. 209 00:09:47,249 --> 00:09:50,599 Έτσι μπορούμε απλώς να μαντέψουμε για να ελαχιστοποιήσουμε το σφάλμα, 210 00:09:50,623 --> 00:09:53,310 και αυτό το κάνουν καλά οι υπολογιστές. 211 00:09:53,310 --> 00:09:54,853 Ας κάνουμε μια πρώτη μαντεψιά: 212 00:09:54,853 --> 00:09:56,009 Τι θα γινόταν αν w = 0; 213 00:09:56,009 --> 00:09:57,249 Τότε το σφάλμα είναι 6. 214 00:09:57,249 --> 00:09:58,885 Εάν το w = 1; Το σφάλμα είναι 4. 215 00:09:58,885 --> 00:10:01,232 Ο υπολογιστής μπορεί δίνοντας διάφορες τιμές 216 00:10:01,256 --> 00:10:03,623 να περιορίσει το σφάλμα κοντά στο μηδέν. 217 00:10:03,647 --> 00:10:07,021 Κάνοντάς το αυτό, λαμβάνει διαδοχικές τιμές κοντά στο w. 218 00:10:07,045 --> 00:10:10,701 Πρακτικά ποτέ δεν το φτάνει αλλά μετά από καμιά δεκαριά δοκιμές 219 00:10:10,725 --> 00:10:15,569 φτάνουμε στο w = 2.999 που είναι αρκετά κοντά. 220 00:10:16,302 --> 00:10:18,116 Και αυτή είναι η διαδικασία μάθησης. 221 00:10:18,140 --> 00:10:20,870 Θυμηθείτε λοιπόν 222 00:10:20,894 --> 00:10:25,272 ότι εδώ παίρνουμε πολλούς γνωστούς x και γνωστούς y 223 00:10:25,296 --> 00:10:28,750 και λύνουμε ως προς w μέσω μιας επαναληπτικής μεθόδου. 224 00:10:28,774 --> 00:10:32,330 Με τον ίδιο ακριβώς τρόπο μαθαίνουμε κι εμείς. 225 00:10:32,354 --> 00:10:34,584 Ως μωρά έχουμε πάρα πολλές εικόνες 226 00:10:34,608 --> 00:10:37,241 και μας λένε, «Αυτό είναι πουλί, αυτό δεν είναι πουλί». 227 00:10:37,714 --> 00:10:39,812 Και με τον καιρό και την επανάληψη 228 00:10:39,836 --> 00:10:42,764 λύνουμε ως προς w, λύνουμε αυτές τις νευρωνικές συνδέσεις. 229 00:10:43,460 --> 00:10:47,460 Έτσι τώρα κρατήσαμε τα x και w σταθερά για να λύσουμε ως προς y, 230 00:10:47,460 --> 00:10:49,457 αυτό είναι καθημερινή, γρήγορη αντίληψη. 231 00:10:49,457 --> 00:10:51,188 Βρίσκουμε πώς λύνουμε ως προς w, 232 00:10:51,188 --> 00:10:53,131 είναι μάθηση που είναι πολύ δυσκολότερη, 233 00:10:53,131 --> 00:10:55,084 ώστε να ελαχιστοποιήσουμε το σφάλμα, 234 00:10:55,084 --> 00:10:57,031 μέσα από πολλά δοκιμαστικά παραδείγματα. 235 00:10:57,031 --> 00:11:00,062 Πριν περίπου από έναν χρόνο, ο Άλεξ Μόρντβιντσεφ της ομάδας μας 236 00:11:00,086 --> 00:11:03,636 αποφάσισε να πειραματιστεί με το τι θα γίνει αν λύσουμε ως προς x, 237 00:11:03,660 --> 00:11:05,697 με δεδομένους γνωστούς τους w και y. 238 00:11:06,124 --> 00:11:07,115 Με άλλα λόγια, 239 00:11:07,115 --> 00:11:08,627 γνωρίζετε ότι είναι ένα πουλί 240 00:11:08,627 --> 00:11:11,930 και ήδη έχετε ένα νευρωνικό δίκτυο που του έχετε μάθει τα πουλιά, 241 00:11:11,930 --> 00:11:14,434 αλλά τι είναι η εικόνα ενός πουλιού; 242 00:11:15,034 --> 00:11:19,842 Αποδεικνύεται τελικά ότι με την ίδια διαδικασία ελαχιστοποίησης σφάλματος 243 00:11:19,842 --> 00:11:23,562 μπορούμε να το κάνουμε με το δίκτυο που έχει μάθει να αναγνωρίζει τα πουλιά, 244 00:11:23,562 --> 00:11:26,924 και το αποτέλεσμα φαίνεται να είναι... 245 00:11:30,400 --> 00:11:32,065 μια εικόνα από πουλιά. 246 00:11:32,814 --> 00:11:36,145 Αυτή λοιπόν είναι μια εικόνα με πουλιά που φτιάχτηκε εξολοκλήρου 247 00:11:36,145 --> 00:11:39,051 από νευρωνικό δίκτυο που έμαθε να αναγνωρίζει πουλιά, 248 00:11:39,051 --> 00:11:41,707 απλώς λύνοντας ως προς x αντί ως προς y, 249 00:11:41,707 --> 00:11:43,395 και κάνοντάς το επαναληπτικά. 250 00:11:43,732 --> 00:11:45,579 Να άλλο ένα διασκεδαστικό παράδειγμα. 251 00:11:45,603 --> 00:11:49,040 Είναι μια δουλειά του Μάικ Τάικα από την ομάδα μας. 252 00:11:49,064 --> 00:11:51,372 που το λέει «Παρέλαση ζώων». 253 00:11:51,396 --> 00:11:54,272 Μου θυμίζει λίγο την τεχνοτροπία του Γουίλιαμ Κέντριτζ, 254 00:11:54,296 --> 00:11:56,785 όπου φτιάχνει σκίτσα, τα σβήνει, 255 00:11:56,809 --> 00:11:58,269 φτιάχνει σκίτσα, τα σβήνει, 256 00:11:58,293 --> 00:11:59,691 και έτσι φτιάχνει μια ταινία. 257 00:11:59,715 --> 00:12:00,866 Σε αυτή την περίπτωση, 258 00:12:00,866 --> 00:12:03,611 ο Μάικ αντιστοιχεί το y με διάφορα ζώα από μια ομάδα, 259 00:12:03,611 --> 00:12:06,863 σε ένα δίκτυο που έχει σχεδιαστεί να αναγνωρίζει και να διακρίνει 260 00:12:06,863 --> 00:12:08,407 διάφορα ζώα μεταξύ τους. 261 00:12:08,431 --> 00:12:12,182 Και μας βγαίνει μια περίεργη μεταμόρφωση από ένα ζώο σε άλλο. 262 00:12:14,221 --> 00:12:18,835 Εδώ, αυτός και ο Άλεξ μαζί, προσπάθησαν να μειώσουν τα y 263 00:12:18,859 --> 00:12:21,612 σε χώρο μόνο δύο διαστάσεων, 264 00:12:21,612 --> 00:12:24,924 φτιάχνοντας έτσι έναν χάρτη από τον χώρο όλων των πραγμάτων 265 00:12:24,924 --> 00:12:26,863 που αναγνωρίζονται από αυτό το δίκτυο. 266 00:12:26,863 --> 00:12:28,794 Φτιάχνοντας αυτό το είδος σύνθεσης 267 00:12:28,794 --> 00:12:31,276 ή δημιουργία εικόνων σε ολόκληρη αυτή την επιφάνεια, 268 00:12:31,300 --> 00:12:34,110 αναπτύσσοντας τις τιμές του y, φτιάχνετε ένα είδος χάρτη - 269 00:12:34,110 --> 00:12:37,621 έναν οπτικό χάρτη όλων των πραγμάτων που το δίκτυο ξέρει να αναγνωρίζει. 270 00:12:37,621 --> 00:12:40,540 Όλα τα ζώα είναι εδώ - το αρμαντίλο είναι σε αυτή τη θέση. 271 00:12:40,919 --> 00:12:43,398 Μπορείτε να το κάνετε και με άλλα είδη δικτύων. 272 00:12:43,422 --> 00:12:46,296 Αυτό είναι ένα δίκτυο σχεδιασμένο να αναγνωρίζει πρόσωπα, 273 00:12:46,320 --> 00:12:48,320 να διακρίνει πρόσωπα μεταξύ τους. 274 00:12:48,344 --> 00:12:51,267 Και εδώ βάζουμε ένα y που λέει «εγώ», 275 00:12:51,267 --> 00:12:53,192 τις παραμέτρους του δικού μου προσώπου. 276 00:12:53,216 --> 00:12:54,922 Και όταν λύσει ως προς x, 277 00:12:54,946 --> 00:12:57,564 παράγει αυτή την αλλόκοτη, 278 00:12:57,588 --> 00:13:02,016 λίγο κυβιστική, σουρεαλιστική, ψυχεδελική εικόνα μου 279 00:13:02,016 --> 00:13:03,810 από πολλαπλές απόψεις ταυτόχρονα. 280 00:13:03,810 --> 00:13:06,794 Ο λόγος που μοιάζει σαν να είναι πολλαπλές απόψεις ταυτόχρονα 281 00:13:06,794 --> 00:13:10,315 είναι επειδή το δίκτυο σχεδιάστηκε να απορρίπτει την αμφισημία 282 00:13:10,339 --> 00:13:12,815 ενός προσώπου σε μια ή σε άλλη πόζα, 283 00:13:12,839 --> 00:13:16,215 ή όταν το βλέπουμε κάθε φορά σε διαφορετικό φωτισμό. 284 00:13:16,239 --> 00:13:18,324 Όταν λοιπόν κάνετε μια τέτοια ανακατασκευή, 285 00:13:18,348 --> 00:13:20,436 αν δεν χρησιμοποιήσετε ως οδηγό 286 00:13:20,436 --> 00:13:22,087 μια βασική εικόνα ή στατιστικές, 287 00:13:22,087 --> 00:13:25,676 τότε θα υπάρξει μια σύγχυση από διαφορετικές απόψεις 288 00:13:25,700 --> 00:13:27,068 λόγω αμφισημίας. 289 00:13:27,786 --> 00:13:32,009 Αυτό συμβαίνει αν ο Άλεξ βάλει το δικό του πρόσωπο ως εικόνα-οδηγό 290 00:13:32,033 --> 00:13:35,354 κατά τη διαδικασία βελτιστοποίησης στην ανακατασκευή του προσώπου μου. 291 00:13:36,284 --> 00:13:38,612 Βλέπετε λοιπόν ότι δεν είναι τέλειο. 292 00:13:38,612 --> 00:13:40,486 Χρειάζεται αρκετή δουλειά ακόμη 293 00:13:40,486 --> 00:13:42,939 στη βελτιστοποίηση της διαδικασίας βελτιστοποίησης. 294 00:13:42,939 --> 00:13:45,906 Αλλά αρχίζουμε να παίρνουμε κάτι πολύ πιο συναφές ως πρόσωπο, 295 00:13:45,906 --> 00:13:48,076 που φτιάχνεται με οδηγό το δικό μου πρόσωπο. 296 00:13:48,892 --> 00:13:51,393 Δεν χρειάζεται να ξεκινήσετε από το μηδέν 297 00:13:51,417 --> 00:13:52,573 ή από μια αοριστία. 298 00:13:52,597 --> 00:13:53,901 Όταν λύνετε ως προς x, 299 00:13:53,925 --> 00:13:57,814 μπορείτε να ξεκινήσετε με ένα x, που είναι ήδη μια άλλη εικόνα το ίδιο. 300 00:13:57,838 --> 00:14:00,394 Όπως σε αυτή η επίδειξη. 301 00:14:00,418 --> 00:14:04,364 Αυτό είναι ένα δίκτυο σχεδιασμένο να ταξινομεί 302 00:14:04,364 --> 00:14:07,683 κάθε είδους διαφορετικά αντικείμενα - ανθρώπινες κατασκευές, ζώα... 303 00:14:07,707 --> 00:14:10,300 Εδώ αρχίζουμε μόνο με μια εικόνα από σύννεφα, 304 00:14:10,324 --> 00:14:11,995 και καθώς βελτιστοποιούμε, 305 00:14:12,019 --> 00:14:16,505 βασικά, αυτό το δίκτυο βρίσκει τι βλέπει μέσα στα σύννεφα. 306 00:14:16,931 --> 00:14:19,245 Και όσο περισσότερο το κοιτάζετε, 307 00:14:19,245 --> 00:14:22,178 τόσο περισσότερα πράγματα βρίσκετε κι εσείς μέσα στα σύννεφα. 308 00:14:23,004 --> 00:14:26,379 Μπορείτε επίσης να βάλετε το δίκτυο με τα πρόσωπα να οραματιστεί εδώ, 309 00:14:26,403 --> 00:14:28,215 και θα έχετε πολύ τρελά αποτελέσματα. 310 00:14:28,239 --> 00:14:29,389 (Γέλια) 311 00:14:30,401 --> 00:14:33,145 Ή ακόμη, ο Μάικ έκανε και άλλα πειράματα 312 00:14:33,169 --> 00:14:37,074 όπου παίρνει την εικόνα με τα σύννεφα, 313 00:14:37,098 --> 00:14:40,605 οραματίζεται μορφές, ζουμάρει, οραματίζεται, ζουμάρει. 314 00:14:40,629 --> 00:14:41,780 Και με αυτό τον τρόπο 315 00:14:41,804 --> 00:14:45,479 βάζετε το δίκτυο σε μια κατάσταση, θα έλεγα σαν ένα είδος αντίστιξης, 316 00:14:45,503 --> 00:14:49,183 ένα είδος ελεύθερου συσχετισμού, 317 00:14:49,207 --> 00:14:51,434 όπου το δίκτυο τρώει την ίδια του την ουρά. 318 00:14:51,458 --> 00:14:54,879 Έτσι πλέον κάθε εικόνα μας κάνει να σκεφτόμαστε, 319 00:14:54,903 --> 00:14:56,324 «Τι νομίζω ότι βλέπω μετά; 320 00:14:56,348 --> 00:14:59,151 Τι νομίζω ότι βλέπω μετά; Τι νομίζω ότι βλέπω μετά;» 321 00:14:59,487 --> 00:15:02,423 Το παρουσίασα πρώτη φορά δημόσια σε μια ομάδα 322 00:15:02,447 --> 00:15:07,884 σε ομιλία στο Σιάτλ που λεγόταν «Ανώτερη Εκπαίδευση» - 323 00:15:07,908 --> 00:15:10,345 αμέσως αφού νομιμοποιήθηκε η μαριχουάνα. 324 00:15:10,369 --> 00:15:12,784 (Γέλια) 325 00:15:14,627 --> 00:15:16,731 Θα ήθελα να κλείσω γρήγορα 326 00:15:16,755 --> 00:15:21,010 με την απλή παρατήρηση ότι αυτή η τεχνολογία δεν περιορίζεται. 327 00:15:21,034 --> 00:15:24,699 Σας έδειξα μόνο οπτικά παραδείγματα επειδή είναι πιο ευχάριστα. 328 00:15:24,723 --> 00:15:26,918 Δεν είναι αποκλειστικά οπτική τεχνολογία. 329 00:15:26,918 --> 00:15:29,281 Ο καλλιτεχνικός συνεργάτης μας, Ρος Γκούντγουιν, 330 00:15:29,281 --> 00:15:32,886 έχει κάνει πειράματα με μια κάμερα που παίρνει φωτογραφίες, 331 00:15:32,910 --> 00:15:37,144 και μετά ένας υπολογιστής στο σακίδιό του γράφει ποιήματα μέσα από νευρωνικά δίκτυα, 332 00:15:37,168 --> 00:15:39,112 με βάση τα περιεχόμενα της εικόνας. 333 00:15:39,136 --> 00:15:42,083 Αυτό το ποιητικό νευρωνικό δίκτυο έχει εκπαιδευτεί 334 00:15:42,107 --> 00:15:44,341 με ένα μεγάλο όγκο ποίησης του 20ου αιώνα. 335 00:15:44,365 --> 00:15:45,864 Και η ποίηση είναι, ξέρετε, 336 00:15:45,888 --> 00:15:47,802 νομίζω, όχι και τόσο άσχημη, τελικά. 337 00:15:47,826 --> 00:15:49,210 (Γέλια) 338 00:15:49,234 --> 00:15:50,393 Κλείνοντας, 339 00:15:50,417 --> 00:15:52,549 σχετικά με τον Μιχαήλ Άγγελο, 340 00:15:52,573 --> 00:15:53,807 νομίζω ότι είχε δίκιο. 341 00:15:53,831 --> 00:15:57,267 Η αντίληψη και η δημιουργικότητα είναι πολύ στενά συνδεδεμένες. 342 00:15:57,611 --> 00:16:00,245 Μόλις είδαμε νευρωνικά δίκτυα 343 00:16:00,269 --> 00:16:02,572 που έχουν εκπαιδευτεί εξολοκλήρου να διακρίνουν, 344 00:16:02,596 --> 00:16:04,978 ή να αναγνωρίζουν διαφορετικά πράγματα στον κόσμο, 345 00:16:04,978 --> 00:16:08,023 και μπορούν να λειτουργούν αντίστροφα, να δημιουργούν. 346 00:16:08,047 --> 00:16:10,170 Ένα από τα πράγματα που συμπεραίνω από αυτό 347 00:16:10,170 --> 00:16:12,252 είναι ότι δεν είδε μόνο ο Μιχαήλ Άγγελος 348 00:16:12,276 --> 00:16:14,728 το γλυπτό μέσα στον όγκο της πέτρας, 349 00:16:14,752 --> 00:16:18,390 αλλά ότι κάθε πλάσμα, κάθε ον, κάθε εξωγήινος, 350 00:16:18,414 --> 00:16:21,895 που μπορεί να επιτελέσει τέτοιου είδους πράξεις αντίληψης, 351 00:16:21,895 --> 00:16:23,510 μπορεί επίσης να δημιουργήσει 352 00:16:23,510 --> 00:16:27,038 επειδή ακριβώς ο ίδιος μηχανισμός χρησιμοποιείται και στις δύο περιπτώσεις. 353 00:16:27,038 --> 00:16:30,368 Επίσης πιστεύω ότι η αντίληψη και η δημιουργικότητα 354 00:16:30,368 --> 00:16:32,578 επ' ουδενί είναι αποκλειστικά κάτι ανθρώπινο. 355 00:16:32,578 --> 00:16:36,240 Έχουμε υπολογιστικά μοντέλα που μπορούν να κάνουν ακριβώς το ίδιο. 356 00:16:36,264 --> 00:16:39,592 Και αυτό δεν πρέπει να μας εκπλήσσει, το μυαλό κάνει υπολογισμούς. 357 00:16:39,616 --> 00:16:41,273 Και τέλος, 358 00:16:41,297 --> 00:16:45,965 οι υπολογιστές ξεκίνησαν ως άσκηση στο σχεδιασμό ευφυών μηχανημάτων. 359 00:16:45,989 --> 00:16:48,451 Σχεδιάστηκε βασικά με την ιδέα 360 00:16:48,475 --> 00:16:51,488 του πώς μπορούμε να κάνουμε τις μηχανές ευφυείς. 361 00:16:51,512 --> 00:16:53,674 Και τελικά αρχίζουμε να εκπληρώνουμε 362 00:16:53,698 --> 00:16:56,104 μερικές από τις υποσχέσεις εκείνων των πρωτοπόρων, 363 00:16:56,128 --> 00:16:57,841 του Τούρινγκ και του Φον Νόιμαν, 364 00:16:57,865 --> 00:17:00,130 του ΜακΚάλοκ και του Πιτς. 365 00:17:00,154 --> 00:17:04,252 Και νομίζω ότι οι υπολογιστές δεν αφορούν μόνο τα λογιστικά, 366 00:17:04,276 --> 00:17:06,423 ή να παίζουμε Καντι Κρας ή κάτι τέτοιο. 367 00:17:06,447 --> 00:17:09,025 Εξαρχής τα σχεδιάσαμε κατ' εικόναν του μυαλού μας. 368 00:17:09,049 --> 00:17:12,318 Και μας δίνουν την ικανότητα να καταλάβουμε το μυαλό μας καλύτερα 369 00:17:12,342 --> 00:17:13,871 και να τα επεκτείνουμε. 370 00:17:14,627 --> 00:17:15,794 Σας ευχαριστώ πολύ. 371 00:17:15,818 --> 00:17:17,467 (Χειροκρότημα)