WEBVTT 00:00:00.800 --> 00:00:03.924 Ηγούμαι μιας ομάδας στην Google που ερευνά τη μηχανική ευφυΐα. 00:00:03.948 --> 00:00:08.598 Με άλλα λόγια, τον κλάδο της μηχανικής που κάνει υπολογιστές και συσκευές 00:00:08.622 --> 00:00:11.041 να μπορούν να κάνουν κάποια απ' όσα κάνει το μυαλό. 00:00:11.439 --> 00:00:14.262 Γι' αυτό ενδιαφερόμαστε για τους κανονικούς εγκεφάλους 00:00:14.262 --> 00:00:16.101 καθώς και για τη νευροεπιστήμη, 00:00:16.101 --> 00:00:20.047 και ειδικότερα για τα πράγματα που κάνει το μυαλό μας 00:00:20.047 --> 00:00:24.089 που ακόμα είναι πολύ ανώτερο από τις επιδόσεις των υπολογιστών. NOTE Paragraph 00:00:25.209 --> 00:00:28.818 Ιστορικά, ένα από αυτά που μας ενδιέφεραν ήταν η αντίληψη, 00:00:28.842 --> 00:00:31.881 η διαδικασία με την οποία τα πράγματα εκεί έξω στον κόσμο 00:00:31.905 --> 00:00:33.489 -ήχοι και εικόνες- 00:00:33.513 --> 00:00:35.691 μετατρέπονται σε έννοιες μέσα στο μυαλό. 00:00:36.235 --> 00:00:38.752 Αυτό είναι ζωτικό για τον εγκέφαλό μας 00:00:38.776 --> 00:00:41.240 και επίσης είναι πολύ χρήσιμο για τον υπολογιστή. 00:00:41.636 --> 00:00:45.286 Για παράδειγμα, οι αλγόριθμοι μηχανικής αντίληψης που φτιάχνει η ομάδα μας 00:00:45.286 --> 00:00:48.884 κάνουν δυνατή την αναζήτηση στις φωτογραφίες του Google Photos 00:00:48.884 --> 00:00:50.911 βάσει του τι αυτές περιέχουν. 00:00:51.594 --> 00:00:55.087 Η άλλη πλευρά της αντίληψης είναι η δημιουργικότητα: 00:00:55.111 --> 00:00:58.149 το να μεταμορφώνετε μια έννοια σε κάτι εκεί έξω στον κόσμο. 00:00:58.173 --> 00:01:01.728 Έτσι τον τελευταίο χρόνο, η εργασία μας πάνω στη μηχανική αντίληψη 00:01:01.752 --> 00:01:06.515 συνδέθηκε απρόσμενα και με τον κόσμο της δημιουργικότητας 00:01:06.515 --> 00:01:07.965 και της τέχνης από μηχανές. NOTE Paragraph 00:01:08.556 --> 00:01:11.930 Νομίζω ότι ο Μιχαήλ Αγγελος είδε πολύ διορατικά 00:01:11.930 --> 00:01:15.520 αυτή τη δυαδική σχέση μεταξύ αντίληψης και δημιουργικότητας. 00:01:16.023 --> 00:01:18.029 Ένα φημισμένο απόφθεγμά του λέει: 00:01:18.053 --> 00:01:21.756 «Κάθε κομμάτι πέτρας έχει μέσα του ένα άγαλμα 00:01:21.756 --> 00:01:25.178 και είναι δουλειά του γλύπτη να το αποκαλύψει». 00:01:26.029 --> 00:01:29.245 Νομίζω ότι ο Μιχαήλ Άγγελος εννοεί 00:01:29.269 --> 00:01:32.449 ότι δημιουργούμε μέσα από την αντίληψη, 00:01:32.473 --> 00:01:35.496 και η ίδια η αντίληψη είναι μια πράξη φαντασίας 00:01:35.520 --> 00:01:38.081 από την οποία είναι φτιαγμένη η δημιουργικότητα. NOTE Paragraph 00:01:38.691 --> 00:01:42.616 Το όργανο που σκέφτεται, αντιλαμβάνεται και φαντάζεται 00:01:42.640 --> 00:01:44.228 είναι φυσικά ο εγκέφαλος. 00:01:45.089 --> 00:01:47.634 Θα ήθελα να αρχίσω με λίγη ιστορία 00:01:47.658 --> 00:01:49.960 σχετικά με το τι γνωρίζουμε για τον εγκέφαλό μας. 00:01:50.406 --> 00:01:53.026 Γιατί διαφορετικά, ας πούμε, από την καρδιά ή τα έντερα 00:01:53.026 --> 00:01:56.064 δεν μπορείς να πεις πολλά για τον εγκέφαλο απλώς κοιτώντας τον 00:01:56.064 --> 00:01:57.676 τουλάχιστον δια γυμνού οφθαλμού. 00:01:57.983 --> 00:02:00.399 Οι πρώτοι ανατόμοι που εξέτασαν τον εγκέφαλο 00:02:00.423 --> 00:02:04.230 έδωσαν στις εμφανείς δομές του κάθε είδους περίεργη ονομασία, 00:02:04.254 --> 00:02:06.687 όπως ιππόκαμπος, ένα είδος μικρής γαρίδας. 00:02:06.711 --> 00:02:09.459 Αλλά φυσικά αυτό δεν μας λέει πάρα πολλά 00:02:09.459 --> 00:02:12.057 σχετικά με το τι πραγματικά συμβαίνει στο εσωτερικό. NOTE Paragraph 00:02:12.780 --> 00:02:16.393 Ο πρώτος που πιστεύω ότι κάπως μάντεψε 00:02:16.417 --> 00:02:18.347 τι περίπου συμβαίνει μέσα στον εγκέφαλο 00:02:18.371 --> 00:02:22.291 ήταν ο μεγάλος Ισπανός νευροανατόμος Σαντιάγο Ραμόν ι Καχάλ 00:02:22.315 --> 00:02:23.859 τον 19ο αιώνα, 00:02:23.883 --> 00:02:27.638 που χρησιμοποίησε μικροσκόπιο και ειδικές χρωστικές 00:02:27.662 --> 00:02:31.832 που μπορούσαν επιλεκτικά να εισχωρήσουν και να χρωματίσουν με μεγάλη αντίθεση 00:02:31.856 --> 00:02:33.864 τα επιμέρους κελιά του εγκεφάλου, 00:02:33.888 --> 00:02:37.042 ούτως ώστε να αρχίσουμε να καταλαβαίνουμε τη μορφολογία τους. 00:02:37.972 --> 00:02:42.023 Αυτά είναι τα σκίτσα νευρώνων που έφτιαξε τον 19ο αιώνα. NOTE Paragraph 00:02:42.120 --> 00:02:44.004 Αυτό είναι από εγκέφαλο πουλιού. 00:02:44.028 --> 00:02:47.085 Βλέπετε αυτή την απίστευτη ποικιλία από διάφορα είδη κελιών, 00:02:47.109 --> 00:02:50.544 ακόμα και η ίδια η κυτταρική θεωρία ήταν αρκετά νέα εκείνον τον καιρό. 00:02:50.568 --> 00:02:51.846 Και αυτές οι δομές, 00:02:51.870 --> 00:02:54.129 τα κελιά που έχουν αυτές τις διακλαδώσεις 00:02:54.129 --> 00:02:56.737 που εκτείνονται σε πολύ μεγάλες αποστάσεις 00:02:56.737 --> 00:02:58.543 ήταν κάτι πολύ νέο εκείνη την εποχή. 00:02:58.779 --> 00:03:01.682 Φυσικά, μας θυμίζουν καλώδια. 00:03:01.706 --> 00:03:05.163 Αυτό θα καταλάβαιναν κάποιοι άνθρωποι τον 19ο αιώνα - 00:03:05.187 --> 00:03:09.501 η επανάσταση καλωδίων και ηλεκτρικού ήταν μόλις στο ξεκίνημά τους. 00:03:09.878 --> 00:03:11.166 Αλλά με διάφορους τρόπους, 00:03:11.166 --> 00:03:14.479 αυτά τα μικροανατομικά σκίτσα του Ραμόν ι Καχάλ, όπως αυτό, 00:03:14.503 --> 00:03:16.835 ακόμη παραμένουν αξεπέραστα με κάποιους τρόπους. NOTE Paragraph 00:03:16.859 --> 00:03:18.713 Πάνω από έναν αιώνα αργότερα 00:03:18.737 --> 00:03:21.562 προσπαθούμε να τελείωσουμε αυτό που άρχισε ο Ραμόν ι Καχάλ. 00:03:21.586 --> 00:03:23.854 Αυτά είναι τα ακατέργαστα δεδομένα 00:03:23.854 --> 00:03:27.625 από τους συνεργάτες μας στο Ινστιτούτο Νευροεπιστήμης Μαξ Πλανκ. 00:03:27.649 --> 00:03:34.099 Οι συνεργάτες μας απεικόνισαν μικρά κομμάτια εγκεφαλικού ιστού. 00:03:34.099 --> 00:03:35.904 Το συνολικό δείγμα εδώ 00:03:35.904 --> 00:03:38.164 είναι περίπου ένα κυβικό χιλιοστό σε μέγεθος, 00:03:38.164 --> 00:03:40.459 κι εδώ σας δείχνω ένα πολύ μικρό κομμάτι. 00:03:40.483 --> 00:03:42.829 Η μπάρα αριστερά είναι περίπου ένα μικρόμετρο. 00:03:42.853 --> 00:03:45.262 Οι δομές που βλέπετε είναι μιτοχόνδρια 00:03:45.286 --> 00:03:47.330 που είναι στο μέγεθος βακτηρίων. 00:03:47.354 --> 00:03:48.905 Και αυτές είναι συνεχείς τομές 00:03:48.929 --> 00:03:52.077 αυτού του πολύ μικρού κομματιού ιστού. 00:03:52.101 --> 00:03:54.504 Απλώς για σύγκριση, 00:03:54.528 --> 00:03:58.320 η διάμετρος μιας μέσης τρίχας είναι περίπου 100 μικρόμετρα. 00:03:58.344 --> 00:04:00.618 Άρα κοιτάζουμε κάτι πολύ πολύ μικρότερο 00:04:00.642 --> 00:04:02.040 από μια τρίχα μαλλιών. NOTE Paragraph 00:04:02.064 --> 00:04:06.095 Και από αυτές τις συνεχείς τομές από ηλεκτρονικό μικροσκόπιο 00:04:06.119 --> 00:04:11.127 κάποιος μπορεί να φτιάξει τρισδιάστατα νευρώνες που μοιάζουν έτσι. 00:04:11.151 --> 00:04:14.308 Έτσι είναι κάπως το ίδιο στυλ με αυτές του Ραμόν ι Καχάλ. 00:04:14.332 --> 00:04:15.824 Μόνο λίγοι νευρώνες άναψαν, 00:04:15.848 --> 00:04:18.629 γιατί αλλιώς δεν θα μπορούσαμε να δούμε τίποτα εδώ. 00:04:18.653 --> 00:04:19.965 Θα ήταν τόσο πυκνό, 00:04:19.989 --> 00:04:21.319 τόσο γεμάτο με δομές, 00:04:21.343 --> 00:04:24.387 με καλώδια που συνδέουν τους νευρώνες μεταξύ τους. NOTE Paragraph 00:04:25.293 --> 00:04:28.097 Έτσι ο Ραμόν ι Καχάλ ήταν λίγο μπροστά από την εποχή του 00:04:28.121 --> 00:04:30.676 και η πρόοδος για την κατανόηση του εγκεφάλου 00:04:30.700 --> 00:04:32.971 προχώρησε αργά τις επόμενες λίγες δεκαετίες. 00:04:33.455 --> 00:04:36.308 Γνωρίζαμε όμως ότι οι νευρώνες χρησιμοποιούν ηλεκτρισμό 00:04:36.332 --> 00:04:39.232 και μέχρι τον Β΄ Παγκόσμιο Πόλεμο είχαμε κάνει αρκετή πρόοδο 00:04:39.232 --> 00:04:42.218 ώστε να κάνουμε ηλεκτρικά πειράματα σε νευρώνες υπό λειτουργία 00:04:42.218 --> 00:04:44.348 ώστε να καταλάβουμε καλύτερα πώς δούλευαν. 00:04:44.631 --> 00:04:48.987 Τότε ακριβώς εφευρέθηκαν οι υπολογιστές 00:04:49.011 --> 00:04:52.111 και βασίστηκαν κατά πολύ στη δομή του εγκεφάλου - 00:04:52.135 --> 00:04:55.220 του «ευφυούς μηχανισμού», όπως τα αποκαλούσε ο Άλαν Τιούρινγκ, 00:04:55.244 --> 00:04:57.235 ο πατέρας της επιστήμης των υπολογιστών. NOTE Paragraph 00:04:57.923 --> 00:05:00.259 Οι Γουόρεν ΜακΚάλοκ και Γουόλτερ Πιτς 00:05:00.259 --> 00:05:03.896 είδαν τα σκίτσα του Ραμόν ι Καχάλ από τον φλοιό του εγκεφάλου 00:05:03.920 --> 00:05:05.482 που σας δείχνω εδώ. 00:05:05.506 --> 00:05:09.948 Αυτός είναι ο φλοιός που επεξεργάζεται εικόνες που φτάνουν από το μάτι. 00:05:10.424 --> 00:05:13.932 Και τους φάνηκε σαν διάγραμμα κυκλώματος. 00:05:14.353 --> 00:05:18.102 Υπάρχουν πολλές λεπτομέρειες στο διάγραμμα των ΜακΚάλοκ και Πιτς 00:05:18.102 --> 00:05:19.564 που δεν είναι ακριβώς σωστές. 00:05:19.588 --> 00:05:20.823 Αλλά αυτή η βασική ιδέα 00:05:20.847 --> 00:05:24.839 ότι ο εγκεφαλικός ιστός λειτουργεί σαν μια σειρά από υπολογιστικά στοιχεία 00:05:24.863 --> 00:05:27.609 που μεταβιβάζουν πληροφορίες συνεχώς ο ένας στον άλλον 00:05:27.633 --> 00:05:29.235 είναι κατά βάσην σωστή. NOTE Paragraph 00:05:29.259 --> 00:05:31.609 Ας μιλήσουμε για μια στιγμή 00:05:31.633 --> 00:05:35.665 τι θα πρέπει να κάνει ένα μοντέλο επεξεργασίας οπτικών πληροφοριών. 00:05:36.228 --> 00:05:38.969 Το βασικό έργο της αντίληψης 00:05:38.993 --> 00:05:43.187 είναι να πάρει μια τέτοια φωτογραφία και να πει, 00:05:43.211 --> 00:05:44.387 «Αυτό είναι ένα πουλί», 00:05:44.411 --> 00:05:47.285 που είναι κάτι πολύ απλό να κάνουμε με τον εγκέφαλό μας. 00:05:47.309 --> 00:05:50.730 Αλλά πρέπει να καταλάβετε ότι για έναν υπολογιστή, 00:05:50.754 --> 00:05:53.841 αυτό ήταν μάλλον αδύνατον πριν από λίγα χρόνια. 00:05:53.865 --> 00:05:55.781 Η κλασική δομή του υπολογιστή 00:05:55.805 --> 00:05:58.582 δεν ευνοεί αυτή τη δουλειά. NOTE Paragraph 00:05:59.366 --> 00:06:01.918 Έτσι λοιπόν, αυτό που συμβαίνει με τα πίξελ, 00:06:01.942 --> 00:06:05.924 ανάμεσα στην εικόνα του πουλιού και τη λέξη «πουλί», 00:06:05.924 --> 00:06:07.822 αφορά ουσιαστικά μια ομάδα νευρώνων 00:06:07.822 --> 00:06:09.987 που αλληλοσυνδέονται σε ένα νευρωνικό δίκτυο, 00:06:09.987 --> 00:06:11.198 όπως στο διάγραμμα. 00:06:11.198 --> 00:06:14.580 Μπορεί να είναι βιολογικό νευρωνικό δίκτυο μέσα στον εγκεφαλικό φλοιό, 00:06:14.580 --> 00:06:17.046 ή, στις μέρες μας, αρχίζουμε να έχουμε την ικανότητα 00:06:17.046 --> 00:06:19.544 να μοντελοποιήσουμε τέτοια δίκτυα στον υπολογιστή. 00:06:19.834 --> 00:06:22.187 Θα σας δείξω πώς μοιάζουν αυτά τα δίκτυα. NOTE Paragraph 00:06:22.211 --> 00:06:25.627 Μπορείτε να σκεφτείτε τα πίξελ ως το πρώτο επίπεδο νευρώνων, 00:06:25.651 --> 00:06:27.754 και βασικά έτσι λειτουργεί το μάτι - 00:06:27.754 --> 00:06:29.727 είναι οι νευρώνες στον αμφιβληστροειδή. 00:06:29.727 --> 00:06:31.801 Και αυτοί μεταδίδουν την πληροφορία 00:06:31.801 --> 00:06:34.528 σε αλλεπάλληλα επίπεδα νευρώνων, 00:06:34.552 --> 00:06:37.265 που όλα συνδέονται από συνάψεις διαφορετικών βαρών. 00:06:37.609 --> 00:06:39.144 Η συμπεριφορά αυτού του δικτύου 00:06:39.144 --> 00:06:42.226 χαρακτηρίζεται από τις δυνάμεις όλων αυτών των συνάψεων. 00:06:42.226 --> 00:06:45.564 Αυτές χαρακτηρίζουν τις υπολογιστικές ιδιότητες αυτού του δικτύου. 00:06:45.588 --> 00:06:47.058 Και στη λήξη της διαδικασίας, 00:06:47.082 --> 00:06:49.529 έχετε έναν νευρώνα ή μια μικρή ομάδα νευρώνων 00:06:49.553 --> 00:06:51.280 που θα ανάψει και θα πει «πουλί». NOTE Paragraph 00:06:51.824 --> 00:06:54.956 Τώρα θα αναπαραστήσω αυτά τα τρία πράγματα - 00:06:54.980 --> 00:06:59.676 τα πίξελ τροφοδοσίας και τις συνάψεις στο νευρωνικό δίκτυο, 00:06:59.700 --> 00:07:01.285 και το πουλί, το εξαγόμενο - 00:07:01.309 --> 00:07:04.366 με τρεις μεταβλητές: x, w και y 00:07:04.523 --> 00:07:06.664 Μπορεί να υπάρχουν περίπου ένα εκατομμύριο x - 00:07:06.688 --> 00:07:08.641 ένα εκατομμύριο πίξελ σε αυτή την εικόνα. 00:07:08.665 --> 00:07:11.111 Υπάρχουν δισεκατομμύρια ή τρισεκατομμύρια w, 00:07:11.135 --> 00:07:14.520 που αντιπροσωπεύουν τα βάρη όλων των συνάψεων του νευρωνικού δικτύου. 00:07:14.520 --> 00:07:16.805 Και μπορεί να υπάρχει ένα μικρός αριθμός από y, 00:07:16.805 --> 00:07:18.337 από εξαγόμενα του δικτύου. 00:07:18.361 --> 00:07:20.470 Το «πουλί» είναι μόνο πέντε γράμματα, σωστά; 00:07:21.088 --> 00:07:24.514 Ας υποθέσουμε ότι αυτός είναι ένας πολύ απλός μαθηματικός τύπος, 00:07:24.538 --> 00:07:26.701 x "x" w = y. 00:07:26.725 --> 00:07:28.761 Βάζω τις φορές σε εισαγωγικά 00:07:28.785 --> 00:07:31.065 επειδή αυτό που φυσικά συμβαίνει εκεί μέσα 00:07:31.089 --> 00:07:34.305 είναι μια σειρά από πολύπλοκες μαθηματικές λειτουργίες. NOTE Paragraph 00:07:35.172 --> 00:07:36.393 Αυτή είναι μια εξίσωση. 00:07:36.417 --> 00:07:38.089 Υπάρχουν τρεις μεταβλητές. 00:07:38.113 --> 00:07:40.839 Και όλοι γνωρίζουμε ότι σε μια εξίσωση 00:07:40.863 --> 00:07:44.505 μπορείς να λύσεις ως προς τον έναν άγνωστο εάν γνωρίζεις τους άλλους δύο. 00:07:45.158 --> 00:07:48.122 Έτσι το πρόβλημα της συνεπαγωγής, 00:07:48.122 --> 00:07:51.435 δηλαδή του να συμπεράνουμε ότι πρόκειται για φωτογραφία πουλιού, 00:07:51.459 --> 00:07:52.733 είναι το εξής: 00:07:52.757 --> 00:07:56.150 είναι που ο άγνωστος είναι ο y και οι w και x είναι γνωστοί. 00:07:56.150 --> 00:07:58.769 Γνωρίζετε τα νευρωνικά δίκτυα, γνωρίζετε και τα πίξελ. 00:07:58.769 --> 00:08:02.050 Όπως βλέπετε είναι ένα σχετικά ξεκάθαρο πρόβλημα. 00:08:02.074 --> 00:08:04.260 Πολλαπλασιάζετε το 2 επί 3 και τελειώσατε. 00:08:04.862 --> 00:08:06.985 Θα σας δείξω ένα τεχνητό νευρωνικό δίκτυο 00:08:07.009 --> 00:08:09.305 που φτιάξαμε πρόσφατα, να κάνει ακριβώς αυτό. NOTE Paragraph 00:08:09.634 --> 00:08:12.494 Δουλεύει σε πραγματικό χρόνο σε κινητό τηλέφωνο, 00:08:12.518 --> 00:08:15.831 και αυτό από μόνο του είναι αξιοθαύμαστο γεγονός, 00:08:15.855 --> 00:08:19.323 τα κινητά μπορούν να κάνουν δισεκατομμύρια και τρισεκατομμύρια λειτουργίες 00:08:19.347 --> 00:08:20.595 ανά δευτερόλεπτο. 00:08:20.619 --> 00:08:22.234 Αυτό που βλέπετε είναι ένα κινητό 00:08:22.258 --> 00:08:25.805 που κοιτάζει αλλεπάλληλες φωτογραφίες από πουλιά, 00:08:25.829 --> 00:08:28.544 και όχι μόνο λέει, «Ναι, είναι πουλί» 00:08:28.568 --> 00:08:31.979 αλλά αναγνωρίζει το είδος του πουλιού με ένα τέτοιο νευρωνικό δίκτυο. 00:08:32.890 --> 00:08:34.716 Έτσι σε αυτή την φωτογραφία, 00:08:34.740 --> 00:08:38.542 οι x και w είναι γνωστοί και ο y είναι ο άγνωστος. 00:08:38.566 --> 00:08:41.404 Φυσικά δεν μπαίνω σε λεπτομέρειες για το πολύ δύσκολο μέρος, 00:08:41.404 --> 00:08:44.959 το πώς στο καλό υπολογίσαμε το w, 00:08:44.983 --> 00:08:47.154 τον εγκέφαλο που μπορεί να κάνει κάτι τέτοιο; 00:08:47.154 --> 00:08:49.238 Πώς μπορεί να μάθαμε ένα τέτοιο μοντέλο; NOTE Paragraph 00:08:49.418 --> 00:08:52.651 Αυτή λοιπόν η διαδικασία μάθησης, να λύνουμε ως προς w, 00:08:52.675 --> 00:08:55.322 αν το κάναμε με την απλή εξίσωση 00:08:55.346 --> 00:08:57.346 στην οποία τα βλέπουμε αυτά ως αριθμούς, 00:08:57.370 --> 00:09:00.057 ξέρουμε πώς ακριβώς να το κάνουμε: 6 = 2 x w, 00:09:00.081 --> 00:09:03.393 βασικά διαιρούμε διά 2 και τελειώσαμε. 00:09:04.001 --> 00:09:06.221 Το πρόβλημα είναι αυτή η πράξη. 00:09:06.823 --> 00:09:07.974 Διαίρεση λοιπόν - 00:09:07.998 --> 00:09:11.119 χρησιμοποιήσαμε τη διαίρεση ως το αντίθετο του πολλαπλασιασμού, 00:09:11.143 --> 00:09:12.583 αλλά όπως είπα μόλις, 00:09:12.607 --> 00:09:15.056 ο πολλαπλασιασμός είναι λίγο ψεύτικος. 00:09:15.080 --> 00:09:18.406 Αυτή είναι μια πολύ περίπλοκη, μια εντελώς μη γραμμική λειτουργία, 00:09:18.430 --> 00:09:20.134 δεν έχει αντίθετο. 00:09:20.158 --> 00:09:23.308 Έτσι πρέπει να βρούμε τρόπο να λύσουμε την εξίσωση 00:09:23.332 --> 00:09:25.356 χωρίς το σύμβολο της διαίρεσης. 00:09:25.380 --> 00:09:27.723 Και ο τρόπος να το κάνουμε είναι αρκετά ξεκάθαρος. 00:09:27.747 --> 00:09:30.418 Απλώς λέτε, ας κάνουμε ένα κόλπο της άλγεβρας 00:09:30.442 --> 00:09:33.348 και να μετακινήσουμε το 6 στη δεξιά πλευρά της εξίσωσης. 00:09:33.372 --> 00:09:35.198 Τώρα ακόμα έχουμε τον πολλαπλασιασμό. 00:09:35.675 --> 00:09:39.255 Και αυτό το μηδέν - ας το σκεφτούμε σαν ένα σφάλμα. 00:09:39.279 --> 00:09:41.794 Με άλλα λόγια, αν λύναμε σωστά ως προς w, 00:09:41.818 --> 00:09:43.474 τότε το σφάλμα θα ήταν μηδέν. 00:09:43.498 --> 00:09:45.290 Και αν δεν το κάναμε αρκετά σωστά, 00:09:45.290 --> 00:09:47.249 το σφάλμα θα είναι μεγαλύτερο από μηδέν. NOTE Paragraph 00:09:47.249 --> 00:09:50.599 Έτσι μπορούμε απλώς να μαντέψουμε για να ελαχιστοποιήσουμε το σφάλμα, 00:09:50.623 --> 00:09:53.310 και αυτό το κάνουν καλά οι υπολογιστές. 00:09:53.310 --> 00:09:54.853 Ας κάνουμε μια πρώτη μαντεψιά: 00:09:54.853 --> 00:09:56.009 Τι θα γινόταν αν w = 0; 00:09:56.009 --> 00:09:57.249 Τότε το σφάλμα είναι 6. 00:09:57.249 --> 00:09:58.885 Εάν το w = 1; Το σφάλμα είναι 4. 00:09:58.885 --> 00:10:01.232 Ο υπολογιστής μπορεί δίνοντας διάφορες τιμές 00:10:01.256 --> 00:10:03.623 να περιορίσει το σφάλμα κοντά στο μηδέν. 00:10:03.647 --> 00:10:07.021 Κάνοντάς το αυτό, λαμβάνει διαδοχικές τιμές κοντά στο w. 00:10:07.045 --> 00:10:10.701 Πρακτικά ποτέ δεν το φτάνει αλλά μετά από καμιά δεκαριά δοκιμές 00:10:10.725 --> 00:10:15.569 φτάνουμε στο w = 2.999 που είναι αρκετά κοντά. 00:10:16.302 --> 00:10:18.116 Και αυτή είναι η διαδικασία μάθησης. NOTE Paragraph 00:10:18.140 --> 00:10:20.870 Θυμηθείτε λοιπόν 00:10:20.894 --> 00:10:25.272 ότι εδώ παίρνουμε πολλούς γνωστούς x και γνωστούς y 00:10:25.296 --> 00:10:28.750 και λύνουμε ως προς w μέσω μιας επαναληπτικής μεθόδου. 00:10:28.774 --> 00:10:32.330 Με τον ίδιο ακριβώς τρόπο μαθαίνουμε κι εμείς. 00:10:32.354 --> 00:10:34.584 Ως μωρά έχουμε πάρα πολλές εικόνες 00:10:34.608 --> 00:10:37.241 και μας λένε, «Αυτό είναι πουλί, αυτό δεν είναι πουλί». 00:10:37.714 --> 00:10:39.812 Και με τον καιρό και την επανάληψη 00:10:39.836 --> 00:10:42.764 λύνουμε ως προς w, λύνουμε αυτές τις νευρωνικές συνδέσεις. NOTE Paragraph 00:10:43.460 --> 00:10:47.460 Έτσι τώρα κρατήσαμε τα x και w σταθερά για να λύσουμε ως προς y, 00:10:47.460 --> 00:10:49.457 αυτό είναι καθημερινή, γρήγορη αντίληψη. 00:10:49.457 --> 00:10:51.188 Βρίσκουμε πώς λύνουμε ως προς w, 00:10:51.188 --> 00:10:53.131 είναι μάθηση που είναι πολύ δυσκολότερη, 00:10:53.131 --> 00:10:55.084 ώστε να ελαχιστοποιήσουμε το σφάλμα, 00:10:55.084 --> 00:10:57.031 μέσα από πολλά δοκιμαστικά παραδείγματα. NOTE Paragraph 00:10:57.031 --> 00:11:00.062 Πριν περίπου από έναν χρόνο, ο Άλεξ Μόρντβιντσεφ της ομάδας μας 00:11:00.086 --> 00:11:03.636 αποφάσισε να πειραματιστεί με το τι θα γίνει αν λύσουμε ως προς x, 00:11:03.660 --> 00:11:05.697 με δεδομένους γνωστούς τους w και y. 00:11:06.124 --> 00:11:07.115 Με άλλα λόγια, 00:11:07.115 --> 00:11:08.627 γνωρίζετε ότι είναι ένα πουλί 00:11:08.627 --> 00:11:11.930 και ήδη έχετε ένα νευρωνικό δίκτυο που του έχετε μάθει τα πουλιά, 00:11:11.930 --> 00:11:14.434 αλλά τι είναι η εικόνα ενός πουλιού; 00:11:15.034 --> 00:11:19.842 Αποδεικνύεται τελικά ότι με την ίδια διαδικασία ελαχιστοποίησης σφάλματος 00:11:19.842 --> 00:11:23.562 μπορούμε να το κάνουμε με το δίκτυο που έχει μάθει να αναγνωρίζει τα πουλιά, 00:11:23.562 --> 00:11:26.924 και το αποτέλεσμα φαίνεται να είναι... 00:11:30.400 --> 00:11:32.065 μια εικόνα από πουλιά. 00:11:32.814 --> 00:11:36.145 Αυτή λοιπόν είναι μια εικόνα με πουλιά που φτιάχτηκε εξολοκλήρου 00:11:36.145 --> 00:11:39.051 από νευρωνικό δίκτυο που έμαθε να αναγνωρίζει πουλιά, 00:11:39.051 --> 00:11:41.707 απλώς λύνοντας ως προς x αντί ως προς y, 00:11:41.707 --> 00:11:43.395 και κάνοντάς το επαναληπτικά. NOTE Paragraph 00:11:43.732 --> 00:11:45.579 Να άλλο ένα διασκεδαστικό παράδειγμα. 00:11:45.603 --> 00:11:49.040 Είναι μια δουλειά του Μάικ Τάικα από την ομάδα μας. 00:11:49.064 --> 00:11:51.372 που το λέει «Παρέλαση ζώων». 00:11:51.396 --> 00:11:54.272 Μου θυμίζει λίγο την τεχνοτροπία του Γουίλιαμ Κέντριτζ, 00:11:54.296 --> 00:11:56.785 όπου φτιάχνει σκίτσα, τα σβήνει, 00:11:56.809 --> 00:11:58.269 φτιάχνει σκίτσα, τα σβήνει, 00:11:58.293 --> 00:11:59.691 και έτσι φτιάχνει μια ταινία. 00:11:59.715 --> 00:12:00.866 Σε αυτή την περίπτωση, 00:12:00.866 --> 00:12:03.611 ο Μάικ αντιστοιχεί το y με διάφορα ζώα από μια ομάδα, 00:12:03.611 --> 00:12:06.863 σε ένα δίκτυο που έχει σχεδιαστεί να αναγνωρίζει και να διακρίνει 00:12:06.863 --> 00:12:08.407 διάφορα ζώα μεταξύ τους. 00:12:08.431 --> 00:12:12.182 Και μας βγαίνει μια περίεργη μεταμόρφωση από ένα ζώο σε άλλο. NOTE Paragraph 00:12:14.221 --> 00:12:18.835 Εδώ, αυτός και ο Άλεξ μαζί, προσπάθησαν να μειώσουν τα y 00:12:18.859 --> 00:12:21.612 σε χώρο μόνο δύο διαστάσεων, 00:12:21.612 --> 00:12:24.924 φτιάχνοντας έτσι έναν χάρτη από τον χώρο όλων των πραγμάτων 00:12:24.924 --> 00:12:26.863 που αναγνωρίζονται από αυτό το δίκτυο. 00:12:26.863 --> 00:12:28.794 Φτιάχνοντας αυτό το είδος σύνθεσης 00:12:28.794 --> 00:12:31.276 ή δημιουργία εικόνων σε ολόκληρη αυτή την επιφάνεια, 00:12:31.300 --> 00:12:34.110 αναπτύσσοντας τις τιμές του y, φτιάχνετε ένα είδος χάρτη - 00:12:34.110 --> 00:12:37.621 έναν οπτικό χάρτη όλων των πραγμάτων που το δίκτυο ξέρει να αναγνωρίζει. 00:12:37.621 --> 00:12:40.540 Όλα τα ζώα είναι εδώ - το αρμαντίλο είναι σε αυτή τη θέση. NOTE Paragraph 00:12:40.919 --> 00:12:43.398 Μπορείτε να το κάνετε και με άλλα είδη δικτύων. 00:12:43.422 --> 00:12:46.296 Αυτό είναι ένα δίκτυο σχεδιασμένο να αναγνωρίζει πρόσωπα, 00:12:46.320 --> 00:12:48.320 να διακρίνει πρόσωπα μεταξύ τους. 00:12:48.344 --> 00:12:51.267 Και εδώ βάζουμε ένα y που λέει «εγώ», 00:12:51.267 --> 00:12:53.192 τις παραμέτρους του δικού μου προσώπου. 00:12:53.216 --> 00:12:54.922 Και όταν λύσει ως προς x, 00:12:54.946 --> 00:12:57.564 παράγει αυτή την αλλόκοτη, 00:12:57.588 --> 00:13:02.016 λίγο κυβιστική, σουρεαλιστική, ψυχεδελική εικόνα μου 00:13:02.016 --> 00:13:03.810 από πολλαπλές απόψεις ταυτόχρονα. 00:13:03.810 --> 00:13:06.794 Ο λόγος που μοιάζει σαν να είναι πολλαπλές απόψεις ταυτόχρονα 00:13:06.794 --> 00:13:10.315 είναι επειδή το δίκτυο σχεδιάστηκε να απορρίπτει την αμφισημία 00:13:10.339 --> 00:13:12.815 ενός προσώπου σε μια ή σε άλλη πόζα, 00:13:12.839 --> 00:13:16.215 ή όταν το βλέπουμε κάθε φορά σε διαφορετικό φωτισμό. 00:13:16.239 --> 00:13:18.324 Όταν λοιπόν κάνετε μια τέτοια ανακατασκευή, 00:13:18.348 --> 00:13:20.436 αν δεν χρησιμοποιήσετε ως οδηγό 00:13:20.436 --> 00:13:22.087 μια βασική εικόνα ή στατιστικές, 00:13:22.087 --> 00:13:25.676 τότε θα υπάρξει μια σύγχυση από διαφορετικές απόψεις 00:13:25.700 --> 00:13:27.068 λόγω αμφισημίας. 00:13:27.786 --> 00:13:32.009 Αυτό συμβαίνει αν ο Άλεξ βάλει το δικό του πρόσωπο ως εικόνα-οδηγό 00:13:32.033 --> 00:13:35.354 κατά τη διαδικασία βελτιστοποίησης στην ανακατασκευή του προσώπου μου. 00:13:36.284 --> 00:13:38.612 Βλέπετε λοιπόν ότι δεν είναι τέλειο. 00:13:38.612 --> 00:13:40.486 Χρειάζεται αρκετή δουλειά ακόμη 00:13:40.486 --> 00:13:42.939 στη βελτιστοποίηση της διαδικασίας βελτιστοποίησης. 00:13:42.939 --> 00:13:45.906 Αλλά αρχίζουμε να παίρνουμε κάτι πολύ πιο συναφές ως πρόσωπο, 00:13:45.906 --> 00:13:48.076 που φτιάχνεται με οδηγό το δικό μου πρόσωπο. NOTE Paragraph 00:13:48.892 --> 00:13:51.393 Δεν χρειάζεται να ξεκινήσετε από το μηδέν 00:13:51.417 --> 00:13:52.573 ή από μια αοριστία. 00:13:52.597 --> 00:13:53.901 Όταν λύνετε ως προς x, 00:13:53.925 --> 00:13:57.814 μπορείτε να ξεκινήσετε με ένα x, που είναι ήδη μια άλλη εικόνα το ίδιο. 00:13:57.838 --> 00:14:00.394 Όπως σε αυτή η επίδειξη. 00:14:00.418 --> 00:14:04.364 Αυτό είναι ένα δίκτυο σχεδιασμένο να ταξινομεί 00:14:04.364 --> 00:14:07.683 κάθε είδους διαφορετικά αντικείμενα - ανθρώπινες κατασκευές, ζώα... 00:14:07.707 --> 00:14:10.300 Εδώ αρχίζουμε μόνο με μια εικόνα από σύννεφα, 00:14:10.324 --> 00:14:11.995 και καθώς βελτιστοποιούμε, 00:14:12.019 --> 00:14:16.505 βασικά, αυτό το δίκτυο βρίσκει τι βλέπει μέσα στα σύννεφα. 00:14:16.931 --> 00:14:19.245 Και όσο περισσότερο το κοιτάζετε, 00:14:19.245 --> 00:14:22.178 τόσο περισσότερα πράγματα βρίσκετε κι εσείς μέσα στα σύννεφα. 00:14:23.004 --> 00:14:26.379 Μπορείτε επίσης να βάλετε το δίκτυο με τα πρόσωπα να οραματιστεί εδώ, 00:14:26.403 --> 00:14:28.215 και θα έχετε πολύ τρελά αποτελέσματα. NOTE Paragraph 00:14:28.239 --> 00:14:29.389 (Γέλια) NOTE Paragraph 00:14:30.401 --> 00:14:33.145 Ή ακόμη, ο Μάικ έκανε και άλλα πειράματα 00:14:33.169 --> 00:14:37.074 όπου παίρνει την εικόνα με τα σύννεφα, 00:14:37.098 --> 00:14:40.605 οραματίζεται μορφές, ζουμάρει, οραματίζεται, ζουμάρει. 00:14:40.629 --> 00:14:41.780 Και με αυτό τον τρόπο 00:14:41.804 --> 00:14:45.479 βάζετε το δίκτυο σε μια κατάσταση, θα έλεγα σαν ένα είδος αντίστιξης, 00:14:45.503 --> 00:14:49.183 ένα είδος ελεύθερου συσχετισμού, 00:14:49.207 --> 00:14:51.434 όπου το δίκτυο τρώει την ίδια του την ουρά. 00:14:51.458 --> 00:14:54.879 Έτσι πλέον κάθε εικόνα μας κάνει να σκεφτόμαστε, 00:14:54.903 --> 00:14:56.324 «Τι νομίζω ότι βλέπω μετά; 00:14:56.348 --> 00:14:59.151 Τι νομίζω ότι βλέπω μετά; Τι νομίζω ότι βλέπω μετά;» NOTE Paragraph 00:14:59.487 --> 00:15:02.423 Το παρουσίασα πρώτη φορά δημόσια σε μια ομάδα 00:15:02.447 --> 00:15:07.884 σε ομιλία στο Σιάτλ που λεγόταν «Ανώτερη Εκπαίδευση» - 00:15:07.908 --> 00:15:10.345 αμέσως αφού νομιμοποιήθηκε η μαριχουάνα. NOTE Paragraph 00:15:10.369 --> 00:15:12.784 (Γέλια) NOTE Paragraph 00:15:14.627 --> 00:15:16.731 Θα ήθελα να κλείσω γρήγορα 00:15:16.755 --> 00:15:21.010 με την απλή παρατήρηση ότι αυτή η τεχνολογία δεν περιορίζεται. 00:15:21.034 --> 00:15:24.699 Σας έδειξα μόνο οπτικά παραδείγματα επειδή είναι πιο ευχάριστα. 00:15:24.723 --> 00:15:26.918 Δεν είναι αποκλειστικά οπτική τεχνολογία. 00:15:26.918 --> 00:15:29.281 Ο καλλιτεχνικός συνεργάτης μας, Ρος Γκούντγουιν, 00:15:29.281 --> 00:15:32.886 έχει κάνει πειράματα με μια κάμερα που παίρνει φωτογραφίες, 00:15:32.910 --> 00:15:37.144 και μετά ένας υπολογιστής στο σακίδιό του γράφει ποιήματα μέσα από νευρωνικά δίκτυα, 00:15:37.168 --> 00:15:39.112 με βάση τα περιεχόμενα της εικόνας. 00:15:39.136 --> 00:15:42.083 Αυτό το ποιητικό νευρωνικό δίκτυο έχει εκπαιδευτεί 00:15:42.107 --> 00:15:44.341 με ένα μεγάλο όγκο ποίησης του 20ου αιώνα. 00:15:44.365 --> 00:15:45.864 Και η ποίηση είναι, ξέρετε, 00:15:45.888 --> 00:15:47.802 νομίζω, όχι και τόσο άσχημη, τελικά. NOTE Paragraph 00:15:47.826 --> 00:15:49.210 (Γέλια) NOTE Paragraph 00:15:49.234 --> 00:15:50.393 Κλείνοντας, 00:15:50.417 --> 00:15:52.549 σχετικά με τον Μιχαήλ Άγγελο, 00:15:52.573 --> 00:15:53.807 νομίζω ότι είχε δίκιο. 00:15:53.831 --> 00:15:57.267 Η αντίληψη και η δημιουργικότητα είναι πολύ στενά συνδεδεμένες. 00:15:57.611 --> 00:16:00.245 Μόλις είδαμε νευρωνικά δίκτυα 00:16:00.269 --> 00:16:02.572 που έχουν εκπαιδευτεί εξολοκλήρου να διακρίνουν, 00:16:02.596 --> 00:16:04.978 ή να αναγνωρίζουν διαφορετικά πράγματα στον κόσμο, 00:16:04.978 --> 00:16:08.023 και μπορούν να λειτουργούν αντίστροφα, να δημιουργούν. 00:16:08.047 --> 00:16:10.170 Ένα από τα πράγματα που συμπεραίνω από αυτό 00:16:10.170 --> 00:16:12.252 είναι ότι δεν είδε μόνο ο Μιχαήλ Άγγελος 00:16:12.276 --> 00:16:14.728 το γλυπτό μέσα στον όγκο της πέτρας, 00:16:14.752 --> 00:16:18.390 αλλά ότι κάθε πλάσμα, κάθε ον, κάθε εξωγήινος, 00:16:18.414 --> 00:16:21.895 που μπορεί να επιτελέσει τέτοιου είδους πράξεις αντίληψης, 00:16:21.895 --> 00:16:23.510 μπορεί επίσης να δημιουργήσει 00:16:23.510 --> 00:16:27.038 επειδή ακριβώς ο ίδιος μηχανισμός χρησιμοποιείται και στις δύο περιπτώσεις. NOTE Paragraph 00:16:27.038 --> 00:16:30.368 Επίσης πιστεύω ότι η αντίληψη και η δημιουργικότητα 00:16:30.368 --> 00:16:32.578 επ' ουδενί είναι αποκλειστικά κάτι ανθρώπινο. 00:16:32.578 --> 00:16:36.240 Έχουμε υπολογιστικά μοντέλα που μπορούν να κάνουν ακριβώς το ίδιο. 00:16:36.264 --> 00:16:39.592 Και αυτό δεν πρέπει να μας εκπλήσσει, το μυαλό κάνει υπολογισμούς. NOTE Paragraph 00:16:39.616 --> 00:16:41.273 Και τέλος, 00:16:41.297 --> 00:16:45.965 οι υπολογιστές ξεκίνησαν ως άσκηση στο σχεδιασμό ευφυών μηχανημάτων. 00:16:45.989 --> 00:16:48.451 Σχεδιάστηκε βασικά με την ιδέα 00:16:48.475 --> 00:16:51.488 του πώς μπορούμε να κάνουμε τις μηχανές ευφυείς. 00:16:51.512 --> 00:16:53.674 Και τελικά αρχίζουμε να εκπληρώνουμε 00:16:53.698 --> 00:16:56.104 μερικές από τις υποσχέσεις εκείνων των πρωτοπόρων, 00:16:56.128 --> 00:16:57.841 του Τούρινγκ και του Φον Νόιμαν, 00:16:57.865 --> 00:17:00.130 του ΜακΚάλοκ και του Πιτς. 00:17:00.154 --> 00:17:04.252 Και νομίζω ότι οι υπολογιστές δεν αφορούν μόνο τα λογιστικά, 00:17:04.276 --> 00:17:06.423 ή να παίζουμε Καντι Κρας ή κάτι τέτοιο. 00:17:06.447 --> 00:17:09.025 Εξαρχής τα σχεδιάσαμε κατ' εικόναν του μυαλού μας. 00:17:09.049 --> 00:17:12.318 Και μας δίνουν την ικανότητα να καταλάβουμε το μυαλό μας καλύτερα 00:17:12.342 --> 00:17:13.871 και να τα επεκτείνουμε. NOTE Paragraph 00:17:14.627 --> 00:17:15.794 Σας ευχαριστώ πολύ. NOTE Paragraph 00:17:15.818 --> 00:17:17.467 (Χειροκρότημα)