WEBVTT

00:00:00.800 --> 00:00:03.924
Ηγούμαι μιας ομάδας στην Google
που ερευνά τη μηχανική ευφυΐα.

00:00:03.948 --> 00:00:08.598
Με άλλα λόγια, τον κλάδο της μηχανικής
που κάνει υπολογιστές και συσκευές

00:00:08.622 --> 00:00:11.041
να μπορούν να κάνουν
κάποια απ' όσα κάνει το μυαλό.

00:00:11.439 --> 00:00:14.262
Γι' αυτό ενδιαφερόμαστε
για τους κανονικούς εγκεφάλους

00:00:14.262 --> 00:00:16.101
καθώς και για τη νευροεπιστήμη,

00:00:16.101 --> 00:00:20.047
και ειδικότερα για τα πράγματα 
που κάνει το μυαλό μας

00:00:20.047 --> 00:00:24.089
που ακόμα είναι πολύ ανώτερο
από τις επιδόσεις των υπολογιστών.

NOTE Paragraph

00:00:25.209 --> 00:00:28.818
Ιστορικά, ένα από αυτά που μας ενδιέφεραν
ήταν η αντίληψη,

00:00:28.842 --> 00:00:31.881
η διαδικασία με την οποία
τα πράγματα εκεί έξω στον κόσμο

00:00:31.905 --> 00:00:33.489
-ήχοι και εικόνες-

00:00:33.513 --> 00:00:35.691
μετατρέπονται σε έννοιες μέσα στο μυαλό.

00:00:36.235 --> 00:00:38.752
Αυτό είναι ζωτικό για τον εγκέφαλό μας

00:00:38.776 --> 00:00:41.240
και επίσης είναι πολύ χρήσιμο 
για τον υπολογιστή.

00:00:41.636 --> 00:00:45.286
Για παράδειγμα, οι αλγόριθμοι μηχανικής
αντίληψης που φτιάχνει η ομάδα μας

00:00:45.286 --> 00:00:48.884
κάνουν δυνατή την αναζήτηση
στις φωτογραφίες του Google Photos

00:00:48.884 --> 00:00:50.911
βάσει του τι αυτές περιέχουν.

00:00:51.594 --> 00:00:55.087
Η άλλη πλευρά της αντίληψης 
είναι η δημιουργικότητα:

00:00:55.111 --> 00:00:58.149
το να μεταμορφώνετε μια έννοια
σε κάτι εκεί έξω στον κόσμο.

00:00:58.173 --> 00:01:01.728
Έτσι τον τελευταίο χρόνο,
η εργασία μας πάνω στη μηχανική αντίληψη

00:01:01.752 --> 00:01:06.515
συνδέθηκε απρόσμενα 
και με τον κόσμο της δημιουργικότητας

00:01:06.515 --> 00:01:07.965
και της τέχνης από μηχανές.

NOTE Paragraph

00:01:08.556 --> 00:01:11.930
Νομίζω ότι ο Μιχαήλ Αγγελος
είδε πολύ διορατικά

00:01:11.930 --> 00:01:15.520
αυτή τη δυαδική σχέση
μεταξύ αντίληψης και δημιουργικότητας.

00:01:16.023 --> 00:01:18.029
Ένα φημισμένο απόφθεγμά του λέει:

00:01:18.053 --> 00:01:21.756
«Κάθε κομμάτι πέτρας 
έχει μέσα του ένα άγαλμα

00:01:21.756 --> 00:01:25.178
και είναι δουλειά του γλύπτη
να το αποκαλύψει».

00:01:26.029 --> 00:01:29.245
Νομίζω ότι ο Μιχαήλ Άγγελος εννοεί

00:01:29.269 --> 00:01:32.449
ότι δημιουργούμε μέσα από την αντίληψη,

00:01:32.473 --> 00:01:35.496
και η ίδια η αντίληψη 
είναι μια πράξη φαντασίας

00:01:35.520 --> 00:01:38.081
από την οποία είναι φτιαγμένη
η δημιουργικότητα.

NOTE Paragraph

00:01:38.691 --> 00:01:42.616
Το όργανο που σκέφτεται, 
αντιλαμβάνεται και φαντάζεται

00:01:42.640 --> 00:01:44.228
είναι φυσικά ο εγκέφαλος.

00:01:45.089 --> 00:01:47.634
Θα ήθελα να αρχίσω με λίγη ιστορία

00:01:47.658 --> 00:01:49.960
σχετικά με το τι γνωρίζουμε
για τον εγκέφαλό μας.

00:01:50.406 --> 00:01:53.026
Γιατί διαφορετικά, ας πούμε,
από την καρδιά ή τα έντερα

00:01:53.026 --> 00:01:56.064
δεν μπορείς να πεις πολλά 
για τον εγκέφαλο απλώς κοιτώντας τον

00:01:56.064 --> 00:01:57.676
τουλάχιστον δια γυμνού οφθαλμού.

00:01:57.983 --> 00:02:00.399
Οι πρώτοι ανατόμοι 
που εξέτασαν τον εγκέφαλο

00:02:00.423 --> 00:02:04.230
έδωσαν στις εμφανείς δομές του
κάθε είδους περίεργη ονομασία,

00:02:04.254 --> 00:02:06.687
όπως ιππόκαμπος, ένα είδος μικρής γαρίδας.

00:02:06.711 --> 00:02:09.459
Αλλά φυσικά αυτό δεν μας λέει πάρα πολλά

00:02:09.459 --> 00:02:12.057
σχετικά με το τι πραγματικά
συμβαίνει στο εσωτερικό.

NOTE Paragraph

00:02:12.780 --> 00:02:16.393
Ο πρώτος που πιστεύω ότι κάπως μάντεψε

00:02:16.417 --> 00:02:18.347
τι περίπου συμβαίνει μέσα στον εγκέφαλο

00:02:18.371 --> 00:02:22.291
ήταν ο μεγάλος Ισπανός νευροανατόμος 
Σαντιάγο Ραμόν ι Καχάλ

00:02:22.315 --> 00:02:23.859
τον 19ο αιώνα,

00:02:23.883 --> 00:02:27.638
που χρησιμοποίησε μικροσκόπιο 
και ειδικές χρωστικές

00:02:27.662 --> 00:02:31.832
που μπορούσαν επιλεκτικά να εισχωρήσουν
και να χρωματίσουν με μεγάλη αντίθεση

00:02:31.856 --> 00:02:33.864
τα επιμέρους κελιά του εγκεφάλου,

00:02:33.888 --> 00:02:37.042
ούτως ώστε να αρχίσουμε
να καταλαβαίνουμε τη μορφολογία τους.

00:02:37.972 --> 00:02:42.023
Αυτά είναι τα σκίτσα νευρώνων
που έφτιαξε τον 19ο αιώνα.

NOTE Paragraph

00:02:42.120 --> 00:02:44.004
Αυτό είναι από εγκέφαλο πουλιού.

00:02:44.028 --> 00:02:47.085
Βλέπετε αυτή την απίστευτη ποικιλία
από διάφορα είδη κελιών,

00:02:47.109 --> 00:02:50.544
ακόμα και η ίδια η κυτταρική θεωρία
ήταν αρκετά νέα εκείνον τον καιρό.

00:02:50.568 --> 00:02:51.846
Και αυτές οι δομές,

00:02:51.870 --> 00:02:54.129
τα κελιά που έχουν αυτές τις διακλαδώσεις

00:02:54.129 --> 00:02:56.737
που εκτείνονται σε πολύ μεγάλες αποστάσεις

00:02:56.737 --> 00:02:58.543
ήταν κάτι πολύ νέο εκείνη την εποχή.

00:02:58.779 --> 00:03:01.682
Φυσικά, μας θυμίζουν καλώδια.

00:03:01.706 --> 00:03:05.163
Αυτό θα καταλάβαιναν 
κάποιοι άνθρωποι τον 19ο αιώνα -

00:03:05.187 --> 00:03:09.501
η επανάσταση καλωδίων και ηλεκτρικού
ήταν μόλις στο ξεκίνημά τους.

00:03:09.878 --> 00:03:11.166
Αλλά με διάφορους τρόπους,

00:03:11.166 --> 00:03:14.479
αυτά τα μικροανατομικά σκίτσα 
του Ραμόν ι Καχάλ, όπως αυτό,

00:03:14.503 --> 00:03:16.835
ακόμη παραμένουν αξεπέραστα
με κάποιους τρόπους.

NOTE Paragraph

00:03:16.859 --> 00:03:18.713
Πάνω από έναν αιώνα αργότερα

00:03:18.737 --> 00:03:21.562
προσπαθούμε να τελείωσουμε 
αυτό που άρχισε ο Ραμόν ι Καχάλ.

00:03:21.586 --> 00:03:23.854
Αυτά είναι τα ακατέργαστα δεδομένα

00:03:23.854 --> 00:03:27.625
από τους συνεργάτες μας στο Ινστιτούτο
Νευροεπιστήμης Μαξ Πλανκ.

00:03:27.649 --> 00:03:34.099
Οι συνεργάτες μας απεικόνισαν
μικρά κομμάτια εγκεφαλικού ιστού.

00:03:34.099 --> 00:03:35.904
Το συνολικό δείγμα εδώ

00:03:35.904 --> 00:03:38.164
είναι περίπου
ένα κυβικό χιλιοστό σε μέγεθος,

00:03:38.164 --> 00:03:40.459
κι εδώ σας δείχνω ένα πολύ μικρό κομμάτι.

00:03:40.483 --> 00:03:42.829
Η μπάρα αριστερά 
είναι περίπου ένα μικρόμετρο.

00:03:42.853 --> 00:03:45.262
Οι δομές που βλέπετε είναι μιτοχόνδρια

00:03:45.286 --> 00:03:47.330
που είναι στο μέγεθος βακτηρίων.

00:03:47.354 --> 00:03:48.905
Και αυτές είναι συνεχείς τομές

00:03:48.929 --> 00:03:52.077
αυτού του πολύ μικρού κομματιού ιστού.

00:03:52.101 --> 00:03:54.504
Απλώς για σύγκριση,

00:03:54.528 --> 00:03:58.320
η διάμετρος μιας μέσης τρίχας 
είναι περίπου 100 μικρόμετρα.

00:03:58.344 --> 00:04:00.618
Άρα κοιτάζουμε κάτι πολύ πολύ μικρότερο

00:04:00.642 --> 00:04:02.040
από μια τρίχα μαλλιών.

NOTE Paragraph

00:04:02.064 --> 00:04:06.095
Και από αυτές τις συνεχείς τομές
από ηλεκτρονικό μικροσκόπιο

00:04:06.119 --> 00:04:11.127
κάποιος μπορεί να φτιάξει τρισδιάστατα
νευρώνες που μοιάζουν έτσι.

00:04:11.151 --> 00:04:14.308
Έτσι είναι κάπως το ίδιο στυλ
με αυτές του Ραμόν ι Καχάλ.

00:04:14.332 --> 00:04:15.824
Μόνο λίγοι νευρώνες άναψαν,

00:04:15.848 --> 00:04:18.629
γιατί αλλιώς δεν θα μπορούσαμε 
να δούμε τίποτα εδώ.

00:04:18.653 --> 00:04:19.965
Θα ήταν τόσο πυκνό,

00:04:19.989 --> 00:04:21.319
τόσο γεμάτο με δομές,

00:04:21.343 --> 00:04:24.387
με καλώδια που συνδέουν 
τους νευρώνες μεταξύ τους.

NOTE Paragraph

00:04:25.293 --> 00:04:28.097
Έτσι ο Ραμόν ι Καχάλ ήταν λίγο 
μπροστά από την εποχή του

00:04:28.121 --> 00:04:30.676
και η πρόοδος 
για την κατανόηση του εγκεφάλου

00:04:30.700 --> 00:04:32.971
προχώρησε αργά 
τις επόμενες λίγες δεκαετίες.

00:04:33.455 --> 00:04:36.308
Γνωρίζαμε όμως ότι οι νευρώνες 
χρησιμοποιούν ηλεκτρισμό

00:04:36.332 --> 00:04:39.232
και μέχρι τον Β΄ Παγκόσμιο Πόλεμο
είχαμε κάνει αρκετή πρόοδο

00:04:39.232 --> 00:04:42.218
ώστε να κάνουμε ηλεκτρικά πειράματα
σε νευρώνες υπό λειτουργία

00:04:42.218 --> 00:04:44.348
ώστε να καταλάβουμε καλύτερα
πώς δούλευαν.

00:04:44.631 --> 00:04:48.987
Τότε ακριβώς εφευρέθηκαν οι υπολογιστές

00:04:49.011 --> 00:04:52.111
και βασίστηκαν κατά πολύ 
στη δομή του εγκεφάλου -

00:04:52.135 --> 00:04:55.220
του «ευφυούς μηχανισμού»,
όπως τα αποκαλούσε ο Άλαν Τιούρινγκ,

00:04:55.244 --> 00:04:57.235
ο πατέρας της επιστήμης των υπολογιστών.

NOTE Paragraph

00:04:57.923 --> 00:05:00.259
Οι Γουόρεν ΜακΚάλοκ και Γουόλτερ Πιτς

00:05:00.259 --> 00:05:03.896
είδαν τα σκίτσα του Ραμόν ι Καχάλ
από τον φλοιό του εγκεφάλου

00:05:03.920 --> 00:05:05.482
που σας δείχνω εδώ.

00:05:05.506 --> 00:05:09.948
Αυτός είναι ο φλοιός που επεξεργάζεται
εικόνες που φτάνουν από το μάτι.

00:05:10.424 --> 00:05:13.932
Και τους φάνηκε σαν διάγραμμα κυκλώματος.

00:05:14.353 --> 00:05:18.102
Υπάρχουν πολλές λεπτομέρειες
στο διάγραμμα των ΜακΚάλοκ και Πιτς

00:05:18.102 --> 00:05:19.564
που δεν είναι ακριβώς σωστές.

00:05:19.588 --> 00:05:20.823
Αλλά αυτή η βασική ιδέα

00:05:20.847 --> 00:05:24.839
ότι ο εγκεφαλικός ιστός λειτουργεί
σαν μια σειρά από υπολογιστικά στοιχεία

00:05:24.863 --> 00:05:27.609
που μεταβιβάζουν πληροφορίες
συνεχώς ο ένας στον άλλον

00:05:27.633 --> 00:05:29.235
είναι κατά βάσην σωστή.

NOTE Paragraph

00:05:29.259 --> 00:05:31.609
Ας μιλήσουμε για μια στιγμή

00:05:31.633 --> 00:05:35.665
τι θα πρέπει να κάνει ένα μοντέλο
επεξεργασίας οπτικών πληροφοριών.

00:05:36.228 --> 00:05:38.969
Το βασικό έργο της αντίληψης

00:05:38.993 --> 00:05:43.187
είναι να πάρει μια τέτοια φωτογραφία
και να πει,

00:05:43.211 --> 00:05:44.387
«Αυτό είναι ένα πουλί»,

00:05:44.411 --> 00:05:47.285
που είναι κάτι πολύ απλό 
να κάνουμε με τον εγκέφαλό μας.

00:05:47.309 --> 00:05:50.730
Αλλά πρέπει να καταλάβετε
ότι για έναν υπολογιστή,

00:05:50.754 --> 00:05:53.841
αυτό ήταν μάλλον αδύνατον
πριν από λίγα χρόνια.

00:05:53.865 --> 00:05:55.781
Η κλασική δομή του υπολογιστή

00:05:55.805 --> 00:05:58.582
δεν ευνοεί αυτή τη δουλειά.

NOTE Paragraph

00:05:59.366 --> 00:06:01.918
Έτσι λοιπόν, 
αυτό που συμβαίνει με τα πίξελ,

00:06:01.942 --> 00:06:05.924
ανάμεσα στην εικόνα του πουλιού
και τη λέξη «πουλί»,

00:06:05.924 --> 00:06:07.822
αφορά ουσιαστικά μια ομάδα νευρώνων

00:06:07.822 --> 00:06:09.987
που αλληλοσυνδέονται
σε ένα νευρωνικό δίκτυο,

00:06:09.987 --> 00:06:11.198
όπως στο διάγραμμα.

00:06:11.198 --> 00:06:14.580
Μπορεί να είναι βιολογικό νευρωνικό δίκτυο
μέσα στον εγκεφαλικό φλοιό,

00:06:14.580 --> 00:06:17.046
ή, στις μέρες μας,
αρχίζουμε να έχουμε την ικανότητα

00:06:17.046 --> 00:06:19.544
να μοντελοποιήσουμε
τέτοια δίκτυα στον υπολογιστή.

00:06:19.834 --> 00:06:22.187
Θα σας δείξω πώς μοιάζουν αυτά τα δίκτυα.

NOTE Paragraph

00:06:22.211 --> 00:06:25.627
Μπορείτε να σκεφτείτε τα πίξελ
ως το πρώτο επίπεδο νευρώνων,

00:06:25.651 --> 00:06:27.754
και βασικά έτσι λειτουργεί το μάτι -

00:06:27.754 --> 00:06:29.727
είναι οι νευρώνες στον αμφιβληστροειδή.

00:06:29.727 --> 00:06:31.801
Και αυτοί μεταδίδουν την πληροφορία

00:06:31.801 --> 00:06:34.528
σε αλλεπάλληλα επίπεδα νευρώνων,

00:06:34.552 --> 00:06:37.265
που όλα συνδέονται 
από συνάψεις διαφορετικών βαρών.

00:06:37.609 --> 00:06:39.144
Η συμπεριφορά αυτού του δικτύου

00:06:39.144 --> 00:06:42.226
χαρακτηρίζεται από τις δυνάμεις 
όλων αυτών των συνάψεων.

00:06:42.226 --> 00:06:45.564
Αυτές χαρακτηρίζουν τις υπολογιστικές
ιδιότητες αυτού του δικτύου.

00:06:45.588 --> 00:06:47.058
Και στη λήξη της διαδικασίας,

00:06:47.082 --> 00:06:49.529
έχετε έναν νευρώνα 
ή μια μικρή ομάδα νευρώνων

00:06:49.553 --> 00:06:51.280
που θα ανάψει και θα πει «πουλί».

NOTE Paragraph

00:06:51.824 --> 00:06:54.956
Τώρα θα αναπαραστήσω 
αυτά τα τρία πράγματα -

00:06:54.980 --> 00:06:59.676
τα πίξελ τροφοδοσίας 
και τις συνάψεις στο νευρωνικό δίκτυο,

00:06:59.700 --> 00:07:01.285
και το πουλί, το εξαγόμενο -

00:07:01.309 --> 00:07:04.366
με τρεις μεταβλητές: x, w και y

00:07:04.523 --> 00:07:06.664
Μπορεί να υπάρχουν
περίπου ένα εκατομμύριο x -

00:07:06.688 --> 00:07:08.641
ένα εκατομμύριο πίξελ σε αυτή την εικόνα.

00:07:08.665 --> 00:07:11.111
Υπάρχουν δισεκατομμύρια 
ή τρισεκατομμύρια w,

00:07:11.135 --> 00:07:14.520
που αντιπροσωπεύουν τα βάρη
όλων των συνάψεων του νευρωνικού δικτύου.

00:07:14.520 --> 00:07:16.805
Και μπορεί να υπάρχει 
ένα μικρός αριθμός από y,

00:07:16.805 --> 00:07:18.337
από εξαγόμενα του δικτύου.

00:07:18.361 --> 00:07:20.470
Το «πουλί» είναι
μόνο πέντε γράμματα, σωστά;

00:07:21.088 --> 00:07:24.514
Ας υποθέσουμε ότι αυτός είναι 
ένας πολύ απλός μαθηματικός τύπος,

00:07:24.538 --> 00:07:26.701
x "x" w = y.

00:07:26.725 --> 00:07:28.761
Βάζω τις φορές σε εισαγωγικά

00:07:28.785 --> 00:07:31.065
επειδή αυτό που φυσικά συμβαίνει εκεί μέσα

00:07:31.089 --> 00:07:34.305
είναι μια σειρά από πολύπλοκες 
μαθηματικές λειτουργίες.

NOTE Paragraph

00:07:35.172 --> 00:07:36.393
Αυτή είναι μια εξίσωση.

00:07:36.417 --> 00:07:38.089
Υπάρχουν τρεις μεταβλητές.

00:07:38.113 --> 00:07:40.839
Και όλοι γνωρίζουμε ότι σε μια εξίσωση

00:07:40.863 --> 00:07:44.505
μπορείς να λύσεις ως προς τον έναν άγνωστο
εάν γνωρίζεις τους άλλους δύο.

00:07:45.158 --> 00:07:48.122
Έτσι το πρόβλημα της συνεπαγωγής,

00:07:48.122 --> 00:07:51.435
δηλαδή του να συμπεράνουμε 
ότι πρόκειται για φωτογραφία πουλιού,

00:07:51.459 --> 00:07:52.733
είναι το εξής:

00:07:52.757 --> 00:07:56.150
είναι που ο άγνωστος είναι ο y
και οι w και x είναι γνωστοί.

00:07:56.150 --> 00:07:58.769
Γνωρίζετε τα νευρωνικά δίκτυα,
γνωρίζετε και τα πίξελ.

00:07:58.769 --> 00:08:02.050
Όπως βλέπετε είναι 
ένα σχετικά ξεκάθαρο πρόβλημα.

00:08:02.074 --> 00:08:04.260
Πολλαπλασιάζετε το 2 επί 3 και τελειώσατε.

00:08:04.862 --> 00:08:06.985
Θα σας δείξω ένα τεχνητό νευρωνικό δίκτυο

00:08:07.009 --> 00:08:09.305
που φτιάξαμε πρόσφατα, 
να κάνει ακριβώς αυτό.

NOTE Paragraph

00:08:09.634 --> 00:08:12.494
Δουλεύει σε πραγματικό χρόνο 
σε κινητό τηλέφωνο,

00:08:12.518 --> 00:08:15.831
και αυτό από μόνο του
είναι αξιοθαύμαστο γεγονός,

00:08:15.855 --> 00:08:19.323
τα κινητά μπορούν να κάνουν δισεκατομμύρια
και τρισεκατομμύρια λειτουργίες

00:08:19.347 --> 00:08:20.595
ανά δευτερόλεπτο.

00:08:20.619 --> 00:08:22.234
Αυτό που βλέπετε είναι ένα κινητό

00:08:22.258 --> 00:08:25.805
που κοιτάζει αλλεπάλληλες 
φωτογραφίες από πουλιά,

00:08:25.829 --> 00:08:28.544
και όχι μόνο λέει, «Ναι, είναι πουλί»

00:08:28.568 --> 00:08:31.979
αλλά αναγνωρίζει το είδος του πουλιού
με ένα τέτοιο νευρωνικό δίκτυο.

00:08:32.890 --> 00:08:34.716
Έτσι σε αυτή την φωτογραφία,

00:08:34.740 --> 00:08:38.542
οι x και w είναι γνωστοί
και ο y είναι ο άγνωστος.

00:08:38.566 --> 00:08:41.404
Φυσικά δεν μπαίνω σε λεπτομέρειες
για το πολύ δύσκολο μέρος,

00:08:41.404 --> 00:08:44.959
το πώς στο καλό υπολογίσαμε το w,

00:08:44.983 --> 00:08:47.154
τον εγκέφαλο που μπορεί 
να κάνει κάτι τέτοιο;

00:08:47.154 --> 00:08:49.238
Πώς μπορεί να μάθαμε ένα τέτοιο μοντέλο;

NOTE Paragraph

00:08:49.418 --> 00:08:52.651
Αυτή λοιπόν η διαδικασία μάθησης,
να λύνουμε ως προς w,

00:08:52.675 --> 00:08:55.322
αν το κάναμε με την απλή εξίσωση

00:08:55.346 --> 00:08:57.346
στην οποία τα βλέπουμε αυτά ως αριθμούς,

00:08:57.370 --> 00:09:00.057
ξέρουμε πώς ακριβώς να το κάνουμε:
6 = 2 x w,

00:09:00.081 --> 00:09:03.393
βασικά διαιρούμε διά 2 και τελειώσαμε.

00:09:04.001 --> 00:09:06.221
Το πρόβλημα είναι αυτή η πράξη.

00:09:06.823 --> 00:09:07.974
Διαίρεση λοιπόν -

00:09:07.998 --> 00:09:11.119
χρησιμοποιήσαμε τη διαίρεση
ως το αντίθετο του πολλαπλασιασμού,

00:09:11.143 --> 00:09:12.583
αλλά όπως είπα μόλις,

00:09:12.607 --> 00:09:15.056
ο πολλαπλασιασμός είναι λίγο ψεύτικος.

00:09:15.080 --> 00:09:18.406
Αυτή είναι μια πολύ περίπλοκη,
μια εντελώς μη γραμμική λειτουργία,

00:09:18.430 --> 00:09:20.134
δεν έχει αντίθετο.

00:09:20.158 --> 00:09:23.308
Έτσι πρέπει να βρούμε τρόπο
να λύσουμε την εξίσωση

00:09:23.332 --> 00:09:25.356
χωρίς το σύμβολο της διαίρεσης.

00:09:25.380 --> 00:09:27.723
Και ο τρόπος να το κάνουμε
είναι αρκετά ξεκάθαρος.

00:09:27.747 --> 00:09:30.418
Απλώς λέτε, ας κάνουμε 
ένα κόλπο της άλγεβρας

00:09:30.442 --> 00:09:33.348
και να μετακινήσουμε το 6
στη δεξιά πλευρά της εξίσωσης.

00:09:33.372 --> 00:09:35.198
Τώρα ακόμα έχουμε τον πολλαπλασιασμό.

00:09:35.675 --> 00:09:39.255
Και αυτό το μηδέν -
ας το σκεφτούμε σαν ένα σφάλμα.

00:09:39.279 --> 00:09:41.794
Με άλλα λόγια, 
αν λύναμε σωστά ως προς w,

00:09:41.818 --> 00:09:43.474
τότε το σφάλμα θα ήταν μηδέν.

00:09:43.498 --> 00:09:45.290
Και αν δεν το κάναμε αρκετά σωστά,

00:09:45.290 --> 00:09:47.249
το σφάλμα θα είναι μεγαλύτερο από μηδέν.

NOTE Paragraph

00:09:47.249 --> 00:09:50.599
Έτσι μπορούμε απλώς να μαντέψουμε
για να ελαχιστοποιήσουμε το σφάλμα,

00:09:50.623 --> 00:09:53.310
και αυτό το κάνουν καλά οι υπολογιστές.

00:09:53.310 --> 00:09:54.853
Ας κάνουμε μια πρώτη μαντεψιά:

00:09:54.853 --> 00:09:56.009
Τι θα γινόταν αν w = 0;

00:09:56.009 --> 00:09:57.249
Τότε το σφάλμα είναι 6.

00:09:57.249 --> 00:09:58.885
Εάν το w = 1; Το σφάλμα είναι 4.

00:09:58.885 --> 00:10:01.232
Ο υπολογιστής μπορεί
δίνοντας διάφορες τιμές

00:10:01.256 --> 00:10:03.623
να περιορίσει το σφάλμα κοντά στο μηδέν.

00:10:03.647 --> 00:10:07.021
Κάνοντάς το αυτό, 
λαμβάνει διαδοχικές τιμές κοντά στο w.

00:10:07.045 --> 00:10:10.701
Πρακτικά ποτέ δεν το φτάνει
αλλά μετά από καμιά δεκαριά δοκιμές

00:10:10.725 --> 00:10:15.569
φτάνουμε στο w = 2.999 
που είναι αρκετά κοντά.

00:10:16.302 --> 00:10:18.116
Και αυτή είναι η διαδικασία μάθησης.

NOTE Paragraph

00:10:18.140 --> 00:10:20.870
Θυμηθείτε λοιπόν

00:10:20.894 --> 00:10:25.272
ότι εδώ παίρνουμε πολλούς γνωστούς x
και γνωστούς y

00:10:25.296 --> 00:10:28.750
και λύνουμε ως προς w 
μέσω μιας επαναληπτικής μεθόδου.

00:10:28.774 --> 00:10:32.330
Με τον ίδιο ακριβώς τρόπο 
μαθαίνουμε κι εμείς.

00:10:32.354 --> 00:10:34.584
Ως μωρά έχουμε πάρα πολλές εικόνες

00:10:34.608 --> 00:10:37.241
και μας λένε, «Αυτό είναι πουλί,
αυτό δεν είναι πουλί».

00:10:37.714 --> 00:10:39.812
Και με τον καιρό και την επανάληψη

00:10:39.836 --> 00:10:42.764
λύνουμε ως προς w, 
λύνουμε αυτές τις νευρωνικές συνδέσεις.

NOTE Paragraph

00:10:43.460 --> 00:10:47.460
Έτσι τώρα κρατήσαμε τα x και w σταθερά
για να λύσουμε ως προς y,

00:10:47.460 --> 00:10:49.457
αυτό είναι καθημερινή, γρήγορη αντίληψη.

00:10:49.457 --> 00:10:51.188
Βρίσκουμε πώς λύνουμε ως προς w,

00:10:51.188 --> 00:10:53.131
είναι μάθηση που είναι πολύ δυσκολότερη,

00:10:53.131 --> 00:10:55.084
ώστε να ελαχιστοποιήσουμε το σφάλμα,

00:10:55.084 --> 00:10:57.031
μέσα από πολλά δοκιμαστικά παραδείγματα.

NOTE Paragraph

00:10:57.031 --> 00:11:00.062
Πριν περίπου από έναν χρόνο,
ο Άλεξ Μόρντβιντσεφ της ομάδας μας

00:11:00.086 --> 00:11:03.636
αποφάσισε να πειραματιστεί
με το τι θα γίνει αν λύσουμε ως προς x,

00:11:03.660 --> 00:11:05.697
με δεδομένους γνωστούς τους w και y.

00:11:06.124 --> 00:11:07.115
Με άλλα λόγια,

00:11:07.115 --> 00:11:08.627
γνωρίζετε ότι είναι ένα πουλί

00:11:08.627 --> 00:11:11.930
και ήδη έχετε ένα νευρωνικό δίκτυο 
που του έχετε μάθει τα πουλιά,

00:11:11.930 --> 00:11:14.434
αλλά τι είναι η εικόνα ενός πουλιού;

00:11:15.034 --> 00:11:19.842
Αποδεικνύεται τελικά ότι με την ίδια
διαδικασία ελαχιστοποίησης σφάλματος

00:11:19.842 --> 00:11:23.562
μπορούμε να το κάνουμε με το δίκτυο 
που έχει μάθει να αναγνωρίζει τα πουλιά,

00:11:23.562 --> 00:11:26.924
και το αποτέλεσμα φαίνεται να είναι...

00:11:30.400 --> 00:11:32.065
μια εικόνα από πουλιά.

00:11:32.814 --> 00:11:36.145
Αυτή λοιπόν είναι μια εικόνα με πουλιά
που φτιάχτηκε εξολοκλήρου

00:11:36.145 --> 00:11:39.051
από νευρωνικό δίκτυο 
που έμαθε να αναγνωρίζει πουλιά,

00:11:39.051 --> 00:11:41.707
απλώς λύνοντας ως προς x
αντί ως προς y,

00:11:41.707 --> 00:11:43.395
και κάνοντάς το επαναληπτικά.

NOTE Paragraph

00:11:43.732 --> 00:11:45.579
Να άλλο ένα διασκεδαστικό παράδειγμα.

00:11:45.603 --> 00:11:49.040
Είναι μια δουλειά του Μάικ Τάικα 
από την ομάδα μας.

00:11:49.064 --> 00:11:51.372
που το λέει «Παρέλαση ζώων».

00:11:51.396 --> 00:11:54.272
Μου θυμίζει λίγο την τεχνοτροπία
του Γουίλιαμ Κέντριτζ,

00:11:54.296 --> 00:11:56.785
όπου φτιάχνει σκίτσα, τα σβήνει,

00:11:56.809 --> 00:11:58.269
φτιάχνει σκίτσα, τα σβήνει,

00:11:58.293 --> 00:11:59.691
και έτσι φτιάχνει μια ταινία.

00:11:59.715 --> 00:12:00.866
Σε αυτή την περίπτωση,

00:12:00.866 --> 00:12:03.611
ο Μάικ αντιστοιχεί το y
με διάφορα ζώα από μια ομάδα,

00:12:03.611 --> 00:12:06.863
σε ένα δίκτυο που έχει σχεδιαστεί
να αναγνωρίζει και να διακρίνει

00:12:06.863 --> 00:12:08.407
διάφορα ζώα μεταξύ τους.

00:12:08.431 --> 00:12:12.182
Και μας βγαίνει μια περίεργη μεταμόρφωση 
από ένα ζώο σε άλλο.

NOTE Paragraph

00:12:14.221 --> 00:12:18.835
Εδώ, αυτός και ο Άλεξ μαζί, 
προσπάθησαν να μειώσουν τα y

00:12:18.859 --> 00:12:21.612
σε χώρο μόνο δύο διαστάσεων,

00:12:21.612 --> 00:12:24.924
φτιάχνοντας έτσι έναν χάρτη 
από τον χώρο όλων των πραγμάτων

00:12:24.924 --> 00:12:26.863
που αναγνωρίζονται από αυτό το δίκτυο.

00:12:26.863 --> 00:12:28.794
Φτιάχνοντας αυτό το είδος σύνθεσης

00:12:28.794 --> 00:12:31.276
ή δημιουργία εικόνων
σε ολόκληρη αυτή την επιφάνεια,

00:12:31.300 --> 00:12:34.110
αναπτύσσοντας τις τιμές του y,
φτιάχνετε ένα είδος χάρτη -

00:12:34.110 --> 00:12:37.621
έναν οπτικό χάρτη όλων των πραγμάτων 
που το δίκτυο ξέρει να αναγνωρίζει.

00:12:37.621 --> 00:12:40.540
Όλα τα ζώα είναι εδώ -
το αρμαντίλο είναι σε αυτή τη θέση.

NOTE Paragraph

00:12:40.919 --> 00:12:43.398
Μπορείτε να το κάνετε 
και με άλλα είδη δικτύων.

00:12:43.422 --> 00:12:46.296
Αυτό είναι ένα δίκτυο 
σχεδιασμένο να αναγνωρίζει πρόσωπα,

00:12:46.320 --> 00:12:48.320
να διακρίνει πρόσωπα μεταξύ τους.

00:12:48.344 --> 00:12:51.267
Και εδώ βάζουμε ένα y που λέει «εγώ»,

00:12:51.267 --> 00:12:53.192
τις παραμέτρους του δικού μου προσώπου.

00:12:53.216 --> 00:12:54.922
Και όταν λύσει ως προς x,

00:12:54.946 --> 00:12:57.564
παράγει αυτή την αλλόκοτη,

00:12:57.588 --> 00:13:02.016
λίγο κυβιστική, σουρεαλιστική,
ψυχεδελική εικόνα μου

00:13:02.016 --> 00:13:03.810
από πολλαπλές απόψεις ταυτόχρονα.

00:13:03.810 --> 00:13:06.794
Ο λόγος που μοιάζει σαν να είναι
πολλαπλές απόψεις ταυτόχρονα

00:13:06.794 --> 00:13:10.315
είναι επειδή το δίκτυο σχεδιάστηκε 
να απορρίπτει την αμφισημία

00:13:10.339 --> 00:13:12.815
ενός προσώπου σε μια ή σε άλλη πόζα,

00:13:12.839 --> 00:13:16.215
ή όταν το βλέπουμε κάθε φορά
σε διαφορετικό φωτισμό.


00:13:16.239 --> 00:13:18.324
Όταν λοιπόν κάνετε
μια τέτοια ανακατασκευή,

00:13:18.348 --> 00:13:20.436
αν δεν χρησιμοποιήσετε ως οδηγό

00:13:20.436 --> 00:13:22.087
μια βασική εικόνα ή στατιστικές,

00:13:22.087 --> 00:13:25.676
τότε θα υπάρξει μια σύγχυση 
από διαφορετικές απόψεις

00:13:25.700 --> 00:13:27.068
λόγω αμφισημίας.

00:13:27.786 --> 00:13:32.009
Αυτό συμβαίνει αν ο Άλεξ βάλει 
το δικό του πρόσωπο ως εικόνα-οδηγό

00:13:32.033 --> 00:13:35.354
κατά τη διαδικασία βελτιστοποίησης
στην ανακατασκευή του προσώπου μου.

00:13:36.284 --> 00:13:38.612
Βλέπετε λοιπόν ότι δεν είναι τέλειο.

00:13:38.612 --> 00:13:40.486
Χρειάζεται αρκετή δουλειά ακόμη

00:13:40.486 --> 00:13:42.939
στη βελτιστοποίηση
της διαδικασίας βελτιστοποίησης.

00:13:42.939 --> 00:13:45.906
Αλλά αρχίζουμε να παίρνουμε κάτι
πολύ πιο συναφές ως πρόσωπο,

00:13:45.906 --> 00:13:48.076
που φτιάχνεται με οδηγό 
το δικό μου πρόσωπο.

NOTE Paragraph

00:13:48.892 --> 00:13:51.393
Δεν χρειάζεται να ξεκινήσετε από το μηδέν

00:13:51.417 --> 00:13:52.573
ή από μια αοριστία.

00:13:52.597 --> 00:13:53.901
Όταν λύνετε ως προς x,

00:13:53.925 --> 00:13:57.814
μπορείτε να ξεκινήσετε με ένα x,
που είναι ήδη μια άλλη εικόνα το ίδιο.

00:13:57.838 --> 00:14:00.394
Όπως σε αυτή η επίδειξη.

00:14:00.418 --> 00:14:04.364
Αυτό είναι ένα δίκτυο
σχεδιασμένο να ταξινομεί

00:14:04.364 --> 00:14:07.683
κάθε είδους διαφορετικά αντικείμενα -
ανθρώπινες κατασκευές, ζώα...

00:14:07.707 --> 00:14:10.300
Εδώ αρχίζουμε μόνο 
με μια εικόνα από σύννεφα,

00:14:10.324 --> 00:14:11.995
και καθώς βελτιστοποιούμε,

00:14:12.019 --> 00:14:16.505
βασικά, αυτό το δίκτυο βρίσκει 
τι βλέπει μέσα στα σύννεφα.

00:14:16.931 --> 00:14:19.245
Και όσο περισσότερο το κοιτάζετε,

00:14:19.245 --> 00:14:22.178
τόσο περισσότερα πράγματα 
βρίσκετε κι εσείς μέσα στα σύννεφα.

00:14:23.004 --> 00:14:26.379
Μπορείτε επίσης να βάλετε το δίκτυο 
με τα πρόσωπα να οραματιστεί εδώ,

00:14:26.403 --> 00:14:28.215
και θα έχετε πολύ τρελά αποτελέσματα.

NOTE Paragraph

00:14:28.239 --> 00:14:29.389
(Γέλια)

NOTE Paragraph

00:14:30.401 --> 00:14:33.145
Ή ακόμη, ο Μάικ έκανε και άλλα πειράματα

00:14:33.169 --> 00:14:37.074
όπου παίρνει την εικόνα με τα σύννεφα,

00:14:37.098 --> 00:14:40.605
οραματίζεται μορφές, ζουμάρει,
οραματίζεται, ζουμάρει.

00:14:40.629 --> 00:14:41.780
Και με αυτό τον τρόπο

00:14:41.804 --> 00:14:45.479
βάζετε το δίκτυο σε μια κατάσταση,
θα έλεγα σαν ένα είδος αντίστιξης,

00:14:45.503 --> 00:14:49.183
ένα είδος ελεύθερου συσχετισμού,

00:14:49.207 --> 00:14:51.434
όπου το δίκτυο
τρώει την ίδια του την ουρά.

00:14:51.458 --> 00:14:54.879
Έτσι πλέον κάθε εικόνα
μας κάνει να σκεφτόμαστε,

00:14:54.903 --> 00:14:56.324
«Τι νομίζω ότι βλέπω μετά;

00:14:56.348 --> 00:14:59.151
Τι νομίζω ότι βλέπω μετά;
Τι νομίζω ότι βλέπω μετά;»

NOTE Paragraph

00:14:59.487 --> 00:15:02.423
Το παρουσίασα πρώτη φορά 
δημόσια σε μια ομάδα

00:15:02.447 --> 00:15:07.884
σε ομιλία στο Σιάτλ
που λεγόταν «Ανώτερη Εκπαίδευση» -

00:15:07.908 --> 00:15:10.345
αμέσως αφού νομιμοποιήθηκε η μαριχουάνα.

NOTE Paragraph

00:15:10.369 --> 00:15:12.784
(Γέλια)

NOTE Paragraph

00:15:14.627 --> 00:15:16.731
Θα ήθελα να κλείσω γρήγορα

00:15:16.755 --> 00:15:21.010
με την απλή παρατήρηση 
ότι αυτή η τεχνολογία δεν περιορίζεται.

00:15:21.034 --> 00:15:24.699
Σας έδειξα μόνο οπτικά παραδείγματα
επειδή είναι πιο ευχάριστα.

00:15:24.723 --> 00:15:26.918
Δεν είναι αποκλειστικά οπτική τεχνολογία.

00:15:26.918 --> 00:15:29.281
Ο καλλιτεχνικός συνεργάτης μας, 
Ρος Γκούντγουιν,

00:15:29.281 --> 00:15:32.886
έχει κάνει πειράματα 
με μια κάμερα που παίρνει φωτογραφίες,

00:15:32.910 --> 00:15:37.144
και μετά ένας υπολογιστής στο σακίδιό του
γράφει ποιήματα μέσα από νευρωνικά δίκτυα,

00:15:37.168 --> 00:15:39.112
με βάση τα περιεχόμενα της εικόνας.

00:15:39.136 --> 00:15:42.083
Αυτό το ποιητικό νευρωνικό δίκτυο 
έχει εκπαιδευτεί

00:15:42.107 --> 00:15:44.341
με ένα μεγάλο όγκο ποίησης του 20ου αιώνα.

00:15:44.365 --> 00:15:45.864
Και η ποίηση είναι, ξέρετε,

00:15:45.888 --> 00:15:47.802
νομίζω, όχι και τόσο άσχημη, τελικά.

NOTE Paragraph

00:15:47.826 --> 00:15:49.210
(Γέλια)

NOTE Paragraph

00:15:49.234 --> 00:15:50.393
Κλείνοντας,

00:15:50.417 --> 00:15:52.549
σχετικά με τον Μιχαήλ Άγγελο,

00:15:52.573 --> 00:15:53.807
νομίζω ότι είχε δίκιο.

00:15:53.831 --> 00:15:57.267
Η αντίληψη και η δημιουργικότητα 
είναι πολύ στενά συνδεδεμένες.

00:15:57.611 --> 00:16:00.245
Μόλις είδαμε νευρωνικά δίκτυα

00:16:00.269 --> 00:16:02.572
που έχουν εκπαιδευτεί εξολοκλήρου
να διακρίνουν,

00:16:02.596 --> 00:16:04.978
ή να αναγνωρίζουν 
διαφορετικά πράγματα στον κόσμο,

00:16:04.978 --> 00:16:08.023
και μπορούν να λειτουργούν αντίστροφα,
να δημιουργούν.

00:16:08.047 --> 00:16:10.170
Ένα από τα πράγματα
που συμπεραίνω από αυτό

00:16:10.170 --> 00:16:12.252
είναι ότι δεν είδε μόνο ο Μιχαήλ Άγγελος

00:16:12.276 --> 00:16:14.728
το γλυπτό μέσα στον όγκο της πέτρας,

00:16:14.752 --> 00:16:18.390
αλλά ότι κάθε πλάσμα, κάθε ον,
κάθε εξωγήινος,

00:16:18.414 --> 00:16:21.895
που μπορεί να επιτελέσει
τέτοιου είδους πράξεις αντίληψης,

00:16:21.895 --> 00:16:23.510
μπορεί επίσης να δημιουργήσει

00:16:23.510 --> 00:16:27.038
επειδή ακριβώς ο ίδιος μηχανισμός
χρησιμοποιείται και στις δύο περιπτώσεις.

NOTE Paragraph

00:16:27.038 --> 00:16:30.368
Επίσης πιστεύω ότι η αντίληψη 
και η δημιουργικότητα

00:16:30.368 --> 00:16:32.578
επ' ουδενί είναι
αποκλειστικά κάτι ανθρώπινο.

00:16:32.578 --> 00:16:36.240
Έχουμε υπολογιστικά μοντέλα 
που μπορούν να κάνουν ακριβώς το ίδιο.

00:16:36.264 --> 00:16:39.592
Και αυτό δεν πρέπει να μας εκπλήσσει,
το μυαλό κάνει υπολογισμούς.

NOTE Paragraph

00:16:39.616 --> 00:16:41.273
Και τέλος,

00:16:41.297 --> 00:16:45.965
οι υπολογιστές ξεκίνησαν ως άσκηση
στο σχεδιασμό ευφυών μηχανημάτων.

00:16:45.989 --> 00:16:48.451
Σχεδιάστηκε βασικά με την ιδέα

00:16:48.475 --> 00:16:51.488
του πώς μπορούμε 
να κάνουμε τις μηχανές ευφυείς.

00:16:51.512 --> 00:16:53.674
Και τελικά αρχίζουμε να εκπληρώνουμε

00:16:53.698 --> 00:16:56.104
μερικές από τις υποσχέσεις
εκείνων των πρωτοπόρων,

00:16:56.128 --> 00:16:57.841
του Τούρινγκ και του Φον Νόιμαν,

00:16:57.865 --> 00:17:00.130
του ΜακΚάλοκ και του Πιτς.

00:17:00.154 --> 00:17:04.252
Και νομίζω ότι οι υπολογιστές
δεν αφορούν μόνο τα λογιστικά,

00:17:04.276 --> 00:17:06.423
ή να παίζουμε Καντι Κρας ή κάτι τέτοιο.

00:17:06.447 --> 00:17:09.025
Εξαρχής τα σχεδιάσαμε 
κατ' εικόναν του μυαλού μας.

00:17:09.049 --> 00:17:12.318
Και μας δίνουν την ικανότητα
να καταλάβουμε το μυαλό μας καλύτερα

00:17:12.342 --> 00:17:13.871
και να τα επεκτείνουμε.

NOTE Paragraph

00:17:14.627 --> 00:17:15.794
Σας ευχαριστώ πολύ.

NOTE Paragraph

00:17:15.818 --> 00:17:17.467
(Χειροκρότημα)