Ήταν σύνηθες, αν θέλατε 
ένας υπολογιστής να κάνει κάτι νέο,

έπρεπε να τον προγραμματίσετε.

Ο προγραμματισμός βέβαια, 
για όσους δεν έχετε ασχοληθεί,

απαιτεί να καταχωρήσεις 
με εξωφρενική λεπτομέρεια

κάθε ξεχωριστό βήμα 
που θέλετε να κάνει ο υπολογιστής

για να πετύχετε το σκοπό σας.

Και αν θέλετε να κάνετε κάτι 
που δεν ξέρετε να το κάνετε ο ίδιος,

αυτό είναι σοβαρό πρόβλημα.

Αυτό ήταν το πρόβλημα του Άρθουρ Σάμιουελ.

Το 1956 ήθελε να κάνει αυτό τον υπολογιστή

να μπορεί να τον νικάει στη ντάμα.

Πώς μπορείς να γράψεις πρόγραμμα,

να καταχωρήσεις με πλήρη λεπτομέρεια,
πώς να γίνει καλύτερος από σένα στη ντάμα;

Έτσι είχε μια ιδέα:

έβαλε τον υπολογιστή να παίξει 
ενάντια στον εαυτό του χιλιάδες φορές

και να μάθει να παίζει ντάμα.

Πραγματικά είχε αποτέλεσμα και έως το 1962

ο υπολογιστής είχε νικήσει 
τον πρωταθλητή της πολιτείας Κονέκτικατ.

Έτσι ο Άρθουρ Σάμιουελ
ήταν ο πατέρας της μηχανικής μάθησης,

και του χρωστάω πολλά,

επειδή ασχολούμαι με την εφαρμογή 
της μηχανικής μάθησης.

Ήμουν πρόεδρος της Kaggle,

μια κοινότητα άνω των 200.000 ατόμων 
που ασχολούνται με τη μηχανική μάθηση.

Η Kaggle οργανώνει διαγωνισμούς

για τη λύση άλυτων προβλημάτων,

και σημείωσε επιτυχίες εκατοντάδες φορές.

Από αυτή την πλεονεκτική θέση 
μπόρεσα να ανακαλύψω πολλά

σχετικά με το τι έκανε η μηχανική μάθηση
στο παρελθόν, τι μπορεί να κάνει σήμερα,

και τι θα μπορεί να κάνει στο μέλλον.

Ίσως η πρώτη εμπορικά μεγάλη επιτυχία
της μηχανικής μάθησης ήταν η Google.

Η Google απέδειξε ότι ήταν δυνατόν 
να βρεθούν πληροφορίες

με ένα αλγόριθμο υπολογιστή,

και αυτός ο αλγόριθμος 
βασίζεται στη μηχανική μάθηση.

Από τότε έχουν υπάρξει πολλές 
εμπορικές επιτυχίες της μηχανικής μάθησης.

Εταιρείες όπως η Amazon και η Netflix

χρησιμοποιούν τη μηχανική μάθηση 
για να προτείνουν προϊόντα ν' αγοράσετε,

ταινίες που θα θέλατε να δείτε.

Μερικές φορές γίνεται ανατριχιαστικό.

Εταιρείες όπως η LinkedIn και το Facebook

μερικές φορές σας λένε 
ποιοι μπορεί να είναι φίλοι σας

και δεν έχετε ιδέα πώς τα κατάφεραν,

και το κάνουν με τη δύναμη
της μηχανικής μάθησης.

Αυτοί είναι αλγόριθμοι που έμαθαν
να το κάνουν από τα δεδομένα

παρά από προγραμματισμό με το χέρι.

Έτσι κατάφερε και η IBM

να νικήσει o Γουότσον τους δύο 
παγκόσμιους πρωταθλητές του «Jeopardy»

απαντώντας απίστευτα πονηρές 
και περίπλοκες ερωτήσεις όπως αυτή.

[«Το "Λιοντάρι του Νεμρώδ" εξαφανίστηκε
από το μουσείο αυτής της πόλης το 2003»]

Γι' αυτό έχουμε πλέον τα πρώτα αυτοκίνητα
που οδηγούν μόνα τους.

Αν θέλεις να μπορείς 
να δεις τη διαφορά, ας πούμε,

ανάμεσα σε ένα δένδρο και έναν πεζό, 
αυτό είναι πολύ σημαντικό.

Δεν ξέρουμε να γράφουμε 
τέτοια προγράμματα με το χέρι,

αλλά με τη μηχανική μάθηση 
αυτό είναι πλέον δυνατόν.

Αυτό το αυτοκίνητο έχει οδηγήσει 
πάνω από 1.600.000 χιλιόμετρα

σε κανονικό δρόμο χωρίς καθόλου ατυχήματα.

Έτσι ξέρουμε ότι οι υπολογιστές
μπορούν να μαθαίνουν,

και μπορούν να μάθουν να κάνουν πράγματα

που μερικές φορές 
ούτε κι εμείς ξέρουμε να κάνουμε,

ή μπορούν να τα κάνουν καλύτερα από εμάς.

Ένα εκπληκτικό παράδειγμα 
της μηχανικής μάθησης που έχω δει

έγινε σε ένα πρόγραμμα 
που έκανα στην Kaggle,

όπου μια ομάδα 
υπό κάποιον ονόματι Τζέφρι Χίντον

από το Πανεπιστήμιο του Τορόντο,

κέρδισε έναν διαγωνισμό 
για αυτόματη ανακάλυψη φαρμάκου.

Αυτό όμως που είναι αξιοσημείωτο 
δεν είναι ότι νίκησαν

όλους τους αλγόριθμους της Μέρκ
ή της διεθνούς ακαδημαϊκής κοινότητας,

αλλά ότι κανείς στην ομάδα δεν είχε
γνώσεις χημείας, βιολογίας ή ιατρικής,

και τα κατάφεραν μέσα σε δύο εβδομάδες.

Πώς τα κατάφεραν;

Χρησιμοποίησαν έναν ασυνήθιστο αλγόριθμο 
που λέγεται βαθιά μάθηση.

Ήταν τόσο σημαντικό 
που η επιτυχία καλύφθηκε

σε πρωτοσέλιδο των Τάιμς της Νέας Υόρκης
μερικές εβδομάδες μετά.

Ο Τζέφρι Χίντον είναι εδώ αριστερά.

Η βαθιά μάθηση είναι ένας αλγόριθμος 
εμπνευσμένος από το ανθρώπινο μυαλό,

συνεπώς είναι ένας αλγόριθμος

που θεωρητικά δεν έχει όρια 
στο τι μπορεί να κάνει.

Όσο περισσότερα δεδομένα 
και χρόνο υπολογισμού του δίνεις,

τόσο καλύτερος γίνεται.

Οι Τάιμς της Νέας Υόρκης
έδειξαν επίσης στο άρθρο

άλλο ένα ασυνήθιστο αποτέλεσμα 
της βαθιάς μάθησης

που θα σας δείξω τώρα.

Δείχνει ότι οι υπολογιστές μπορούν 
να ακούν και να καταλαβαίνουν.

(Βίντεο) Ρίτσαρντ Ράσιντ: 
Τώρα το τελευταίο βήμα

που θέλω να κάνω σε αυτή τη διαδικασία

είναι να σας μιλήσω κανονικά στα Κινέζικα.

Το μυστικό εδώ είναι ότι,

μπορέσαμε να πάρουμε μεγάλη ποσότητα 
πληροφοριών από ομιλητές της Κινεζικής

και να φτιάξουμε ένα σύστημα 
μετατροπής κειμένου σε ομιλία

που μετατρέπει Κινέζικο λόγο 
από γραπτό σε προφορικό,

και μετά χρειαστήκαμε καμιά ώρα 
με τη δική μου φωνή

για να μπορέσουμε να ρυθμίσουμε

το βασικό σύστημα μετατροπής λόγου 
ώστε να ακούγεται σαν εμένα.

Και πάλι το αποτέλεσμα δεν ήταν τέλειο.

Υπήρχαν μερικά λαθάκια.

(Στα Κινέζικα)

(Χειροκρότημα)

Χρειάζεται να γίνουν πολλά 
σε αυτό τον τομέα.

(Στα Κινέζικα)

(Χειροκρότημα)

Τζέρεμι Χάουαρντ: Αυτό ήταν 
σε συνέδριο μηχανικής μάθησης στην Κίνα.

Δεν συμβαίνει συχνά σε ακαδημαϊκά συνέδρια

να έχεις τόσο αυθόρμητες επευφημίες,

αλλά μιας και είμαστε σε συνάντηση TED,
μην περιορίζεστε.

Όλα όσα είδατε εκεί 
συνέβησαν με τη βαθιά μάθηση.

(Χειροκρότημα) 
Ευχαριστώ.

Η μεταγραφή στα Αγγλικά
έγινε από τη βαθιά μάθηση.

Η μετάφραση στα Κινέζικα, 
το κείμενο πάνω δεξιά,

και η σύνθεση της φωνής 
έγιναν από τη βαθιά μάθηση επίσης.

Η βαθιά μάθηση είναι κάτι ξεχωριστό.

Είναι ένας αλγόριθμος 
που μοιάζει να μπορεί να κάνει τα πάντα,

και ανακάλυψα ότι πριν ένα χρόνο 
είχε επίσης μάθει να βλέπει.

Σε έναν δυσνόητο διαγωνισμό στη Γερμανία

σχετικά με την αναγνώριση οδικής σήμανσης,

η βαθιά μάθηση έμαθε να αναγνωρίζει 
οδικά σήματα όπως αυτό.

Όχι μόνο αναγνώριζε τα οδικά σήματα

καλύτερα από κάθε άλλο αλγόριθμο,

στον πίνακα αποτελεσμάτων 
σημείωσε βαθμολογία

δύο φορές καλύτερη από τους ανθρώπους.

Έτσι έως το 2011,

είχαμε το πρώτο παράδειγμα υπολογιστή
που μπορεί να δει καλύτερα από άνθρωπο.

Από τότε έγιναν πολλά.

Το 2012 η Google ανακοίνωσε ότι 
ο αλγόριθμος βαθιά μάθηση

έβλεπε βίντεο του YouTube

και διάβαζε δεδομένα 
από 16.000 υπολογιστές για ένα μήνα,

και ο υπολογιστής έμαθε από μόνος του 
έννοιες όπως «άνθρωπος και «γάτα»,

απλώς βλέποντας τα βίντεο.

Μοιάζει πολύ με τον τρόπο 
που μαθαίνουν οι άνθρωποι.

Δεν μαθαίνουμε 
όταν κάποιος μας λέει τι να δούμε,

αλλά μαθαίνοντας από μόνοι μας 
τι είναι αυτά τα πράγματα.

Επίσης το 2012 ο Τζέφρι Χίντον 
που είδαμε νωρίτερα

κέρδισε στον δημοφιλή διαγωνισμό ImageNet,

προσπαθώντας να βρει 
μέσα από 1,5 εκατομμύριο εικόνες

τι απεικονίζουν.

Από το 2014 έχουμε πέσει 
στο 6% ποσοστό σφάλματος

στην αναγνώριση εικόνας.

Και πάλι καλύτερα από τον άνθρωπο.

Οι μηχανές τα καταφέρνουν πολύ καλά 
σε αυτό τον τομέα,

και πλέον χρησιμοποιείται στη βιομηχανία.

Για παράδειγμα, η Google ανακοίνωσε πέρυσι

ότι χαρτογράφησαν ολόκληρη
τη Γαλλία μέσα σε δύο ώρες,

και το έκαναν εισάγοντας φωτογραφίες 
από την τεχνολογία Street View

σε έναν αλγόριθμο βαθιάς μάθησης
ώστε να αναγνωρίζει την αρίθμηση των οδών.

Φανταστείτε πόσο θα έπαιρνε παλιότερα:

πλήθος ανθρώπων, πολλά χρόνια.

Συμβαίνει επίσης στην Κίνα.

Η Baidu είναι θα λέγαμε 
η αντίστοιχη Google της Κίνας

και εδώ πάνω αριστερά 
βλέπετε ένα παράδειγμα

από μια φωτογραφία που μεταφόρτωσα 
στο σύστημα βαθιάς μάθησης της Baidu,

και από κάτω βλέπετε ότι 
το σύστημα αναγνώρισε τη φωτογραφία

και βρήκε και παρόμοιες.

Οι παρόμοιες εικόνες έχουν παρόμοιο φόντο,

παρόμοιο προσανατολισμό των προσώπων,

μερικές ακόμα και με τη γλώσσα έξω.

Αυτό σαφώς δεν είναι 
σαν να βλέπεις κείμενο σε ιστοσελίδα.

Μόνο μια φωτογραφία ανέβασα.

Έχουμε λοιπόν υπολογιστές 
που πράγματι καταλαβαίνουν τι βλέπουν

και γι' αυτό μπορούν 
να ερευνήσουν βάσεις δεδομένων

εκατοντάδων εκατομμυρίων εικόνων
σε πραγματικό χρόνο.

Τι σημασία έχει ότι 
οι υπολογιστές μπορούν να βλέπουν;

Λοιπόν, δεν είναι μόνο αυτό.

Η βαθιά μάθηση έκανε περισσότερα.

Περίπλοκες προτάσεις με λεπτές έννοιες, 
όπως αυτή εδώ,

μπορούν πλέον να κατανοηθούν 
από τον αλγόριθμο.

Όπως βλέπετε εδώ,

το σύστημα του Στάνφορντ
στην κόκκινη κουκκίδα στην κορυφή

κατάλαβε ότι αυτή η πρόταση 
εκφράζει αρνητικό συναίσθημα.

Η βαθιά μάθηση όντως πλησιάζει 
την ανθρώπινη επίδοση

στο να καταλαβαίνουν το κεντρικό θέμα 
και το γενικό περιεχόμενο μιας πρότασης.

Η βαθιά μάθηση χρησιμοποιήθηκε επίσης
για την ανάγνωση Κινέζικων

και πάλι στο επίπεδο 
του Κινέζου φυσικού ομιλητή.

Αυτός ο αλγόριθμος εξελίχθηκε 
από ομάδα Ελβετών,

κανείς εκ των οποίων 
δεν μιλούσε ή καταλάβαινε Κινέζικα.

Όπως είπα, η χρήση της βαθιάς μάθησης

είναι το καλύτερο σύστημα
στον κόσμο γι' αυτό,

συγκρινόμενο ακόμα και 
με την ανθρώπινη κατανόηση.

Είναι ένα σύστημα 
που φτιάχνουμε στην εταιρεία μου

που δείχνει πώς συντίθενται όλα τα μέρη.

Αυτές είναι εικόνες χωρίς κείμενο,

και καθώς πληκτρολογώ κείμενο,

σε πραγματικό χρόνο 
κατανοεί αυτές τις εικόνες,

αντιλαμβάνεται το θέμα τους,

και βρίσκει παρόμοιες φωτογραφίες 
με το κείμενο που γράφω.

Άρα ουσιαστικά
καταλαβαίνει τις προτάσεις μου

και καταλαβαίνει αυτές τις εικόνες.

Ξέρω ότι έχετε δει κάτι τέτοιο στη Google,

όπου πληκτρολογείτε κάτι 
και σας δείχνει εικόνες,

αλλά στην πραγματικότητα 
ψάχνει στην ιστοσελίδα για κείμενο.

Αυτό είναι πολύ διαφορετικό 
από το να κατανοείς τις εικόνες.

Αυτό το κατάφεραν οι υπολογιστές

για πρώτη φορά πριν λίγους μήνες.

Έτσι οι υπολογιστές, όχι μόνο βλέπουν,
αλλά μπορούν και να διαβάσουν,

και φυσικά δείξαμε 
ότι καταλαβαίνουν ό,τι ακούνε.

Ίσως δεν σας εκπλήξει να σας πω 
ότι μπορούν να γράφουν.

Εδώ είναι κείμενο που παρήγαγα χθες
με έναν αλγόριθμο βαθιάς μάθησης.

Και αυτό είναι κείμενο που παρήγαγε 
ένας αλγόριθμος του Στάνφορντ.

Κάθε πρόταση δημιουργήθηκε

από έναν αλγόριθμο βαθιάς μάθησης
για να περιγράψει καθεμιά από τις εικόνες.

Ο αλγόριθμος δεν είχε ξαναδεί άνθρωπο 
με μαύρο πουκάμισο να παίζει κιθάρα.

Είχε ξαναδεί άνθρωπο, 
είχε ξαναδεί μαύρο,

είχε ξαναδεί κιθάρα,

αλλά από μόνος του έφτιαξε 
αυτή τη νέα περιγραφή για την εικόνα.

Εδώ δεν φτάσαμε την ανθρώπινη απόδοση 
αλλά πλησιάζουμε.

Στις δοκιμές, οι άνθρωποι προτιμούν 
τις ετικέτες που φτιάχτηκαν από υπολογιστή

μία στις τέσσερις φορές.

Αυτό το σύστημα είναι μόνο δύο εβδομάδων,

άρα μάλλον εντός του επόμενου έτους,

ο αλγόριθμος θα έχει ξεπεράσει 
την ανθρώπινη επίδοση

με τους τρέχοντες ρυθμούς.

Άρα οι υπολογιστές μπορούν και να γράφουν.

Βάζοντάς τα όλα μαζί 
οδεύουμε σε εκπληκτικές δυνατότητες.

Για παράδειγμα, στην ιατρική,

μια ομάδα στη Βοστόνη 
ανακοίνωσε ότι ανακάλυψαν

μεγάλο αριθμό νέων κλινικά σχετικών
χαρακτηριστικών όγκων

που θα βοηθήσει τους γιατρούς 
στην πρόγνωση του καρκίνου.

Παρομοίως στο Στάνφορντ,

μια ομάδα ανακοίνωσε ότι, 
εξετάζοντας ιστούς σε μεγέθυνση,

εξέλιξαν ένα σύστημα μηχανικής μάθησης

που είναι όντως καλύτερο 
από τους ανθρώπους παθολόγους

στην πρόβλεψη των ποσοστών επιβίωσης 
των πασχόντων από καρκίνο.

Και στις δύο περιπτώσεις, 
όχι μόνο έκαναν ακριβέστερη πρόβλεψη,

αλλά παρήγαγαν πιο διορατική γνώση.

Στην περίπτωση της ακτινολογίας,

υπήρξαν νέες κλινικές ενδείξεις 
που οι άνθρωποι θα καταλάβουν.

Σε αυτή την παθολογική περίπτωση,

το σύστημα στον υπολογιστή ανακάλυψε 
ότι τα κύτταρα γύρω από τον όγκο

είναι το ίδιο σημαντικά 
όσο τα καρκινικά κύτταρα

για τη διάγνωση.

Αυτό είναι αντίθετο από όσα διδάσκονταν 
οι παθολόγοι για δεκαετίες.

Σε καθεμιά από τις δύο περιπτώσεις, 
ήταν συστήματα που αναπτύχθηκαν

από συνδυασμό ειδικών στην ιατρική 
και ειδικών στη μηχανική μάθηση,

αλλά από πέρυσι, 
το έχουμε ξεπεράσει και αυτό.

Εδώ έχουμε παράδειγμα 
εντοπισμού καρκινικής περιοχής

σε ανθρώπινο ιστό κάτω από το μικροσκόπιο.

Το σύστημα μπορεί να εντοπίσει
αυτές τις περιοχές ακριβέστερα,

ή περίπου με την ίδια ακρίβεια 
όσο οι παθολόγοι,

αλλά έγινε εξολοκλήρου με τη βαθιά μάθηση,
χωρίς ιατρική τεχνογνωσία,

από ανθρώπους χωρίς προϋπηρεσία 
στον χώρο αυτό.

Παρόμοια εδώ, αυτή η κατάτμηση νευρώνα.

Μπορούμε πλέον να κατατμήσουμε νευρώνες
με την ίδια ακρίβεια όπως οι άνθρωποι,

αλλά με σύστημα που αναπτύχθηκε 
με τη βαθιά μάθηση

και ανθρώπους που δεν είχαν 
καμία σχέση με την ιατρική.

Συνεπώς εγώ ο ίδιος, 
πλήρως άσχετος με την ιατρική,

φαίνεται να έχω όλα τα προσόντα 
να φτιάξω μια ιατροφαρμακευτική εταιρεία,

πράγμα που έκανα.

Αρχικά φοβόμουν να το κάνω,

αλλά θεωρητικά φαινόταν εφικτό

να φτιάξω χρήσιμα φάρμακα χρησιμοποιώντας
μόνο τεχνικές ανάλυσης δεδομένων.

Ευτυχώς τα σχόλια ήταν άκρως ενθαρρυντικά.

όχι μόνο από τα μέσα 
αλλά και από την ιατρική κοινότητα,

που με στήριξε πολύ.

Θεωρητικά μπορούμε να πάρουμε 
την μέση φάση της ιατρικής διαδικασίας

και να αναλύσουμε τα δεδομένα της
στο μέγιστο δυνατό βαθμό,

αφήνοντας τους γιατρούς να κάνουν 
αυτό που ξέρουν καλύτερα.

Θα σας δώσω ένα παράδειγμα.

Τώρα μας παίρνει 15 λεπτά να βγάλουμε 
ένα νέο διαγνωστικό τεστ

και θα το δείτε σε πραγματικό χρόνο,

αλλά το συμπίεσα σε τρία λεπτά 
παραλείποντας κάποια κομμάτια.

Αντί για τη δημιουργία 
ενός ιατρικού διαγνωστικού τεστ,

θα σας δείξω ένα διαγνωστικό τεστ 
από εικόνες αυτοκινήτων,

επειδή είναι κάτι που όλοι καταλαβαίνουμε.

Ξεκινάμε με περίπου 1,5 εκατομμύριο 
εικόνες αυτοκινήτων

και θέλω να φτιάξω κάτι που θα τις χωρίσει

ανάλογα με τη γωνία λήψης της φωτογραφίας.

Οι εικόνες δεν έχουν καθόλου κείμενο, 
έτσι αρχίζω από το μηδέν.

Με τον αλγόριθμο βαθιάς γνώσης

μπορεί αυτόματα να εντοπίσει 
περιοχές δομής μέσα στις εικόνες.

Είναι καλό που άνθρωπος και υπολογιστής 
μπορούν να συνεργαστούν.

Ο άνθρωπος που βλέπετε εδώ

λέει στον υπολογιστή 
για τις περιοχές ενδιαφέροντος

που θέλει να χρησιμοποιήσει ο υπολογιστής 
για να βελτιώσει τον αλγόριθμό του.

Τα συστήματα αυτά είναι 
σε διάστημα 16.000 διαστάσεων,

έτσι βλέπετε τον υπολογιστή 
να το περιστρέφει σε αυτό το διάστημα,

προσπαθώντας να βρει νέες περιοχές δομής.

Και όταν το κάνει με επιτυχία,

τότε ο ανθρώπινος χειριστής μπορεί 
να δείξει τις περιοχές ενδιαφέροντος.

Εδώ ο υπολογιστής βρήκε επιτυχώς περιοχές,

για παράδειγμα, κάποιες γωνίες.

Κατά τη διάρκεια της διαδικασίας,

σταδιακά λέμε στον υπολογιστή 
όλο και περισσότερα

για το είδος των δομών που ψάχνουμε.

Φανταστείτε ότι στο διαγνωστικό τεστ

θα είναι ο παθολόγος που δείχνει 
τις επικίνδυνες περιοχές,

ή ο ακτινολόγος να δείχνει 
τους εν δυνάμει ανησυχητικούς όζους.

Μερικές φορές ο αλγόριθμος δυσκολεύεται.

Εδώ έχει μπερδευτεί λίγο.

Τα μπρος και πίσω μέρη των αυτοκινήτων
έχουν μπλεχτεί.

Τότε πρέπει να προσέξουμε λίγο περισσότερο

επιλέγοντας χειροκίνητα αυτά τα μπρος 
από εκείνα τα πίσω μέρη,

και μετά λέγοντας στον υπολογιστή 
ότι αυτά είναι ένα είδος ομάδας

που μας ενδιαφέρει.

Το κάνουμε για λίγο, 
παραλείπουμε λίγο εδώ,

και μετά εκπαιδεύουμε
τον αλγόριθμο βαθιά μάθηση

με βάση αυτά τα διακόσια περίπου πράγματα,

και ελπίζουμε ότι βελτιώθηκε.

Μπορείτε να δείτε ότι θολώνει 
κάποια μέρη των εικόνων,

δείχνοντάς μας ότι ήδη καταλαβαίνει 
πώς να αναγνωρίζει κάποια μέρη μόνος του.

Μπορούμε να χρησιμοποιήσουμε
το σχέδιο με τις παρόμοιες εικόνες,

και έτσι εδώ μπορείτε να δείτε

ο υπολογιστής τώρα μπορεί ολοκληρωτικά 
να βρίσκει μόνο τα μπροστινά μέρη.

Σε αυτό το σημείο ο άνθρωπος 
μπορεί να λέει στον υπολογιστή,

εντάξει, μια χαρά τα πας.

Φυσικά κάποιες φορές, 
ακόμα και σε αυτό το σημείο

είναι ακόμα δύσκολο 
να διακρίνει τις ομάδες.

Εδώ, ακόμη και αφού ο υπολογιστής 
το έχει περιστρέψει κάμποσο,

ακόμα οι εικόνες αριστερής 
και δεξιάς πλευράς

είναι ανάμικτες.

Έτσι δίνουμε στον υπολογιστή
κάποιες οδηγίες,

και του λέμε να βρει 
μια προβολή που να διαχωρίζει

κατά το δυνατόν 
τις δεξιές από τις αριστερές πλευρές

χρησιμοποιώντας
τον αλγόριθμο βαθιάς γνώσης.

Με αυτή την οδηγία --
ωραία, είχε αποτέλεσμα.

Κατάφερε να βρει τρόπο σκέψης 
σχετικά με αυτά τα αντικείμενα

ώστε να τα διαχωρίσει.

Καταλαβαίνετε λοιπόν πώς γίνεται.

Αυτή δεν είναι περίπτωση που ο υπολογιστής
αντικαθιστά τον άνθρωπο,

αλλά όπου συνεργάζονται.

Εδώ αντικαθιστούμε κάτι 
που χρειαζόταν μια ομάδα

πέντε ή έξι ατόμων για σχεδόν επτά χρόνια,

και το αντικαθιστούμε με κάτι 
που χρειάζεται 15 λεπτά

για ένα άτομο που δουλεύει μόνο του.

Έτσι η διαδικασία αφαιρεί τέσσερις 
ή πέντε επαναληπτικές φάσεις.

Βλέπετε ότι τώρα έχουμε 62%

από 1,5 εκατομμύριο εικόνες 
ορθά ταξινομημένες.

Και σε αυτό το σημείο, 
μπορούμε αρκετά γρήγορα

να μαρκάρουμε μεγάλα τμήματα,

να τα τσεκάρουμε ώστε να μην έχουν λάθη.

Όπου υπάρχουν σφάλματα, 
ενημερώνουμε τον υπολογιστή.

Και με αυτή τη διαδικασία για κάθε ομάδα,

έχουμε φτάσει σε ένα ποσοστό επιτυχίας 80%

στην ταξινόμηση 1,5 εκατομμυρίου εικόνων.

Είμαστε στη φάση όπου

παίρνουμε τις λίγες εικόνες 
που δεν ταξινομήθηκαν σωστά

και προσπαθούμε να βρούμε τον λόγο.

Με αυτή την προσέγγιση,

σε 15 λεπτά φτάνουμε
το 97% στον ρυθμό ταξινόμησης.

Αυτή η τεχνική θα βοηθήσει 
να διορθώσουμε ένα σοβαρό πρόβλημα,

την ανεπάρκεια ειδικών
στην ιατρική σε όλο τον κόσμο.

Το Παγκόσμιο Οικονομικό Φόρουμ λέει ότι

υπάρχει δεκαπλάσιο με εικοσαπλάσιο 
έλλειμμα ιατρών στον αναπτυσσόμενο κόσμο,

και θα χρειαστούν 300 χρόνια

για να εκπαιδευθούν αρκετοί άνθρωποι
ώστε να λυθεί το πρόβλημα.

Φαντάζεστε να μπορούσαμε 
να ενισχύσουμε την απόδοσή τους

με την προσέγγιση της βαθιάς μάθησης;

Είμαι ενθουσιασμένος 
με αυτές τις προοπτικές.

Ανησυχώ επίσης και για τα προβλήματα.

Το πρόβλημα εδώ είναι ότι 
κάθε μπλε περιοχή στο χάρτη

είναι μέρος όπου οι υπηρεσίες 
είναι πάνω από το 80% της απασχόλησης.

Ποιες είναι οι υπηρεσίες;

Αυτές είναι οι υπηρεσίες.

Είναι αυτά ακριβώς τα πράγματα 
που ο υπολογιστής μόλις έμαθε να κάνει.

Έτσι το 80% της παγκόσμιας απασχόλησης 
στον αναπτυσσόμενο κόσμο

είναι πράγματα που οι υπολογιστές
μόλις έμαθαν να κάνουν.

Τι σημαίνει αυτό;

Κάτι θα γίνει.
Θα αντικατασταθούν από άλλες δουλειές.

Θα γίνουν περισσότερες θέσεις
για επιστήμονες δεδομένων.

Όχι ακριβώς.

Δεν χρειάζονται πολύ χρόνο 
να φτιάξουν κάτι τέτοιο.

Αυτούς τους τέσσερις αλγόριθμους 
τους έφτιαξε το ίδιο άτομο.

Αν σκεφτείτε, εντάξει, 
το έχουμε ξαναδεί το έργο,

είδαμε τα αποτελέσματα στο παρελθόν 
όταν προέκυψαν νέες ανάγκες

και αντικαταστάθηκαν από νέα επαγγέλματα,

ποια θα είναι τα νέα επαγγέλματα;

Είναι πολύ δύσκολο να το εκτιμήσουμε

γιατί η ανθρώπινη απόδοση 
αυξάνεται με σταδιακό ρυθμό,

αλλά τώρα έχουμε το σύστημα βαθιάς μάθησης

που αυξάνει την ικανότητά του 
με ρυθμούς γεωμετρικής προόδου.

Και είμαστε εδώ.

Προς το παρόν,
κοιτάμε γύρω μας και σκεφτόμαστε

«Οι υπολογιστές είναι χαζά μηχανήματα».
Σωστά;

Σε πέντε χρόνια όμως, οι υπολογιστές
θα έχουν φύγει από τα όρια του πίνακα.

Θα πρέπει να αρχίσουμε να σκεφτόμαστε 
αυτή την ικανότητα άμεσα.

Το έχουμε δει ακόμη μια φορά στο παρελθόν.

Στη Βιομηχανική Επανάσταση

είδαμε μια αλλαγή ρυθμού στην ικανότητα 
χάρις στις μηχανές.

Το θέμα είναι βέβαια, ότι μετά από λίγο 
τα πράγματα ισοπεδώθηκαν.

Υπήρξε κοινωνική διάσπαση,

αλλά εφόσον οι μηχανές χρησιμοποιήθηκαν 
για την παραγωγή ενέργειας παντού

τα πράγματα έφτασαν σε μια σταθερότητα.

Η Επανάσταση Μηχανικής Μάθησης

θα διαφέρει πολύ
από τη Βιομηχανική Επανάσταση

επειδή η Μηχανική Μάθηση 
ποτέ δεν φτάνει σε στάδιο σταθερότητας.

Όσο οι υπολογιστές βελτιώνονται 
σε διανοητικές ικανότητες,

θα φτιάξουν καλύτερους υπολογιστές 
που θα βελτιωθούν διανοητικά περισσότερο,

έτσι θα είναι ένα είδος αλλαγής

που ο κόσμος δεν έχει ξαναζήσει,

έτσι η προηγούμενη αντίληψή σας 
για το τι είναι δυνατόν είναι διαφορετική.

Ήδη μας επηρεάζει.

Τα τελευταία 25 χρόνια, καθώς αυξανόταν 
η παραγωγικότητα κεφαλαίου,

η παραγωγικότητα εργασίας έμενε σταθερή, 
ίσως και να μειωνόταν ελάχιστα.

Ας ξαναρχίσουμε αυτή τη συζήτηση τώρα.

Ξέρω ότι όταν κάνω συζήτηση
σχετικά με αυτή την κατάσταση,

οι άνθρωποι γίνονται απαξιωτικοί.

Οι υπολογιστές δεν μπορούν να σκεφτούν,

δεν νιώθουν, 
δεν καταλαβαίνουν την ποίηση,

εμείς δεν καταλαβαίνουμε πραγματικά 
πώς αυτοί λειτουργούν.

Και λοιπόν;

Οι υπολογιστές τώρα μπορούν να κάνουν
όσα οι άνθρωποι πληρώνονται για να κάνουν

έτσι είναι καιρός να σκεφτούμε

πώς θα αναπροσαρμόσουμε
τις κοινωνικές και οικονομικές δομές

σε αυτή τη νέα πραγματικότητα.

Ευχαριστώ.

(Χειροκρότημα)