WEBVTT 00:00:06.677 --> 00:00:11.306 Πώς γίνεται όλα τα διαγαλαξιακά είδη στις ταινίες και στην τηλεόραση 00:00:11.306 --> 00:00:13.983 να μιλούν τέλεια αγγλικά; 00:00:13.983 --> 00:00:17.886 Μια γρήγορη απάντηση είναι πως δεν θα είχε ενδιαφέρον μια ταινία 00:00:17.886 --> 00:00:21.774 όπου το διαστημικό πλήρωμα θα περνούσε αιώνες συντάσσοντας εξωγήινο λεξικό. 00:00:21.774 --> 00:00:23.392 Αλλά για να είμαστε ακριβείς, 00:00:23.392 --> 00:00:26.789 οι δημιουργοί του Σταρ Τρεκ και άλλων κόσμων επιστημονικής φαντασίας 00:00:26.789 --> 00:00:30.224 εισήγαγαν την ιδέα ενός καθολικού μεταφραστή, 00:00:30.224 --> 00:00:34.632 μιας φορητής συσκευής που μπορεί στη στιγμή να μεταφράσει όλες τις γλώσσες. 00:00:34.632 --> 00:00:38.539 Επομένως, γίνεται να υπάρξει αληθινά ένας καθολικός μεταφραστής; 00:00:38.539 --> 00:00:42.137 Ήδη έχουμε πολλά προγράμματα που ισχυρίζονται ότι αυτό ακριβώς κάνουν, 00:00:42.137 --> 00:00:45.954 μεταφράζουν μια λέξη, μια πρόταση, ένα ολόκληρο βιβλίο από μια γλώσσα 00:00:45.954 --> 00:00:49.004 σχεδόν σε όλες τις υπόλοιπες, 00:00:49.004 --> 00:00:52.337 είτε πρόκειται για σύγχρονα αγγλικά είτε για αρχαία σανσκριτικά. 00:00:52.337 --> 00:00:55.913 Αν η μετάφραση αφορούσε μόνο την αναζήτηση λέξεων στο λεξικό, 00:00:55.913 --> 00:00:59.825 θα ήταν παιχνιδάκι για αυτά τα προγράμματα. 00:00:59.825 --> 00:01:02.959 Η πραγματικότητα ωστόσο, είναι λίγο πιο περίπλοκη. 00:01:02.959 --> 00:01:07.079 Ένα μεταφραστικό πρόγραμμα χρησιμοποιεί μια λεξικολογική βάση δεδομένων, 00:01:07.079 --> 00:01:10.442 που περιλαμβάνει όλες τις λέξεις που υπάρχουν σε ένα λεξικό, 00:01:10.442 --> 00:01:13.553 όλους τους γραμματικούς τύπους των λέξεων της γλώσσας εισαγωγής, 00:01:13.553 --> 00:01:18.925 και ένα σύνολο κανόνων που αναγνωρίζουν τα στοιχειώδη γλωσσικά στοιχεία της. 00:01:18.925 --> 00:01:22.396 Σε μια φαινομενικά απλή πρόταση όπως: «Τα παιδιά τρώνε τα μάφιν», 00:01:22.396 --> 00:01:27.050 το πρόγραμμα πρώτα θα εντοπίσει τη σύνταξη ή τη γραμματική δομή, 00:01:27.050 --> 00:01:29.587 αναγνωρίζοντας τα παιδιά ως το υποκείμενο, 00:01:29.587 --> 00:01:32.317 και την υπόλοιπη πρόταση ως κατηγόρημα 00:01:32.317 --> 00:01:34.368 που αποτελείται από το ρήμα «τρώω», 00:01:34.368 --> 00:01:37.422 και το άμεσο αντικείμενο «τα μάφιν». 00:01:37.422 --> 00:01:40.249 Έπειτα πρέπει να αναγνωρίσει την αγγλική μορφολογία, 00:01:40.249 --> 00:01:44.681 ή το πως η γλώσσα αναλύεται στις ελάχιστες νοηματικές ενότητές της, 00:01:44.681 --> 00:01:46.124 όπως τη λέξη «μάφιν» 00:01:46.124 --> 00:01:49.755 και την κατάληξη «-s» που δηλώνει τον πληθυντικό. 00:01:49.755 --> 00:01:52.449 Τέλος, επεξεργάζεται τη σημασιολογία, 00:01:52.449 --> 00:01:56.178 το τι πράγματι σημαίνουν τα μέρη της πρότασης. 00:01:56.178 --> 00:01:58.074 Για να μεταφραστεί η πρόταση σωστά, 00:01:58.074 --> 00:02:01.982 το πρόγραμμα θα αναζητήσει σε άλλο σύνολο λεξιλογικών όρων και κανόνων 00:02:01.982 --> 00:02:05.166 το κάθε στοιχείο της γλώσσας προς μετάφραση. 00:02:05.166 --> 00:02:07.020 Αλλά εδώ γίνεται περίπλοκο. 00:02:07.020 --> 00:02:11.820 Το συντακτικό ορισμένων γλωσσών επιτρέπει κάθε γλωσσικό συνδυασμό 00:02:11.820 --> 00:02:16.954 ενώ σε άλλες, κάποιοι συνδυασμοί θα έκαναν τα μάφιν να τρώνε τα παιδιά. 00:02:16.954 --> 00:02:19.647 Η μορφολογία επίσης αποτελεί πρόβλημα. 00:02:19.647 --> 00:02:23.243 Τα σλοβένικα διακρίνουν τα δύο από τα τρία παιδιά ή περισσότερα παιδιά 00:02:23.243 --> 00:02:27.097 προσθέτοντας ένα δυϊκό επίθημα που απουσιάζει από πολλές άλλες γλώσσες, 00:02:27.097 --> 00:02:30.532 ενώ η απουσία οριστικών άρθρων στα ρώσικα θα σας κάνει να αναρωτιέστε 00:02:30.532 --> 00:02:33.575 αν τα παιδιά τρώνε κάποια συγκεκριμένα μάφιν 00:02:33.575 --> 00:02:36.139 ή αν γενικά τρώνε μάφιν. 00:02:36.519 --> 00:02:39.708 Εν κατακλείδι, ακόμα και αν η σημασιολογία είναι τεχνικά ορθή, 00:02:39.708 --> 00:02:42.757 το πρόγραμμα ίσως σφάλει σε λεπτότερες έννοιες, 00:02:42.757 --> 00:02:45.809 όπως αν τα παιδιά «τρώνε» τα μάφιν 00:02:45.809 --> 00:02:47.794 ή αν τα «καταβροχθίζουν». 00:02:47.794 --> 00:02:51.558 Ένας άλλος τρόπος είναι η στατική μηχανική μετάφραση, 00:02:51.558 --> 00:02:55.762 η οποία αναλύει μια βάση δεδομένων από βιβλία, άρθρα και έγγραφα 00:02:55.762 --> 00:02:59.168 που έχουν ήδη μεταφραστεί από ανθρώπους. 00:02:59.488 --> 00:03:02.959 Εντοπίζοντας ζεύγη μεταξύ αρχικού και μεταφρασμένου κειμένου 00:03:02.959 --> 00:03:05.393 που είναι απίθανο να εμφανίστηκαν τυχαία, 00:03:05.393 --> 00:03:09.345 το πρόγραμμα μπορεί να αναγνωρίσει αντιστοιχίες φράσεων και δομών, 00:03:09.345 --> 00:03:11.939 και τα χρησιμοποιεί σε μελλοντικές μεταφράσεις. 00:03:12.429 --> 00:03:14.969 Όπως και να έχει, η ποιότητα αυτών των μεταφράσεων 00:03:14.969 --> 00:03:17.690 εξαρτάται από το μέγεθος της αρχικής βάσης δεδομένων 00:03:17.690 --> 00:03:21.357 και τη διαθεσιμότητα δειγμάτων μετάφρασης των διαφόρων γλωσσών 00:03:21.357 --> 00:03:23.383 ή του ύφους γραφής. 00:03:23.383 --> 00:03:27.140 Η δυσκολία που έχουν οι μηχανές να αποδώσουν εξαιρέσεις, ανωμαλίες, 00:03:27.140 --> 00:03:30.994 και τα αποχρώντα νοήματα που ενστικτωδώς κατανοούν οι άνθρωποι, 00:03:30.994 --> 00:03:35.045 έχει πείσει μερικούς ερευνητές πως η γλωσσική μας κατανόηση 00:03:35.045 --> 00:03:39.251 είναι μοναδικό προϊόν της βιολογικής εγκεφαλικής μας δομής. 00:03:39.251 --> 00:03:43.101 Ένας από τους διασημότερους φανταστικούς καθολικούς μεταφραστές, 00:03:43.101 --> 00:03:46.439 το «Babel Fish» της σειράς: «Γυρίστε τον γαλαξία με ωτοστόπ», 00:03:46.439 --> 00:03:49.726 δεν είναι καν μηχάνημα αλλά ένα πλασματάκι 00:03:49.726 --> 00:03:54.210 που μεταφράζει τα εγκεφαλικά κύματα και νευρικά σήματα νοήμονων ειδών 00:03:54.210 --> 00:03:57.005 μέσω ενός είδους τηλεπάθειας. 00:03:57.005 --> 00:03:59.976 Προς στιγμήν, η εκμάθηση μιας γλώσσας με τον παραδοσιακό τρόπο 00:03:59.976 --> 00:04:04.886 εξακολουθεί να αποδίδει καλύτερα από κάθε διαθέσιμο λογισμικό. 00:04:04.886 --> 00:04:06.659 Αλλά αυτό δεν είναι εύκολο, 00:04:06.659 --> 00:04:09.574 καθώς μόνο ο τεράστιος αριθμός των γλωσσών στον κόσμο, 00:04:09.574 --> 00:04:12.989 καθώς και η διαρκής αλληλεπίδραση των ομιλητών τους, 00:04:12.989 --> 00:04:18.004 θα επιφέρουν μεγάλες εξελίξεις στην αυτόματη μετάφραση. 00:04:18.004 --> 00:04:21.409 Μπορεί μέχρι να συναντήσουμε διαγαλαξιακά όντα, 00:04:21.409 --> 00:04:24.846 να μπορούμε να επικοινωνήσουμε μαζί τους με μια μικρή συσκευή, 00:04:24.846 --> 00:04:29.356 ή μπορούμε, εναλλακτικά, να αρχίσουμε να συντάσσουμε το λεξικό της γλώσσας τους.