WEBVTT 00:00:06.070 --> 00:00:07.120 Γεια, με λένε Τζον. 00:00:07.510 --> 00:00:10.620 Ηγούμαι των ομάδων εκμάθησης αναζήτησης και μηχανής στην Google. 00:00:11.130 --> 00:00:14.230 Πιστεύω ότι είναι εκπληκτικά συγκλονιστικό 00:00:14.230 --> 00:00:16.214 ότι άνθρωποι από όλο τον κόσμο 00:00:16.215 --> 00:00:19.650 στρέφονται σε μηχανές αναζήτησης για να ρωτήσουν τετριμμένες ερωτήσεις. 00:00:19.650 --> 00:00:21.320 και απίστευτα σημαντικές ερωτήσεις. 00:00:21.320 --> 00:00:23.450 Άρα, είναι τεράστια ευθύνη να τους δίνουμε 00:00:23.450 --> 00:00:25.504 τις καλύτερες απαντήσεις που μπορούμε, 00:00:26.710 --> 00:00:30.610 Γεια, με λένε Αξάγια και δουλεύω στην ομάδα αναζήτησης Bing. 00:00:30.910 --> 00:00:33.190 Πολλές φορές θα ξεκινήσουμε να ερευνούμε 00:00:33.190 --> 00:00:35.800 την τεχνητή νοημοσύνη και την εκμάθηση μηχανής, 00:00:35.830 --> 00:00:39.010 αλλά θα πρέπει να αναρωτιόμαστε πώς οι χρήστες θα κάνουν χρήση, 00:00:39.140 --> 00:00:41.975 γιατί σε τελική ανάλυση, θέλουμε να αφήσουμε τη σφραγίδα μας 00:00:41.975 --> 00:00:43.600 πάνω στην κοινωνία. 00:00:43.780 --> 00:00:45.400 Ας ρωτήσουμε ένα απλό ερώτημα: 00:00:45.820 --> 00:00:48.530 Πόσος χρόνος χρειάζεται για να ταξιδέψουμε στον Άρη; 00:00:49.330 --> 00:00:51.180 Από που προήλθαν αυτά τα αποτελέσματα 00:00:51.370 --> 00:00:54.100 και γιατί αυτό απαριθμήθηκε πριν από το άλλο; 00:00:54.100 --> 00:00:57.830 Εντάξει, ας κάνουμε μια βουτιά στα βαθιά για να δούμε πώς η μηχανή αναζήτησης 00:00:57.830 --> 00:00:59.980 μετέτρεψε το ερώτημά σας σε αποτέλεσμα. 00:00:59.980 --> 00:01:03.360 Το πρώτο πράγμα που πρέπει να ξέρετε είναι πως όταν κάνετε μια έρευνα, 00:01:03.360 --> 00:01:06.610 η μηχανή αναζήτησης δεν πηγαίνει έξω στο Παγκόσμιο Δίκτυο/Διαδίκτυο 00:01:06.610 --> 00:01:08.900 για να εκτελέσει την έρευνα σε πραγματικό χρόνο. 00:01:08.900 --> 00:01:11.630 Και αυτό γιατί υπάρχουν πάνω από δισεκατομμύρια ιστότοποι 00:01:11.630 --> 00:01:15.290 στο διαδίκτυο και εκατοντάδες άλλοι που δημιουργούνται κάθε στιγμή και λεπτό. 00:01:15.290 --> 00:01:17.620 Έτσι, αν η μηχανή αναζήτησης έπρεπε να ερευνήσει 00:01:17.620 --> 00:01:20.100 κάθε ξεχωριστό ιστότοπο για να βρει αυτό που θέλατε, 00:01:20.100 --> 00:01:21.390 θα χρειαζόταν άπειρο χρόνο. 00:01:21.400 --> 00:01:23.120 Άρα, για μια γρηγορότερη αναζήτηση, 00:01:23.120 --> 00:01:25.890 οι μηχανές αναζήτησης συνεχώς το διαδίκτυο εκ των προτέρων 00:01:25.890 --> 00:01:29.455 για να καταγράψουν πληροφορίες που ενδέχεται να βοηθήσουν με την αναζήτησή 00:01:29.455 --> 00:01:30.440 σας αργότερα. 00:01:30.440 --> 00:01:33.160 Κατά αυτόν τον τρόπο, όταν ερευνάτε για ταξίδια στον Άρη, 00:01:33.160 --> 00:01:35.300 η μηχανή αναζήτησης έχει ήδη ό,τι χρειάζεται 00:01:35.300 --> 00:01:37.680 για να σας δώσει μια απάντηση σε πραγματικό χρόνο. 00:01:37.680 --> 00:01:40.930 Το διαδίκτυο είναι ένα δίκτυο σελίδων συνδεδεμένο με υπερσυνδέσμους. 00:01:40.930 --> 00:01:43.370 Οι μηχανές αναζήτησης τρέχουν ένα πρόγραμμα διαρκώς 00:01:43.370 --> 00:01:46.320 που αποκαλείται Αράχνη που διασχίζει αυτές τις σελίδες δικτύου 00:01:46.320 --> 00:01:48.470 για να συλλέγει πληροφορίες σχετικά με αυτές. 00:01:48.470 --> 00:01:50.430 Κάθε φορά που βρίσκει έναν υπερσύνδεσμο, 00:01:50.430 --> 00:01:53.340 τον ακολουθεί μέχρι να έχει επισκεφθεί κάθε σελίδα, 00:01:53.340 --> 00:01:55.550 που μπορεί να βρει σε ολόκληρο το διαδίκτυο. 00:01:55.550 --> 00:01:57.585 Για κάθε σελίδα που επισκέπτεται η αράχνη, 00:01:58.390 --> 00:02:02.320 καταγράφει οποιαδήποτε τυχόν πληροφορία μπορεί να χρειαστεί για μια αναζήτηση 00:02:02.500 --> 00:02:06.320 με την προσθήκη της σε μια ειδική βάση δεδομένων που ονομάζεται δείκτης έρευνας. 00:02:06.320 --> 00:02:08.934 Τώρα, ας πάμε σε εκείνη την έρευνα που κάναμε νωρίτερα 00:02:08.934 --> 00:02:11.944 και ας δούμε αν μπορούμε να καταλάβουμε πως η μηχανή αναζήτησης 00:02:11.944 --> 00:02:13.287 βρήκε τα αποτελέσματα. 00:02:13.287 --> 00:02:16.107 Όταν ρωτάμε ποσό χρειάζεται για να ταξιδέψουμε στον Άρη, 00:02:16.107 --> 00:02:18.860 η μηχανή αναζήτησης αναζητά κάθε μία από αυτές τις λέξεις 00:02:18.860 --> 00:02:21.350 στον δείκτη έρευνας για να βρει αμέσως μια λίστα 00:02:21.350 --> 00:02:24.440 όλων των σελίδων στο διαδίκτυο που περιέχουν αυτές τις λέξεις. 00:02:24.440 --> 00:02:26.870 Αλλά μόνο η έρευνα για αυτούς τους όρους αναζήτησης 00:02:26.870 --> 00:02:28.760 μπορεί να επιστρέφει χιλιάδες σελίδες, 00:02:28.760 --> 00:02:31.440 έτσι η μηχανή αναζήτησης θα πρέπει να μπορεί να καθορίσει 00:02:31.440 --> 00:02:34.103 τις καλύτερες αντιστοιχίες για να σας τις δείξει πρώτες. 00:02:34.103 --> 00:02:37.010 Σε αυτό το σημείο γίνεται πολύπλοκο γιατί η μηχανή αναζήτησης 00:02:37.010 --> 00:02:39.060 μπορεί να χρειαστεί να μαντέψει τι ψάχνετε. 00:02:39.060 --> 00:02:41.880 Κάθε μηχανή αναζήτησης χρησιμοποιεί τον δικό της αλγόριθμο 00:02:41.880 --> 00:02:44.930 για να κατατάξει τις σελίδες βάση αυτού που πιστεύει ότι θέλετε. 00:02:44.930 --> 00:02:47.940 Ο αλγόριθμός κατάταξης της μηχανής αναζήτησης μπορεί να ελέγχει 00:02:47.940 --> 00:02:50.900 αν ο όρος αναζήτησης σας εμφανίζεται στον τίτλο της σελίδας 00:02:50.900 --> 00:02:53.820 αν όλες οι λέξεις εμφανίζονται η μία μετά την άλλη 00:02:53.820 --> 00:02:56.320 ή οποιονδήποτε αριθμό άλλων υπολογισμών 00:02:56.320 --> 00:02:58.610 για να βοηθήσει να καθοριστεί καλύτερα 00:02:58.670 --> 00:03:01.420 ποιες σελίδες θέλετε να δείτε και ποιες όχι. 00:03:01.420 --> 00:03:03.420 Η Google επινόησε τον πιο γνωστό αλγόριθμο 00:03:03.420 --> 00:03:06.375 για την επιλογή των πιο σχετικών αποτελεσμάτων μιας αναζήτησης 00:03:06.375 --> 00:03:08.160 συνυπολογίζοντας 00:03:08.440 --> 00:03:11.230 πόσες άλλες σελίδες συνδέθηκαν με μια συγκεκριμένη σελίδα. 00:03:11.470 --> 00:03:13.780 Αν πχ πολλοί ιστότοποι πιστεύουν 00:03:13.780 --> 00:03:15.660 ότι μια ιστοσελίδα είναι ενδιαφέρουσα, 00:03:15.660 --> 00:03:17.940 τότε πιθανώς να είναι αυτή που ψάχνετε. 00:03:17.940 --> 00:03:20.290 Αυτός ο αλγόριθμος ονομάζεται κατάταξη σελίδας 00:03:20.590 --> 00:03:22.330 όχι γιατί κατατάσσει ιστοσελίδες, 00:03:22.570 --> 00:03:25.210 αλλά γιατί ονομάστηκε από τον εφευρέτη του, Larry Page, 00:03:25.330 --> 00:03:27.453 που είναι ένας από τους ιδρυτές της Google. 00:03:27.460 --> 00:03:30.650 Επειδή ένας ιστότοπος συχνά βγάζει χρήματα όταν πηγαίνετε σε αυτόν 00:03:30.660 --> 00:03:34.080 οι σπάμμερς προσπαθούν ακατάπαυστα να βρουν τρόπους οι σελίδες τους να 00:03:34.080 --> 00:03:36.871 απαριθμούνται υψηλότερα στα αποτελέσματα. 00:03:37.750 --> 00:03:40.750 Οι μηχανές αναζήτησης ενημερώνουν τους αλγορίθμους τους τακτικά 00:03:40.750 --> 00:03:44.226 έτσι ώστε ψεύτικές ή αναξιόπιστες τοποθεσίες να μην φτάνουν στην κορυφή. 00:03:44.226 --> 00:03:46.426 Τελικά, εξαρτάται από εσάς να έχετε το νου σας 00:03:46.426 --> 00:03:48.376 για τις σελίδες που είναι αναξιόπιστες 00:03:48.376 --> 00:03:51.280 κοιτώντας στην διεύθυνσή τους και εξασφαλίζοντας ότι είναι μια 00:03:51.280 --> 00:03:52.930 αξιόπιστη πηγή. 00:03:52.930 --> 00:03:55.240 Τα προγράμματα αναζήτησης πάντα εξελίσσονται 00:03:55.240 --> 00:03:57.830 για να βελτιώνουν τους αλγορίθμους που δίνουν καλύτερα 00:03:57.830 --> 00:03:59.170 και γρηγορότερα αποτελέσματα 00:03:59.170 --> 00:04:00.460 από τους ανταγωνιστές τους. 00:04:00.460 --> 00:04:03.440 Σήμερα, οι μηχανές αναζήτησης χρησιμοποιούν ακόμα πληροφορίες 00:04:03.440 --> 00:04:06.820 που δεν έχετε παράσχει ξεκάθαρα για να εξειδικεύσετε την αναζήτησή σας. 00:04:07.740 --> 00:04:10.710 Αν για παράδειγμα κάνατε μια αναζήτηση για πάρκα σκύλων, 00:04:10.710 --> 00:04:13.230 πολλές μηχανές αναζήτησης θα σας δώσουν αποτελέσματα 00:04:13.230 --> 00:04:15.470 για όλα τα πάρκα σκύλων κοντά στην περιοχή σας 00:04:15.470 --> 00:04:17.800 ακόμα και αν δεν πληκτρολογήσατε την περιοχή σας. 00:04:17.800 --> 00:04:20.530 Σύγχρονες μηχανές αναζήτησης κατανοούν περισσότερα επίσης 00:04:20.530 --> 00:04:22.260 από λέξεις απλώς πάνω σε μια σελίδα 00:04:22.300 --> 00:04:24.970 αλλά τι σημαίνουν στην ουσία για να βρουν την καλύτερη 00:04:24.970 --> 00:04:26.750 που ταιριάζει με αυτό που ψάχνετε. 00:04:27.130 --> 00:04:29.980 Αν για παράδειγμα ερευνάτε για γρήγορο πίτσερ 00:04:30.280 --> 00:04:32.300 θα ξέρει πως ψάχνετε για αθλητή. 00:04:32.500 --> 00:04:34.450 Αλλά αν ψάχνετε για μεγάλη κανάτα, 00:04:34.450 --> 00:04:36.730 θα βρει εναλλακτικές για την κουζίνα σας. 00:04:36.730 --> 00:04:40.255 Για την καλύτερη κατανόηση των λέξεων, χρησιμοποιούμε κάτι που αποκαλείται 00:04:40.255 --> 00:04:41.910 εκμάθηση μηχανής, 00:04:41.910 --> 00:04:43.985 ένα είδος τεχνητής νοημοσύνης. 00:04:43.985 --> 00:04:46.600 δίνει το περιθώριο σε αλγορίθμους έρευνας να αναζητούν 00:04:47.020 --> 00:04:49.330 όχι μόνο γράμματα ξεχωριστά ή λέξεις σε σελίδα. 00:04:49.330 --> 00:04:52.210 αλλά την καλύτερη κατανόηση του νοήματος των λέξεων. 00:04:52.290 --> 00:04:54.450 Το διαδίκτυο αυξάνεται ραγδαία, 00:04:55.100 --> 00:04:58.010 αλλά αν η δουλεία των ομάδων που σχεδιάζουν μηχανές αναζήτησης 00:04:58.010 --> 00:04:59.810 γίνεται σωστά, 00:05:00.080 --> 00:05:04.090 οι πληροφορίες που θέλετε θα πρέπει να είναι πάντα κοντά σας.