1 00:00:06,070 --> 00:00:07,120 Γεια, με λένε Τζον. 2 00:00:07,510 --> 00:00:10,620 Ηγούμαι των ομάδων εκμάθησης αναζήτησης και μηχανής στην Google. 3 00:00:11,130 --> 00:00:14,230 Πιστεύω ότι είναι εκπληκτικά συγκλονιστικό 4 00:00:14,230 --> 00:00:16,214 ότι άνθρωποι από όλο τον κόσμο 5 00:00:16,215 --> 00:00:19,650 στρέφονται σε μηχανές αναζήτησης για να ρωτήσουν τετριμμένες ερωτήσεις. 6 00:00:19,650 --> 00:00:21,320 και απίστευτα σημαντικές ερωτήσεις. 7 00:00:21,320 --> 00:00:23,450 Άρα, είναι τεράστια ευθύνη να τους δίνουμε 8 00:00:23,450 --> 00:00:25,504 τις καλύτερες απαντήσεις που μπορούμε, 9 00:00:26,710 --> 00:00:30,610 Γεια, με λένε Αξάγια και δουλεύω στην ομάδα αναζήτησης Bing. 10 00:00:30,910 --> 00:00:33,190 Πολλές φορές θα ξεκινήσουμε να ερευνούμε 11 00:00:33,190 --> 00:00:35,800 την τεχνητή νοημοσύνη και την εκμάθηση μηχανής, 12 00:00:35,830 --> 00:00:39,010 αλλά θα πρέπει να αναρωτιόμαστε πώς οι χρήστες θα κάνουν χρήση, 13 00:00:39,140 --> 00:00:41,975 γιατί σε τελική ανάλυση, θέλουμε να αφήσουμε τη σφραγίδα μας 14 00:00:41,975 --> 00:00:43,600 πάνω στην κοινωνία. 15 00:00:43,780 --> 00:00:45,400 Ας ρωτήσουμε ένα απλό ερώτημα: 16 00:00:45,820 --> 00:00:48,530 Πόσος χρόνος χρειάζεται για να ταξιδέψουμε στον Άρη; 17 00:00:49,330 --> 00:00:51,180 Από που προήλθαν αυτά τα αποτελέσματα 18 00:00:51,370 --> 00:00:54,100 και γιατί αυτό απαριθμήθηκε πριν από το άλλο; 19 00:00:54,100 --> 00:00:57,830 Εντάξει, ας κάνουμε μια βουτιά στα βαθιά για να δούμε πώς η μηχανή αναζήτησης 20 00:00:57,830 --> 00:00:59,980 μετέτρεψε το ερώτημά σας σε αποτέλεσμα. 21 00:00:59,980 --> 00:01:03,360 Το πρώτο πράγμα που πρέπει να ξέρετε είναι πως όταν κάνετε μια έρευνα, 22 00:01:03,360 --> 00:01:06,610 η μηχανή αναζήτησης δεν πηγαίνει έξω στο Παγκόσμιο Δίκτυο/Διαδίκτυο 23 00:01:06,610 --> 00:01:08,900 για να εκτελέσει την έρευνα σε πραγματικό χρόνο. 24 00:01:08,900 --> 00:01:11,630 Και αυτό γιατί υπάρχουν πάνω από δισεκατομμύρια ιστότοποι 25 00:01:11,630 --> 00:01:15,290 στο διαδίκτυο και εκατοντάδες άλλοι που δημιουργούνται κάθε στιγμή και λεπτό. 26 00:01:15,290 --> 00:01:17,620 Έτσι, αν η μηχανή αναζήτησης έπρεπε να ερευνήσει 27 00:01:17,620 --> 00:01:20,100 κάθε ξεχωριστό ιστότοπο για να βρει αυτό που θέλατε, 28 00:01:20,100 --> 00:01:21,390 θα χρειαζόταν άπειρο χρόνο. 29 00:01:21,400 --> 00:01:23,120 Άρα, για μια γρηγορότερη αναζήτηση, 30 00:01:23,120 --> 00:01:25,890 οι μηχανές αναζήτησης συνεχώς το διαδίκτυο εκ των προτέρων 31 00:01:25,890 --> 00:01:29,455 για να καταγράψουν πληροφορίες που ενδέχεται να βοηθήσουν με την αναζήτησή 32 00:01:29,455 --> 00:01:30,440 σας αργότερα. 33 00:01:30,440 --> 00:01:33,160 Κατά αυτόν τον τρόπο, όταν ερευνάτε για ταξίδια στον Άρη, 34 00:01:33,160 --> 00:01:35,300 η μηχανή αναζήτησης έχει ήδη ό,τι χρειάζεται 35 00:01:35,300 --> 00:01:37,680 για να σας δώσει μια απάντηση σε πραγματικό χρόνο. 36 00:01:37,680 --> 00:01:40,930 Το διαδίκτυο είναι ένα δίκτυο σελίδων συνδεδεμένο με υπερσυνδέσμους. 37 00:01:40,930 --> 00:01:43,370 Οι μηχανές αναζήτησης τρέχουν ένα πρόγραμμα διαρκώς 38 00:01:43,370 --> 00:01:46,320 που αποκαλείται Αράχνη που διασχίζει αυτές τις σελίδες δικτύου 39 00:01:46,320 --> 00:01:48,470 για να συλλέγει πληροφορίες σχετικά με αυτές. 40 00:01:48,470 --> 00:01:50,430 Κάθε φορά που βρίσκει έναν υπερσύνδεσμο, 41 00:01:50,430 --> 00:01:53,340 τον ακολουθεί μέχρι να έχει επισκεφθεί κάθε σελίδα, 42 00:01:53,340 --> 00:01:55,550 που μπορεί να βρει σε ολόκληρο το διαδίκτυο. 43 00:01:55,550 --> 00:01:57,585 Για κάθε σελίδα που επισκέπτεται η αράχνη, 44 00:01:58,390 --> 00:02:02,320 καταγράφει οποιαδήποτε τυχόν πληροφορία μπορεί να χρειαστεί για μια αναζήτηση 45 00:02:02,500 --> 00:02:06,320 με την προσθήκη της σε μια ειδική βάση δεδομένων που ονομάζεται δείκτης έρευνας. 46 00:02:06,320 --> 00:02:08,934 Τώρα, ας πάμε σε εκείνη την έρευνα που κάναμε νωρίτερα 47 00:02:08,934 --> 00:02:11,944 και ας δούμε αν μπορούμε να καταλάβουμε πως η μηχανή αναζήτησης 48 00:02:11,944 --> 00:02:13,287 βρήκε τα αποτελέσματα. 49 00:02:13,287 --> 00:02:16,107 Όταν ρωτάμε ποσό χρειάζεται για να ταξιδέψουμε στον Άρη, 50 00:02:16,107 --> 00:02:18,860 η μηχανή αναζήτησης αναζητά κάθε μία από αυτές τις λέξεις 51 00:02:18,860 --> 00:02:21,350 στον δείκτη έρευνας για να βρει αμέσως μια λίστα 52 00:02:21,350 --> 00:02:24,440 όλων των σελίδων στο διαδίκτυο που περιέχουν αυτές τις λέξεις. 53 00:02:24,440 --> 00:02:26,870 Αλλά μόνο η έρευνα για αυτούς τους όρους αναζήτησης 54 00:02:26,870 --> 00:02:28,760 μπορεί να επιστρέφει χιλιάδες σελίδες, 55 00:02:28,760 --> 00:02:31,440 έτσι η μηχανή αναζήτησης θα πρέπει να μπορεί να καθορίσει 56 00:02:31,440 --> 00:02:34,103 τις καλύτερες αντιστοιχίες για να σας τις δείξει πρώτες. 57 00:02:34,103 --> 00:02:37,010 Σε αυτό το σημείο γίνεται πολύπλοκο γιατί η μηχανή αναζήτησης 58 00:02:37,010 --> 00:02:39,060 μπορεί να χρειαστεί να μαντέψει τι ψάχνετε. 59 00:02:39,060 --> 00:02:41,880 Κάθε μηχανή αναζήτησης χρησιμοποιεί τον δικό της αλγόριθμο 60 00:02:41,880 --> 00:02:44,930 για να κατατάξει τις σελίδες βάση αυτού που πιστεύει ότι θέλετε. 61 00:02:44,930 --> 00:02:47,940 Ο αλγόριθμός κατάταξης της μηχανής αναζήτησης μπορεί να ελέγχει 62 00:02:47,940 --> 00:02:50,900 αν ο όρος αναζήτησης σας εμφανίζεται στον τίτλο της σελίδας 63 00:02:50,900 --> 00:02:53,820 αν όλες οι λέξεις εμφανίζονται η μία μετά την άλλη 64 00:02:53,820 --> 00:02:56,320 ή οποιονδήποτε αριθμό άλλων υπολογισμών 65 00:02:56,320 --> 00:02:58,610 για να βοηθήσει να καθοριστεί καλύτερα 66 00:02:58,670 --> 00:03:01,420 ποιες σελίδες θέλετε να δείτε και ποιες όχι. 67 00:03:01,420 --> 00:03:03,420 Η Google επινόησε τον πιο γνωστό αλγόριθμο 68 00:03:03,420 --> 00:03:06,375 για την επιλογή των πιο σχετικών αποτελεσμάτων μιας αναζήτησης 69 00:03:06,375 --> 00:03:08,160 συνυπολογίζοντας 70 00:03:08,440 --> 00:03:11,230 πόσες άλλες σελίδες συνδέθηκαν με μια συγκεκριμένη σελίδα. 71 00:03:11,470 --> 00:03:13,780 Αν πχ πολλοί ιστότοποι πιστεύουν 72 00:03:13,780 --> 00:03:15,660 ότι μια ιστοσελίδα είναι ενδιαφέρουσα, 73 00:03:15,660 --> 00:03:17,940 τότε πιθανώς να είναι αυτή που ψάχνετε. 74 00:03:17,940 --> 00:03:20,290 Αυτός ο αλγόριθμος ονομάζεται κατάταξη σελίδας 75 00:03:20,590 --> 00:03:22,330 όχι γιατί κατατάσσει ιστοσελίδες, 76 00:03:22,570 --> 00:03:25,210 αλλά γιατί ονομάστηκε από τον εφευρέτη του, Larry Page, 77 00:03:25,330 --> 00:03:27,453 που είναι ένας από τους ιδρυτές της Google. 78 00:03:27,460 --> 00:03:30,650 Επειδή ένας ιστότοπος συχνά βγάζει χρήματα όταν πηγαίνετε σε αυτόν 79 00:03:30,660 --> 00:03:34,080 οι σπάμμερς προσπαθούν ακατάπαυστα να βρουν τρόπους οι σελίδες τους να 80 00:03:34,080 --> 00:03:36,871 απαριθμούνται υψηλότερα στα αποτελέσματα. 81 00:03:37,750 --> 00:03:40,750 Οι μηχανές αναζήτησης ενημερώνουν τους αλγορίθμους τους τακτικά 82 00:03:40,750 --> 00:03:44,226 έτσι ώστε ψεύτικές ή αναξιόπιστες τοποθεσίες να μην φτάνουν στην κορυφή. 83 00:03:44,226 --> 00:03:46,426 Τελικά, εξαρτάται από εσάς να έχετε το νου σας 84 00:03:46,426 --> 00:03:48,376 για τις σελίδες που είναι αναξιόπιστες 85 00:03:48,376 --> 00:03:51,280 κοιτώντας στην διεύθυνσή τους και εξασφαλίζοντας ότι είναι μια 86 00:03:51,280 --> 00:03:52,930 αξιόπιστη πηγή. 87 00:03:52,930 --> 00:03:55,240 Τα προγράμματα αναζήτησης πάντα εξελίσσονται 88 00:03:55,240 --> 00:03:57,830 για να βελτιώνουν τους αλγορίθμους που δίνουν καλύτερα 89 00:03:57,830 --> 00:03:59,170 και γρηγορότερα αποτελέσματα 90 00:03:59,170 --> 00:04:00,460 από τους ανταγωνιστές τους. 91 00:04:00,460 --> 00:04:03,440 Σήμερα, οι μηχανές αναζήτησης χρησιμοποιούν ακόμα πληροφορίες 92 00:04:03,440 --> 00:04:06,820 που δεν έχετε παράσχει ξεκάθαρα για να εξειδικεύσετε την αναζήτησή σας. 93 00:04:07,740 --> 00:04:10,710 Αν για παράδειγμα κάνατε μια αναζήτηση για πάρκα σκύλων, 94 00:04:10,710 --> 00:04:13,230 πολλές μηχανές αναζήτησης θα σας δώσουν αποτελέσματα 95 00:04:13,230 --> 00:04:15,470 για όλα τα πάρκα σκύλων κοντά στην περιοχή σας 96 00:04:15,470 --> 00:04:17,800 ακόμα και αν δεν πληκτρολογήσατε την περιοχή σας. 97 00:04:17,800 --> 00:04:20,530 Σύγχρονες μηχανές αναζήτησης κατανοούν περισσότερα επίσης 98 00:04:20,530 --> 00:04:22,260 από λέξεις απλώς πάνω σε μια σελίδα 99 00:04:22,300 --> 00:04:24,970 αλλά τι σημαίνουν στην ουσία για να βρουν την καλύτερη 100 00:04:24,970 --> 00:04:26,750 που ταιριάζει με αυτό που ψάχνετε. 101 00:04:27,130 --> 00:04:29,980 Αν για παράδειγμα ερευνάτε για γρήγορο πίτσερ 102 00:04:30,280 --> 00:04:32,300 θα ξέρει πως ψάχνετε για αθλητή. 103 00:04:32,500 --> 00:04:34,450 Αλλά αν ψάχνετε για μεγάλη κανάτα, 104 00:04:34,450 --> 00:04:36,730 θα βρει εναλλακτικές για την κουζίνα σας. 105 00:04:36,730 --> 00:04:40,255 Για την καλύτερη κατανόηση των λέξεων, χρησιμοποιούμε κάτι που αποκαλείται 106 00:04:40,255 --> 00:04:41,910 εκμάθηση μηχανής, 107 00:04:41,910 --> 00:04:43,985 ένα είδος τεχνητής νοημοσύνης. 108 00:04:43,985 --> 00:04:46,600 δίνει το περιθώριο σε αλγορίθμους έρευνας να αναζητούν 109 00:04:47,020 --> 00:04:49,330 όχι μόνο γράμματα ξεχωριστά ή λέξεις σε σελίδα. 110 00:04:49,330 --> 00:04:52,210 αλλά την καλύτερη κατανόηση του νοήματος των λέξεων. 111 00:04:52,290 --> 00:04:54,450 Το διαδίκτυο αυξάνεται ραγδαία, 112 00:04:55,100 --> 00:04:58,010 αλλά αν η δουλεία των ομάδων που σχεδιάζουν μηχανές αναζήτησης 113 00:04:58,010 --> 00:04:59,810 γίνεται σωστά, 114 00:05:00,080 --> 00:05:04,090 οι πληροφορίες που θέλετε θα πρέπει να είναι πάντα κοντά σας.