Γεια, με λένε Τζον. Ηγούμαι των ομάδων εκμάθησης αναζήτησης και μηχανής στην Google. Πιστεύω ότι είναι εκπληκτικά συγκλονιστικό ότι άνθρωποι από όλο τον κόσμο στρέφονται σε μηχανές αναζήτησης για να ρωτήσουν τετριμμένες ερωτήσεις. και απίστευτα σημαντικές ερωτήσεις. Άρα, είναι τεράστια ευθύνη να τους δίνουμε τις καλύτερες απαντήσεις που μπορούμε, Γεια, με λένε Αξάγια και δουλεύω στην ομάδα αναζήτησης Bing. Πολλές φορές θα ξεκινήσουμε να ερευνούμε την τεχνητή νοημοσύνη και την εκμάθηση μηχανής, αλλά θα πρέπει να αναρωτιόμαστε πώς οι χρήστες θα κάνουν χρήση, γιατί σε τελική ανάλυση, θέλουμε να αφήσουμε τη σφραγίδα μας πάνω στην κοινωνία. Ας ρωτήσουμε ένα απλό ερώτημα: Πόσος χρόνος χρειάζεται για να ταξιδέψουμε στον Άρη; Από που προήλθαν αυτά τα αποτελέσματα και γιατί αυτό απαριθμήθηκε πριν από το άλλο; Εντάξει, ας κάνουμε μια βουτιά στα βαθιά για να δούμε πώς η μηχανή αναζήτησης μετέτρεψε το ερώτημά σας σε αποτέλεσμα. Το πρώτο πράγμα που πρέπει να ξέρετε είναι πως όταν κάνετε μια έρευνα, η μηχανή αναζήτησης δεν πηγαίνει έξω στο Παγκόσμιο Δίκτυο/Διαδίκτυο για να εκτελέσει την έρευνα σε πραγματικό χρόνο. Και αυτό γιατί υπάρχουν πάνω από δισεκατομμύρια ιστότοποι στο διαδίκτυο και εκατοντάδες άλλοι που δημιουργούνται κάθε στιγμή και λεπτό. Έτσι, αν η μηχανή αναζήτησης έπρεπε να ερευνήσει κάθε ξεχωριστό ιστότοπο για να βρει αυτό που θέλατε, θα χρειαζόταν άπειρο χρόνο. Άρα, για μια γρηγορότερη αναζήτηση, οι μηχανές αναζήτησης συνεχώς το διαδίκτυο εκ των προτέρων για να καταγράψουν πληροφορίες που ενδέχεται να βοηθήσουν με την αναζήτησή σας αργότερα. Κατά αυτόν τον τρόπο, όταν ερευνάτε για ταξίδια στον Άρη, η μηχανή αναζήτησης έχει ήδη ό,τι χρειάζεται για να σας δώσει μια απάντηση σε πραγματικό χρόνο. Το διαδίκτυο είναι ένα δίκτυο σελίδων συνδεδεμένο με υπερσυνδέσμους. Οι μηχανές αναζήτησης τρέχουν ένα πρόγραμμα διαρκώς που αποκαλείται Αράχνη που διασχίζει αυτές τις σελίδες δικτύου για να συλλέγει πληροφορίες σχετικά με αυτές. Κάθε φορά που βρίσκει έναν υπερσύνδεσμο, τον ακολουθεί μέχρι να έχει επισκεφθεί κάθε σελίδα, που μπορεί να βρει σε ολόκληρο το διαδίκτυο. Για κάθε σελίδα που επισκέπτεται η αράχνη, καταγράφει οποιαδήποτε τυχόν πληροφορία μπορεί να χρειαστεί για μια αναζήτηση με την προσθήκη της σε μια ειδική βάση δεδομένων που ονομάζεται δείκτης έρευνας. Τώρα, ας πάμε σε εκείνη την έρευνα που κάναμε νωρίτερα και ας δούμε αν μπορούμε να καταλάβουμε πως η μηχανή αναζήτησης βρήκε τα αποτελέσματα. Όταν ρωτάμε ποσό χρειάζεται για να ταξιδέψουμε στον Άρη, η μηχανή αναζήτησης αναζητά κάθε μία από αυτές τις λέξεις στον δείκτη έρευνας για να βρει αμέσως μια λίστα όλων των σελίδων στο διαδίκτυο που περιέχουν αυτές τις λέξεις. Αλλά μόνο η έρευνα για αυτούς τους όρους αναζήτησης μπορεί να επιστρέφει χιλιάδες σελίδες, έτσι η μηχανή αναζήτησης θα πρέπει να μπορεί να καθορίσει τις καλύτερες αντιστοιχίες για να σας τις δείξει πρώτες. Σε αυτό το σημείο γίνεται πολύπλοκο γιατί η μηχανή αναζήτησης μπορεί να χρειαστεί να μαντέψει τι ψάχνετε. Κάθε μηχανή αναζήτησης χρησιμοποιεί τον δικό της αλγόριθμο για να κατατάξει τις σελίδες βάση αυτού που πιστεύει ότι θέλετε. Ο αλγόριθμός κατάταξης της μηχανής αναζήτησης μπορεί να ελέγχει αν ο όρος αναζήτησης σας εμφανίζεται στον τίτλο της σελίδας αν όλες οι λέξεις εμφανίζονται η μία μετά την άλλη ή οποιονδήποτε αριθμό άλλων υπολογισμών για να βοηθήσει να καθοριστεί καλύτερα ποιες σελίδες θέλετε να δείτε και ποιες όχι. Η Google επινόησε τον πιο γνωστό αλγόριθμο για την επιλογή των πιο σχετικών αποτελεσμάτων μιας αναζήτησης συνυπολογίζοντας πόσες άλλες σελίδες συνδέθηκαν με μια συγκεκριμένη σελίδα. Αν πχ πολλοί ιστότοποι πιστεύουν ότι μια ιστοσελίδα είναι ενδιαφέρουσα, τότε πιθανώς να είναι αυτή που ψάχνετε. Αυτός ο αλγόριθμος ονομάζεται κατάταξη σελίδας όχι γιατί κατατάσσει ιστοσελίδες, αλλά γιατί ονομάστηκε από τον εφευρέτη του, Larry Page, που είναι ένας από τους ιδρυτές της Google. Επειδή ένας ιστότοπος συχνά βγάζει χρήματα όταν πηγαίνετε σε αυτόν οι σπάμμερς προσπαθούν ακατάπαυστα να βρουν τρόπους οι σελίδες τους να απαριθμούνται υψηλότερα στα αποτελέσματα. Οι μηχανές αναζήτησης ενημερώνουν τους αλγορίθμους τους τακτικά έτσι ώστε ψεύτικές ή αναξιόπιστες τοποθεσίες να μην φτάνουν στην κορυφή. Τελικά, εξαρτάται από εσάς να έχετε το νου σας για τις σελίδες που είναι αναξιόπιστες κοιτώντας στην διεύθυνσή τους και εξασφαλίζοντας ότι είναι μια αξιόπιστη πηγή. Τα προγράμματα αναζήτησης πάντα εξελίσσονται για να βελτιώνουν τους αλγορίθμους που δίνουν καλύτερα και γρηγορότερα αποτελέσματα από τους ανταγωνιστές τους. Σήμερα, οι μηχανές αναζήτησης χρησιμοποιούν ακόμα πληροφορίες που δεν έχετε παράσχει ξεκάθαρα για να εξειδικεύσετε την αναζήτησή σας. Αν για παράδειγμα κάνατε μια αναζήτηση για πάρκα σκύλων, πολλές μηχανές αναζήτησης θα σας δώσουν αποτελέσματα για όλα τα πάρκα σκύλων κοντά στην περιοχή σας ακόμα και αν δεν πληκτρολογήσατε την περιοχή σας. Σύγχρονες μηχανές αναζήτησης κατανοούν περισσότερα επίσης από λέξεις απλώς πάνω σε μια σελίδα αλλά τι σημαίνουν στην ουσία για να βρουν την καλύτερη που ταιριάζει με αυτό που ψάχνετε. Αν για παράδειγμα ερευνάτε για γρήγορο πίτσερ θα ξέρει πως ψάχνετε για αθλητή. Αλλά αν ψάχνετε για μεγάλη κανάτα, θα βρει εναλλακτικές για την κουζίνα σας. Για την καλύτερη κατανόηση των λέξεων, χρησιμοποιούμε κάτι που αποκαλείται εκμάθηση μηχανής, ένα είδος τεχνητής νοημοσύνης. δίνει το περιθώριο σε αλγορίθμους έρευνας να αναζητούν όχι μόνο γράμματα ξεχωριστά ή λέξεις σε σελίδα. αλλά την καλύτερη κατανόηση του νοήματος των λέξεων. Το διαδίκτυο αυξάνεται ραγδαία, αλλά αν η δουλεία των ομάδων που σχεδιάζουν μηχανές αναζήτησης γίνεται σωστά, οι πληροφορίες που θέλετε θα πρέπει να είναι πάντα κοντά σας.