0:00:00.420,0:00:04.660 Google Oversett er et gratisverktøy som du kan bruke til å oversette setninger, dokumenter 0:00:04.660,0:00:07.680 og til og med hele nettsteder – med ett tastetrykk. 0:00:07.680,0:00:12.099 Men hvordan fungerer det egentlig? Selv om det virker som om vi har et helt rom fullt av tospråklige 0:00:12.099,0:00:17.470 alver som jobber for oss, gjøres faktisk all oversettelsen av datamaskiner. Disse datamaskinene 0:00:17.470,0:00:22.520 bruker en prosess som kalles «statistisk maskinoversettelse» – som på godt norsk betyr at 0:00:22.520,0:00:25.439 datamaskinene genererer oversettelser basert på mønstre som finnes i store mengder av tekst. 0:00:25.439,0:00:30.539 Men la oss gå ett steg tilbake. Hvis du vil lære noen et nytt språk, vil du ofte starte med gloser og 0:00:30.539,0:00:34.809 grammatiske regler som forklarer hvordan setninger er bygd opp. En datamaskin kan lære et fremmedspråk 0:00:34.809,0:00:42.379 på samme måte – ved å basere seg på gloser og et sett regler. 0:00:42.379,0:00:46.309 Men språk er kompliserte, og som enhver språkperson kan fortelle deg, finnes det unntak til nesten alle 0:00:46.309,0:00:51.679 regler. Når du prøver å fange opp alle disse unntakene og unntakene til unntakene i et 0:00:51.679,0:00:57.239 dataprogram, går det ut over kvaliteten på oversettelsen. 0:00:57.239,0:01:01.779 Google Oversett baserer seg på en annen tilnærming. I stedet for å forsøke å lære datamaskinene 0:01:01.779,0:01:07.060 alle regler i et språk, lar vi datamaskinene oppdage reglene selv. Det gjør de ved å 0:01:07.060,0:01:10.619 analysere millioner av dokumenter som allerede er oversatt av mennesker. Disse oversatte 0:01:10.619,0:01:17.259 tekstene hentes fra bøker, organisasjoner, som for eksempel FN, og nettsteder 0:01:17.259,0:01:19.950 fra hele verden. 0:01:19.950,0:01:23.810 Datamaskinene skanner tekstene og ser etter statistisk signifikante mønstre – det vil 0:01:23.810,0:01:27.969 si mønstre mellom oversettelsen og den originale teksten som ikke kan antas å 0:01:27.969,0:01:33.829 være tilfeldige. Når datamaskinen finner et mønster, kan den bruke dette mønsteret til 0:01:33.829,0:01:38.710 å oversette lignende tekst i fremtiden. Når du gjentar denne prosessen milliarder av 0:01:38.710,0:01:43.700 ganger, ender du opp med milliarder av mønstre – og et svært intelligent dataprogram. 0:01:43.700,0:01:48.399 For enkelte språk har vi imidlertid færre tilgjengelige oversatte dokumenter og 0:01:48.399,0:01:53.049 derfor færre mønstre som programmet har gjenkjent. Derfor vil kvaliteten på 0:01:53.049,0:01:58.479 oversettelsen variere mellom språk og språkpar. Vi vet at oversettelsene ikke alltid er 0:01:58.479,0:02:03.240 perfekt, men ved å stadig tilføre nye oversatte tekster, kan vi gjøre datamaskinene smartere 0:02:03.240,0:02:05.539 og oversettelsene bedre. 0:02:05.539,0:02:09.670 Neste gang du oversetter en setning eller nettside med Google Oversett, kan du tenke 0:02:09.670,0:02:15.349 på de millionene av dokumenter og milliardene av mønstre som ligger bak oversettelsen – og som 0:02:15.349,0:02:17.650 gir deg resultatene i løpet av et øyeblikk. 0:02:17.650,0:02:19.260 Ganske stilig, ikke sant? 0:02:19.260,9:59:59.000 Prøv det på translate.google.com.