WEBVTT 00:00:00.420 --> 00:00:04.660 Google Oversett er et gratisverktøy som du kan bruke til å oversette setninger, dokumenter 00:00:04.660 --> 00:00:07.680 og til og med hele nettsteder – med ett tastetrykk. 00:00:07.680 --> 00:00:12.099 Men hvordan fungerer det egentlig? Selv om det virker som om vi har et helt rom fullt av tospråklige 00:00:12.099 --> 00:00:17.470 alver som jobber for oss, gjøres faktisk all oversettelsen av datamaskiner. Disse datamaskinene 00:00:17.470 --> 00:00:22.520 bruker en prosess som kalles «statistisk maskinoversettelse» – som på godt norsk betyr at 00:00:22.520 --> 00:00:25.439 datamaskinene genererer oversettelser basert på mønstre som finnes i store mengder av tekst. 00:00:25.439 --> 00:00:30.539 Men la oss gå ett steg tilbake. Hvis du vil lære noen et nytt språk, vil du ofte starte med gloser og 00:00:30.539 --> 00:00:34.809 grammatiske regler som forklarer hvordan setninger er bygd opp. En datamaskin kan lære et fremmedspråk 00:00:34.809 --> 00:00:42.379 på samme måte – ved å basere seg på gloser og et sett regler. 00:00:42.379 --> 00:00:46.309 Men språk er kompliserte, og som enhver språkperson kan fortelle deg, finnes det unntak til nesten alle 00:00:46.309 --> 00:00:51.679 regler. Når du prøver å fange opp alle disse unntakene og unntakene til unntakene i et 00:00:51.679 --> 00:00:57.239 dataprogram, går det ut over kvaliteten på oversettelsen. 00:00:57.239 --> 00:01:01.779 Google Oversett baserer seg på en annen tilnærming. I stedet for å forsøke å lære datamaskinene 00:01:01.779 --> 00:01:07.060 alle regler i et språk, lar vi datamaskinene oppdage reglene selv. Det gjør de ved å 00:01:07.060 --> 00:01:10.619 analysere millioner av dokumenter som allerede er oversatt av mennesker. Disse oversatte 00:01:10.619 --> 00:01:17.259 tekstene hentes fra bøker, organisasjoner, som for eksempel FN, og nettsteder 00:01:17.259 --> 00:01:19.950 fra hele verden. 00:01:19.950 --> 00:01:23.810 Datamaskinene skanner tekstene og ser etter statistisk signifikante mønstre – det vil 00:01:23.810 --> 00:01:27.969 si mønstre mellom oversettelsen og den originale teksten som ikke kan antas å 00:01:27.969 --> 00:01:33.829 være tilfeldige. Når datamaskinen finner et mønster, kan den bruke dette mønsteret til 00:01:33.829 --> 00:01:38.710 å oversette lignende tekst i fremtiden. Når du gjentar denne prosessen milliarder av 00:01:38.710 --> 00:01:43.700 ganger, ender du opp med milliarder av mønstre – og et svært intelligent dataprogram. 00:01:43.700 --> 00:01:48.399 For enkelte språk har vi imidlertid færre tilgjengelige oversatte dokumenter og 00:01:48.399 --> 00:01:53.049 derfor færre mønstre som programmet har gjenkjent. Derfor vil kvaliteten på 00:01:53.049 --> 00:01:58.479 oversettelsen variere mellom språk og språkpar. Vi vet at oversettelsene ikke alltid er 00:01:58.479 --> 00:02:03.240 perfekt, men ved å stadig tilføre nye oversatte tekster, kan vi gjøre datamaskinene smartere 00:02:03.240 --> 00:02:05.539 og oversettelsene bedre. 00:02:05.539 --> 00:02:09.670 Neste gang du oversetter en setning eller nettside med Google Oversett, kan du tenke 00:02:09.670 --> 00:02:15.349 på de millionene av dokumenter og milliardene av mønstre som ligger bak oversettelsen – og som 00:02:15.349 --> 00:02:17.650 gir deg resultatene i løpet av et øyeblikk. 00:02:17.650 --> 00:02:19.260 Ganske stilig, ikke sant? 00:02:19.260 --> 99:59:59.999 Prøv det på translate.google.com.