1 00:00:00,420 --> 00:00:04,660 Google Oversett er et gratisverktøy som du kan bruke til å oversette setninger, dokumenter 2 00:00:04,660 --> 00:00:07,680 og til og med hele nettsteder – med ett tastetrykk. 3 00:00:07,680 --> 00:00:12,099 Men hvordan fungerer det egentlig? Selv om det virker som om vi har et helt rom fullt av tospråklige 4 00:00:12,099 --> 00:00:17,470 alver som jobber for oss, gjøres faktisk all oversettelsen av datamaskiner. Disse datamaskinene 5 00:00:17,470 --> 00:00:22,520 bruker en prosess som kalles «statistisk maskinoversettelse» – som på godt norsk betyr at 6 00:00:22,520 --> 00:00:25,439 datamaskinene genererer oversettelser basert på mønstre som finnes i store mengder av tekst. 7 00:00:25,439 --> 00:00:30,539 Men la oss gå ett steg tilbake. Hvis du vil lære noen et nytt språk, vil du ofte starte med gloser og 8 00:00:30,539 --> 00:00:34,809 grammatiske regler som forklarer hvordan setninger er bygd opp. En datamaskin kan lære et fremmedspråk 9 00:00:34,809 --> 00:00:42,379 på samme måte – ved å basere seg på gloser og et sett regler. 10 00:00:42,379 --> 00:00:46,309 Men språk er kompliserte, og som enhver språkperson kan fortelle deg, finnes det unntak til nesten alle 11 00:00:46,309 --> 00:00:51,679 regler. Når du prøver å fange opp alle disse unntakene og unntakene til unntakene i et 12 00:00:51,679 --> 00:00:57,239 dataprogram, går det ut over kvaliteten på oversettelsen. 13 00:00:57,239 --> 00:01:01,779 Google Oversett baserer seg på en annen tilnærming. I stedet for å forsøke å lære datamaskinene 14 00:01:01,779 --> 00:01:07,060 alle regler i et språk, lar vi datamaskinene oppdage reglene selv. Det gjør de ved å 15 00:01:07,060 --> 00:01:10,619 analysere millioner av dokumenter som allerede er oversatt av mennesker. Disse oversatte 16 00:01:10,619 --> 00:01:17,259 tekstene hentes fra bøker, organisasjoner, som for eksempel FN, og nettsteder 17 00:01:17,259 --> 00:01:19,950 fra hele verden. 18 00:01:19,950 --> 00:01:23,810 Datamaskinene skanner tekstene og ser etter statistisk signifikante mønstre – det vil 19 00:01:23,810 --> 00:01:27,969 si mønstre mellom oversettelsen og den originale teksten som ikke kan antas å 20 00:01:27,969 --> 00:01:33,829 være tilfeldige. Når datamaskinen finner et mønster, kan den bruke dette mønsteret til 21 00:01:33,829 --> 00:01:38,710 å oversette lignende tekst i fremtiden. Når du gjentar denne prosessen milliarder av 22 00:01:38,710 --> 00:01:43,700 ganger, ender du opp med milliarder av mønstre – og et svært intelligent dataprogram. 23 00:01:43,700 --> 00:01:48,399 For enkelte språk har vi imidlertid færre tilgjengelige oversatte dokumenter og 24 00:01:48,399 --> 00:01:53,049 derfor færre mønstre som programmet har gjenkjent. Derfor vil kvaliteten på 25 00:01:53,049 --> 00:01:58,479 oversettelsen variere mellom språk og språkpar. Vi vet at oversettelsene ikke alltid er 26 00:01:58,479 --> 00:02:03,240 perfekt, men ved å stadig tilføre nye oversatte tekster, kan vi gjøre datamaskinene smartere 27 00:02:03,240 --> 00:02:05,539 og oversettelsene bedre. 28 00:02:05,539 --> 00:02:09,670 Neste gang du oversetter en setning eller nettside med Google Oversett, kan du tenke 29 00:02:09,670 --> 00:02:15,349 på de millionene av dokumenter og milliardene av mønstre som ligger bak oversettelsen – og som 30 00:02:15,349 --> 00:02:17,650 gir deg resultatene i løpet av et øyeblikk. 31 00:02:17,650 --> 00:02:19,260 Ganske stilig, ikke sant? 32 00:02:19,260 --> 99:59:59,999 Prøv det på translate.google.com.