WEBVTT

00:00:00.420 --> 00:00:04.660
Google Oversett er et gratisverktøy som du kan bruke til å oversette setninger, dokumenter

00:00:04.660 --> 00:00:07.680
og til og med hele nettsteder – med ett tastetrykk.

00:00:07.680 --> 00:00:12.099
Men hvordan fungerer det egentlig? Selv om det virker som om vi har et helt rom fullt av tospråklige

00:00:12.099 --> 00:00:17.470
alver som jobber for oss, gjøres faktisk all oversettelsen av datamaskiner. Disse datamaskinene

00:00:17.470 --> 00:00:22.520
bruker en prosess som kalles «statistisk maskinoversettelse» – som på godt norsk betyr at

00:00:22.520 --> 00:00:25.439
datamaskinene genererer oversettelser basert på mønstre som finnes i store mengder av tekst.

00:00:25.439 --> 00:00:30.539
Men la oss gå ett steg tilbake. Hvis du vil lære noen et nytt språk, vil du ofte starte med gloser og

00:00:30.539 --> 00:00:34.809
grammatiske regler som forklarer hvordan setninger er bygd opp. En datamaskin kan lære et fremmedspråk

00:00:34.809 --> 00:00:42.379
på samme måte – ved å basere seg på gloser og et sett regler.

00:00:42.379 --> 00:00:46.309
Men språk er kompliserte, og som enhver språkperson kan fortelle deg, finnes det unntak til nesten alle

00:00:46.309 --> 00:00:51.679
regler. Når du prøver å fange opp alle disse unntakene og unntakene til unntakene i et

00:00:51.679 --> 00:00:57.239
dataprogram, går det ut over kvaliteten på oversettelsen.

00:00:57.239 --> 00:01:01.779
Google Oversett baserer seg på en annen tilnærming. I stedet for å forsøke å lære datamaskinene

00:01:01.779 --> 00:01:07.060
alle regler i et språk, lar vi datamaskinene oppdage reglene selv. Det gjør de ved å

00:01:07.060 --> 00:01:10.619
analysere millioner av dokumenter som allerede er oversatt av mennesker. Disse oversatte

00:01:10.619 --> 00:01:17.259
tekstene hentes fra bøker, organisasjoner, som for eksempel FN, og nettsteder

00:01:17.259 --> 00:01:19.950
fra hele verden.

00:01:19.950 --> 00:01:23.810
Datamaskinene skanner tekstene og ser etter statistisk signifikante mønstre – det vil

00:01:23.810 --> 00:01:27.969
si mønstre mellom oversettelsen og den originale teksten som ikke kan antas å

00:01:27.969 --> 00:01:33.829
være tilfeldige. Når datamaskinen finner et mønster, kan den bruke dette mønsteret til

00:01:33.829 --> 00:01:38.710
å oversette lignende tekst i fremtiden. Når du gjentar denne prosessen milliarder av

00:01:38.710 --> 00:01:43.700
ganger, ender du opp med milliarder av mønstre – og et svært intelligent dataprogram.

00:01:43.700 --> 00:01:48.399
For enkelte språk har vi imidlertid færre tilgjengelige oversatte dokumenter og

00:01:48.399 --> 00:01:53.049
derfor færre mønstre som programmet har gjenkjent. Derfor vil kvaliteten på

00:01:53.049 --> 00:01:58.479
oversettelsen variere mellom språk og språkpar. Vi vet at oversettelsene ikke alltid er

00:01:58.479 --> 00:02:03.240
perfekt, men ved å stadig tilføre nye oversatte tekster, kan vi gjøre datamaskinene smartere

00:02:03.240 --> 00:02:05.539
og oversettelsene bedre.

00:02:05.539 --> 00:02:09.670
Neste gang du oversetter en setning eller nettside med Google Oversett, kan du tenke

00:02:09.670 --> 00:02:15.349
på de millionene av dokumenter og milliardene av mønstre som ligger bak oversettelsen – og som

00:02:15.349 --> 00:02:17.650
gir deg resultatene i løpet av et øyeblikk.

00:02:17.650 --> 00:02:19.260
Ganske stilig, ikke sant?

00:02:19.260 --> 99:59:59.999
Prøv det på translate.google.com.