WEBVTT 00:00:00.420 --> 00:00:04.660 Google'i tõlge on tasuta tööriist, millega saate kohe tõlkida lauseid, dokumente ja 00:00:04.660 --> 00:00:07.680 isegi terveid veebisaite. 00:00:07.680 --> 00:00:12.099 Kuidas see täpselt töötab? Kuigi võib näida, nagu töötaks toatäis kakskeelseid haldjaid 00:00:12.099 --> 00:00:17.470 meie heaks, tuleb tõlge tegelikult arvutitest. Need arvutid kasutavad „statistilise masintõlke“ 00:00:17.470 --> 00:00:22.520 protsessi, mis on lihtsalt peen viis öelda, et meie arvutid genereerivad tõlkeid suurtes 00:00:22.520 --> 00:00:25.439 tekstimassiivides leitud mustrite põhjal. 00:00:25.439 --> 00:00:30.539 Aga astume parem sammu tagasi. Kui soovite kellelegi uut keelt õpetada, alustate ehk 00:00:30.539 --> 00:00:34.809 sõnavara ja lausete konstrueerimist selgitavate grammatikareeglite õpetamisega. 00:00:34.809 --> 00:00:39.909 Arvuti saab sama moodi võõrkeelt õppida — toetudes sõnavarale 00:00:39.909 --> 00:00:42.379 ja reeglistikule. 00:00:42.379 --> 00:00:46.309 Kuid keeled on keerulised ja, nagu iga keeleõppur võib teile kinnitada, peaaegu 00:00:46.309 --> 00:00:51.679 igal reeglil on erandeid. Kui üritada kaasata neid erandeid ja erandite erandeid 00:00:51.679 --> 00:00:57.239 arvutiprogrammi, hakkab tõlkekvaliteet langema. 00:00:57.239 --> 00:01:01.779 Google'i tõlge läheneb asjale teisiti. Selle asemel, et õpetada arvutitele, kõiki keele 00:01:01.779 --> 00:01:07.060 reegleid, laseme arvutitel ise need reeglid avastada. Avastamiseks 00:01:07.060 --> 00:01:10.619 analüüsivad nad miljoneid ja miljoneid dokumente, mida inimestest tõlkijad 00:01:10.619 --> 00:01:17.259 on juba tõlkinud. Need tõlgitud tekstid tulevad raamatutest, organisatsioonidest (nt ÜRO) 00:01:17.259 --> 00:01:19.950 ja veebisaitidelt üle maailma. 00:01:19.950 --> 00:01:23.810 Meie arvutid skannivad neid tekste, otsides statistiliselt olulisi mustreid, st tõlke 00:01:23.810 --> 00:01:27.969 ja lähteteksti vahelisi mustreid, mis tõenäoliselt ei ole juhuslikud. 00:01:27.969 --> 00:01:33.829 Kui arvuti on mustri leidnud, saab ta seda tulevikus kasutada sarnaste tekstide 00:01:33.829 --> 00:01:38.710 tõlkimiseks. Kui protsessi miljardeid kordi korrata, on lõpptulemuseks miljardid 00:01:38.710 --> 00:01:43.700 mustrid ja üks väga nutikas arvutiprogramm. 00:01:43.700 --> 00:01:48.399 Kuid mõnedes keeltes on meil vähem tõlgitud dokumente kasutada ja seega on ka meie 00:01:48.399 --> 00:01:53.049 tarkvara tuvastanud vähem mustreid. Seetõttu on tõlke kvaliteet erinevates keeltes ja 00:01:53.049 --> 00:01:58.479 keelepaarides erinev. Me teame, et meie tõlked ei ole alati täiuslikud, kuid pidevalt uusi 00:01:58.479 --> 00:02:03.240 tõlgitud tekste pakkudes muudame arvutid nutikamaks ja tõlked 00:02:03.240 --> 00:02:05.539 paremaks. 00:02:05.539 --> 00:02:09.670 Kui te järgmine kord Google'i tõlkega lauset või veebilehte tõlgite, mõelge neile miljonitele 00:02:09.670 --> 00:02:15.349 dokumentidele ja miljarditele mustritele, mille tulemus teie tõlge on — ja kõik see 00:02:15.349 --> 00:02:17.650 juhtub silmapilgu jooksul. 00:02:17.650 --> 00:02:19.260 Päris uhke, kas pole? 00:02:19.260 --> 99:59:59.999 Proovige ise aadressil translate.google.com.