0:00:06.677,0:00:11.306 Jak to możliwe, że w telewizji[br]tak wiele międzygalaktycznych ras 0:00:11.306,0:00:14.483 mówi doskonale po angielsku? 0:00:14.483,0:00:17.886 Po prostu nikt nie chce oglądać[br]załogi statku kosmicznego 0:00:17.886,0:00:21.774 tworzącej latami słownik języka kosmitów. 0:00:21.774,0:00:23.392 Dla porządku trzeba wspomnieć, 0:00:23.392,0:00:26.789 że twórcy Star Treka[br]i innych światów science-fiction, 0:00:26.789,0:00:30.514 wprowadzili ideę[br]uniwersalnego translatora, 0:00:30.514,0:00:35.012 przenośnego urządzenia[br]tłumaczącego na dowolny język. 0:00:35.012,0:00:38.539 Czy taki wynalazek jest w ogóle realny? 0:00:38.539,0:00:42.137 Istnieje wiele programów, [br]które mają to właśnie robić: 0:00:42.137,0:00:45.954 wziąć z jednego języka słowo,[br]zdanie, a nawet całą książkę 0:00:45.954,0:00:49.004 i przełożyć na niemal każdy inny język, 0:00:49.004,0:00:52.337 zarówno współczesny angielski,[br]jak i starożytny sanskryt. 0:00:52.337,0:00:55.913 Gdyby tłumaczenie polegało jedynie[br]na wyszukiwaniu słów w słowniku, 0:00:55.913,0:00:59.825 programy te byłyby lepsze[br]od tłumacza-człowieka. 0:00:59.825,0:01:03.299 W rzeczywistości jest to[br]bardziej skomplikowane. 0:01:03.299,0:01:07.349 Program o systemie regułowym[br]korzysta z leksykalnej bazy danych 0:01:07.349,0:01:10.302 zawierającej wszystkie słowa ze słownika, 0:01:10.302,0:01:13.283 ich wszystkie formy gramatyczne 0:01:13.283,0:01:18.925 oraz zbiór zasad gramatycznych[br]do rozpoznawania elementów języka. 0:01:18.925,0:01:22.396 W pozornie prostym zdaniu:[br]"Dzieci jedzą muffinki", 0:01:22.396,0:01:27.050 program najpierw analizuje składnię[br]albo strukturę gramatyczną, 0:01:27.050,0:01:29.587 rozpoznając "dzieci" jako podmiot, 0:01:29.587,0:01:32.317 a resztę zdania jako orzeczenie, 0:01:32.317,0:01:34.368 składające się z czasownika "jeść", 0:01:34.368,0:01:37.422 oraz dopełnienia bliższego "muffinki". 0:01:37.422,0:01:40.249 Potem musi rozpoznać angielską morfologię, 0:01:40.249,0:01:44.681 czyli jak można rozbić język[br]na najmniejsze elementy znaczeniowe, 0:01:44.681,0:01:46.124 takie jak słowo muffinka 0:01:46.124,0:01:49.755 i "s", angielski sufiks liczby mnogiej. 0:01:49.755,0:01:52.449 Wreszcie musi zrozumieć semantykę, 0:01:52.449,0:01:56.178 czyli co właściwie znaczą [br]poszczególne części zdania. 0:01:56.178,0:01:58.124 Żeby przetłumaczyć to zdanie prawidłowo, 0:01:58.124,0:02:01.982 program odniesie się do innego[br]słownictwa oraz zasad gramatycznych 0:02:01.982,0:02:05.166 dla każdego elementu w języku docelowym. 0:02:05.166,0:02:07.020 Tutaj sprawy zaczynają się komplikować. 0:02:07.020,0:02:11.820 Składnia niektórych języków[br]pozwala dowolnie zmieniać szyk zdania, 0:02:11.820,0:02:16.954 a w innych po zmianie szyku[br]okazałoby się, że muffinki jedzą dzieci. 0:02:16.954,0:02:19.647 Morfologia też może stanowić problem. 0:02:19.647,0:02:23.243 Słoweński rozróżnia między dwójką[br]a trójką i więcej dzieci 0:02:23.243,0:02:27.097 za pomocą sufiksu liczby podwójnej,[br]nieobecnej w wielu językach. 0:02:27.097,0:02:30.532 W rosyjskim brak przedimków określonych 0:02:30.532,0:02:33.575 powoduje, że nie wiemy,[br]czy dzieci jedzą konkretne muffinki, 0:02:33.575,0:02:36.719 czy jadają je w ogóle. 0:02:36.719,0:02:39.708 Wreszcie, nawet gdy znaczenie[br]jest technicznie poprawne, 0:02:39.708,0:02:42.757 program może przeoczyć[br]drobne różnice znaczeniowe, 0:02:42.757,0:02:45.809 jak to, czy dzieci "jedzą" muffinki, 0:02:45.809,0:02:47.794 czy je "pożerają". 0:02:47.794,0:02:51.558 Inną metodą jest statystyczne[br]tłumaczenie maszynowe, 0:02:51.558,0:02:55.762 czyli analiza bazy danych[br]z książkami, artykułami i dokumentami, 0:02:55.762,0:02:59.488 które wcześniej zostały[br]przetłumaczone przez człowieka. 0:02:59.488,0:03:02.959 Wyszukując dopasowania między źródłem[br]a przetłumaczonym tekstem, 0:03:02.959,0:03:05.393 które raczej nie pojawiają się[br]przez przypadek, 0:03:05.393,0:03:09.345 program może rozpoznać [br]odpowiadające sobie frazy i wzory 0:03:09.345,0:03:12.429 i wykorzystać je potem w tłumaczeniach. 0:03:12.429,0:03:14.969 Jednak jakość takiego tłumaczenia 0:03:14.969,0:03:17.690 zależy od wielkości bazy danych 0:03:17.690,0:03:21.357 oraz dostępności próbek[br]dla poszczególnych języków 0:03:21.357,0:03:23.383 lub stylów pisania. 0:03:23.383,0:03:27.140 Problemy, jakie komputery mają[br]z wyjątkami, nieregularnościami 0:03:27.140,0:03:30.994 i odcieniami znaczeniowymi [br]zrozumiałymi tylko dla człowieka, 0:03:30.994,0:03:35.045 doprowadziły pewnych badaczy do wniosku,[br]że rozumienie przez nas języka 0:03:35.045,0:03:39.251 jest wytworem biologicznej[br]struktury naszego mózgu. 0:03:39.251,0:03:43.101 Jeden z najbardziej znanych[br]fikcyjnych uniwersalnych translatorów, 0:03:43.101,0:03:46.439 Ryba Babel z "Autostopem przez galaktykę", 0:03:46.439,0:03:49.726 nie jest maszyną, ale stworzonkiem, 0:03:49.726,0:03:54.210 które tłumaczy fale mózgowe [br]i sygnały nerwowe czujących istot 0:03:54.210,0:03:57.005 za pomocą telepatii. 0:03:57.005,0:03:59.726 Na razie nauka języków [br]w tradycyjny sposób 0:03:59.726,0:04:05.106 wciąż da nam lepsze wyniki [br]niż jakikolwiek dostępny program. 0:04:05.106,0:04:06.749 To niełatwe zadanie, 0:04:06.749,0:04:09.014 a ogromna ilość języków na świecie 0:04:09.014,0:04:12.989 i coraz więcej interakcji[br]między ich użytkownikami 0:04:12.989,0:04:18.004 pozostanie bodźcem do dalszego rozwoju[br]tłumaczenia automatycznego. 0:04:18.004,0:04:21.409 Być może do czasu, gdy spotkamy[br]obcych z innych galaktyk, 0:04:21.409,0:04:24.660 będziemy mogli porozmawiać z nimi[br]za pomocą maleńkiego gadżetu, 0:04:24.660,0:04:29.026 a może będziemy musieli[br]i tak sporządzić słownik.