1 00:00:06,677 --> 00:00:11,306 영화나 텔레비전에 등장하는 수많은 외계 종족들은 2 00:00:11,306 --> 00:00:14,483 어떻게 완벽한 영어를 구사하는 걸까요? 3 00:00:14,483 --> 00:00:17,886 간단히 말하자면, 우주 승무원이 수년 간 외계어 사전을 번역하는 것을 4 00:00:17,886 --> 00:00:21,774 아무도 보고 싶어하지 않기 때문일 겁니다. 5 00:00:21,774 --> 00:00:23,392 그러나 일관성을 유지하기 위해서 6 00:00:23,392 --> 00:00:26,789 "스타 트렉"과 다른 공상과학영화 제작자들은 7 00:00:26,789 --> 00:00:30,514 '만능 번역기'라는 개념을 만들어냈습니다. 8 00:00:30,514 --> 00:00:35,012 어떤 언어라도 바로 번역해주는 휴대용 번역기이죠. 9 00:00:35,012 --> 00:00:38,539 그런데 과연 이게 현실에서 가능한 걸까요? 10 00:00:38,539 --> 00:00:42,137 사실 그런 기능이 있다고 '주장'하는 프로그램들은 이미 많이 있습니다. 11 00:00:42,137 --> 00:00:45,954 한 언어로 된 단어나 문장, 아니면 책 전체를 12 00:00:45,954 --> 00:00:49,004 거의 모든 언어로 번역해주는 것이죠. 13 00:00:49,004 --> 00:00:52,337 현대 영어로든, 고대 산스크리트어로든요. 14 00:00:52,337 --> 00:00:55,913 만약 번역이 단순히 사전에서 단어를 찾는 것의 문제였다면 15 00:00:55,913 --> 00:00:59,825 이런 번역 프로그램들은 인간을 훨씬 능가했을 겁니다. 16 00:00:59,825 --> 00:01:03,299 하지만 현실은 좀 더 복잡합니다. 17 00:01:03,299 --> 00:01:07,349 규칙 기반 번역 프로그램의 경우에는 '어휘 데이터베이스'를 사용하는데, 18 00:01:07,349 --> 00:01:10,302 이는 사람들이 사전에서 찾는 단어와 19 00:01:10,302 --> 00:01:13,282 사용하는 문법의 구조와 20 00:01:13,282 --> 00:01:18,925 입력된 언어의 기본적인 요소들을 인식하는 법칙들을 모두 포함합니다. 21 00:01:18,925 --> 00:01:22,396 '아이들이 머핀을 먹는다.'와 같이 간단해 보이는 문장의 경우에 22 00:01:22,396 --> 00:01:27,050 번역 프로그램은 가장 먼저 구문이나 문법구조를 분석합니다. 23 00:01:27,050 --> 00:01:29,587 '아이들'을 주어로 24 00:01:29,587 --> 00:01:32,318 그리고 문장의 나머지 부분들은 25 00:01:32,318 --> 00:01:34,368 '먹다'라는 동사와 26 00:01:34,368 --> 00:01:37,418 '머핀'이라는 직접 목적어로 구성된 술부로 인식하는 거죠. 27 00:01:37,418 --> 00:01:40,249 다음 단계로 프로그램은 영어를 형태론적으로 인지하거나 28 00:01:40,249 --> 00:01:44,681 의미를 갖는 가장 작은 단위로 언어가 어떻게 분해되는지를 찾게 됩니다. 29 00:01:44,681 --> 00:01:46,124 단어 'muffins'가 'muffin'과 30 00:01:46,124 --> 00:01:49,755 복수형을 나타내는 접미사 's'로 나뉘는 것처럼요. 31 00:01:49,755 --> 00:01:52,449 마지막으로 의미론에 대한 이해가 필요합니다. 32 00:01:52,449 --> 00:01:56,178 다시 말해, 문장 각 부분의 실제 의미를 파악하는 거죠. 33 00:01:56,178 --> 00:01:58,074 이 문장을 제대로 번역하기 위해 34 00:01:58,074 --> 00:02:01,982 프로그램은 각각의 단어와 법칙들을 35 00:02:01,982 --> 00:02:05,166 번역하려는 언어의 각 요소에 적용합니다. 36 00:02:05,166 --> 00:02:07,020 하지만 이 과정은 정말 까다롭습니다. 37 00:02:07,020 --> 00:02:11,820 몇몇 언어의 구문론에서는 단어를 어떤 순서로 배열하든 상관 없지만 38 00:02:11,820 --> 00:02:16,954 어떤 언어의 경우에는 순서가 잘못되었을 때 '머핀이 아이들을 먹게' 될 수도 있습니다. 39 00:02:16,954 --> 00:02:19,647 형태론과 관련해서도 문제가 발생할 수 있습니다. 40 00:02:19,647 --> 00:02:23,243 슬로베니아어의 경우에는 두 명, 세 명, 또는 그 이상의 아이들을 41 00:02:23,243 --> 00:02:27,097 다른 많은 언어에서는 볼 수 없는 '이중 접미사'를 이용해 구분합니다. 42 00:02:27,097 --> 00:02:30,532 반면 러시아어에는 정관사가 부족하기 때문에 43 00:02:30,532 --> 00:02:33,575 아이들이 '특정한 머핀'을 먹는 건지 44 00:02:33,575 --> 00:02:36,719 아니면 '그냥 머핀'을 먹는 건지 의문을 남길 수 있습니다. 45 00:02:36,719 --> 00:02:39,708 마지막으로 의미적인 부분이 기술적으로는 정확하다고 해도 46 00:02:39,708 --> 00:02:42,757 번역 프로그램은 미세한 점을 놓칠 수 있습니다. 47 00:02:42,757 --> 00:02:45,809 아이들이 머핀을 '그냥' 먹는지 48 00:02:45,809 --> 00:02:47,794 아니면 '게걸스럽게' 먹는지요. 49 00:02:47,794 --> 00:02:51,558 또 다른 번역 방식은 통계에 근거한 번역 시스템입니다. 50 00:02:51,558 --> 00:02:55,762 이 프로그램의 경우에는 사람들이 이미 번역해 놓은 51 00:02:55,762 --> 00:02:59,488 책, 기사 또는 문서들의 통계 자료를 분석해서 언어를 번역합니다. 52 00:02:59,488 --> 00:03:02,959 원본과 번역본에서 어떤 부분이 우연히 일치할 가능성은 거의 없기 때문에 53 00:03:02,959 --> 00:03:05,393 원본과 번역본 사이에 일치하는 부분을 찾음으로써 54 00:03:05,393 --> 00:03:09,345 프로그램은 서로의 언어에 부합하는 구절과 패턴을 찾을 수 있고 55 00:03:09,345 --> 00:03:12,429 이를 앞으로의 번역 과정에 사용할 수 있습니다. 56 00:03:12,429 --> 00:03:14,969 하지만 이런 방식의 번역은 57 00:03:14,969 --> 00:03:17,690 초기 데이터베이스의 규모와 58 00:03:17,690 --> 00:03:21,357 특정 언어나 문체의 예시가 존재하는지의 여부에 따라 59 00:03:21,357 --> 00:03:23,383 번역의 질이 좌우됩니다. 60 00:03:23,383 --> 00:03:27,140 예외적 요소들이나 불규칙한 부분들, 혹은 말의 뉘앙스와 같이 61 00:03:27,140 --> 00:03:31,194 인간에게 자연스러운 요소들이 컴퓨터에게는 어려운 점일 수 있으며 62 00:03:31,194 --> 00:03:35,045 때문에 어떤 연구자들은 언어의 이해가 63 00:03:35,045 --> 00:03:39,251 생물학적 뇌 구조의 독특한 산물이라고 봅니다. 64 00:03:39,251 --> 00:03:43,101 실제로, 유명한 가상 번역기 중 하나인 65 00:03:43,101 --> 00:03:46,439 '은하수를 여행하는 히치하이커를 위한 안내서'의 '바벨 피쉬'도 66 00:03:46,439 --> 00:03:49,726 기계가 아닌 하나의 작은 생명체로서 67 00:03:49,726 --> 00:03:54,210 텔레파시를 통해 지각이 있는 생명체들의 68 00:03:54,210 --> 00:03:57,005 뇌파와 신경 신호를 번역합니다. 69 00:03:57,005 --> 00:03:59,726 당분간은 컴퓨터 번역 프로그램을 사용하는 것보다 70 00:03:59,726 --> 00:04:05,106 지금까지 그랬던 것처럼 언어를 배우는 게 더 나을 겁니다. 71 00:04:05,106 --> 00:04:06,749 물론 언어를 배우는 일이 결코 쉬운 일은 아닙니다. 72 00:04:06,749 --> 00:04:09,454 하지만 전 세계적으로 수많은 언어가 존재하고 73 00:04:09,454 --> 00:04:12,989 다양한 언어를 사용하는 사람들 간의 의사소통이 증가하고 있는 만큼 74 00:04:12,989 --> 00:04:18,004 자동 번역기의 발전을 위한 노력도 계속될 것입니다. 75 00:04:18,004 --> 00:04:21,409 아마도 우리가 외계인을 만나게 될 때쯤이면 76 00:04:21,409 --> 00:04:24,660 작고 간단한 장치를 통해 그들과 의사소통을 할 수 있을 겁니다. 77 00:04:24,660 --> 00:04:29,026 아니면 결국 외계어 사전 편찬을 시작해야 할 지도 모르는 일이죠.