0:00:06.677,0:00:11.306 영화나 텔레비전에 등장하는[br]수많은 외계 종족들은 0:00:11.306,0:00:14.483 어떻게 완벽한 영어를[br]구사하는 걸까요? 0:00:14.483,0:00:17.886 간단히 말하자면, 우주 승무원이 [br]수년 간 외계어 사전을 번역하는 것을 0:00:17.886,0:00:21.774 아무도 보고 싶어하지 [br]않기 때문일 겁니다. 0:00:21.774,0:00:23.392 그러나 일관성을 유지하기 위해서 0:00:23.392,0:00:26.789 "스타 트렉"과 다른 [br]공상과학영화 제작자들은 0:00:26.789,0:00:30.514 '만능 번역기'라는 [br]개념을 만들어냈습니다. 0:00:30.514,0:00:35.012 어떤 언어라도 바로 [br]번역해주는 휴대용 번역기이죠. 0:00:35.012,0:00:38.539 그런데 과연 이게 [br]현실에서 가능한 걸까요? 0:00:38.539,0:00:42.137 사실 그런 기능이 있다고 '주장'하는 [br]프로그램들은 이미 많이 있습니다. 0:00:42.137,0:00:45.954 한 언어로 된 단어나 문장, [br]아니면 책 전체를 0:00:45.954,0:00:49.004 거의 모든 언어로 번역해주는 것이죠. 0:00:49.004,0:00:52.337 현대 영어로든, [br]고대 산스크리트어로든요. 0:00:52.337,0:00:55.913 만약 번역이 단순히 사전에서 [br]단어를 찾는 것의 문제였다면 0:00:55.913,0:00:59.825 이런 번역 프로그램들은[br]인간을 훨씬 능가했을 겁니다. 0:00:59.825,0:01:03.299 하지만 현실은 좀 더 복잡합니다. 0:01:03.299,0:01:07.349 규칙 기반 번역 프로그램의 경우에는[br]'어휘 데이터베이스'를 사용하는데, 0:01:07.349,0:01:10.302 이는 사람들이 사전에서 찾는 단어와 0:01:10.302,0:01:13.282 사용하는 문법의 구조와 0:01:13.282,0:01:18.925 입력된 언어의 기본적인 요소들을 [br]인식하는 법칙들을 모두 포함합니다. 0:01:18.925,0:01:22.396 '아이들이 머핀을 먹는다.'와 같이[br]간단해 보이는 문장의 경우에 0:01:22.396,0:01:27.050 번역 프로그램은 가장 먼저 [br]구문이나 문법구조를 분석합니다. 0:01:27.050,0:01:29.587 '아이들'을 주어로 0:01:29.587,0:01:32.318 그리고 문장의 나머지 부분들은 0:01:32.318,0:01:34.368 '먹다'라는 동사와 0:01:34.368,0:01:37.418 '머핀'이라는 직접 목적어로 [br]구성된 술부로 인식하는 거죠. 0:01:37.418,0:01:40.249 다음 단계로 프로그램은[br]영어를 형태론적으로 인지하거나 0:01:40.249,0:01:44.681 의미를 갖는 가장 작은 단위로[br]언어가 어떻게 분해되는지를 찾게 됩니다. 0:01:44.681,0:01:46.124 단어 'muffins'가 'muffin'과 0:01:46.124,0:01:49.755 복수형을 나타내는 [br]접미사 's'로 나뉘는 것처럼요. 0:01:49.755,0:01:52.449 마지막으로 의미론에 대한[br]이해가 필요합니다. 0:01:52.449,0:01:56.178 다시 말해, 문장 각 부분의[br]실제 의미를 파악하는 거죠. 0:01:56.178,0:01:58.074 이 문장을 제대로 번역하기 위해 0:01:58.074,0:02:01.982 프로그램은 각각의 단어와 법칙들을 0:02:01.982,0:02:05.166 번역하려는 언어의 [br]각 요소에 적용합니다. 0:02:05.166,0:02:07.020 하지만 이 과정은 정말 까다롭습니다. 0:02:07.020,0:02:11.820 몇몇 언어의 구문론에서는 [br]단어를 어떤 순서로 배열하든 상관 없지만 0:02:11.820,0:02:16.954 어떤 언어의 경우에는 순서가 잘못되었을 때 [br]'머핀이 아이들을 먹게' 될 수도 있습니다. 0:02:16.954,0:02:19.647 형태론과 관련해서도 [br]문제가 발생할 수 있습니다. 0:02:19.647,0:02:23.243 슬로베니아어의 경우에는[br]두 명, 세 명, 또는 그 이상의 아이들을 0:02:23.243,0:02:27.097 다른 많은 언어에서는 볼 수 없는 [br]'이중 접미사'를 이용해 구분합니다. 0:02:27.097,0:02:30.532 반면 러시아어에는[br]정관사가 부족하기 때문에 0:02:30.532,0:02:33.575 아이들이 '특정한 머핀'을 먹는 건지 0:02:33.575,0:02:36.719 아니면 '그냥 머핀'을 먹는 건지 [br]의문을 남길 수 있습니다. 0:02:36.719,0:02:39.708 마지막으로 의미적인 부분이[br]기술적으로는 정확하다고 해도 0:02:39.708,0:02:42.757 번역 프로그램은[br]미세한 점을 놓칠 수 있습니다. 0:02:42.757,0:02:45.809 아이들이 머핀을 '그냥' 먹는지 0:02:45.809,0:02:47.794 아니면 '게걸스럽게' 먹는지요. 0:02:47.794,0:02:51.558 또 다른 번역 방식은 [br]통계에 근거한 번역 시스템입니다. 0:02:51.558,0:02:55.762 이 프로그램의 경우에는[br]사람들이 이미 번역해 놓은 0:02:55.762,0:02:59.488 책, 기사 또는 문서들의 통계 자료를 [br]분석해서 언어를 번역합니다. 0:02:59.488,0:03:02.959 원본과 번역본에서 어떤 부분이 [br]우연히 일치할 가능성은 거의 없기 때문에 0:03:02.959,0:03:05.393 원본과 번역본 사이에 [br]일치하는 부분을 찾음으로써 0:03:05.393,0:03:09.345 프로그램은 서로의 언어에 부합하는[br]구절과 패턴을 찾을 수 있고 0:03:09.345,0:03:12.429 이를 앞으로의 번역 과정에[br]사용할 수 있습니다. 0:03:12.429,0:03:14.969 하지만 이런 방식의 번역은 0:03:14.969,0:03:17.690 초기 데이터베이스의 규모와 0:03:17.690,0:03:21.357 특정 언어나 문체의 예시가 [br]존재하는지의 여부에 따라 0:03:21.357,0:03:23.383 번역의 질이 좌우됩니다. 0:03:23.383,0:03:27.140 예외적 요소들이나 불규칙한 부분들,[br]혹은 말의 뉘앙스와 같이 0:03:27.140,0:03:31.194 인간에게 자연스러운 요소들이[br]컴퓨터에게는 어려운 점일 수 있으며 0:03:31.194,0:03:35.045 때문에 어떤 연구자들은 언어의 이해가 0:03:35.045,0:03:39.251 생물학적 뇌 구조의 [br]독특한 산물이라고 봅니다. 0:03:39.251,0:03:43.101 실제로, 유명한 가상 번역기 중 하나인 0:03:43.101,0:03:46.439 '은하수를 여행하는 [br]히치하이커를 위한 안내서'의 '바벨 피쉬'도 0:03:46.439,0:03:49.726 기계가 아닌 하나의 작은 생명체로서 0:03:49.726,0:03:54.210 텔레파시를 통해 지각이 있는 생명체들의 0:03:54.210,0:03:57.005 뇌파와 신경 신호를 번역합니다. 0:03:57.005,0:03:59.726 당분간은 컴퓨터 번역 프로그램을 [br]사용하는 것보다 0:03:59.726,0:04:05.106 지금까지 그랬던 것처럼 [br]언어를 배우는 게 더 나을 겁니다. 0:04:05.106,0:04:06.749 물론 언어를 배우는 일이 [br]결코 쉬운 일은 아닙니다. 0:04:06.749,0:04:09.454 하지만 전 세계적으로[br]수많은 언어가 존재하고 0:04:09.454,0:04:12.989 다양한 언어를 사용하는 사람들 간의 [br]의사소통이 증가하고 있는 만큼 0:04:12.989,0:04:18.004 자동 번역기의 발전을 위한[br]노력도 계속될 것입니다. 0:04:18.004,0:04:21.409 아마도 우리가 외계인을 [br]만나게 될 때쯤이면 0:04:21.409,0:04:24.660 작고 간단한 장치를 통해 [br]그들과 의사소통을 할 수 있을 겁니다. 0:04:24.660,0:04:29.026 아니면 결국 외계어 사전 편찬을 [br]시작해야 할 지도 모르는 일이죠.