1 00:00:05,997 --> 00:00:11,306 Làm cách nào mà sinh vật giữa các thiên hà trên phim, TV 2 00:00:11,306 --> 00:00:14,253 có thể nói tiếng Anh một cách trôi chảy nhỉ? 3 00:00:14,253 --> 00:00:17,886 Ngắn gọn đó là chả ai muốn xem một thuyền trưởng phi hành đoàn 4 00:00:17,886 --> 00:00:21,774 dành nhiều năm trời để tìm hiểu từ điển của người ngoài hành tinh. 5 00:00:21,774 --> 00:00:23,392 Nhưng để cho hợp lí 6 00:00:23,392 --> 00:00:26,789 các nhà sản xuất phim Chiến tranh giữa các vì sao và những phim khác 7 00:00:26,789 --> 00:00:30,514 đã đưa ra một khái niệm máy phiên dịch vũ trụ- 8 00:00:30,514 --> 00:00:35,012 một thiết bị cầm tay có thể dịch tức thì ngôn ngữ nào. 9 00:00:35,012 --> 00:00:38,539 Liệu máy phiên dịch vũ trụ có tồn tại trong đời thật? 10 00:00:38,539 --> 00:00:42,137 Chúng ta đã có nhiều chương trình máy tính chứng minh được khả năng này 11 00:00:42,137 --> 00:00:45,954 đánh 1 từ, 1 câu hoặc cả 1 cuốn sách bằng 1 ngôn ngữ 12 00:00:45,954 --> 00:00:49,004 và dịch ra bất kì ngôn ngữ nào khác 13 00:00:49,004 --> 00:00:52,117 cho dù đó là tiếng Anh hiện đại hay tiếng Phạn cổ. 14 00:00:52,117 --> 00:00:55,913 Nếu như việc dịch thuật chỉ đơn thuần là tra nghĩa trong từ điển 15 00:00:55,913 --> 00:00:59,825 thì những chương trình này sẽ dịch còn tốt hơn so với con người. 16 00:00:59,825 --> 00:01:03,299 Thực tế là, câu chuyện phức tạp hơn như thế một chút. 17 00:01:03,299 --> 00:01:07,349 Nguyên tắc cơ bản của một chương trình dịch là sử dụng hệ thông tin từ vựng 18 00:01:07,349 --> 00:01:10,302 bao gồm tất cả những từ mà bạn sẽ tìm thấy trong từ điển 19 00:01:10,302 --> 00:01:13,283 và các dạng ngữ pháp có thể có thể có 20 00:01:13,283 --> 00:01:18,925 và bộ nguyên tắc để nhận diện thành phần ngôn ngữ học thiết yếu cần dịch. 21 00:01:18,925 --> 00:01:22,396 Thử lấy một ví dụ có vẻ đơn giản: "The children eat the muffins" 22 00:01:22,396 --> 00:01:27,050 chương trình sẽ đầu tiên phân tích cấu trúc ngữ pháp câu 23 00:01:27,050 --> 00:01:29,587 bằng cách định dạng "The children" là chủ ngữ 24 00:01:29,587 --> 00:01:32,317 và phần còn lại của câu là vị ngữ 25 00:01:32,317 --> 00:01:34,368 động từ là "eat", 26 00:01:34,368 --> 00:01:37,172 và tân ngữ trực tiếp là "the muffins". 27 00:01:37,172 --> 00:01:40,249 Sau đó nó cần nhận diện hình thái ngôn ngữ của tiếng Anh 28 00:01:40,249 --> 00:01:44,681 hay làm cách nào mà ngôn ngữ này có thể chia thành những đơn vị nghĩa nhỏ nhất, 29 00:01:44,681 --> 00:01:46,124 ví dụ từ "muffin" 30 00:01:46,124 --> 00:01:49,755 và hậu tố "s", sử dụng để chỉ số nhiều. 31 00:01:49,755 --> 00:01:52,679 Cuối cùng câu dịch cần được hiểu về ngữ nghĩa học, 32 00:01:52,679 --> 00:01:56,178 mỗi phần của câu thực tế ra có nghĩa gì. 33 00:01:56,178 --> 00:01:58,074 Để dịch một câu chính xác, 34 00:01:58,074 --> 00:02:01,982 chương trình sẽ quy ra hệ từ vựng và quy tắc 35 00:02:01,982 --> 00:02:05,166 của mỗi thành phần trong ngôn ngữ đích. 36 00:02:05,166 --> 00:02:07,020 Nhưng đây là lúc dễ gây ra nhầm lẫn. 37 00:02:07,020 --> 00:02:11,820 Cú pháp của một số ngôn ngữ cho phép từ được đặt không cần theo trật tự, 38 00:02:11,820 --> 00:02:16,954 trong khi có những ngôn ngữ có thể khiến câu trở thành "The muffin eat the child". 39 00:02:16,954 --> 00:02:19,647 Hình thái ngôn ngữ cũng có thể gây ra rắc rối khi dịch. 40 00:02:19,647 --> 00:02:23,243 Tiếng Slovene có sự phân biệt giữa 2 đứa trẻ và 3 đứa trẻ hoặc nhiều hơn 41 00:02:23,243 --> 00:02:27,097 khi sử dụng cặp hậu tố mà những ngôn ngữ khác không có, 42 00:02:27,097 --> 00:02:30,532 trong khi tiếng Nga lại không sử dụng mạo từ có thể khiến bạn băn khoăn 43 00:02:30,532 --> 00:02:33,575 liệu là bọn trẻ đang ăn những cái bánh muffin cụ thể 44 00:02:33,575 --> 00:02:36,719 hay chỉ là ăn theo nghĩa chung. 45 00:02:36,719 --> 00:02:39,708 Cuối cùng, cho dù ngữ nghĩa có đúng về mặt kĩ thuật, 46 00:02:39,708 --> 00:02:42,757 chương trình có thể dịch chưa phù hợp, 47 00:02:42,757 --> 00:02:45,809 như bọn trẻ ăn bánh muffin một cách bình thường, 48 00:02:45,809 --> 00:02:47,794 hay ăn một cách ngấu nghiến. 49 00:02:47,794 --> 00:02:51,558 Một phương thức dịch khác là máy dịch dữ liệu, 50 00:02:51,558 --> 00:02:55,762 phân tích những dữ liệu trong sách, báo hay tài liệu 51 00:02:55,762 --> 00:02:59,488 mà đã được dịch sẵn. 52 00:02:59,488 --> 00:03:02,959 Bằng cách tìm ra sự phù hợp giữa dữ liệu nguồn và bài đã được dịch, 53 00:03:02,959 --> 00:03:05,393 điều mà khó xảy ra một cách ngẫu nhiên, 54 00:03:05,393 --> 00:03:09,345 chương trình này có thể xác định những cụm và mẫu câu tương đương 55 00:03:09,345 --> 00:03:12,429 và sử dụng chúng khi cần đến trong tương lai 56 00:03:12,429 --> 00:03:14,969 Tuy nhiên chất lượng dịch kiểu này 57 00:03:14,969 --> 00:03:17,690 phụ thuộc vào dữ liệu ban đầu 58 00:03:17,690 --> 00:03:21,357 và sự sẵn có các mẫu trong những ngôn ngữ nhất định 59 00:03:21,357 --> 00:03:23,383 hay phong cách viết. 60 00:03:23,383 --> 00:03:27,140 Khó khăn mà máy tính gặp phải với những ngoại lệ và trường hợp bất quy tắc 61 00:03:27,140 --> 00:03:30,994 và nghĩa có vẻ tự nhiên như con người 62 00:03:30,994 --> 00:03:35,045 đã khiến các nhà khoa học tin rằng thấu hiểu ngôn ngữ 63 00:03:35,045 --> 00:03:39,251 là sản phẩm đặc trưng của cấu trúc sinh học của não bộ. 64 00:03:39,251 --> 00:03:43,101 Thực tế, một trong những máy phiên dịch ảo vũ trụ nổi tiếng nhất, 65 00:03:43,101 --> 00:03:46,439 Babel fish, trong phim "The Hitchhiker's Guide to the Galaxy", 66 00:03:46,439 --> 00:03:49,726 không hoàn toàn là 1 cái máy, mà là 1 sinh vật bé 67 00:03:49,726 --> 00:03:54,210 có thể dịch được sóng não và tín hiệu thần kinh của những sinh vật có tri giác 68 00:03:54,210 --> 00:03:57,005 thông qua một dạng cảm nhận. 69 00:03:57,005 --> 00:03:59,726 Cho đến nay, học một ngôn ngữ nào theo cách truyền thống 70 00:03:59,726 --> 00:04:05,106 đều đem lại kết quả tốt hơn so với các chương trình dịch có sẵn. 71 00:04:05,106 --> 00:04:06,749 Nhưng đây không là cách đơn giản 72 00:04:06,749 --> 00:04:09,014 và số lượng lớn các ngôn ngữ trên thế giới 73 00:04:09,014 --> 00:04:12,989 cũng như việc ngày càng tăng số lượng người nói chúng, 74 00:04:12,989 --> 00:04:18,004 điều này sẽ tiếp tục khuyến khích phát triển các máy phiên dịch tự động. 75 00:04:18,004 --> 00:04:21,409 Đến khi chúng ta tiếp xúc với dạng thể sống khác trong các dãi ngân hà 76 00:04:21,409 --> 00:04:24,660 chúng ta có thể giao tiếp với họ bằng 1 thiết bị gọn nhẹ 77 00:04:24,660 --> 00:04:29,026 hoặc chúng ta tiếp tục phải tra từ điển như cũ.