WEBVTT 00:00:05.997 --> 00:00:11.306 Làm cách nào mà sinh vật giữa các thiên hà trên phim, TV 00:00:11.306 --> 00:00:14.253 có thể nói tiếng Anh một cách trôi chảy nhỉ? 00:00:14.253 --> 00:00:17.886 Ngắn gọn đó là chả ai muốn xem một thuyền trưởng phi hành đoàn 00:00:17.886 --> 00:00:21.774 dành nhiều năm trời để tìm hiểu từ điển của người ngoài hành tinh. 00:00:21.774 --> 00:00:23.392 Nhưng để cho hợp lí 00:00:23.392 --> 00:00:26.789 các nhà sản xuất phim Chiến tranh giữa các vì sao và những phim khác 00:00:26.789 --> 00:00:30.514 đã đưa ra một khái niệm máy phiên dịch vũ trụ- 00:00:30.514 --> 00:00:35.012 một thiết bị cầm tay có thể dịch tức thì ngôn ngữ nào. 00:00:35.012 --> 00:00:38.539 Liệu máy phiên dịch vũ trụ có tồn tại trong đời thật? 00:00:38.539 --> 00:00:42.137 Chúng ta đã có nhiều chương trình máy tính chứng minh được khả năng này 00:00:42.137 --> 00:00:45.954 đánh 1 từ, 1 câu hoặc cả 1 cuốn sách bằng 1 ngôn ngữ 00:00:45.954 --> 00:00:49.004 và dịch ra bất kì ngôn ngữ nào khác 00:00:49.004 --> 00:00:52.117 cho dù đó là tiếng Anh hiện đại hay tiếng Phạn cổ. 00:00:52.117 --> 00:00:55.913 Nếu như việc dịch thuật chỉ đơn thuần là tra nghĩa trong từ điển 00:00:55.913 --> 00:00:59.825 thì những chương trình này sẽ dịch còn tốt hơn so với con người. 00:00:59.825 --> 00:01:03.299 Thực tế là, câu chuyện phức tạp hơn như thế một chút. 00:01:03.299 --> 00:01:07.349 Nguyên tắc cơ bản của một chương trình dịch là sử dụng hệ thông tin từ vựng 00:01:07.349 --> 00:01:10.302 bao gồm tất cả những từ mà bạn sẽ tìm thấy trong từ điển 00:01:10.302 --> 00:01:13.283 và các dạng ngữ pháp có thể có thể có 00:01:13.283 --> 00:01:18.925 và bộ nguyên tắc để nhận diện thành phần ngôn ngữ học thiết yếu cần dịch. 00:01:18.925 --> 00:01:22.396 Thử lấy một ví dụ có vẻ đơn giản: "The children eat the muffins" 00:01:22.396 --> 00:01:27.050 chương trình sẽ đầu tiên phân tích cấu trúc ngữ pháp câu 00:01:27.050 --> 00:01:29.587 bằng cách định dạng "The children" là chủ ngữ 00:01:29.587 --> 00:01:32.317 và phần còn lại của câu là vị ngữ 00:01:32.317 --> 00:01:34.368 động từ là "eat", 00:01:34.368 --> 00:01:37.172 và tân ngữ trực tiếp là "the muffins". 00:01:37.172 --> 00:01:40.249 Sau đó nó cần nhận diện hình thái ngôn ngữ của tiếng Anh 00:01:40.249 --> 00:01:44.681 hay làm cách nào mà ngôn ngữ này có thể chia thành những đơn vị nghĩa nhỏ nhất, 00:01:44.681 --> 00:01:46.124 ví dụ từ "muffin" 00:01:46.124 --> 00:01:49.755 và hậu tố "s", sử dụng để chỉ số nhiều. 00:01:49.755 --> 00:01:52.679 Cuối cùng câu dịch cần được hiểu về ngữ nghĩa học, 00:01:52.679 --> 00:01:56.178 mỗi phần của câu thực tế ra có nghĩa gì. 00:01:56.178 --> 00:01:58.074 Để dịch một câu chính xác, 00:01:58.074 --> 00:02:01.982 chương trình sẽ quy ra hệ từ vựng và quy tắc 00:02:01.982 --> 00:02:05.166 của mỗi thành phần trong ngôn ngữ đích. 00:02:05.166 --> 00:02:07.020 Nhưng đây là lúc dễ gây ra nhầm lẫn. 00:02:07.020 --> 00:02:11.820 Cú pháp của một số ngôn ngữ cho phép từ được đặt không cần theo trật tự, 00:02:11.820 --> 00:02:16.954 trong khi có những ngôn ngữ có thể khiến câu trở thành "The muffin eat the child". 00:02:16.954 --> 00:02:19.647 Hình thái ngôn ngữ cũng có thể gây ra rắc rối khi dịch. 00:02:19.647 --> 00:02:23.243 Tiếng Slovene có sự phân biệt giữa 2 đứa trẻ và 3 đứa trẻ hoặc nhiều hơn 00:02:23.243 --> 00:02:27.097 khi sử dụng cặp hậu tố mà những ngôn ngữ khác không có, 00:02:27.097 --> 00:02:30.532 trong khi tiếng Nga lại không sử dụng mạo từ có thể khiến bạn băn khoăn 00:02:30.532 --> 00:02:33.575 liệu là bọn trẻ đang ăn những cái bánh muffin cụ thể 00:02:33.575 --> 00:02:36.719 hay chỉ là ăn theo nghĩa chung. 00:02:36.719 --> 00:02:39.708 Cuối cùng, cho dù ngữ nghĩa có đúng về mặt kĩ thuật, 00:02:39.708 --> 00:02:42.757 chương trình có thể dịch chưa phù hợp, 00:02:42.757 --> 00:02:45.809 như bọn trẻ ăn bánh muffin một cách bình thường, 00:02:45.809 --> 00:02:47.794 hay ăn một cách ngấu nghiến. 00:02:47.794 --> 00:02:51.558 Một phương thức dịch khác là máy dịch dữ liệu, 00:02:51.558 --> 00:02:55.762 phân tích những dữ liệu trong sách, báo hay tài liệu 00:02:55.762 --> 00:02:59.488 mà đã được dịch sẵn. 00:02:59.488 --> 00:03:02.959 Bằng cách tìm ra sự phù hợp giữa dữ liệu nguồn và bài đã được dịch, 00:03:02.959 --> 00:03:05.393 điều mà khó xảy ra một cách ngẫu nhiên, 00:03:05.393 --> 00:03:09.345 chương trình này có thể xác định những cụm và mẫu câu tương đương 00:03:09.345 --> 00:03:12.429 và sử dụng chúng khi cần đến trong tương lai 00:03:12.429 --> 00:03:14.969 Tuy nhiên chất lượng dịch kiểu này 00:03:14.969 --> 00:03:17.690 phụ thuộc vào dữ liệu ban đầu 00:03:17.690 --> 00:03:21.357 và sự sẵn có các mẫu trong những ngôn ngữ nhất định 00:03:21.357 --> 00:03:23.383 hay phong cách viết. 00:03:23.383 --> 00:03:27.140 Khó khăn mà máy tính gặp phải với những ngoại lệ và trường hợp bất quy tắc 00:03:27.140 --> 00:03:30.994 và nghĩa có vẻ tự nhiên như con người 00:03:30.994 --> 00:03:35.045 đã khiến các nhà khoa học tin rằng thấu hiểu ngôn ngữ 00:03:35.045 --> 00:03:39.251 là sản phẩm đặc trưng của cấu trúc sinh học của não bộ. 00:03:39.251 --> 00:03:43.101 Thực tế, một trong những máy phiên dịch ảo vũ trụ nổi tiếng nhất, 00:03:43.101 --> 00:03:46.439 Babel fish, trong phim "The Hitchhiker's Guide to the Galaxy", 00:03:46.439 --> 00:03:49.726 không hoàn toàn là 1 cái máy, mà là 1 sinh vật bé 00:03:49.726 --> 00:03:54.210 có thể dịch được sóng não và tín hiệu thần kinh của những sinh vật có tri giác 00:03:54.210 --> 00:03:57.005 thông qua một dạng cảm nhận. 00:03:57.005 --> 00:03:59.726 Cho đến nay, học một ngôn ngữ nào theo cách truyền thống 00:03:59.726 --> 00:04:05.106 đều đem lại kết quả tốt hơn so với các chương trình dịch có sẵn. 00:04:05.106 --> 00:04:06.749 Nhưng đây không là cách đơn giản 00:04:06.749 --> 00:04:09.014 và số lượng lớn các ngôn ngữ trên thế giới 00:04:09.014 --> 00:04:12.989 cũng như việc ngày càng tăng số lượng người nói chúng, 00:04:12.989 --> 00:04:18.004 điều này sẽ tiếp tục khuyến khích phát triển các máy phiên dịch tự động. 00:04:18.004 --> 00:04:21.409 Đến khi chúng ta tiếp xúc với dạng thể sống khác trong các dãi ngân hà 00:04:21.409 --> 00:04:24.660 chúng ta có thể giao tiếp với họ bằng 1 thiết bị gọn nhẹ 00:04:24.660 --> 00:04:29.026 hoặc chúng ta tiếp tục phải tra từ điển như cũ.