-
Làm cách nào mà sinh vật
giữa các thiên hà trên phim, TV
-
có thể nói tiếng Anh một cách
trôi chảy nhỉ?
-
Ngắn gọn đó là chả ai muốn xem một
thuyền trưởng phi hành đoàn
-
dành nhiều năm trời để tìm hiểu từ điển
của người ngoài hành tinh.
-
Nhưng để cho hợp lí
-
các nhà sản xuất phim Chiến tranh giữa
các vì sao và những phim khác
-
đã đưa ra một khái niệm máy phiên dịch
vũ trụ-
-
một thiết bị cầm tay có thể dịch tức thì
ngôn ngữ nào.
-
Liệu máy phiên dịch vũ trụ có tồn tại
trong đời thật?
-
Chúng ta đã có nhiều chương trình
máy tính chứng minh được khả năng này
-
đánh 1 từ, 1 câu hoặc cả 1 cuốn sách
bằng 1 ngôn ngữ
-
và dịch ra bất kì ngôn ngữ nào khác
-
cho dù đó là tiếng Anh hiện đại hay tiếng
Phạn cổ.
-
Nếu như việc dịch thuật chỉ đơn thuần là
tra nghĩa trong từ điển
-
thì những chương trình này sẽ dịch
còn tốt hơn so với con người.
-
Thực tế là, câu chuyện phức tạp hơn
như thế một chút.
-
Nguyên tắc cơ bản của một chương
trình dịch là sử dụng hệ thông tin từ vựng
-
bao gồm tất cả những từ mà bạn sẽ tìm
thấy trong từ điển
-
và các dạng ngữ pháp có thể có thể có
-
và bộ nguyên tắc để nhận diện thành
phần ngôn ngữ học thiết yếu cần dịch.
-
Thử lấy một ví dụ có vẻ đơn giản:
"The children eat the muffins"
-
chương trình sẽ đầu tiên phân tích cấu
trúc ngữ pháp câu
-
bằng cách định dạng "The children" là
chủ ngữ
-
và phần còn lại của câu là vị ngữ
-
động từ là "eat",
-
và tân ngữ trực tiếp là "the muffins".
-
Sau đó nó cần nhận diện hình thái ngôn
ngữ của tiếng Anh
-
hay làm cách nào mà ngôn ngữ này có thể
chia thành những đơn vị nghĩa nhỏ nhất,
-
ví dụ từ "muffin"
-
và hậu tố "s", sử dụng để chỉ số nhiều.
-
Cuối cùng câu dịch cần được hiểu về ngữ
nghĩa học,
-
mỗi phần của câu thực tế ra có nghĩa gì.
-
Để dịch một câu chính xác,
-
chương trình sẽ quy ra hệ từ
vựng và quy tắc
-
của mỗi thành phần trong ngôn ngữ đích.
-
Nhưng đây là lúc dễ gây ra nhầm lẫn.
-
Cú pháp của một số ngôn ngữ cho phép
từ được đặt không cần theo trật tự,
-
trong khi có những ngôn ngữ có thể khiến
câu trở thành "The muffin eat the child".
-
Hình thái ngôn ngữ cũng có thể
gây ra rắc rối khi dịch.
-
Tiếng Slovene có sự phân biệt giữa 2 đứa
trẻ và 3 đứa trẻ hoặc nhiều hơn
-
khi sử dụng cặp hậu tố mà những ngôn
ngữ khác không có,
-
trong khi tiếng Nga lại không sử dụng
mạo từ có thể khiến bạn băn khoăn
-
liệu là bọn trẻ đang ăn những cái bánh
muffin cụ thể
-
hay chỉ là ăn theo nghĩa chung.
-
Cuối cùng, cho dù ngữ nghĩa có đúng
về mặt kĩ thuật,
-
chương trình có thể dịch chưa phù hợp,
-
như bọn trẻ ăn bánh muffin một cách
bình thường,
-
hay ăn một cách ngấu nghiến.
-
Một phương thức dịch khác
là máy dịch dữ liệu,
-
phân tích những dữ liệu trong sách, báo
hay tài liệu
-
mà đã được dịch sẵn.
-
Bằng cách tìm ra sự phù hợp giữa dữ
liệu nguồn và bài đã được dịch,
-
điều mà khó xảy ra một cách ngẫu nhiên,
-
chương trình này có thể xác định những cụm
và mẫu câu tương đương
-
và sử dụng chúng khi cần đến trong
tương lai
-
Tuy nhiên chất lượng dịch kiểu này
-
phụ thuộc vào dữ liệu ban đầu
-
và sự sẵn có các mẫu trong những ngôn
ngữ nhất định
-
hay phong cách viết.
-
Khó khăn mà máy tính gặp phải với
những ngoại lệ và trường hợp bất quy tắc
-
và nghĩa có vẻ tự nhiên như con người
-
đã khiến các nhà khoa học tin rằng thấu
hiểu ngôn ngữ
-
là sản phẩm đặc trưng của cấu trúc sinh
học của não bộ.
-
Thực tế, một trong những máy phiên
dịch ảo vũ trụ nổi tiếng nhất,
-
Babel fish, trong phim
"The Hitchhiker's Guide to the Galaxy",
-
không hoàn toàn là 1 cái máy, mà
là 1 sinh vật bé
-
có thể dịch được sóng não và tín hiệu
thần kinh của những sinh vật có tri giác
-
thông qua một dạng cảm nhận.
-
Cho đến nay, học một ngôn ngữ nào
theo cách truyền thống
-
đều đem lại kết quả tốt hơn so với
các chương trình dịch có sẵn.
-
Nhưng đây không là cách đơn giản
-
và số lượng lớn các ngôn ngữ trên
thế giới
-
cũng như việc ngày càng tăng số lượng
người nói chúng,
-
điều này sẽ tiếp tục khuyến khích phát
triển các máy phiên dịch tự động.
-
Đến khi chúng ta tiếp xúc với
dạng thể sống khác trong các dãi ngân hà
-
chúng ta có thể giao tiếp với họ bằng 1
thiết bị gọn nhẹ
-
hoặc chúng ta tiếp tục phải tra từ điển
như cũ.