Làm cách nào mà sinh vật
giữa các thiên hà trên phim, TV
có thể nói tiếng Anh một cách
trôi chảy nhỉ?
Ngắn gọn đó là chả ai muốn xem một
thuyền trưởng phi hành đoàn
dành nhiều năm trời để tìm hiểu từ điển
của người ngoài hành tinh.
Nhưng để cho hợp lí
các nhà sản xuất phim Chiến tranh giữa
các vì sao và những phim khác
đã đưa ra một khái niệm máy phiên dịch
vũ trụ-
một thiết bị cầm tay có thể dịch tức thì
ngôn ngữ nào.
Liệu máy phiên dịch vũ trụ có tồn tại
trong đời thật?
Chúng ta đã có nhiều chương trình
máy tính chứng minh được khả năng này
đánh 1 từ, 1 câu hoặc cả 1 cuốn sách
bằng 1 ngôn ngữ
và dịch ra bất kì ngôn ngữ nào khác
cho dù đó là tiếng Anh hiện đại hay tiếng
Phạn cổ.
Nếu như việc dịch thuật chỉ đơn thuần là
tra nghĩa trong từ điển
thì những chương trình này sẽ dịch
còn tốt hơn so với con người.
Thực tế là, câu chuyện phức tạp hơn
như thế một chút.
Nguyên tắc cơ bản của một chương
trình dịch là sử dụng hệ thông tin từ vựng
bao gồm tất cả những từ mà bạn sẽ tìm
thấy trong từ điển
và các dạng ngữ pháp có thể có thể có
và bộ nguyên tắc để nhận diện thành
phần ngôn ngữ học thiết yếu cần dịch.
Thử lấy một ví dụ có vẻ đơn giản:
"The children eat the muffins"
chương trình sẽ đầu tiên phân tích cấu
trúc ngữ pháp câu
bằng cách định dạng "The children" là
chủ ngữ
và phần còn lại của câu là vị ngữ
động từ là "eat",
và tân ngữ trực tiếp là "the muffins".
Sau đó nó cần nhận diện hình thái ngôn
ngữ của tiếng Anh
hay làm cách nào mà ngôn ngữ này có thể
chia thành những đơn vị nghĩa nhỏ nhất,
ví dụ từ "muffin"
và hậu tố "s", sử dụng để chỉ số nhiều.
Cuối cùng câu dịch cần được hiểu về ngữ
nghĩa học,
mỗi phần của câu thực tế ra có nghĩa gì.
Để dịch một câu chính xác,
chương trình sẽ quy ra hệ từ
vựng và quy tắc
của mỗi thành phần trong ngôn ngữ đích.
Nhưng đây là lúc dễ gây ra nhầm lẫn.
Cú pháp của một số ngôn ngữ cho phép
từ được đặt không cần theo trật tự,
trong khi có những ngôn ngữ có thể khiến
câu trở thành "The muffin eat the child".
Hình thái ngôn ngữ cũng có thể
gây ra rắc rối khi dịch.
Tiếng Slovene có sự phân biệt giữa 2 đứa
trẻ và 3 đứa trẻ hoặc nhiều hơn
khi sử dụng cặp hậu tố mà những ngôn
ngữ khác không có,
trong khi tiếng Nga lại không sử dụng
mạo từ có thể khiến bạn băn khoăn
liệu là bọn trẻ đang ăn những cái bánh
muffin cụ thể
hay chỉ là ăn theo nghĩa chung.
Cuối cùng, cho dù ngữ nghĩa có đúng
về mặt kĩ thuật,
chương trình có thể dịch chưa phù hợp,
như bọn trẻ ăn bánh muffin một cách
bình thường,
hay ăn một cách ngấu nghiến.
Một phương thức dịch khác
là máy dịch dữ liệu,
phân tích những dữ liệu trong sách, báo
hay tài liệu
mà đã được dịch sẵn.
Bằng cách tìm ra sự phù hợp giữa dữ
liệu nguồn và bài đã được dịch,
điều mà khó xảy ra một cách ngẫu nhiên,
chương trình này có thể xác định những cụm
và mẫu câu tương đương
và sử dụng chúng khi cần đến trong
tương lai
Tuy nhiên chất lượng dịch kiểu này
phụ thuộc vào dữ liệu ban đầu
và sự sẵn có các mẫu trong những ngôn
ngữ nhất định
hay phong cách viết.
Khó khăn mà máy tính gặp phải với
những ngoại lệ và trường hợp bất quy tắc
và nghĩa có vẻ tự nhiên như con người
đã khiến các nhà khoa học tin rằng thấu
hiểu ngôn ngữ
là sản phẩm đặc trưng của cấu trúc sinh
học của não bộ.
Thực tế, một trong những máy phiên
dịch ảo vũ trụ nổi tiếng nhất,
Babel fish, trong phim
"The Hitchhiker's Guide to the Galaxy",
không hoàn toàn là 1 cái máy, mà
là 1 sinh vật bé
có thể dịch được sóng não và tín hiệu
thần kinh của những sinh vật có tri giác
thông qua một dạng cảm nhận.
Cho đến nay, học một ngôn ngữ nào
theo cách truyền thống
đều đem lại kết quả tốt hơn so với
các chương trình dịch có sẵn.
Nhưng đây không là cách đơn giản
và số lượng lớn các ngôn ngữ trên
thế giới
cũng như việc ngày càng tăng số lượng
người nói chúng,
điều này sẽ tiếp tục khuyến khích phát
triển các máy phiên dịch tự động.
Đến khi chúng ta tiếp xúc với
dạng thể sống khác trong các dãi ngân hà
chúng ta có thể giao tiếp với họ bằng 1
thiết bị gọn nhẹ
hoặc chúng ta tiếp tục phải tra từ điển
như cũ.