WEBVTT 00:00:06.677 --> 00:00:11.306 איך זה שכל כך הרבה מינים אינטרגלקטיים בסרטים ובטלויזיה 00:00:11.306 --> 00:00:14.483 מדברים במקרה אנגלית מושלמת? 00:00:14.483 --> 00:00:17.886 התשובה הקצרה היא שאף אחד לא רוצה לצפות בצוות ספינת חלל 00:00:17.886 --> 00:00:21.774 מבלה שנים בהרכבת מילון חייזרים. 00:00:21.774 --> 00:00:23.392 אבל כדי לשמור על עקביות, 00:00:23.392 --> 00:00:26.789 היוצרים של סטאר טרק ועולמות בדיוניים אחרים 00:00:26.789 --> 00:00:30.514 הציגו את הרעיון של מתרגם אוניברסלי, 00:00:30.514 --> 00:00:35.012 מכשיר נייד שיכול לתרגם מיידית כל שפה. 00:00:35.012 --> 00:00:38.539 אז האם מתרגם אוניברסלי אפשרי בחיים האמיתיים? 00:00:38.539 --> 00:00:42.137 יש לנו כבר הרבה תוכנות שטוענות בדיוק לזה, 00:00:42.137 --> 00:00:45.954 לקחת מילה, משפט, או ספר שלם בשפה אחת 00:00:45.954 --> 00:00:49.004 ולתרגם אותו לכמעט כל אחת אחרת, 00:00:49.004 --> 00:00:52.337 בין אם זה אנגלית מודרנית או סנסקריט עתיקה. 00:00:52.337 --> 00:00:55.913 ואם תרגום היה פשוט עניין של לחפש מילים במילון, 00:00:55.913 --> 00:00:59.825 התוכנות האלו היה יכולות בקלות לנצח אנשים. 00:00:59.825 --> 00:01:03.299 המציאות, עם זאת, היא מעט יותר מורכבת. 00:01:03.299 --> 00:01:07.349 תרגום מבוסס חוקים משתמש במאגר מידע לשוני, 00:01:07.349 --> 00:01:10.302 שכולל את כל המילים שתמצאו במילון 00:01:10.302 --> 00:01:13.283 וכל המבנים הדקדוקיים שהן יכולות ללבוש, 00:01:13.283 --> 00:01:18.925 וסט חוקים כדי להכיר את האלמנטים הלשוניים הבסיסיים בשפת הקלט. 00:01:18.925 --> 00:01:22.396 למשפט שנראה פשוט כמו, "הילדים אוכלים את המאפינס," 00:01:22.396 --> 00:01:27.050 התוכנה ראשית תנסח את התחביר, או מבנה דקדוקי, 00:01:27.050 --> 00:01:29.587 על ידי זיהוי הילדים כנושא, 00:01:29.587 --> 00:01:32.317 ושאר המשפט כנשוא 00:01:32.317 --> 00:01:34.368 שמכיל את הפועל "לאכול," 00:01:34.368 --> 00:01:37.422 ועצם ישיר "המאפינס." 00:01:37.422 --> 00:01:40.249 אז היא צריכה לזהות מורפולוגיה אנגלית, 00:01:40.249 --> 00:01:44.681 או איך השפה יכולה להתחלק ליחידות הכי קטנות בעלות המשמעות, 00:01:44.681 --> 00:01:46.124 כמו המילה מאפין 00:01:46.124 --> 00:01:49.755 והתוספת "ס" שמשמשת להראות רבים. 00:01:49.755 --> 00:01:52.449 לבסוף, היא צריכה להבין את הסמנטיקה, 00:01:52.449 --> 00:01:56.178 מה למעשה המשמעות של החלקים השונים של המשפט. 00:01:56.178 --> 00:01:58.074 כדי לתרגם את המשפט הזה נכון, 00:01:58.074 --> 00:02:01.982 התוכנה צריכה להתייחס לסטים שונים של אוצר מילים וחוקים 00:02:01.982 --> 00:02:05.166 לכל אלמנט של שפת המטרה. 00:02:05.166 --> 00:02:07.020 אבל שם זה נעשה מסובך. 00:02:07.020 --> 00:02:11.820 התחביר של כמה שפות מאפשר למילים להיות מאורגנות בכל סדר, 00:02:11.820 --> 00:02:16.954 בעוד באחרות, זה יכול לגרום למאפין לאכול את הילד. 00:02:16.954 --> 00:02:19.647 מורפולוגיה יכולה גם להוות בעיה. 00:02:19.647 --> 00:02:23.243 סלובנית מבדילה בין שני ילדים ושלושה ילדים או יותר 00:02:23.243 --> 00:02:27.097 בשימוש בתוספת כפולה שלא קיימת בהרבה שפות אחרות, 00:02:27.097 --> 00:02:30.532 בעוד היעדר תוויות יידוע ברוסית ישאיר אתכם תוהים 00:02:30.532 --> 00:02:33.575 אם הילדים אוכלים מאפין מסויים, 00:02:33.575 --> 00:02:36.719 או פשוט אוכלים מאפינס באופן כללי. 00:02:36.719 --> 00:02:39.708 לבסוף, אפילו כשהסמנטיקה נכונה טכנית, 00:02:39.708 --> 00:02:42.757 התוכנית יכולה לפספס נקודות עדינות יותר, 00:02:42.757 --> 00:02:45.809 כמו אם הילדים "מנג'יאנו" את המאפינס, 00:02:45.809 --> 00:02:47.794 או "דיבורני" אותם. 00:02:47.794 --> 00:02:51.558 שיטה נוספת היא תרגום מכונה סטטיסטי, 00:02:51.558 --> 00:02:55.762 שמנתח מאגר מידע של ספרים, מאמרים, ומסמכים 00:02:55.762 --> 00:02:59.488 שכבר תורגמו על ידי אנשים. 00:02:59.488 --> 00:03:02.959 על ידי מציאת התאמות בין מקורות וטקסט מתורגם 00:03:02.959 --> 00:03:05.393 שלא הגיוני שיתרחשו במקרה, 00:03:05.393 --> 00:03:09.345 התוכנית יכולה לזהות מושגים ותבניות מותאמים, 00:03:09.345 --> 00:03:12.429 ולהשתמש בהם לתרגומים עתידיים. 00:03:12.429 --> 00:03:14.969 עם זאת, האיכות של סוג זה של תרגום 00:03:14.969 --> 00:03:17.690 תלוי בגודל מאגר המידע הראשוני 00:03:17.690 --> 00:03:21.357 והזמינות של דוגמאות לשפות מסויימות 00:03:21.357 --> 00:03:23.383 או סגנונות שונים של כתיבה. 00:03:23.383 --> 00:03:27.140 הקושי שיש למחשבים עם יוצאי הדופן, חוסר הסדר 00:03:27.140 --> 00:03:30.994 והגוונים של משמעויות שנתפסים אינסטינקטיבית עבור אנשים 00:03:30.994 --> 00:03:35.045 הובילו כמה חוקרים להאמין שההבנה שלנו של שפה 00:03:35.045 --> 00:03:39.251 היא תוצא יחודי של מבנה המוח הביולוגי. 00:03:39.251 --> 00:03:43.101 למעשה, אחד המתרגמים האוניברסליים המומצאים הכי מפורסמים, 00:03:43.101 --> 00:03:46.439 דג בבל מ"מדריך הטרמפיסט לגלקסיה", 00:03:46.439 --> 00:03:49.726 הוא לא מכונה בכלל אלא יצור קטן 00:03:49.726 --> 00:03:54.210 שמתרגם את גלי המוח וסימנים עצביים של יצורים תבוניים 00:03:54.210 --> 00:03:57.005 דרך צורה של טלפטיה. 00:03:57.005 --> 00:03:59.726 בינתיים, למידת שפה בדרך המסורתית 00:03:59.726 --> 00:04:05.106 עדיין תיתן לנו תוצאה טובה יותר מכל תוכנת תרגום שזמינה כעת. 00:04:05.106 --> 00:04:06.749 אבל זו לא מטלה פשוטה, 00:04:06.749 --> 00:04:09.014 והמספר העצום של שפות בעולם, 00:04:09.014 --> 00:04:12.989 כמו גם האינטראקציה הגדלה בין האנשים שמדברים אותן, 00:04:12.989 --> 00:04:18.004 רק תמשיך לעורר התקדמות גדולה יותר בתרגום אוטומטי. 00:04:18.004 --> 00:04:21.409 אולי בזמן שניתקל בצורות חיים אינטרגלקטיות, 00:04:21.409 --> 00:04:24.660 נהיה מסוגלים לתקשר איתם דרך מכשיר זעיר, 00:04:24.660 --> 00:04:29.026 או שאולי נצטרך להתחיל להרכיב את המילון ההוא אחרי הכל.