< Return to Video

ما تعلمناه من 5 ملايين كتاب

  • 0:00 - 0:02
    إيريز ليبرمان ايدن: الجميع يعرف
  • 0:02 - 0:05
    أن الصورة تعادل الف كلمة.
  • 0:07 - 0:09
    لكننا في هارفارد
  • 0:09 - 0:12
    تساءلنا ما إذا كان ذلك بالفعل صحيحا.
  • 0:12 - 0:14
    (ضحك)
  • 0:14 - 0:18
    وبالتالي جمعنا فريقا من الخبراء،
  • 0:18 - 0:20
    يمتدون في هارفارد وMIT
  • 0:20 - 0:23
    قاموس التراث الأمريكي، موسوعة بريتانيكا
  • 0:23 - 0:25
    وحتى رعاتنا الذين نفتخر بهم،
  • 0:25 - 0:28
    غوغل.
  • 0:28 - 0:30
    ودبرنا هذا
  • 0:30 - 0:32
    لحوالي أربع سنوات.
  • 0:32 - 0:37
    ووصلنا إلى استنتاج مبدئي،
  • 0:37 - 0:40
    سيداتي سادتي، الصورة لا تعادل الف كلمة.
  • 0:40 - 0:42
    في الحقيقة، وجدنا بعض الصور
  • 0:42 - 0:47
    التي تقدر بأكثر من 500 مليار كلمة.
  • 0:47 - 0:49
    جان باتيست ميشال: إذن كيف وصلنا إلى هذا الاستنتاج؟
  • 0:49 - 0:51
    إذن أنا وإريز كنا نفكر في طرق
  • 0:51 - 0:53
    للحصول على صورة كبيرة للثقافة الإنسانية
  • 0:53 - 0:56
    والتاريخ البشري: تغيرها عبر الزمن.
  • 0:56 - 0:58
    وهكذا الكثير من الكتب تم تأليفها على مدى السنوات.
  • 0:58 - 1:00
    وبالتالي كنا نفكر، حسنا أفضل طريقة للاستفادة منها
  • 1:00 - 1:02
    هو قراءة كل هذه الملايين من الكتب.
  • 1:02 - 1:05
    الآن بالطبع، إن كان هناك مقياس لمدى روعة ذلك،
  • 1:05 - 1:08
    كان هذا ليصنف عاليا وعاليا للغاية.
  • 1:08 - 1:10
    الآن المشكل هو أن هناك محور أفاصيل لذلك،
  • 1:10 - 1:12
    والذي هو محور العملية.
  • 1:12 - 1:14
    هذا متدن متدن للغاية.
  • 1:14 - 1:17
    (تصفيق)
  • 1:17 - 1:20
    الآن الناس يميلون إلى استخدام مقاربة بديلة،
  • 1:20 - 1:22
    والتي هي أخذ بضعة مصادر وقرائتها بعناية.
  • 1:22 - 1:24
    هذا عملي للغاية، لكن ليس بتلك الروعة.
  • 1:24 - 1:27
    ما تريد فعله حقا
  • 1:27 - 1:30
    هو أخذ الجزء الرائع والعملي كذلك من هذا الفضاء.
  • 1:30 - 1:33
    وقد اتضح أن هناك شركة على الجانب الآخر من النهر تدعى غوغل
  • 1:33 - 1:35
    والتي بدأت مشروع رقمنة قبل بضع سنوات
  • 1:35 - 1:37
    من شأنه أن يسمح بهذه المقاربة.
  • 1:37 - 1:39
    قاموا برقمنة ملايين الكتب.
  • 1:39 - 1:42
    وبالتالي ما يعنيه ذلك هو، قد يستخدم المرء طرقا حوسبية
  • 1:42 - 1:44
    لقراءة كل الكتب بضغطة زر.
  • 1:44 - 1:47
    هذا في غاية العملية والروعة.
  • 1:48 - 1:50
    إ. ل. أ: دعوني أخبركم قليلا من أين تأتي الكتب.
  • 1:50 - 1:53
    منذ قديم الزمن، تواجد كتّاب.
  • 1:53 - 1:56
    هؤلاء الكتّاب كانوا يسعون لتأليف كتب.
  • 1:56 - 1:58
    وقد صار ذلك سهلا جدا
  • 1:58 - 2:00
    مع تطور الصحافة المطبوعة قبل بضعة قرون.
  • 2:00 - 2:03
    منذ ذلك الوقت، استطاع الكتاب
  • 2:03 - 2:05
    على مدى 129 مليون مناسبة متميزة،
  • 2:05 - 2:07
    من نشر الكتب.
  • 2:07 - 2:09
    الآن إن لم تكن تلك الكتب مفقودة في التاريخ،
  • 2:09 - 2:11
    فإنها في مكان ما في مكتبة،
  • 2:11 - 2:14
    والكثير من تلك الكتب يتم استرجاعها من المكتبات
  • 2:14 - 2:16
    ورقمنتها من قبل غوغل،
  • 2:16 - 2:18
    والذين قاموا بمسح 15 مليون كتاب لحد الساعة.
  • 2:18 - 2:21
    الآن حين يقوم غوغل برقمنة كتاب، يضعونه في شكل أنيق للغاية.
  • 2:21 - 2:23
    الآن لدينا البيانات بالإضافة إلى البيانات الوصفية.
  • 2:23 - 2:26
    لدينا معلومات حول أمور مثل أين تم نشره،
  • 2:26 - 2:28
    من كان المؤلف، متى تم نشره.
  • 2:28 - 2:31
    وما نقوم به هو القراء من خلال كل هذه السجلات
  • 2:31 - 2:35
    وإلغاء كل البيانات التي ليست ذات جودة عالية.
  • 2:35 - 2:37
    ما يتبقى لنا
  • 2:37 - 2:40
    هو مجموعة من خمسة ملايين كتاب،
  • 2:40 - 2:43
    500 مليار كلمة،
  • 2:43 - 2:45
    سلسلة من الأحرف أطول بألف مرة
  • 2:45 - 2:48
    من الجينوم البشري --
  • 2:48 - 2:50
    نص إن تمت كتابته،
  • 2:50 - 2:52
    سيمتد من هنا إلى القمر وعودة
  • 2:52 - 2:54
    10 مرات متوالية --
  • 2:54 - 2:58
    قشرة حقيقية لجينومنا الثقافي.
  • 2:58 - 3:00
    ما قمنا به بالطبع
  • 3:00 - 3:03
    حين واجهنا تلك المبالغة الفظيعة ..
  • 3:03 - 3:05
    (ضحك)
  • 3:05 - 3:08
    هو ماكان أي باحث يحترم نفسه
  • 3:08 - 3:11
    ليقوم به.
  • 3:11 - 3:13
    أخذنا صفحة من إكس كي سي دي،
  • 3:13 - 3:15
    وقلنا، "ارجع للوراء.
  • 3:15 - 3:17
    سنجرب العلم."
  • 3:17 - 3:19
    (ضحك)
  • 3:19 - 3:21
    ج. م: الآن بالطبع، كنا نفكر،
  • 3:21 - 3:23
    حسنا، دعونا أولا نضع البيانات فقط هناك
  • 3:23 - 3:25
    حتى يمارس عليها الناس العلم.
  • 3:25 - 3:27
    الآن كنا نفكر، ما نوع البيانات التي قد نصدرها؟
  • 3:27 - 3:29
    حسنا بالطبع، تريد أخذ كل الكتب
  • 3:29 - 3:31
    ونشر النص الكامل لتلك الخمس ملايين كتاب.
  • 3:31 - 3:33
    الآن غوغل، وجون أوروانت تحديدا،
  • 3:33 - 3:35
    أخبرونا عن معادلة صغيرة علينا تعلمها.
  • 3:35 - 3:38
    حسنا لديكم خمس ملايين، هذا يعني، خمس ملايين كاتب
  • 3:38 - 3:41
    وخمس ملايين مدعي هي دعوى قضائية هائلة.
  • 3:41 - 3:43
    إذن، على الرغم من أن هذا كان ليكون رائعا للغاية،
  • 3:43 - 3:46
    مجددا، إنه غير عملي للغاية.
  • 3:46 - 3:48
    (ضحك)
  • 3:48 - 3:50
    الآن مجددا، أذعنا نوعا ما،
  • 3:50 - 3:53
    وأنجزنا المقاربة العملية جدا، والتي لم تكن بتلك الروعة.
  • 3:53 - 3:55
    قلنا، حسنا بدل نشر النصوص الكاملة،
  • 3:55 - 3:57
    سنقوم بنشر إحصائيات حول الكتب.
  • 3:57 - 3:59
    إذن على سبيل المثال "بصيص من السعادة."
  • 3:59 - 4:01
    إنها أربع كلمات؛ نسمي ذلك أربعة-غرام
  • 4:01 - 4:03
    سنقوم باخباركم بعدد المرات التي ظهرت فيها أربعة-غرام معينة
  • 4:03 - 4:05
    في الكتب في 1801، 1802، 1803،
  • 4:05 - 4:07
    على طول الطريق إلى 2008.
  • 4:07 - 4:09
    ذلك يعطينا تسلسلا زمنيا
  • 4:09 - 4:11
    حول مدى تردد استخدام هذه الجملة المعينة مع مرور الزمن.
  • 4:11 - 4:14
    نقوم بذلك لكل الكلمات والجمل التي تظهر في تلك الكتب،
  • 4:14 - 4:17
    وذلك يعطينا جدولا ضخما من ملياري سطر
  • 4:17 - 4:19
    يخبرنا حول الطريقة التي تتغير بها الثقافة.
  • 4:19 - 4:21
    إ. ل. أ: وبالتالي هذان الملياران،
  • 4:21 - 4:23
    نسميهما ملياري ن-غرام.
  • 4:23 - 4:25
    ما الذي تخبرنا؟
  • 4:25 - 4:27
    حسنا ال: ن-غرام المفردة تقيس الاتجاهات الثقافية.
  • 4:27 - 4:29
    دعوني أعطيكم مثالا.
  • 4:29 - 4:31
    دعونا نفترض أنني في ازدهار،
  • 4:31 - 4:33
    ثم أردت إخباركم في الغد كيف أبليت حسنا.
  • 4:33 - 4:36
    وبالتالي قد أقول، "البارحة قد نجحت."
  • 4:36 - 4:39
    كبديل، يمكنني القول، "البارحة، ازدهرت."
  • 4:39 - 4:42
    حسنا أي واحدة يمكنني استخدامها؟
  • 4:42 - 4:44
    كيف أعرف؟
  • 4:44 - 4:46
    قبل ستة أشهر من الآن،
  • 4:46 - 4:48
    أعلى تقدم تقني في المجال
  • 4:48 - 4:50
    كان أن تقوم، على سبيل المثال،
  • 4:50 - 4:52
    بالذهاب إلى عالم نفساني بشعر رائع،
  • 4:52 - 4:54
    وتقول،
  • 4:54 - 4:57
    "ستيف، أنت خبير في الأفعال غير النظامية.
  • 4:57 - 4:59
    ما الذي يجدر بي فعله؟"
  • 4:59 - 5:01
    وسيقول لك، "حسنا معظم الناس يقولون نجحت،
  • 5:01 - 5:04
    لكن بعضهم يقول ازدهرت."
  • 5:04 - 5:06
    وتعلم كذلك، أكثر أو أقل،
  • 5:06 - 5:09
    أنه إن عدت 200 سنة إلى الوراء
  • 5:09 - 5:12
    وسألت رجل دولة بنفس الشعر الرائع،
  • 5:12 - 5:15
    (ضحك)
  • 5:15 - 5:17
    "توم، ما الذي يجدر بي قوله؟"
  • 5:17 - 5:19
    سيقول، "حسنا، في وقتنا، معظم الناس يزدهرون،
  • 5:19 - 5:22
    لكن بعضعهم ينجحون."
  • 5:22 - 5:24
    وبالتالي الآن ما سأعرضهم عليهم هو بينات خام.
  • 5:24 - 5:28
    صفان من هذا جدول ملياري مدخلة.
  • 5:28 - 5:30
    ما ترونه هو تردد سنة بسنة
  • 5:30 - 5:33
    لـ "نجح" و"ازدهر" على مرور الزمن.
  • 5:34 - 5:36
    الآن هذه فقط اثنتان
  • 5:36 - 5:39
    من ملياري صف.
  • 5:39 - 5:41
    وبالتالي مجموع البيانات الكلية
  • 5:41 - 5:44
    هي مليار مرة أكثر روعة من هذه الشريحة.
  • 5:44 - 5:46
    (ضحك)
  • 5:46 - 5:50
    (تصفيق)
  • 5:50 - 5:52
    ج. م: الآن هناك الكثير من الصور الأخرى التي تعادل 500 مليار كلمة.
  • 5:52 - 5:54
    على سبيل المثال، هذه.
  • 5:54 - 5:56
    إن أخذتم الإنفلونزا
  • 5:56 - 5:58
    سترون ذرى في الأوقات التي تعرفون
  • 5:58 - 6:01
    كانت تقتل فيه أوبئة الأنفلونزا الكبرى الناس في جميع أنحاء العالم.
  • 6:01 - 6:04
    إ. ل. أ: إن لم تكونوا بعد مقتنعين،
  • 6:04 - 6:06
    مستويات البحر ترتفع،
  • 6:06 - 6:09
    وكذلك ثنائي أكسيد الكربون في الجو والحرارة العالمية.
  • 6:09 - 6:12
    ج. م: سترغبون كذلك في إلقاء نظرة على هذا الـ ن-غرام بذاته،
  • 6:12 - 6:15
    وذلك لإخبار نيتشه أن الإله ليس ميتا،
  • 6:15 - 6:18
    على الرغم من أنه قد يحتاج وكيلا إعلاميا أفضل.
  • 6:18 - 6:20
    (ضحك)
  • 6:20 - 6:23
    إ. ل. أ: يمكنكم الحصول على بعض المفاهيم المجردة بهذا الشيء.
  • 6:23 - 6:25
    على سبيل المثال، دعوني أخبركم عن تاريخ
  • 6:25 - 6:27
    السنة 1950.
  • 6:27 - 6:29
    للغالبية العظمى من التاريخ،
  • 6:29 - 6:31
    لم يهتم أحد في حدود 1950.
  • 6:31 - 6:33
    في 1700 في 1800 في 1900،
  • 6:33 - 6:36
    لم يهتم أحد.
  • 6:37 - 6:39
    خلال الثلاثينيات والأربعينيات،
  • 6:39 - 6:41
    لم يهتم أحد.
  • 6:41 - 6:43
    وفجأة، في منتصف الأربعينيات،
  • 6:43 - 6:45
    بدأت تحدث ضجة.
  • 6:45 - 6:47
    بدأ الناس يدركون أن 1950 قادمة،
  • 6:47 - 6:49
    وقد تكون عظيمة.
  • 6:49 - 6:52
    (ضحك)
  • 6:52 - 6:55
    لكن لا شيء جعل الناس أكثر اهتماما بـ 1950
  • 6:55 - 6:58
    مثل السنة 1950.
  • 6:58 - 7:01
    (ضحك)
  • 7:01 - 7:03
    كان الناس يمشون مهووسين.
  • 7:03 - 7:05
    لم يستطيعوا التوقف عن الكلام
  • 7:05 - 7:08
    حول ما قاموا به في 1950،
  • 7:08 - 7:11
    كل ما كانوا يخططون له في 1950،
  • 7:11 - 7:16
    كل الأحلام حول ما أرادوا إنجازه في 1950.
  • 7:16 - 7:18
    في الواقع، 1950 كان آسرا لدرجة
  • 7:18 - 7:20
    أنه في السنوات اللاحقة،
  • 7:20 - 7:23
    بقي الناس يتحدثون حول كل الأمور الرائعة التي حدثت،
  • 7:23 - 7:25
    في 51 و 52 و53.
  • 7:25 - 7:27
    وأخير في 1954،
  • 7:27 - 7:29
    أحدهم استيقظ وأدرك
  • 7:29 - 7:33
    أن 1950 قد انقضت.
  • 7:33 - 7:35
    (ضحك)
  • 7:35 - 7:37
    وبكل بساطة، انفجرت الفقاعة.
  • 7:37 - 7:39
    (ضحك)
  • 7:39 - 7:41
    وقصة 1950
  • 7:41 - 7:43
    هي قصة كل سنة لدينا في السجلات،
  • 7:43 - 7:46
    بالتفاف بسيط، لأنه لدينا الآن هذه المبيانات الجميلة.
  • 7:46 - 7:49
    ولأنه لدينا مبيانات جميلة، يمكننا قياس الأشياء.
  • 7:49 - 7:51
    يمكننا القول، "حسنا ما مدى سرعة انفجار الفقاعة؟"
  • 7:51 - 7:54
    وقد اتضح أنه يمكننا قياس ذلك بدقة بالغة.
  • 7:54 - 7:57
    تم اشتقاق معادلات، وإنتاج رسوم بيانية،
  • 7:57 - 7:59
    والنتيجة الخام
  • 7:59 - 8:02
    هي أنه وجدنا أن الفقاعة تنفجر بسرعة أكثر فأكثر
  • 8:02 - 8:04
    مع مرور كل سنة.
  • 8:04 - 8:09
    نحن نفقد اهتمامنا بالماضي بشكل أكثر سرعة.
  • 8:09 - 8:11
    ج. م: الآن نصيحة مهنية بسيطة.
  • 8:11 - 8:13
    وبالتالي لمن يريد منكم أن يشتهر،
  • 8:13 - 8:15
    يمكننا الاستفادة من الشخصيات السياسية الـ 25 الأكثر شهرة،
  • 8:15 - 8:17
    والكتاب والممثلين وما إلى ذلك.
  • 8:17 - 8:20
    وبالتالي إذا ما أردت أن تصبح مشهورا لاحقا، يجدر بك أن تصير ممثلا،
  • 8:20 - 8:22
    لأن الشهرة تبدأ بالزيادة في نهاية العشرينيات --
  • 8:22 - 8:24
    لا تزال يافعا، ذلك عظيم للغاية.
  • 8:24 - 8:26
    الآن إن أمكنك الانتظار قليلا، يجدر بك أن تصير كاتبا،
  • 8:26 - 8:28
    لأنه آنذاك ترتفع إلى مستويات عظيمة،
  • 8:28 - 8:30
    مثل مارك توين، على سبيل المثال: في غاية الشهرة.
  • 8:30 - 8:32
    لكن إن أردت أن تصل إلى أعلى القمة،
  • 8:32 - 8:34
    يجدر بك أن تؤجل المتعة،
  • 8:34 - 8:36
    وتصير سياسيا بالطبع.
  • 8:36 - 8:38
    وبالتالي هنا ستصير مشهورا في نهاية خمسينياتك،
  • 8:38 - 8:40
    وستصير مشهورا للغاية بعد ذلك.
  • 8:40 - 8:43
    والعلماء كذلك يميلون إلى أن يصيروا مشهورين حين يكونون أكبر بكثير.
  • 8:43 - 8:45
    على سبيل المثال، الأحيائيون والفيزيائيون
  • 8:45 - 8:47
    يصيرون بقدر شهرة الممثلين.
  • 8:47 - 8:50
    خطأ واحد لا يجدر بكم الوقوع فيه هو أن تصيروا رياضياتيين.
  • 8:50 - 8:52
    (ضحك)
  • 8:52 - 8:54
    إن قمتم بذلك،
  • 8:54 - 8:57
    قد تعتقدون، "أوه عظيم. سأقوم بأعظم أعمالي في العشرينيات من عمري"
  • 8:57 - 8:59
    لكن خمنوا ماذا، لا أحد في الواقع يهتم.
  • 8:59 - 9:02
    (ضحك)
  • 9:02 - 9:04
    إ. ل. أ: هناك ملاحظات حكيمة أخرى
  • 9:04 - 9:06
    فيما بين الـ ن-غرام.
  • 9:06 - 9:08
    على سبيل المثال، هنا تجدون مسار مارك شاغال،
  • 9:08 - 9:10
    فنان ولد سنة 1887.
  • 9:10 - 9:13
    ويبدو هذا مثل مسار شخص مشهور عادي.
  • 9:13 - 9:17
    يصير أكثر وأكثر شهرة،
  • 9:17 - 9:19
    باستثناء إن بحثتم بالألمانية.
  • 9:19 - 9:21
    إن بحثتم بالألمانية، ترون شيئا غريبا للغاية،
  • 9:21 - 9:23
    شيئا لا ترونه أبدا،
  • 9:23 - 9:25
    وهو أن تصير مشهورا للغاية
  • 9:25 - 9:27
    ثم وفجأة،
  • 9:27 - 9:30
    يصل الحضيض ما بين 1933 و1945،
  • 9:30 - 9:33
    قبل أن يرتد مجددا لاحقا.
  • 9:33 - 9:35
    وبالطبع، ما ترونه
  • 9:35 - 9:38
    هو حقيقة كون مارك شاغال فنانا يهوديا
  • 9:38 - 9:40
    في ألمانيا النازية.
  • 9:40 - 9:42
    الآن هذه الإشارات
  • 9:42 - 9:44
    هي في الواقع قوية للغاية
  • 9:44 - 9:47
    لدرجة أنه لا تحتاج إلى معرفة أن أحدهم كان تحت الرقابة.
  • 9:47 - 9:49
    يمكننا في الواقع إستنتاج ذلك
  • 9:49 - 9:51
    باستخدام معالجة إشارات أساسية.
  • 9:51 - 9:53
    هنا طريقة بسيطة للقيام بذلك.
  • 9:53 - 9:55
    حسنا، توقع منطقي
  • 9:55 - 9:57
    هو أن شهرة أحدهم في فترة زمنية معينة
  • 9:57 - 9:59
    يجب أن تكون تقريبا معدل شهرتهم قبل
  • 9:59 - 10:01
    وبعد الاشتهار.
  • 10:01 - 10:03
    وبالتالي ذلك نوع مما نتوقعه.
  • 10:03 - 10:06
    ونقارن ذلك بالشهرة التي نلاحظها.
  • 10:06 - 10:08
    ونقسم واحدا بالآخر
  • 10:08 - 10:10
    لإنتاج شيء نسميه مؤشر القمع.
  • 10:10 - 10:13
    إن كان مؤشر القمع صغيرا جدا للغاية،
  • 10:13 - 10:15
    بعد ذلك قد تكون أنت ذاتك تحت القمع.
  • 10:15 - 10:18
    إن كان كبيرا للغاية، ربما تكون مستفيدا من بروباغاندا.
  • 10:19 - 10:21
    ج. م: الآن يمكنكم فعلا أن تنظروا
  • 10:21 - 10:24
    توزيع مؤشرات القمع على لمجموع السكان.
  • 10:24 - 10:26
    لذا على سبيل المثال، هنا --
  • 10:26 - 10:28
    مؤشر القمع هذا هو لـ 5000 شخص
  • 10:28 - 10:30
    تم اختيارهم من كتب إنجليزية حيث لا يوجد هناك قمع --
  • 10:30 - 10:32
    سيكون شيئا مثل هذا، سيكون أساسا متركزا بإحكام.
  • 10:32 - 10:34
    ما تتوقعونه هو ما يمكنكم ملاحظته أساسا.
  • 10:34 - 10:36
    هذا التوزيع كما يرى في ألمانيا --
  • 10:36 - 10:38
    مختلف كثيرا، إنه محول قليلا لليسار.
  • 10:38 - 10:41
    تحدث عنه الناس مرتين أقل مما يجب أن يكون.
  • 10:41 - 10:43
    لكن المهم جدا، التوزيع أقل وسعا.
  • 10:43 - 10:46
    هناك الكثير من الناس ينتهون في أقصى يسار التوزيع
  • 10:46 - 10:49
    تم الحديث عنهم حوالي 10 مرات أقل مما يجب أن يكون.
  • 10:49 - 10:51
    لكن كذلك الكثير من الناس على أقصى اليسار
  • 10:51 - 10:53
    يبدو أنهم استفادوا من البروباغندا.
  • 10:53 - 10:56
    هذه الصورة هي السمة المميزة للرقابة في سجل الكتب.
  • 10:56 - 10:58
    إ. ل. أ: الكلتروميكس
  • 10:58 - 11:00
    هي ما نسمي هذه الطريقة.
  • 11:00 - 11:02
    إنها نوع ما مثل الجينوميات.
  • 11:02 - 11:04
    باستثناء أن الجينوما هي عدسات على البيولوجيا
  • 11:04 - 11:07
    من خلال نافذة تسلسل القواعد في الجينوم البشري.
  • 11:07 - 11:09
    الكلتروميكس أمر مشابه.
  • 11:09 - 11:12
    إنه تطبيق تحليل لمجموعة البيانات الهائلة الحجم
  • 11:12 - 11:14
    لدراسة الثقافة البشرية.
  • 11:14 - 11:16
    هنا، على سبيل المثال من خلال عدسات الجينوم،
  • 11:16 - 11:19
    من خلال عدسات السجل التاريخي المرقمن.
  • 11:19 - 11:21
    الأمر العظيم بخصوص الكلتروميكس
  • 11:21 - 11:23
    هو أن الجميع يمكنه القيام بذلك.
  • 11:23 - 11:25
    لماذا يمكن للجميع القيام بذلك؟
  • 11:25 - 11:27
    الجميع يمكنه القيام بذلك لأن ثلاثة أشخاص،
  • 11:27 - 11:30
    جون أوروانت ومات غراي وويل بروكمان في غوغل،
  • 11:30 - 11:32
    رأوا النموذج الأولي لعارض ن-غرام،
  • 11:32 - 11:34
    فقالوا، "هذا في غاية المتعة.
  • 11:34 - 11:37
    علينا جعل هذا متوفرا للناس."
  • 11:37 - 11:39
    وبالتالي في أسبوعين بالتمام -- الأسبوعان قبل صدور ورقتنا البحثية --
  • 11:39 - 11:42
    قاموا ببرمجة نسخة من عارض ن-غرام من أجل الاستخدام العام.
  • 11:42 - 11:45
    وبالتالي يمكنكم كذلك أن تكتبوا أي كلمة أو جملة تهتمون بها
  • 11:45 - 11:47
    ورؤية الـ ن-غرام مباشرة --
  • 11:47 - 11:49
    كذلك تصفح أمثلة من مختلف الكتب
  • 11:49 - 11:51
    حيث تظهر ن-غرام.
  • 11:51 - 11:53
    ج. م: الآن تم استخدام هذا أكثر من مليون مرة في اليوم الأول،
  • 11:53 - 11:55
    وهذه بالفعل أفضل كل تلك الاستعلامات.
  • 11:55 - 11:58
    وبالتالي أراد الناس وضع قدمهم الأفضل إلى الأمام.
  • 11:58 - 12:01
    لكن اتضح أنه في القرن الـ 18، لم يهتم الناس بذلك على الإطلاق.
  • 12:01 - 12:04
    لم يريدوا أن يكونوا الأفضل، أرادوا أن يكونوا الأفدل.
  • 12:04 - 12:07
    وبالتالي ما حصل هو، بالطبع، هذا كان مجرد خطأ.
  • 12:07 - 12:09
    ليس ذلك السعي نحو التوسط،
  • 12:09 - 12:12
    إنه فقط حقيقة كون الحرف ض كان يكتب بشكل مختلف، نوعا ما مثل د.
  • 12:12 - 12:15
    الآن بالطبع، غوغل لم يلاحظ ذلك آنذاك،
  • 12:15 - 12:18
    وبالتالي أبلغنا عن ذلك في المقال العلمي الذي كتبناه.
  • 12:18 - 12:20
    لكن اتضح أن ذلك هو فقط تذكير
  • 12:20 - 12:22
    أنه، على الرغم من أنه ممتع جدا،
  • 12:22 - 12:24
    حين تفسر تلك الرسوم البيانية، عليك أن تكون حذرا للغاية،
  • 12:24 - 12:27
    وعليك أن تعتمد المعايير الأساسية للعلوم.
  • 12:27 - 12:30
    إ. ل. أ: الناس كانوا يستخدمون جميع أنواع أغراض المتعة.
  • 12:30 - 12:37
    (ضحك)
  • 12:37 - 12:39
    في الواقع، ليس علينا الكلام،
  • 12:39 - 12:42
    سنقوم فقط بعرض بقية الشرائح والبقاء صامتين.
  • 12:42 - 12:45
    هذا الشخص كان مهتما بتاريخ الإحباط.
  • 12:45 - 12:48
    هنا هذه الأنواع المختلفة من الإحباط.
  • 12:48 - 12:51
    إن صدمت اصبع قدمك، تلك آ "أرغ."
  • 12:51 - 12:53
    إن كان كوكب الأرض أبيد من طرف الفوغونات
  • 12:53 - 12:55
    لإفساح المكان لممر بين-نجمي،
  • 12:55 - 12:57
    تلك 8 آهات "آآآآآآآآرغ."
  • 12:57 - 12:59
    هذا الشخص درس كل هذه ال"آرغ".
  • 12:59 - 13:01
    من واحد إلى ثمانية آهات.
  • 13:01 - 13:03
    وقد اتضح
  • 13:03 - 13:05
    أن أقل الآهات استخداما
  • 13:05 - 13:08
    هي بالطبع تلك التي ترتبط بالأشياء الأكثر احباطا
  • 13:08 - 13:11
    باستثناء، وبشكل غريب، في بداية الثمانينيات.
  • 13:11 - 13:13
    نعتقد أن لذلك علاقة بريغان.
  • 13:13 - 13:15
    (ضحك)
  • 13:15 - 13:18
    ج. م: هناك الكثير من الاستخدامات لهذه البيانات،
  • 13:18 - 13:21
    لكن الخلاصة أن السجلات التاريخية تتم رقمنتها.
  • 13:21 - 13:23
    غوغل قد بدأ يرقمن 15 مليون كتاب.
  • 13:23 - 13:25
    ذلك 12 في المئة من كل الكتب التي نشرت من قبل.
  • 13:25 - 13:28
    إنه قسم لا بأس به من الثقافة البشرية.
  • 13:28 - 13:31
    هناك ما هو أكثر بكثير في الثقافة: هناك المخطوطات، الجرائد،
  • 13:31 - 13:33
    هناك الأشياء التي ليست كتابة، مثل الفن والرسومات.
  • 13:33 - 13:35
    كل هذا يصادف تواجده في حواسيبنا،
  • 13:35 - 13:37
    في حواسيب في جميع أنحاء العالم.
  • 13:37 - 13:40
    وحين يحدث ذلك، سيغير ذلك الطريقة التي
  • 13:40 - 13:42
    نفهم بها ماضينا، وحاضرنا والثقافة البشرية.
  • 13:42 - 13:44
    شكرا جزيلا لكم.
  • 13:44 - 13:47
    (تصفيق)
Title:
ما تعلمناه من 5 ملايين كتاب
Speaker:
جين بابتيست ميكل + إيريز ليبرمان أيدن
Description:

هل سبق لكم أن تسليتم بمشروع عارض ن-غرام في مختبرات غوغل؟ إنه أداة مسببة للإدمان تسمح لك بالبحث في الكلمات والأفكار في قاعدة بيانات 5 ملايين كتاب على مر القرون. يعرض إيريز ليبرمان إيدن وجان باتيست ميشال كيفية اشتغالها، وبعضا من الأمور المفاجئة التي يمكننا تعلمها من 500 مليار كلمة.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Retired user edited Arabic subtitles for What we learned from 5 million books
Retired user added a translation

Arabic subtitles

Revisions Compare revisions