< Return to Video

از 5 میلیون کتاب چه چیزی یادگرفتیم

  • 0:00 - 0:02
    اریز لیبرمن آیدن: همه می دانند که
  • 0:02 - 0:05
    یک تصویر به اندازه هزاران کلمه ارزش دارد.
  • 0:07 - 0:09
    اما ما در هاروارد
  • 0:09 - 0:12
    می خواستیم به درستی آن پی ببریم.
  • 0:12 - 0:14
    (خنده حضار)
  • 0:14 - 0:18
    برای همین تیمی از متخصصان تشکیل دادیم،
  • 0:18 - 0:20
    از هاروارد و ام آی تی گرفته
  • 0:20 - 0:23
    تا دیکشنری امریکن هریتیج، دایره المعارف بریتانیکا
  • 0:23 - 0:25
    و حتی حامی مالی عظیممان،
  • 0:25 - 0:28
    گوگل.
  • 0:28 - 0:30
    و در حدود 4 سال
  • 0:30 - 0:32
    در مورد آن فکر کردیم.
  • 0:32 - 0:37
    و به نتیجه تکان دهنده ایی رسیدیم.
  • 0:37 - 0:40
    خانمها و آقایان تصویر به اندازه هزاران کلمه ارزش ندارد.
  • 0:40 - 0:42
    در حقیقت تصاویری پیدا کردیم که
  • 0:42 - 0:47
    500 میلیون کلمه ارزش داشتند.
  • 0:47 - 0:49
    ژان باپتیست میشل: چگونه به این نتیجه رسیدیم؟
  • 0:49 - 0:51
    من و اروز به روشهایی فکر می کردیم تا
  • 0:51 - 0:53
    به تصویر بزرگی از فرهنگ و تاریخ انسان
  • 0:53 - 0:56
    دست یابیم: تغییر در طول زمان.
  • 0:56 - 0:58
    کتابهایی زیادی در طول تاریخ نوشته شده است.
  • 0:58 - 1:00
    فکر کردیم بهترین راه آموختن از آنها
  • 1:00 - 1:02
    خواندن تمام این چند میلیون کتاب است.
  • 1:02 - 1:05
    البته اگه مقیاسی باشد که بتوان بزرگی آنرا اندازه گرفت،
  • 1:05 - 1:08
    بی نهایت، بی نهایت زیاد است.
  • 1:08 - 1:10
    مشکل این بود که یک محور ایکس وجود دارد،
  • 1:10 - 1:12
    و آن محور کاربردی است.
  • 1:12 - 1:14
    که بسیار، بسیار پایین است.
  • 1:14 - 1:17
    (تشویق)
  • 1:17 - 1:20
    امروزه مردم از یک روش جایگزین استفاده میکنند،
  • 1:20 - 1:22
    چند منبع تهیه می کنند وآنرا با دقت می خوانند.
  • 1:22 - 1:24
    کاملا عملی است اما چندان عالی نیست.
  • 1:24 - 1:27
    کاری که می خواهید کنید این است که
  • 1:27 - 1:30
    بهترین و در عین حال عملی ترین نتیجه را از این فضا بدست بیاورید.
  • 1:30 - 1:33
    معلوم شد شرکتی آنطرف رودخانه وجود دارد بنام گوگل
  • 1:33 - 1:35
    که از سالها پیش یک پروژه دیجیتالی کردن را شروع کرده
  • 1:35 - 1:37
    که ممکن است این رویکرد را ممکن سازد.
  • 1:37 - 1:39
    میلیونها کتاب را دیجیتالی کرده اند.
  • 1:39 - 1:42
    یعنی اینکه یکنفر می تواند با روشهای محاسباتی
  • 1:42 - 1:44
    همه کتابها را به یک کلیک بخواند.
  • 1:44 - 1:47
    بسیار عملی و عالی است.
  • 1:48 - 1:50
    الا: اجازه دهید توضیح دهم این کتابها از کجا می آیند.
  • 1:50 - 1:53
    از زمانهای قدیم کسانی بودن که نویسنده بودند.
  • 1:53 - 1:56
    این نویسندگان شیفته نوشتن کتاب بودند.
  • 1:56 - 1:58
    و این کار با توسعه فرایند چاپ
  • 1:58 - 2:00
    از قرنها پیش آسانتر شد.
  • 2:00 - 2:03
    از آن به بعد نویسندگان
  • 2:03 - 2:05
    129 میلیون کتاب در موضوعات مختلف را
  • 2:05 - 2:07
    منتشر کردند.
  • 2:07 - 2:09
    اگر این کتابها در تاریخ گم نمی شدند،
  • 2:09 - 2:11
    جایی در کتابخانه بودند،
  • 2:11 - 2:14
    و بسیاری از این کتابها از کتابخانه ها جمع آوری شدند
  • 2:14 - 2:16
    و توسط گوگل دیجیتالی شدند،
  • 2:16 - 2:18
    که تا کنون 15 میلیون کتاب را اسکن کرده است.
  • 2:18 - 2:21
    وقتی گوگل کتاب را اسکن می کند آنرا به فرمت جالبی در می آورد.
  • 2:21 - 2:23
    علاوه بر اطلاعات اصلی، اطلاعات جنبی را هم داریم.
  • 2:23 - 2:26
    ما اطلاعاتی راجع به اینکه مثلا کجا این کتاب منتشر شده است،
  • 2:26 - 2:28
    نویسنده کتاب کی بوده و چه وقت نوشته شده داریم.
  • 2:28 - 2:31
    و کاری که ما باید بکنیم این است که همه این رکوردها را مرور کنیم
  • 2:31 - 2:35
    و هر چیزی که ارزش مناسب اطلاعاتی ندارد نادیده بگیریم.
  • 2:35 - 2:37
    چیزی که برای ما باقی ماند
  • 2:37 - 2:40
    مجموعه ای از پنج میلیون کتاب است،
  • 2:40 - 2:43
    500 میلیارد کلمه،
  • 2:43 - 2:45
    رشته کاراکترهایی هزاران برابر بزرگتر از
  • 2:45 - 2:48
    ژنوم انسان--
  • 2:48 - 2:50
    متنی که اگر نوشته بشود،
  • 2:50 - 2:52
    10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد.
  • 2:52 - 2:54
    10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد.
  • 2:54 - 2:58
    پاره حقیقتی از ژنوم فرهنگی ما.
  • 2:58 - 3:00
    البته ما وقتی با چنین
  • 3:00 - 3:03
    حجم بی نهایت بزرگی مواجه شدیم...
  • 3:03 - 3:05
    (خنده حضار)
  • 3:05 - 3:08
    کاری کردیم که هر محقق قابل احترامی
  • 3:08 - 3:11
    انجام می داد.
  • 3:11 - 3:13
    صفحه ای از XKCD خارج کردیم و
  • 3:13 - 3:15
    گفتیم، "کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم."
  • 3:15 - 3:17
    گفتیم، "کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم."
  • 3:17 - 3:19
    (خنده حضار)
  • 3:19 - 3:21
    جی ام: در آن زمان فکر می کردیم،
  • 3:21 - 3:23
    بسیار خوب، بیایید اطلاعات را در دسترس افرادی قرار دهیم
  • 3:23 - 3:25
    که با آن کار علمی می کنند.
  • 3:25 - 3:27
    و فکر کردیم چه نوع اطلاعاتی میتوانیم ارائه کنیم؟
  • 3:27 - 3:29
    البته می خواهید که
  • 3:29 - 3:31
    تمام متن این پنج میلیون کتاب را استخراج کنید.
  • 3:31 - 3:33
    اکنون گوگل و به ویژه اورانت،
  • 3:33 - 3:35
    به ما معادله کوچکی گفتند که باید یاد بگیریم.
  • 3:35 - 3:38
    ازآنجایی که 5 میلیون کتاب داریم پس 5 میلیون نویسنده داریم
  • 3:38 - 3:41
    و 5 میلیون شاکی که دعوای دادگاهی عظیمی است.
  • 3:41 - 3:43
    اگرچه بسیار بسیار عجیب است،
  • 3:43 - 3:46
    خیلی خیلی غیرممکن است.
  • 3:46 - 3:48
    (خنده حضار)
  • 3:48 - 3:50
    ما کاوش کردیم،
  • 3:50 - 3:53
    و ما روش خیلی کاربردی ای را انجام دادیم، که کمتر جالب بود.
  • 3:53 - 3:55
    گفتیم بجای انتشار متن کلی کتاب،
  • 3:55 - 3:57
    ما میخواهیم اطلاعات آماری راجع به کتابها منتشر کنیم.
  • 3:57 - 3:59
    مثلا کتاب "بارقه ای از امید" را برای مثال در نظر بگیرید
  • 3:59 - 4:01
    که چهار کلمه است، آنرا 4 تایی نامیدیم.
  • 4:01 - 4:03
    به شما خواهیم گفت چندبار یک چهارتایی خاص
  • 4:03 - 4:05
    در سالهای1801، 1802، 1803
  • 4:05 - 4:07
    تا 2008 در کتابها بکار رفته.
  • 4:07 - 4:09
    این روش به ما یک سری زمانی
  • 4:09 - 4:11
    از اینکه این جمله در طول زمان چقدر تکرار شده به ما می دهد.
  • 4:11 - 4:14
    این کار را برای تمام کلمات و عباراتی که در کتابها بکار رفته بود انجام دادیم،
  • 4:14 - 4:17
    و جدولی به بزرگی 2 میلیارد خط داد
  • 4:17 - 4:19
    که به ما نحوه تغییر فرهنگ را می گوید.
  • 4:19 - 4:21
    الا: از اینرو آن دو میلیارد خط،
  • 4:21 - 4:23
    را دومیلیارد ان-گرم می نامیم.
  • 4:23 - 4:25
    به ما چه می گویند؟
  • 4:25 - 4:27
    هر کدام از این ان-گرمها روند فرهنگی ما را می سنجند.
  • 4:27 - 4:29
    اجازه دهید مثالی بزنم.
  • 4:29 - 4:31
    فرض کنید من در حال پیشرفت هستم،
  • 4:31 - 4:33
    و فردا به شما خواهم گفت چقدر خوب کار کردم.
  • 4:33 - 4:36
    و ممکن است بگویم "دیروز من پیشرفتم"
  • 4:36 - 4:39
    همچنین، می توانیم بگویم، دیروز پیشرفت کردم"
  • 4:39 - 4:42
    کدام را باید بکار ببرم؟
  • 4:42 - 4:44
    چطوری بفهمم؟
  • 4:44 - 4:46
    حدود شش ماه پیش،
  • 4:46 - 4:48
    بهترین کار در این زمینه
  • 4:48 - 4:50
    اینطور بود که مثلا با موهای عجیب
  • 4:50 - 4:52
    پیش روانشناس بروید
  • 4:52 - 4:54
    و بگویید،
  • 4:54 - 4:57
    استیو، تو متخصص افعال بی قاعده ایی.
  • 4:57 - 4:59
    چکار کنم؟
  • 4:59 - 5:01
    و او به شما می گفت، خوب اغلب مردم می گویند پیشرفت کردم،
  • 5:01 - 5:04
    اما بعضی ها می گویند پیشرفتم.
  • 5:04 - 5:06
    و کم و بیش می دانید،
  • 5:06 - 5:09
    که اگر به 200 سال پیش برگردید
  • 5:09 - 5:12
    و این جمله را با موهای عجیب بپرسید،
  • 5:12 - 5:15
    (خنده حضار)
  • 5:15 - 5:17
    "تام، چی باید بگم؟"
  • 5:17 - 5:19
    می گفت ، "خوب در روزگار من مردم پیش میرفتند،
  • 5:19 - 5:22
    اما بعضی ها پیشرفت میکردند"
  • 5:22 - 5:24
    چیزی که به شما نشان خواهم داد اطلاعات خام هستند.
  • 5:24 - 5:28
    دو ردیف از این جدول دومیلیارد ردیفی.
  • 5:28 - 5:30
    چیزی که می بینید تکرار سال به سال
  • 5:30 - 5:33
    "پیشرفت کردن" و "پیشرفتن" در طول زمان است.
  • 5:34 - 5:36
    و این تاره دو ردیف
  • 5:36 - 5:39
    از دو میلیارد ردیف است.
  • 5:39 - 5:41
    بنابراین مجموعه کل اطلاعات
  • 5:41 - 5:44
    یک میلیارد بار شگفت انگیز تر از این اسلاید است.
  • 5:44 - 5:46
    (خنده حضار)
  • 5:46 - 5:50
    (تشویق)
  • 5:50 - 5:52
    جی ام: تصاویر دیگری هم وجود دارد که 500 میلیارد کلمه می ارزند.
  • 5:52 - 5:54
    برای نمونه، این یکی.
  • 5:54 - 5:56
    اگر آنفولانزا را در نظر بگیرید،
  • 5:56 - 5:58
    شما میتوانید در زمان هایی که میدانید آنفولانزا
  • 5:58 - 6:01
    جان مردم زیادی را در سراسر جهان گرفته، اوج هایی مشاهده کنید.
  • 6:01 - 6:04
    الا: اگر هنور متقاعد نشدید،
  • 6:04 - 6:06
    سطح دریاها در حال افزایش هستند،
  • 6:06 - 6:09
    همینطور دی اسید کربن و گرمای زمین.
  • 6:09 - 6:12
    جی ام: شاید بخواهید به این ان-گرم خاص نگاهی بیاندازید،
  • 6:12 - 6:15
    که به نیچه می گوید خدا نمرده،
  • 6:15 - 6:18
    اگرچه شاید موافق باشید که به تبلیغ کننده بهتری نیاز دارد.
  • 6:18 - 6:20
    (خنده حضار)
  • 6:20 - 6:23
    الا: می توانید مفاهیم انتزاعی زیبایی با اینگونه چیزها بدست آورید.
  • 6:23 - 6:25
    برای نمونه بذارید براتون تاریخ
  • 6:25 - 6:27
    سال 1950 را بگم.
  • 6:27 - 6:29
    اکثر عمده تاریخ،
  • 6:29 - 6:31
    کسی به 1950 توجهی نمی کند.
  • 6:31 - 6:33
    در سال 1700، در 1800 در 1900،
  • 6:33 - 6:36
    هیچکس اهمیت نداد.
  • 6:37 - 6:39
    از دهه 30 و 40،
  • 6:39 - 6:41
    هیچکس اهمیت نداد.
  • 6:41 - 6:43
    ناگهان در اواسط دهه 40،
  • 6:43 - 6:45
    یه صدایی شروع شد.
  • 6:45 - 6:47
    مردم متوجه شدند که سال 1950 داره میرسه،
  • 6:47 - 6:49
    و این می تونه اتفاق خیلی بزرگی باشه.
  • 6:49 - 6:52
    (خنده حضار)
  • 6:52 - 6:55
    اما هیچی چیز 1950 برای مردم جذاب نبود
  • 6:55 - 6:58
    همانند سال 1950.
  • 6:58 - 7:01
    (خنده حضار)
  • 7:01 - 7:03
    مردم با وسواس به این طرف و آنطرف می رفتند.
  • 7:03 - 7:05
    نمی تونستند جلوی صحبت کردنشان را بگیرند
  • 7:05 - 7:08
    درباره کارهایی که در سال 1950 انجام داده بودند،
  • 7:08 - 7:11
    و چیزهایی که قصد داشتند در سال 1950 انجام دهند،
  • 7:11 - 7:16
    تمام ارزوهایی که می خواستند در سال 1950 برآورده کنند.
  • 7:16 - 7:18
    در حقیقت، سال 1950 چنان جذاب بود
  • 7:18 - 7:20
    که سالها بعد از آن،
  • 7:20 - 7:23
    مردم فقط به صحبت در مورد تمام اتفاقاتی که افتاده بود صحبت کردند،
  • 7:23 - 7:25
    در 51، 52، 53.
  • 7:25 - 7:27
    و در سرانجام در 1954،
  • 7:27 - 7:29
    یکی فهمید که
  • 7:29 - 7:33
    سال 1950 تمام شده.
  • 7:33 - 7:35
    (خنده حضار)
  • 7:35 - 7:37
    و اینگونه، حباب ترکید.
  • 7:37 - 7:39
    (خنده حضار)
  • 7:39 - 7:41
    و داستان 1950
  • 7:41 - 7:43
    داستان هرسالی است که ثبت می کنیم،
  • 7:43 - 7:46
    با کمی تغییر چون ما این جدول های زیبا را داریم.
  • 7:46 - 7:49
    و چون این جدولهای زیبا را داریم، می توانیم اتفاقات را اندازه گیری کنیم.
  • 7:49 - 7:51
    می توانم بگویم، "با چه سرعتی حباب ترکید؟"
  • 7:51 - 7:54
    و مشخص شد که می توانیم آنرا با دقت اندازه گیری کنیم.
  • 7:54 - 7:57
    معادلات بدست آمد و گراف ها رسم شد،
  • 7:57 - 7:59
    و نتیجه نهایی
  • 7:59 - 8:02
    چیزی شد که فهمیدیم حباب سریعتر و سریعتر می ترکد
  • 8:02 - 8:04
    هر سالی که می گذرد.
  • 8:04 - 8:09
    علاقه خود را به گذشته با سرعت بیشتری از دست می دهیم.
  • 8:09 - 8:11
    جی ام: اکنون کمی نصیحت شغلی.
  • 8:11 - 8:13
    آنهایی که به دنبال شهرت هستند،
  • 8:13 - 8:15
    می توانیم از 25 شخصیت مشهور سیاسی یادبگیریم،
  • 8:15 - 8:17
    نویسندگان، هنرپیشه ها و غیره.
  • 8:17 - 8:20
    اگر می خواهید خیلی زود مشهور بشید باید هنرپیشه شوید،
  • 8:20 - 8:22
    چون شهرت از پایان دهه 20 شما شروع می شود--
  • 8:22 - 8:24
    هنوز جوان هستید و این خیلی عالیه.
  • 8:24 - 8:26
    اگر کمی صبر داشته باشید باید نویسنده شوید،
  • 8:26 - 8:28
    چون به جاهای بالایی خواهید رسید،
  • 8:28 - 8:30
    مانند مارک تواین بسیار مشهور.
  • 8:30 - 8:32
    اما اگر می خواهید به جای بالا برسید،
  • 8:32 - 8:34
    باید لذت را به تاخیر بیاندازید
  • 8:34 - 8:36
    و البته سیاستمدار شوید.
  • 8:36 - 8:38
    و اینجاست که تا پایان دهه 50 زندگی خود مشهور می شوید،
  • 8:38 - 8:40
    و بعد از آن بسیار بسیار مشهور خواهید شد.
  • 8:40 - 8:43
    دانشمندان هم وقتی مسن تر شدن مشهور می شوند.
  • 8:43 - 8:45
    مانند بیولوژیست ها و فیزیکدانها
  • 8:45 - 8:47
    تقریبا به اندازه هنرپیشه ها مشهورند.
  • 8:47 - 8:50
    نباید اشتباه کنید و ریاضی دان شوید.
  • 8:50 - 8:52
    (خنده حضار)
  • 8:52 - 8:54
    اگر اینکار را کنید،
  • 8:54 - 8:57
    ممکن است فکر کنید "عالیه، من وقتی 20 سالم شد بهترین کارم را ارائه می کنم"
  • 8:57 - 8:59
    اما می توانید حدس بزنید، هیچکسی توجهی نخواهد کرد.
  • 8:59 - 9:02
    (خده حضار)
  • 9:02 - 9:04
    بیشتر نوشته های
  • 9:04 - 9:06
    ان-گرم جدی هستند.
  • 9:06 - 9:08
    مثلا این خط سیر مارک شاگال است،
  • 9:08 - 9:10
    هنرمندی که در سال 1887 بدنیا آمد.
  • 9:10 - 9:13
    همانند مسیر رایج یک شخص مشهور به نظر می رسد.
  • 9:13 - 9:17
    او مشهورتر، مشهورتر و مشهورتر می شود،
  • 9:17 - 9:19
    بجز وقتی به آلمان نگاه کنید.
  • 9:19 - 9:21
    اگر به آلمان نگاه کنید چیز کاملا عجیبی می بینید،
  • 9:21 - 9:23
    چیزی که تا حالا هرگز ندیدید،
  • 9:23 - 9:25
    اینکه بسیار مشهور می شود
  • 9:25 - 9:27
    و ناگهان سقوط می کند،
  • 9:27 - 9:30
    و بین سالهای 1933 و 1945 می بینیم که در پایین ترین سطح قرار دارد،
  • 9:30 - 9:33
    قبل از اینکه دوباره شروع به بدست آوردن محبوبیت کند.
  • 9:33 - 9:35
    البته چیزی که می بینیم
  • 9:35 - 9:38
    این است که مارک شاگال یک هنرمند یهودی بود
  • 9:38 - 9:40
    در آلمان نازی.
  • 9:40 - 9:42
    اکنون این علائم
  • 9:42 - 9:44
    چنان قوی هستند که
  • 9:44 - 9:47
    که لازم نیست بدانیم کسی سانسور شده است.
  • 9:47 - 9:49
    می توانیم به آن پی ببریم
  • 9:49 - 9:51
    معمولا با استفاده از فرآیند سیگنال ساده.
  • 9:51 - 9:53
    یک راه ساده آن اینجاست.
  • 9:53 - 9:55
    خوب، یک انتظار معقول
  • 9:55 - 9:57
    اینکه شهرت فردی در یک دوره زمانی
  • 9:57 - 9:59
    باید تقریبا به اندازه میانگین شهرتش در گذشته
  • 9:59 - 10:01
    و بعد از آن مدت باشد.
  • 10:01 - 10:03
    و این چیزی است که انتظار داریم.
  • 10:03 - 10:06
    و آنرا با شهرتی که می بینیم مقایسه می کنیم.
  • 10:06 - 10:08
    و فقط یکی را بر دیگری تقسیم می کنیم
  • 10:08 - 10:10
    تا چیزی ایجاد کنیم که آنرا شاخص سرکوب می نامیم.
  • 10:10 - 10:13
    اگر شاخص سرکوب خیلی، خیلی، خیلی کوچک باشد،
  • 10:13 - 10:15
    ممکن است به راحتی سرکوب شده باشید.
  • 10:15 - 10:18
    اگر بزرگ باشد، شاید از پروپاگاندا ذی نفع هستید.
  • 10:19 - 10:21
    جی ام: اکنون می توانید شاخص های
  • 10:21 - 10:24
    توزیع سرکوب در کل جمعیت را ببینید.
  • 10:24 - 10:26
    برای نمونه، اینجا --
  • 10:26 - 10:28
    این شاخص سرکوب برای 5000 نفر است
  • 10:28 - 10:30
    از کتابهای انگلیسی انتخاب شده اند جایی که سرکوب مشهودی وجود ندارد--
  • 10:30 - 10:32
    شبیه این خواهد بود، اساسا محکم روی کسی متمرکز است.
  • 10:32 - 10:34
    چیزی که انتظار دارید چیزی است که می بینید.
  • 10:34 - 10:36
    این توزیعی است که در آلمان دیده می شود--
  • 10:36 - 10:38
    خیلی متفاوت، به سمت چپ متمایل است.
  • 10:38 - 10:41
    مردم دوبرابر از آنچه که باید کمتر صحبت می کنند.
  • 10:41 - 10:43
    اما چیزی که مهمتر است، توزیع وسیع تر است.
  • 10:43 - 10:46
    مردم بسیاری هستند که در انتهای سمت چپ این توزیع هستند
  • 10:46 - 10:49
    مردمی که 10 بار کمتر از آنچه باید باشد کمتر صحبت می کنند.
  • 10:49 - 10:51
    اما از طرف دیگر مردمی هستند
  • 10:51 - 10:53
    از این پروپاگاندا ذی نفع هستند.
  • 10:53 - 10:56
    این تصویر نمایانگر سانسور در کتاب است.
  • 10:56 - 10:58
    الا: کالترومیکس
  • 10:58 - 11:00
    اسمی است که ما روی این متد گذاشته ایم.
  • 11:00 - 11:02
    نوعی ژن شناسی است.
  • 11:02 - 11:04
    فرقشان این است که لنز ژنومیکس روی بیولوژی است
  • 11:04 - 11:07
    از پنجره ترتیب ژنوم انسانی.
  • 11:07 - 11:09
    کالترومیکس شبیه آن است.
  • 11:09 - 11:12
    برنامه تحلیل اطلاعات در مقیاس عظیم است
  • 11:12 - 11:14
    برای مطالعه فرهنگ انسان.
  • 11:14 - 11:16
    اینجا، بجای نگاه از عدسی ژنوم،
  • 11:16 - 11:19
    از لنزهای قطعات دیجیتالی شده ثبت تاریخی دیده می شود.
  • 11:19 - 11:21
    نکته بزرگ در مورد کالترومیکس
  • 11:21 - 11:23
    این است که هر کسی می تواند آنرا انجام دهد.
  • 11:23 - 11:25
    چرا هر کسی می تواند انجام دهد؟
  • 11:25 - 11:27
    هر کسی می تواند انجام دهد چون سه نفر
  • 11:27 - 11:30
    جان اوروانت، مت گری و بیل بروکمن در گوگل،
  • 11:30 - 11:32
    نمونه ای از بیینده انگرم را دیدند،
  • 11:32 - 11:34
    و گفتند، " بسیار جالب است.
  • 11:34 - 11:37
    باید این را در دسترس مردم قرار دهیم."
  • 11:37 - 11:39
    در عرض دو هفته - دو هفته قبل از اینکه مقاله ما منتشر شود --
  • 11:39 - 11:42
    نسخه ای از بیننده انگرم را برای استفاده عمومی کدگذاری کردند.
  • 11:42 - 11:45
    و شما می توانید هر کلمه یا عبارتی که دوست دارید را تایپ کنید
  • 11:45 - 11:47
    و ان-گرم آن را سریع پیدا کنید--
  • 11:47 - 11:49
    همچنین نمونه هایی از کتاب های مختلف را مرور کنید
  • 11:49 - 11:51
    در ان-گرم شما که ظاهر می شود.
  • 11:51 - 11:53
    جی ام: در روز اول میلیون ها بار استفاده شد،
  • 11:53 - 11:55
    و واقعا بهترین تمام جستجوهاست.
  • 11:55 - 11:58
    مردم می خواهند بهترین باشند، با بهترین قدم شروع کنند.
  • 11:58 - 12:01
    اما در قرن 18 معلوم شد، مردم اصلا به آن توجهی نمی کردند.
  • 12:01 - 12:04
    نمی خواستند بهترین باشند، می خواستند به نفعشان باشد.
  • 12:04 - 12:07
    چه اتفاقی افتاد، البته، این کاملا اشتباه است.
  • 12:07 - 12:09
    تلاش برای حد متوسط هم نبود،
  • 12:09 - 12:12
    فقط مانند متفاوت نوشتن S بود، یا چیزی شبیه F.
  • 12:12 - 12:15
    حالا البته که گوگل آنرا در آن زمان انتخاب نکرد،
  • 12:15 - 12:18
    برای همین در مقاله علمی که نوشتیم آنرا گزارش کردیم.
  • 12:18 - 12:20
    معلوم شد فقط یادآوری است
  • 12:20 - 12:22
    اگرچه بسیار جالب است،
  • 12:22 - 12:24
    وقتی این گرافها را تفسیر می کنید باید بسیار دقت کنید،
  • 12:24 - 12:27
    و باید استانداردهای پایه را در علوم رعایت کنید.
  • 12:27 - 12:30
    الا: مردم از این برای انواع مقاصد تفریحی استفاده کردند.
  • 12:30 - 12:37
    (خنده حضار)
  • 12:37 - 12:39
    در واقع، دیگر صحبت نخواهیم کرد،
  • 12:39 - 12:42
    به شما اسلایدها را نشان می دهیم و ساکت خواهیم ماند.
  • 12:42 - 12:45
    این شخص یه تاریخ افسردگی علاقمند است.
  • 12:45 - 12:48
    انواع نا امیدی وجود دارد.
  • 12:48 - 12:51
    اگر انگشت شصت تون به جایی بخوره ، یک آ "آخ" است.
  • 12:51 - 12:53
    اگر سیاره زمین توسط وگونها نابود بشه
  • 12:53 - 12:55
    تا جایی برای عبور از ستاره ها باز بشه،
  • 12:55 - 12:57
    8 تا آ"آآآآآآآآخ" است.
  • 12:57 - 12:59
    این شخص همه"آخ ها" را مطالعه کرده است.
  • 12:59 - 13:01
    از یک تا هشت آ.
  • 13:01 - 13:03
    و متوجه شد
  • 13:03 - 13:05
    "آخ" های کمتر رایجتر
  • 13:05 - 13:08
    آنهایی هستند که مربوط به چیزهای افسرده کننده است--
  • 13:08 - 13:11
    بجز، بطور عجیبی، در اوائل قرن 80.
  • 13:11 - 13:13
    ما فکر کردیم احتمال داره که این ربطی به ریگان داشته باشه.
  • 13:13 - 13:15
    (خنده حضار)
  • 13:15 - 13:18
    جی ام: کاربردهای متعددی برای این اطلاعات وجود دارد،
  • 13:18 - 13:21
    اما دلیل اصلی دیجیتالی کردن برای ثبت تاریخی است.
  • 13:21 - 13:23
    گوگل دیجیتالی کردن 15 میلیون کتاب را شروع کرده است.
  • 13:23 - 13:25
    12 درصد کتابهایی که منتشر شده است.
  • 13:25 - 13:28
    بخش عظیمی از فرهنگ بشری است.
  • 13:28 - 13:31
    چیزهای فرهنگی بیشتری وجود دارد: دست نوشته ها، روزنامه ها،
  • 13:31 - 13:33
    چیزهایی که نوشتنی نیستند، مانند هنر و نقاشی.
  • 13:33 - 13:35
    همه اینها در کامپیوتر ما قرار دارند،
  • 13:35 - 13:37
    در تمام کامپیوترهای سراسر دنیا.
  • 13:37 - 13:40
    و وقتی اتفاق بیافتد، مسیری که داریم را تغییر خواهد داد
  • 13:40 - 13:42
    تا گذشته و حال و فرهنگ بشری را بفهمیم.
  • 13:42 - 13:44
    بسیار سپاسگذارم.
  • 13:44 - 13:47
    (تشویق)
Title:
از 5 میلیون کتاب چه چیزی یادگرفتیم
Speaker:
Jean-Baptiste Michel + Erez Lieberman Aiden
Description:

آیا تا حالا با بیننده انگرم گوگل لب کار کردید؟ ابزار شیفته کننده ای است که به شما امکان می دهد کلمات و ایده ها را در بانک اطلاعاتی 5 میلیون کتاب در طول چند صد سال پیش جستجو کنید. ارز لیبرمن آیدن و ژان باپتیست میشل به شما نشان می دهند که کارکرد آن چگونه است و نشان می دهند چه چیزهای جالبی که از 500 میلیارد کلمه می توانیم بیاموزیم.

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
13:48
Mehdi Yaghoubi added a translation

Persian subtitles

Revisions