1 00:00:00,000 --> 00:00:02,000 اریز لیبرمن آیدن: همه می دانند که 2 00:00:02,000 --> 00:00:05,000 یک تصویر به اندازه هزاران کلمه ارزش دارد. 3 00:00:07,000 --> 00:00:09,000 اما ما در هاروارد 4 00:00:09,000 --> 00:00:12,000 می خواستیم به درستی آن پی ببریم. 5 00:00:12,000 --> 00:00:14,000 (خنده حضار) 6 00:00:14,000 --> 00:00:18,000 برای همین تیمی از متخصصان تشکیل دادیم، 7 00:00:18,000 --> 00:00:20,000 از هاروارد و ام آی تی گرفته 8 00:00:20,000 --> 00:00:23,000 تا دیکشنری امریکن هریتیج، دایره المعارف بریتانیکا 9 00:00:23,000 --> 00:00:25,000 و حتی حامی مالی عظیممان، 10 00:00:25,000 --> 00:00:28,000 گوگل. 11 00:00:28,000 --> 00:00:30,000 و در حدود 4 سال 12 00:00:30,000 --> 00:00:32,000 در مورد آن فکر کردیم. 13 00:00:32,000 --> 00:00:37,000 و به نتیجه تکان دهنده ایی رسیدیم. 14 00:00:37,000 --> 00:00:40,000 خانمها و آقایان تصویر به اندازه هزاران کلمه ارزش ندارد. 15 00:00:40,000 --> 00:00:42,000 در حقیقت تصاویری پیدا کردیم که 16 00:00:42,000 --> 00:00:47,000 500 میلیون کلمه ارزش داشتند. 17 00:00:47,000 --> 00:00:49,000 ژان باپتیست میشل: چگونه به این نتیجه رسیدیم؟ 18 00:00:49,000 --> 00:00:51,000 من و اروز به روشهایی فکر می کردیم تا 19 00:00:51,000 --> 00:00:53,000 به تصویر بزرگی از فرهنگ و تاریخ انسان 20 00:00:53,000 --> 00:00:56,000 دست یابیم: تغییر در طول زمان. 21 00:00:56,000 --> 00:00:58,000 کتابهایی زیادی در طول تاریخ نوشته شده است. 22 00:00:58,000 --> 00:01:00,000 فکر کردیم بهترین راه آموختن از آنها 23 00:01:00,000 --> 00:01:02,000 خواندن تمام این چند میلیون کتاب است. 24 00:01:02,000 --> 00:01:05,000 البته اگه مقیاسی باشد که بتوان بزرگی آنرا اندازه گرفت، 25 00:01:05,000 --> 00:01:08,000 بی نهایت، بی نهایت زیاد است. 26 00:01:08,000 --> 00:01:10,000 مشکل این بود که یک محور ایکس وجود دارد، 27 00:01:10,000 --> 00:01:12,000 و آن محور کاربردی است. 28 00:01:12,000 --> 00:01:14,000 که بسیار، بسیار پایین است. 29 00:01:14,000 --> 00:01:17,000 (تشویق) 30 00:01:17,000 --> 00:01:20,000 امروزه مردم از یک روش جایگزین استفاده میکنند، 31 00:01:20,000 --> 00:01:22,000 چند منبع تهیه می کنند وآنرا با دقت می خوانند. 32 00:01:22,000 --> 00:01:24,000 کاملا عملی است اما چندان عالی نیست. 33 00:01:24,000 --> 00:01:27,000 کاری که می خواهید کنید این است که 34 00:01:27,000 --> 00:01:30,000 بهترین و در عین حال عملی ترین نتیجه را از این فضا بدست بیاورید. 35 00:01:30,000 --> 00:01:33,000 معلوم شد شرکتی آنطرف رودخانه وجود دارد بنام گوگل 36 00:01:33,000 --> 00:01:35,000 که از سالها پیش یک پروژه دیجیتالی کردن را شروع کرده 37 00:01:35,000 --> 00:01:37,000 که ممکن است این رویکرد را ممکن سازد. 38 00:01:37,000 --> 00:01:39,000 میلیونها کتاب را دیجیتالی کرده اند. 39 00:01:39,000 --> 00:01:42,000 یعنی اینکه یکنفر می تواند با روشهای محاسباتی 40 00:01:42,000 --> 00:01:44,000 همه کتابها را به یک کلیک بخواند. 41 00:01:44,000 --> 00:01:47,000 بسیار عملی و عالی است. 42 00:01:48,000 --> 00:01:50,000 الا: اجازه دهید توضیح دهم این کتابها از کجا می آیند. 43 00:01:50,000 --> 00:01:53,000 از زمانهای قدیم کسانی بودن که نویسنده بودند. 44 00:01:53,000 --> 00:01:56,000 این نویسندگان شیفته نوشتن کتاب بودند. 45 00:01:56,000 --> 00:01:58,000 و این کار با توسعه فرایند چاپ 46 00:01:58,000 --> 00:02:00,000 از قرنها پیش آسانتر شد. 47 00:02:00,000 --> 00:02:03,000 از آن به بعد نویسندگان 48 00:02:03,000 --> 00:02:05,000 129 میلیون کتاب در موضوعات مختلف را 49 00:02:05,000 --> 00:02:07,000 منتشر کردند. 50 00:02:07,000 --> 00:02:09,000 اگر این کتابها در تاریخ گم نمی شدند، 51 00:02:09,000 --> 00:02:11,000 جایی در کتابخانه بودند، 52 00:02:11,000 --> 00:02:14,000 و بسیاری از این کتابها از کتابخانه ها جمع آوری شدند 53 00:02:14,000 --> 00:02:16,000 و توسط گوگل دیجیتالی شدند، 54 00:02:16,000 --> 00:02:18,000 که تا کنون 15 میلیون کتاب را اسکن کرده است. 55 00:02:18,000 --> 00:02:21,000 وقتی گوگل کتاب را اسکن می کند آنرا به فرمت جالبی در می آورد. 56 00:02:21,000 --> 00:02:23,000 علاوه بر اطلاعات اصلی، اطلاعات جنبی را هم داریم. 57 00:02:23,000 --> 00:02:26,000 ما اطلاعاتی راجع به اینکه مثلا کجا این کتاب منتشر شده است، 58 00:02:26,000 --> 00:02:28,000 نویسنده کتاب کی بوده و چه وقت نوشته شده داریم. 59 00:02:28,000 --> 00:02:31,000 و کاری که ما باید بکنیم این است که همه این رکوردها را مرور کنیم 60 00:02:31,000 --> 00:02:35,000 و هر چیزی که ارزش مناسب اطلاعاتی ندارد نادیده بگیریم. 61 00:02:35,000 --> 00:02:37,000 چیزی که برای ما باقی ماند 62 00:02:37,000 --> 00:02:40,000 مجموعه ای از پنج میلیون کتاب است، 63 00:02:40,000 --> 00:02:43,000 500 میلیارد کلمه، 64 00:02:43,000 --> 00:02:45,000 رشته کاراکترهایی هزاران برابر بزرگتر از 65 00:02:45,000 --> 00:02:48,000 ژنوم انسان-- 66 00:02:48,000 --> 00:02:50,000 متنی که اگر نوشته بشود، 67 00:02:50,000 --> 00:02:52,000 10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد. 68 00:02:52,000 --> 00:02:54,000 10 برابر فاصله رفت و برگشت از اینجا تا ماه کشیده خواهد شد. 69 00:02:54,000 --> 00:02:58,000 پاره حقیقتی از ژنوم فرهنگی ما. 70 00:02:58,000 --> 00:03:00,000 البته ما وقتی با چنین 71 00:03:00,000 --> 00:03:03,000 حجم بی نهایت بزرگی مواجه شدیم... 72 00:03:03,000 --> 00:03:05,000 (خنده حضار) 73 00:03:05,000 --> 00:03:08,000 کاری کردیم که هر محقق قابل احترامی 74 00:03:08,000 --> 00:03:11,000 انجام می داد. 75 00:03:11,000 --> 00:03:13,000 صفحه ای از XKCD خارج کردیم و 76 00:03:13,000 --> 00:03:15,000 گفتیم، "کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم." 77 00:03:15,000 --> 00:03:17,000 گفتیم، "کنار باستید. ما روش میخواهیم روش علمی رو امتحان کنیم." 78 00:03:17,000 --> 00:03:19,000 (خنده حضار) 79 00:03:19,000 --> 00:03:21,000 جی ام: در آن زمان فکر می کردیم، 80 00:03:21,000 --> 00:03:23,000 بسیار خوب، بیایید اطلاعات را در دسترس افرادی قرار دهیم 81 00:03:23,000 --> 00:03:25,000 که با آن کار علمی می کنند. 82 00:03:25,000 --> 00:03:27,000 و فکر کردیم چه نوع اطلاعاتی میتوانیم ارائه کنیم؟ 83 00:03:27,000 --> 00:03:29,000 البته می خواهید که 84 00:03:29,000 --> 00:03:31,000 تمام متن این پنج میلیون کتاب را استخراج کنید. 85 00:03:31,000 --> 00:03:33,000 اکنون گوگل و به ویژه اورانت، 86 00:03:33,000 --> 00:03:35,000 به ما معادله کوچکی گفتند که باید یاد بگیریم. 87 00:03:35,000 --> 00:03:38,000 ازآنجایی که 5 میلیون کتاب داریم پس 5 میلیون نویسنده داریم 88 00:03:38,000 --> 00:03:41,000 و 5 میلیون شاکی که دعوای دادگاهی عظیمی است. 89 00:03:41,000 --> 00:03:43,000 اگرچه بسیار بسیار عجیب است، 90 00:03:43,000 --> 00:03:46,000 خیلی خیلی غیرممکن است. 91 00:03:46,000 --> 00:03:48,000 (خنده حضار) 92 00:03:48,000 --> 00:03:50,000 ما کاوش کردیم، 93 00:03:50,000 --> 00:03:53,000 و ما روش خیلی کاربردی ای را انجام دادیم، که کمتر جالب بود. 94 00:03:53,000 --> 00:03:55,000 گفتیم بجای انتشار متن کلی کتاب، 95 00:03:55,000 --> 00:03:57,000 ما میخواهیم اطلاعات آماری راجع به کتابها منتشر کنیم. 96 00:03:57,000 --> 00:03:59,000 مثلا کتاب "بارقه ای از امید" را برای مثال در نظر بگیرید 97 00:03:59,000 --> 00:04:01,000 که چهار کلمه است، آنرا 4 تایی نامیدیم. 98 00:04:01,000 --> 00:04:03,000 به شما خواهیم گفت چندبار یک چهارتایی خاص 99 00:04:03,000 --> 00:04:05,000 در سالهای1801، 1802، 1803 100 00:04:05,000 --> 00:04:07,000 تا 2008 در کتابها بکار رفته. 101 00:04:07,000 --> 00:04:09,000 این روش به ما یک سری زمانی 102 00:04:09,000 --> 00:04:11,000 از اینکه این جمله در طول زمان چقدر تکرار شده به ما می دهد. 103 00:04:11,000 --> 00:04:14,000 این کار را برای تمام کلمات و عباراتی که در کتابها بکار رفته بود انجام دادیم، 104 00:04:14,000 --> 00:04:17,000 و جدولی به بزرگی 2 میلیارد خط داد 105 00:04:17,000 --> 00:04:19,000 که به ما نحوه تغییر فرهنگ را می گوید. 106 00:04:19,000 --> 00:04:21,000 الا: از اینرو آن دو میلیارد خط، 107 00:04:21,000 --> 00:04:23,000 را دومیلیارد ان-گرم می نامیم. 108 00:04:23,000 --> 00:04:25,000 به ما چه می گویند؟ 109 00:04:25,000 --> 00:04:27,000 هر کدام از این ان-گرمها روند فرهنگی ما را می سنجند. 110 00:04:27,000 --> 00:04:29,000 اجازه دهید مثالی بزنم. 111 00:04:29,000 --> 00:04:31,000 فرض کنید من در حال پیشرفت هستم، 112 00:04:31,000 --> 00:04:33,000 و فردا به شما خواهم گفت چقدر خوب کار کردم. 113 00:04:33,000 --> 00:04:36,000 و ممکن است بگویم "دیروز من پیشرفتم" 114 00:04:36,000 --> 00:04:39,000 همچنین، می توانیم بگویم، دیروز پیشرفت کردم" 115 00:04:39,000 --> 00:04:42,000 کدام را باید بکار ببرم؟ 116 00:04:42,000 --> 00:04:44,000 چطوری بفهمم؟ 117 00:04:44,000 --> 00:04:46,000 حدود شش ماه پیش، 118 00:04:46,000 --> 00:04:48,000 بهترین کار در این زمینه 119 00:04:48,000 --> 00:04:50,000 اینطور بود که مثلا با موهای عجیب 120 00:04:50,000 --> 00:04:52,000 پیش روانشناس بروید 121 00:04:52,000 --> 00:04:54,000 و بگویید، 122 00:04:54,000 --> 00:04:57,000 استیو، تو متخصص افعال بی قاعده ایی. 123 00:04:57,000 --> 00:04:59,000 چکار کنم؟ 124 00:04:59,000 --> 00:05:01,000 و او به شما می گفت، خوب اغلب مردم می گویند پیشرفت کردم، 125 00:05:01,000 --> 00:05:04,000 اما بعضی ها می گویند پیشرفتم. 126 00:05:04,000 --> 00:05:06,000 و کم و بیش می دانید، 127 00:05:06,000 --> 00:05:09,000 که اگر به 200 سال پیش برگردید 128 00:05:09,000 --> 00:05:12,000 و این جمله را با موهای عجیب بپرسید، 129 00:05:12,000 --> 00:05:15,000 (خنده حضار) 130 00:05:15,000 --> 00:05:17,000 "تام، چی باید بگم؟" 131 00:05:17,000 --> 00:05:19,000 می گفت ، "خوب در روزگار من مردم پیش میرفتند، 132 00:05:19,000 --> 00:05:22,000 اما بعضی ها پیشرفت میکردند" 133 00:05:22,000 --> 00:05:24,000 چیزی که به شما نشان خواهم داد اطلاعات خام هستند. 134 00:05:24,000 --> 00:05:28,000 دو ردیف از این جدول دومیلیارد ردیفی. 135 00:05:28,000 --> 00:05:30,000 چیزی که می بینید تکرار سال به سال 136 00:05:30,000 --> 00:05:33,000 "پیشرفت کردن" و "پیشرفتن" در طول زمان است. 137 00:05:34,000 --> 00:05:36,000 و این تاره دو ردیف 138 00:05:36,000 --> 00:05:39,000 از دو میلیارد ردیف است. 139 00:05:39,000 --> 00:05:41,000 بنابراین مجموعه کل اطلاعات 140 00:05:41,000 --> 00:05:44,000 یک میلیارد بار شگفت انگیز تر از این اسلاید است. 141 00:05:44,000 --> 00:05:46,000 (خنده حضار) 142 00:05:46,000 --> 00:05:50,000 (تشویق) 143 00:05:50,000 --> 00:05:52,000 جی ام: تصاویر دیگری هم وجود دارد که 500 میلیارد کلمه می ارزند. 144 00:05:52,000 --> 00:05:54,000 برای نمونه، این یکی. 145 00:05:54,000 --> 00:05:56,000 اگر آنفولانزا را در نظر بگیرید، 146 00:05:56,000 --> 00:05:58,000 شما میتوانید در زمان هایی که میدانید آنفولانزا 147 00:05:58,000 --> 00:06:01,000 جان مردم زیادی را در سراسر جهان گرفته، اوج هایی مشاهده کنید. 148 00:06:01,000 --> 00:06:04,000 الا: اگر هنور متقاعد نشدید، 149 00:06:04,000 --> 00:06:06,000 سطح دریاها در حال افزایش هستند، 150 00:06:06,000 --> 00:06:09,000 همینطور دی اسید کربن و گرمای زمین. 151 00:06:09,000 --> 00:06:12,000 جی ام: شاید بخواهید به این ان-گرم خاص نگاهی بیاندازید، 152 00:06:12,000 --> 00:06:15,000 که به نیچه می گوید خدا نمرده، 153 00:06:15,000 --> 00:06:18,000 اگرچه شاید موافق باشید که به تبلیغ کننده بهتری نیاز دارد. 154 00:06:18,000 --> 00:06:20,000 (خنده حضار) 155 00:06:20,000 --> 00:06:23,000 الا: می توانید مفاهیم انتزاعی زیبایی با اینگونه چیزها بدست آورید. 156 00:06:23,000 --> 00:06:25,000 برای نمونه بذارید براتون تاریخ 157 00:06:25,000 --> 00:06:27,000 سال 1950 را بگم. 158 00:06:27,000 --> 00:06:29,000 اکثر عمده تاریخ، 159 00:06:29,000 --> 00:06:31,000 کسی به 1950 توجهی نمی کند. 160 00:06:31,000 --> 00:06:33,000 در سال 1700، در 1800 در 1900، 161 00:06:33,000 --> 00:06:36,000 هیچکس اهمیت نداد. 162 00:06:37,000 --> 00:06:39,000 از دهه 30 و 40، 163 00:06:39,000 --> 00:06:41,000 هیچکس اهمیت نداد. 164 00:06:41,000 --> 00:06:43,000 ناگهان در اواسط دهه 40، 165 00:06:43,000 --> 00:06:45,000 یه صدایی شروع شد. 166 00:06:45,000 --> 00:06:47,000 مردم متوجه شدند که سال 1950 داره میرسه، 167 00:06:47,000 --> 00:06:49,000 و این می تونه اتفاق خیلی بزرگی باشه. 168 00:06:49,000 --> 00:06:52,000 (خنده حضار) 169 00:06:52,000 --> 00:06:55,000 اما هیچی چیز 1950 برای مردم جذاب نبود 170 00:06:55,000 --> 00:06:58,000 همانند سال 1950. 171 00:06:58,000 --> 00:07:01,000 (خنده حضار) 172 00:07:01,000 --> 00:07:03,000 مردم با وسواس به این طرف و آنطرف می رفتند. 173 00:07:03,000 --> 00:07:05,000 نمی تونستند جلوی صحبت کردنشان را بگیرند 174 00:07:05,000 --> 00:07:08,000 درباره کارهایی که در سال 1950 انجام داده بودند، 175 00:07:08,000 --> 00:07:11,000 و چیزهایی که قصد داشتند در سال 1950 انجام دهند، 176 00:07:11,000 --> 00:07:16,000 تمام ارزوهایی که می خواستند در سال 1950 برآورده کنند. 177 00:07:16,000 --> 00:07:18,000 در حقیقت، سال 1950 چنان جذاب بود 178 00:07:18,000 --> 00:07:20,000 که سالها بعد از آن، 179 00:07:20,000 --> 00:07:23,000 مردم فقط به صحبت در مورد تمام اتفاقاتی که افتاده بود صحبت کردند، 180 00:07:23,000 --> 00:07:25,000 در 51، 52، 53. 181 00:07:25,000 --> 00:07:27,000 و در سرانجام در 1954، 182 00:07:27,000 --> 00:07:29,000 یکی فهمید که 183 00:07:29,000 --> 00:07:33,000 سال 1950 تمام شده. 184 00:07:33,000 --> 00:07:35,000 (خنده حضار) 185 00:07:35,000 --> 00:07:37,000 و اینگونه، حباب ترکید. 186 00:07:37,000 --> 00:07:39,000 (خنده حضار) 187 00:07:39,000 --> 00:07:41,000 و داستان 1950 188 00:07:41,000 --> 00:07:43,000 داستان هرسالی است که ثبت می کنیم، 189 00:07:43,000 --> 00:07:46,000 با کمی تغییر چون ما این جدول های زیبا را داریم. 190 00:07:46,000 --> 00:07:49,000 و چون این جدولهای زیبا را داریم، می توانیم اتفاقات را اندازه گیری کنیم. 191 00:07:49,000 --> 00:07:51,000 می توانم بگویم، "با چه سرعتی حباب ترکید؟" 192 00:07:51,000 --> 00:07:54,000 و مشخص شد که می توانیم آنرا با دقت اندازه گیری کنیم. 193 00:07:54,000 --> 00:07:57,000 معادلات بدست آمد و گراف ها رسم شد، 194 00:07:57,000 --> 00:07:59,000 و نتیجه نهایی 195 00:07:59,000 --> 00:08:02,000 چیزی شد که فهمیدیم حباب سریعتر و سریعتر می ترکد 196 00:08:02,000 --> 00:08:04,000 هر سالی که می گذرد. 197 00:08:04,000 --> 00:08:09,000 علاقه خود را به گذشته با سرعت بیشتری از دست می دهیم. 198 00:08:09,000 --> 00:08:11,000 جی ام: اکنون کمی نصیحت شغلی. 199 00:08:11,000 --> 00:08:13,000 آنهایی که به دنبال شهرت هستند، 200 00:08:13,000 --> 00:08:15,000 می توانیم از 25 شخصیت مشهور سیاسی یادبگیریم، 201 00:08:15,000 --> 00:08:17,000 نویسندگان، هنرپیشه ها و غیره. 202 00:08:17,000 --> 00:08:20,000 اگر می خواهید خیلی زود مشهور بشید باید هنرپیشه شوید، 203 00:08:20,000 --> 00:08:22,000 چون شهرت از پایان دهه 20 شما شروع می شود-- 204 00:08:22,000 --> 00:08:24,000 هنوز جوان هستید و این خیلی عالیه. 205 00:08:24,000 --> 00:08:26,000 اگر کمی صبر داشته باشید باید نویسنده شوید، 206 00:08:26,000 --> 00:08:28,000 چون به جاهای بالایی خواهید رسید، 207 00:08:28,000 --> 00:08:30,000 مانند مارک تواین بسیار مشهور. 208 00:08:30,000 --> 00:08:32,000 اما اگر می خواهید به جای بالا برسید، 209 00:08:32,000 --> 00:08:34,000 باید لذت را به تاخیر بیاندازید 210 00:08:34,000 --> 00:08:36,000 و البته سیاستمدار شوید. 211 00:08:36,000 --> 00:08:38,000 و اینجاست که تا پایان دهه 50 زندگی خود مشهور می شوید، 212 00:08:38,000 --> 00:08:40,000 و بعد از آن بسیار بسیار مشهور خواهید شد. 213 00:08:40,000 --> 00:08:43,000 دانشمندان هم وقتی مسن تر شدن مشهور می شوند. 214 00:08:43,000 --> 00:08:45,000 مانند بیولوژیست ها و فیزیکدانها 215 00:08:45,000 --> 00:08:47,000 تقریبا به اندازه هنرپیشه ها مشهورند. 216 00:08:47,000 --> 00:08:50,000 نباید اشتباه کنید و ریاضی دان شوید. 217 00:08:50,000 --> 00:08:52,000 (خنده حضار) 218 00:08:52,000 --> 00:08:54,000 اگر اینکار را کنید، 219 00:08:54,000 --> 00:08:57,000 ممکن است فکر کنید "عالیه، من وقتی 20 سالم شد بهترین کارم را ارائه می کنم" 220 00:08:57,000 --> 00:08:59,000 اما می توانید حدس بزنید، هیچکسی توجهی نخواهد کرد. 221 00:08:59,000 --> 00:09:02,000 (خده حضار) 222 00:09:02,000 --> 00:09:04,000 بیشتر نوشته های 223 00:09:04,000 --> 00:09:06,000 ان-گرم جدی هستند. 224 00:09:06,000 --> 00:09:08,000 مثلا این خط سیر مارک شاگال است، 225 00:09:08,000 --> 00:09:10,000 هنرمندی که در سال 1887 بدنیا آمد. 226 00:09:10,000 --> 00:09:13,000 همانند مسیر رایج یک شخص مشهور به نظر می رسد. 227 00:09:13,000 --> 00:09:17,000 او مشهورتر، مشهورتر و مشهورتر می شود، 228 00:09:17,000 --> 00:09:19,000 بجز وقتی به آلمان نگاه کنید. 229 00:09:19,000 --> 00:09:21,000 اگر به آلمان نگاه کنید چیز کاملا عجیبی می بینید، 230 00:09:21,000 --> 00:09:23,000 چیزی که تا حالا هرگز ندیدید، 231 00:09:23,000 --> 00:09:25,000 اینکه بسیار مشهور می شود 232 00:09:25,000 --> 00:09:27,000 و ناگهان سقوط می کند، 233 00:09:27,000 --> 00:09:30,000 و بین سالهای 1933 و 1945 می بینیم که در پایین ترین سطح قرار دارد، 234 00:09:30,000 --> 00:09:33,000 قبل از اینکه دوباره شروع به بدست آوردن محبوبیت کند. 235 00:09:33,000 --> 00:09:35,000 البته چیزی که می بینیم 236 00:09:35,000 --> 00:09:38,000 این است که مارک شاگال یک هنرمند یهودی بود 237 00:09:38,000 --> 00:09:40,000 در آلمان نازی. 238 00:09:40,000 --> 00:09:42,000 اکنون این علائم 239 00:09:42,000 --> 00:09:44,000 چنان قوی هستند که 240 00:09:44,000 --> 00:09:47,000 که لازم نیست بدانیم کسی سانسور شده است. 241 00:09:47,000 --> 00:09:49,000 می توانیم به آن پی ببریم 242 00:09:49,000 --> 00:09:51,000 معمولا با استفاده از فرآیند سیگنال ساده. 243 00:09:51,000 --> 00:09:53,000 یک راه ساده آن اینجاست. 244 00:09:53,000 --> 00:09:55,000 خوب، یک انتظار معقول 245 00:09:55,000 --> 00:09:57,000 اینکه شهرت فردی در یک دوره زمانی 246 00:09:57,000 --> 00:09:59,000 باید تقریبا به اندازه میانگین شهرتش در گذشته 247 00:09:59,000 --> 00:10:01,000 و بعد از آن مدت باشد. 248 00:10:01,000 --> 00:10:03,000 و این چیزی است که انتظار داریم. 249 00:10:03,000 --> 00:10:06,000 و آنرا با شهرتی که می بینیم مقایسه می کنیم. 250 00:10:06,000 --> 00:10:08,000 و فقط یکی را بر دیگری تقسیم می کنیم 251 00:10:08,000 --> 00:10:10,000 تا چیزی ایجاد کنیم که آنرا شاخص سرکوب می نامیم. 252 00:10:10,000 --> 00:10:13,000 اگر شاخص سرکوب خیلی، خیلی، خیلی کوچک باشد، 253 00:10:13,000 --> 00:10:15,000 ممکن است به راحتی سرکوب شده باشید. 254 00:10:15,000 --> 00:10:18,000 اگر بزرگ باشد، شاید از پروپاگاندا ذی نفع هستید. 255 00:10:19,000 --> 00:10:21,000 جی ام: اکنون می توانید شاخص های 256 00:10:21,000 --> 00:10:24,000 توزیع سرکوب در کل جمعیت را ببینید. 257 00:10:24,000 --> 00:10:26,000 برای نمونه، اینجا -- 258 00:10:26,000 --> 00:10:28,000 این شاخص سرکوب برای 5000 نفر است 259 00:10:28,000 --> 00:10:30,000 از کتابهای انگلیسی انتخاب شده اند جایی که سرکوب مشهودی وجود ندارد-- 260 00:10:30,000 --> 00:10:32,000 شبیه این خواهد بود، اساسا محکم روی کسی متمرکز است. 261 00:10:32,000 --> 00:10:34,000 چیزی که انتظار دارید چیزی است که می بینید. 262 00:10:34,000 --> 00:10:36,000 این توزیعی است که در آلمان دیده می شود-- 263 00:10:36,000 --> 00:10:38,000 خیلی متفاوت، به سمت چپ متمایل است. 264 00:10:38,000 --> 00:10:41,000 مردم دوبرابر از آنچه که باید کمتر صحبت می کنند. 265 00:10:41,000 --> 00:10:43,000 اما چیزی که مهمتر است، توزیع وسیع تر است. 266 00:10:43,000 --> 00:10:46,000 مردم بسیاری هستند که در انتهای سمت چپ این توزیع هستند 267 00:10:46,000 --> 00:10:49,000 مردمی که 10 بار کمتر از آنچه باید باشد کمتر صحبت می کنند. 268 00:10:49,000 --> 00:10:51,000 اما از طرف دیگر مردمی هستند 269 00:10:51,000 --> 00:10:53,000 از این پروپاگاندا ذی نفع هستند. 270 00:10:53,000 --> 00:10:56,000 این تصویر نمایانگر سانسور در کتاب است. 271 00:10:56,000 --> 00:10:58,000 الا: کالترومیکس 272 00:10:58,000 --> 00:11:00,000 اسمی است که ما روی این متد گذاشته ایم. 273 00:11:00,000 --> 00:11:02,000 نوعی ژن شناسی است. 274 00:11:02,000 --> 00:11:04,000 فرقشان این است که لنز ژنومیکس روی بیولوژی است 275 00:11:04,000 --> 00:11:07,000 از پنجره ترتیب ژنوم انسانی. 276 00:11:07,000 --> 00:11:09,000 کالترومیکس شبیه آن است. 277 00:11:09,000 --> 00:11:12,000 برنامه تحلیل اطلاعات در مقیاس عظیم است 278 00:11:12,000 --> 00:11:14,000 برای مطالعه فرهنگ انسان. 279 00:11:14,000 --> 00:11:16,000 اینجا، بجای نگاه از عدسی ژنوم، 280 00:11:16,000 --> 00:11:19,000 از لنزهای قطعات دیجیتالی شده ثبت تاریخی دیده می شود. 281 00:11:19,000 --> 00:11:21,000 نکته بزرگ در مورد کالترومیکس 282 00:11:21,000 --> 00:11:23,000 این است که هر کسی می تواند آنرا انجام دهد. 283 00:11:23,000 --> 00:11:25,000 چرا هر کسی می تواند انجام دهد؟ 284 00:11:25,000 --> 00:11:27,000 هر کسی می تواند انجام دهد چون سه نفر 285 00:11:27,000 --> 00:11:30,000 جان اوروانت، مت گری و بیل بروکمن در گوگل، 286 00:11:30,000 --> 00:11:32,000 نمونه ای از بیینده انگرم را دیدند، 287 00:11:32,000 --> 00:11:34,000 و گفتند، " بسیار جالب است. 288 00:11:34,000 --> 00:11:37,000 باید این را در دسترس مردم قرار دهیم." 289 00:11:37,000 --> 00:11:39,000 در عرض دو هفته - دو هفته قبل از اینکه مقاله ما منتشر شود -- 290 00:11:39,000 --> 00:11:42,000 نسخه ای از بیننده انگرم را برای استفاده عمومی کدگذاری کردند. 291 00:11:42,000 --> 00:11:45,000 و شما می توانید هر کلمه یا عبارتی که دوست دارید را تایپ کنید 292 00:11:45,000 --> 00:11:47,000 و ان-گرم آن را سریع پیدا کنید-- 293 00:11:47,000 --> 00:11:49,000 همچنین نمونه هایی از کتاب های مختلف را مرور کنید 294 00:11:49,000 --> 00:11:51,000 در ان-گرم شما که ظاهر می شود. 295 00:11:51,000 --> 00:11:53,000 جی ام: در روز اول میلیون ها بار استفاده شد، 296 00:11:53,000 --> 00:11:55,000 و واقعا بهترین تمام جستجوهاست. 297 00:11:55,000 --> 00:11:58,000 مردم می خواهند بهترین باشند، با بهترین قدم شروع کنند. 298 00:11:58,000 --> 00:12:01,000 اما در قرن 18 معلوم شد، مردم اصلا به آن توجهی نمی کردند. 299 00:12:01,000 --> 00:12:04,000 نمی خواستند بهترین باشند، می خواستند به نفعشان باشد. 300 00:12:04,000 --> 00:12:07,000 چه اتفاقی افتاد، البته، این کاملا اشتباه است. 301 00:12:07,000 --> 00:12:09,000 تلاش برای حد متوسط هم نبود، 302 00:12:09,000 --> 00:12:12,000 فقط مانند متفاوت نوشتن S بود، یا چیزی شبیه F. 303 00:12:12,000 --> 00:12:15,000 حالا البته که گوگل آنرا در آن زمان انتخاب نکرد، 304 00:12:15,000 --> 00:12:18,000 برای همین در مقاله علمی که نوشتیم آنرا گزارش کردیم. 305 00:12:18,000 --> 00:12:20,000 معلوم شد فقط یادآوری است 306 00:12:20,000 --> 00:12:22,000 اگرچه بسیار جالب است، 307 00:12:22,000 --> 00:12:24,000 وقتی این گرافها را تفسیر می کنید باید بسیار دقت کنید، 308 00:12:24,000 --> 00:12:27,000 و باید استانداردهای پایه را در علوم رعایت کنید. 309 00:12:27,000 --> 00:12:30,000 الا: مردم از این برای انواع مقاصد تفریحی استفاده کردند. 310 00:12:30,000 --> 00:12:37,000 (خنده حضار) 311 00:12:37,000 --> 00:12:39,000 در واقع، دیگر صحبت نخواهیم کرد، 312 00:12:39,000 --> 00:12:42,000 به شما اسلایدها را نشان می دهیم و ساکت خواهیم ماند. 313 00:12:42,000 --> 00:12:45,000 این شخص یه تاریخ افسردگی علاقمند است. 314 00:12:45,000 --> 00:12:48,000 انواع نا امیدی وجود دارد. 315 00:12:48,000 --> 00:12:51,000 اگر انگشت شصت تون به جایی بخوره ، یک آ "آخ" است. 316 00:12:51,000 --> 00:12:53,000 اگر سیاره زمین توسط وگونها نابود بشه 317 00:12:53,000 --> 00:12:55,000 تا جایی برای عبور از ستاره ها باز بشه، 318 00:12:55,000 --> 00:12:57,000 8 تا آ"آآآآآآآآخ" است. 319 00:12:57,000 --> 00:12:59,000 این شخص همه"آخ ها" را مطالعه کرده است. 320 00:12:59,000 --> 00:13:01,000 از یک تا هشت آ. 321 00:13:01,000 --> 00:13:03,000 و متوجه شد 322 00:13:03,000 --> 00:13:05,000 "آخ" های کمتر رایجتر 323 00:13:05,000 --> 00:13:08,000 آنهایی هستند که مربوط به چیزهای افسرده کننده است-- 324 00:13:08,000 --> 00:13:11,000 بجز، بطور عجیبی، در اوائل قرن 80. 325 00:13:11,000 --> 00:13:13,000 ما فکر کردیم احتمال داره که این ربطی به ریگان داشته باشه. 326 00:13:13,000 --> 00:13:15,000 (خنده حضار) 327 00:13:15,000 --> 00:13:18,000 جی ام: کاربردهای متعددی برای این اطلاعات وجود دارد، 328 00:13:18,000 --> 00:13:21,000 اما دلیل اصلی دیجیتالی کردن برای ثبت تاریخی است. 329 00:13:21,000 --> 00:13:23,000 گوگل دیجیتالی کردن 15 میلیون کتاب را شروع کرده است. 330 00:13:23,000 --> 00:13:25,000 12 درصد کتابهایی که منتشر شده است. 331 00:13:25,000 --> 00:13:28,000 بخش عظیمی از فرهنگ بشری است. 332 00:13:28,000 --> 00:13:31,000 چیزهای فرهنگی بیشتری وجود دارد: دست نوشته ها، روزنامه ها، 333 00:13:31,000 --> 00:13:33,000 چیزهایی که نوشتنی نیستند، مانند هنر و نقاشی. 334 00:13:33,000 --> 00:13:35,000 همه اینها در کامپیوتر ما قرار دارند، 335 00:13:35,000 --> 00:13:37,000 در تمام کامپیوترهای سراسر دنیا. 336 00:13:37,000 --> 00:13:40,000 و وقتی اتفاق بیافتد، مسیری که داریم را تغییر خواهد داد 337 00:13:40,000 --> 00:13:42,000 تا گذشته و حال و فرهنگ بشری را بفهمیم. 338 00:13:42,000 --> 00:13:44,000 بسیار سپاسگذارم. 339 00:13:44,000 --> 00:13:47,000 (تشویق)