Return to Video

Как я построил информационную машину времени

  • 0:00 - 0:03
    Это изображение планеты Земля.
  • 0:03 - 0:06
    Оно очень похоже
    на известные всем снимки,
  • 0:06 - 0:08
    сделанные в рамках
    космической программы Аполлон.
  • 0:08 - 0:10
    Но есть отличие —
  • 0:10 - 0:11
    по данному изображению можно щёлкнуть,
  • 0:11 - 0:13
    и, если вы сделаете,
  • 0:13 - 0:16
    то сможете рассмотреть
    практически любое место на Земле.
  • 0:16 - 0:18
    Например, это вид
    с высоты птичьего полёта
  • 0:18 - 0:20
    на кампус Федеральной
    политехнической школы в Лозанне (ФПШЛ).
  • 0:20 - 0:22
    В большинстве случаев
    вы также можете увидеть,
  • 0:22 - 0:26
    как выглядит здание с соседней улицы.
  • 0:26 - 0:28
    Весьма впечатляюще.
  • 0:28 - 0:31
    Но чего-то не хватает в этой
    замечательной экскурсии:
  • 0:31 - 0:33
    указания времени.
  • 0:33 - 0:36
    Я, на самом деле, не уверен,
    когда была сделана эта фотография.
  • 0:36 - 0:38
    Я даже не уверен соответствует
  • 0:38 - 0:44
    ли эта фотография действительности.
  • 0:44 - 0:46
    В моей лаборатории
    мы разрабатываем инструменты
  • 0:46 - 0:48
    для путешествий
    не только в пространстве,
  • 0:48 - 0:50
    но также и во времени.
  • 0:50 - 0:52
    Вопрос, который нас интересует:
  • 0:52 - 0:54
    Возможно ли сконструировать нечто,
  • 0:54 - 0:56
    похожее на Карты Гугл прошлого?
  • 0:56 - 0:59
    Могу ли я добавить бегунок к Картам Гугл
  • 0:59 - 1:01
    и просто поменять год,
  • 1:01 - 1:03
    чтобы посмотреть, как
    выглядела местность 100 лет назад,
  • 1:03 - 1:04
    1000 лет назад?
  • 1:04 - 1:06
    Возможно ли это?
  • 1:06 - 1:09
    Могу ли я воспроизвести
    социальную сеть прошлого?
  • 1:09 - 1:12
    Могу ли сделать Фейсбук Средневековья?
  • 1:12 - 1:16
    Могу ли построить машину времени?
  • 1:16 - 1:18
    Может быть, проще сказать:
    «Нет, это невозможно».
  • 1:18 - 1:22
    Или же мы можем подумать об этом
    с информационной точки зрения.
  • 1:22 - 1:25
    Это то, что я называю
    «информационный гриб».
  • 1:25 - 1:27
    На вертикальной оси задано время.
  • 1:27 - 1:29
    На горизонтальной — объём
    доступной цифровой информации.
  • 1:29 - 1:33
    Очевидно, что последние 10 лет
    мы владеем большим объёмом информации.
  • 1:33 - 1:36
    И так же очевидно, что чем больше мы уходим
    в прошлое, тем меньше информации доступно.
  • 1:36 - 1:39
    Если мы хотим создать что-то
    вроде Карты Гугл прошлого
  • 1:39 - 1:40
    или Фейсбук прошлого,
  • 1:40 - 1:42
    нам нужно расширить эту область,
  • 1:42 - 1:44
    задать ей форму вроде прямоугольника.
  • 1:44 - 1:45
    Как это сделать?
  • 1:45 - 1:47
    Один из способов — оцифровывание.
  • 1:47 - 1:49
    Существует множество материалов —
  • 1:49 - 1:55
    газеты, печатные книги,
    тысячи печатных книг.
  • 1:55 - 1:57
    Я всё это могу
    перевести в цифровой формат
  • 1:57 - 2:00
    Я могу извлечь
    из этих источников информацию.
  • 2:00 - 2:04
    Конечно, чем дальше мы будем заглядывать в прошлое,
    тем меньше информации будет доступно.
  • 2:04 - 2:06
    Таким образом,
    этих действий может быть недостаточно.
  • 2:06 - 2:09
    Я могу поступить так,
    как поступают историки.
  • 2:09 - 2:10
    Я могу экстраполировать.
  • 2:10 - 2:15
    Это то, что в информатике
    мы называем «моделированием».
  • 2:15 - 2:16
    Если взять журнал,
  • 2:16 - 2:19
    то можно предположить, что
    это не просто журнал путевых заметок
  • 2:19 - 2:22
    некоего венецианского капитана,
    отправившегося в конкретное путешествие.
  • 2:22 - 2:23
    Я могу предположить, что это журнал,
  • 2:23 - 2:26
    описывающий типичное
    путешествие тех времён.
  • 2:26 - 2:28
    Я экстраполирую.
  • 2:28 - 2:30
    Если у меня есть картина фасада,
  • 2:30 - 2:33
    я могу предположить,
    что она содержит изображение
    не только одного конкретного здания,
  • 2:33 - 2:37
    но, скорее всего,
    она включает в себя элементы зданий,
  • 2:37 - 2:41
    информация о которых утеряна.
  • 2:41 - 2:44
    Таким образом, если мы хотим
    создать машину времени,
  • 2:44 - 2:45
    нам нужны две вещи.
  • 2:45 - 2:47
    Нам нужны весьма большие архивы
  • 2:47 - 2:50
    и отличные специалисты.
  • 2:50 - 2:52
    Венецианская Машина Времени —
  • 2:52 - 2:54
    проект, о котором
    я собираюсь вам рассказать —
  • 2:54 - 2:57
    это совместный проект ФПШЛ
  • 2:57 - 3:00
    и Венецианского Университета
    Ка' Фоскари.
  • 3:00 - 3:02
    У Венеции есть одна особенность —
  • 3:02 - 3:05
    её система управления
  • 3:05 - 3:07
    очень и очень бюрократична.
  • 3:07 - 3:09
    Они отслеживают абсолютно всё,
  • 3:09 - 3:12
    почти как Гугл сегодня.
  • 3:12 - 3:13
    Государственный Архив представляет собой
  • 3:13 - 3:15
    80 километров полок с документами,
  • 3:15 - 3:17
    содержащими информацию обо всех аспектах
  • 3:17 - 3:19
    жизни Венеции более чем за 1000 лет.
  • 3:19 - 3:21
    Здесь учтено каждое отшвартовавшееся
  • 3:21 - 3:22
    и каждое вошедшее в порт судно.
  • 3:22 - 3:25
    Записано каждое изменение,
    произведённое в городе.
  • 3:25 - 3:29
    Вся эта информация содержится в Архиве.
  • 3:29 - 3:32
    Мы начинаем 10-летнюю
    программу по оцифровыванию,
  • 3:32 - 3:34
    цель которой — трансформация
  • 3:34 - 3:35
    этого необъятного архива
  • 3:35 - 3:38
    в гигантскую информационную систему.
  • 3:38 - 3:40
    Результат, к которому мы стремимся, —
  • 3:40 - 3:45
    это 450 оцифрованных книг в день.
  • 3:45 - 3:47
    Конечно, когда занимаешься
    оцифровкой, этого недостаточно,
  • 3:47 - 3:48
    потому большинство документов написаны
  • 3:48 - 3:51
    на латинском, тосканском,
  • 3:51 - 3:52
    венецианском диалектах.
  • 3:52 - 3:54
    То есть нужно их транскрибировать,
  • 3:54 - 3:56
    в некоторых случаях — перевести,
  • 3:56 - 3:57
    занести в алфавитный указатель,
  • 3:57 - 3:59
    а это, очевидно, непросто.
  • 3:59 - 4:03
    В частности, традиционный метод
    оптического распознавания текста,
  • 4:03 - 4:04
    который может применяться
    для печатных манускриптов,
  • 4:04 - 4:08
    не так хорошо работает
    для рукописных документов.
  • 4:08 - 4:10
    И тогда решением
    будет воспользоваться методами
  • 4:10 - 4:13
    из другой области: распознавания речи.
  • 4:13 - 4:15
    Учитывая специфику данной области
    используемые в ней методы кажутся неприменимыми
  • 4:15 - 4:18
    но, на самом деле, всё разрешается
  • 4:18 - 4:20
    путём введения
    дополнительных ограничений.
  • 4:20 - 4:22
    Если у вас есть очень хорошая модель
  • 4:22 - 4:23
    используемого языка,
  • 4:23 - 4:25
    есть очень хороший образец документа,
  • 4:25 - 4:27
    как хорошо они структурированы.
  • 4:27 - 4:28
    И это все административные документы.
  • 4:28 - 4:30
    Они хорошо структурированы
    в большинстве случаев.
  • 4:30 - 4:33
    Если разделить этот огромный
    архив на меньшие «подархивы»,
  • 4:33 - 4:36
    где меньшая подгруппа
    несёт те же характерные черты,
  • 4:36 - 4:40
    тогда есть шанс на успех.
  • 4:43 - 4:45
    Если мы дойдём до этого этапа, то появится
    возможность сделать ещё одну вещь:
  • 4:45 - 4:49
    извлечь из такого документа события.
  • 4:49 - 4:51
    Фактически, около 10 миллиардов событий
  • 4:51 - 4:53
    могут быть извлечены из такого архива.
  • 4:53 - 4:55
    Поиск по этой
    огромной информационной системе
  • 4:55 - 4:56
    можно проводить различными методами.
  • 4:56 - 4:58
    Можно задавать такие вопросы как:
  • 4:58 - 5:01
    «Кто жил в этом палаццо в 1323 году?»
  • 5:01 - 5:03
    «Сколько стоил морской лещ
    на рынке Реальто
  • 5:03 - 5:05
    в 1434 году?»
  • 5:05 - 5:06
    «Каково было жалованье
  • 5:06 - 5:08
    стекловара в Мурано,
  • 5:08 - 5:09
    например, за последние десять лет?»
  • 5:09 - 5:11
    Можно даже задавать
    более открытые вопросы,
  • 5:11 - 5:14
    потому как они
    будут семантически закодированы.
  • 5:14 - 5:16
    Далее — можно согласовать
    информацию в пространстве,
  • 5:16 - 5:18
    так как большая её часть
    является пространственной.
  • 5:18 - 5:20
    Затем можно предпринимать
    такие действия, как
  • 5:20 - 5:22
    воссоздание
    необыкновенного пути развития
  • 5:22 - 5:25
    города, которому удалось
    поддерживать устойчивое развитие
  • 5:25 - 5:27
    на протяжении более 1000 лет,
  • 5:27 - 5:29
    оставаясь при этом
  • 5:29 - 5:32
    в постоянной гармонии
    с окружающей средой.
  • 5:32 - 5:33
    Вы можете воссоздать этот путь развития,
  • 5:33 - 5:36
    представить различные его варианты.
  • 5:36 - 5:39
    Хотя, конечно, нельзя понять Венецию,
    просто взглянув на город.
  • 5:39 - 5:41
    Необходимо рассматривать его в более
    широком европейском контексте.
  • 5:41 - 5:44
    Таким образом, идея заключается
    в документировании всего,
  • 5:44 - 5:46
    что происходило на европейском уровне.
  • 5:46 - 5:48
    Можно также воссоздать развитие
  • 5:48 - 5:50
    Венецианской морской империи —
  • 5:50 - 5:54
    то как она постепенно взяла
    под контроль Адриатическое море,
  • 5:54 - 5:57
    как стала самой мощной
    средневековой империей
  • 5:57 - 5:59
    средневековой империей,
  • 5:59 - 6:01
    контролируя большинство морских путей
  • 6:01 - 6:04
    от востока на юг.
  • 6:05 - 6:08
    Также можно делать и другие вещи,
  • 6:08 - 6:10
    потому что на этих морских путях
  • 6:10 - 6:12
    есть свои закономерности.
  • 6:12 - 6:14
    Можно пойти ещё дальше
  • 6:14 - 6:17
    и создать систему моделирования,
  • 6:17 - 6:19
    Средиземноморский симулятор,
  • 6:19 - 6:22
    который способен воссоздать
  • 6:22 - 6:24
    даже ту информацию, которой не хватает,
  • 6:24 - 6:27
    что даёт нам возможность
    задавать такие вопросы,
  • 6:27 - 6:30
    как если бы мы воспользовались
    планировщиком маршрута.
  • 6:30 - 6:33
    «Если я сейчас на Корфу в июне 1323 года
  • 6:33 - 6:36
    и хочу отправиться в Константинополь,
  • 6:36 - 6:38
    где я могу взять лодку?»
  • 6:38 - 6:39
    Мы можем ответить на этот вопрос,
    вероятно,
  • 6:39 - 6:44
    с точностью в день-два-три.
  • 6:44 - 6:45
    «Сколько это будет стоить?»
  • 6:45 - 6:49
    «Какова вероятность
    столкнуться с пиратами?»
  • 6:49 - 6:51
    Вы, конечно, понимаете,
  • 6:51 - 6:53
    что главная научная трудность
    подобного проекта, —
  • 6:53 - 6:57
    это качественная и количественная
    оценка информации и учёт
  • 6:57 - 7:00
    неопределённости и непостоянства
    на каждом этапе данного процесса.
  • 7:00 - 7:03
    Ошибки встречаются повсюду —
  • 7:03 - 7:06
    в документах, например,
    неверное имя капитана,
  • 7:06 - 7:09
    некоторые судна, на самом деле,
    никогда не уходили в море.
  • 7:09 - 7:14
    Ошибки в переводе,
    предвзятость толкований, —
  • 7:14 - 7:17
    более того, если
    добавить алгоритмические процессы, —
  • 7:17 - 7:20
    появятся ошибки,
    связанные с распознаванием,
  • 7:20 - 7:22
    извлечением информации.
  • 7:22 - 7:26
    То есть полученные нами данные будут
    весьма и весьма сомнительными.
  • 7:26 - 7:30
    Каким же образом можно обнаружить
    и скорректировать такие неточности?
  • 7:30 - 7:34
    Каким образом можно обозначить
    этот вид неопределённости?
  • 7:34 - 7:36
    Задача не из лёгких.
    Самое очевидное, что можно сделать, —
  • 7:36 - 7:38
    это задокументировать
    каждый шаг процесса,
  • 7:38 - 7:41
    не только закодировав
    историческую информацию,
  • 7:41 - 7:43
    но и так называемую
    «метаисторическую» информацию —
  • 7:43 - 7:46
    то, на чем построены
    исторические знания —
  • 7:46 - 7:48
    задокументировать каждый шаг.
  • 7:48 - 7:50
    Это не даст гарантии, что мы приблизимся
  • 7:50 - 7:52
    к единой истории Венеции,
  • 7:52 - 7:54
    но мы, вероятно, сможем воссоздать
  • 7:54 - 7:57
    полностью задокументированную
    потенциальную историю Венеции.
  • 7:57 - 7:59
    Может быть, не будет единой карты.
  • 7:59 - 8:01
    Может быть, их будет несколько.
  • 8:01 - 8:03
    Система должна это учитывать,
  • 8:03 - 8:06
    потому что нам приходиться
    работать с новой формой неизвестности,
  • 8:06 - 8:11
    которая является абсолютным новшеством
    для такого типа гигантских баз данных.
  • 8:11 - 8:13
    Каким образом мы должны представить
  • 8:13 - 8:17
    это новое исследование
    большой аудитории?
  • 8:17 - 8:19
    И вновь, Венеция —
    исключительна в этом смысле.
  • 8:19 - 8:22
    Учитывая миллионы туристов,
    приезжающих каждый год,
  • 8:22 - 8:23
    она является одним из лучших мест,
  • 8:23 - 8:26
    где можно попытаться
    изобрести музей будущего.
  • 8:26 - 8:30
    Представьте, в горизонтальной плоскости
    вы видите реконструированную карту
  • 8:30 - 8:31
    заданного года,
  • 8:31 - 8:34
    а в вертикальной — документ,
  • 8:34 - 8:35
    на основе которого
    сделана реконструкция,
  • 8:35 - 8:39
    например, картины.
  • 8:39 - 8:41
    Представьте систему с «эффектом
    присутствия», которая позволяет
  • 8:41 - 8:45
    воссоздать и окунуться
    в Венецию заданного года —
  • 8:45 - 8:48
    опыт, которым можно
    поделиться с группой.
  • 8:48 - 8:50
    И наоборот, представьте, что вы начали
  • 8:50 - 8:52
    с документа, венецианского манускрипта,
  • 8:52 - 8:55
    и вы смотрите, что можно
    воспроизвести на его основе,
  • 8:55 - 8:57
    как он расшифрован,
  • 8:57 - 8:59
    каким образом можно
    воссоздать его содержание.
  • 8:59 - 9:01
    Это фотография с выставки,
  • 9:01 - 9:03
    которая в настоящее время
    проходит в Женеве,
  • 9:03 - 9:06
    с такой вот системой.
  • 9:06 - 9:08
    В заключении можно сказать, что
  • 9:08 - 9:11
    исследования в области гуманитарных
    наук стоят на пороге
  • 9:11 - 9:13
    эволюции, возможно, схожей с той,
  • 9:13 - 9:17
    что произошла с бионауками 30 лет назад.
  • 9:17 - 9:22
    Действительно, это вопрос масштаба.
  • 9:22 - 9:25
    Мы рассматриваем проекты, которые
  • 9:25 - 9:29
    ещё не были под силу
    ни одной исследовательской команде
  • 9:29 - 9:32
    это абсолютно ново
    для гуманитарных наук,
  • 9:32 - 9:35
    где традицией является работать
  • 9:35 - 9:39
    небольшими группами или в паре.
  • 9:39 - 9:42
    Посещая Государственный Архив,
  • 9:42 - 9:44
    понимаешь, что это не по силам
    какой-то одной команде,
  • 9:44 - 9:48
    необходимо сотрудничество.
  • 9:48 - 9:51
    Для смены парадигмы мы должны
  • 9:51 - 9:53
    фактически воспитать новое поколение
  • 9:53 - 9:55
    «цифровых гуманитарных наук»,
  • 9:55 - 9:57
    готовых к подобной смене.
  • 9:57 - 9:59
    Спасибо большое.
  • 9:59 - 10:03
    (Аплодисменты)
Title:
Как я построил информационную машину времени
Speaker:
Frederic Kaplan
Description:

Представьте, что вы могли бы бродить по Фейсбуку… начиная со Средневековья. На самом деле, эта возможность не так далека, как кажется. В своей увлекательной и интересной презентации исследователь и инженер Фредерик Каплан представляет Венецианскую Машину Времени — проект, целью которого является оцифровка 80 километров книг и создание симулятора 1000-летнего исторического и географического периода развития Венеции. (Снято на TEDxCaFoscariU)

more » « less
Video Language:
English
Team:
closed TED
Project:
TEDTalks
Duration:
10:20

Russian subtitles

Revisions