Как я построил информационную машину времени

0:00 - 0:03

Это изображение планеты Земля.
0:03 - 0:06

Оно очень похоже
на известные всем снимки,
0:06 - 0:08

сделанные в рамках
космической программы Аполлон.
0:08 - 0:10

Но есть отличие —
0:10 - 0:11

по данному изображению можно щёлкнуть,
0:11 - 0:13

и, если вы сделаете,
0:13 - 0:16

то сможете рассмотреть
практически любое место на Земле.
0:16 - 0:18

Например, это вид
с высоты птичьего полёта
0:18 - 0:20

на кампус Федеральной
политехнической школы в Лозанне (ФПШЛ).
0:20 - 0:22

В большинстве случаев
вы также можете увидеть,
0:22 - 0:26

как выглядит здание с соседней улицы.
0:26 - 0:28

Весьма впечатляюще.
0:28 - 0:31

Но чего-то не хватает в этой
замечательной экскурсии:
0:31 - 0:33

указания времени.
0:33 - 0:36

Я, на самом деле, не уверен,
когда была сделана эта фотография.
0:36 - 0:38

Я даже не уверен соответствует
0:38 - 0:44

ли эта фотография действительности.
0:44 - 0:46

В моей лаборатории
мы разрабатываем инструменты
0:46 - 0:48

для путешествий
не только в пространстве,
0:48 - 0:50

но также и во времени.
0:50 - 0:52

Вопрос, который нас интересует:
0:52 - 0:54

Возможно ли сконструировать нечто,
0:54 - 0:56

похожее на Карты Гугл прошлого?
0:56 - 0:59

Могу ли я добавить бегунок к Картам Гугл
0:59 - 1:01

и просто поменять год,
1:01 - 1:03

чтобы посмотреть, как
выглядела местность 100 лет назад,
1:03 - 1:04

1000 лет назад?
1:04 - 1:06

Возможно ли это?
1:06 - 1:09

Могу ли я воспроизвести
социальную сеть прошлого?
1:09 - 1:12

Могу ли сделать Фейсбук Средневековья?
1:12 - 1:16

Могу ли построить машину времени?
1:16 - 1:18

Может быть, проще сказать:
«Нет, это невозможно».
1:18 - 1:22

Или же мы можем подумать об этом
с информационной точки зрения.
1:22 - 1:25

Это то, что я называю
«информационный гриб».
1:25 - 1:27

На вертикальной оси задано время.
1:27 - 1:29

На горизонтальной — объём
доступной цифровой информации.
1:29 - 1:33

Очевидно, что последние 10 лет
мы владеем большим объёмом информации.
1:33 - 1:36

И так же очевидно, что чем больше мы уходим
в прошлое, тем меньше информации доступно.
1:36 - 1:39

Если мы хотим создать что-то
вроде Карты Гугл прошлого
1:39 - 1:40

или Фейсбук прошлого,
1:40 - 1:42

нам нужно расширить эту область,
1:42 - 1:44

задать ей форму вроде прямоугольника.
1:44 - 1:45

Как это сделать?
1:45 - 1:47

Один из способов — оцифровывание.
1:47 - 1:49

Существует множество материалов —
1:49 - 1:55

газеты, печатные книги,
тысячи печатных книг.
1:55 - 1:57

Я всё это могу
перевести в цифровой формат
1:57 - 2:00

Я могу извлечь
из этих источников информацию.
2:00 - 2:04

Конечно, чем дальше мы будем заглядывать в прошлое,
тем меньше информации будет доступно.
2:04 - 2:06

Таким образом,
этих действий может быть недостаточно.
2:06 - 2:09

Я могу поступить так,
как поступают историки.
2:09 - 2:10

Я могу экстраполировать.
2:10 - 2:15

Это то, что в информатике
мы называем «моделированием».
2:15 - 2:16

Если взять журнал,
2:16 - 2:19

то можно предположить, что
это не просто журнал путевых заметок
2:19 - 2:22

некоего венецианского капитана,
отправившегося в конкретное путешествие.
2:22 - 2:23

Я могу предположить, что это журнал,
2:23 - 2:26

описывающий типичное
путешествие тех времён.
2:26 - 2:28

Я экстраполирую.
2:28 - 2:30

Если у меня есть картина фасада,
2:30 - 2:33

я могу предположить,
что она содержит изображение
не только одного конкретного здания,
2:33 - 2:37

но, скорее всего,
она включает в себя элементы зданий,
2:37 - 2:41

информация о которых утеряна.
2:41 - 2:44

Таким образом, если мы хотим
создать машину времени,
2:44 - 2:45

нам нужны две вещи.
2:45 - 2:47

Нам нужны весьма большие архивы
2:47 - 2:50

и отличные специалисты.
2:50 - 2:52

Венецианская Машина Времени —
2:52 - 2:54

проект, о котором
я собираюсь вам рассказать —
2:54 - 2:57

это совместный проект ФПШЛ
2:57 - 3:00

и Венецианского Университета
Ка' Фоскари.
3:00 - 3:02

У Венеции есть одна особенность —
3:02 - 3:05

её система управления
3:05 - 3:07

очень и очень бюрократична.
3:07 - 3:09

Они отслеживают абсолютно всё,
3:09 - 3:12

почти как Гугл сегодня.
3:12 - 3:13

Государственный Архив представляет собой
3:13 - 3:15

80 километров полок с документами,
3:15 - 3:17

содержащими информацию обо всех аспектах
3:17 - 3:19

жизни Венеции более чем за 1000 лет.
3:19 - 3:21

Здесь учтено каждое отшвартовавшееся
3:21 - 3:22

и каждое вошедшее в порт судно.
3:22 - 3:25

Записано каждое изменение,
произведённое в городе.
3:25 - 3:29

Вся эта информация содержится в Архиве.
3:29 - 3:32

Мы начинаем 10-летнюю
программу по оцифровыванию,
3:32 - 3:34

цель которой — трансформация
3:34 - 3:35

этого необъятного архива
3:35 - 3:38

в гигантскую информационную систему.
3:38 - 3:40

Результат, к которому мы стремимся, —
3:40 - 3:45

это 450 оцифрованных книг в день.
3:45 - 3:47

Конечно, когда занимаешься
оцифровкой, этого недостаточно,
3:47 - 3:48

потому большинство документов написаны
3:48 - 3:51

на латинском, тосканском,
3:51 - 3:52

венецианском диалектах.
3:52 - 3:54

То есть нужно их транскрибировать,
3:54 - 3:56

в некоторых случаях — перевести,
3:56 - 3:57

занести в алфавитный указатель,
3:57 - 3:59

а это, очевидно, непросто.
3:59 - 4:03

В частности, традиционный метод
оптического распознавания текста,
4:03 - 4:04

который может применяться
для печатных манускриптов,
4:04 - 4:08

не так хорошо работает
для рукописных документов.
4:08 - 4:10

И тогда решением
будет воспользоваться методами
4:10 - 4:13

из другой области: распознавания речи.
4:13 - 4:15

Учитывая специфику данной области
используемые в ней методы кажутся неприменимыми
4:15 - 4:18

но, на самом деле, всё разрешается
4:18 - 4:20

путём введения
дополнительных ограничений.
4:20 - 4:22

Если у вас есть очень хорошая модель
4:22 - 4:23

используемого языка,
4:23 - 4:25

есть очень хороший образец документа,
4:25 - 4:27

как хорошо они структурированы.
4:27 - 4:28

И это все административные документы.
4:28 - 4:30

Они хорошо структурированы
в большинстве случаев.
4:30 - 4:33

Если разделить этот огромный
архив на меньшие «подархивы»,
4:33 - 4:36

где меньшая подгруппа
несёт те же характерные черты,
4:36 - 4:40

тогда есть шанс на успех.
4:43 - 4:45

Если мы дойдём до этого этапа, то появится
возможность сделать ещё одну вещь:
4:45 - 4:49

извлечь из такого документа события.
4:49 - 4:51

Фактически, около 10 миллиардов событий
4:51 - 4:53

могут быть извлечены из такого архива.
4:53 - 4:55

Поиск по этой
огромной информационной системе
4:55 - 4:56

можно проводить различными методами.
4:56 - 4:58

Можно задавать такие вопросы как:
4:58 - 5:01

«Кто жил в этом палаццо в 1323 году?»
5:01 - 5:03

«Сколько стоил морской лещ
на рынке Реальто
5:03 - 5:05

в 1434 году?»
5:05 - 5:06

«Каково было жалованье
5:06 - 5:08

стекловара в Мурано,
5:08 - 5:09

например, за последние десять лет?»
5:09 - 5:11

Можно даже задавать
более открытые вопросы,
5:11 - 5:14

потому как они
будут семантически закодированы.
5:14 - 5:16

Далее — можно согласовать
информацию в пространстве,
5:16 - 5:18

так как большая её часть
является пространственной.
5:18 - 5:20

Затем можно предпринимать
такие действия, как
5:20 - 5:22

воссоздание
необыкновенного пути развития
5:22 - 5:25

города, которому удалось
поддерживать устойчивое развитие
5:25 - 5:27

на протяжении более 1000 лет,
5:27 - 5:29

оставаясь при этом
5:29 - 5:32

в постоянной гармонии
с окружающей средой.
5:32 - 5:33

Вы можете воссоздать этот путь развития,
5:33 - 5:36

представить различные его варианты.
5:36 - 5:39

Хотя, конечно, нельзя понять Венецию,
просто взглянув на город.
5:39 - 5:41

Необходимо рассматривать его в более
широком европейском контексте.
5:41 - 5:44

Таким образом, идея заключается
в документировании всего,
5:44 - 5:46

что происходило на европейском уровне.
5:46 - 5:48

Можно также воссоздать развитие
5:48 - 5:50

Венецианской морской империи —
5:50 - 5:54

то как она постепенно взяла
под контроль Адриатическое море,
5:54 - 5:57

как стала самой мощной
средневековой империей
5:57 - 5:59

средневековой империей,
5:59 - 6:01

контролируя большинство морских путей
6:01 - 6:04

от востока на юг.
6:05 - 6:08

Также можно делать и другие вещи,
6:08 - 6:10

потому что на этих морских путях
6:10 - 6:12

есть свои закономерности.
6:12 - 6:14

Можно пойти ещё дальше
6:14 - 6:17

и создать систему моделирования,
6:17 - 6:19

Средиземноморский симулятор,
6:19 - 6:22

который способен воссоздать
6:22 - 6:24

даже ту информацию, которой не хватает,
6:24 - 6:27

что даёт нам возможность
задавать такие вопросы,
6:27 - 6:30

как если бы мы воспользовались
планировщиком маршрута.
6:30 - 6:33

«Если я сейчас на Корфу в июне 1323 года
6:33 - 6:36

и хочу отправиться в Константинополь,
6:36 - 6:38

где я могу взять лодку?»
6:38 - 6:39

Мы можем ответить на этот вопрос,
вероятно,
6:39 - 6:44

с точностью в день-два-три.
6:44 - 6:45

«Сколько это будет стоить?»
6:45 - 6:49

«Какова вероятность
столкнуться с пиратами?»
6:49 - 6:51

Вы, конечно, понимаете,
6:51 - 6:53

что главная научная трудность
подобного проекта, —
6:53 - 6:57

это качественная и количественная
оценка информации и учёт
6:57 - 7:00

неопределённости и непостоянства
на каждом этапе данного процесса.
7:00 - 7:03

Ошибки встречаются повсюду —
7:03 - 7:06

в документах, например,
неверное имя капитана,
7:06 - 7:09

некоторые судна, на самом деле,
никогда не уходили в море.
7:09 - 7:14

Ошибки в переводе,
предвзятость толкований, —
7:14 - 7:17

более того, если
добавить алгоритмические процессы, —
7:17 - 7:20

появятся ошибки,
связанные с распознаванием,
7:20 - 7:22

извлечением информации.
7:22 - 7:26

То есть полученные нами данные будут
весьма и весьма сомнительными.
7:26 - 7:30

Каким же образом можно обнаружить
и скорректировать такие неточности?
7:30 - 7:34

Каким образом можно обозначить
этот вид неопределённости?
7:34 - 7:36

Задача не из лёгких.
Самое очевидное, что можно сделать, —
7:36 - 7:38

это задокументировать
каждый шаг процесса,
7:38 - 7:41

не только закодировав
историческую информацию,
7:41 - 7:43

но и так называемую
«метаисторическую» информацию —
7:43 - 7:46

то, на чем построены
исторические знания —
7:46 - 7:48

задокументировать каждый шаг.
7:48 - 7:50

Это не даст гарантии, что мы приблизимся
7:50 - 7:52

к единой истории Венеции,
7:52 - 7:54

но мы, вероятно, сможем воссоздать
7:54 - 7:57

полностью задокументированную
потенциальную историю Венеции.
7:57 - 7:59

Может быть, не будет единой карты.
7:59 - 8:01

Может быть, их будет несколько.
8:01 - 8:03

Система должна это учитывать,
8:03 - 8:06

потому что нам приходиться
работать с новой формой неизвестности,
8:06 - 8:11

которая является абсолютным новшеством
для такого типа гигантских баз данных.
8:11 - 8:13

Каким образом мы должны представить
8:13 - 8:17

это новое исследование
большой аудитории?
8:17 - 8:19

И вновь, Венеция —
исключительна в этом смысле.
8:19 - 8:22

Учитывая миллионы туристов,
приезжающих каждый год,
8:22 - 8:23

она является одним из лучших мест,
8:23 - 8:26

где можно попытаться
изобрести музей будущего.
8:26 - 8:30

Представьте, в горизонтальной плоскости
вы видите реконструированную карту
8:30 - 8:31

заданного года,
8:31 - 8:34

а в вертикальной — документ,
8:34 - 8:35

на основе которого
сделана реконструкция,
8:35 - 8:39

например, картины.
8:39 - 8:41

Представьте систему с «эффектом
присутствия», которая позволяет
8:41 - 8:45

воссоздать и окунуться
в Венецию заданного года —
8:45 - 8:48

опыт, которым можно
поделиться с группой.
8:48 - 8:50

И наоборот, представьте, что вы начали
8:50 - 8:52

с документа, венецианского манускрипта,
8:52 - 8:55

и вы смотрите, что можно
воспроизвести на его основе,
8:55 - 8:57

как он расшифрован,
8:57 - 8:59

каким образом можно
воссоздать его содержание.
8:59 - 9:01

Это фотография с выставки,
9:01 - 9:03

которая в настоящее время
проходит в Женеве,
9:03 - 9:06

с такой вот системой.
9:06 - 9:08

В заключении можно сказать, что
9:08 - 9:11

исследования в области гуманитарных
наук стоят на пороге
9:11 - 9:13

эволюции, возможно, схожей с той,
9:13 - 9:17

что произошла с бионауками 30 лет назад.
9:17 - 9:22

Действительно, это вопрос масштаба.
9:22 - 9:25

Мы рассматриваем проекты, которые
9:25 - 9:29

ещё не были под силу
ни одной исследовательской команде
9:29 - 9:32

это абсолютно ново
для гуманитарных наук,
9:32 - 9:35

где традицией является работать
9:35 - 9:39

небольшими группами или в паре.
9:39 - 9:42

Посещая Государственный Архив,
9:42 - 9:44

понимаешь, что это не по силам
какой-то одной команде,
9:44 - 9:48

необходимо сотрудничество.
9:48 - 9:51

Для смены парадигмы мы должны
9:51 - 9:53

фактически воспитать новое поколение
9:53 - 9:55

«цифровых гуманитарных наук»,
9:55 - 9:57

готовых к подобной смене.
9:57 - 9:59

Спасибо большое.
9:59 - 10:03

(Аплодисменты)

Title:: Как я построил информационную машину времени
Speaker:: Frederic Kaplan
Description:: Представьте, что вы могли бы бродить по Фейсбуку… начиная со Средневековья. На самом деле, эта возможность не так далека, как кажется. В своей увлекательной и интересной презентации исследователь и инженер Фредерик Каплан представляет Венецианскую Машину Времени — проект, целью которого является оцифровка 80 километров книг и создание симулятора 1000-летнего исторического и географического периода развития Венеции. (Снято на TEDxCaFoscariU)

more » « less
Video Language:: English
Team:: closed TED
Project:: TEDTalks
Duration:: 10:20

	Aliaksandr Autayeu edited Russian subtitles for How to build an information time machine
	Aliaksandr Autayeu approved Russian subtitles for How to build an information time machine
	Aliaksandr Autayeu edited Russian subtitles for How to build an information time machine
	Aliaksandr Autayeu edited Russian subtitles for How to build an information time machine
	Aliaksandr Autayeu edited Russian subtitles for How to build an information time machine
	Aliaksandr Autayeu edited Russian subtitles for How to build an information time machine
	Aliaksandr Autayeu edited Russian subtitles for How to build an information time machine
	Elena Krotova accepted Russian subtitles for How to build an information time machine

Show all

Russian subtitles

Revisions

Revision 5 Edited (legacy editor)

Aliaksandr Autayeu

Как я построил информационную машину времени

Revisions

Our website uses cookies

Operating cookies (Required)