-
Итак, добрый день! Рад приветствовать вас, мне кажется на самой интересной части этого блока. Мы сегодня будем работать с Gephi.
-
И научимся визуализировать сети и анализировать их. Ну что же, давайте начнём. Итак, мы хотим визуализировать сеть в Gephi.
-
Что нам для этого потребуется? Разумеется, сам инструмент и давайте поговорим больше о Gephi и немножко уже о самих сетях.
-
Gephi это интерактивный программный инструмент для визуализации сетей и который в дальнейшем позволяет нам их как раз исследовать.
-
Его разработали Матье Бастиан, Матье Жакоми и другие. И на своём веб-сайте они заявляют, что это инструмент для аналитиков данных и учёных,
-
стремящихся исследовать и понимать графы. И они сравнивают его с фотошопом, только для данных. Пользователь взаимодействует с представлением,
-
манипулирует структурами, формами и цветами, чтобы выявлять скрытые клочки информации. Цель состоит в том, чтобы помочь аналитикам данных
-
делать гипотезы и интуитивно обнаруживать закономерности, визуализировать структурные особенности и неисправности во время поиска данных.
-
Важный момент о Gephi. В Gephi нет кнопки "отменить" или "повторить", то есть Ctrl+Z у нас не работает и Gephi не перечисляет
-
и не сохраняет ваши действия и настройки. Таким образом, лучше взять блокнот и записать используемые вами настройки, чтобы вы могли вспомнить что вы делали,
-
если позже откроете свой проект. Так как у нас нет Ctrl+Z, часто сохраняйте свой проект. Используйте его под "сохранить как", потому что
-
лучше каждое действие сохранять отдельно, чтобы вы могли вернуться к определённому моменту в своей работе. В Gephi вы можете использовать
-
различные алгоритмы, ForceAtlas2 наиболее используемый из них. Если вы используете Gephi для академических исследований, вам необходимо понимать
-
как работает алгоритм хотя бы на базовом уровне. Для этого вы можете прочитать об алгоритме в статьях, написанных разработчиками.
-
Чтобы другие могли понять визуализацию Gephi, вам потребуется представить дополнительную контекстную информацию.
-
При наведении курсора мыши на функции в Gephi появится небольшое жёлтое поле, в котором кратко объясняется на что они способны.
-
Не бойтесь пробовать различные варианты и смотреть как соответственно изменяется ваша визуализация, чтобы освоить Gephi вам просто
-
нужно пробовать разные вещи и скорее всего вы столкнётесь со многими неприятными проблемами. Ну что же, с Gephi мы немного познакомились,
-
но что же такое сеть, которую мы собираемся визуализировать? Давайте посмотрим на следующий пример, который сейчас у меня на экране.
-
Эта визуализация показывает взаимодействие, которое представлено линиями между людьми, которые представлены кругами.
-
Например, Миша общается со Стёпой и общается с Ксюшей. Саша ни с кем не общается, только общается с ней. Коля и Петя общаются между собой.
-
В Gephi круги называются узлами, а связи между узлами рёбрами. Иногда у рёбер также есть веса, эти веса указывают на силу взаимодействия между узлами.
-
Эта сеть не имеет взвешенных рёбер, но связи между узлами могут быть двухсторонними, например вы можете видеть на рисунке две линии,
-
как я уже сказал. В нашем случае две стрелочки. Коля и Петя общаются между собой, то есть идёт стрелочка и к Пете и идёт стрелочка и к Коле.
-
Это ориентированный граф, но графы также могут быть неориентированными. В неориентированных графах по умолчанию рёбра имеют двухстороннюю связь,
-
поэтому не имеет значения в каком направлении они движутся. В ориентированных графах рёбра могут иметь односторонние или двухсторонние связи,
-
в которых направление имеет значение. Как видите, Таня общается с Ваней, но Ваня не общается с Таней. Примером неориентированного графа
-
могут служить ваши друзья в фейсбуке, потому что и вы с ними дружите, и они с вами дружат. Ну например общение в твиттере может быть ориентированным,
-
так как вы можете к кому-то обращаться, он может вам не отвечать или вы можете делать репосты. В этом мы используем готовый набор данных,
-
который будет представлен социальной сетью героев "Марвел". Мы попытаемся разобраться, кто из них самых популярный, как эта сеть устроена,
-
можно ли разбить её на кластеры и т.д. Ну что же, давайте я начну с самого начала. И мы все вместе откроем Gephi. В дальнейшем нажмём "Новый проект",
-
когда появится меню. И выберем в меню "Файл" -> "Импортировать лист", который нам нужен. И выбираете нужный вам dataset.
-
В нашем случае мы будем смотреть на взаимодействие героев "Марвел", в каких появлялись они вместе в разных комиксах или нет.
-
Главное посмотреть на разделитель, у нас это запятая. И импортируется он как лист смежности в нашем случае, потому что если вы хотите импортировать
-
это как, сейчас я вам покажу, как таблицу рёбер, то здесь должен быть source, а здесь target. Нажимаем далее. Смотрим.
-
Тип графа - Mixed - нет, у нас граф неориентированный. Добавляем в то же самое пространство. Новое нам создавать не надо.
-
Узлов всего у нас 6423. Рёбер у нас получается 574468. У вас должен был получиться чёрный квадрат. Это данные, которые вы только что импортировали.
-
Вкладка "Обработка" - это наша основная рабочая область. Здесь мы проанализируем и визуализируем наши данные. Вы можете сохранить проект, чтобы если что,
-
вернуться к самому началу. Назвать его можно с каким-то более-менее смыслом, потому что если у вас будет много проектов, и у них будет
-
одно и то же название или название будет бессмысленным, то будет очень сложно между ними маневрировать. В следующем блоке мы разберём разные меню.
-
И получим практические знания по работе с Gephi и dataset.