-
В рамках этой недели мы попытаемся разобраться в визуализации данных. На лекциях мы разберём, что такое визуализация, почему к данным нужно относиться критически.
-
На что нужно обращать внимание при создании графиков и познакомимся с инструментом визуализации Tableau. Визуализация используется для интерпретации
-
или пояснения количественных данных. Это особенно полезно для больших объёмов информации, которые проще воспринимать в графическом формате.
-
Если они, разумеется, для этого подходят. Сравните эти две версии одной и той же информации: в таблице и в диаграмме.
-
Вся информационная визуализация представляет собой метрики, выраженные в виде графиков. Последствия этого утверждения весьма разнообразны.
-
Всё, что можно оценить количественно, учитывая числовые значения, можно превратить в график, диаграмму или другую визуализацию с помощью вычислительных средств.
-
Все части процесса: от создания количественной информации до создания визуализаций - являются актами интерпретации.
-
Понимание того, как графические форматы придают смысл или семантическую ценность имеет решающее значение для создания визуализации.
-
Но, любое ощущение того что данным присуща визуальная форма - является иллюзией. Мы можем взять любой набор данных и поместить его в круговую диаграмму,
-
непрерывный график, диаграмму рассеивания, древовидную карту и т.д. Задача состоит в том, чтобы понять как визуализация создаёт
-
доказательства, а затем использовать графический формат, функции которого служит ваша цели. Многие информационные визуализации
-
являются олицетворением дезинформации. Создание данных, как мы отметили в предыдущем уроке по этой теме, зависит от параметризации.
-
Напомним, основная концепция заключается в том что всё что можно измерить, посчитать или дать метрическое или числовое значение можно превратить в данные.
-
Это, конечно, концепция согласно которой все данные являются рукотворными. Это означает, что они не передаются, а создаются в процессе сбора.
-
Концепция параметризации имеет решающее значение для визуализации, потому что способы которыми мы присваиваем значение данным
-
будут иметь прямое влияние на способы их отображения. Визуализация обладает сильной риторической силой благодаря своим графическим качествам.
-
И могут легко исказить данные. Все визуализации являются интерпретациями, но некоторые из них больше подходят для структуры определённого набора данных, чем другие.
-
Например, если вы показываете результаты опросов общественного мнения в США, выбор того будете ли вы показывать результаты,
-
раскрашивая область внутри границ штатов или использовать диаграмму рассеивания или другую единицу размера населения будет иметь решающее значение.
-
Если вы получаете информацию об итогах выборов, тогда графический эффект должен учитывать просто регион, но если вы смотрите на предпочтения
-
потребителей в отношении продукта, то количество населения и даже местоположение имеют значение. Если вы пытаетесь отследить путь
-
распространения эпидемии, важны транспортные сети, а также населённые пункты и пункты соприкосновения, поэтому не стоит забывать о вопросах,
-
которые нужно задавать самому себе при работе с данными. Мы должны определить: что считать, какие значения присваивать, что отображать.
-
Во многих случаях графическое изображение является артефактом того, как были приняты решения о дизайне, а не решения о данных.
-
Например, если вы регистрируете рост учеников в классе, создание непрерывного графика соединяющего точки не имеет вообще никакого смысла.
-
Между одним учеником и другим нет непрерывности роста. А теперь давайте поговорим о некоторых основах. Различие между дискретными
-
и непрерывными данными - одно из наиболее важных решений при выборе дизайна. Если вы показываете изменение во времени
-
или любую другую непрерывную переменную, то линейный график - правильный выбор. Если вы используете график, который показывает количество
-
с площадью, используйте его для процентов от целого. Если вы увеличиваете площадь круга на основе метрики, связанной с радиусом,
-
вы вносите радикальное искажение в соотношение элементов. Способ, которым вы маркируете и упорядочиваете свои графические элементы сделает
-
некоторые аргументы более очевидными. Если вы хотите сравнить количества, убедитесь что они отображаются рядом. Использование легенд имеет
-
решающее значение, их дизайн может либо улучшить, либо затруднить читаемость. Имейте ввиду, что многие визуализации, такие как
-
сетевые диаграммы упорядочивают информацию для максимальной читаемости на экране, они не используют близость или расстояние семантически
-
значимым образом. Теперь давайте пройдёмся по выводам, чтобы закрепить урок. Информационные визуализации - это показатели, выраженные в виде графиков.
-
Они позволяют нам наглядно отображать большие объёмы (часто сложных) данных таким образом, чтобы очень эффективно выявлять
-
закономерности, аномалии и другие особенности данных. Также они содержат много исторической и культурной информации в их "лишних" элементах,
-
то есть форма визуализации также является информацией.