В рамках этой недели мы попытаемся разобраться в визуализации данных. На лекциях мы разберём, что такое визуализация, почему к данным нужно относиться критически.
На что нужно обращать внимание при создании графиков и познакомимся с инструментом визуализации Tableau. Визуализация используется для интерпретации
или пояснения количественных данных. Это особенно полезно для больших объёмов информации, которые проще воспринимать в графическом формате.
Если они, разумеется, для этого подходят. Сравните эти две версии одной и той же информации: в таблице и в диаграмме.
Вся информационная визуализация представляет собой метрики, выраженные в виде графиков. Последствия этого утверждения весьма разнообразны.
Всё, что можно оценить количественно, учитывая числовые значения, можно превратить в график, диаграмму или другую визуализацию с помощью вычислительных средств.
Все части процесса: от создания количественной информации до создания визуализаций - являются актами интерпретации.
Понимание того, как графические форматы придают смысл или семантическую ценность имеет решающее значение для создания визуализации.
Но, любое ощущение того что данным присуща визуальная форма - является иллюзией. Мы можем взять любой набор данных и поместить его в круговую диаграмму,
непрерывный график, диаграмму рассеивания, древовидную карту и т.д. Задача состоит в том, чтобы понять как визуализация создаёт
доказательства, а затем использовать графический формат, функции которого служит ваша цели. Многие информационные визуализации
являются олицетворением дезинформации. Создание данных, как мы отметили в предыдущем уроке по этой теме, зависит от параметризации.
Напомним, основная концепция заключается в том что всё что можно измерить, посчитать или дать метрическое или числовое значение можно превратить в данные.
Это, конечно, концепция согласно которой все данные являются рукотворными. Это означает, что они не передаются, а создаются в процессе сбора.
Концепция параметризации имеет решающее значение для визуализации, потому что способы которыми мы присваиваем значение данным
будут иметь прямое влияние на способы их отображения. Визуализация обладает сильной риторической силой благодаря своим графическим качествам.
И могут легко исказить данные. Все визуализации являются интерпретациями, но некоторые из них больше подходят для структуры определённого набора данных, чем другие.
Например, если вы показываете результаты опросов общественного мнения в США, выбор того будете ли вы показывать результаты,
раскрашивая область внутри границ штатов или использовать диаграмму рассеивания или другую единицу размера населения будет иметь решающее значение.
Если вы получаете информацию об итогах выборов, тогда графический эффект должен учитывать просто регион, но если вы смотрите на предпочтения
потребителей в отношении продукта, то количество населения и даже местоположение имеют значение. Если вы пытаетесь отследить путь
распространения эпидемии, важны транспортные сети, а также населённые пункты и пункты соприкосновения, поэтому не стоит забывать о вопросах,
которые нужно задавать самому себе при работе с данными. Мы должны определить: что считать, какие значения присваивать, что отображать.
Во многих случаях графическое изображение является артефактом того, как были приняты решения о дизайне, а не решения о данных.
Например, если вы регистрируете рост учеников в классе, создание непрерывного графика соединяющего точки не имеет вообще никакого смысла.
Между одним учеником и другим нет непрерывности роста. А теперь давайте поговорим о некоторых основах. Различие между дискретными
и непрерывными данными - одно из наиболее важных решений при выборе дизайна. Если вы показываете изменение во времени
или любую другую непрерывную переменную, то линейный график - правильный выбор. Если вы используете график, который показывает количество
с площадью, используйте его для процентов от целого. Если вы увеличиваете площадь круга на основе метрики, связанной с радиусом,
вы вносите радикальное искажение в соотношение элементов. Способ, которым вы маркируете и упорядочиваете свои графические элементы сделает
некоторые аргументы более очевидными. Если вы хотите сравнить количества, убедитесь что они отображаются рядом. Использование легенд имеет
решающее значение, их дизайн может либо улучшить, либо затруднить читаемость. Имейте ввиду, что многие визуализации, такие как
сетевые диаграммы упорядочивают информацию для максимальной читаемости на экране, они не используют близость или расстояние семантически
значимым образом. Теперь давайте пройдёмся по выводам, чтобы закрепить урок. Информационные визуализации - это показатели, выраженные в виде графиков.
Они позволяют нам наглядно отображать большие объёмы (часто сложных) данных таким образом, чтобы очень эффективно выявлять
закономерности, аномалии и другие особенности данных. Также они содержат много исторической и культурной информации в их "лишних" элементах,
то есть форма визуализации также является информацией.