0:00:03.729,0:00:12.102 В рамках этой недели мы попытаемся разобраться в визуализации данных. На лекциях мы разберём, что такое визуализация, почему к данным нужно относиться критически. 0:00:12.102,0:00:21.037 На что нужно обращать внимание при создании графиков и познакомимся с инструментом визуализации Tableau. Визуализация используется для интерпретации 0:00:21.037,0:00:28.316 или пояснения количественных данных. Это особенно полезно для больших объёмов информации, которые проще воспринимать в графическом формате. 0:00:28.316,0:00:35.655 Если они, разумеется, для этого подходят. Сравните эти две версии одной и той же информации: в таблице и в диаграмме. 0:00:35.655,0:00:43.076 Вся информационная визуализация представляет собой метрики, выраженные в виде графиков. Последствия этого утверждения весьма разнообразны. 0:00:43.076,0:00:52.117 Всё, что можно оценить количественно, учитывая числовые значения, можно превратить в график, диаграмму или другую визуализацию с помощью вычислительных средств. 0:00:52.117,0:00:58.410 Все части процесса: от создания количественной информации до создания визуализаций - являются актами интерпретации. 0:00:58.410,0:01:07.312 Понимание того, как графические форматы придают смысл или семантическую ценность имеет решающее значение для создания визуализации. 0:01:07.312,0:01:15.055 Но, любое ощущение того что данным присуща визуальная форма - является иллюзией. Мы можем взять любой набор данных и поместить его в круговую диаграмму, 0:01:15.055,0:01:22.863 непрерывный график, диаграмму рассеивания, древовидную карту и т.д. Задача состоит в том, чтобы понять как визуализация создаёт 0:01:22.863,0:01:29.813 доказательства, а затем использовать графический формат, функции которого служит ваша цели. Многие информационные визуализации 0:01:29.813,0:01:37.149 являются олицетворением дезинформации. Создание данных, как мы отметили в предыдущем уроке по этой теме, зависит от параметризации. 0:01:37.149,0:01:46.071 Напомним, основная концепция заключается в том что всё что можно измерить, посчитать или дать метрическое или числовое значение можно превратить в данные. 0:01:46.071,0:01:54.244 Это, конечно, концепция согласно которой все данные являются рукотворными. Это означает, что они не передаются, а создаются в процессе сбора. 0:01:54.244,0:02:02.060 Концепция параметризации имеет решающее значение для визуализации, потому что способы которыми мы присваиваем значение данным 0:02:02.060,0:02:10.161 будут иметь прямое влияние на способы их отображения. Визуализация обладает сильной риторической силой благодаря своим графическим качествам. 0:02:10.161,0:02:20.337 И могут легко исказить данные. Все визуализации являются интерпретациями, но некоторые из них больше подходят для структуры определённого набора данных, чем другие. 0:02:20.337,0:02:26.979 Например, если вы показываете результаты опросов общественного мнения в США, выбор того будете ли вы показывать результаты, 0:02:26.979,0:02:35.980 раскрашивая область внутри границ штатов или использовать диаграмму рассеивания или другую единицу размера населения будет иметь решающее значение. 0:02:35.980,0:02:43.457 Если вы получаете информацию об итогах выборов, тогда графический эффект должен учитывать просто регион, но если вы смотрите на предпочтения 0:02:43.457,0:02:50.393 потребителей в отношении продукта, то количество населения и даже местоположение имеют значение. Если вы пытаетесь отследить путь 0:02:50.393,0:02:57.076 распространения эпидемии, важны транспортные сети, а также населённые пункты и пункты соприкосновения, поэтому не стоит забывать о вопросах, 0:02:57.076,0:03:04.591 которые нужно задавать самому себе при работе с данными. Мы должны определить: что считать, какие значения присваивать, что отображать. 0:03:04.591,0:03:11.543 Во многих случаях графическое изображение является артефактом того, как были приняты решения о дизайне, а не решения о данных. 0:03:11.543,0:03:18.088 Например, если вы регистрируете рост учеников в классе, создание непрерывного графика соединяющего точки не имеет вообще никакого смысла. 0:03:18.088,0:03:24.355 Между одним учеником и другим нет непрерывности роста. А теперь давайте поговорим о некоторых основах. Различие между дискретными 0:03:24.355,0:03:30.623 и непрерывными данными - одно из наиболее важных решений при выборе дизайна. Если вы показываете изменение во времени 0:03:30.623,0:03:37.013 или любую другую непрерывную переменную, то линейный график - правильный выбор. Если вы используете график, который показывает количество 0:03:37.013,0:03:43.400 с площадью, используйте его для процентов от целого. Если вы увеличиваете площадь круга на основе метрики, связанной с радиусом, 0:03:43.400,0:03:52.435 вы вносите радикальное искажение в соотношение элементов. Способ, которым вы маркируете и упорядочиваете свои графические элементы сделает 0:03:52.435,0:04:00.960 некоторые аргументы более очевидными. Если вы хотите сравнить количества, убедитесь что они отображаются рядом. Использование легенд имеет 0:04:00.960,0:04:08.282 решающее значение, их дизайн может либо улучшить, либо затруднить читаемость. Имейте ввиду, что многие визуализации, такие как 0:04:08.282,0:04:15.765 сетевые диаграммы упорядочивают информацию для максимальной читаемости на экране, они не используют близость или расстояние семантически 0:04:15.765,0:04:24.693 значимым образом. Теперь давайте пройдёмся по выводам, чтобы закрепить урок. Информационные визуализации - это показатели, выраженные в виде графиков. 0:04:24.693,0:04:30.765 Они позволяют нам наглядно отображать большие объёмы (часто сложных) данных таким образом, чтобы очень эффективно выявлять 0:04:30.765,0:04:38.585 закономерности, аномалии и другие особенности данных. Также они содержат много исторической и культурной информации в их "лишних" элементах, 0:04:38.585,0:04:42.185 то есть форма визуализации также является информацией.