Я делаю визуализацию данных. Каждое значение представлено квадратом. Чтобы сделать исходные данные интуитивно понятными, должна ли длина стороны каждого квадрата или площадь каждого квадрата быть пропорциональны данным, которые он представляет?
Если вы, создатель, не уверены, как читатель узнает, что именно?
Краткий ответ: значение должно быть связано 1:1 с количеством цвета на странице . Так что в вашем примере это должна быть площадь. Но это еще не все: вам также нужно избегать вводящих в заблуждение сигналов, которые могут заставить читателя прочитать ее неправильно, и вам нужно знать, почему вы используете площадь вместо длины (например, гистограммы), потому что у этого есть реальные плюсы и минусы.
Во- первых, никогда не изменяйте длину и ширину (т.е. площадь) формы, если на самом деле переменная связана только с длиной одной стороны. Если X вдвое больше Y, но Y содержит в четыре раза больше цвета на странице, вы вводите читателей в заблуждение. Такое искажение иногда называют « фактором лжи », и часто предполагается, что это преднамеренная попытка ввести в заблуждение и преувеличить различия.
Если вы используете площадь в качестве меры, я настоятельно рекомендую:
Зная, почему вы используете area . Используя площадь вместо линейного размера, такого как длина, вы:
Рассмотрите возможность использования кругов для области, а не квадратов, выровненных по центру :
Например, выше трудно не заметить, что квадрат с пометкой «5» составляет три четверти высоты квадрата с пометкой «10», так что это может ввести в заблуждение.
Круги не вызывают такого рода сравнения: это скорее внутренне, мгновенное «Эта капля намного больше, чем следующая капля».
Существует множество доказательств, начиная с пользовательского тестирования и заканчивая небольшими исследованиями (позже мы попытаемся найти несколько примеров), что такое интуитивное сравнение на основе областей может быть более привлекательным, может снизить входной барьер для менее заинтересованной аудитории и может помогают сосредоточить внимание читателя на предмете, а не на холодных мелочах чисел. Но это происходит за счет того, что мешает более численному анализу.
Не выбирайте между одномерным (длина или расстояние) и двухмерным (площадь) по эстетическим соображениям: выбирайте между ними в зависимости от вашей аудитории и сообщения.
Что больше подходит для общения: мгновенное сравнение на уровне интуиции на уровне «это намного больше» или более взвешенное численное сравнение на уровне «это примерно 80% другого»?
Или есть практические причины, по которым вам нужно использовать площадь?
Затем, когда вы выбрали из практических соображений, примените эстетику.
Я бы сказал район. Оптически квадрат со стороной в два раза больше, чем площадь в 4 раза больше. Случайные наблюдатели свяжутся с местностью, даже не прочитав вашу легенду.
Хорошим примером является этот легендарный график Рэндалла Манро из xkcd :
Мы не так хорошо оцениваем различия в площади, как в длине. Мы используем длину в качестве прокси и поэтому склонны недооценивать различия в площади.
По этой причине круг, который на самом деле имеет площадь в 2 раза больше другого, кажется слишком маленьким , потому что наш мозг связывает их радиусы, которые отличаются в 1,4 раза.
Есть интересные попытки согласования этого явления, такие как Пропорциональное отображение символов в R , которое предлагает перцептивное масштабирование символов, чтобы более точно соответствовать тому, как мы оцениваем длины и площади.
Вот рис. 2 из этой статьи
Лично у меня нет никакого опыта в этом, и я избегаю использования областей, если требуются количественные оценки.
Интересным тангенсом является взаимосвязь между восприятием объема и длины. Разница в том, как мы их воспринимаем, еще более поразительна. Это можно проиллюстрировать в этом видео о сравнении размеров звезд .
К тому времени, когда вы доберетесь до самой большой звезды, которая примерно в 1700 раз больше диаметра Солнца, у вас останется впечатление, что она намного больше, чем в 1700 раз.
Для более систематического взгляда на нашу ошибку в восприятии различий в площадях и длинах см. «Краудсорсинговое графическое восприятие: использование Mechanical Turk для оценки дизайна визуализации» Джеффри Хира и Майкла Бостока.
На мой взгляд площадь (D), а не каждую сторону (E).
Если вы используете сторону длины 2, то площадь будет в 4 раза больше, и у вас будет сильно перекрывающийся график. (Е)
Когда у вас есть обычная гистограмма (A), данные линейны, а столбик с символом просто для эстетики. (Б)
В этих случаях площадь снова является репрезентативной для данных, потому что столбцы одинаковы. У вас может быть трехмерная полоса, но объем полосы все равно представляет данные (C)
Тафте широко занимался этим. Видеть:
Некоторые принципы графической целостности:
- Представление чисел, физически измеренных на поверхности самого графика, должно быть прямо пропорционально представленным числовым величинам.
- Для устранения графических искажений и двусмысленности следует использовать четкие, подробные и тщательные маркировки. Запишите пояснения к данным на самом графике. Отмечайте важные события в данных.
- Показывайте вариации данных, а не вариации дизайна.
- При отображении денег во временных рядах дефлированные и стандартизированные единицы денежного измерения почти всегда лучше, чем номинальные единицы.
- Количество изображаемых измерений, несущих информацию (переменных), не должно превышать количество измерений в данных. Графика не должна цитировать данные вне контекста.
В вашем случае вы должны спросить себя, лучше ли данные представлены 2D или 3D изображением или линией. Куб, квадрат и линия — это не одно и то же. Это одна из причин, почему трехмерные гистограммы так часто вводят в заблуждение.
тупица
Михаил Шумахер
DA01
тупица
пользователь56reinstatemonica8