Должна ли площадь или длина квадрата быть пропорциональны визуализируемым данным?

Я делаю визуализацию данных. Каждое значение представлено квадратом. Чтобы сделать исходные данные интуитивно понятными, должна ли длина стороны каждого квадрата или площадь каждого квадрата быть пропорциональны данным, которые он представляет?

Еще нет. Он широкий? Я надеялся, что ответ будет определенным (я предполагаю, что это «область»), но у этих людей здесь будет больше знаний в области графического дизайна и психологии восприятия, чтобы подтвердить это.
IIRC это было описано в немецкой книге, которую я однажды прочитал, «So lügt man mit Statistik» en.wikipedia.org/wiki/Walter_Krämer - не уверен, есть ли английский эквивалент. TL;DR — зависит от того, что вы хотите, чтобы ваши читатели читали из визуализаций.
Ответ конечно не однозначный. Все зависит от специфики, а именно от того, какие данные вы представляете, как вы представляете и что вы хотите сообщить с помощью этих данных.
Можете ли вы привести примеры, когда особенности или то, что мы хотим, чтобы читатели прочитали из визуализации, заставят нас сделать длину стороны квадрата пропорциональной данным, а не площади квадрата?
+1 Почему каждый интересный вопрос привлекает хотя бы один близкий голос?!? <ворчать>

Ответы (5)

Если вы, создатель, не уверены, как читатель узнает, что именно?

Краткий ответ: значение должно быть связано 1:1 с количеством цвета на странице . Так что в вашем примере это должна быть площадь. Но это еще не все: вам также нужно избегать вводящих в заблуждение сигналов, которые могут заставить читателя прочитать ее неправильно, и вам нужно знать, почему вы используете площадь вместо длины (например, гистограммы), потому что у этого есть реальные плюсы и минусы.


Во- первых, никогда не изменяйте длину и ширину (т.е. площадь) формы, если на самом деле переменная связана только с длиной одной стороны. Если X вдвое больше Y, но Y содержит в четыре раза больше цвета на странице, вы вводите читателей в заблуждение. Такое искажение иногда называют « фактором лжи », и часто предполагается, что это преднамеренная попытка ввести в заблуждение и преувеличить различия.

введите описание изображения здесь


Если вы используете площадь в качестве меры, я настоятельно рекомендую:

  • Зная, почему вы используете area . Используя площадь вместо линейного размера, такого как длина, вы:

    • Пожертвуйте способностью ясно видеть различия математически (вы не можете легко сказать: «Смотрите, это в два раза больше, чем другое»)
    • Предложите своим читателям просмотреть его интуитивно понятным повседневным нечисловым способом, как люди, например, сравнивают размеры пирогов в магазине. Менее изощренный, но более непосредственный. Больше кишки, меньше головы.
    • Небольшие различия между очень похожими числами становятся практически незаметными.
    • Когда одна переменная во много раз меньше другой, очень маленькая переменная не исчезает так сильно, как на гистограмме, что обеспечивает большую гибкость макетов.

введите описание изображения здесь

  • Рассмотрите возможность использования кругов для области, а не квадратов, выровненных по центру :

    • Кружки, потому что это не вызывает путаницы с гистограммами и т.п. Высота и ширина менее важны: меньше похоже, что вы предлагаете сравнение по высоте или ширине.
    • Выровнено по центру, потому что не предлагает людям сравнивать рост

введите описание изображения здесь

Например, выше трудно не заметить, что квадрат с пометкой «5» составляет три четверти высоты квадрата с пометкой «10», так что это может ввести в заблуждение.

Круги не вызывают такого рода сравнения: это скорее внутренне, мгновенное «Эта капля намного больше, чем следующая капля».


Существует множество доказательств, начиная с пользовательского тестирования и заканчивая небольшими исследованиями (позже мы попытаемся найти несколько примеров), что такое интуитивное сравнение на основе областей может быть более привлекательным, может снизить входной барьер для менее заинтересованной аудитории и может помогают сосредоточить внимание читателя на предмете, а не на холодных мелочах чисел. Но это происходит за счет того, что мешает более численному анализу.

Не выбирайте между одномерным (длина или расстояние) и двухмерным (площадь) по эстетическим соображениям: выбирайте между ними в зависимости от вашей аудитории и сообщения.

Что больше подходит для общения: мгновенное сравнение на уровне интуиции на уровне «это намного больше» или более взвешенное численное сравнение на уровне «это примерно 80% другого»?

Или есть практические причины, по которым вам нужно использовать площадь?

Затем, когда вы выбрали из практических соображений, примените эстетику.

«Пропорционально количеству цвета на странице» — очень полезное эмпирическое правило (по крайней мере, в 2D); спасибо за это, я буду использовать его. Дизайн, к которому я перехожу, основан на кругах, я думаю, вы правы.

Я бы сказал район. Оптически квадрат со стороной в два раза больше, чем площадь в 4 раза больше. Случайные наблюдатели свяжутся с местностью, даже не прочитав вашу легенду.

Хорошим примером является этот легендарный график Рэндалла Манро из xkcd :

введите описание изображения здесь( огромная, разборчивая версия )

Мы не так хорошо оцениваем различия в площади, как в длине. Мы используем длину в качестве прокси и поэтому склонны недооценивать различия в площади.

По этой причине круг, который на самом деле имеет площадь в 2 раза больше другого, кажется слишком маленьким , потому что наш мозг связывает их радиусы, которые отличаются в 1,4 раза.

Есть интересные попытки согласования этого явления, такие как Пропорциональное отображение символов в R , которое предлагает перцептивное масштабирование символов, чтобы более точно соответствовать тому, как мы оцениваем длины и площади.

Вот рис. 2 из этой статьи

введите описание изображения здесь

Лично у меня нет никакого опыта в этом, и я избегаю использования областей, если требуются количественные оценки.

Интересным тангенсом является взаимосвязь между восприятием объема и длины. Разница в том, как мы их воспринимаем, еще более поразительна. Это можно проиллюстрировать в этом видео о сравнении размеров звезд .

К тому времени, когда вы доберетесь до самой большой звезды, которая примерно в 1700 раз больше диаметра Солнца, у вас останется впечатление, что она намного больше, чем в 1700 раз.

Для более систематического взгляда на нашу ошибку в восприятии различий в площадях и длинах см. «Краудсорсинговое графическое восприятие: использование Mechanical Turk для оценки дизайна визуализации» Джеффри Хира и Майкла Бостока.

На мой взгляд площадь (D), а не каждую сторону (E).

Если вы используете сторону длины 2, то площадь будет в 4 раза больше, и у вас будет сильно перекрывающийся график. (Е)

Когда у вас есть обычная гистограмма (A), данные линейны, а столбик с символом просто для эстетики. (Б)

В этих случаях площадь снова является репрезентативной для данных, потому что столбцы одинаковы. У вас может быть трехмерная полоса, но объем полосы все равно представляет данные (C)

Графики, иллюстрирующие различия в восприятии и совпадения размеров

4 раза? Разве это не разница между линейным и квадратичным?
Позвольте мне проиллюстрировать и отредактировать пост.
Предположим, что данные равны 81. Если мы используем площадь, то стороны имеют длину 9, что дает площадь 81. Если мы используем стороны, то они имеют длину 81, а площадь равна 6 561. 81 — это не 4 раза по 9, а 6561 — это не 4 раза по 81. Откуда вы взяли 4?
«Если вы используете сторону длиной 2, то площадь будет в 4 раза больше значения». Я не могу понять, что вы пытаетесь сказать. Я думаю, вы имеете в виду, что если вы используете длину стороны для представления величины данных, удвоение значения данных умножает площадь на четыре.
Дэвид - это моя редакция! В исходном сообщении Рафаэля говорилось: «Если вы используете сторону, площадь будет в 4 раза больше». Если вы знаете лучший способ прояснить это, сделайте это.

Тафте широко занимался этим. Видеть:

  • Визуальное отображение количественной информации,
  • Представление информации и другие.

Некоторые принципы графической целостности:

  1. Представление чисел, физически измеренных на поверхности самого графика, должно быть прямо пропорционально представленным числовым величинам.
  2. Для устранения графических искажений и двусмысленности следует использовать четкие, подробные и тщательные маркировки. Запишите пояснения к данным на самом графике. Отмечайте важные события в данных.
  3. Показывайте вариации данных, а не вариации дизайна.
  4. При отображении денег во временных рядах дефлированные и стандартизированные единицы денежного измерения почти всегда лучше, чем номинальные единицы.
  5. Количество изображаемых измерений, несущих информацию (переменных), не должно превышать количество измерений в данных. Графика не должна цитировать данные вне контекста.

В вашем случае вы должны спросить себя, лучше ли данные представлены 2D или 3D изображением или линией. Куб, квадрат и линия — это не одно и то же. Это одна из причин, почему трехмерные гистограммы так часто вводят в заблуждение.