Книга: Аналитическая культура

Организация данных

Организация данных

То, как будет организовано представление информации на диаграмме, зависит от выбора диаграммы, и наоборот. В рамках ограничений, которые накладывает выбор диаграммы, по-прежнему остается важным структурный выбор, например, как расположить столбцы диаграммы — горизонтально или вертикально. Самое удивительное, что даже на этом уровне есть небольшие вариации в том, как можно представить данные, так что это существенно повлияет на сообщение.

На рис. 7.9 показан среднегодовой размер оплаты труда госслужащих в Великобритании по тарифным разрядам и с делением по гендерному признаку.


Рис. 7.9. Среднегодовая заработная плата (в тыс. фунтов стерлингов) госслужащих в Великобритании по тарифным разрядам (более низкая цифра разряда означает более высокую должность) и с делением по гендерному признаку

Источник: http://news.bbc.co.uk/2/hi/business/8044720.stm

С диаграммой все в порядке. У нее понятное название и обозначения осей. По оси х представлены тарифные разряды по возрастающей слева направо, как и следовало ожидать, учитывая, что в западной традиции принято направление чтения слева направо (хотя несколько вводит в заблуждение, что номера тарифных разрядов, наоборот, уменьшаются в порядке значимости). Ось y тоже нареканий не вызывает. Нет усечения по вертикальной оси. Интервал в 25 тыс. фунтов стерлингов кажется оправданным. При составлении диаграммы был богатый выбор цветовой палитры.

В итоге выбрали основной голубой цвет (который обычно ассоциируется с мужским полом) и дополнительный оранжевый для обозначения женского пола. Выбор вполне обоснован. В этой диаграмме нет грубых ошибок.

А теперь посмотрите, что получится, если во всех тарифных разрядах поменять местами столбцы, обозначающие пол (рис. 7.10).


Рис. 7.10. Та же самая диаграмма, что и на рис. 7.9, за исключением того, что во всех тарифных разрядах поменяли местами столбцы, обозначающие пол. Вам не кажется, что неравенство в заработной плате по гендерному признаку бросается в глаза сильнее?

Удивительная разница. Те же самые данные, те же самые оси, те же самые интервалы и цветовая схема. Всего одно небольшое изменение кардинальным образом меняет восприятие неравенства в оплате труда у мужчин и женщин[116]. Основное сообщение, о неравенстве оплаты труда, становится гораздо более наглядным. Первая диаграмма построена правильно, просто вторая — более наглядная.

Думаю, из этого примера очевидно, что каждая диаграмма, которую вы строите, требует индивидуального подхода. К тому же необходимо развивать в себе критическое восприятие. Этот навык приходит с практикой, в процессе работы со случаями, подобными этому. Поэтому всем специалистам по работе с данными я настоятельно рекомендую ознакомиться с книгами, которые я упоминал в начале этой главы, изучить метод trifecta checkup Кайзера Фанга — метод проверки диаграмм на наличие «графического мусора»[117], а также посещать семинары по визуализации данных и, самое главное, практиковаться. Изучайте диаграммы из Wall Street Journal, New York Times и The Economist — все они задают очень высокую планку качества. Что делает их такими эффективными и где у них бывают проколы? (Да, такое тоже случается.) Сравните диаграммы в /r/dataisbeautiful/[118] и r/dataisugly[119]. Почему первые такие ясные, а вторые такие бестолковые? Спросите себя, что бы вы сделали иначе.

Оглавление книги


Генерация: 0.267. Запросов К БД/Cache: 2 / 0
поделиться
Вверх Вниз