Линейные графики, диаграммы и статистические карты. Диаграммы

Большую группу графиков составляют структурные диаграммы. Это такие диаграммы, в которых отдельные статистические совокупности сопоставляются по их структуре, характеризующейся соотношением разных параметров совокупности или ее отдельных частей.

Широко распространенный метод графического изображения структуры статистических данных заключается в составлении структурных круговых или секторных диаграмм. Секторные диаграммы удобно строить следующим образом: всю величину явления принимают за 100%, рассчитывают доли отдельных частей в процентах. Круг разбивают на секторы пропорционально частям изображаемого целого. Таким образом, на 1% приходится 3,6°. Для получения центральных углов секторов, изображающих доли частей целого, необходимо их процентное выражение умножить на 3,6°. Секторные диаграммы позволяют не только разделить целое па части, но и сгруппировать отдельные части, давая как бы комбинированную группировку долей по двум признакам.

Пример. Рассмотрим построение секторной диаграммы по данным, приведенным в табл. 4.3.

Таблица 4.3/ Данные об охвате населения телевизионным вещанием на конец 2010 г. в N-м регионе

Построение секторной диаграммы начинается с определения центральных углов секторов.

Для этого процентное выражение отдельных частей совокупности но каждой категории умножим на 3,6°. Три и более телевизионные программы - 131,7°; две - 207°; одна - 14,8°; ни одной - 7,6°. По найденным значениям углов круг делится на соответствующие сектора (рис. 4.11).

Рис. 4.11.

Другим видом структурных статистических диаграмм являются полосовые диаграммы удельных весов, отражающие структуры сравниваемых совокупностей по процентному соотношению в них отдельных частей, выделяемых потому или иному количественному или атрибутивному признаку. Эти диаграммы получены путем преобразования простой полосовой диаграммы с подразделенными полосами. Полосовые диаграммы удельных весов могут вскрыть существенные особенности многих изучаемых экономических явлений.

Пример. Необходимо изобразить графически данные, приведенные в табл. 4.4.

Таблица 4.4/ Данные, характеризующие структуру потребительских расходов населения в N-м регионе за период 2009-2010 гг., %

Рис. 4.12.

Значительными преимуществами полосовых структурных диаграмм по сравнению с другими видами являются их большая емкость, возможность отразить на небольшом пространстве большой объем полезной информации. Секторные же диаграммы выглядят убедительно при существенных различиях сравниваемых структур, а при небольших различиях они могут быть недостаточно выразительны.

Диаграммы динамики

Для изображения и внесения суждений о развитии явления во времени строят диаграммы динамики. Для наглядного изображения динамики явлений используют многие диаграммы: столбиковые, ленточные, квадратные, круговые, линейные, радиальные и др. Выбор вида диаграмм зависит в основном от особенностей исходных данных, от цели исследования. Например, если имеется ряд динамики с неравно отстоящими уровнями во времени (1913, 1940, 1950, 1980, 2000, 2010 гг.), то часто для наглядности используют столбиковые, квадратные или круговые диаграммы. Они зрительно впечатляют, хорошо запоминаются, но не годны для изображения большого числа уровней, так как громоздки. Если число уровней в ряду динамики велико, то целесообразно применять линейные диаграммы, которые воспроизводят непрерывность процесса развития в виде непрерывной ломаной линии.

Для построения линейных диаграмм используют систему прямоугольных координат. Обычно но оси абсцисс откладывают время (годы, месяцы и т.д.), а по оси ординат наносят масштабы для отображения явлений или процессов. Особое внимание следует обратить на масштаб осей координат, поскольку от этого зависит общий вид графика. Обеспечение равновесия, пропорциональности между осями координат необходимо в диаграмме, так как нарушение равновесия дает неправильное изображение развития явления. Если масштаб для шкалы на оси абсцисс очень растянут по сравнению с масштабом на оси ординат, то колебания в динамике явлений мало выделяются, и наоборот, преувеличение масштаба по оси ординат по сравнению с масштабом на оси абсцисс дает резкие колебания. Если в ряду динамики данные за некоторые годы отсутствуют, это должно быть учтено при построении графика. Равным периодам времени и размерам уровня должны соответствовать равные отрезки масштабной шкалы.

Пример. Рассмотрим построение линейной диаграммы на основании следующих данных по динамике производства газетной бумаги в регионе за период 2001-2010 гг.:

Год.............2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Производство,

Млн.т...........237 179 189 158 186 192 172 191 210 211

Изображение динамики производства газетной бумаги на координатной сетке с неразрывной шкалой значений, начинающихся от нуля, вряд ли целесообразно, так как 2/3 ноля диаграммы остается неиспользованным, и это ничего не даст для выразительности изображения. Поэтому в данных условиях рекомендуется строить шкалу без вертикального нуля, т.е. шкала значений разрывается недалеко от нулевой линии, и на диаграмму попадает лишь часть возможного поля графика. Это не приводит к искажениям в изображении динамики изучаемого процесса, и его изменения показываются диаграммой более четко (рис. 4.13).

Рис. 4.13.

Нередко на одном линейном графике приводится несколько кривых, которые дают сравнительную характеристику динамики различных показателей или одного и того же показателя в разных странах. Примером графического изображения сразу нескольких показателей служит рис. 4.14.

Рис. 4.14.

Линейные диаграммы с равномерной шкалой имеют недостаток, снижающий их познавательную ценность. Этот недостаток заключается в том, что равномерная шкала позволяет измерять и сравнивать только отраженные на диаграмме абсолютные приросты или уменьшения показателен на протяжении исследуемого периода. Однако при изучении динамики важно знать и относительные изменения исследуемых показателей по сравнению с достигнутым уровнем или темпы их изменения.

Именно относительные изменения экономических показателей в динамике искажаются при изображении их на координатной диаграмме с равномерной вертикальной шкалой. Кроме того, в обычных координатах теряет всякую наглядность и даже становится невозможным изображение рядов динамики с резко изменяющимися уровнями, которые обычно имеют место в динамических рядах за длительный период времени.

В этих случаях следует отказаться от равномерной шкалы и положить в основу графика полулогарифмическую систему. Полулогарифмической системой называется система, в которой на одной оси нанесен линейный масштаб, а на другой - логарифмический. В данном случае логарифмический масштаб наносят на ось ординат, а на оси абсцисс располагают равномерную шкалу для отсчета времени по принятым интервалам (годам, кварталам, месяцам, дням и т.д.). Техника построения логарифмической шкалы следующая: найти логарифмы исходных чисел; построить ординату и разделить на несколько равных частей. Затем нанести на ординату (или равную ей параллельную линию) отрезки, пропорциональные абсолютным приростам этих логарифмов. Далее записать соответствующие логарифмы чисел и их антилогарифмы, например 0".000; 0,3010; 0,4771; 0,6021; ...; 1,000, что дает 1, 2,3,4,10. Полученные антилогарифмы окончательно дают вид искомой шкалы на ординате.

Пример . Допустим, нужно изобразить на графике динамику производства угля в регионе за 1980-2010 гг., за эти годы его рост составил 9,1 раза. С этой целью найдем логарифмы для каждого уровня ряда (табл. 4.5).

Найдя минимальное и максимальное значения логарифмов производства угля, построим масштаб с таким расчетом, чтобы все данные разместились на графике. В соответствии с масштабом найдем соответствующие точки, которые соединим прямыми линиями. В результате получим график (рис. 4.15) с использованием логарифмического масштаба на оси ординат.

Таблица 4.5 Динамика производства угля в регионе за период 1980-2010 гг., млн т

Производство К,

Рис. 4.15.

К диаграммам динамики относятся и радиальные диаграммы, построенные в полярных координатах и предназначенные для отражения процессов, ритмически повторяющихся во времени. Чаще всего эти диаграммы применяют для иллюстрации сезонных колебаний, и в этом отношении они имеют преимущество перед статистическими кривыми. Радиальные диаграммы подразделяют на два вида: замкнутые и спиральные. Эти два вида диаграмм отличаются друг от друга по технике построения; все зависит от того, что взято в качестве базы отсчета - центр круга или окружность.

Замкнутые диаграммы отражают весь внутригодовой цикл динамики одного года. Их построение сводится к следующему: строят круг, среднемесячный показатель приравнивают к радиусу этого круга, затем весь круг делят на 12 равных секторов посредством проведения радиусов, которые изображают в виде топких линий. Каждый радиус изображает месяц, причем расположение месяцев аналогично циферблату часов. На каждом радиусе делают отметку в определенном месте согласно масштабу, исходя из данных на соответствующий месяц. Если данные превышают среднегодовой уровень, то отметку ставят вне окружности па продолжении радиуса. Затем отметки различных месяцев соединяют отрезками.

Пример. Необходимо изобразить с помощью замкнутой диаграммы динамику индексов потребительских цен на все товары и услуги в одном из регионов по месяцам 2010 г. по следующим данным, % к декабрю прошлого года:

Январь..............................................................101,68

Февраль...........................................................102,81

Март.................................................................103,42

Апрель.............................................................104,01

Май...................................................................104,67

Июнь................................................................105,66

Июль................................................................106,58

Август..............................................................106,68

Сентябрь.........................................................107,52

Октябрь...........................................................109,28

Ноябрь.............................................................110,62

Декабрь............................................................111,87

Среднемесячный индекс равен 106,2

Построим круг радиусом, равным среднемесячному показателю. 11а горизонтальном диаметре построим шкалу, взяв длину радиуса, равную 4 см. Следовательно, 1 см = 106,2/4 = 26,6% (рис. 4.16).

Рис. 4.16.

Если в качестве базы отсчета берется окружность, такого рода диаграммы называют спиральными. Спиральные диаграммы отличаются от замкнутых тем, что в них декабрь одного года соединяется не с январем данного же года, а с январем следующего года. Это дает возможность изобразить весь динамический ряд за несколько лет в виде одной кривой. Особенно наглядна такая диаграмма тогда, когда наряду с сезонным ритмом ряд обнаруживает неуклонный рост из года в год.

Для отображения зависимости одного показателя от другого используют диаграмму взаимосвязи. Один показатель принимают за X, а другой за У (т.е. функцию от X), затем строят прямоугольную систему координат с масштабами для показателей, в которой формируется рисунок.

С повышением стоимости основных производственных фондов происходит увеличение затрат на реализацию продукции. Данная зависимость этих показателей может быть выражена линейной связью (рис. 4.17).

Рис. 4.17.

Диаграммы взаимосвязи имеют большое значение на практике, так как множество различных показателей связаны между собой либо прямой, либо обратной формой связи. Они могут использоваться также для отображения различных циклических процессов (например, инфляционной спирали), взаимно накладывающихся явлений и т.п.

Среди плоскостных диаграмм наибольшее распространение получили столбиковые, полосовые или ленточные, треугольные, квадратные, круговые, секторные, фигурные.

Столбиковые диаграммы изображаются в виде прямоугольников (столбиков), вытянутых по вертикали, высота которых соответствует значению показателя (рис. 6.9).

Полосовая диаграмма

Принцип построения полосовых диаграмм тот же, что и столбиковых. Отличие заключается в том, что полосовые (или ленточные) графики представляют значение показателя не по вертикальной, а по горизонтальной оси.

Оба вида диаграмм применяются для сравнения не только самих величин, но и их частей. Для изображения структуры совокупности строят столбики (полосы) одинакового размера, принимая целое за 100%, а величину частей целого - соответствующей удельным весам (рис. 6.10).

Для изображения показателей с противоположным содержанием (импорт и экспорт, сальдо положительное и отрицательное, возрастная пирамида) строят разнонаправленные столбиковые или полосовые диаграммы.

Основу квадратных, треугольных и круговых диаграмм составляет изображение значения показателя величиной площади геометрической фигуры.

Квадратная диаграмма

Для построения квадратной диаграммы устанавливают размер стороны квадрата путем извлечения корня квадратного из значения показателя.

Так, например, для построения диаграммы на рис. 6.11 из объема услуг связи за 1997 г. в России по отправлению телеграмм
(73 млн.), пенсионных выплат (392 млн.), посылок (24 млн.) квадратные корни составили соответствено 8,5; 19,8; 4,9.

Круговая диаграмма

Круговые диаграммы строятся в виде площади кругов, радиусы которых равны корню квадратному из значений показателя.

Секторная диаграмма

Для изображения структуры (состава) совокупности используются секторные диаграммы . Круговая секторная диаграмма строится путем разделения круга на секторы пропорционально удельному весу частей в целом. Размер каждого сектора определяется величиной угла расчета (1% соответствует 3,6 0).

Пример. Доля продовольственных товаров в объеме розничного товарооборота России составила в 1992 г. 55%, а в 1997 г. - 49%, доля непродовольственных товаров составила соответственно 45% и 51%.

Построим два круга одинакового радиуса, а для изображения секторов определим центральные углы: для продовольственных товаров 3,6 0 *55 = 198 0 , 3,6*49 = 176,4 0 ; для непродовольственных товаров 3,6 0 *45 = 162 0 ; 3,6 0 *51 = 183,6 0 . Разделим круги на соответствующие секторы (рис. 6.12).

Треугольная диаграмма

Разновидностью диаграмм, представляющих структуру (кроме столбиковых и полосовых), является диаграмма треугольная. Она применяется для одновременного изображения трех величин, изображающих элементы или составные части целого. Треугольная диаграмма представляет собой равносторонний треугольник, каждая сторона которого является равномерной масштабной шкалой от 0 до 100. Внутри строится координатная сетка, соответствующая линиям, проводимым параллельно сторонам треугольника. Перпендикуляры из любой точки координатной сетки представляют доли трех компонентов, соответствует в сумме 100% (рис. 6.13). Точка на графике соответствует 20% (по А), 30% (по В) и 50% (по С).

Рис. 6.13. Треугольная диаграмма

Фигурная диаграмма

Диаграммы фигурные представляют собой изображение в виде рисунков, силуэтов, фигур.

— В некотором смысле, показывая человеку круговую диаграмму, вы можете оскорбить его интеллектуальные способности

К. Г. Карстен, «Диаграммы и графики» (1923)

Первые негативные выпады в сторону круговых (секторных) диаграмм начались более 100 лет назад. В 1914 году инженер и сторонник визуализации, Виллард Бринтон (Willard Brinton), опубликовал работу под названием «Графические методы», которую принято считать первой книгой о правильной визуализации данных для широкой аудитории. Он был Эдвардом Тафтом своего времени: пропагандистом наглядного обмена информацией и памфлетистом плохих форм.

Значительная часть книги Бринтона предостерегает читателей от использования круговых диаграмм (pie chart). В самой первой главе, описывая «составные элементы», автор объясняет:

«Круговая диаграмма, вероятно, используется гораздо чаще, чем любая другая форма, для демонстрации пропорций элементов. Однако, круг с секторами — это далеко не оптимальная форма, поскольку он и близко не обладает такой же выразительностью, как столбиковые диаграммы. Недостатком секторного представления является невозможность размещения частей таким образом, чтобы их можно было легко сравнить или просуммировать».

С тех пор, как Бринтон написал эти слова, многие статистики и эксперты в области визуализации выступили против секторных диаграмм и настаивали на использовании различных альтернатив. Хотя изначально в своих суждениях критики апеллировали к логике, за последние 40 лет они отыскали экспериментальные доказательства, которые указывают на неполноценность таких диаграмм в плане точности передачи информации.

Тем не менее, круговые диаграммы остаются весьма востребованными. Крупные издательства и медиа-корпорации, например, The Walt Street Journal и Target Corporation, до сих пор используют их, чтобы отображать свои данные. Кроме того, некоторые веб-ресурсы также задействуют этот довольно спорный графический метод.

Чтобы понять суть проблемы, вернемся к ее истокам и рассмотрим аргументы сторонников и критиков секторных диаграмм.

История возникновения

Отцом современной визуализации данных можно по праву назвать Уильяма Плейфэра (William Playfair). Он родился в Шотландии в 1759 году и вел очень увлекательный образ жизни. Плейфэр принимал участие во взятии Бастилии, внес свой вклад в развитие телеграфа и, конечно же, опубликовал первую круговую диаграмму. Он также является создателем столбиковой и линейной диаграмм.

Круговая диаграмма является одной из многих инноваций шотландского «мошенника» Уильяма Плейфэра

На рубеже XVIII века, использование иллюстраций в серьезной интеллектуальной литературе считалось слишком детским подходом. Но, как свободно мыслящего человека, Плейфэра это не остановило.

В 1801 году он опубликовал «Статистический Бревиарий» (Statistical Breviary) — книгу, посвященную демографическим и экономическим данным европейских государств. В этой работе, которая содержала первую круговую диаграмму, Плейфэр аргументирует ценность использования графических элементов: «Создание визуального образа для наших глаз при сохранении всех пропорций и размеров — это наиболее оптимальный и читабельный способ выражения определенной идеи».

Секторная диаграмма, опубликованная на страницах «Статистического Бревиария», показана ниже. На ней изображены доли земельных участков Турецкой Империи, расположенных в Азии, Африке и Европе тех времен. Этот рисунок принято считать первой круговой диаграммой, где идея о целом была представлена в виде круга, а для различия секторов использовался цвет.

Распределение площади Турецкой Империи является первой известной секторной диаграммой

Но как Плейфэр пришел к такой идее?

Некоторые эксперты считают, что секторная диаграмма обязана своим появлением кругам, которые использовались для представления понятий в философии и математике. Брат Плейфэра, Джон, был уважаемым математиком и ученым. Вполне вероятно, что Уильям увидел разделенный круг, изображающий составные части категории, в одной из его работ. Математики и философы применяют этот тип иллюстрации еще с XIV века.

Пример использования круга для представления составных частей в XIV веке

Секторная диаграмма, впрочем как и другие инновации Плейфэра, обрела широкое распространение не сразу. В то время Уильяма считали «мошенником» и нечистым на руку бизнесменом, поэтому, как правило, его идеи игнорировались.

Так продолжалось до 1850-х годов, пока круговая диаграмма не обрела еще одного важного сторонника — французского инженера Чарльза Джозефа-Минарда (Charles Joseph-Minard), который подтвердил эффективность данного метода. Минард был «пионером» статистических графиков и, по мнению многих, создателем самых гениальных методик визуализации данных.

Будучи в первую очередь картографом, Минард дополнил круговыми диаграммами свои карты. На размещенном ниже примере он изобразил в виде таких диаграмм количество мяса, поставляемого в парижские магазины из различных регионов Франции. Размер круга представляет общее количество мяса, и каждый круг разделен пропорционально на доли баранины, телятины и говядины:

Карта, созданная пионером визуализации данных Чарльзом Джозефом-Минардом в 1858 году, с использованием круговых диаграмм

Изобретение секторной диаграммы иногда ошибочно приписывают легендарной британской медсестре и общественному деятелю Флоренс Найтингейл (Florence Nightingale). В 1858 году она распределила причины смертности британских солдат в Крымской войне по месяцам. Флоренс использовала эту диаграмму, чтобы убедить правительство Великобритании улучшить санитарные условия и питание в военных лагерях.

Несмотря на то, что ее чертеж смотрится очень мощно и убедительно, на самом деле он не является круговой диаграммой. Это так называемая областная диаграмма (polar-area chart), в которой круг делится на ровные части, но их длина зависит от величины переменной:

Областная диаграмма Флоренс Найтингейл, которую часто путают с круговой диаграммой

Критика в адрес круговой диаграммы

Первые сто лет истории круговой диаграммы были мирным временем, но буря уже надвигалась. Слова Бринтона, которые мы цитировали в начале поста, являются самым ранним примером критики в сторону данной инновации, но к 1920 году в мире появилось еще больше литературы, резко осуждающий этот метод.

В 1923 году американский экономист Карл Густав Карстен (Karl G. Karsten) согласился с предупреждением Бринтона касательно секторных диаграмм. Заявления Карстена в его книге «Диаграммы и графики» (Charts and Graphs) удивительно похожи на те, что мы слышим сегодня:

«У секторной диаграммы очень много недостатков. Во-первых, человеческий глаз не может нормально сравнить длину дуги окружности, поскольку секторы направлены в различные стороны. Во-вторых, человеческое зрение не приспособлено к сравнению углов в принципе…

Наконец, невозможно эффективно оценить величину областей, особенно если они представлены в виде неравномерных секторов в круге. Не существует способа, который бы позволял сравнивать компоненты круглой фигуры так же быстро и точно, как части прямой линии или столбца»

Однако, хотя подобные выпады звучали все чаще, статистик Вальтер Кросби Иллс (Walter Crosby Eells) отметил, что многие критические замечания основываются «исключительно на личных предпочтениях». Иллс и другие решили проверить это предположение.

Ранние исследования в этой области были направлены на то, чтобы выяснить, пропорции какой разделенной фигуры — круга или столбца — люди определяют более точно. В ходе эксперимента 1927 года, проведенного Фредериком Крокстоном (Frederick Croxton) и Роем Страйкером (Roy Stryker), ученые попросили более 800 испытуемых угадать пропорции каждого компонента различных сегментированных фигур:

В данном случае пропорции практически идентичны.

Исследователи рассчитали среднюю погрешность предположений респондентов, но в этом эксперименте и многих других экспериментах ученым так и не удалось отыскать серьезных доводов, дискредитирующих круговые диаграммы. Сторонники данного типа визуализации до сих пор используют результаты проведенных в 1927 году исследований, чтобы аргументировать свою точку зрения.

Тем не менее, как отметил ученый Майкл Макдональд-Росс (Michael Macdonald-Ross) в обширном обзоре «Конфронтации круга и столбца», эти первоначальные эксперименты на самом деле не отображают реальное положение вещей. Несмотря на то, что сегментированный столбец в то время считался основной альтернативой кругу, сегодня специалисты практически всегда предлагают использовать гистограммы или точечные диаграммы.

Основной и, возможно, наиболее мощный удар по секторным диаграммам пришелся на 1980-е года, благодаря усилиям статистика Уильяма Кливленда (William Cleveland). Кливленд является автором новаторской книги «Элементы графических данных», в результате которой, как многие считают, визуализация данных обрела научную основу. Его работа не только описывает базовые «задачи восприятия», решаемые при просмотре диаграммы (например, суждения касаемо длины или площади), но и утверждает, с какими из них люди справляются лучше всего.

В эксперименте, проведенном в 1984 году, Кливленд и его друг, исследователь Роберт МакГилл (Robet McGill) тестировали круговую диаграмму. Вместо того, чтобы сравнивать ее с сегментированным столбцом, они сопоставили разделенный на части круг с его истинным конкурентом — гистограммой:.

В эксперименте Кливленда задачей восприятия гистограммы было определение позиции на шкале, а при просмотре круговых диаграмм — угол сегмента. Ученые обнаружили, что гипотез на счет высоты столбцов гистограммы были в 1,96 раз точнее, чем суждения, касающиеся угла. Кливленд отметил: «Круговые диаграммы не обеспечивают эффективную передачу информацию о разнице значений».

После этого, статистик Наоми Роббинс (Naomi Robbins) проводила исследования, чтобы понять, почему мы так плохо определяем углы. В книге «Создание более эффективных графиков» (Creating More Effective Graphs) она пишет, что, как правило, люди склонны недооценивать острые углы и переоценивать тупые. Роббинс также утверждает, что сегменты круга, направленные в стороны, кажутся большими, чем те, что размещены вверху или внизу.

Это исследование подбодрило ярых противников секторных диаграмм, к которым относятся и сегодняшние ведущие специалисты в области визуализации данных — Эдвард Тафт (Edward Tuft) и Стивен Фью (Spethen Few). Тафт пишет: «Таблица практически всегда лучше, чем дурацкая круговая диаграмма, а Фью добавляет: «Пироги можете оставить на десерт» (pie — пирог по-английски).

Кроме того, круговые диаграммы постоянно высмеиваются популярными СМИ, например, в Washington Post, и в New York Times:

Круговая диаграмма, демонстрирующая эффективность круговой диаграммы

Тем не менее, у этого инструмента есть и свои защитники.

Доводы в защиту круговой диаграммы

По мнению многих пользователей, основным преимуществом круговой диаграммы является то, что все сегменты выглядят частью чего-то целого. К примеру, рассматривая график населения страны, распределенного по возрастным группам, зритель понимает, что представленные данные касаются всех людей, проживающих в этой стране. Это допущение не будет столь очевидным в случае с гистограммами.

Некоторые ученые также оспаривают эмпирическую литературу, которая резко критикует секторные диаграммы. Пожалуй, ни один человек не потратил больше времени на поиск аргументов в пользу этих диаграмм, чем психолог Ян Спенс (Ian Spence). В своей книге «Возникновение и использование статистических диаграмм (No Humble Pie: The Origins and Usage of a Statistical Chart) он активно защищает этот осуждаемый многими визуальный элемент.

Спенс утверждает, что исследования восприятия «пирожковых» диаграмм плохо проработаны. Он считает работу Кливленда ошибочной, поскольку в ней испытуемых просят сравнить размеры отдельных сегментов круга, а не оценить величину сегмента по отношению к целой фигуре. По его мнению, круговые диаграммы чаще используются для второй цели. Ссылаясь на другое исследование 1987 года, Спенс заявляет, что в этом плане секторные диаграммы и сегментированные столбцы абсолютно идентичны. Он пишет:

«На мой взгляд, чаще всего круговые диаграммы критиковали люди, которые хотели сделать больше, чем могли на самом деле. Секторная диаграмма — это простой информационный график, и его основное назначение заключается в демонстрации связи между сегментом и целой фигурой»

Исследование 2013 года о толковании человеком круговых диаграмм и столбцов дало сторонникам «пирогов» еще больше аргументов. В ходе эксперимента, проведенного Университетом Тафтса для измерения психической энергии, требуемой при просмотре различных графиков, использовалась около инфра-красная спектроскопия. Авторы обнаружили, что круговые диаграммы оцениваются не менее точно и что среднестатистический человек не считает их изучение более утомительным, чем просмотр гистограмм.

Однако, критикуя данное исследование, Стивен Фью утверждает, что заявления, сделанные психологами, ошибочны и безответственны. Эксперимент проверял способность людей делать гипотезы касаемо отдельных диаграмм (круговой и столбиковой), а не одной и той же. По словам Фью, на самом деле, глядя на эти графики, респонденты должны были действовать не совсем так, поэтому данная работа не имеет большого значения.

Другие считают, что секторная диаграмма может быть полезной, когда она используется редко и в эстетических целях. Нейтан Яу (Nathan Yau) из Flowing Datapoints говорит, что даже если предположения об углах в круговой диаграмме не так точны, как в других случаях, это не особо важно, ведь на практике выдвигать такие допущения не нужно практически никогда (в частности, когда на чертеже изображено только два или три значения). При определенных обстоятельствах, круговую диаграмму выбрать даже лучше, чисто из дизайнерских соображений:

Эта диаграмма не очень информативна с точки зрения представления данных, но она красива и оригинальна (Sky — небо, Sunny side of pyramid — солнечная сторона пирамиды, Shady side of pyramid — теневая сторона пирамиды)

Вместо заключения

Даже после столетних споров об их полезности, круговые диаграммы никуда не делись. На защиту (как и на критику) этого визуального инструмента представления данных было затрачено много энергии, при этом ученым так и не удалось объяснить привлекательность данной фигуры. Возможно, она связана с тем, что это первый тип диаграмм, с которыми люди сталкиваются еще в школе, или же нам попросту нравятся круги. А может, стоит винить Microsoft за то, что они добавили секторные диаграммы в Excel.

Так или иначе, по мере увеличения роли информации и цифровых данных в современной жизни, их грамотная визуализация требует все больше внимания. Многие уже выступают за то, чтобы статистика стала обязательной дисциплиной для изучения в старших классах. Как знать, возможно, благодаря более широкому использованию гистограмм и других графических методик, круговые диаграммы наконец утратят свою актуальность. Или нет.

Наиболее распространенными диаграммами сравнения являются столбиковые диаграммы, принцип построения которых состоит в изображении статистических показателей в виде поставленных по вертикали прямоугольников - столбиков (рис. 2.1.1). Каждый столбик изображает величину отдельного уровня исследуемого статистического ряда. Таким образом, сравнение статистических показателей возможно потому, что все сравниваемые показатели выражены в одной единице измерения.

При построении столбиковых диаграмм необходимо начертить систему прямоугольных координат, в которой располагаются столбики. На горизонтальной оси располагаются основания столбиков, величина основания определяется произвольно, но устанавливается одинаковой для всех.

Рисунок 2.1.1 - Пример столбиковой диаграммы

Шкала, определяющая масштаб столбиков по высоте, расположена по вертикальной оси. Величина каждого столбика по вертикали соответствует размеру изображаемого на графике статистического показателя. Таким образом, у всех столбиков, составляющих диаграмму, переменной величиной является только одно измерение.

Размещение столбиков в поле графика может быть различным:

  • · на одинаковом расстоянии друг от друга;
  • · вплотную друг к другу;
  • · в частном наложении друг на друга.

Правила построения столбиковых диаграмм допускают одновременное расположение на одной горизонтальной оси изображений нескольких показателей. В этом случае столбики располагаются группами, для каждой из которых может быть принята разная размерность варьирующих признаков.

Разновидности столбиковых диаграмм составляют так называемые ленточные или полосовые диаграммы. Их отличие состоит в том, что масштабная шкала расположена по горизонтали сверху и она определяет величину полос по длине.

Область применения столбиковых и полосовых диаграмм одинакова, так как идентичны правила их построения. Одномерность изображаемых статистических показателей и их одномасштабность для различных столбиков и полос требуют выполнения единственного положения: соблюдения соразмерности (столбиков - по высоте, полос - по длине) и пропорциональности изображаемым величинам. Для выполнения этого требования необходимо: во-первых, чтобы шкала, по которой устанавливается размер столбика (полосы) , начиналась с нуля; во-вторых, эта шкала должна быть непрерывной, т.е. охватывать все числа данного статистического ряда; разрыв шкалы и соответственно столбиков (полос) не допускается. Невыполнение указанных правил приводит к искаженному графическому представлению анализируемого статистического материала.

Столбиковые и полосовые диаграммы как прием графического изображения статистических данных, по существу, взаимозаменяемы, т.е. рассматриваемые статистические показатели равно могут быть представлены как столбиками, так и полосами. И в этом, и в другом случае для изображения величины явления используется одно измерение каждого прямоугольника - высота столбика или длина полосы. Поэтому и сфера применения этих двух диаграмм в основном одинакова.

Разновидностью столбиковых (ленточных) диаграмм являются направленные диаграммы. Они отличаются от обычных двусторонним расположением столбиков или полос и имеют начало отсчета по масштабу в середине. Обычно такие диаграммы применяются для изображения величин противоположного качественного значения. Сравнение между собой столбиков (полос), направленных в разные стороны, менее эффективно, чем расположенных рядом в одном направлении. Несмотря на это, анализ направленных диаграмм позволяет делать достаточно содержательные выводы, так как особое расположение придает графику яркое изображение. К группе двусторонних относятся диаграммы чистых отклонений. В них полосы направлены в обе стороны от вертикальной нулевой линии: вправо - для прироста; влево - для уменьшения. С помощью таких диаграмм удобно изображать отклонения от плана или некоторого уровня, принятого за базу сравнения. Важным достоинством рассматриваемых диаграмм является возможность видеть размах колебаний изучаемого статистического признака, что само по себе имеет большое значение для анализа.

Для простого сравнения не зависимых друг от друга показателей могут также использоваться диаграммы, принцип построения которых состоит в том, что сравниваемые величины изображаются в виде правильных геометрических фигур, которые строятся так, чтобы площади их относились между собой как количества, этими фигурами изображаемые. Иными словами, эти диаграммы выражают величину изображаемого явления размером своей площади.

Для получения диаграмм рассматриваемого типа используют разнообразные геометрические фигуры - квадрат, круг, реже - прямоугольник. Известно, что площадь квадрата равна квадрату его стороны, а площадь круга определяется пропорционально квадрату его радиуса. Поэтому для построения диаграмм необходимо сначала из сравниваемых величин извлечь квадратный корень. Затем на базе полученных результатов определить сторону квадрата или радиус круга соответственно принятому масштабу (рис. 2.1.2).

Рисунок 2.1.2 - Пример фигурной диаграммы

Наиболее выразительным и легко воспринимаемым является способ построения диаграмм сравнения в виде фигур-знаков. В этом случае статистические совокупности изображаются не геометрическими фигурами, а символами или знаками, воспроизводящими в какой-то степени внешний образ статистических данных. Достоинство такого способа графического изображения заключается в высокой степени наглядности, в получении подобного отображения, отражающего содержание сравниваемых совокупностей.

Важнейший признак любой диаграммы - масштаб. Поэтому чтобы правильно построить фигурную диаграмму, необходимо определить единицу счета. В качестве последней принимается отдельная фигура (символ), которой условно присваивается конкретное численное значение. А исследуемая статистическая величина изображается отдельным количеством одинаковых по размеру фигур, последовательно располагающихся на рисунке. Однако в большинстве случаев не удается изобразить статистический показатель целым количеством фигур. Последнюю из них приходится делить на части, так как по масштабу один знак является слишком крупной единицей измерения. Обычно эта часть определяется на глаз. Сложность точного ее определения является недостатком фигурных диаграмм. Однако большая точность представления статистических данных не преследуется, и результаты получаются вполне удовлетворительными.

Как правило, фигурные диаграммы широко используются для популяризации статистических данных и рекламы .

Дата: 9 января 2017 Категория:

Задумываясь над тем, в, я предлагаю разобраться, какие бывают графики в Эксель и как правильно их применять. От правильного выбора типа диаграммы зависит корректность подачи графической информации, её наглядность и доступность. А чтобы сделать выбор – нужно продумать, какую цель преследует диаграмма и какой тип данных будет на ней изображен.

Например, вы можете строить графики изменения величин во времени, гистограммы для сравнения каких-то показателей, круговые диаграммы долевого участия в общем показателе и многое другое. Для такой визуализации нужно подобрать оптимальный вид диаграммы и получить максимальный эффект от возможностей Microsoft Excel. Давайте разбираться какие графики позволяет строить нам программа.

Гистограмма

Гистограмма – это вид диаграммы, который позволяет отобразить и, главное, сравнить некоторые дискретные данные. Выглядит она, как набор столбиков, характеризующих значение показателя для определенной категории. В примерах я буду приводить диаграммы продаж четырех работников за 6 лет (по годам). Гистограммы бывают таких типов:

  1. Гистограмма с группировкой – отображает значения из рядов данных, располагая их рядом для удобного сравнения.

  1. – располагает данные не рядом а в одном столбце. Это позволяет не только сравнить отдельные ряды данных, но и суммарный показатель в целом. В нашем примере мы сможем сравнить продажи по продавцам и суммарные продажи по годам.

  1. – подобна предыдущей, но здесь значения нормированы, т.е. приведены к процентам. Суммарный показатель всегда – 100%. Так проще оценить долевое участие каждого из рядов (в нашем случае – продавцов) в совокупном результате.

  1. Трехмерная гистограмма с группировкой – то же, что и в п.1, только добавлен эффект объема. Впрочем, график все равно остается двумерным, просто добавляется визуальный эффект. Такие же варианты есть для гистограммы с накоплением и для нормированной.

  1. – это диаграмма, построенная уже в трех измерениях. Хотя выглядит это эффектно, на практике не всегда наглядно и удобно, поэтому применяйте её осторожно, когда это действительно оправдано.

Графики в Excel

Графики лучше всего подходят для отображения непрерывных процессов или дискретных с высокой частотой дискретизации, например, ежедневных продаж, изменения температуры и др. Графики делятся на такие виды:

  1. График – показывает изменение ряда с течением времени. Самый простой и наглядный вариант

  1. График с накоплением – здесь каждый следующий ряд «ложится» на предыдущий. На диаграмме с рисунка продажи Иванова (первый ряд) первого числа составили 22,2 у.е., а Зимы (второй ряд) – 32,69. На графике точка продажи Иванова – 22,2 у.е., а Зимы – 22,20 + 32,69 = 54,9 у.е. То есть, началом отсчета для графика второго ряда будет не ось X, а график предыдущего ряда. Такая визуализация позволяет оценить долевой вклад каждого ряда в суммарном прогрессе с течением времени.

  1. Нормированный график с накоплением. Здесь последний накопительный ряд принят за базис, 100%. Остальные графики показаны в процентном отношении к нему. Соотношение значений в суммарном прогрессе отслеживается очень хорошо, но нельзя оценить, как изменяется сумма величин.

  1. Графики с маркерами это группа графиков, дублирующая предыдущие три, но каждая точка такого графика будет обозначена маркером, внешний вид которого можно настраивать.

  1. очень похож на обычный (из п.1), но изображается не линиями, а лентами, имитируя объем. Такое представление выглядит эффектно, но редко оправдано на практике.

Линейчатая диаграмма практически не отличается от гистограммы, только столбцы в ней располагаются не вдоль горизонтальной оси, а вдоль вертикальной. Типы диаграммы те же, что и у гистограммы, за исключением объемного варианта, он недоступен. Я применяю линейчатую диаграмму, когда названия категорий представляют собой достаточно длинный текст, и отобразить его под горизонтальной осью — проблематично.

Круговые диаграммы в Эксель

Круговые диаграммы изображаются в виде круга с сегментами, по размерам которых легко определить соотношение величин. В нашем примере рассмотрим состав одной буханки пшеничного хлеба. У круговой диаграммы есть такие разновидности:

  1. – самый простой вариант – круг, разделенный на секторы.

  1. – похожа на предыдущую, но кажется объемной. Эффектно смотрится и может придать диаграмме современного, продуманного вида.

  1. – отображает на дополнительной диаграмме те величины, которые слишком мало, чтобы их разглядеть.

  1. – то же, что и в предыдущем примере, только вспомогательная диаграмма не круговая, а линейчатая.

  1. – схожа с обычной круговой, но выполнена в форме кольца, а не круга. Выглядит менее громоздкой и достаточно практичной.

Точечные диаграммы

Такие диаграммы подходят, например, для визуализации результатов научного эксперимента или статистической выборки. Здесь по обоим осям откладываются значения, а на диаграмме точками отображается соотношение между ними. У этого вида диаграмм есть такие разновидности:

  1. Точечная – набор точек на пересечении двух величин. На рисунке я представил пример такого набора с линией тренда, характеризующей усредненное соотношение для всей совокупности данных.

  1. Точечная с гладкими кривыми (с маркерами и без) – здесь точки данных соединены сглаженными линиям для отображения тенденции. Сглаживание применяется, когда речь идет о непрерывных данных

  1. Точечная с прямыми отрезками (с маркерами и без) – то же, что и в прошлом пункте, но линии не сглажены.

  1. Пузырьковая диаграмма (плоская или объемная) – отображает ту же зависимость, что и точечная, но может нести в себе дополнительный ряд данных, который будет влиять на размер каждого пузырька. То есть, такая диаграмма отображает не два параметра, а три.

Диаграммы с областями в Эксель

Диаграммы с областями – это обычные графики, только области от оси до графика залиты цветом. Это может добавлять визуальной привлекательности диаграмме, а может, наоборот, мешать. По аналогии с графиками и гистограммами, есть такие типы диаграмм с областями:

  1. : график с залитыми участками от оси до линии графика.

  1. Диаграмма с областями с накоплением – график последующего ряда «ложится» на график предыдущего. Удобно для оценки общего прогресса и сравнения рядов данных между собой.

  1. Нормированная диаграмма с накоплением – данные приведены к процентному соотношению, где базис – накопленный уровень последнего ряда. Очень удобно для визуального сопоставления вклада каждого ряда в общий прогресс.

Все перечисленные виды диаграмм доступны как двумерными, так и объемными.

Лепестковые диаграммы

Лепестковая диаграмма имеет столько осей (выстроенных по кругу), сколько задано категорий. А значение ряда для данной категории откладывается на этой оси. Таким образом, у нас получается замкнутая линия, похожая на петлю и демонстрирующая тенденции по категориям.

Есть три вида этих диаграмм:

  1. – только линии на осях, как на рисунке выше.
  2. Лепестковая с маркерами – в каждой точке на оси изображается маркер.
  3. Заполненная лепестковая – фигуры, очерченные диаграммами, заполняются цветом.

Практическая ценность этого вида диаграмм ограничена, но в некоторых случаях она может выглядеть интереснее гистограммы, например. Проверяйте опытным путем.

Поверхностные диаграммы

Это еще один способ, кроме пузырьковых, отобразить три параметра на одном рисунке. Такие диаграммы дают возможность реализовать трехмерные графики, где это уместно и полезно. Поверхностные диаграммы бывают:

  1. Поверхность – трехмерная диаграмма, напоминающая рельеф. Может быть обычной, закрашенной, либо «проволочной», где отображается, как будто, каркас рельефа. Целесообразность построения проверяем только экспериментально, ведь некоторые участки могут перекрывать другие данные. Если этого не происходит, поверхность может быть очень полезной.

  1. Контурная – отображает вид сверху и напоминает топографическую карту с отображением уровней. Как и у поверхности, можно сделать залитую диаграмму или проволочную. Мне ни разу не приходилось применять в практике этот вид диаграмм, но очевидно, кому-то он может быть полезен.

Биржевые диаграммы

Название диаграммы говорит само за себя, она призвана визуализировать изменение биржевых котировок, облегчая работу аналитикам. Хотя, многие умельцы научились применять их и для других статистических данных. Всего разработчики предлагают четыре вида диаграмм, отображающие перечисленные биржевые показатели:

  1. Максимальная цена, минимальная цена, средняя цена . Минимальная и максимальная цены будут отображены прямой линией, средняя – меткой.

  1. Курс открытия, максимальная цена, минимальная цена, курс закрытия. Максимальная и минимальная цены, так же, отображаются линией, а курсы открытия и закрытия – цилиндром. Если цилиндр залит – курс закрытия ниже открытия.

  1. Объем продаж, максимальная цена, минимальная цена, курс закрытия. Здесь добавляется еще объем продаж в виде залитого столбика.

  1. Объем продаж, курс открытия, максимальная цена, минимальная цена, курс закрытия. Самый детальный график, в нем отображаются сразу все перечисленные выше показатели.

Особый вид диаграмм составляют комбинированные. Они включают в себя визуализации нескольких видов, благодаря чему достигается наилучший эффект от применения диаграмм и графиков в Microsoft Excel.

Пожалуй, это и все диаграммы, которые мы рассмотрели на примере Microsoft Excel 2013. В других редакциях программы этот список может отличаться, но отличия небольшие.

На этом я статью завершаю, а следующий пост будет посвящен . Жду Вас на страницах своего блога!