Меры вариации в статистике. Коэффициент вариации в статистике: примеры расчета

Информация о средних уровнях исследуемых совокупностей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Необходимо учитывать разброс или вариацию отдельных значений изучаемого признака, которая является важной характеристикой исследуемой совокупности.

Вариацией называется колеблемость, многообразие, изменчивость значения признака у единиц совокупности.

Вариация порождается комплексом условий, действующих на совокупность и ее единицы. Например, вариация оценок на экзамене в вузе порождается, в частности, различными способностями студентов, неодинаковым временем, затрачиваемым ими на самостоятельную работу, различием социально-бытовых условий. Именно вариация и предопределяет необходимость статистики. Если бы все студенты получали одинаковые оценки или, например, семьи имели одинаковые доходы, то необходимость в статистическом исследовании отпала бы.

Измерение вариаций дает возможность оценить степень воздействия на данный признак других варьирующих признаков, установить, какие факторы и в какой степени влияют на смертность населения, финансовое положение предприятий, урожайность зерновых культур и т.п. Определение вариации необходимо при организации выборочного наблюдения, построении статистических моделей, разработке материалов экспертных опросов и во многих других случаях.

Каким же образом статистика дает количественную оценку степени колеблемости признака в совокупности, измеряет вариацию? Для этой цели используют такие показатели, как размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Все эти показатели находят широкое применение в социально-экономической статистике, поэтому рассмотрим их сущностную и логическую основы.

Показатели вариации и способы их расчета

Показатели вариации делятся на две группы: абсолютные и относительные.

К абсолютным показателям относятся размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение.

В число относительных показателей вариации входят коэффициент вариации, относительное линейное отклонение и др.

Размах вариации

Этот показатель вычисляется как разность между наибольшим и наименьшим значениями варьирующего признака:

Он показывает, насколько велико различие между единицами совокупности, имеющими самое маленькое (А"т(п) и самое большое значение признака (Хтах). Например, различие между максимальной и минимальной пенсией разных групп населения, уровнем дохода различных категорий работающих или нормами выработки у рабочих определенной специальности или квалификации.

Размах является важной характеристикой вариации, он дает первое общее представление о различии единиц внутри совокупности. Этот показатель выражается в тех именованных числах, в каких выражены значения признака.

Особенность размаха вариации заключается в том, что он зависит лишь от двух крайних значений признака. По этой причине его целесообразно применять в тех случаях, когда особое значение имеет либо минимальный, либо максимальный вариант, т.е. когда размах вариации имеет большое смысловое значение. Например, им определяются пределы, в которых могут колебаться размеры тех или иных параметров деталей; его используют при оценке различного рода рисков. Другая сторона этой особенности заключается в том, что на величину размаха вариации большое влияние оказывает случайность. Так как из статистического ряда берутся только два значения признака, причем крайние в ряду, на размах этих значений могут оказывать влияние причины случайного характера, то и размах вариации может быть зависимым от причин случайного характера.

С отмеченной особенностью связано и то обстоятельство, что показатель размаха вариации не учитывает частот в вариационном ряду распределения.

5.3. Показатели вариации

Целью статистического исследования является выявление основных свойств и закономерностей изучаемой статистической совокупности. В процессе сводной обработки данных статистического наблюдения строят ряды распределения. Различают два типа рядов распределения – атрибутивные и вариационные, в зависимости от того, является ли признак, взятый за основу группировки, качественным или количественным.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Самыми простыми признаками вариации являются минимум и максимум – это наименьшее и наибольшее значение признака в совокупности. Число повторений отдельных вариантов значений признаков называют частотой повторения. Обозначим частоту повторения значения признака fi, сумма частот, равная объему изучаемой совокупности будет:

где k – число вариантов значений признака. Частоты удобно заменять частостями – wi. Частость – относительный показатель частоты – может быть выражен в долях единицы или процентах и позволяет сопоставлять вариационные ряды с различным числом наблюдений. Формально имеем:

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин. Область применения этого показателя ограничена достаточно однородными совокупностями, точнее, характеризует вариацию признака показатель, основанный на учете изменчивости всех значений признака.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели

вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:


– абсолютное значение (модуль) отклонения варианта от средней арифметической; f– частота.

Первая формула применяется, если каждый из вариантов встречается в совокупности только один раз, а вторая – в рядах с неравными частотами.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия (?2) – средняя из квадратов отклонений вариантов значений признака от их средней величины:

Вторая формула применяется при наличии у вариантов своих весов (или частот вариационного ряда).

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение (?) представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Используя в качестве абсолютного показателя вариации размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, получают относительные показатели колеблемости:


– наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Вариационными называют ряды распределения, построенные по количественному признаку. Значения количественных признаков у отдельных единиц совокупности не постоянны, более или менее различаются между собой. Такое различие в величине признака носит название вариации. Отдельные числовые значения признака, встречающиеся в изучаемой совокупности, называют вариантами значений. Наличие вариации у отдельных единиц совокупности обусловлено влиянием большого числа факторов на формирование уровня признака. Изучение характера и степени вариации признаков у отдельных единиц совокупности является важнейшим вопросом всякого статистического исследования. Для описания меры изменчивости признаков используют показатели вариации.

Другой важной задачей статистического исследования является определение роли отдельных факторов или их групп в вариации тех или иных признаков совокупности. Для решения такой задачи в статистике применяются специальные методы исследования вариации, основанные на использовании системы показателей, с помощью которых измеряется вариация. В практике исследователь сталкивается с достаточно большим количеством вариантов значений признака, что не дает представления о распределении единиц по величине признака в совокупности. Для этого проводят расположение всех вариантов значений признака в возрастающем или убывающем порядке. Этот процесс называют ранжированием ряда. Ранжированный ряд сразу дает общее представление о значениях, которые принимает признак в совокупности.

Недостаточность средней величины для исчерпывающей характеристики совокупности заставляет дополнять средние величины показателями, позволяющими оценить типичность этих средних путем измерения колеблемости (вариации) изучаемого признака. Использование этих показателей вариации дает возможность сделать статистический анализ более полным и содержательным и тем самым глубже понять сущность изучаемых общественных явлений.

Для измерения вариации признака применяются различные абсолютные и относительные показатели. К абсолютным показателям вариации относятся среднее линейное отклонение, размах вариации, дисперсия, среднее квадратическое отклонение.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности: R = Xmax – Xmin. Этот показатель дает лишь самое общее представление о колеблемости изучаемого признака, так как показывает разницу только между предельными значениями вариантов. Он совершенно не связан с частотами в вариационном ряду, т. е. с характером распределения, а его зависимость может придавать ему неустойчивый, случайный характер только от крайних значений признака. Размах вариации не дает никакой информации об особенностях исследуемых совокупностей и не позволяет оценить степень типичности полученных средних величин.

Для характеристики вариации признака нужно обобщить отклонения всех значений от какой-либо типичной для изучаемой совокупности величины. Такие показатели вариации, как среднее линейное отклонение, дисперсия и среднее квадратическое отклонение, основаны на рассмотрении отклонений значений признака отдельных единиц совокупности от средней арифметической.

Среднее линейное отклонение представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической:

– абсолютное значение (модуль) отклонения варианта от средней арифметической; f– частота.

Существует и другой способ усреднения отклонений вариантов от средней арифметической. Этот очень распространенный в статистике способ сводится к расчету квадратов отклонений вариантов от средней величины с их последующим усреднением. При этом мы получаем новый показатель вариации – дисперсию.

Дисперсия – средняя из квадратов отклонений вариантов значений признака от их средней величины:

В экономико-статистическом анализе вариацию признака принято оценивать чаще всего с помощью среднего квадратического отклонения. Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии:

Среднее линейное и среднее квадратическое отклонения показывают, на сколько в среднем колеблется величина признака у единиц исследуемой совокупности, и выражаются в тех же единицах измерения, что и варианты.

В статистической практике часто возникает необходимость сравнения вариации различных признаков. Например, большой интерес представляет сравнение вариаций возраста персонала и его квалификации, стажа работы и размера заработной платы и т. д. Для подобных сопоставлений показатели абсолютной колеблемости признаков – среднее линейное и среднее квадртическое отклонение – не пригодны. Нельзя, в самом деле, сравнивать колеблемость стажа работы, выражаемую в годах, с колеблемостью заработной платы, выражаемой в рублях и копейках.

При сравнении изменчивости различных признаков в совокупности удобно применять относительные показатели вариации. Эти показатели вычисляются как отношение абсолютных показателей к средней арифметической (или медиане). Коэффициент вариации – наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33 % для распределений, близких к нормальному.

Тема 6. Виды и методы анализа рядов динамики

  1. Ряды динамики. Виды рядов динамики.
  2. Основные показатели рядов динамики
  3. Средние показатели рядов динамики

1. Явления общественной жизни, изучаемые социально-экономической статистикой, находятся в непрерывном изменении и развитии. С течением времени – от месяца к месяцу, от года к году – изменяются численность населения и его состав, объем производимой продукции, уровень производительности труда и т. д., поэтому одной из важнейших задач статистики является изучение изменения общественных явлений во времени – процесса их развития, их динамики. Эту задачу статистика решает путем построения и анализа рядов динамики (временных рядов).

Ряд динамики (хронологический, динамический, временной ряд) – это последовательность упорядоченных во времени числовых показателей, характеризующих уровень развития изучаемого явления. Ряд включает два обязательных элемента: время и конкретное значение показателя (уровень ряда).

Каждое числовое значение показателя, характеризующее величину, размер явления, называется уровнем ряда. Кроме уровней каждый ряд динамики содержит указания о тех моментах либо периодах времени, к которым относятся уровни.

При подведении итогов статистического наблюдения получают абсолютные показатели двух видов. Одни из них характеризуют состояние явления на определенный момент времени: наличие на этот момент каких-либо единиц совокупности или наличие того или иного объема признака. К таким показателям относится численность населения, парк автомобилей, жилищный фонд, товарные запасы и т. д. Величину таких показателей можно определить непосредственно только по состоянию на тот или иной момент времени, а потому эти показатели и соответствующие ряды динамики и называются моментными.

Другие показатели характеризуют итоги какого-либо процесса за определенный период (интервал) времени (сутки, месяц, квартал, год и т. п.). Такими показателями являются, например, число родившихся, количество произведенной продукции, ввод в действие жилых домов, фонд заработной платы и др. Величину этих показателей можно подсчитать только за какой-нибудь интервал (период) времени, поэтому такие показатели и ряды их значений называются интервальными.

Каждый уровень интервального ряда уже представляет собой сумму уровней за более короткие промежутки времени. При этом единица совокупности, входящая в состав одного уровня, не входит в состав других уровней, поэтому в интервальном ряду динамики уровни за примыкающие друг к другу периоды времени можно суммировать, получая итоги (уровни) за более продолжительные периоды (так, суммируя месячные уровни, получим квартальные, суммируя квартальные, получим годовые, суммируя годовые – многолетние).

В моментном динамическом ряду одни и те же единицы совокупности обычно входят в состав нескольких уровней, поэтому суммирование уровней моментного ряда динамики само по себе не имеет смысла, так как получающиеся при этом итоги лишены самостоятельной экономической значимости.

При построении и перед анализом ряда динамики нужно прежде всего обратить внимание на то, чтобы уровни ряда были сопоставимы между собой, так как только в этом случае динамический ряд будет правильно отражать процесс развития явления. Сопоставимость уровней ряда динамики – это важнейшее условие обоснованности и правильности выводов, полученных в результате анализа этого ряда. При построении динамического ряда надо иметь в виду, что ряд может охватывать большой период времени, в течение которого могли произойти изменения, нарушающие сопоставимость (территориальные изменения, изменения круга охвата объектов, методологии расчетов и т. д.).

При изучении динамики общественных явлений статистика решает следующие задачи:

Измеряет абсолютную и относительную скорость роста либо снижения уровня за отдельные промежутки времени;

Дает обобщающие характеристики уровня и скорости его изменения за тот или иной период;

Выявляет и численно характеризует основные тенденции развития явлений на отдельных этапах;

Дает сравнительную числовую характеристику развития данного явления в разных регионах или на разных этапах;

Выявляет факторы, обусловливающие изменение изучаемого явления во времени;

Делает прогнозы развития явления в будущем.

2 . Простейшими показателями анализа, которые используются при решении ряда задач, в первую очередь при измерении скорости изменения уровня ряда динамики, являются абсолютный прирост, темпы роста и прироста, а также абсолютное значение (содержание) одного процента прироста. Расчет этих показателей основан на сравнении между собой уровней ряда динамики. При этом уровень, с которым производится сравнение, называется базисным, так как он является базой сравнения. Обычно за базу сравнения принимается либо предыдущий, либо какой-либо предшествующий уровень, например первый уровень ряда.

Если каждый уровень сравнивается с предыдущим, то полученные при этом показатели называются цепными, так как они представляют собой как бы звенья «цепи», связывающей между собой уровни ряда. Если же все уровни связываются с одним и тем же уровнем, выступающим как постоянная база сравнения, то полученные при этом показатели называются базисными.

Часто построение ряда динамики начинают с того уровня, который будет использован в качестве постоянной базы сравнения. Выбор этой базы должен быть обоснован историческими и социально-экономическими особенностями развития изучаемого явления. В качестве базисного целесообразно брать какой-либо характерный, типичный уровень, например конечный уровень предыдущего этапа развития (или средний его уровень, если на предыдущем этапе уровень то повышался, то понижался).

Абсолютный прирост показывает, на сколько единиц увеличился (или уменьшился) уровень по сравнению с базисным, т. е. за тот или иной промежуток (период) времени. Абсолютный прирост равен разности между сравниваемыми уровнями и измеряется в тех же единицах, что и эти уровни:

где уi – уровень i-го года; yi-1 – уровень предшествующего года; y0 – уровень базисного года.

Абсолютный прирост за единицу времени (месяц, год) измеряет абсолютную скорость роста (или снижения) уровня. Цепные и базисные абсолютные приросты связаны между собой: сумма последовательных цепных приростов равна соответствующему базисному приросту, т. е. общему приросту за весь период.

Более полную характеристику роста можно получить только тогда, когда абсолютные величины дополняются относительными. Относительными показателями динамики являются темпы роста и темпы прироста, характеризующие интенсивность процесса роста.

Темп роста (Тр) – статистический показатель, который отражает интенсивность изменения уровней ряда динамики и показывает, во сколько раз увеличился уровень по сравнению с базисным, а в случае уменьшения – какую часть базисного уровня составляет сравниваемый уровень; измеряется отношением текущего уровня к предыдущему или базисному:

Между цепными и базисными темпами роста, выраженными в форме коэффициентов, существует определенная взаимосвязь: произведение последовательных цепных темпов роста равно базисному темпу роста за весь соответствующий период.

Темп прироста (Тпр) характеризует относительную величину прироста, т. е. представляет собой отношение абсолютного прироста к предыдущему или базисному уровню:

Темп прироста, выраженный в процентах, показывает, на сколько процентов увеличился (или уменьшился) уровень по сравнению с базисным, принятым за 100 %.

При анализе темпов развития никогда не следует упускать из виду, какие абсолютные величины – уровни и абсолютные приросты – скрываются за темпами роста и прироста. Нужно, в частности, иметь в виду, что при снижении (замедлении) темпов роста и прироста абсолютный прирост может возрастать.

В связи с этим важно изучать еще один показатель динамики – абсолютное значение (содержание) 1 % прироста, который определяется как результат деления абсолютного прироста на соответствующий темп прироста:

3. С течением времени изменяются не только уровни явлений, но и показатели их динамики – абсолютные приросты и темпы развития, поэтому для обобщающей характеристики развития, для выявления и измерения типичных основных тенденций и закономерностей и решения других задач анализа используются средние показатели временного ряда – средние уровни, средние абсолютные приросты и средние темпы динамики.

При вычислении средних показателей динамики необходимо иметь в виду, что к этим средним показателям полностью относятся общие положения теории средних величин. Это означает прежде всего, что динамическая средняя будет типичной, если она характеризует период с однородными, более или менее стабильными условиями развития явления. Выделение таких периодов – этапов развития – в определенном отношении аналогично группировке. Если же динамическая средняя величина исчислена за период, в течение которого условия развития явления существенно менялись, т. е. период, охватывающий разные этапы развития явления, то такой средней величиной нужно пользоваться с большой осторожностью, дополняя ее средними величинами за отдельные этапы.

Наиболее просто вычисляется средний уровень интервального ряда динамики абсолютных величин с равностоящими уровнями. Расчет производится по формуле простой средней арифметической:

где n – число фактических уровней за последовательные равные отрезки времени.

Для моментного ряда с разностоящими уровнями расчет среднего уровня ряда производится по формуле

Средний абсолютный прирост показывает, на сколько единиц увеличивался или уменьшался уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежемесячно, ежегодно и т. д.). Средний абсолютный прирост характеризует среднюю абсолютную скорость роста (или снижения) уровня и всегда является интервальным показателем. Он вычисляется путем деления общего прироста за весь период на длину этого периода в тех или иных единицах времени:

Расчет среднего абсолютного цепного прироста:

Расчет среднего абсолютного базисного прироста:

где – цепные абсолютные приросты за последовательные промежутки времени; n – число цепных приростов; У0 – уровень базисного периода.

Средний темп роста, выраженный в форме коэффициента, показывает, во сколько раз увеличивается уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.).

Для средних темпов роста и прироста сохраняет силу та же взаимосвязь, которая имеет место между обычными темпами роста и прироста:

Средний темп прироста (или снижения), выраженный в процентах, показывает, на сколько процентов увеличивался (или снижался) уровень по сравнению с предыдущим периодом в среднем за единицу времени (в среднем ежегодно, ежемесячно и т. п.). Средний темп прироста характеризует среднюю интенсивность роста, т. е. среднюю относительную скорость изменения уровня.

Вариация - это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу, любимому занятию в свободное время и т.д.

Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Исследование вариации в статистике имеет большое значение, помогает познать сущность изучаемого явления. Особенно актуально оно в период формирования многоукладной экономики. Измерение вариации, выяснение его причины, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.п.) для принятия научно обоснованных управленческих решений.

Средняя величина дает обобщенную характеристику признака изучаемой совокупности,но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагается около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Средняя величина признака в двух совокупностях может быть одинаковой, но в одном случае все индивидуальные значения отличаются от нее мало, а в другом - эти отличия велики, т.е. в одном случае вариация признака мала, а в другом велика, это весьма важное значение для характеристики надежности средней величины.

Чем больше варианты отдельных единиц совокупности различаются между собой, тем больше они отличаются от своей средней, и наоборот, - тем меньше они отличаются от средней, которая в таком случае будет более реально представлять всю совокупность. Вот почему ограничиваться вычислением одной средней в ряде случаев нельзя. Нужны и другие показатели, характеризующие отклонения отдельных значений от общей средней.

Это можно показать на таком примере. Предположим, что одинаковую работу выполняют две бригады, каждая из трех человек. Пусть количество деталей, шт., изготовленных за смену отдельными рабочими, составляло:

В первой бригаде 95, 100, 105 (???????х1=100 шт.);

Во второй бригаде - 75, 100, 125 (?х2=100 шт.)

Средняя выработка на одного рабочего в обеих бригадах одинакова и составляет 1=2=100 шт., однако колеблемость выработки отдельных рабочих в первой бригаде гораздо меньше, чем во второй.

Поэтому возникает необходимость измерять вариацию признака в совокупностях. Для этой цели в статистике применяют ряд обобщающих показателей:

  • * размах вариации;
  • *среднее линейное отклонение;
  • * дисперсия;
  • * среднее квадратическое отклонение;
  • *коэффициент вариации.

Самым элементарным показателем вариации признака является размах вариацииR, представляющим собой разность максимальным и минимальным значениями признака:

R = хmax- хmin.

В нашем примере размах вариации сменной выработки деталей составляет: в первой бригаде - R1= 10 шт. (т.е.105-95); во второй бригаде - R2=50 шт. (т.е 125-75), что в 5 раз больше.

Это свидетельствует о том, что при численном равенстве средняя выработка первой бригады более «устойчива». Размах вариации может служить базой расчета возможных резервов роста выработки. Таких резервов больше у второй бригады, поскольку в случае достижения всеми рабочими максимальной для этой бригады выработки деталей, ею может быть изготовлено 375 шт., т.е. (3Ч125), а в первой - только 315 шт., т.е. (3Ч105).

Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду. При изучении вариации нельзя ограничиваться только определением ее размаха. Для анализа вариации необходим показатель, который отражает все колебания варьирующего признака и дает обобщенную характеристику. Простейший показатель такого типа - среднее линейное отклонение.

>Cреднее линейное отклонение представляет собой среднюю арифметическую абсолютных значений отклонений отдельных вариантов от их средней арифметической (при этом всегда предполагают, что среднюю вычитают из варианта: (x -).

Среднее линейное отклонение:

* для несгруппированных данных

где n - число членов ряда;

*для сгруппированных данных

где?f - сумма частот вариационного ряда.

В формулах (2.1) и (2.2) разности в числителе взяты по модулю, (иначе в числителе всегда будет ноль - алгебраическая сумма отклонений вариантов отих средней арифметической). Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко (только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл). С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.

> Дисперсия признака представляет собой средний квадрат отклонений вариантов от их средней величины, она вычисляется поформула простой и взвешенной дисперсий (в зависимости от исходных данных):

*простая дисперсия для несгруппированных данных

*взвешенная дисперсия для вариационного ряда

Техника вычисления дисперсии по формулам (2.3) и (2.4) достаточно сложна, а при больших значениях вариантов и частот может быть громоздкой.

Расчет можно упростить, используя свойства дисперсии (доказываемые в математической статистике). Приведем два из них:

  • 1) если все значения признака уменьшить или увеличить на одну и ту же постоянную величину А, то дисперсия от этого не изменится;
  • 2) если все значения признака уменьшить или увеличить в одно и тоже число раз (iраз), то дисперсия соответственно уменьшится или увеличится в i2раз.

Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия. Ниже, в частности, будет показано разложение дисперсии на соответствующие элементы, позволяющие оценить влияние различных факторов, обуславливающих вариацию признака.

  • >Среднее квадратическое отклонение у равно корню квадратному из дисперсии:
  • *для несгруппированных данных

*для вариационного ряда

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности; оно показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

>Коэффициент вариации представляет собой выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается количественно однородной, если коэффициент вариации не превышает 33%.

Решение задач

Задача 3.6

Пользуясь формулой Стерджесса, определите интервал группировки сотрудников фирмы по уровню доходов, если общая численность составляет 20 человек, а минимальный и максимальный доход соответственно равен 5000 и 30000 рублей.

Согласно формуле Стерджессаn = 1 + 3,322 - lgN,

где n - число групп;

N - число единиц совокупности, определим число групп в коллективе фирмы.

n = 1 + 3,322 - lg 20 = 1 + 3,322 -1,3?3.

Вариация признака (уровень дохода сотрудников) проявляется в сравнительно узких границах и распределение будет носить равномерный характер. Совокупность сотрудников разделится на 3 группировки с равными интервалами. Величина равного интервала определяется по следующей формуле:

h = R/n = (xmax-xmin)/n,

где xmax и xmin- максимальное и минимальное значение признака в совокупности;

n - число групп.

h = (30000 - 5000)/3 = 8333,33.

Итак, величина интервала определена, теперь можно определить границы групп:

  • 5000 - 13333,33 1-я группа
  • 13333,33 - 21666,66 2-я группа
  • 21666,66 - 30000 3-я группа.

Задача 7.4

По результатам зимней экзаменационной сессии одного курса студентов:

Определите:

  • а) средний балл оценки знаний студентов;
  • б) модальный балл успеваемости и медианное значение балла;
  • в) сделайте выводы о характере данногораспределении.

Средний балл найдем по формуле

ар= (2х6 + 3х75 + 4х120 + 5х99)/300 = 1212/300 = 4,04. Средний балл по итогам сессии достаточно высокий и равен 4.

Мода (Mo) - значение признака наиболее часто встречающееся в исследуемой совокупности, т.е., это один из вариантов признака, который в ряду распределения имеет наибольшую частоту (частость).

В дискретном ряду модальное значение определяется визуальнопо максимальной частоте. Соответственно, Mo= 4,т.к в данной совокупности именно эту оценку получило самое большое число студентов в группе.

Медиана (Ме) - значение признака (варианта), приходящееся на середину ранжированной (упорядоченной) совокупности, т.е. это вариант, который делит ряд распределения на две равные по объему части.

Медиана, как и мода, не зависит от крайних значений вариантов, поэтому применяется для характеристики центра в ряду распределения.

Для определения медианы в ранжированном ряду необходимо вначале найти номер медианы по формуле:

N = (300+1)/2 = 150,5

Затем используют кумулятивные частоты Sfили частость Sd.

Зная, чтоN = 150,5, накапливаем частоты до тех пор, пока кумулятивная частотаSfне будет равна этому номеру или превысит его. Следовательно, на 2 балла сдали 6 человек + 75 человек, сдавшие на 3 балла - это 81человек, + 120 человек, сдавшие на 4, равно 201 человек. Таким образом, медиана данного ряда распределения равна 4 баллам, т.е. половина студентов сдали на 2, 3 и 4,а половина на 4 и 5.

Вывод: средний балл,модальное значение и медиана совпадают и равняются 4 баллам. Это говорит о симметричном распределении частот множества.

Понятие вариации и ее значение

Вариация это различие в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени.

Например, работники фирмы различаются по доходам, затратам времени на работу, росту, весу и т.д.

Вариация возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Таким образом, величина каждого варианта объективна.

Исследование вариации в статистике имеет большое значение, т.к. помогает познать сущность изучаемого явления. Измерение вариации, выяснение ее причины, выявление влияния отдельных факторов дает важную информацию (например, о продолжительности жизни людей, доходах и расходах населения, финансовом положении предприятия и т.д.) для принятия научно обоснованных управленческих решений.

Средняя величина дает обобщающую характеристику признака изучаемой совокупности, но она не раскрывает строения совокупности, которое весьма существенно для ее познания. Средняя не показывает, как располагаются около нее варианты осредняемого признака, сосредоточены ли они вблизи средней или значительно отклоняются от нее. Поэтому для характеристики колебания признака используют показатели вариации.

Показатели вариации и их значение в статистике

Для измерения вариации признака в совокупностях используют следующие обобщающие показатели вариации: размах вариации, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение .

1. Самым распространенным абсолютным показателем является размах вариации (), определяемый как разность между наибольшим () и наименьшим () значениями вариантов.

. (5.1)

Этот показатель прост для расчета, что и обусловило его широкое распространение. Однако он улавливает только крайние отклонения и не отражает отклонений всех вариант в ряду.

2. Для обобщающей характеристики распределения отклонений рассчитывают среднее линейное отклонение , определяемое как средняя арифметическая из отклонений индивидуальных значений от средней, без учета знака этих отклонений:

Невзвешенное среднее линейное отклонение:

, (5.2)

Взвешенное среднее линейное отклонение:

. (5.3)

В этих формулах разности в числителе взяты по модулю, иначе в числителе всегда будет ноль. Поэтому среднее линейное отклонение как меру вариации признака применяют в статистической практике редко, только в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл. С его помощью, например, анализируется состав работающих, ритмичность производства, оборот внешней торговли.

3. Меру вариации более объективно отражает показатель дисперсии ( - средний квадрат отклонений), определяемый как средняя из отклонений, возведенных в квадрат:

Невзвешенная:

, (5.4)

Взвешенная:

. (5.5)

Дисперсия имеет большое значение в экономическом анализе. В математической статистике важную роль для характеристики качества статистических оценок играет их дисперсия.

4. Корень квадратный из дисперсии «среднего квадрата отклонений» представляет собой среднее квадратическое отклонение :

Среднее квадратическое отклонение - это обобщающая характеристика размеров вариации признака в совокупности. Оно показывает, насколько в среднем отклоняются конкретные варианты от их среднего значения; является абсолютной мерой колеблемости признака и выражается в тех же единицах, что и варианты, поэтому экономически хорошо интерпретируется.

Чем меньше значения дисперсии и среднего квадратического отклонения, тем однороднее (количественно) совокупность и тем более типичной будет средняя величина.

В статистической практике часто возникает необходимость сравнения вариаций различных признаков (например, сравнение вариаций возраста рабочих и их квалификации, стажа работы и размера заработной платы).

Для осуществления такого рода сравнений используют следующие относительные показатели:

Коэффициент осциляции – отражающий относительную колеблемость крайних значений признака вокруг средней:

. (5.7)

Относительное линейное отклонение характеризует долю усредненного значения абсолютных отклонений от средней величины:

. (5.8)

Коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средней величины:

. (5.9)

Если , то это говорит о большой колеблемости признака в изучаемой совокупности.

5.3 Дисперсия: свойства и методы расчета

Дисперсия обладает рядом свойств, которые позволяют упростить ее расчеты.

1) Если из всех значений вариант отнять какое-то постоянное число , то средний квадрат отклонений от этого не изменится:

. (5.10)

2) Если все значения вариант разделить на какое-то постоянное число , то средний квадрат отклонений уменьшится от этого в раз, а среднее квадратическое отклонение – в раз.

. (5.11)

3) Если исчислить средний квадрат отклонений от любой величины , которая в той или иной степени отличается от средней арифметической , то он всегда будет больше среднего квадрата отклонений , исчисленного от средней арифметической:

А именно средний квадрат отклонений при этом будет больше на квадрат разности средней и этой условно взятой величиной, т.е. на :

Дисперсия от средней имеет свойство минимальности , т.е. она всегда меньше дисперсий, исчисленных от любых других величин. В этом случае, когда приравнивается к нулю, формула принимает вид:

. (5.14)

Используя второе свойство дисперсии, разделив все варианты на величину интервала, получим следующую формулу вычисления дисперсии в вариационных рядах с равными интервалами по способу моментов:

, (5.15)

где - дисперсия, исчисленная по способу моментов;