Статистическая сводка и группировка. Статистический ряд распределения. Примеры решения задач. Статистические ряды

Наиболее простым способом обобщения статистического материала является построение рядов. Результатом сводки статистического исследования могут быть ряды распределения.

После определения группировочного признака, количества групп и интервалов группировки данные сводки и группировки представляются в виде рядов распределения и оформляются в виде статистических таблиц.

Ряд распределния является одним из видов группировок.

Рядом распределения в статистике называется упорядоченное распределение единиц совокупности на группы по какому-либо одному признаку: по качественному или количественному.

  1. Виды рядов распределения

В зависимости от признака, положенного в основу образования ряда распределения различают атрибутивные и вариационные ряды распределения:

    атрибутивными называют ряды распределения, построенные по качественными признакам;

    вариационными называют ряды распределения, построенные в порядке возрастания или убывания значений количественного признака.

Вариационный ряд распределения состоит из двух столбцов. В первом столбце приводятся количественные значения варьирующегося признака, которые называются вариантами и обозначаются. Дискретная варианта - выражается целым числом. Интервальная варианта находится в пределах от и до. В зависимости от типа варианты можно построить дискретный или интервальный вариационный ряд. Во втором столбце содержится количество конкретных вариант, выраженное через частоты или частости:

    частоты - это абсолютные числа, показывающие столько раз в совокупности встречается данное значение признака; сумма всех частот должна быть равна численности единиц всей совокупности;

    частости - это частоты выраженные в процентах к итогу; сумма всех частостей выраженных в процентах должна быть равна 100% в долях единице.

Вариационный ряд характеризуется двумя элементами: вариантой (Х) и частотой (f). Варианта – это отдельное значение признака отдельной единицы или группы совокупности. Число, показывающее, сколько раз встречается то или иное значение признака, называется частотой. Если частота выражена относительным числом, то она называется частостью.

Вариационный ряд может быть:

    интервальным, когда определены границы «от» и «до», интервальные ряды распределения можно представить графически в виде гистограммы;

    дискретным, когда изучаемый признак характеризуется определенным числом.

  1. Графическое изображение рядов распределения

Наглядно ряды распределения представляются при помощи графических изображений.

Ряды распределения изображаются в виде:

    полигона;

    гистограммы;

    кумуляты;

При построении полигона на горизонтальной оси (ось абсцисс) откладывают значения варьирующего признака, а на вертикальной оси (ось ординат) - частоты или частости.

Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам (или частостям).

Распределение признака в вариационном ряду по накопленным частотам (частостям) изображается с помощью кумуляты.

Кумулята или кумулятивная кривая в отличие от полигона строится по накопленным частотам или частостям. При этом на оси абсцисс помещают значения признака, а на оси ординат - накопленные частоты или частости.

Огива строится аналогично кумуляте с той лишь разницей, что накопленные частоты помещают на оси абсцисс, а значения признака - на оси ординат.

Разновидностью кумуляты является кривая концентрации или график Лоренца. Для построения кривой концентрации на обе оси прямоугольной системы координат наносится масштабная шкала в процентах от 0 до 100. При этом на оси абсцисс указывают накопленные частости, а на оси ординат - накопленные значения доли (в процентах) по объему признака.

Статистическое измерение, методы сплошного и выборочного наблюдения социально-экономических явлений и процессов, статистические группировки, методы обработки и анализа статистической информации.

Статистическое наблюдение – это планомерный, научно организованный и как правило систематический сбор данных о явлениях и процессах общественной жизни путём регистрации заранее намеченных существенных признаков с целью получения в дальнейшем обобщающих характеристик этих явлений и процессов. На основе наблюдения делаются выводы о тех или иных психических процессах. Различают два вида наблюдения - сплошное и выборочное.Сплошным называют наблюдение, когда фиксируются все особенности и проявления психической деятельности человека в течение какого-то определенного периода. В отличие от этого при выборочном наблюдении обращается внимание только на те факты в поведении человека, которые имеют прямое или косвенное отношение к изучаемому вопросу.

Выборочное наблюдение является одним из наиболее широко применяемых видов несплошного наблюдения. В основе выборочного наблюдения лежит идея о том, что отобранная в случайном порядке некоторая часть единиц может представлять всю изучаемую совокупность явления по интересующим исследователя признакам. Целью выборочного наблюдения является получение информации для определения сводных обобщающих характеристик всей изучаемой генеральной совокупности.

Группировка - это распределение множества единиц исследуемой совокупности по группам в соответствии с существенным для данной группы признаком. Метод группировки позволяет обеспечивать первичное обобщение данных, представление их в более упорядоченном виде. Признаки, по которым проводится группировка, называют группировочными признаками . Группировочный признак иногда называют основанием группировки . Правильный выбор существенного группировочного признака дает возможность сделать научно обоснованные выводы по результатам статистического исследования. Группировочные признаки могут иметь как количественное выражение (объем, доход, курс валюты, возраст и т.д.), так и качественное (форма собственности предприятия, пол человека, отраслевая принадлежность, семейное положение и т.д.). Система способов, приемов, с помощью которых статистика исследует массовые явления, образует статистическую методологию. Ее специфика заключается в том, что все основные методические приемы используются по мере выполнения задач трех последовательных стадий (этапов) статистического исследования:
I. Статистического наблюдения;
II. сводки и группировки первичных статистических данных;
III. научной обработки и анализа статистической информации.
Содержание работы первого этапа предполагает использование метода массовых наблюдений, которые есть не что иное, как сбор первичной статистической информации.
На втором этапе собранная информация при помощи метода статистических группировок определенным способом обобщается и распределяется.
На третьем этапе с помощью метода обобщающих показателей осуществляется анализ статистической информации.

Организационные формы и виды статистического наблюдения. Способы статистического наблюдения. Виды группировок, их применение в статистике. Группировочные признаки, их обоснование и выбор. Определение числа групп и величины интервала.

К основным организационным формам статистического наблюдения относят: отчетность и специально организованное наблюдение.

Отчетность – это форма статистического наблюдения, при которой в соответствующие статистические органы поступают в определенные сроки сведения от предприятий и организация, которые осуществляют экономическую деятельность. Сведения должны подаваться в установленном законом порядке отчетных документов.

Органами государственной статистики утверждаются формы статистической отчетности.

В коммерческой деятельности отчетность подразделяется на:

1) общегосударственную – обязательна для всех организаций и представляется в сводном виде в органы государственной статистики;

2) внутриведомственную – эта отчетность действует в пределах ведомств и министерств. Существуют следующие формы отчетности:

1) типовой называют отчетность, которая содержит показатели, одинаковые для всех предприятий, учреждений различных организационных форм, а также для иных видов деятельности

2) если предприятие имеет свои определенные особенности, то в эту организацию вводится специализированная отчетность;

3) отчетность, предоставляемая каждым предприятием в одинаковые промежутки времени, называется периодической;

4) отчетность, которая поступает в органы статистики по мере необходимости, называется единовременной отчетностью. Каждая организация вправе выбирать, по какому способу ей предоставить отчетные данные.

Виды статистического наблюдения:

1) если обследованию подвергается абсолютно все единицы изучаемой совокупности явлений и процессов, то это сплошное статистическое наблюдение;

2) если обследованию подвергаются часть единиц изучаемой совокупности явлений, то это несплошное статистическое наблюдение;

3) выборочным наблюдением называют наблюдение, при котором характеристика всей совокупности фактов дается по некоторой их части, отобранной в случайном порядке;

4) монографическое обследование – это детальное изучение и описание определенных единиц совокупности;

5) если обследованию подвергается та часть единиц совокупности, у которой величина изучаемого признака является преобладающей во всем объеме, то это называетсяметодом основного массива;

6) сбор данных, основанный на добровольном заполнении адресатами анкет, называетсяанкетным обследованием;

7) если наблюдение ведется непрерывно, и при этом все факты и явления, происходящие в состоянии изменения, регистрируются, то это наблюдение называется текущим;

8) если же наблюдение осуществляется нерегулярно, но только тогда, когда требуется, это наблюдение называется единовременным;

9) периодическим называется наблюдение, которое повторяется через определенные промежутки времени (год, месяц, квартал и т. д.).

В зависимости от источников собираемых сведений различают:

1) наблюдение, осуществляемое самими регистраторами путем замера и с помощью осмотра, подсчета и взвешивания признаков изучаемого объекта, называется непосредственным;

2) опрос – это наблюдение, при котором ответы человека на вопросы фиксируются на определенном формуляре;

3) при документальном учете фактов источником сведений служат документы.

Предоставление предприятиями, организациями статистических отчетов о своей хозяйственной деятельности в строго установленном порядке называют отчетным способом. Вид статистического наблюдения, предполагающий предоставление сведений в органы, которые и ведут наблюдение, в явочном порядке называют явочным способом.

Если сведения в органы предоставляют корреспонденты, то этот способ называют корреспондентским.(1) Типологические группировки

Их задача – выявление социально-экономических типов или однородных в существенном отношении групп.

(2) Структурные группировки

Их задача – изучение состава отдельных типических групп при помощи объединения единиц совокупности, близких друг к другу по величине группировочного признака.

(3) Аналитические группировки

Их задача – выявления влияния одних признаков на другие (выявить связь между социально-экономическими явлениями).

(4) Комбинационные группировки

В них производится разделение совокупности на группы по двум или более признакам. При этом группы, образованные по одному признаку, разбиваются на подгруппы по другому признаку.

Такие группировки дают возможность изучить структуру совокупности по нескольким признакам одновременно.Группировочный признак - признак, по которому происходит объединение отдельных единиц совокупности в отдельные группы. Для группировки следует брать существенные признаки, выражающие наиболее характерные черты изучаемого явления.

Первичная группировка - непосредственная группировка данных статистического наблюдения. Вторичная группировка - это перегруппировка ранее сгруппированных данных. Необходимость вторичной группировки возникает в двух случаях:

1) ранее произведенная группировка не удовлетворяет целям исследования в отношении числа групп;

2) для сравнения данных, относящихся к различным периодам времени или к различным территориям, если первичная группировка была произведена по разным группировочным признакам или по разным интервалам.

Существуют два способа вторичной группировки: объединение мелких групп, а более крупные и выделение определённой доли единиц совокупности.

Основные задачи, решаемые с помощью группировок:

1) выделение в совокупности изучаемых явлений их социально-экономических типов;

2) изучение структуры общественных явлений;

3) выявление связей и зависимостей между общественными явлениями.

Для определения оптимального числа групп применяется формула Стерджесса: , где n – число групп; N – число единиц совокупности. n округляют до целого числа. После определения числа групп следует определить интервалы группировки. Интервал – это значения варьирующего признака, лежащие в определённых границах. Нижней границей интервала называется наименьшее значение признака в интервале, а верхней границей – наибольшее значение признака в нём. Величина (ширина) интервала представляет собой разность между верхней и нижней границами интервала. Интервалы группировки в зависимости от их величины бывают равные и неравные. Если вариация признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то строят группировку с равными интервалами. Величину равного интервала определяют по формуле: , где и – максимальное и минимальное значения признака Открытые – это интервалы, у которых указана только одна граница: верхняя – у первого интервала, нижняя – у последнего. Ширина открытого интервала принимается равной ширине смежного с ним интервала. Закрытыми называются интервалы, у которых обозначены обе границы. При группировке по количественному признаку границы интервалов могут быть обозначены по-разному. Если основанием группировки выступает непрерывный признак, то одно и то же значение признака выступает и верхней, и нижней границами у двух смежных интервалов. Т.о., верхняя граница i-го интервала равна нижней границе i+1-го интервала. При таком обозначении границ может возникнуть вопрос, в какую группу включать единицы объекта, значения признака у которых совпадают с границами интервалов. Обычно нижняя граница формируется по принципу «включительно», а верхняя – по принципу «исключительно». Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе i-1-го интервала, увеличенной на 1. Неравные интервалы применяются в статистике, когда значения признака варьируют неравномерно и в значительных размерах.

Статистические ряды распределения, их виды. Основные характеристики рядов распределения.

Важнейшей частью статистического анализа является построение рядов распределения (структурной группировки) с целью выделения характерных свойств и закономерностей изучаемой совокупности. В зависимости от того, какой признак (количественный или качественный) взят за основу группировки данных, различают соответственно типы рядов распределения.
Если за основу группировки взят качественный признак, то такой ряд распределения называют атрибутивным(распределение по видам труда, по полу, по профессии, по религиозному признаку, национальной принадлежности и т.д.).
Если ряд распределения построен по количественному признаку, то такой ряд называют вариационным. Построить вариационный ряд - значит упорядочить количественное распределение единиц совокупности по значениям признака, а затем подсчитать числа единиц совокупности с этими значениями (построить групповую таблицу).
Графически ряды распределения изображаются в виде:
1) гистограмма – график, по которому интервальный вариационный ряд изображается в виде смежных друг с другом столбиков. (По оси Ох – границы интервалов, по Оу – частота интервала).
2) полигон распределения – график, на котором график распределения изображается в виде линейной диаграммы. (По Ох – значение варьируемого признака, по Оу – частота).
3) кумулята – график, на котором по Ох – значения варьируемого признака или верхние границы интервалов, а по Оу – накопленные частоты.
4) огива – а) график, на котором по Ох – значения варьируемого
признака, по Оу – частость признака;
б) график, на котором по Ох – накопленная частота, по Оу
– значения варьируемого признака. В вариационных рядах существует определенная связь в изменении частот и значений варьирующего признака: с увеличением варьирующего признака величина частот вначале возрастает до определенной величины, а затем уменьшается. Такого рода изменения называются закономерностями распределения.
Важные свойства кривой распределения – это степень ее асимметрии, высоко– или низковершинность, которые в совокупности характеризуют форму или тип кривой распределения.
Важная задача – это определение формы кривой.
Характер общего распределения предполагает оценку степени его однородности и вычисление показателей асимметрии и эксцесса.
Симметричным называют распределение, в котором частоты любых двух вариантов, равноотстоящих в обе стороны от центра распределения, равны между собой.
Для симметричных распределений средняя арифметическая, мода и медиана равны между собой.
Наиболее точным и распространенным является показатель, основанный на определении центрального момента третьего порядка.
Общим является нормальное распределение, которое может быть представлено графически в виде симметричной куполообразной кривой.
Куполообразная форма кривой показывает, что большинство значений концентрируется вокруг центра измерения, и в действительно симметричном одновершинном распределении средняя, мода и медиана совпадут.
Закон нормального распределения предполагает, что отклонение от среднего значения является результатом большого количества мелких отклонений, что позитивные и негативные отклонения равновероятны и что наиболее вероятным значением всех в равной мере надежных измерений является их арифметическая средняя.
Теоретической кривой распределения называют кривую распределения, которая выражает общую закономерность данного типа.
В кривой нормального распределения отражается закономерность, которая возникает при взаимодействии множества случайных причин.
Для симметричных распределений рассчитывается показатель эксцесса (островершинности).
Эксцесс – выпад вершины эмпирического распределения вверх или вниз от вершины кривой нормального распределения.
Оценка показателей асимметрии и эксцесса дает возможность сделать вывод о том, можно ли отнести данное эмпирическое распределение к типу кривых нормального распределения.

Виды абсолютных величин, единицы измерения и способы получения. Относительные величины, их виды, способы расчета. Относительные величины планового задания, структуры, динамики, интенсивности, координации, сравнения и методы их исчисления и анализа.

Абсолютные величины бывают экономически простыми (численность магазинов, работников) и экономически сложными (объем товарооборота, размер основных фондов). Абсолютные величины – всегда числа именованные, имеют определенную размерность, единицы измерения. В статистической науке применяются натуральные, денежные (стоимостные) и трудовые единицы измерения. Единицы измерения называют натуральными, если они будут соответствовать потребительским или природным свойствам предмета, товара и будут выражены в физических весах, мерах длины и т. п. В статистической практике натуральные единицы измерения могут быть составными. Применяют условно-натуральные единицы измерения при суммировании количества разнородных товаров, продуктов. Абсолютные величины используют в практике торговли, применяют в анализе и прогнозировании коммерческой деятельности. На основе этих величин в коммерческой деятельности составляют хозяйственные договоры, оценивают объем спроса на конкретные изделия и т. д. Абсолютными величинами измеряются все стороны общественной жизни. Абсолютные величины по способу выражения размеров изучаемых процессов подразделяются на: индивидуальные и суммарные, они в свою очередь относятся к одному из видов обобщающих величин. Размеры количественных признаков у каждой статистической единицы характеризуют индивидуальные абсолютные величины, а также они являются базой при статистической сводке для соединения отдельных единиц статистического объекта в группы. На их основе получают абсолютные величины, в которых можно выделить показатели объема признаков совокупности и показатели численности совокупности.

Относительные величины – это показатель, который представляет собой частное от деления двух статистических величин и характеризует количественное соотношение между ними. Для расчета относительных величин в числитель ставится сравниваемый показатель, который будет отражать изучаемое явление а в знаменателе отражается показатель, с которым и будет производиться это сравнение, он является основанием или базой для сравнения. База сравнения – это своеобразный измеритель. Основание имеет результат отношения в зависимости от количественного (числового) значения, который выражается в: коэффициенте, процентах, промилле или децимилле.

Если база сравнения принимается за единицу, то относительная величина является коэффициентом и показывает, во сколько раз изучаемая величина больше основания. Если базу сравнения принять за 100%, то результат вычисления относительной величины будет выражен в процентах.

Если базу сравнения принимают за 1000, то результат сравнения выражается в промилле (%0). Относительные величины могут быть выражены и децимилле, если основание отношения равно 10 000.

В зависимости от цели статистического исследования относительные величины подразделяются на следующие виды: выполнение договорных обязательств; относительные величины, характеризующие структуру совокупности; относительные величины динамики; сравнения; координации; относительные величины интенсивности.

Относительные показатели планового задания (ОППЗ) используются для перспективного планирования деятельности субъекта финансово–хозяйственной сферы и т.д.

ОППЗ рассчитывается следующей формулой:

Относительные величины структуры– это показатели, характеризующие долю от состава изучаемых совокупностей. Относительная величина структуры определяется отношением абсолютной величины отдельного элемента статистической совокупности к абсолютной величине всей совокупности, т. е. как отношение части к общему (целому), и характеризует удельный вес части в целом, в форме процента.

Относительные величины динамики характеризуют изменение изучаемого явления во времени, выявляют направление развития, измеряют интенсивность развития. Рассчитывается относительная величина динамики как отношение уровня признака в определенный период или момент времени к уровню того же признака в предшествующий период или момент времени, т. е характеризует изменение уровня определенного явления во времени. Относительные величины динамики называются темпами роста:

Именованные величины выражаются в относительных величинах интенсивности:

Относительная величина интенсивности = абсолютная величина изучаемого явления / абсолютная величина, характеризующая объем среды, в которой распространяется явление

Относительные показатели координации (ОПК) – это соотношение одной части совокупности к другой части этой же совокупности:

ОПК = уровень, характеризующий i – ую часть совокупности / уровень, характеризующий часть совокупности, выбранную в качестве базы сравнения

Средняя в статистике, ее сущность и условия применения. Виды и формы средней. Средняя простая и взвешенная. Веса средних, их выбор. Расчет средних по данным вариационного ряда распределения.

Средняя величина - это обобщающая количественная характеристика совокупности однотипных явлений по одному варьирующему признаку. В экономической практике используется широкий круг показателей, вычисленных в виде средних величин. Важнейшее свойство средней величины заключается в том, что она представляет значение определенного признака во всей совокупности одним числом, несмотря на количественные различия его у отдельных единиц совокупности, и выражает то общее, что присуще всем единицам изучаемой совокупности. Таким образом, через характеристику единицы совокупности она характеризует всю совокупность в целом. Важнейшим условием научного использования средних величин в статистическом анализе общественных явлений является однородность совокупности, для которой исчисляется средняя. Качественная однородность совокупности определяется на основе всестороннего теоретического анализа сущности явления. Так, например, при исчислении средней урожайности требуется, чтобы исходные данные относились к одной и той же культуре (средняя урожайность пшеницы) или группе культур (средняя урожайность зерновых). Нельзя вычислять среднюю для разнородных культур. Средние, полученные для неоднородных совокупностей, будут искажать характер изучаемого общественного явления, фальсифицировать его, или будут бессмысленными. Еще одним важным условием применения средних величин в анализе является достаточное количество единиц в совокупности, по которой рассчитывается среднее значение признака. Достаточность анализируемых единиц обеспечивается корректным определением границ исследуемой совокупности, т.е. закладывается еще на начальном этапе статистического исследования. Данное условие становится решающим при применении выборочного наблюдения, когда необходимо обеспечить репрезентативность выборки.

Определение максимального и минимального значения признака в изучаемой совокупности также является условием применения средней величины в анализе. В случае больших отклонений между крайними значениями и средней, необходимо проверить принадлежность экстремумов к исследуемой совокупности. Если сильная изменчивость признака вызвана случайными, кратковременными факторами, то, возможно, крайние значения не характерны для совокупности. Следовательно, их следует исключить из анализа, т.к. они оказывают влияние на размер средней величины. Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней, определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное, позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др. В статистике выделяют несколько видов средних величин:

1. По наличию признака-веса: а) невзвешенная средняя величина; б) взвешенная средняя величина.

2. По форме расчета: а) средняя арифметическая величина; б) средняя гармоническая величина;

в) средняя геометрическая величина; г) средняя квадратическая, кубическая и т.д. величины.

3. По охвату совокупности: а) групповая средняя величина; б) общая средняя величина. При расчете средних величин появилось понятие “вес ”. В качестве веса будет выступать стоимость основных производственных фондов и нормируемых оборотных средств, то есть понятие веса и частоты не всегда совпадают.

На практике из массы признаков необходимо выбрать один, который следует использовать в качестве веса. Выбор веса не следует понимать так, что всякий раз может быть несколько вариантов взвешивания. Вопрос должен быть решен таким образом, чтобы в результате взвешивания был бы обеспечен возврат к тем величинам, которые играли роль числителя при исчислении средней величины. Следовательно, при взвешивании средних величин в качестве весов должен быть взят знаменатель дроби, ибо только при умножении на то, на что раньше делили, мы вернемся к первоначальной величине.

Вариационный ряд представляет собой две колонки, в левой колонке приводятся значения варьирующего признака, именуемые вариантами и обозначаемые (x), а в правой – абсолютные числа, показывающие, сколько раз встречается каждый вариант. Показатели этой колонки называются частотами и обозначаются (f). Наряду со средними величинами в качестве статистических характеристик вариационных рядов распределения рассчитываются структурные средние – мода и медиана.
Мода (Mo) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой.
Медианой (Me) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности.
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины ∑|x i - Me|=min.

7.Структурные средние: мода, медиана, квартили и децили.

Мода – величина признака, которая чаще всего встречается в данной совокупности. Применительно к вариационному ряду модой является наиболее часто встречающееся значение ранжированного ряда. Она показывает размер признака, свойственный значительной части совокупности, и определяется по формуле:

где х0 – нижняя граница интервала;

h – величина интервала;

fm – частота интервала;

fm-1 – частота предшествующего интервала;

fm+1 – частота следующего интервала.

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой – больше.

Описательный характер медианы проявляется в том, что она характеризует количественную границу значений варьирующего признака, которыми обладает половина единиц совокупности.

При определении медианы в интервальных вариационных рядах сначала определяется интервал, в котором она находится (медианный интервал). Этот интервал характерен тем, что его накопленная сумма частот равна или превышает полусумму всех частот ряда. Расчет медианы интервального вариационного ряда производится по формуле:

Где х0 – нижняя граница интервала; h – величина интервала;

fm – частота интервала; f – число членов ряда; Sm- 1 – сумма накопленных членов ряда, предшествующих данному. Наряду с медианой для более полной характеристики структуры изучаемой совокупности применяют и другие значения вариантов, занимающих в ранжированном ряду вполне определенное положение. К ним относятся квартили и децили. Квартили делят ряд по сумме частот на четыре равные части, а децили – на десять равных частей. Квартилей насчитывается три, а децилей – девять. Медиана и мода в отличие от средней арифметической не погашают индивидуальных различий в значениях варьирующего признака и поэтому являются дополнительными и очень важными характеристика–ми статистической совокупности. На практике они часто используются вместо средней либо наряду с ней. Особенно целесообразно вычислять медиану и моду в тех случаях, когда изучаемая совокупность содержит некоторое количество единиц с очень большим или очень малым значением варьирующего признака.

8.Показатели вариации признака: размах вариации, среднее квадратическое отклонение, коэффициент вариации.

Для характеристики степени однородности изучаемой совокупности, степени колеблемости индивидуальных знаний признака от средней по всей совокупности применяются так называемые показатели вариации: размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и коэффициент вариации. Размах вариации - это разность между максимальным и минимальным значением признака по данной совокупности. Показывает лишь разницу между максимальным и минимальным значением изучаемого признака, не касаясь степени колеблемости (варьирования) признаков остальных единиц совокупности. Среднее линейное отклонение - это средняя арифметическая, полученная из абсолютных отклонений индивидуальных значений признака от средней арифметической по всей совокупности. Среднее квадратичное отклонение определяется путем извлечения корня квадратного, из суммы квадратов линейных отклонений, поделенных число индивидуальных значений признаков изучаемой совокупности. Коэффициент вариации:процентное отношение среднего квадратичного отклонения к средней арифметической.

Ряд распределения представляет собой простейшую группировку, в которой каждая выделяемая группа характеризуется только одним признаком .

В таблице 2 (только число банков) – малая выборка – простейший ряд.

Пример: с детьми, которых в разное время во дворе было: 9 10 11 8 8 9 9 11 11. Ранжируем от min к max и получаем:

Пример 2. : со студентами в аудитории.

Таблица 0

Распределение числа студентов группы 302

Число студентов (чел.)

Итого:

Статистический ряд распределения – это упорядоченный ряд распределения единиц совокупности на группы по определенному варьирующему признаку.

Выделяются 2 вида рядов:

1. атрибутивный

Например: таблица 0 Распределения числа студентов группы 302 по полу (женский, мужской), число, % (нумерация столбцов обязательна).

Строится по качественному признаку, которые не имеет числового выражения. Такие ряды характеризуют совокупность по изучаемому признаку.

2. вариационный

Построен по количественному признаку, причем признак располагается в порядке возрастания или убывания значения признака, т.е. ряд должен быть проранжирован.

Характеристики ряда распределения:

1. x – вариант(а) – это значение признака в вариационном ряду, т.е. те значения, которые принимает группировочный признак;

2. f – частота – показывает сколько раз в совокупности встречается данное значение признака.

Пример 3. : Дети гуляли во дворе. В определенное время их было: 9 10 11 8 8 9 9 11 11. Ранжируем ряд от меньшего к большему и увидим сколько раз встречается тот или иной вариант.

Сумма всех частот равна сумме элементов ряда

Иногда для характеристики ряда используют частости – частоты, выраженные в % или долях 1,0 .

В любом случае Wi – частоты = 100% или Wi – частоты = 1 доле.

(см. табл. 0: 83,3+16,7 = 100,0%)

(см. табл. 0: 0,83+0,17 = 1,00).

В зависимости от характера вариационного признака вариационные ряды подразделяются на дискретные и интервальные .

В дискретных рядах варианты представлены в виде целых чисел и их значения можно пересчитать.

Пример 4:

Таблица 4

Распределение семей по числу детей

Число детей в семье (чел.)

Количество семей (ед.)

S (накопленные частоты)

Итого:

Интервальный ряд – это ряд, в кот. значение признака выражен в виде интервалов.

В интервальных рядах признак может меняться непрерывно (от min к max), причем отличаются друг от друга на сколь угодно малую величину .

Интервальные ряды применяются в тех случаях, если значение признака меняются непрерывно, а также если дискретный признак меняется в очень широких пределах, т.е. число вариантов достаточно велико.

Правила построения рядов, выбор количества групп и величин интервалов также как и при группировке.

Таблица 5

Распределение сотрудников предприятия по размерам месячной заработной платы, руб.

Зарплата (руб.)

Число сотрудников (чел.)

Накопленные частоты

Итого:

Кроме частот используются накопленные частоты или накопленные частости.

Они определяются путем последовательного суммирования частот предшествующих интервалов и обозначаются S.

Накопительные частоты называются аккумулированными частотами , они показывают сколько элементов ряда имеют значение до определенного ряда.

Введение

С незапамятных времен человечество осуществляло учет многих сопутствующих его жизнедеятельности явлений и предметов и связанные с ним вычисления. Люди получали разносторонние, хотя и различающиеся полнотой на различных этапах общественного развития. Данные, учитывавшиеся повседневно в процессе принятия хозяйственных решений, а в обобщенном виде и на государственном уровне при определении русла экономической и социальной политики и характера внешнеполитической деятельности.

Руководствуясь соображениями зависимости благосостояния нации от величины создаваемого полезного продукта, интересов стратегической безопасности государств и народов от численности взрослого мужского населения, доходов казны от размера налогооблагаемых ресурсов и т. д., издавна отчетливо осознавалась и реализовывалась в форме различных учетных акций.

С учетом достижений экономической науки стал возможен расчет показателей, обобщенно характеризующих результаты воспроизводственного процесса на уровне общества: совокупного общественного продукта, национального дохода, валового национального продукта.

Всю перечисленную информацию в постоянно возрастающих объемах предоставляет обществу статистика, являющаяся необходимо принадлежностью государственного аппарата. Статистические данные, таким образом, способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.

Для статистического анализа данных в своей работе я использовала программу Excel (расчет формул и построение графиков).

Статистические ряды распределения, их значение и применение в статистике

В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения. В них известна численность единиц наблюдения в группах. Представленная в абсолютном и относительном выражении.

Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности на группы по определенному варьирующему признаку. Он характеризует состав (структуру) изучаемого явления, позволяет судить об однородности совокупности, закономерности распределения и границах варьирования единиц совокупности.

Статистические ряды подразделяются на:

Атрибутивные - это ряды, построенные по атрибутивным признакам, в порядке возрастания или убывания наблюдаемых знаний.

То есть качественным признакам, не имеющим числового выражения и характеризующим свойство, качество изучаемого социально-экономического явления.

Атрибутивные ряды распределения характеризуют состав совокупности по тем или иным существенным признакам.

Взятые за несколько периодов, эти данные позволяют исследовать изменение структуры.

Число групп атрибутивного ряда распределения адекватно числу градаций. Разновидностей атрибутивного признака.

Пример атрибутивного ряда распределения приведен в таблице 1.

Таблица 1. Распределение студентов 1-го курса по успеваемости

Элементами данного ряда распределения являются градации атрибутивного признака «Успеваемость» («успевают» - «не успевают») и численность каждой группы в абсолютном (человек) и относительном (%) выражении.

Студентов, сдавших экзамен по дисциплине, было 46 человек. Их удельный вес составил 92%.

Вариационные - это ряды, построенные по количественному признаку.

Вариационные ряды распределения состоят из двух элементов: вариантов и частот:

Варианты - это числовые значения количественного признака в вариационном ряду распределения. Они могут быть положительными и отрицательными, абсолютными и относительными. Так, при группировке предприятий по результатам хозяйственной деятельности варианты положительные - это прибыль, а отрицательные числа - это убыток.

Частоты - это численности отдельных вариантов или каждой группы вариационного ряда, т.е. это числа, показывающие, как часто встречаются те или иные варианты в ряду распределения. Сумма всех частот называется объемом совокупности и определяется числом элементов всей совокупности.

Частости - это частоты, выраженные в виде относительных величин (долях единиц или процентах). Сумма частостей равна единице или 100%. Замена частот частостями позволяет сопоставлять вариационные ряды с разным числом наблюдений.

Вариационные ряды в зависимости от характера вариации подразделяются на дискретные и интервальные.

Дискретный вариационный ряд распределения - это ряд, в котором группы составлены по признаку, изменяющемуся дискретно и принимающему только целые значения.

Пример дискретного вариационного ряда распределения приведен в таблице 2.

Таблица 2. Распределение студентов по экзаменационному баллу

В гр. 1 таблицы 2 представлены варианты дискретного вариационного ряда. В гр. 2 - частоты, а в гр. 3 - частости. В случае непрерывной вариации величина признака у единиц совокупности может принимать в определенным пределах любые значения. Отличающиеся друг от друга на сколь угодно малую величину.

Интервальный вариационный ряд распределения - это ряд, в котором группировочный признак, составляющий основание группировки, может принимать в определенном интервале любые значения, в том числе и дробные.

Интервальный ряд распределения целесообразно строить, прежде всего, при непрерывной вариации признака, а также, если дискретная вариация проявляется в широких пределах, т.е. число вариантов дискретного признака достаточно велико.

Правила и принципы построения интервальных рядов распределения аналогичны правилам и принципам построения статистических группировок. В случае, если интервальный вариационный ряд распределения построен с равными интервалами, частоты позволяют судить о степени заполнения интервала единицами совокупности. При построении неравных интервалов нельзя получить информацию о степени заполнения каждого интервала. С целью проведения сравнительного анализа заполненности интервалов определяется показатель, характеризующий плотность распределения. Это отношение числа единиц совокупности к ширине интервала.

Пример интервального вариационного рада распределения приведен в таблице 3.

Таблица 3. Распределение строительных фирм региона по среднесписочной численности работающих*

* - Цифры условные

Представленный ряд распределения является интервальным, в основании образования групп которого лежит непрерывный признак.

Анализ рядов распределения можно для наглядности проводить на основе их графического изображения. Для этой цели строят полигон, гистограмму, огиву и кумуляту распределения.

Расчетная часть задания № 5

Имеются выборочные данные (выборка 5%-я механическая) о среднегодовой стоимости основных производственных фондов и выпуске продукции предприятий отрасли экономики за отчетный период.

Таблица 4. Исходные данные

Выпуск продукции, млн. руб.

По исходным данным:

1. Постройте статистический ряд распределения предприятий по среднегодовой стоимости основных производственных фондов, образовав четыре группы предприятий с равными интервалами, охарактеризовав их числом предприятий и удельным весом предприятий.

2. Рассчитайте обобщающие показатели ряда распределения:

а) среднегодовую стоимость основных производственных фондов, взвешивая значения признака по абсолютной численности предприятий и их удельному весу;

б) моду и медиану;

в) постройте графики ряда распределения и определите на них значение моды и медианы.

Решение:

1. Сначала определяем длину интервала по формуле:

е=(х max - x min)/k,

где k - число групп в группировке (из условия k=4),

х max и x min - максимальное и минимальное значения ряда распределения,

е=(60 - 20)/4=10 млн. руб.

Затем определим нижнюю и верхнюю интервальные границы для каждой группы:

Номер группы

нижняя граница

верхняя граница

Составим рабочую таблицу 5, куда сведем исходные данные:

Таблица 5. Рабочая таблица

Группы пред-ий по среднегодовой стоимости ОПФ,

№ предпри-ятия

Среднегодовая стоимость ОПФ, млн. руб.

Выпуск продукции,

Рассчитаем характеристику ряда распределения по удельному весу предприятий по формуле:

где d - удельный вес предприятия;

f i - кол-во предприятий в группе;

F i - общее кол-во предприятий.

Подставляем данные в формулы. Полученные результаты заносим в итоговую таблицу 6.

Все формулы и расчеты таблицы 6 введены в программе Excel и даны в Приложении 1.

Таблица 6. Распределения предприятий по среднегодовой стоимости основных производственных фондов

Данная группировка показывает, что у наибольшей части данных предприятий (33,3%) среднегодовая стоимость основных производственных фондов составляет от 40 до 50 млн. руб.

2. а) Рассчитаем среднегодовую стоимость основных производственных фондов по формуле средней арифметической взвешенной, взвешивая значения по абсолютной численности предприятий:

и по удельному весу:

Для расчета средней из интервального ряда необходимо выразить варианты одним (дискретным) числом, это средняя арифметическая простая из верхнего и нижнего значений интервала:

Подставляем данные в формулы. Полученные результаты занесем в таблицу 7.

Все формулы и расчеты таблицы 7 введены в программе Excel и даны в Приложении 1.

Таблица 7. Расчет среднегодовой стоимости ОПФ

Показатели средних равны, что доказывает правильность расчетов. Среднегодовая стоимость ОПФ равна 41,333 млн. руб.

б) Рассчитаем моду и медиану данного ряда.

Мода - это значение признака, наиболее часто встречающееся в изучаемой совокупности. Для интервальных вариационных рядов распределения мода рассчитывается по формуле:

где x Mo - нижняя граница модального интервала;

i Mo - величина модального интервала;

f Mo - частота модального интервала;

f Mo-1 - частота интервала, предшествующего модальному;

f Mo+1 - частота интервала, следующего за модальным.

Первоначально по наибольшей частоте признака определим модальный интервал. Наибольшее число предприятий - 10 - среднегодовая стоимость основных производственных фондов в интервале 40 - 50 млн. руб., который и является модальным.

Подставляем данные в формулу.

Из расчета видно, что модальным значением стоимости ОПФ предприятий является стоимость равная 44 млн. руб.

Медиана - это вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части. Для интервальных вариационных рядов медиана рассчитывается по формуле:

где x Mе - нижняя граница медианного интервала;

i Mе - величина медианного интервала;

F - сумма частот ряда;

S Mе-1 - сумма накопленных частот ряда, предшествующих медианному интервалу;

f Mе - частота медианного интервала.

Определяем медианный интервал, в котором находится порядковый номер медианы. Для этого подсчитаем сумму частот накопленным итогом до числа, превышающего половину объема совокупности (30/2 = 15). Полученные данные заносим в расчетную таблицу 8.

Таблица 8. Расчет медианны

В графе «Сумма накопленных частот» значение 23 соответствует интервалу 40 - 50. Это и есть медианный интервал, в котором находится медиана.

Подставляем данные в формулу.

Из расчета видно, что у половины предприятий среднегодовая стоимость основных производственных фондов до 42 млн. руб., а у другой половина - выше этой суммы.

в) Построим графики данного ряда распределения по полученным данным:

Рис. 1.

Медиана

Рис. 2. Кумулята распределения предприятий по среднегодовой стоимости ОПФ

Особую форму группировки данных представляют так называемые статистические ряды, или числовые значения признака, расположенного в определенном порядке. В зависимости от того, какие признаки изучаются, статистические ряды делят на атрибутивные, вариационные, ряды динамики, регрессии, ряды ранжированных значений признаков и ряды накопленных частот. Наиболее часто в психологии используются вариационные ряды, ряды регрессии и ряды ранжированных значений признаков.

Вариационным рядом распределения называют двойной ряд чисел, показывающий, каким образом числовые значения признака связаны с их повторяемостью в данной выборке. Например, психолог провел тестирование интеллекта по тесту Векслера у 25 школьников, и сырые баллы по второму субтесту оказались следующими: 6, 9, 5, 7, 10, 8, 9, 10, 8, 11, 9, 12, 9, 8, 10, 11, 9, 10, 8, 10, 7, 9, 10, 9, 11. Как видим, некоторые цифры попадаются в данном ряду по несколько раз. Следовательно, учитывая число повторений, данные ряд можно представить в более удобной, компактной форме:

Это и есть вариационный ряд. Числа, показывающие, сколько раз отдельные варианты встречаются в данной совокупности, называются частотами, или весами, вариант. Они обозначаются строчной буквой латинского алфавита.f i и имеют индекс “i”, соответствующий номеру переменной в вариационном ряду.

Процентное представление частот полезно в тех случаях, когда приходится сравнивать вариационные ряды, сильно различающиеся по объемам. Например, при тестировании школьной готовности детей города, поселка городского типа и села были обследованы выборки детей численностью 1000, 300 и 100 человека соответственно. Различие в объемах выборок очевидно. Поэтому сравнение результатов тестирования лучше проводить, используя проценты частот.

Приведенный выше ряд (3.1) можно представить по другому. Если элементы ряда расположить в возрастающем порядке, то получится так называемый ранжированный вариационный ряд:

Подобная форма представления (3.3) более предпочтительна, чем (3.1), поскольку лучше иллюстрирует закономерность варьирования признака.

Частоты, характеризующие ранжированный вариационный ряд, можно складывать, или накапливать. Накопленные частоты получаются последовательным суммированием значений частот от первой частоты до последней.

В качестве примера вновь обратимся к ряду 3.3. Преобразуем его в ряд 3.4 в котором введем дополнительную строчку и назовем ее «кумуляты частот»:

Рассмотрим подробно как получилась последняя строчка. В начале ряда частот стоит 1. В кумулятивном ряду на втором месте стоит 2 - это сумма первой и второй частоты, т.е. 1 + 1, на третьем месте стоит 4 это сумма второй (уже накопленной частоты) и третьей частоты, т.е. 2 + 2, на четвертом 8 = 4 + 4 и т.д.


Размах (иногда эту величину называют разбросом) выборки обозначается буквой R. Это самый простой показатель, который можно получить для выборки - разность между максимальной и минимальной величинами данного конкретного вариационного ряда, т.е.

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.

Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный. Например, даны две выборки:

При равенстве средних и разбросов для этих двух выборочных рядов характер их варьирования различен. Для того чтобы более четко представлять характер варьирования выборок, следует обратиться к их распределениям.

Таблицы и графики распределения частот

Как правило, анализ данных начинается с изучения того, как часто встречаются те или иные значения интересующего исследователя признака (переменной) в имеющемся множестве наблюдений. Для этого строятся таблицы и графики распределения частот. Нередко они являются основой для получения ценных содержательных выводов исследования.

Если признак принимает всего лишь несколько возможных значений (до 10-15), то таблица распределения частот показывает частоту встречаемости каждого значения признака. Если указывается, сколько раз встречается каждое значение признака, то это - таблица абсолютных частот распределения, если указывается доля наблюдений, приходящихся на то или иное значение признака, то говорят об относительных частотах распределения.

Во многих случаях признак может принимать множество различных значений, например, если мы измеряем время решения тестовой задачи. В этом случае о распределении признака позволяет судить таблица сгруппированных частот, в которых частоты группируются по разрядам или интервалам значений признака.

Еще одной разновидностью таблиц распределения являются таблицы распределения накопленных частот. Они показывают, как накапливаются частоты по мере возрастания значений признака. Напротив каждого значения (интервала) указывается сумма частот встречаемости всех тех наблюдений, величина признака у которых не превышает данного значения (меньше верхней границы данного интервала). Накопленные частоты содержатся в правых столбцах табл. 3.2 и 3.3.

Для более наглядного представления строится график распределения частот или график накопленных частот - гистограмма или сглаженная кривая распределения.

Гистограмма распределения частот - это столбиковая диаграмма, каждый столбец которой опирается на конкретное значение признака или разрядный интервал (для сгруппированных частот). Высота столбика пропорциональна частоте встречаемости соответствующего значения. На рис. 3.1 изображена гистограмма распределения частот для примера из табл. 3.2.

Гистограмма накошенных частот отличается от гистограммы распределения тем, что высота каждого столбика пропорциональна частоте, накопленной к данному значению (интервалу). На рис. 3.2 изображена гистограмма накопленных частот для данных табл. 3.2.

Построение полигона распределения частот напоминает построение гистограммы. В гистограмме вершина каждого столбца, соответствующая частоте встречаемости данного значения (интервала) признака, - отрезок прямой. А для полигона отмечается точка, соответствующая середине этого отрезка. Далее все точки соединяются ломаной линией (рис. 3.3). Вместо гистограммы или полигона часто изображают сглаженную кривую распределения частот. На рис. 3.4 изображена гистограмма распределения для примера из табл. 3.3 (столбики) и сглаженная кривая того же распределения частот.

Таблицы и графики распределения частот дают важную предварительную информацию о форме распределения признака: о том, какие значения встречаются реже, а какие чаще, насколько выражена изменчивость признака. Обычно выделяют следующие типичные формы распределения. Равномерное распределение – когда все значения встречаются одинаково (или почти одинаково) часто. Симметричное распределение - когда одинаково часто встречаются крайние значения. Нормальное распределение - симметричное распределение, у которого крайние значения встречаются редко и частота постепенно повышается от крайних к серединным значениям признака. Асимметричные распределения - левосторонние (с преобладанием частот малых значений), правосторонние (с преобладанием частот больших значений).

Уже сами по себе таблицы и графики распределения признака позволяют делать некоторые содержательные выводы при сравнении групп испытуемых между собой. Сравнивая распределения, мы можем не только судить о том, какие значения встречаются чаще в той или иной группе, но и сравнивать группы по степени выраженности индивидуальных различий - изменчивости по данному признаку.

Таблицы и графики накопленных частот позволяют быстро получить дополнительную информацию о том, сколько испытуемых (или какая их доля) имеют выраженность признака не выше определенного значения.

Раздел 4. Описательные статистики
(Статистическое распределение и его числовые характеристики)

Переменная может принимать много значений. На начальном этапе обработки данных вместо того, чтобы рассматривать все значения переменной, рекомендуется проанализировать т. к. описательные статистики. Они дают общее представление о значениях или разбросе значений, которые принимает переменная.

К первичным описательным статистикам (Descriptive Statistics) обычно относят числовые характеристики распределения измеренного на выборке признака. Каждая такая характеристика отражает в одном числовом значении свойство распределения множества результатов измерения: с точки зрения их расположения на числовой оси либо с точки зрения их изменчивости. Основное назначение каждой из первичных описательных статистик - замена множества значений признака, измеренного на выборке, одним числом (например, средним значением как мерой центральной тенденции). Компактное описание группы при помощи первичных статистик позволяет интерпретировать результаты измерений, в частности, путем сравнения первичных статистик разных групп.