Средняя величина - это обобщающая характеристика совокупности однотипных явлений по изучаемому признака.

Выбор средней определяется экономическим содержанием определенного показателя и исходных данных. В каждом конкретном случае применяется одна из средних величин:

Арифметическая

Гармоническая

Квадратичная

Геометрическая

Каждая из них может быть простой и взвешенной. Перечисленные средние относятся к классу степенных средних и определяются формулой (при различных значениях m):

При m = -1 средняя гармоническая;

m = 0 средняя геометрическая

m = 1 средняя арифметическая;

m = 2 средняя квадратическая;

Средняя арифметическая простая - это самая часто используемая средняя величина, которая получается, если подставить в общую формулу m=1. Средняя арифметическая простая имеет следующий вид:

где X - значения величин, для которых необходимо рассчитать среднее значение; N - общее количество значений X (число единиц в изучаемой совокупности).

Средняя арифметическая взвешенная вычисляется когда варианты встречаются не одинаковое число раз.

Число одинаковых значений и признаков в рядах распределения называется частотой или весом (f). Средняя арифметическая взвешенная имеет следующий вид:

Для вычисления средней арифметической взвешенной необходимо:

Каждую варианту умножить на вес признака (x*f)

Найти сумму этих произведений

Сумму произведений вариант

Средняя гармоническая простая применяется в тех случаях, когда вес каждого варианта =1, и когда индивидуальное значение обратного признака встречается по 1 разу. Средняя гармоническая простая обратная средней арифметической из обратных значений признака.

Средняя гармоническая простая применяется для расчета средней трудоемкости и средней производительности труда.

Средняя гармоническая взвешенная применятся, когда статистическая информация не содержит частой по отдельным вариантам совокупности, а представлена как их произведение, и когда имеются данные об индивидуальных значениях признака и общем объеме совокупности, но неизвестны частоты.

Средняя квадратическая простая применяется для расчета среднего диаметра стволов деревьев, клубней, труб и т.д. Т.е. она применятся для обобщения признаков, выраженных линейными мерами каких-либо площадей. Средняя квадратическая простая определяется путем деления суммы квадратов отдельных значений признаков на их число и извлечение из полученного частного квадратного корня.

Средняя квадратическая взвешенная применяется в том случае, если будет частота повторения признака.

Средняя геометрическая простая применяется в тех случаях, когда индивидуальное значение признака представляет собой относительные величины динамики. Вычисляется путем извлечения корня степени n из произведений отдельных значений признака.

Модой называется наиболее часто встречающаяся величинв признака. Определение моды зависит от того, в каком ряду представлен вальрирующий признак, если вальрирующий признак представлен в в идее дискретного ряда распределения, то для определения моды не требуется никаких вычислений. В таком ряду модой будет то значение признака, которое обладает наибольшей частотой. Если значение признака представлены в виде интервального вида, то мода определяется:

где Мо - мода;

ХНМо - нижняя граница модального интервала

;hМо - размах модального интервала (разность между его верхней и нижней границей);

fМо - частота модальноого интервала;

fМо-1 - частота интервала, предшествующего модальному;

fМо+1 - частота интервала, следующего за модальным.

Медианой называется варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда. А если упорядоченный ряд состоит из четного числа членов, то медианой будет средняя арифметическая двух вариант, расположенных в середине ряда. Медиану для интервального вариационного ряда рассчитывают:

где Ме - медиана;

НМе - нижняя граница медианного интервала;

hМе - размах медианного интервала;

fМе - частота медианного интервала;

fМе-1 - сумма частот интервалов, предшествующих медианному.

Показатели вариаций- отклонение индивидуальных показателей от средней величины.

Существуют следующие показатели вариаций:

Размах вариации или лимит изменчивости

Среднее линейное отклонение

Дисперсия

Среднее квадратическое отклонение

Коэффициент вариации

Размах вариации- разность между наибольшим и наименьшим значением вальрирующего признака.

Размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариантов в ряду.

Среднее линейное отклонение- сумма отклонений каждой варианты от своей средней арифметической без учета знака, деленная на число вариант. Существует простое и взвешенное.

Среднее линейное отклонение дает лишь приближенную характеристику вариации.

Дисперсия- среднее арифметическое квадратов отклонений каждого значения признака от общей средней.

Для расчета простой дисперсии находят отклонения каждой варианты от средней, затем отклонения возводят в квадрат, суммируют и делят на число вариант.

Простая дисперсия:

Взвешенная:

Среднее квадратическое отклонение- корень квадратный из дисперсии.

Среднее квадратическое отклонение обладает большей степенью точности и находит применение при любом анализе статистических совокупностей. Чем меньше значение дисперсии и среднего квадратического отклонения, тем однороднее совокупность и тем более типичней будет средняя величина.

Коэффициент вариаций- относительная мера изменчивости признака. % отношение среднего квадратического отклонения к средней арифметической.

Чем больше коэффициент вариации, тем больше разброс значений признака вокруг средней, тем менее однородней совокупность по своему составу. Совокупность считается количественно однородной, если коэффициент вариаций не превышает 33%.

1. Сущность и значение средних величин

2. Виды средних величин

2.1. Степенные средние

2.2. Структурные средние

3. Понятие и показатели вариации

Средняя величина – обобщающий показатель, характеризующий типичный уровень варьирующего (изменяющегося) признака в конкретных условиях места и времени.

Средняя величина всегда именованная, она имеет ту же размерность, что и признак у отдельных единиц совокупности.

Отличительной особенностью средних величин является то, что в них сглаживаются индивидуальные различия признака у отдельных единиц совокупности, в результате чего появляется возможность охарактеризовать общие черты и свойства массовых экономических явлений. Вместе с тем средние показатели иногда приводят к необъективным выводам при проведении экономико-статистического анализа, так как они игнорируют те различия в количественных признаках отдельных единиц совокупности, которые реально существуют и могут представлять самостоятельный интерес.

Принципы применения средних величин:

1. Для расчета средних величин должны быть использованы массовые данные. В средней величине, рассчитанной на основе данных о большом числе единиц (массовых данных)колебания в величине признака, вызванные случайными причинами сглаживаются и проявляется типичный размер признака для всей совокупности.

2. Средние величины рассчитываются по однородным совокупностям. Для получения однородной совокупности необходима группировка данных, поэтому расчет средней величины должен сочетаться с методом группировки. Если исследуемое явление не является однородным, то его разбивают на группы, содержащие только однородные элементы. Для такого явления рассчитываются сначала средние по группам, которые называются групповые средние, они выражают наиболее типичную величину явления в каждой группе. Затем рассчитывается для всех групп общая средняя величина, характеризующая явление в целом. Она определяется как среднее значение из групповых средних, взвешенных по числу элементов совокупности, включенных в каждую группу.

На практике безусловное выполнение данного условия повлекло бы за собой ограничение возможностей статистического анализа общественных процессов, поэтому часто средние величины рассчитываются по неоднородным явлениям (например, средняя ЗП по Брянской области)

3. Общие средние величины должны подкрепляться групповыми средними, характеризующими части совокупности. Это обусловлено тем, что за средними показателями скрываются особенности различных частей изучаемой совокупности (например, средняя ЗП в каждом районе Брянской области).

4. Определение максимального и минимального значения признака в изучаемой совокупности. В случае больших отклонений между крайними значениями и средним необходимо проверить принадлежность экстремумов к исследуемой совокупности. Если сильная изменчивость признака вызвана случайными кратковременными факторами, то, возможно, крайние значения не характерны для совокупности, следовательно, их необходимо исключить из анализа, так как они оказывают влияние на размер средней величины (например, многие данные по Москве существенно отличаются от общероссийских).



Средние величины делятся на два класса: степенные средние и структурные средние

Степенные средние в зависимости от представления исходных данных рассчитываются в двух формах: простой и взвешенной. Простая средняя рассчитывается по не сгруппированным данным, а взвешаная средняя рассчитывается по сгруппированным данным, представленным в виде интервальных или дискретных рядов распределения.

Виды степенных средних.

Формулы расчета степенных средних величин смори в раздатке.

Средняя арифметическая простая применяется, когда количество вариантов по конкретному признаку встречается по одному или одинаковому числу раз.

Пример 1 . Имеются след данные о ЗП рабочих участка за сентябрь. Вычислить среднюю ЗП рабочих участка за сентябрь.

Решение: что требуется усреднить, то и признак – Х; f=1 (частота) для каждого значения признака, так как ничего не повторяется. Каждое значение признака (ЗП) встречается только один раз, поэтому применим формулу средней арифметической простой: x ср =(11700+11208+…+10870)/10=11366,5 руб.

Средняя арифметическая взвешаная применяется при условии повторения признака неодинаковое число раз.

Пример 2. Имеется распределение рабочих участка по величине ЗП за сентябрь.

Решение: Х – заработная плата; число рабочих – частота признака – f. Так как имеются повторяющиеся с разной частотой значения признака, применим формулу средней арифметической взвешенной: x ср =(10250*2+10750*6+11125*15+11575*7)/(2+6+15+7)=11097 руб.

Расчет средних величин по результатам группировки.

Часто исходные данные для анализа бывают представлены в сгруппированном виде – когда для каждого значения осредняемого Х сообщается частота его повторения. В этих случаях средняя величина рассчитывается по обычным формулам средних взвешенных (пример 2). Сложности возникают, когда в сгруппированных данных указывается не конкретное значение признака Х по каждой группе, а лишь интервал его изменения (пример 3). В данном случае правильный расчет общей средней величины возможен, если от интервалов перейти к их серединам. Таким образом, расчет средней арифметической делают по формуле: =(∑ i *f i)/∑f i , i =x min +((x max -x min)/2), где x max – верхняя граница, x min – нижняя граница. При этом величины открытых интервалов (первого и последнего) условно приравниваются к величинам интервалов, примыкающих к ним (второго и предпоследнего).

Расчет среднего значения по данным группировки требует особого внимания при выборе взвевающего показателя (частоты). Часто величины f i – частоты повторения признака х – в исходных данных либо отсутствуют, либо не совсем очевидны.

Пример 3 : имеются след данные:

Определить среднюю себестоимость изделия.

Решение: себестоимость единицы – Х, частота повторений – если с определением серединного интервала сложностей не возникает i =x min +((x max -x min)/2); 1 =110+ =112,5; 2 =115+ =117,5; 3 =122,5; 4 =127,5, то при выборе взвешивающего показателя типичной ошибкой является выбор признака «Число предприятий»; умножения себестоимости одного изделия на число предприятий экономического смысла не имеет, тогда как умножение себестоимости одного изделия на объем продукции дает реальную экономическую величину–общую сумму затрат. Таким образом, в качестве взвешивающего показателя следует взять объем продукции (четвертый столбец – f).

Тогда средняя себестоимость изделия будет равна: = . = =123,15 руб.

Средняя гармоническая – величина, обратная средней арифметической. Средняя гармоническая простая рассчитывается, если имеются похожие объекты различные по какому либо признаку.

Пример 4: два автомобиля работают на одной марке бензина. Первый автомобиль имеет удельный расход 0,05 л/км, второй 0,08 л/км. Определить средний удельный расход бензина по двум автомобилям.

Решение: = .

Средняя гармоническая взвешенная рассчитывается в случае, если по условию дано произведение признака на частоту (x*f).

Пример 5 : определить среднюю продолжительность рабочего дня на предприятии по данным таблицы.

Решение: признак – средняя фактическая продолжительность, третий столбец – x*f. = .

Средняя геометрическая: применяется в основном простая для определения среднего коэффициента роста.

Годы Производство продукции, тыс. руб. Коэффициенты роста, цепные
-
1,081
1,05

Решение: для 2009 КР не будет (не с чем сравнивать); для 2010: 400/370=1,081; для 2011: 420/400=1,05. Условные обозначения: x – третий столбец. =

Средняя квадратическая применяется для расчета среднего квадратического отклонения, являющегося показателем вариации признаков, а также в технике и, например, при сооружении трубопроводов.

Пример 7: подача жидкого топлива для технологического процесса осуществляется в цехе тремя трубопроводами с диаметром 2, 5 и 6 см. При капитальном ремонте здания цеха эти трубопроводы будут заменены на три новых, одинакового диаметра при сохранении их общей пропускной способности. Определить средний диаметр трубы (диаметр новой трубы).

Решение: определяющий показатель пропускной способности труб – их радиус. = . Д=2 ч=4,66 см.

Резюме: значения степенных средних, рассчитанных на основе одних и тех же индивидуальных значений признака при разных показателях степени, не одинаковы. Чем выше степень средней, тем больше величина самой средней – правило мажорантности средних.

Мода – числовое значение признака, которое наиболее часто встречается в ряду распределения. Может определяться по несгруппированным данным, а также для дискретного и интервального ряда распределения.

Расчет моды по несгруппированным данным

Пример 8: известно, что семь сотрудников отдела кадров имеет след стаж работы, лет: 5, 2, 4, 3, 4, 2, 2.

Решение: ранжируем исходные данные: 2,2,2,3,4,4,5. Так как чаще всего встречается стаж работы два года, он является модальным.

Расчет моды по дискретному ряду распределения:

Особенности применения моды для дискретного ряда:

1. Если все значения вариационного ряда имеют одинаковую частоту, то этот вариационный ряд не имеет моды

2. Если два соседних варианта имеют одинаковую наибольшую частоту, то мода рассчитывается как среднее арифметическое из этих вариантов

3. Если два не соседних варианта имеют одинаковую наибольшую частоту, то вариационный ряд называется бимодальным

4. Если таких вариантов более двух, то ряд полимодальный

Пример 9: имеется ряд распределения рабочих по выработке деталей:

Определить моду.

Решение: вводим условные обозначения: выработка – признак, частота – число рабочих. Поскольку наибольшее число рабочих (5 человек) имеют выработку 20 деталей, мода равна 20.

Расчет моды по интервальному ряду распределения

Для интервальных рядов распределения мода рассчитывается по формуле: , где i – величина модального интервала, fм – частота модального интервала, fм-1 – частота интервала предшествующего модальному, fм+1 – частота интервала след за модальным.

Пример 10: имеются предприятия региона, распределенные на группы по стоимости основных производственных фондов. Определить моду.

Решение: признак – группы ОПФ, число предприятий – частота повторений признака. Модальный интервал 18-20, так как для него характерно наибольшая частота (10 предприятий). млн. руб.. Вывод: предприятие, имеющее величину ОПФ в размере 18,8 млн. руб., представляют собой наибольшую группу в общем объеме рассматриваемых предприятий.

На практике мода иногда используется вместо средней арифметической или вместе с ней, например, при определении наиболее ходовых размеров одежды и обуви, что учитывается при планировании их производства.

Медиана – это величина признака, которое делит упорядоченную последовательность его значений на две равные по численности части. Рассчитывается по несгруппированным данным, а также для дискретного и интервального ряда.

Расчет медианы по несгруппированным данным

В начале для определения медианы необходимо провести ранжирование (упорядочение). Если ряд состоит из нечетного количества вариантов, место медианы определяется по формуле: , где n – количество единиц совокупности. Для четного ряда медиана рассчитывается как средняя арифметическая простая из двух значений, находящихся в середине ряда.

Пример 11: по условию примера 8 найти медиану.

Решение: проведем ранжирование исходных данных: 2 2 2 3 4 4 5. Ряд нечетный, потому что семь элементов, поэтому место медианы. Медианный стаж 3 года, то есть половина работников имеют стаж менее трех лет, другая половина – более трех лет.

Расчет медианы по дискретному и интервальному ряду распределения:

Алгоритм нахождения медианы для дискретного ряда (медианного интервала для интервального ряда):

1. Определяем общую сумму и полусумму частот

2. Для каждого значения признака (интервала) определяем сумму накопленных частот

3. Медианным будет то значение признака (тот интервал), для которого сумма накопленных частот впервые будет равна или превысит их полусумму.

Для интервального ряда медиана рассчитывается по формуле . где Sм-1 – сумма частот накопленная до начала медианного интервала, fм – частота медианного интервала.

Пример 12: по данным примера 9 найти медиану.

Решение:

1. Определяем сумму частот – 15.полусумма – 7,5

2. Смотри в таблице (третий столбец)

3. Медианой является то значение признака, для которого сумма накопленных частот впервые будет равно или превысит полусумму (11>7,5)

Вывод: таким образом, медиана равна 20 деталей (первый столбец), то есть половина рабочих имеют выработку более 20 деталей, другая половина менее 20 деталей.

Пример 13: по данным примера 10 найти медиану.

Решение:

1. Определяем сумму частот – 25, полусумма – 12,5

2. Смотри третий столбец примера 10

3. Медиана находится в том интервале, в котором сумма накопленных частот впервые будет равна или превысит полусумму (18>12,5)

Таким образом, медианный интервал 18-20. Применим формулу: млн. руб.

Медиана всегда лежит в медианном интервале!

Вывод: половина предприятий имеют стоимость ОПФ менее 18,9 млн. руб., остальные – более 18,9 млн. руб.

Медиана используется при распределении семей по величине дохода, при проектировании оптимального положения остановок общественного транспорта, складских помещений и т.д.

Мода и медиана имеют преимущество перед средней арифметической для ряда распределения с открытыми интервалами.

Для исследования колеблемости средней величины в статистике возникает необходимость изучения признаков вариации ее измерения.

Вариация – это несовпадение уровней одного и того же признака у разных объектов, принадлежащих одной совокупности (например, вариация оценок по дисциплине ЭПП в группе 11-ПИ).

Вариацией называется изменчивость только тех явлений, на которые воздействуют внешние факторы и причины. Тогда, как о явлениях, изменяющихся в силу своей внутренней природы, нельзя говорить. Что они подвержены вариации (например, рост отдельного человека, меняющийся в течение жизни. Изучение изменчивости роста, который. Допустим, к году составляет 0,8 метра, а к 20 годам 1,79 метра, путем расчета среднего роста будет некорректным, так как в начале жизни рост был небольшой в силу естественных причин).

Не следует путать с вариацией изменения размера признака по одной и той же единице совокупности, наблюдаемой в разные моменты или периоды времени. Такое изменение называется изменение во времени или динамикой явления и исследуется с помощью специальных методов.

Задачи исследования вариации в статистике

1. Выявление изменчивости размеров явления дает возможность оценить степень зависимости изучаемого явления от других факторов в свою очередь подверженных изменчивости, то есть оценить степень устойчивости явления к внешним воздействиям

2. Вариация предполагает оценку однородности изучаемого явления, то есть меру типичности, рассчитанной для этого явления статистической величины (прежде всего средней)

3. Вариация и методы ее исследования имеют важнейшее значение в изучении явлений, протекающих в обществе. Одной из главных проблем исследования общественных явлений и процессов является высокий уровень их изменчивости, так как участниками общественных процессов выступают люди, обладающие различными системами ценностей и интересов

Вариация измеряется при помощи абсолютных показателей (размах вариации, среднее линейное отклонение, среднее квадратическое отклонение и дисперсия) и относительных показателей (коэффициент вариации).

Размах вариации определяется как разница между максимальным и минимальным значением признака: R=Xmax-Xmin.

Пример 14 . Определить средний размер страховых выплатах за год по договорам страхования от несчастных случаев. Проанализировать вариацию данных.

Х=(5*11+6*17+7*23+8*30+9*18)/99=7,3 тыс. руб

R=9-5=4 тыс. руб.

Среднее линейное отклонение точнее характеризует колеблемость и представляет собой среднюю арифметическую из абсолютных значений отклонений отдельных вариантов от их средней арифметической. Рассчитывается как простое (для дискретных рядов), так и взвешенное (для интервальных).

где Xi - значение варианта;

X - среднее значение признака;

Fi – частота повторения призака;

n - число вариантов.

d= (I(5-7,3)*11+(6-7,3)*17+(7-7,3)*23+(8-7,3)*30+(9-7,3)*18I)/99=1,07 тыс. руб.

Дисперсия – среднее квадратическое отклонение в квадрате.

Среднее квадратическое отклонение – показывает, на сколько в среднем отклоняются конкретные варианты от их среднего значения.

Т.о. страховые выплаты отклонялись от их среднего размера в среднем на 1,25 тыс. руб.

Коэффициент вариации – наиболее часто применяемый показатель колеблемости относительно среднего значения, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.

V=1,25/7,3*100%=17,1% (совокупность по рассматриваемому признаку можно считать однородной).


Рисуем этот столбец сами, расчет тоже производим сами

П - произведение

Мода всегда лежит в модальном интервале

В статистике средней величиной называют обобщающий показатель совокупности однородных общественных или природных явлений, который показывает типичный уровень варьирующего признака в расчете на единицу совокупности в конкретный момент времени.

Нахождение среднего - один из распространенных приемов обобщения. Средняя величина отражает то общее, что типично (характерно) для всех единиц изучаемой совокупности, но в то же время она игнорирует различия отдельных единиц. Мы уже говорили, что при неограниченном увеличении количества наблюдений (п -» оо) средняя величина, согласно закону больших чисел, будет неограниченно приближаться к его математическому ожиданию, т. е. при п -> оо можно записать х ~ М[Х], здесь х - средняя величина. То есть средняя величина - это оценка математического ожидания.

Сделаем небольшое отступление и приведем краткие сведения об оценках параметров, полученных в результате п опытов. Предположим, что надо определить по результатам п опытов некоторый параметр d. Приближенное значение этого параметра будем называть его оценкой и обозначим d. Оценка d должна удовлетворять ряду требований, чтобы в каком-то смысле быть оценкой “доброкачественной”.

Оценка d при увеличении числа опытов должна сходиться по вероятности к искомому параметру, т. е.

Оценка, обладающая таким свойством, называется состоятельной.

Кроме того, пользуясь оценкой d вместо самого параметра d, желательно не делать систематической ошибки, т. е. математическое ожидание оценки должно быть равным самому параметру:

Оценка, которая обладает данным свойством, называется несмещенной.

Было бы хорошо, если бы выбранная несмещенная оценка d была как можно менее случайной, т. е. обладала по сравнению с другими минимальной дисперсией:

Оценка, которая обладает данным свойством, называется эффективной.

В реальных условиях не всегда удается удовлетворить всем перечисленным требованиям. Тем не менее при выборе оценки любого параметра желательно эту оценку рассмотреть со всех перечисленных точек зрения.

Вернемся к средним величинам. При их вычислении при большом количестве наблюдений случайности взаимопога- шаются (это следует из закона больших чисел), следовательно, можно абстрагироваться от несущественных особенностей изучаемого явления и от количественных значений признака в каждом конкретном опыте.

Крупный вклад в обоснование и развитие теории средних величин внес А. Кетле. Согласно его учению массовые процессы формируются под влиянием двух групп причин. К первой группе общих для всех единиц массовой совокупности причин относятся те из них, которые определяют состояние массового процесса. Они формируют типичный уровень для единиц данной однородной совокупности.

Вторая группа причин формирует специфические особенности отдельных единиц массовой совокупности и, следовательно, их разброс от типичного уровня.

Эти причины не связаны с природой изучаемого явления, поэтому их называют случайными причинами.

Средняя величина, полученная по всей совокупности, называется общей, а средние величины, вычисленные по каждой группе, называются групповыми средними. Есть два вида средних величин: степенные средние (средняя арифметическая и др.), структурные средние (мода, медиана).

Рассмотрим степенные средние. Степенные средние определяются исходя из формулы

где х - среднее значение;

х { - текущее значение изучаемого признака;

т - показатель степени средней;

п - количество признаков (вариант).

В зависимости от показателя т степени средней получаем следующие виды степенных средних:

  • - среднюю гармоническую х гар, если т = -1;
  • - среднюю геометрическую эс геом, если т = 0;
  • - среднюю арифметическую х ар, если т = 1;
  • - среднюю квадратическую х квад, если т = 2;
  • - среднюю кубическую х куб., если т = 3,
  • - ИТ. д.

При использовании одних и тех же данных чем больше т в формуле (6.4), тем больше значение средней, т. е.

Приведем конкретные формулы для вычисления некоторых видов степенных средних.

При т = -1 получаем среднюю гармоническую:

В том случае, если исходные данные сгруппированы, используются взвешенные средние. В качестве веса может использоваться частота р (количество опытов, в которых появилось интересующее нас событие) или относительная частота

Запишем формулы для взвешенной средней гармонической:

При т = 0 получаем среднюю геометрическую:

т. е. получили неопределенность.

Для ее раскрытия прологарифмируем обе части формулы (6.4.)

затем подставляем т = 0 и получаем

т. е. имеем неопределенность вида Для раскрытия этой неопределенности применяем правило Лопиталя. Полученный результат потенцируется, и окончательно получаем

Широкое применение средняя геометрическая получила для нахождения средних темпов изменения в рядах динамики и в рядах распределения.

Запишем формулы для взвешенной средней геометрической.

Приведем конкретный пример нахождения средней геометрической взвешенной по формуле (6.11).

Пример 6.1

Исходные данные наблюдений приведены в табл. 6.1.

Таблица 6.1

В табл. 6.1 х. - результаты, принятые некоторой случайной величиной X в г-м опыте; р. - частота события - показывает, сколько раз в результате всех опытов появилось интересующее нас событие. Например, х = 2 появилось в 24 опытах 5 раз.

Относительная частота события (частость).

По формуле (6.11) получаем:

По формуле (6.12) имеем

При т = 1 получаем среднюю арифметическую:

Средняя арифметическая - наиболее распределенный вид среди всех видов степенных средних. Она используется в тех случаях, когда объем варьирующего признака для всей совокупности является суммой значений признаков отдельных единиц.

Приведем формулы для нахождения средней арифметической взвешенной:

При большом количестве наблюдений, согласно закону больших чисел, формула (6.15) определяет оценку математического ожидания т. е.

При т = 2 получаем среднюю квадратическую:

Она используется для вычисления среднего размера признака, выраженного в квадратных единицах.

Формулы для нахождения средней квадратической взвешенной имеют вид:

При га = 3 получаем среднюю кубическую:

Она применяется для нахождения среднего размера признака, выраженного в кубических единицах.

Формулы для вычисления средней кубической взвешенной имеют вид:

Теперь рассмотрим структурные средние: моду и медиану. В статистике, в отличие от теории вероятностей, имеем дело с оценками этих величин. Мы будем обозначать их теми же буквами, что и в главе 2, но с тильдой.

Мода в статистике (Мо) - значение случайной величины, которое встречается в статистическом ряду распределения чаще всего, т. е. имеет наибольшую частоту или относительную частоту (частость).

Например, в табл. 6.1 наибольшая относительная частота / = 0,33, поэтому мода равна Мо = 5.

Если мы имеем группированный ряд распределения с равными интервалами, то моду можно найти по формуле

где Мо нижн - нижняя граница модального интервала;

г Мо - длина модального интервала;

Рмо - частота модального интервала;

М-мо_, - частота интервала, предшествующего модальному;

М-мо +1 -- частота интервала, следующего за модальным.

Заметим, что для расчета можно использовать и относительные частоты.

Медиана в статистике - варианта, которая находится в середине ранжированного ряда распределения, т. е. значение медианы находиться по ее порядковому номеру.

Если ряд распределения имеет нечетное число элементов, номер медианы находиться по формуле

Например, в табл. 6.2 приведены величины окладов профессорско-преподавательского состава кафедры высшей математики.

Таблица 6.2

Количество элементов ряда равно 5, поэтому по формуле (6.23) находим номер медианы , следовательно, меди

ана в данном случае равна

Если ряд содержит четное число элементов, то варианта находится как средняя из двух вариант, находящихся в середине ряда.

В группированном ряду распределения медиана (так как она делит всю совокупность на две равные части) находится в каком-то из интервалов.

Кумулятивная (накопленная) частота (или относительная частота) равна или превышает полусумму всех частот ряда (для относительных частот она равна 1/2 или превышает 1/2).

В этом случае значение медианы вычисляется по формуле

где - нижняя граница медианного интервала;

Длина медианного интервала;

Полусумма частот;

Сумма частот, накопленная до начала медианного интервала;

Частота медианного интервала.

Реферат

Средние величины и показатели вариации

1.Сущность средних в статистике

2.Виды средних величин и способы их расчёта

3.Основные показатели вариации и их значение в статистике

1. Сущность средних величин в статистике

В процессе изучения массовых социально-экономических явлений возникает необходимость выявления их общих свойств, типичных размеров и характерных признаков. Необходимость в обобщающем среднем показателе возникает в том случае, когда признаки, характеризующие единицы изучаемой совокупности, количественно варьируют. Например, размер дневной выработки ткачей на текстильной фабрике зависит от общих условий производства, ткачи используют одинаковое сырьё, работают на одинаковых станках и т.д. В то же время часовая выработка отдельных ткачей колеблется, т.е. варьирует, так как зависит от индивидуальных особенностей каждого ткача (его квалификации, профессионального опыта и т.д.). Чтобы характеризовать дневную выработку всех ткачей предприятия, необходимо исчислить среднюю величину дневной выработки, так, как, только, в, этом, показателе найдут отражение общие для ткачей условия производства.

Таким образом, исчисление средних обобщающих показателей означает отвлечение (абстрагирование) от особенностей, отражающихся в величине признака у отдельных единиц, и выявление общих для данной совокупности типичных черт и свойств.

Таким образом, средней величиной в статистике является обобщённая, количественна характеристика признака и статистической совокупности. Она выражает характерную, типичную величину признака у единиц совокупности, образующихся в данных условиях места и времени под влиянием всей совокупности факторов. Действие разнообразных факторов порождает колебание, вариацию усредняемого признака. Средняя величина является общей мерой их действия, равнодействующей всех этих факторов. Средняя величина характеризует совокупность по усредняемому признаку, но относится к единице совокупности. Например, средняя выработка продукции на одного рабочего данного предприятия представляет собой отношение всей выработки (за любой период времени) к общей (средней за тот же период) численности его рабочих. Она характеризует производительность труда данной совокупности, но относится к одному рабочему. В средней величине массового явления погашаются индивидуальные различия единиц статистической совокупности в значениях усредняемого признака, обусловленные случайными обстоятельствами. Вследствие этого взаимопогашения в средней проявлявляется общее, закономерное свойство данной статистической совокупности явлений. Между средней и индивидуальными значениями осреднённого признака существует диалектическая связь как между общим и отдельным. Средняя является важнейшей категорией статистической науки и важнейшей формой обобщающих показателей. Многие явления общественной жизни становятся ясными, определёнными, лишь, будучи обобщенными, в форме средних величин. Таковы, например, упомянутая выше производительность труда, совокупность рабочих, урожайность сельскохозяйственных культур и т.д. Средняя выступает в статистике важнейшим методом научного обобщения. В этом смысле говорят о методе средних величин, который широко применяется в экономической науке. Многие категории экономической науки определяются с использованием понятия средней.

Основным условием правильного применения средней величины является однородность статистической совокупности по усредняемому признаку. Однородной статистической совокупностью называется такая совокупность, в которой её составные элементы (единицы) сходны между собой по существенным для данного исследования признакам и относятся к одному и тому же типу явлений. Однородная совокупность, будучи однородна по одним признакам, может быть разнородной по другим. Только в средних для таких совокупностей проявляются специфические особенности, закономерности развития анализируемого явления. Средняя вычисленная для неоднородной статистической совокупности, т.е. такой в которой объединены качественно различные явления, теряет своё научное значений. Такие средние являются фиктивными, не только не дающими представления о действительности, но и искажающими её. Для формирования однородных статистических совокупностей производится соответствующая группировка. С помощью группировок и в качественно однородной совокупности могут быть выделены характерные в количественном отношении группы. Для каждой из них может быть вычислена своя средняя, называемая средней групповой (частной) в отличие от общей средней (для совокупности в целом).

2. Виды средних величин

Большое значение в методологии средних величин имеют вопросы выбора формы средней, т.е. формулы по которой можно правильно вычислить среднюю величину, и выбора весов средней. Наиболее часто в статистике применяются средняя агрегатная, средняя арифметическая, средняя гармоническая, средняя геометрическая, средняя квадратичная, мода и медиана. Применение той или иной формулы зависит от содержания усредняемого признака и конкретных данных, по которым её необходимо рассчитать. Для выбора формы средней можно воспользоваться так называемым средним исходным соотношением.

2.1 Средняя арифметическая

Средняя арифметическая - одна из наиболее распространенных форм средней величины. Средняя арифметическая рассчитывается как частное от деления суммы индивидуальных значений (вариантов) варьирующего признака на их число. Средняя арифметическая применяется в тех случаях, когда объём варьирующего признака явлений однородной статистической совокупности, образуется путём суммирования значений признака всех единиц явлений статистической совокупности. Различают следующие средне арифметические величины:

1) Простая средняя арифметическая , которая определяется путём простого суммирования количественных значений варьирующего признака и деления этой сумы на их варианты и рассчитывается по следующей формуле:


Х - средняя величина статистической совокупности,

x i - сумма отдельных варьирующих вариантов явлений статистической совокупности,

n i - количество варьирующих вариантов явлений статистической совокупности.

2) Среднеарифметическая взвешенная - средняя величина признака явления, вычисленная с учётом весов. Веса средних величин - частоты, с которыми отдельные значения признака осредняемого принимаются в расчёт при исчислении его средней величины. Выбор весов средней величины зависит от сущности усредняемого признака и характера данных, которыми располагают для вычисления средних величин. В качестве весов средних величин могут быть показатели численности единиц или размеры частей статистической совокупности (в форме абсолютных или относительных величин), обладающих данным вариантом (значением) усредняемого признака явления статистической совокупности, а также величины показателя связанного с усредняемым признаком. Среднеарифметическая взвешенная рассчитывается по следующей формуле:


X- средняя арифметическая взвешенная,

х - величина отдельных варьирующих вариантов явлений статистической совокупности,

Назначение простой, и взвешенной средней арифметической является определение среднего значения варьирующего признака. Если в изучаемой статистической совокупности варианты значений признака встречаются по одному разу или имеют одинаковый вес, то применяется простая средняя арифметическая, если же варианты значений данного признака встречаются в изучаемой совокупности по несколько раз или имеют различные веса, для определения среднего значения варьирующего признака применяется средняя арифметическая взвешенная.

2.2 Средняя гармоническая

Средняя гармоническая применяется для расчёта средней величины тогда, когда непосредственные данные о весах отсутствуют, а известны варианты усредняемого признака (х) и произведения значений вариантов на количество единиц, обладающих данным его значением w (w = xf).

Данная средняя рассчитывается по следующим формулам:

1.) Среднегармоническая простая:

Х - средняя гармоническая простая,

n - количество варьирующих вариантов явлений статистической совокупности.

2) Среднегармоническая взвешенная:

Х - средняя гармоническая взвешенная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

При использовании гармонической взвешенной выявляют веса и таким образом получают тот же результат, который дал бы расчёт по средней арифметической взвешенной, если бы были известны все необходимые для этого данные.

2.3 Средняя агрегатная

Средняя агрегатная рассчитывается по формуле:

X - средняя агрегатная,

х - сумма отдельных варьирующих вариантов явлений статистической совокупности,

Средняя агрегатная вычисляется в тех случаях, когда известны (имеются) значения числителя и значения знаменателя исходного соотношения средней.

2.4 Средняя геометрическая

5.1. Понятие средней величины

Средняя величина – это обобщающий показатель, характеризующий типический уровень явления. Он выражает величину признака, отнесенную к единице совокупности.

Средняя всегда обобщает количественную вариацию признака, т.е. в средних величинах погашаются индивидуальные различия единиц совокупности, обусловленные случайными обстоятельствами. В отличие от средней абсолютная величина, характеризующая уровень признака отдельной единицы совокупности, не позволяет сравнивать значения признака у единиц, относящихся к разным совокупностям. Так, если нужно сопоставить уровни оплаты труда работников на двух предприятиях, то нельзя сравнивать по данному признаку двух работников разных предприятий. Оплата труда выбранных для сравнения работников может быть не типичной для этих предприятий. Если же сравнивать размеры фондов оплаты труда на рассматриваемых предприятиях, то не учитывается численность работающих и, следовательно, нельзя определить, где уровень оплаты труда выше. В конечном итоге сравнить можно лишь средние показатели, т.е. сколько в среднем получает один работник на каждом предприятии. Таким образом, возникает необходимость расчета средней величины как обобщающей характеристики совокупности.

Вычисление среднего – один из распространенных приемов обобщения; средний показатель отрицает то общее, что характерно (типично) для всех единиц изучаемой совокупности, в то же время он игнорирует различия отдельных единиц. В каждом явлении и его развитии имеет место сочетание случайности и необходимости. При исчислении средних в силу действия закона больших чисел случайности взаимопогашаются, уравновешиваются, поэтому можно абстрагироваться от несущественных особенностей явления, от количественных значений признака в каждом конкретном случае. В способности абстрагироваться от случайности отдельных значений, колебаний и заключена научная ценность средних как обобщающих характеристик совокупностей.

Для того, чтобы средний показатель был действительно типизирующим, он должен рассчитываться с учетом определенных принципов.

Остановимся на некоторых общих принципах применения средних величин.
1. Средняя должна определяться для совокупностей, состоящих из качественно однородных единиц.
2. Средняя должна исчисляться для совокупности, состоящей из достаточно большого числа единиц.
3. Средняя должна рассчитываться для совокупности, единицы которой находятся в нормальном, естественном состоянии.
4. Средняя должна вычисляться с учетом экономического содержания исследуемого показателя.

5.2. Виды средних и способы их вычисления

Рассмотрим теперь виды средних величин, особенности их исчисления и области применения. Средние величины делятся на два больших класса: степенные средние, структурные средние.

К степенным средним относятся такие наиболее известные и часто применяемые виды, как средняя геометрическая, средняя арифметическая и средняя квадратическая.

В качестве структурных средних рассматриваются мода и медиана.

Остановимся на степенных средних. Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными. Простая средняя считается по не сгруппированным данным и имеет следующий общий вид:

где X i – варианта (значение) осредняемого признака;

n – число вариант.

Взвешенная средняя считается по сгруппированным данным и имеет общий вид

,

где X i – варианта (значение) осредняемого признака или серединное значение интервала, в котором измеряется варианта;
m – показатель степени средней;
f i – частота, показывающая, сколько раз встречается i-e значение осредняемого признака.

Приведем в качестве примера расчет среднего возраста студентов в группе из 20 человек:


Средний возраст рассчитаем по формуле простой средней:

Сгруппируем исходные данные. Получим следующий ряд распределения:

В результате группировки получаем новый показатель – частоту, указывающую число студентов в возрасте Х лет. Следовательно, средний возраст студентов группы будет рассчитываться по формуле взвешенной средней:

Общие формулы расчета степенных средних имеют показатель степени (m). В зависимости от того, какое значение он принимает, различают следующие виды степенных средних:
средняя гармоническая, если m = -1;
средняя геометрическая, если m –> 0;
средняя арифметическая, если m = 1;
средняя квадратическая, если m = 2;
средняя кубическая, если m = 3.

Формулы степенных средних приведены в табл. 4.4.

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Здесь действует правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

В статистической практике чаще, чем остальные виды средних взвешенных, используются средние арифметические и средние гармонические взвешенные.

Таблица 5.1

Виды степенных средних

Вид степенной
средней
Показатель
степени (m)
Формула расчета
Простая Взвешенная
Гармоническая -1
Геометрическая 0
Арифметическая 1
Квадратическая 2
Кубическая 3

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Среднюю гармоническую применяют для расчетов тогда, когда в качестве весов используются не единицы совокупности – носители признака, а произведения этих единиц на значения признака (т.е. m = Xf). К средней гармонической простой следует прибегать в случаях определения, например, средних затрат труда, времени, материалов на единицу продукции, на одну деталь по двум (трем, четырем и т.д.) предприятиям, рабочим, занятым изготовлением одного и того же вида продукции, одной и той же детали, изделия.

Главное требование к формуле расчета среднего значения заключается в том, чтобы все этапы расчета имели реальное содержательное обоснование; полученное среднее значение должно заменить индивидуальные значения признака у каждого объекта без нарушения связи индивидуальных и сводных показателей. Иначе говоря, средняя величина должна исчисляться так, чтобы при замене каждого индивидуального значения осредняемого показателя его средней величиной оставался без изменения некоторый итоговый сводный показатель, связанный тем или другим образом с осредняемым . Этот итоговый показатель называется определяющим, поскольку характер его взаимосвязи с индивидуальными значениями определяет конкретную формулу расчета средней величины. Покажем это правило на примере средней геометрической.

Формула средней геометрической

используется чаще всего при расчете среднего значения по индивидуальным относительным величинам динамики.

Средняя геометрическая применяется, если задана последовательность цепных относительных величин динамики, указывающих, например, на рост объема производства по сравнению с уровнем предыдущего года: i 1 , i 2 , i 3 ,..., i n . Очевидно, что объем производства в последнем году определяется начальным его уровнем (q 0) и последующим наращиванием по годам:

q n =q 0 × i 1 × i 2 ×...×i n .

Приняв q n в качестве определяющего показателя и заменяя индивидуальные значения показателей динамики средними, приходим к соотношению

Отсюда

5.3. Структурные средние

Особый вид средних величин – структурные средние – применяется для изучения внутреннего строения рядов распределения значений признака, а также для оценки средней величины (степенного типа), если по имеющимся статистическим данным ее расчет не может быть выполнен (например, если бы в рассмотренном примере отсутствовали данные и об объеме производства, и о сумме затрат по группам предприятий).

В качестве структурных средних чаще всего используют показатели моды – наиболее часто повторяющегося значения признака – и медианы – величины признака, которая делит упорядоченную последовательность его значений на две равные по численности части. В итоге у одной половины единиц совокупности значение признака не превышает медианного уровня, а у другой – не меньше его.

Если изучаемый признак имеет дискретные значения, то особых сложностей при расчете моды и медианы не бывает. Если же данные о значениях признака Х представлены в виде упорядоченных интервалов его изменения (интервальных рядов), расчет моды и медианы несколько усложняется. Поскольку медианное значение делит всю совокупность на две равные по численности части, оно оказывается в каком-то из интервалов признака X. С помощью интерполяции в этом медианном интервале находят значение медианы:

,

где X Me – нижняя граница медианного интервала;
h Me – его величина;
(Sum m)/2 – половина от общего числа наблюдений или половина объема того показателя, который используется в качестве взвешивающего в формулах расчета средней величины (в абсолютном или относительном выражении);
S Me-1 – сумма наблюдений (или объема взвешивающего признака), накопленная до начала медианного интервала;
m Me – число наблюдений или объем взвешивающего признака в медианном интервале (также в абсолютном либо относительном выражении).

В нашем примере могут быть получены даже три медианных значения – исходя из признаков количества предприятий, объема продукции и общей суммы затрат на производство:

Таким образом, у половины предприятий уровень себестоимость единицы продукции превышает 125,19 тыс. руб., половина всего объема продукции производится с уровнем затрат на изделие больше 124,79 тыс. руб. и 50 % общей суммы затрат образуется при уровне себестоимости одного изделия выше 125,07 тыс. руб. Заметим также, что наблюдается некоторая тенденция к росту себестоимости, так как Ме 2 = 124,79 тыс. руб., а средний уровень равен 123,15 тыс. руб.

При расчете модального значения признака по данным интервального ряда надо обращать внимание на то, чтобы интервалы были одинаковыми, поскольку от этого зависит показатель повторяемости значений признака X. Для интервального ряда с равными интервалами величина моды определяется как

где Х Mo – нижнее значение модального интервала;
m Mo – число наблюдений или объем взвешивающего признака в модальном интервале (в абсолютном либо относительном выражении);
m Mo -1 – то же для интервала, предшествующего модальному;
m Mo+1 – то же для интервала, следующего за модальным;
h – величина интервала изменения признака в группах.

Для нашего примера можно рассчитать три модальных значения исходя из признаков числа предприятий, объема продукции и суммы затрат. Во всех трех случаях модальный интервал один и тот же, так как для одного и того же интервала оказываются наибольшими и число предприятий, и объем продукции, и общая сумма затрат на производство:

Таким образом, чаще всего встречаются предприятия с уровнем себестоимости 126,75 тыс. руб., чаще всего выпускается продукция с уровнем затрат 126,69 тыс. руб., и чаще всего затраты на производство объясняются уровнем себестоимости в 123,73 тыс. руб.

5.4. Показатели вариации

Конкретные условия, в которых находится каждый из изучаемых объектов, а также особенности их собственного развития (социальные, экономические и пр.) выражаются соответствующими числовыми уровнями статистических показателей. Таким образом, вариация, т.е. несовпадение уровней одного и того же показателя у разных объектов, имеет объективный характер и помогает познать сущность изучаемого явления.

Для измерения вариации в статистике применяют несколько способов.

Наиболее простым является расчет показателя размаха вариации Н как разницы между максимальным (X max) и минимальным (X min) наблюдаемыми значениями признака:

H=X max - X min .

Однако размах вариации показывает лишь крайние значения признака. Повторяемость промежуточных значений здесь не учитывается.

Более строгими характеристиками являются показатели колеблемости относительно среднего уровня признака. Простейший показатель такого типа – среднее линейное отклонение Л как среднее арифметическое значение абсолютных отклонений признака от его среднего уровня:

При повторяемости отдельных значений Х используют формулу средней арифметической взвешенной:

(Напомним, что алгебраическая сумма отклонений от среднего уровня равна нулю.)

Показатель среднего линейного отклонения нашел широкое применение на практике. С его помощью анализируются, например, состав работающих, ритмичность производства, равномерность поставок материалов, разрабатываются системы материального стимулирования. Но, к сожалению, этот показатель усложняет расчеты вероятностного типа, затрудняет применение методов математической статистики. Поэтому в статистических научных исследованиях для измерения вариации чаще всего применяют показатель дисперсии.

Дисперсия признака (s 2) определяется на основе квадратической степенной средней:

.

Показатель s, равный , называется средним квадратическим отклонением.

В общей теории статистики показатель дисперсии является оценкой одноименного показателя теории вероятностей и (как сумма квадратов отклонений) оценкой дисперсии в математической статистике, что позволяет использовать положения этих теоретических дисциплин для анализа социально-экономических процессов.

Если вариация оценивается по небольшому числу наблюдений, взятых из неограниченной генеральной совокупности, то и среднее значение признака определяется с некоторой погрешностью. Расчетная величина дисперсии оказывается смещенной в сторону уменьшения. Для получения несмещенной оценки выборочную дисперсию, полученную по приведенным ранее формулам, надо умножить на величину n / (n - 1). В итоге при малом числе наблюдений (< 30) дисперсию признака рекомендуется вычислять по формуле

Обычно уже при n > (15÷20) расхождение смещенной и несмещенной оценок становится несущественным. По этой же причине обычно не учитывают смещенность и в формуле сложения дисперсий.

Если из генеральной совокупности сделать несколько выборок и каждый раз при этом определять среднее значение признака, то возникает задача оценки колеблемости средних. Оценить дисперсию среднего значения можно и на основе всего одного выборочного наблюдения по формуле

,

где n – объем выборки; s 2 – дисперсия признака, рассчитанная по данным выборки.

Величина носит название средней ошибки выборки и является характеристикой отклонения выборочного среднего значения признака Х от его истинной средней величины. Показатель средней ошибки используется при оценке достоверности результатов выборочного наблюдения.

Показатели относительного рассеивания. Для характеристики меры колеблемости изучаемого признака исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы наблюдения одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей). Расчет показателей меры относительного рассеивания осуществляют как отношение абсолютного показателя рассеивания к средней арифметической, умножаемое на 100%.

1. Коэффициентом осцилляции отражает относительную колеблемость крайних значений признака вокруг средней

.

2. Относительное линейное отключение характеризует долю усредненного значения признака абсолютных отклонений от средней величины

.

3. Коэффициент вариации:

является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

В статистике совокупности, имеющие коэффициент вариации больше 30–35 %, принято считать неоднородными.

У такого способа оценки вариации есть и существенный недостаток. Действительно, пусть, например, исходная совокупность рабочих, имеющих средний стаж 15 лет, со средним квадратическим отклонением s = 10 лет, «состарилась» еще на 15 лет. Теперь = 30 лет, а среднеквадратическое отклонение по-прежнему равно 10. Совокупность, ранее бывшая неоднородной (10/15 × 100 = 66,7%), со временем оказывается, таким образом, вполне однородной (10/30 × 100 = 33,3 %).

Боярский А.Я. Теоретические исследования по статистике: Сб. Науч. Трудов.– М.: Статистика,1974. С. 19–57.

Предыдущая