|37 |
|50,1-100 |78 |
|100,1-150 |111 |
|150,1-200 |105 |
|200,1-250 |68 |
|Свыше 250 |49 |
|Итого |448 |
Если в атрибутивных и дискретных вариационных рядах частотная
характеристика относится непосредственно к варианту ряда, то в интервальных
к группе вариантов.
Поскольку в расчетах группа должна быть представлена обычно одним
вариантом, в качестве этого варианта условно выбирается середина каждого
интервала.
Такой подход возможен исходя из гипотезы о равномерном распределении
вариантов внутри каждого интервала.
Интервальный ряд, таким образом, преобразуется в дискретный, варианты
которого – это середины соответствующих интервалов. Середины закрытых
интервалов определяются как полусумма нижней и верхней границы интервала.
Середина первого интервала с открытой нижней границей определяется по
формуле [pic], где xВ1 – верхняя граница первого интервала, c2 – второй
интервал.
Середина последнего интервала определяется по формуле [pic], где xнn –
нижняя граница n-го интервала, сn-1 – предыдущий интервал (предпоследний).
2. Частотные характеристики рядов распределения.
Различают абсолютные и относительные частотные характеристики.
Абсолютная характеристика – частота, показывает, сколько раз
встречается в совокупности данный вариант ряда. Достоинство частоты –
простота, недостаток – невозможность сравнительного анализа рядов
распределения разной численности.
Для подобных сравнений применяют относительные частоты или частости,
которые рассчитываются по формуле:
[pic], где N – численность совокупности.
Это относительная величина структуры (по форме).
Сумма частостей равна 1.
[pic]
Если частости выражены в процентах или в промилях их суммы равны
соответственно 100 или 1000.
В неравных интервальных рядах распределения частотные характеристики
зависят не только от распределения вариантов ряда, но и от величины
интервала при прочих равных условиях расширение границ интервала приводит к
увеличению наполненности групп.
Для анализа рядов распределения с неравными интервалами используют
показатели плотности:
Абсолютная плотность: [pic], где fi – частота, ci - величина интервала
– показывает, сколько единиц в совокупности приходится на единицу величины
соответствующего интервала. Абсолютная плотность позволяет сопоставлять
между собой насыщенность различных по величине интервалов ряда. Абсолютные
плотности не позволяют, однако, сравнивать ряды распределения разной
численности.
Для подобных сравнений применяются относительные плотности: [pic], где
di – частости (доли), ci - величины соответствующих интервалов –
показывает, какая часть (доля) совокупности приходится на единицу величины
соответствующего интервала.
3. Графическое изображение рядов распределения.
Графическое изображение рядов распределения дает наглядное
представление о закономерностях распределения.
Дискретный ряд изображается на графике в виде ломаной линии – полигона
распределения.
[pic]
Интервальные ряды изображаются в виде гистограмм распределения (то есть
столбиков диаграмм) при этом основанием каждого прямоугольника служит
величина соответствующего интервала, а высотой его частотная
характеристика.
[pic]
Любая гистограмма может быть преобразована в полигон распределений, для
этого необходимо соединить между собой отрезками прямой вершины ее
прямоугольников.
При графическом изображении рядов с неравными интервалами по оси
ординат откладываются абсолютные или относительные плотности.
Поскольку [pic], то [pic] и площадь каждого прямоугольника такой
гистограммы равна частоте соответствующего интервала, а общая площадь
гистограммы равна численности совокупности.
[pic]
Если на графике откладываются относительные плотности [pic], то [pic],
то площадь каждого прямоугольника равна частости соответствующего
интервала, а общая площадь гистограммы равна 1.
При равноинтервальной группировке графики распределений составленные по
частотам, частостям и плотностям, подобны друг другу.
Графики распределений с неравными интервалами различаются в зависимости
от того, по какой частотной характеристике они строятся.
Для характеристики рядов распределения применяют так же графики
накопленных частот или куммуляты.
Пример: Распределение хозяйств по урожайности зерновых.
|Урожайность, |Число хозяйств,|Накопленная |
| | | |
|га |[pic] |частота, |
| | |[pic] |
|До 6 |2 |2 |
|6-10 |8 |10 (2+8) |
|10-14 |17 |27 (10+17) |
|14-18 |12 |39 (12+27) |
|18-22 |6 |45 (6+39) |
|Свыше 22 |2 |47 (25+2) |
|Итого |47 | |
Накопленная частота – это сумма частот данного и всех предшествующих
интервалов.
Куммулята позволяет определить, какая часть совокупности обладает
значениями изучаемого признака не превышающими заданного предела, а какая
часть – наоборот – превышает этот предел.
[pic]
Средние величины.
1. Понятие средней величины.
2. Средняя арифметическая величина и ее расчет прямым способом.
3. Свойства средней арифметической величины.
4. Практическое использование свойств средней арифметической.
5. Степенные средние.
6. Мода и процентили.
1. Понятие средней величины.
Уровень любого показателя формируется под воздействием существенных
закономерных для данного явления, а так случайных причин. Поскольку
случайных причин множество и их действия носят стихийный разнонаправленный
характер, необходимо нивелировать (устранить) результат такого воздействия,
для того чтобы определить типичный закономерный для данных условий места и
времени уровень показателей. Таким уровнем является средняя величина.
Средняя – это обобщающая характеристика количественно и качественно
однородной совокупности в определенных условиях. Среднее определяется по
какому-либо признаку. Среднее проявляется в результате действия закона
больших чисел, когда в массовых совокупностях индивидуальные отклонения от
типичного уровня взаимопогашаются. Среднее позволяет заменить множество
значений показателей одним типичным, что значительно упрощает последующий
анализ явлений.
Средняя является объективной характеристикой только для однородных
явлений. Средние для неоднородных совокупностей называются огульными и
могут применяться только в сочетании с частными средними однородных
совокупностей.
Средняя применяется в статистических исследованиях для оценки
сложившегося уровня явления, для сравнения между собой нескольких
совокупностей по одному и тому же признаку, для исследования динамики
развития изучаемого явления во времени, для изучения взаимосвязей явлений.
Средние широко применяются в различных плановых, прогнозных, финансовых
расчетах.
2. Средняя арифметическая величина и ее расчет прямым способом.
Средняя арифметическая – наиболее распространенный на практике вид
средних. Различают 2 вида арифметических средних:
. Невзвешенную (простую);
. Взвешенную.
Средняя арифметическая невзвешенная рассчитывается для
несгруппированных данных по формуле: [pic], где [pic] - сумма вариантов, N
– их число – применяется обычно для совокупностей численностью N[pic]15.
Для массовых статистических совокупностей рассчитывается взвешенная
средняя арифметическая по формуле: [pic], где [pic] - частоты.
Пример: Расчет средней выработки рабочими токарного цеха.
|Количество деталей, |Число рабочих, |[pi|Объем производства, |
|изготовленных рабочим | |c] | |
|за смену, шт. |чел., [pic] | |[pic] |
|До 300 |3 |290|870 |
|300-320 |9 |310|2790 |
|320-340 |15 |330|4950 |
|340-360 |12 |350|4200 |
|360-380 |6 |370|2220 |
|Свыше 380 |6 |390|2340 |
|Итого |51 | |17370 |
[pic]
Из таблицы:
1. Средняя величина всегда тяготеет к вариантам с наибольшими
частотами.
2. Средняя величина может не совпадать ни с одним из вариантов
дискретного ряда.
3. Средняя величина находится внутри интервала значений вариантов ряда.
Сумма [pic] помимо чисто математического, как правило, имеет смысловое
значение, наличие смыслового значения – один из способов проверки
правильности выбора средней.
Даже если варианты ряда представлены целыми числами, среднее может быть
смешанным числом, иногда такой результат логически неправомерен. В этом
случае его надо округлять, переводить в проценты или в промили.
3. Свойства средней арифметической величины.
Свойства средней важны для понимания механизма расчета этого
показателя, а так же для разработки ряда более сложных статистических
методик.
Свойства:
1. Если из всех вариантов ряда вычесть или ко всем вариантам добавить
постоянное число, то средняя арифметическая соответственно
уменьшится или увеличится на это число. [pic].
2. Если все варианты ряда умножить или разделить на постоянное число,
то средняя арифметическая соответственно увеличится или уменьшится в
это число раз. [pic].
3. Если все частоты увеличить или уменьшить в постоянное число раз, то
средняя от этого не изменится. [pic].
4. Сумма отклонений всех вариантов ряда от средней арифметической равна
0. (Нулевое свойство средней). [pic].
5. Общая средняя совокупности равна средней арифметической из частных
средне взвешенных по объемам частных совокупностей. [pic], где
[pic] - средняя арифметическая частных групп, [pic] - численность
соответствующих групп, [pic] - общая средняя.
6. Сумма квадратов отклонений всех вариантов ряда от средней
арифметической меньше суммы квадратов их отклонений от любого
другого постоянного числа.
[pic]
Средний квадрат отклонений вариантов ряда от произвольного числа А
равен дисперсии плюс квадрат разности между средней и этим числом А.
Данное свойство положено в основу метода наименьших квадратов, который
широко применяется в исследовании статистических взаимосвязей.
4. Практическое использование свойств средней арифметической.
Свойства средней арифметической используются так же для упрощения
методики ее расчета. В условиях малопроизводительной вычислительной
техники эта методика обеспечивала значительную экономию времени и труда. В
настоящее время данная методика служит наглядным образцом иллюстрации
свойств средней.
Упрощенная методика расчета средней арифметической
(по данным о выработке рабочих токарей).
|[pi|[p|[pic] |[pic] |[pic] |[pic|
|c] |ic| | | |] |
| |] | | | | |
|290|3 |-40 |-2 |1 |-2 |
|310|9 |-20 |-1 |3 |-3 |
|330|15|0 |0 |5 |0 |
|350|12|20 |1 |4 |4 |
|370|6 |40 |2 |2 |4 |
|390|6 |60 |3 |2 |6 |
| |51| | |17 |9 |
Данный метод называется так же методом расчета от условного нуля. В
качестве условного нуля выбирается произвольное постоянное число А. Обычно
это вариант ряда с наибольшей частотой. А=330.
Рассчитываем среднюю по новым вариантам: [pic].
Пользуясь свойствами средней переходим от условного [pic] к
фактической средней величине [pic].
5. Степенные средние.
Средняя арифметическая величина является частным случаем, который
называется степенной средней.
[pic] - для несгруппированных данных;
[pic] - для сгруппированных данных.
Последовательно придавая k дискретное значение 0, 1, 2, 3, … и т.д.
получим различные виды средних.
Если k=-1 степенные средние приобретают вид средней гармонической.
[pic] - для несгруппированных данных;
[pic] - для сгруппированных данных.
Пример: В течение рабочей смены 3 рабочих изготовляли детали. 1й
рабочий затрачивая на изготовление 1 детали – 6 мин., 2й – 8 мин., 3й – 7,5
мин. Определить средние затраты времени на изготовление 1 детали.
Среднюю арифметическую взвешенную нельзя использовать для расчета, так
как каждый из рабочих изготавливал за смену разное количество деталей. В
числителе формулы отражается количество человеко-силы, а в знаменателе
условное количество деталей, изготавливаемых за смену.
[pic]
Пример: Продавец в течении нескольких дней продавал на рынке морковь. В
первые 4 дня цена составляла 6 руб./кг, в последние 5 дней цена поднялась
до 7 руб., а оставшаяся морковь была продана за 4,50 руб./кг. Поскольку
данные о товарообороте отсутствуют, то для решения задачи применяется
средняя гармоническая взвешенная:
[pic]
При этом число дней продаж моркови по различным ценам рассматривается
как показатель условного товарооборота.
Средняя гармоническая применяется в тех случаях, когда частоты ряда
выражены в неявном виде.
Если величина k=0, то степенная средняя приобретает вид средней
геометрической.
[pic] для несгруппированных данных;
[pic] для сгруппированных данных.
Средняя геометрическая применяется в тех случаях, когда отдельные
варианты ряда резко отличаются от остальных.
Наиболее часто формулу средней геометрической используют для
определения средних валютных курсов, эффективности валютных курсов,
реальной эффективности валютных курсов (международная финансовая
статистика).
Если k=1 степенная средняя принимает вид средней арифметической,
взвешенной и невзвешенной.
Если k=2, средняя квадрата.
[pic] для несгруппированных данных;
[pic] - для сгруппированных данных.
Результаты статистического исследования зависят от того, насколько
верно избран вид средней. Расчет средних, выполненных на основе одних и тех
же данных разными способами дает различные результаты.
В курсе математической статистики доказано, что чем ниже степень
средней, тем меньше ее величина. Это называется правилом мажорантности
средней.
|k |-1 |0 |1 |2 |
|[p|[pi|<|[pi|<|[p|<|[pi|
|ic|c] | |c] | |ic| |c] |
|] | | | | |] | | |
Доказано так же, что чем интенсивней колеблются значения вариантов
ряда, тем больше разница между ними.
6. Мода и процентили.
Наряду со средними для характеристики распределения применяют такие
показатели как мода и процентили, которые дополняют характеристику
(обобщающую) и позволяют сравнивать между собой и находить различия в рядах
с одинаковыми средними.
Мода – это наиболее часто встречающийся вариант ряда.
В дискретных рядах распределения модой является вариант, имеющий
максимальную частотную характеристику.
В интервальных рядах мода определяется в два этапа. В начале
определяется интервал, содержащий моду (модальный интервал), а затем
рассчитывается значение моды по формуле:
[pic], где [pic] - нижняя граница модального интервала, i – величина
этого интервала, [pic], [pic], [pic] - частоты модального, предшествующего
ему и следующего за ним интервалов.
Для последней таблицы (данные о выработке рабочих токарей):
[pic]
Медиана (вид процентиля), который занимает серединное положение в ряду
распределения. Медиана определяется по формуле:
[pic], где [pic] - нижняя граница интервала, содержащего медиану
(интервал определяется по накопленной частоте, первой превышающей 50% суммы
частот (в дальнейшем для квартилей, децилей – 25%, 75%, 0,1%, 0,2% и
т.д.)), i – величина этого интервала, [pic] - номер медианы, [pic] -
накопленная частота интервала, предшествующего медиане, [pic] - частота
медианного интервала.
Поскольку медиана разновидность процентиля то данная формула носит
универсальный характер, она может применяться для определения квартилей (Q)
и децилей (d).
Квартили (четверти) отсекают от совокупности соответственно 25%, 50% и
75%.
Децили отсекают от совокупности соответственно 10%, 20%, 30% и т.д.
На первом этапе определяется номер процентиля по формуле:
[pic] - для ряда четным числом единиц;
[pic] - с нечетным числом единиц.
[pic] - номер процентиля (порядковый), [pic] - индекс процентиля
(выражается десятичной дробью) ([pic]), N – численность совокупности.
Расчет моды и процентилей
на примере группировки магазинов по сумме товарооборота.
|Группы магазинов |Число |Накопленная |
|с торговой площадью, |магазинов,|частота, |
| | |[pic] |
|кв. м |[pic] | |
|До 100 |6 |6 |
|100-200 |12 |18 |
|200-300 |27 |45 |
|300-400 |13 |58 |
|400-500 |8 |66 |
|Свыше 500 |5 |71 |
|Итого |71 | |
Накопленная частота – это сумма частот данного и всех предшествующих
ему интервалов.
[pic]
[pic]
Четверть всех магазинов имеет площадь менее 200 кв. метров, а остальные
75% более 200 кв. метров.
[pic]
Три четверти магазинов имеют торговые площади не превышающие 369,2 кв.
метров, остальные больше.
[pic]
Показатели вариации.
1. Понятие вариации и роль ее изучения в статистических исследованиях.
2. Измерители вариации.
3. Прямой способ расчета показателей вариации.
4. Свойства дисперсии и среднего квадратического отклонения.
5. Упрощенный способ расчета дисперсии и средне квадратического
отклонения.
6. Относительные показатели вариации.
7. Стандартизация данных.
8. Моменты распределения.
9. Показатели асимметрии и эксцесса.
10. Средняя арифметическая и дисперсия альтернативного признака.
1. Понятие вариации и роль ее изучения в статистических исследованиях.
Вариация – это колеблемость значений признака у отдельных единиц
совокупности.
Наличию вариации обязана своим появлением статистика. Большинство
статистических закономерностей проявляется через вариацию. Изучая вариацию
значений признака в сочетании с его частотными характеристиками, мы
обнаруживаем закономерности распределения (например: население по возрасту,
студентов по уровню оценок).
Рассматривая вариацию одного признака параллельно с изменением другого,
мы обнаруживаем взаимосвязи между этими признаками или их отсутствие
(например: зависимость между торговой площадью и товарооборотом).
Вариации в статистике проявляются двояко, либо через изменения значений
признака у отдельных единиц совокупности, либо через наличие или отсутствие
изучаемого признака у отдельных единиц совокупности.
Изучение вариации в статистике имеет как самостоятельную цель, так и
является промежуточным этапом более сложных статистических исследований.
2. Измерители вариации.
Простейшим показателем вариации является размах колебаний: [pic].
Достоинство этого показателя простота расчета, возможность
использования для оценки вариации однородных совокупностей. Недостаток –
неприемлемость для неоднородных совокупностей с редкими выбросами крайних
значений признака.
Частично недостатки этого показателя устраняет межквартельный размах:
[pic]. Однако, он характеризует вариацию только половины совокупности.
Для учета колеблемости всех значений признака применяют показатели
среднего линейного отклонения, дисперсии и средне квадратического
отклонения.
Средне линейное отклонение – среднее значение отклонений всех вариантов
ряда от средней арифметической (иногда от моды или медианы):
[pic] - для несгруппированных данных;
[pic] - для сгруппированных данных.
[pic] [pic]
Аналогичным по смыслу среднему линейному отклонению является показатель
дисперсии и рассчитываемый на его основе показатель средне квадратического
отклонения.
Дисперсия – рассеивание, данный показатель характеризует рассеивание
значений признака относительно его средней величины.
[pic] - для несгруппированных данных;
[pic] - для сгруппированных данных.
Дисперсия – средне квадратическое отклонение всех вариантов ряда от
средней арифметической. Если извлечь квадратный корень из дисперсии,
получим средне квадратическое отклонение.
[pic] - для несгруппированных данных;
|