число сочетаний из pN=M элементов генеральной
совокупности, обладающих изучаемым признаком по k; [pic] - число сочетаний
из qN=N-M единиц, необладающих изучаемым признаком n-k единиц; [pic] -
число исходов, удовлетворяющих и неудовлетворяющих данному испытанию.
[pic]
Математическое ожидание гипергеометрического распределения не зависит
от объема генеральной совокупности и как в биномиальном распределении
определяется по формуле:
[pic], где [pic] - корректирует дисперсию при бесповторном отборе в
зависимости от численности выборки и генеральной совокупности.
Если численность генеральной совокупности достаточно велика, то [pic],
в этом случае [pic], то [pic], то есть, зная параметры биномиального
распределения всегда можно рассчитать параметры гипергеометрического.
13. Нормальное распределение.
Нормальное распределение – это наиболее важный вид распределения в
статистике.
Нормально распределяются значения признака под воздействием множества
различных причин, которые практически не взаимосвязаны друг с другом и
влияние каждой из которых сравнительно мало, по сравнению с действием всех
остальных факторов.
Нормальное распределение отражает вариацию значений признака у единиц
однородной совокупности. Подобное распределение наблюдается преимущественно
в естественно-научных испытаниях (измерение роста, веса).
В социально-экономических явлениях нормального распределения данные
встречаются редко. Здесь всегда присутствуют причины существенным образом
влияющие на уровень изучаемого признака (результат управленческого
воздействия).
Тем не менее, гипотеза о нормальном распределении исходных данных лежит
в основе методологии анализа взаимосвязей выборочного метода и многих
других статистических методов.
При достаточно большом числе испытаний нормальная кривая служит
пределом, к которому стремятся многие виды распределения, в том числе
биномиальное и гипергеометрическое.
Нормальное распределение выражается функцией вида:
[pic]
Данная функция характеризует плотность нормального распределения
вероятности, ее математическое ожидание [pic], а показатель степени –
стандартное значение отклонений эмпирических данных от
среднеарифметических.
Масштабирование данных кривой по оси x осуществляется величинами
среднеквадратического отклонения [pic]. Так как показатель степени функции
возведет в четную степень, функция положительна, кривая симметрична
относительно средней, то есть показатель асимметрии равен [pic]. Показатель
эксцесса кривой нормального распределения так же равен 0.
[pic]
Значения параметров [pic] и [pic] влияют на форму и положение графика
на координатной плоскости. С изменением [pic] при [pic] кривая скользит
вдоль оси x. С изменением [pic] при [pic] чем больше [pic] тем более
плосковершинной становится нормальная кривая. Нормальная кривая имеет точки
перегиба с координатами [pic]. Площадь, ограниченная функцией и ординатами,
проведенными из точек с координатами:
[pic] составляет 0,6827 площади всей кривой;
[pic] - 0,9545 площади всей кривой;
[pic] - 0,9973 площади всей кривой.
14. Сравнительная оценка параметров эмпирического и нормального
распределений. Критерий Пирсона.
Нормальный характер распределения свидетельствует о количественной
однородности статистических данных и об отсутствии каких-либо причин
существенным образом определяющих вариацию изучаемого явления.
Поэтому статистический анализ нередко начинается с проверки того, как
фактически (эмпирически) данные ложатся на идеальную теоретическую кривую
или апроксимируются (то есть выражение данных какой-либо кривой) сравнение
эмпирических и теоретических данных. Производится путем оценки гипотезы
нормального характера распределения. Вероятностные статистические
предположения выдвигаются в виде нулевой гипотезы. Отклонения данных
эмпирических от нормальных носят случайный характер. Оценку нулевой
гипотезы в данном случае осуществляют графическим методом или путем расчета
специальных обобщающих показателей сходства, называемых критериями
согласия.
Независимо от выбранного метода генеральные ряды распределения
преобразуются в дискретные и стандартизируются.
Пример: Известно, что среднемесячная заработная плата всех рабочих
[pic]=1402,42 руб., среднеквадратическое отклонение [pic]=338,58 руб.
Данные распределения среднемесячной заработной платы.
Средне-месячная заработная плата |Число раб-ков, [pic] (эмпир.) |[pic]
|[pic] |[pic] |[pic] |[pic]
(теор.) |[pic] |[pic] |[pic] | |До 700 |16 |600 |-2,37 |-2,81 |0,0241
|12,93 |3,07 |9,41 |0,73 | |700,1-900 |56 |800 |-1,78 |-1,58 |0,0819 |44,04
|11,96 |142,95 |3,25 | |900,1-1100 |89 |1000 |-1,19 |-0,71 |0,1969 |105,82
|-16,82 |282,90 |2,67 | |1100,1-1300 |172 |1200 |-0,60 |-0,18 |0,3337
|179,35 |-7,35 |54,05 |0,30 | |1300,1-1500 |244 |1400 |-0,01 |0,00 |0,3989
|214,44 |29,56 |873,70 |4,07 | |1500,1-1700 |163 |1600 |0,58 |-0,17 |0,3365
|180,87 |-17,87 |319,44 |1,77 | |1700,1-1900 |93 |1800 |1,17 |-0,69 |0,2002
|107,62 |-14,62 |213,80 |1,99 | |1900,1-2100 |64 |2000 |1,76 |-1,56 |0,0840
|45,17 |18,83 |354,42 |7,85 | |Свыше 2100,1 |13 |2200 |2,36 |-2,77 |0,0249
|13,38 |-0,38 |0,14 |0,01 | |Итого |910 | | | | | | | |22,63 | |
В связи с тем, что табличные значения рассчитаны для непрерывно
изменяющегося признака с дисперсией равной 1, необходимо скорректировать
полученные частости на фактическую величину интервала и
среднеквадратическое отклонение.
[pic], где [pic] величина интервала. Так как все интервалы равны
[pic], тогда [pic].
[pic]
Графики не позволяют определить насколько существенны отклонения,
поэтому более точным считается способ расчета критериев согласия. Наиболее
известный из них:
[pic]
В соответствии с формулой, чем сильнее совпадение кривых, тем меньше
величина [pic]. При отсутствии отклонений [pic], но даже при небольших
отклонениях величина [pic] зависит от числа слагаемых (то есть от числа
групп). Если [pic]>0, то необходима его вероятностная оценка (стр. 368).
[pic] - число степеней свободы и заданная вероятность несущественности
отклонений эмпирических данных и теоретических. r – число групп, k - число
параметров, которые нельзя изменить.
[pic]
Поскольку фактическое значение [pic] (22,63) гораздо больше табличного
(5,348) даже для вероятности 0,5, гипотеза о случайном характере отклонений
эмпирических данных от теоретических отклоняется.
|