Общая теория статистики - Статистика - Скачать бесплатно
к дискретному ряду дальнейшие вычисления
происходят по методике рассмотренной выше.
Если веса fi заданы не в абсолютных показателях, а в относительных,
то формула расчета средней арифметической будет следующей:
[pic]
pi - относительные величины структуры, показывающие, какой процент
составляют частоты вариантов в сумме всех частот.
Если относительные величины структуры заданы не в процентах, а в
долях, то среднее арифметическое будет рассчитываться по формуле:
[pic]
39. Структурное среднее.
40. Мода и медиана, их определение в вариационных рядах.
Структурное среднее характеризует состав статистической совокупности
по одному из варьирующих признаков. К этим средним относятся мода и
медиана.
Мода - такое значение варьирующего признака, которое в данном ряду
распределения имеет наибольшую частоту.
В дискретных рядах распределений мода определяется визуально.
Сначала определяется наибольшая частота, а по ней модальное значение
признака. В интервальных рядах для вычисления моды используется следующая
формула:
[pic]
Xmo - нижняя граница модальности (интервал ряда с наибольшей частотой)
Mo - величина интервала
fMo - частота модального интервала
fMo-1 - частота интервала предшествующего модальному
fMo+1 - частота интервала следующего за модальным
Медианой называется такое значение варьирующего признака, которое
делит ряд распределения на две равные части по объему частот. Медиана
рассчитывается по разному в дискретных и интервальных рядах.
1. Если ряд распределения дискретный и состоит из четного числа членов, то
медиана определяется как средняя величина из двух серединных значений
рангированного ряда признаков.
2. Если в дискретном ряду распределения нечетное число уровней, то медианой
будет серединное значение рангированного ряда признаков.
В интервальных рядах медиана определяется по формуле:
[pic]
[pic] - нижняя граница медианного интервала (интервала для которого
накопленная частота впервые превысит полусумму частот)
Me - величина интервала
[pic] - сумма частот ряда
[pic] - сумма накопленных частот предшествующих медианному интервалу
[pic] - частота медианного интервала
41. Общее понятие о вариации.
Вариацией называется различие значений признака у отдельных единиц
совокупности.
Вариация возникает в силу того, что отдельные значения признака
формируются по влияние большого числа взаимосвязанных факторов. Эти факторы
часто действуют в противоположных направлениях и их совместное действие
формирует значение признаков у конкретной единицы совокупности.
Необходимость изучения вариаций связана с тем, что средняя величина,
обобщающая данные статистического наблюдения, на показывает как колеблется
вокруг нее индивидуальное значение признака. Вариации присущи явлениям
природы и общества. При этом революция в обществе происходит быстрее, чем
аналогичные изменения в природе. Объективно существуют также вариации в
пространстве и во времени.
Вариации в пространстве показывают различие статистических показателей
относящихся к различным административно-территориальным единицам.
Вариации во времени показывают различие показателей в зависимости от
периода или момента времени к которым они относятся.
42. Сущность и значение показателей вариации.
43. Абсолютные показатели вариации (=42, без коэффициента).
К примерам вариаций относятся следующие показатели:
1. размах вариаций
2. среднее линейное отклонение
3. среднее квадратическое отклонение
4. дисперсия
5. коэффициент
1. Размах вариаций является ее простейшим показателем. Он определяется как
разность между максимальным и минимальным значение признака. Недостаток
этого показателя заключается в том, что он зависит только от двух крайних
значений признака (min, max) и не характеризует колеблимость внутри
совокупности. R=Xmax-Xmin.
2. Среднее линейное отклонение является средней величиной абсолютных
значений отклонений от средней арифметической. Отклонения берутся по
модулю, т.к. в противном случае, из-за математических свойств средней
величины, они всегда были бы равны нулю.
3. Среднее квадратическое отклонение определяется как корень из дисперсии.
4. Дисперсия (средний квадрат отклонений) имеет наибольшее применение в
статистике как показатель меры колеблимости.
Дисперсия является именованным показателем. Она измеряется в
единицах соответствующих квадрату единиц измерения изучаемого признака.
5. Коэффициент вариаций определяется как отношение среднего квадратического
отклонения к средней величине признака, выраженное в процентах:
[pic]
Он характеризует количественную однородность статистической
совокупности. Если данный коэффициент < 50%, то это говорит об однородности
статистической совокупности. Если же совокупность не однородна, то любые
статистические исследования можно проводить только внутри выделенных
однородных групп.
44. Дисперсия и ее свойства.
Дисперсия - средний квадрат отклонений индивидуальных значений
признака от их средней величины.
Свойства дисперсии:
1. Дисперсия постоянной величины равна нулю.
2. Уменьшение всех значений признака на одну и ту же величину А не меняет
величины дисперсии. Значит средний квадрат отклонений можно вычислить не по
заданным значениям признака, а по отклонениям их от какого-то постоянного
числа.
3. Уменьшение всех значений признака в k раз уменьшает дисперсию в k2 раз,
а среднее квадратическое отклонение - к раз. Значит, все значения признака
можно разделить на какое-то постоянное число (скажем, на величину интервала
ряда), исчислить среднее квадратическое отклонение, а затем умножить его на
постоянное число.
4. Если исчислить средний квадрат отклонений от любой величины А, то в той
или иной степени отличающейся от средней арифметической (X~), то он всегда
будет больше среднего квадрата отклонений, исчисленного от средней
арифметической. Средний квадрат отклонений при этом будет больше на вполне
определенную величину - на квадрат разности средней и этой условно взятой
величины.
45. Внутригрупповая и межгрупповая дисперсия.
Выделяют дисперсию общую, межгрупповую и внутригрупповую. Общая дисперсия
(2 измеряет вариацию признака во всей совокупности под влиянием всех
факторов, обусловивших эту вариацию.
Межгрупповая дисперсия ((2x) характеризует систематическую вариацию,
т.е. различия в величине изучаемого признака, возникающие под влиянием
признака-фактора, положенного в основание группировки.
Внутригрупповая дисперсия ((2i) отражает случайную вариацию, т.е.
часть вариации, происходящую под влиянием неучтенных факторов и не
зависящую от признака-фактора, положенного в основание группировки.
46. Правило сложения дисперсий.
Существует закон, связывающий три вида дисперсии. Общая дисперсия
равна сумме средней из внутригрупповых и межгрупповых дисперсий:
[pic]
Данное соотношение называют правилом сложения дисперсий. Согласно
этому правилу, общая дисперсия, возникающая под действием всех факторов,
равна сумме дисперсии, возникающей за счет группировочного признака.
Зная любые два вида дисперсий, можно определить или проверить
правильность расчета третьего вида.
Правило сложения дисперсий широко применяется при исчислении
показателей тесноты связей, в дисперсионном анализе, при оценке точности
типической выборки и в ряде других случаев.
47. Взаимосвязи общественных явлений, их виды, формы.
Многообразие взаимосвязей в которых находятся социально-
экономические явления, рождают необходимость в их классификации.
По видам различают функциональную и корреляционную зависимость.
Функциональной называют такую зависимость, при которой одному
значению факторного признака X соответствует одно строго определенное
значение результативного признака Y.
В отличие от функциональной зависимости, корреляционная выражает
такую связь между социально-экономическими явлениями, при которой одному
значению факторного признака X могут соответствовать несколько значений
результативного признака Y.
По направлению различают прямую и обратную зависимость.
Прямой называют такую зависимость, при которой значение факторного
признака X и результативного признака Y изменяются в одном направлении.
Т.о. при увеличении значения X, значения Y в среднем увеличиваются, а при
уменьшении X - Y уменьшается.
Обратная зависимость между факторным и результативным признаками,
если они изменяются в противоположных направлениях.
50. Анализ взаимосвязи качественных признаков.
Для исследования взаимосвязи качественных альтернативных признаков,
принимающих только 2 взаимоисключающих значения, используется коэффициент
ассоциации и контингенции. При расчете этих коэффициентов составляется т.н.
таблица 4-х камней, а сами коэффициенты рассчитываются по формуле:
[pic]
[pic]
|Группы |Группы |+ |- |Итого: |
|по |по | | | |
|признак|признак| | | |
|у Y |у X | | | |
|+ |a |b |a+b |
|- |c |d |c+d |
|Итого: |a+c |c+d |a+b+c+d |
Если коэффициент ассоциации ( 0,5, а коэффициент контингенции ( 0,3,
то можно сделать вывод о наличии существенной зависимости между изучаемыми
признаками.
Если признаки имеют 3 или более градаций, то для изучения
взаимосвязей используются коэффициенты Пирсена и Чупрова. Они
рассчитываются по формулам:
С - коэффициент Пирсена
К - коэффициент Чупрова
[pic]
[pic]
( - показатель взаимной сопряженности
K - число значений (групп) первого признака
K1 - число значений (групп) второго признака
[pic]
fij - частоты соответствующих клеток таблицы
mi - столбцы таблицы
nj - строки
Для расчета коэффициентов Пирсена и Чупрова составляется
вспомогательная таблица:
|Груп|Груп|1 |2 |... |i |Итого: |
|па |па | | | | | |
|приз|приз| | | | | |
|нака|нака| | | | | |
|Y |X | | | | | |
|1 |f11 |f12 |... |f1i |n1 |
|2 |f21 |f22 |... |f2i |n2 |
|... |... |... |... |... |... |
|j |fji |fj2 |... |fji |nj |
|Итого: |m1 |m2 |... |mi |((minj |
При ранжировании качественных признаков с целью изучения их
взаимосвязи используется коэффициент корреляции Кэндалла.
[pic]
n - число наблюдений
S - сумма разностей между числом последовательностей и числом инвервий по
второму признаку.
S=P+Q
P - сумма значений рангов, следующих за данными и превышающих его величину
Q - сумма значений рангов, следующих за данными и меньших его величины
(учитывается со знаком «-»).
При наличии связанных рангов формула коэффициента Кендалла будет
следующей:
[pic]
Vx и Vy определяются отдельно для рангов X и Y по формуле:
[pic]
51. Статистические методы изучения взаимосвязей.
Важное место в статистическом изучении взаимосвязей занимают
следующие методы:
1. Метод приведения параллельных данных.
2. Метод аналитических группировок.
3. Графический метод.
4. Балансовый метод.
5. Индексный метод.
6. Корреляционно-регрессионный.
1. Сущность метода приведения параллельных данных заключается в следующем:
Исходные данные по признаку X располагаются в порядке возрастания
или убывания, а по признаку Y записываются соответствующие им показатели.
Путем сопоставления значений X и Y, делается вывод о наличии и направлении
зависимости.
3. Сущность графического метода составляет наглядное представление наличия
и направления взаимосвязей между признаками. Для этого значение факторного
признака X располагается по оси абсцисс, а значение результативного
признака по оси ординат. По совместному расположению точек на графике
делают вывод о направлении и наличии зависимости. При этом возможны
следующие варианты:
а (, б/ (вверх) , в (вниз).
Если точки на графике расположены беспорядочно (а), то зависимость
между изучаемыми признаками отсутствует.
Если точки на графике концентрируются вокруг прямой (б)/,
зависимость между признаками прямая.
Если точки концентрируются вокруг прямой (в), то это
свидетельствует о наличии обратной зависимости.
На основе метода параллельных данных и графического метода, могут
быть рассчитаны показатели, характеризующие степень тесноты корреляционной
зависимости.
Наиболее кратным из них является коэффициент знаков Фехнера. Он
рассчитывается по формуле:
[pic]
C - сумма совпадающих знаков отклонений индивидуальных значений признака от
средней.
H - сумма несовпадений
Данный коэффициент изменяется в пределах (-1;1).
Значение KF=0 свидетельствует об отсутствии зависимости между
изучаемыми признаками.
Если KF=(1, то это говорит о наличии функциональной прямой (+) и
обратной (-) зависимости. При значении KF>(0,6( делается вывод о наличии
сильной прямой (обратной) зависимости между признаками.
[pic] - квадраты разности рангов
(R2-R1), n - число пар рангов
Данный коэффициент, как и предыдущий, изменяется в тех же пределах и
имеет одинаковую с KF экономическую интерпретацию.
52. Непараметрические показатели тесноты взаимосвязи. Спирмен. Кендалл.
54. Понятие ранга динамики. Виды динамических рядов.
В анализе социально-экономических явлений часто приходится прибегать
к различным условным оценкам, например рангам, а взаимосвязь между
отдельными признаками измерять с помощью непараметрических коэффициентов
связи. Данные коэффициенты исчисляются при условии, что исследуемые
признаки подчиняются различным законам распределения.
Ранжирование - это процедура упорядочения объектов изучения, которая
выполняется на основе предпочтения.
Ранг - это порядковый номер значений признака, расположенных в
порядке возрастания или убывания их величин. Если значения признака имеют
одинаковую количественную оценку, то ранг всех этих значений принимается
равным средней арифметической от соответствующих номеров мест, которые
определяют. Данные ранги называют связными.
Принцип нумерации значений исследуемых признаков является основой
непараметрических методов изучения взаимосвязи между социально-
экономическими явлениями и процессами.
Среди непараметрических методов оценки тесноты связи наибольшее
значение имеют ранговые коэффициенты Спирмена (() и Кендалла ((). Эти
коэффициенты могут быть использованы для определения частоты связей как
между количественными, так и между качественными признаками при условии,
если их значения упорядочить или проранжировать по степени убывания или
возрастания признака.
Коэффициент корреляции рангов (коэффициент Спирмена) рассчитывается
по формуле (для случая, когда нет связных рангов). Коэффициент Спирмена
принимает любые значения в интервале [-1;1].
Ранговый коэффициент корреляции Кендалла (() может также
использоваться для измерения взаимосвязи между качественными признаками,
характеризующими однородные объекты, ранжированные по одному принципу.
Расчет данного коэффициента выполняется в следующей
последовательности:
1. Значения X ранжируются в порядке возрастания или убывания
2. Значения Y располагаются в порядке, соответствующим значениям X
3. Для каждого ранга Y определяется число следующих за ним значений рангов,
превышающих его величину
4. Для ранга Y определяется число следующих за ним рангов, меньших его
величины. Суммарная величина обозначается через Q и фиксируется со знаком (-
)
5. Определяется сумма баллов по всем членам ряда.
Для определения тесноты связи между произвольным числом
ранжированных признаков применяется множественный коэффициент ранговой
корреляции (коэффициент конкордации) (W).
53. Показатели взаимной сопряженности.
Для исследования взаимосвязи качественных альтернативных признаков,
принимающих только 2 взаимоисключающих значения, используется коэффициент
ассоциации и контингенции. При расчете этих коэффициентов составляется т.н.
таблица 4-х камней, а сами коэффициенты рассчитываются по формуле:
[pic]
[pic]
|Группы |Группы |+ |- |Итого: |
|по |по | | | |
|признак|признак| | | |
|у Y |у X | | | |
|+ |a |b |a+b |
|- |c |d |c+d |
|Итого: |a+c |c+d |a+b+c+d |
Если коэффициент ассоциации ( 0,5, а коэффициент контингенции ( 0,3,
то можно сделать вывод о наличии существенной зависимости между изучаемыми
признаками.
Если признаки имеют 3 или более градаций, то для изучения
взаимосвязей используются коэффициенты взаимной сопряженности Пирсена и
Чупрова. Они рассчитываются по формулам:
С - коэффициент Пирсена
К - коэффициент Чупрова
[pic]
[pic]
( - показатель взаимной сопряженности
K - число значений (групп) первого признака
K1 - число значений (групп) второго признака
[pic]
fij - частоты соответствующих клеток таблицы
mi - столбцы таблицы
nj - строки
Для расчета коэффициентов Пирсена и Чупрова составляется
вспомогательная таблица:
|Груп|Груп|1 |2 |... |i |Итого: |
|па |па | | | | | |
|приз|приз| | | | | |
|нака|нака| | | | | |
|Y |X | | | | | |
|1 |f11 |f12 |... |f1i |n1 |
|2 |f21 |f22 |... |f2i |n2 |
|... |... |... |... |... |... |
|j |fji |fj2 |... |fji |nj |
|Итого: |m1 |m2 |... |mi |((minj |
При ранжировании качественных признаков с целью изучения их
взаимосвязи используется коэффициент корреляции Кэндалла.
[pic]
n - число наблюдений
S - сумма разностей между числом последовательностей и числом инвервий по
второму признаку.
S=P+Q
P - сумма значений рангов, следующих за данными и превышающих его величину
Q - сумма значений рангов, следующих за данными и меньших его величины
(учитывается со знаком «-»).
При наличии связанных рангов формула коэффициента Кендалла будет
следующей:
[pic]
Vx и Vy определяются отдельно для рангов X и Y по формуле:
[pic]
55. Сопоставимость уровней и смыкаемость рядов динамики.
Важнейшим условием правильного построения ряда динамики является
сопоставимость всех входящих в него входящих в него уровней. Данное условие
решается либо в процессе сбора и обработки данных, либо путем их пересчета.
Несопоставимость уровней ряда может возникнуть вследствие изменения
единиц измерения или единиц счета.
На сопоставимость уровней ряда динамики непосредственно влияет
методология учета или расчета показателей. Например, если в одни годы
среднюю урожайность считали с засеянной площади, а в другие - с убранной,
то такие уровни будут несопоставимы.
Условием сопоставимости уровней ряда динамики является периодизация
динамики. В процессе развития во времени прежде всего приосходят
количественные изменения явлений, а затем на определенных ступенях
совершаются качественные скачки, приводящие к изменению закономерности
явления. Поэтому научный подход к изучению рядов динамики заключается в
том, чтобы ряды, охватывающие большие периоды времени, расчленять на такие,
которые бы объединяли лишь однокачественные периоды развития совокупности,
характеризующейся одной закономерностью развития.
Процесс выделения однородных этапов развития носит название
периодизации динамики.
Важно также, чтобы в ряду динамики интервалы или моменты, по которым
определены уровни, имели одинаковый экономический смысл. Например, при
изучении роста поголовья скота бессмысленно сравнивать цифры поголовья по
состоянию на 1 октября с 1 января, так как первая цифра включает не только
скот, оставшийся на зимовку, но и предназначенный к убою, а вторая цифра
включает только скот, оставленный на зимовку.
Уровни ряда динамики могут оказаться несопоставимыми по кругу
охватываемых объектов вследствие перехода ряда объектов из одного
подчинения в другое.
Несопоставимость уровней ряда может возникнуть вследствие изменений
территориальных границ областей, районов и т.д. При этом, говоря об
изменении территории, к которой относятся уровни ряда за разное время,
следует иметь в виду, что вопрос о сопоставимости или несопоставимости при
изменении территории решается по-разному, в зависимости от цели
исследования.
Для того чтобы привести уровни ряда динамики к сопоставимому виду,
иногда приходится прибегать к приему, который называется «смыкание рядов
динамики». Под смыканием понимают объединение в один ряд (более длинный)
двух или нескольких рядов динамики, уровни которых исчислены по разной
методологии или разным территориальным границам. Для осуществления смыкания
необходимо, чтобы для одного из периодов (переходного) имелись данные,
исчисленные по разной методологии (или в разных границах).
60. Компоненты ряда динамики.
Ряд динамики может быть подвержен влиянию факторов эволюционного и
осциллятивного характера, а также находиться под влиянием факторов разного
воздействия.
Влияния эволюционного характера - это изменения, определяющие некое
общее направление развития, как бы многолетнюю эволюцию, которая пробивает
себе дорогу через другие систематические и случайные колебания. Такие
изменения динамического ряда называются тенденцией развития, или трендом.
Влияния осциллятивного характера - это циклические (конъюнктурные) и
сезонные колебания. Циклические (или периодические) состоят в том, что
значение изучаемого признака в течение какого-то времени возрастает,
достигает определенного максимума, затем понижается, достигает
определенного минимума, вновь возрастает до прежнего значения и т.д.
Циклические колебания в экономических процессах примерно соответствуют так
называемым циклам конъюнктуры. Сезонные колебания - это колебания,
периодически повторяющиеся в некоторое определенное время каждого года, дни
месяца или часы дня. Эти изменения отчетливо наблюдаются на графиках многих
рядов динамики, содержащих данные за период не менее одного года.
Нерегулярные колебания для социально-экономических явлений можно
разделить на две группы: а) спорадически наступающие изменения, вызванные,
например, войной или экологической катастрофой; б) случайные колебания,
являющиеся результатом действия большого количества относительно слабых
второстепенных факторов.
61. Методы выявления тенденции рядов динамики.
62. Определение основной тенденции динамики на основе укрупнения интервалов
и скользящей средней.
Уровни ряда динамики формируются под вниманием 3-х групп факторов:
1. Факторов определяющих основное направление, т.е. тенденцию развития
изучаемого явления.
2. Факторов действующих периодически, т.е. направленных колебаний по
неделям месяца, месяцам года и т.д.
3. Факторов действующих в разных, иногда в противоположных направлениях и
не оказывающих существенного влияния на уровень данного ряда динамики.
Основной задачей статистического изучения данамики является
выявление тенденции.
Основными методами выявления тенденции рядов динамики являются:
- метод укрупнения интервалов
- метод скользящей средней
- метод аналитического выравнивания
1. Сущность метода укрупнения интервалов заключается в следующем:
Исходный ряд динамики преобразуется и заменяется другими состоящими
из других уровней, относящихся к укрупненным периодам или моментам времени.
Например: ряд динамики прибыли малого предприятия за 1997 год по кварталам
того же года. При этом уровни ряда за укрупненные периоды или моменты
времени могут представлять собой либо суммарные, либо средние показатели.
Однако в любом случае рассчитанные таким образом уровни ряда более
отчетливо выявляют тенденции, поскольку сезонные и случайные колебания при
суммировании или определении средних взаимопогашаются и уравновешиваются.
2. Метод скользящей средней, как и предыдущий предполагает преобразование
исходного ряда динамики. Для выявления тенденции формируются интервал,
состоящий из одинакового числа уровней. При этом каждый последующий
интервал получается путем смещения на 1 уровень от начального. По
образованным таким образом интервалам определяются в начале сумма, а затем
средние. Технически удобнее определять скользящие средние для нечетного
интервала. В этом случае рассчитанная средняя величина будет относиться к
конкретному уровню ряда динамики, т.е. к середине интервала скольжения.
При определении скользящей средней по четному интервалу, расчетное
значение средней величины относится к промежутку между двумя уровнями, и
таким образом теряют экономический
|