Анализ интервального вариационного ряда "Численность экономически активного населения по субъектам Российской Федерации в 2012 году"
Табличное и графическое представление вариационного ряда. Определение среднестатистической численности населения в субъектах России. Характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса и применением критерия согласия Пирсона.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 17.11.2014 |
Размер файла | 403,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
t-тест для одной выборки
Этот тест используется для проверки гипотезы о том, что математическое ожидание случайной величины X, представленной выборкой xS , имеет заданное значение ?. Тест требует, чтобы переданная в него выборка являлась выборкой нормальной случайной величины.
В процессе своей работы тест вычисляет t-статистику
Если величина X распределена нормально, то статистика t будет иметь распределение Стьюдента с N-1 степенями свободы. Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.
Замечание.
В случае если X не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Однако в соответствии с центральной предельной теоремой при росте размера выборки распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборки достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределения не выполняется. Однако не существует простого способа определить, какое N достаточно велико. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемое распределение отклоняется от нормального. Некоторые источники приводят в качестве «достаточно большого N» 30, но даже этот размер выборки может оказаться недостаточен. Альтернативой в этом случае может являться непараметрический тест - критерий знаков или W-критерий Уилкоксона.
При необходимости сравнения только двух групп можно использовать частный случай дисперсионного анализа -- критерий Стьюдента. Если при проведении t-анализа имеются только средние значения, величина стандартного отклонения и численностью групп можно пойти по пути изучения возможности R.
Ниже приведем сравнение статистических показателей рассчитанных различными способами (табл.5.3)
Таблица 5.3
№ |
Название показателя |
Значение в ППП STATISTIKA |
Значения ручного расчета по сгруппированным данным |
|
1 |
Средняя арифметическая |
755,7558 |
779,6 |
|
2 |
Медиана |
568,0000 |
578,8 |
|
3 |
Мода |
439,0000 |
448,0 |
|
4 |
Дисперсия |
369995,4 |
389243,3 |
|
5 |
Верхний квартиль |
362,0000 |
387,0 |
|
6 |
Нижний квартиль |
1054,0000 |
1069,0 |
|
7 |
Размах вариации |
2635,0000 |
2635,0 |
|
8 |
Среднее квадратическое отклонение |
608,2725 |
612,275 |
6. Сглаживание эмпирического распределения
Проверка гипотезы о законе распределения
Сравнивая полученные величины теоретических частот f' c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.
В данное распределение близко к нормальному.
Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.
Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.
Наиболее распространенным является критерий согласия Пирсона,, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам по формуле 6.1:
(6.1)
Вычисленное значение критерия необходимо сравнить с табличным (критическим) значением . Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты < 5, то интервалы объединяют для условия > 5.
Если , то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.
Используя статистическую таблицу 1.4 (стр.19) и методические указания произведем расчет и анализ значений критерия согласия Пирсона, объединив некоторые интервалы с частотами < 5 предыдущих интервальных рядов:
Таблица 6.1 Таблица для расчёта сглаживания эмпирического распределения.
№ |
|||||||||
1 |
10 |
340 |
175 |
21 |
-0,95476 |
-20,05 |
-59,5298 |
-108,938 |
|
2 |
340 |
670 |
505 |
27 |
-0,41224 |
-11,1305 |
-42,4894 |
-113,647 |
|
3 |
670 |
1000 |
835 |
15 |
0,130277 |
1,954162 |
4,144309 |
28,43563 |
|
4 |
1000 |
1300 |
1150 |
9 |
0,648137 |
5,833237 |
7,422538 |
0,335247 |
|
5 |
1300 |
1660 |
1480 |
5 |
1,190657 |
5,953287 |
4,208498 |
0,14886 |
|
6 |
1660 |
1990 |
1825 |
5 |
1,757837 |
8,789187 |
6,213252 |
0,23691 |
|
7 |
1990 |
2650 |
2320 |
4 |
2,571617 |
10,28647 |
5,817369 |
0,567753 |
|
k |
86 |
-74,2132 |
-192,86 |
рассчитаем в Microsoft Excel по формуле (6.2)
(6.2)
Где x - значение изучаемого признака;
- среднее арифметическое (в нашем случае 755,7558);
- среднее квадратическое (в нашем случае 608,2725)
Аналогично рассчитываем по формуле(6.3):
6.3)
где N - объем совокупности; h - величина интервала
Если все эмпирические частоты равны соответствующим теоретическим частотам, то ?2 равно нулю. Очевидно, что чем больше отличаются эмпирические и теоретические частоты, тем ?2 больше; если расхождение несущественно, то ?2 должно быть малым. Имеются специальные таблицы критических значений ?2 при 5%-ном и 1%-ном уровнях значимости. Критические значения зависят от числа степеней свободы (d.f. - degrees of freedom) и уровня значимости.
Число степеней свободы рассчитывается так: если эмпирический ряд распределения имеет k категорий, то k эмпирических частот f1, f2, …, fk должны быть связаны следующим соотношением:
Если параметры теоретического распределения известны, то только k - 1 частот могут принимать произвольные значения, т. Е. свободно варьировать, а последняя частота может быть найдена из указанного соотношения. Поэтому говорят, что система из k частот благодаря наличию одной связи теряет одну «степень свободы» и имеет только k -- 1 степеней свободы. Кроме того, если при нахождении теоретических частот р параметров теоретического распределения неизвестны, то они должны быть найдены по данным эмпирического ряда. Это накладывает на эмпирические частоты еще р связей, благодаря чему система теряет еще р степеней свободы. Таким образом, число свободно варьируемых частот (а значит, и число степеней свободы) становится равным:
d.f. = (k - 1) - р = k - (р + 1).
Полученное значение критерия ?2 сравнивается с табличным при числе степеней свободы, равном числу групп (с условием Ф. Йейтса), за минусом трех - по числу фиксированных параметров в формуле нормального закона распределения и с учетом равенства сумм теоретических и фактических частот.
Сумма теоретических частот нормального распределения меньше суммы фактических частот, так как нормальный закон не ограничен рамками фактических минимума и максимума.
Ясно, что гипотеза о соответствии распределения хозяйств по урожайности нормальному закону не может быть отклонена.
Какое практическое значение может иметь произведенная проверка гипотезы? Во-первых, соответствие нормальному закону позволяет прогнозировать, какое число хозяйств (или доля совокупности) попадает в тот или иной интервал значений признака. Во-вторых, нормальное распределение возникает при действии на вариацию изучаемого показателя множества независимых факторов. Из этого следует, что нельзя существенно снизить вариацию урожайности, воздействуя только на один-два управляемых фактора, скажем удобрения или энергозатраты.
С помощью критерия ?2 можно проверять не только гипотезу о согласии эмпирического распределения с нормальным законом, но и с любым другим известным законом распределения - равномерным распределением, распределением Пуассона и т. Д. Например, суд рассматривает жалобу посетителей казино на то, что, по их мнению, игральная кость, которой там пользуются, фальшива, некоторые числа очков, якобы, выпадают чаще, чем другие, и этим пользуются крупье, обирающие игроков.
Суд назначает экспертизу игральной кости: эксперт делает 600 бросков и записывает число выпавших единиц, двоек, троек и т. Д.
Полученное эмпирическое распределение сравнивается с теоретическим, т. Е. равномерным: в правильной кости вероятность выпадения каждого числа очков должна быть равна 1/6, при 600 бросках это даст по 100 выпадений каждого числа очков. С помощью критерия ?2 проверяется нулевая гипотеза о том, что различия эмпирического и теоретического распределений случайны, т. Е. не являются систематическим результатом фальсификации формы кости или положения центра тяжести в ней; H0 : fфакт = fтеор
Используя методические указания и программу STATISTICA, произведем сглаживание эмпирического распределения путём последовательного построения нормального, логнормального и прямоугольного типов распределения.
В результате получим следующие таблицы (Таб.6.2 - Таб.6.4)
Проверка гипотезы о нормальном распределении переменной Var1.
Проверка гипотезы о прямоугольном распределении переменной Var1
Проверка гипотезы о логарифмически нормальном распределении переменной Var1.
Проиллюстрируем полученные данные, сгладив эмпирическое распределение переменной Var1 нормальным распределением а соответствии с рисунками (Рис.6.1. - Рис.6.3.)
Таблица 6.2
Upper Boundare |
Variable: Var1, Distribution: Normal (Spreadsheet41) Chi-Square = 12,19147, df = 3 (adjusted) , p = 0,00676 |
|||||||||
Observed Frequency |
Cumulative Observed |
Percent Observed |
Cumul.% Observed |
Expected Frequency |
Cumulative Expected |
Percent Expected |
Cumul. % Expected |
Observed Expected |
||
<=339.375 |
21 |
21 |
24.41860 |
24.4186 |
21.22654 |
21.22654 |
24.68202 |
24.6820 |
-0.22654 |
|
668.750 |
27 |
48 |
31.39535 |
55.8140 |
16.88266 |
38.10920 |
19.63100 |
44.3130 |
10.11734 |
|
998.125 |
15 |
63 |
17.44186 |
73.2558 |
18.20812 |
56.31732 |
21.17223 |
82.6373 |
-3.20812 |
|
1327.50 |
9 |
72 |
10.46512 |
83.7209 |
14.75117 |
71.06849 |
17.15252 |
82.6378 |
-5.75117 |
|
1656.875 |
5 |
77 |
5.81395 |
89.5349 |
8.97647 |
80.04496 |
10.43776 |
93.0755 |
-3.97647 |
|
1986.25 |
5 |
82 |
5.81395 |
95.3488 |
4.10260 |
84.14756 |
4.77046 |
97.8460 |
0.89740 |
|
2315.625 |
1 |
83 |
1.16279 |
96.5116 |
1.40805 |
85.55561 |
1.63727 |
99.4833 |
-0.40805 |
|
< infinity |
3 |
86 |
3.48837 |
100.000 |
0.44439 |
86.00000 |
0.51673 |
100.000 |
2.55561 |
Таблица 6.3
Upper Boundare |
Variable: Var1, Distribution: Rectangular (Spreadsheet44) Chi-Square = 56,88372, df = 5, p = 0,00000 |
|||||||||
Observed Frequency |
Cumulative Observed |
Percent Observed |
Cumul.% Observed |
Expected Frequency |
Cumulative Expected |
Percent Expected |
Cumul. % Expected |
Observed Expected |
||
<=339.375 |
21 |
21 |
24.41860 |
24.4186 |
10,77040 |
10,77040 |
12,52372 |
12,5237 |
10,22960 |
|
668.7500 |
27 |
48 |
31.39535 |
55.8140 |
10,77040 |
21,54080 |
12,52372 |
25,0474 |
16,22960 |
|
998.1250 |
15 |
63 |
17.44186 |
73.2558 |
10,77040 |
32,31120 |
12,52372 |
37,5712 |
4,22960 |
|
1327.500 |
9 |
72 |
10.46512 |
83.7209 |
10,77040 |
43,08159 |
12,52372 |
50,0949 |
-1,77040 |
|
1656.875 |
5 |
77 |
5.81395 |
89.5349 |
10,77040 |
53,85199 |
12,52372 |
62,6186 |
-5,77040 |
|
1986.250 |
5 |
82 |
5.81395 |
95.3488 |
10,77040 |
64,62239 |
12,52372 |
75,1423 |
-5,77040 |
|
2315.625 |
1 |
83 |
1.16279 |
96.5116 |
10,77040 |
75,39279 |
12,52372 |
87,6660 |
-9,77040 |
|
< infinity |
3 |
86 |
3.48837 |
100.0000 |
10.60721 |
86.00000 |
12,33397 |
100,000 |
-7,60721 |
Таблица 6.4.
Upper Boundare |
Variable: Var1, Distribution: Rectangular (Spreadsheet44) Chi-Square = 56,88372, df = 5, p = 0,00000 |
|||||||||
Observed Frequency |
Cumulative Observed |
Percent Observed |
Cumul.% Observed |
Expected Frequency |
Cumulative Expected |
Percent Expected |
Cumul. % Expected |
Observed Expected |
||
<=339.3750 |
21 |
21 |
24.41860 |
24.4186 |
33,00682 |
33,00682 |
38,38002 |
38,3800 |
-12,0068 |
|
668.75000 |
27 |
48 |
31.39535 |
55.8140 |
19,44743 |
52,45425 |
22,61329 |
60,9933 |
7,5526 |
|
998.12500 |
15 |
63 |
17.44186 |
73.2558 |
10,48496 |
62,93920 |
12,19181 |
73,1851 |
4,5150 |
|
1327.50000 |
9 |
72 |
10.46512 |
83.7209 |
6,30037 |
69,23957 |
7,32601 |
80,5111 |
2,6996 |
|
1656.87500 |
5 |
77 |
5.81395 |
89.5349 |
4,08683 |
73,32640 |
4,75213 |
85,2633 |
0,9132 |
|
1986.25000 |
5 |
82 |
5.81395 |
95.3488 |
2,80099 |
76,12739 |
3,25697 |
88,5202 |
2,1990 |
|
2315.62500 |
1 |
83 |
1.16279 |
96.5116 |
2,00097 |
78,12836 |
2,32671 |
90,8469 |
-1,0010 |
|
< infinity |
3 |
86 |
3.48837 |
100.0000 |
7,87164 |
86.00000 |
9,15307 |
100,0000 |
-4,8716 |
Рис. 6.1
Рис. 6.2
Рис. 6.3
Заключение
В рассмотренной таблице интервального вариационного ряда «Численность экономически активного населения по субъектам Российской Федерации в 2012 году» определена среднестатистическая численность населения в субъектах России, при этом выбросами оказались Москва и Московская область.
Наибольшая часть населения России проживает в субъектах Федерации с численностью от 275 до 540 тыс. чел.
Мода таблицы составляет 439 тыс. чел., медиана 568 тыс. чел., при этом мода в таблице возникла по причине наличия в составе России 2 регионов с одинаковым количеством жителей (в противно случае таблица была бы полимодальной).
Среднее арифметическое составляет 755,7558 тыс. чел., что дополнительно свидетельствует о факте проживания основного населения России в относительно небольших по численности субъектах Федерации.
Проведенная характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса показал, что имеет место нормальное распределение с правосторонней асимметрией.
Это же было проверено критериями согласия Пирсона.
Список использованной литературы
1. Боровиков В.П., STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В.П. Боровиков. - 2-е изд. - СПб. : - 2011. - 688 с.
2. Венецкий И.Г., Основные математико-статистические понятия и формулы в экономическом анализе. Справочник / И.Г. Венецкий, В.И. Венецкая. - 2-е изд., перераб. и доп. - М.: Статистика, 1979 - 477 с.
3. Ефимова М.Р., Общая теория статистики: учеб. / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. - М.: ИНФРА-М, 2002. - 416 с.
Размещено на Allbest.ru
Подобные документы
Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.
курсовая работа [70,7 K], добавлен 26.10.2011Построение интервального вариационного ряда распределения стран Европы по объему импорта с Россией, выделение четырех групп стран с равными интервалами. Определение среднемесячных и среднегодовых остатков сырья, материалов, фурнитуры на складе ателье.
контрольная работа [69,3 K], добавлен 16.11.2011Понятие и назначение, порядок и правила построения вариационного ряда. Анализ однородности данных в группах. Показатели вариации (колеблемости) признака. Определение среднего линейного и квадратического отклонения, коэффициента осцилляции и вариации.
контрольная работа [354,6 K], добавлен 26.04.2010Показатели естественного движения населения, структура его доходов и расходов. Построение и анализ вариационного ряда по уровню номинальной оплаты труда. Применение статистических методов в анализе факторов, влияющих на изменение уровня жизни населения.
курсовая работа [831,9 K], добавлен 06.11.2014Построение таблицы и графиков ряда распределения. Показатели центра и структуры распределения. Характеристика формы распределения. Распределение показателей регионов России по показателям оборота малых предприятий. Ранжирование вариационного ряда.
курсовая работа [344,1 K], добавлен 21.03.2014Анализ эффективности деятельности предприятий. Построение статистического ряда распределения организаций по выручке от продажи продукции. Вычисление медианы для интервального вариационного ряда. Группировка предприятий по выручке от продажи продукции.
контрольная работа [82,4 K], добавлен 30.04.2014Построение дискретного и интервального вариационного ряда работы горных предприятий. Вычисление характеристик меры и степени вариации. Определение основных показателей, показывающих направление и интенсивность количественных изменений динамического ряда.
курсовая работа [381,0 K], добавлен 13.12.2011Расчет коэффициентов рождаемости, смертности, естественного прироста, прибытия, выбытия и миграции населения в Республике Казахстан. Определение численности экономически активного населения, структуры и размера трудовых ресурсов, уровня безработицы.
контрольная работа [115,1 K], добавлен 05.04.2015Общие понятия экономически активного населения и трудовых ресурсов; баланс трудовых ресурсов. Проблемы занятости и безработицы в странах мира и в Российской Федерации. Статистика численности работников, использования рабочего времени, заработной платы.
курсовая работа [317,9 K], добавлен 15.12.2009Способы и методика расчета среднего количества перевозимого груза, среднеквадратическое отклонение и коэффициент вариации, коэффициент ассиметрии. Ранжирование ряда "дальность пробега", составление интервального вариационного ряда по формуле Стэрджесса.
контрольная работа [67,0 K], добавлен 30.01.2009