Анализ интервального вариационного ряда "Численность экономически активного населения по субъектам Российской Федерации в 2012 году"

Табличное и графическое представление вариационного ряда. Определение среднестатистической численности населения в субъектах России. Характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса и применением критерия согласия Пирсона.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 17.11.2014
Размер файла 403,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

t-тест для одной выборки

Этот тест используется для проверки гипотезы о том, что математическое ожидание случайной величины X, представленной выборкой xS , имеет заданное значение ?. Тест требует, чтобы переданная в него выборка являлась выборкой нормальной случайной величины.

В процессе своей работы тест вычисляет t-статистику

Если величина X распределена нормально, то статистика t будет иметь распределение Стьюдента с N-1 степенями свободы. Это позволяет нам использовать распределение Стьюдента для определения уровня значимости, соответствующего полученному значению t-статистики.

Замечание.

В случае если X не является нормальной случайной величиной, то величина t будет иметь другое, неизвестное распределение, и, строго говоря, t-тест Стьюдента нельзя применять. Однако в соответствии с центральной предельной теоремой при росте размера выборки распределение t будет стремиться к распределению Стьюдента. Таким образом, если размер выборки достаточно велик, то мы можем использовать t-тест, даже если требование нормальности распределения не выполняется. Однако не существует простого способа определить, какое N достаточно велико. В каждом конкретном случае есть своя граница, зависящая от того, насколько исследуемое распределение отклоняется от нормального. Некоторые источники приводят в качестве «достаточно большого N» 30, но даже этот размер выборки может оказаться недостаточен. Альтернативой в этом случае может являться непараметрический тест - критерий знаков или W-критерий Уилкоксона.

При необходимости сравнения только двух групп можно использовать частный случай дисперсионного анализа -- критерий Стьюдента. Если при проведении t-анализа имеются только средние значения, величина стандартного отклонения и численностью групп можно пойти по пути изучения возможности R.

Ниже приведем сравнение статистических показателей рассчитанных различными способами (табл.5.3)

Таблица 5.3

Название показателя

Значение в ППП STATISTIKA

Значения ручного расчета по сгруппированным данным

1

Средняя арифметическая

755,7558

779,6

2

Медиана

568,0000

578,8

3

Мода

439,0000

448,0

4

Дисперсия

369995,4

389243,3

5

Верхний квартиль

362,0000

387,0

6

Нижний квартиль

1054,0000

1069,0

7

Размах вариации

2635,0000

2635,0

8

Среднее квадратическое отклонение

608,2725

612,275

6. Сглаживание эмпирического распределения

Проверка гипотезы о законе распределения

Сравнивая полученные величины теоретических частот f' c эмпирическими (фактическими) частотами f, убеждаемся, что их расхождения могут быть весьма невелики.

В данное распределение близко к нормальному.

Объективная характеристика соответствия теоретических и эмпирических частот может быть получена при помощи специальных статистических показателей, которые называют критериями согласия.

Для оценки близости эмпирических и теоретических частот применяются критерий согласия Пирсона, критерий согласия Романовского, критерий согласия Колмогорова.

Наиболее распространенным является критерий согласия Пирсона,, который можно представить как сумму отношений квадратов расхождений между f' и f к теоретическим частотам по формуле 6.1:

(6.1)

Вычисленное значение критерия необходимо сравнить с табличным (критическим) значением . Табличное значение определяется по специальной таблице, оно зависит от принятой вероятности Р и числа степеней свободы k (при этом k = m - 3, где m - число групп в ряду распределения для нормального распределения). При расчете критерия согласия Пирсона должно соблюдаться следующее условие: достаточно большим должно быть число наблюдений (n 50), при этом если в некоторых интервалах теоретические частоты < 5, то интервалы объединяют для условия > 5.

Если , то расхождения между эмпирическими и теоретическими частотами распределения могут быть случайными и предположение о близости эмпирического распределения к нормальному не может быть отвергнуто.

Используя статистическую таблицу 1.4 (стр.19) и методические указания произведем расчет и анализ значений критерия согласия Пирсона, объединив некоторые интервалы с частотами < 5 предыдущих интервальных рядов:

Таблица 6.1 Таблица для расчёта сглаживания эмпирического распределения.

1

10

340

175

21

-0,95476

-20,05

-59,5298

-108,938

2

340

670

505

27

-0,41224

-11,1305

-42,4894

-113,647

3

670

1000

835

15

0,130277

1,954162

4,144309

28,43563

4

1000

1300

1150

9

0,648137

5,833237

7,422538

0,335247

5

1300

1660

1480

5

1,190657

5,953287

4,208498

0,14886

6

1660

1990

1825

5

1,757837

8,789187

6,213252

0,23691

7

1990

2650

2320

4

2,571617

10,28647

5,817369

0,567753

k

86

-74,2132

-192,86

рассчитаем в Microsoft Excel по формуле (6.2)

(6.2)

Где x - значение изучаемого признака;

- среднее арифметическое (в нашем случае 755,7558);

- среднее квадратическое (в нашем случае 608,2725)

Аналогично рассчитываем по формуле(6.3):

6.3)

где N - объем совокупности; h - величина интервала

Если все эмпирические частоты равны соответствующим теоретическим частотам, то ?2 равно нулю. Очевидно, что чем больше отличаются эмпирические и теоретические частоты, тем ?2 больше; если расхождение несущественно, то ?2 должно быть малым. Имеются специальные таблицы критических значений ?2 при 5%-ном и 1%-ном уровнях значимости. Критические значения зависят от числа степеней свободы (d.f. - degrees of freedom) и уровня значимости.

Число степеней свободы рассчитывается так: если эмпирический ряд распределения имеет k категорий, то k эмпирических частот f1, f2, …, fk должны быть связаны следующим соотношением:

Если параметры теоретического распределения известны, то только k - 1 частот могут принимать произвольные значения, т. Е. свободно варьировать, а последняя частота может быть найдена из указанного соотношения. Поэтому говорят, что система из k частот благодаря наличию одной связи теряет одну «степень свободы» и имеет только k -- 1 степеней свободы. Кроме того, если при нахождении теоретических частот р параметров теоретического распределения неизвестны, то они должны быть найдены по данным эмпирического ряда. Это накладывает на эмпирические частоты еще р связей, благодаря чему система теряет еще р степеней свободы. Таким образом, число свободно варьируемых частот (а значит, и число степеней свободы) становится равным:

d.f. = (k - 1) - р = k - (р + 1).

Полученное значение критерия ?2 сравнивается с табличным при числе степеней свободы, равном числу групп (с условием Ф. Йейтса), за минусом трех - по числу фиксированных параметров в формуле нормального закона распределения и с учетом равенства сумм теоретических и фактических частот.

Сумма теоретических частот нормального распределения меньше суммы фактических частот, так как нормальный закон не ограничен рамками фактических минимума и максимума.

Ясно, что гипотеза о соответствии распределения хозяйств по урожайности нормальному закону не может быть отклонена.

Какое практическое значение может иметь произведенная проверка гипотезы? Во-первых, соответствие нормальному закону позволяет прогнозировать, какое число хозяйств (или доля совокупности) попадает в тот или иной интервал значений признака. Во-вторых, нормальное распределение возникает при действии на вариацию изучаемого показателя множества независимых факторов. Из этого следует, что нельзя существенно снизить вариацию урожайности, воздействуя только на один-два управляемых фактора, скажем удобрения или энергозатраты.

С помощью критерия ?2 можно проверять не только гипотезу о согласии эмпирического распределения с нормальным законом, но и с любым другим известным законом распределения - равномерным распределением, распределением Пуассона и т. Д. Например, суд рассматривает жалобу посетителей казино на то, что, по их мнению, игральная кость, которой там пользуются, фальшива, некоторые числа очков, якобы, выпадают чаще, чем другие, и этим пользуются крупье, обирающие игроков.

Суд назначает экспертизу игральной кости: эксперт делает 600 бросков и записывает число выпавших единиц, двоек, троек и т. Д.

Полученное эмпирическое распределение сравнивается с теоретическим, т. Е. равномерным: в правильной кости вероятность выпадения каждого числа очков должна быть равна 1/6, при 600 бросках это даст по 100 выпадений каждого числа очков. С помощью критерия ?2 проверяется нулевая гипотеза о том, что различия эмпирического и теоретического распределений случайны, т. Е. не являются систематическим результатом фальсификации формы кости или положения центра тяжести в ней; H0 : fфакт = fтеор

Используя методические указания и программу STATISTICA, произведем сглаживание эмпирического распределения путём последовательного построения нормального, логнормального и прямоугольного типов распределения.

В результате получим следующие таблицы (Таб.6.2 - Таб.6.4)

Проверка гипотезы о нормальном распределении переменной Var1.

Проверка гипотезы о прямоугольном распределении переменной Var1

Проверка гипотезы о логарифмически нормальном распределении переменной Var1.

Проиллюстрируем полученные данные, сгладив эмпирическое распределение переменной Var1 нормальным распределением а соответствии с рисунками (Рис.6.1. - Рис.6.3.)

Таблица 6.2

Upper

Boundare

Variable: Var1, Distribution: Normal (Spreadsheet41) Chi-Square = 12,19147, df = 3 (adjusted) , p = 0,00676

Observed Frequency

Cumulative Observed

Percent Observed

Cumul.% Observed

Expected Frequency

Cumulative Expected

Percent Expected

Cumul. % Expected

Observed Expected

<=339.375

21

21

24.41860

24.4186

21.22654

21.22654

24.68202

24.6820

-0.22654

668.750

27

48

31.39535

55.8140

16.88266

38.10920

19.63100

44.3130

10.11734

998.125

15

63

17.44186

73.2558

18.20812

56.31732

21.17223

82.6373

-3.20812

1327.50

9

72

10.46512

83.7209

14.75117

71.06849

17.15252

82.6378

-5.75117

1656.875

5

77

5.81395

89.5349

8.97647

80.04496

10.43776

93.0755

-3.97647

1986.25

5

82

5.81395

95.3488

4.10260

84.14756

4.77046

97.8460

0.89740

2315.625

1

83

1.16279

96.5116

1.40805

85.55561

1.63727

99.4833

-0.40805

< infinity

3

86

3.48837

100.000

0.44439

86.00000

0.51673

100.000

2.55561

Таблица 6.3

Upper

Boundare

Variable: Var1, Distribution: Rectangular (Spreadsheet44) Chi-Square = 56,88372, df = 5, p = 0,00000

Observed Frequency

Cumulative Observed

Percent Observed

Cumul.% Observed

Expected Frequency

Cumulative Expected

Percent Expected

Cumul. % Expected

Observed Expected

<=339.375

21

21

24.41860

24.4186

10,77040

10,77040

12,52372

12,5237

10,22960

668.7500

27

48

31.39535

55.8140

10,77040

21,54080

12,52372

25,0474

16,22960

998.1250

15

63

17.44186

73.2558

10,77040

32,31120

12,52372

37,5712

4,22960

1327.500

9

72

10.46512

83.7209

10,77040

43,08159

12,52372

50,0949

-1,77040

1656.875

5

77

5.81395

89.5349

10,77040

53,85199

12,52372

62,6186

-5,77040

1986.250

5

82

5.81395

95.3488

10,77040

64,62239

12,52372

75,1423

-5,77040

2315.625

1

83

1.16279

96.5116

10,77040

75,39279

12,52372

87,6660

-9,77040

< infinity

3

86

3.48837

100.0000

10.60721

86.00000

12,33397

100,000

-7,60721

Таблица 6.4.

Upper

Boundare

Variable: Var1, Distribution: Rectangular (Spreadsheet44) Chi-Square = 56,88372, df = 5, p = 0,00000

Observed Frequency

Cumulative Observed

Percent Observed

Cumul.% Observed

Expected Frequency

Cumulative Expected

Percent Expected

Cumul. % Expected

Observed Expected

<=339.3750

21

21

24.41860

24.4186

33,00682

33,00682

38,38002

38,3800

-12,0068

668.75000

27

48

31.39535

55.8140

19,44743

52,45425

22,61329

60,9933

7,5526

998.12500

15

63

17.44186

73.2558

10,48496

62,93920

12,19181

73,1851

4,5150

1327.50000

9

72

10.46512

83.7209

6,30037

69,23957

7,32601

80,5111

2,6996

1656.87500

5

77

5.81395

89.5349

4,08683

73,32640

4,75213

85,2633

0,9132

1986.25000

5

82

5.81395

95.3488

2,80099

76,12739

3,25697

88,5202

2,1990

2315.62500

1

83

1.16279

96.5116

2,00097

78,12836

2,32671

90,8469

-1,0010

< infinity

3

86

3.48837

100.0000

7,87164

86.00000

9,15307

100,0000

-4,8716

Рис. 6.1

Рис. 6.2

Рис. 6.3

Заключение

В рассмотренной таблице интервального вариационного ряда «Численность экономически активного населения по субъектам Российской Федерации в 2012 году» определена среднестатистическая численность населения в субъектах России, при этом выбросами оказались Москва и Московская область.

Наибольшая часть населения России проживает в субъектах Федерации с численностью от 275 до 540 тыс. чел.

Мода таблицы составляет 439 тыс. чел., медиана 568 тыс. чел., при этом мода в таблице возникла по причине наличия в составе России 2 регионов с одинаковым количеством жителей (в противно случае таблица была бы полимодальной).

Среднее арифметическое составляет 755,7558 тыс. чел., что дополнительно свидетельствует о факте проживания основного населения России в относительно небольших по численности субъектах Федерации.

Проведенная характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса показал, что имеет место нормальное распределение с правосторонней асимметрией.

Это же было проверено критериями согласия Пирсона.

Список использованной литературы

1. Боровиков В.П., STATISTICA. Искусство анализа данных на компьютере: для профессионалов / В.П. Боровиков. - 2-е изд. - СПб. : - 2011. - 688 с.

2. Венецкий И.Г., Основные математико-статистические понятия и формулы в экономическом анализе. Справочник / И.Г. Венецкий, В.И. Венецкая. - 2-е изд., перераб. и доп. - М.: Статистика, 1979 - 477 с.

3. Ефимова М.Р., Общая теория статистики: учеб. / М.Р. Ефимова, Е.В. Петрова, В.Н. Румянцев. - М.: ИНФРА-М, 2002. - 416 с.

Размещено на Allbest.ru


Подобные документы

  • Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.

    курсовая работа [70,7 K], добавлен 26.10.2011

  • Построение интервального вариационного ряда распределения стран Европы по объему импорта с Россией, выделение четырех групп стран с равными интервалами. Определение среднемесячных и среднегодовых остатков сырья, материалов, фурнитуры на складе ателье.

    контрольная работа [69,3 K], добавлен 16.11.2011

  • Понятие и назначение, порядок и правила построения вариационного ряда. Анализ однородности данных в группах. Показатели вариации (колеблемости) признака. Определение среднего линейного и квадратического отклонения, коэффициента осцилляции и вариации.

    контрольная работа [354,6 K], добавлен 26.04.2010

  • Показатели естественного движения населения, структура его доходов и расходов. Построение и анализ вариационного ряда по уровню номинальной оплаты труда. Применение статистических методов в анализе факторов, влияющих на изменение уровня жизни населения.

    курсовая работа [831,9 K], добавлен 06.11.2014

  • Построение таблицы и графиков ряда распределения. Показатели центра и структуры распределения. Характеристика формы распределения. Распределение показателей регионов России по показателям оборота малых предприятий. Ранжирование вариационного ряда.

    курсовая работа [344,1 K], добавлен 21.03.2014

  • Анализ эффективности деятельности предприятий. Построение статистического ряда распределения организаций по выручке от продажи продукции. Вычисление медианы для интервального вариационного ряда. Группировка предприятий по выручке от продажи продукции.

    контрольная работа [82,4 K], добавлен 30.04.2014

  • Построение дискретного и интервального вариационного ряда работы горных предприятий. Вычисление характеристик меры и степени вариации. Определение основных показателей, показывающих направление и интенсивность количественных изменений динамического ряда.

    курсовая работа [381,0 K], добавлен 13.12.2011

  • Расчет коэффициентов рождаемости, смертности, естественного прироста, прибытия, выбытия и миграции населения в Республике Казахстан. Определение численности экономически активного населения, структуры и размера трудовых ресурсов, уровня безработицы.

    контрольная работа [115,1 K], добавлен 05.04.2015

  • Общие понятия экономически активного населения и трудовых ресурсов; баланс трудовых ресурсов. Проблемы занятости и безработицы в странах мира и в Российской Федерации. Статистика численности работников, использования рабочего времени, заработной платы.

    курсовая работа [317,9 K], добавлен 15.12.2009

  • Способы и методика расчета среднего количества перевозимого груза, среднеквадратическое отклонение и коэффициент вариации, коэффициент ассиметрии. Ранжирование ряда "дальность пробега", составление интервального вариационного ряда по формуле Стэрджесса.

    контрольная работа [67,0 K], добавлен 30.01.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.