Инструменты статистики

Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 29.11.2011
Размер файла 290,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ОГЛАВЛЕНИЕ

ВВЕДЕНИЕ

1. ОПРЕДЕЛЕНИЕ СРЕДНЕГО ЗНАЧЕНИЯ ПОКАЗАТЕЛЯ В СОВОКУПНОСТИ

2. ВАРИАЦИОННЫЙ АНАЛИЗ ПОКАЗАТЕЛЯ

3. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ХАРАКТЕРЕ РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ

4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

5. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ ПОКАЗАТЕЛЯ

6. АНАЛИЗ РЯДОВ ДИНАМИКИ

ЗАКЛЮЧЕНИЕ

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

ПРИЛОЖЕНИЯ

ВВЕДЕНИЕ

На протяжении всего времени своего существования, статистика была незаменимым помощником в ведении хозяйства, управлении государством, направлении социальных процессов.

Предмет статистики - это количественная сторона социально-экономических явлений, которая рассматривается во взаимозависимости с качественной стороной в системе общественного производства. Именно поэтому статистика является столь важной и востребованной в наши дни наукой.

Цель сводки - выявление типичных черт и закономерностей, присущих явлению в целом. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучение взаимосвязей между признаками. Если рассчитать сводные показатели только в целом по совокупности, то мы не можем уловить ее структуры, роли отдельных групп, их специфики. С помощью вариационного анализа можно найти и проанализировать структуру вариаций, силу вариаций, интенсивности вариаций, характер вариации, колеблемость признака, определить распределение признака. Изучение динамики позволяет дать характеристику изменения статистических показателей во времени, изучить развитие данного статистического показателя.

Методы статистики, перечисленные мною выше, будут применены в рамках данного курсового проекта и именно в том случае, если их применение будет являться оправданным и целесообразным. Цель данной курсовой работы - освоить инструменты статистики для дальнейшего применения в решении управленческих задач.

1. ОПРЕДЕЛЕНИЕ СРЕДНЕГО ЗНАЧЕНИЯ ПОКАЗАТЕЛЯ В

СОВОКУПНОСТИ

Формулировка задания: на основании имеющихся данных определить среднее значение показателя в совокупности. Определить размах вариации в исследуемой совокупности на основе имеющихся индивидуальных значений показателя.

Решение: Выполним простую сводку регионов РФ по показателю "Среднемесячная номинальная начисленная заработная плата (в месяц), руб." в 2007 г., т.е. занесем результаты статистического наблюдения в единый документ без какого-либо ранжирования или разделения на группы. Задача сводки - обобщить, систематизировать результаты наблюдения, чтобы стало возможным выявить характерные черты совокупности. Исходные данные были взяты из Российского статистического ежегодника 2008 года. Для дальнейших расчетов из совокупности исключаем, во-первых, те регионы, данных для которых нет в таблице, а во-вторых, субъекты РФ, значения показателя для которых уже входят в данные, приведенные для соответствующих этим субъектам областей. В результате были исключены следующие субъекты: Ненецкий автономный округ, Усть-Ордынский Бурятский автономный округ, Ханты-Мансийский автономный округ - Югра, Ямало-Ненецкий автономный округ, Агинский Бурятский автономный округ, а также Чеченская республика, т.к. по ней данные отсутствуют. В изучаемой совокупность получилось 80 субъектов.

Из приложения А можно рассчитать среднее значение показателя в совокупности. Необходимо учитывать, что оно должно быть рассчитано по формуле средней арифметической взвешенной, однако вес определить достаточно сложно, потому что неизвестно, сколько человек и сколько времени работали за весь 2007 год. Также нельзя точно определить размер заработной платы отдельного работника, поэтому в курсовой работе среднее рассчитано по формуле простой арифметической. Средняя величина - количественная характеристика общего в явлениях и процессах, характеристика статистической закономерности. Формула для расчёта простой арифметической средней величины:

Наименьшее значение показателя в совокупности равно 5696,4 рублей и оно принадлежит республике Дагестан. Наибольшее принадлежит Чукотскому автономному округу. Размах вариации, как разность между наибольшего и наименьшего значения, составил 25162,7 рублей:

Размах вариации является показателем силы вариации, поэтому он показывает насколько велик абсолютный разброс значений признака.

Выводы: В среднем по Российской Федерации на 2007г. среднемесячная номинальная начисленная заработная плата составляла -11929,2 руб. Величина размаха вариации 25162,7 рублей характеризует достаточно высокое расхождение между значениями признаков по единицам статистической совокупности, а, следовательно, и неоднородность изучаемой статистической совокупности.

2. ВАРИАЦИОННЫЙ АНАЛИЗ

Формулировка задания: провести вариационный анализ статистической совокупности по показателю, для чего:

1) построить вариационный ряд и изобразить его графически;

2) построить кумуляту и огиву (в одной системе координат);

3) рассчитать показатели структуры, силы и интенсивности вариации;

4) сделать выводы относительно исследуемой совокупности.

Решение:

1) Первый этап вариационного анализа - построение вариационного ряда. Это упорядоченное распределение единиц совокупности по возрастающим (убывающим) значения признака. На этом этапе важно правильно определить, ряд какого вида целесообразно построить. Т.к. изучаемый признак - номинальная начисленная заработная плата - относится к непрерывному виду, то строим интервальный вариационный ряд. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала.

Воспользуемся формулой Стержесса:

К = 1+3,32lg80 = 7,32

В качестве длины интервала выбирается целочисленное и удобное для восприятия значение в интервале от l1 до l2 .

;

В нашем случае l1 = 3594,67 и l2 = 3145,34. Таким образом, вариационный интервальный ряд по формуле Стержесса должен состоять из 7 интервалов длиной l=3500.Но в нашем случае за длину интервала для наглядности необходимо принять 4000 руб. (Таблица 2.1).

Таблица 2.1 - Вариационный ряд

Среднемесячная начисленная заработная плата, руб.

Количество регионов

5 000-9 000

23

9 000-13 000

36

13 000-17 000

11

17 000-21 000

4

21 000-25 000

4

25 000-29 000

1

29 000-33 000

1

Графически интервальный вариационный ряд изображается гистограммой (рисунок 2.1):

Рисунок 2.1 Графическое отображение вариационного ряда

Из графического изображения вариационного ряда видно, что по субъектам Российской Федерации на 2007 год большая доля субъектов имеет уровень среднемесячной заработной платы от 9000 рублей до 13000 рублей (36 субъектов из 80, что составляет 45%).

2) Огива (распределение "больше чем") и кумулята (распределение "меньше чем") строятся по накопленным частотам. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают значения признака, который меньше или равен рассматриваемому значению. Расчет накопленных частот для огивы и кумуляты представлены в Таблице 2.2 и Таблице 2.3

Таблица 2.2 - Координаты точек пересечения для кумуляты

Граница интервала

кол-во регионов

накопленные частоты (кумулята)

5000-9000

23

23

9000-13000

36

59

13000-17000

11

70

17000-21000

4

74

21000-25000

4

78

25000-29000

1

79

29000-33000

1

80

Таблица 2.3 - Координаты точек пересечения для огивы

Граница интервала

кол-во регионов

накопленные частоты (огива)

5000-9000

23

80

9000-13000

36

57

13000-17000

11

21

17000-21000

4

10

21000-25000

4

6

25000-29000

1

2

29000-33000

1

1

Графическое изображение кумуляты и огивы выглядит следующим образом (Рисунок 2.2 и рисунок 2.3).

Рисунок 2.2 - Графическое изображение кумуляты

Рисунок 2.3 - Графическое изображение огивы

3) К показателям структуры относятся мода и медиана.

Мода - наиболее часто встречающееся значение признака.

Модальный интервал - это интервал с наибольшей частотой появления признака. В данном случае модальный интервал: от 9000 рублей до 13000 рублей.

Мо = ;

В данной совокупности большинство регионов имеют уровень безработицы близкий к 10368,4 рублей.

Медиана - значение признака, делящее совокупность на две равные части.

Медианный интервал - это интервал, в котором накопленная частота появления признака превышает половину объема совокупности.

В данном случае медианный интервал: от 9000 рублей до 13000 рублей (в данном интервале накопленная частота 59 превышает половину объема совокупности, который равен 40).

Ме = ;

Это означает, что половина регионов РФ имеют уровень среднемесячной зарплаты ниже 11956,5 рублей, а половина - выше.

Значение медианы и моды должны попадать в медианный интервал.

Мо = 10368,4 рублей; Ме = 11456,5 рублей - эти значения попадают в медианный интервал: от 9000 рублей до 13000 рублей.

Среднее значение по формуле средней взвешенной равно 11850 рублей (приложение Б).

К показателям силы вариации относятся среднее линейное отклонение (), среднее квадратическое отклонение () и дисперсия ().

;

В среднем по совокупности значения признака у отдельных единиц отклоняется от среднего значения примерно на 3553,75 рублей, что является довольно значительной цифрой.

;

СКО (корень из дисперсии) показывает, на сколько в среднем фактические значения показателя отклоняются от своего среднего значения (является более точным, чем среднее линейное отклонение). Соотношение СКО к среднему линейному отклонению зависит от наличия в совокупности резких отклонений (чем больше соотношение, тем более неоднородна совокупность). Для нормального распределения ?/d ? 1,25. В нашем же случае эта величина равна 1,40 - то есть наше распределение нельзя считать близким к нормальному. Квадрат среднего квадратического отклонения дает величину дисперсии, которая является мерой рассеивания значений признака по всем единицам совокупности под влиянием всех факторов. Чем меньше ее значение, тем лучше, тем меньше значения признака совокупности отклоняются от своего среднего значения. Полученное значение дисперсии велико, что говорит о сильном разбросе значений признака от среднего.

К показателям интенсивности относятся относительный размах вариации (), относительное линейное отклонение () и коэффициент вариации ().

;

;

.

Они используются для сравнения наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Совокупность можно считать однородной, если коэффициент вариации не превышает 33 %. Значение коэффициента вариации, равное 42%, говорит о неоднородности совокупности (относительное среднее линейное отклонение имеет тот же смысл, но является менее точным показателем: в нашем случае этот коэффициент равен 30%). Относительный размах вариации для нашей совокупности составил 212%. Это говорит о сильном разбросе значений показателя от средней величины.

Таблица 2.4 - Показатели вариации

Показатель

Значение, рублей

Размах вариации

25162,70

Мода

10 368,40

Медиана

11 456,50

Среднее линейное отклонение

3 553,75

Среднее квадратическое отклонение

4 967,65

Дисперсия

24 677 500,00

Относительный размах вариации

2,12

Относительное линейное отклонение

0,30

Коэффициент вариации

0,42

3. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ХАРАКТЕРЕ

РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ

Задание: Проверить гипотезу о нормальном распределении Показателя, используя критерий Пирсона. Степень значимости принять равной 0,05.

Решение:

Нормальное распределение - распределение, полностью определяющееся двумя параметрами - средним значением и СКО.

Причина частого обращения именно к закону нормального распределения заключается в том, что в этом типе распределения отражается закономерность, возникающая при взаимодействии множества случайных факторов, ни один из которых не является преобладающим.

Проверим гипотезу о нормальном законе распределения. Для этого воспользуемся критерием согласия Пирсона (хи-квадрат). Идея Пирсона заключается в расчете и последующей оценке размера отклонений фактических значений частоты появления признака по интервалам от их теоретических значений, т.е. значений, которые бы имели место в случае нормального распределения. Чем больше размер этих отклонений, тем меньше оснований считать распределение близким к нормальному.

Результаты проверки гипотезы представлены в Приложении Б.

Таким образом, проверка гипотезы показала, что данное распределение не соответствует нормальному. Этот результат не явился неожиданным, т.к. в социально-экономической статистике нормальное распределение практически вообще не встречается; однако сравнение с нормальным распределением важно для выяснения степени и характера отклонений от него фактического распределения.

Проанализируем характер отклонений в параметрах распределения от нормального.

Если , то гипотеза принята;

Если , то гипотеза отклоняется.

Для расчета фактического значения:

рассчитаем нормированное отклонение () для каждого интервала;

найдём плотности вероятности нормирования по таблице;

определим теоретические частоты для каждого интервал (Приложение В);

определим теоретическое значение критерия Пирсона ();

Расчет представлен в Таблице3.1.

Таблица 3.1 - Расчет критерия Пирсона фактического

Интервалы значений признака

Частота,

Частота,

?2расч.

5 000-9 000

23

16

3,06

9 000-13 000

36

25

4,84

13 000-17 000

11

21

4,76

17 000-33 000

10

11

0,09

Итого:

Х

Х

12,76

Для сравнения фактического значения критерия Пирсонас табличным значением рассчитаем число степеней свободы df=4-3=1 (4-число интервалов в вариационном ряду), при уровне значимости 0,05 и при df = 1, табличное значение равно 3,841. Расчётное значение = 12,76, что значительно выше табличного. Следовательно, гипотезу о близости эмпирического распределения к нормальному отвергается с вероятностью 95%.Для наглядности анализа данных, представим распределения теоретических и фактических частот графически (Рисунок 3.1).

Рисунок 3.1 - Распределение частот

Из графика наглядно видно, что данное эмпирическое распределение не соответствует нормальному закону распределения.

Рассчитаем показатели эксцесса и ассиметрии (Приложение Г). Для этого используем формулы коэффициента асимметрии и показателя эксцесса.

Показатель ассиметрии больше нуля, следовательно, имеет место правосторонняя ассиметрия, т.е. основная масса значений смещена в область малых значений. Показатель эксцесса равен 2,61, что больше нуля, следовательно распределение признака является островершинным.

Вывод: гипотеза о близости эмпирического распределения к нормальному отвергается с вероятностью 95%, следовательно, довольно сложно прогнозировать какая доля единиц совокупности попадёт в данный интервал значений признака.

4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ

Задание: провести 20%-ную бесповторную выборку двумя способами: случайная и районированная, используя в качестве районов Федеральные округа.

Решение: выборка

Генеральная совокупность 80 субъектов, выборка будет составлять 18 субъектов. Выборка производиться случайным образом с помощью генератора случайных чисел.

Таблица 4.1 - Список 20%-ной выборочной совокупности

Регион

Среднемесячная начисленная зарплата за 2007г., руб.

Ивановская область

8171,6

Липецкая область

10907,1

Тамбовская область

7903,0

Тверская область

10177,0

г. Москва

23623,3

Республика Карелия

13342,1

Калининградская область

12750,3

Новгородская область

11004,9

г. Санкт-Петербург

17552,0

Республика Адыгея

8056,4

Республика Марий Эл

8404,3

Республика Татарстан

11468,6

Нижегородская область

10302,0

Челябинская область

11897,5

Иркутская область

13770,0

Магаданская область

22101,6

Сахалинская область

23346,3

Еврейская автономная область

11968,9

Х среднее по формуле простой арифметической получается равным 13297 рублей:

Дисперсию в выборочной () совокупности равна:

Рассчитаем предельную ошибку выборки по формуле:

, (1)

где tст - коэффициент доверия Стьюдента; n - размер выборочной совокупности; S2 - выборочная дисперсия признака в малой выборке. Значение коэффициента доверия Стьюдента выбирается по таблице «Распределение Стьюдента» по двум параметрам: число степеней свободы (d.f.=n-1) и степень значимости (?=1-F(t)).

Таблица 4.3 - Расчет предельной ошибки для случайной 20% бесповторной выборки

F(t)

a

t

предельная ошибка выборки

интервал для генеральной средней совокупности

0,977

0,023

2,567

3102,200

10050

16255

0,833

0,167

2,898

3502,211

9650,4

16655

0,641

0,359

1,069

1291,878

11861

14444

Из расчетов видно, что чем больше доверительная вероятность, тем большее значение имеет коэффициент доверия Стьюдента, и тем шире доверительный интервал. Интерпретация полученных результатов:

С вероятностью 97,7 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 10050 руб. до 16255 руб.

С вероятностью 83,3 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 9650,4 руб. до 16655 руб.

С вероятностью 64,1 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 11861 руб. до 14444 руб.

Районированная выборка.

В каждом округе производиться двадцати процентная выборка. В центральном округе 18 субъектов, 18*20%=3,6, округляем в большую сторону до 4 субъектов. В Северо-Западном округе 10 субъектов, выбираем 2 субъекта, в Южном округе 13 субъектов 13*20%=2,6 субъекта, округляем до 3х. В Приволжском округе 14 субъектов, 20% составляет 2,8, примерно 3, в Уральском округе 4 субъекта, 20% составляет 1 субъекта, в Сибирском 12 субъектов, 20% - 2,4, примерно 3 субъекта, в Дальневосточном округе 9 субъектов, 20% - 1,8, примерно 2 субъекта. Всего получается 19 субъектов. Считаем х среднее для каждой группы по формуле простой арифметической средней, х среднее общее по формуле средней взвешанной, где вес-количество субъектов в группе. Считается дисперсия внутри групповая для каждой группы, и средняя остаточная дисперсия. Выборка и расчёты по ней представлены в приложении Д.

Таблица 4.4 - Расчет предельной ошибки для районированной 20% бесповторной выборки

F(t)

a

t

предельная ошибка выборки

интервал для генеральной средней

0,977

0,023

2,567

2204,039

10239,428

14647,506

0,833

0,167

2,898

2488,237

9955,229

14931,704

0,641

0,359

1,069

917,849

11525,618

13361,315

С вероятностью 97,7 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 10239,4 руб. до 14647,5 руб.

С вероятностью 83,3 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 9955,2 руб. до 14931,7 руб.

С вероятностью 64,1 % можно утверждать, среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 11525,6 руб. до 13361,3 руб.

Вывод: районированная выборка оказалась более точной, так как при той же вероятности, что и в случае случайной выборки, она обеспечивает меньший доверительный интервал, а значит и более высокую точность.

5 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ

Задание: для пары признаков, один из которых является факторным (среднемесячная начисленная заработная плата по субъектам РФ за 2007.), а другой результативным (средние цены на первичном рынке жилья по субъектам РФ за 2007г.), провести корреляционно-регрессионный анализ.

Решение:

Для построения поля корреляции понадобиться корреляционная решётка. Группировку по факторному признаку производим используя расчеты из второго задания. Всего получилось 7 интервалов длиной 4000 рублей.

Теперь разделим совокупность на группы по результативному признаку. Размах его вариации равен 97702 рублей. По формуле Стерджесса k =7,20.

Целесообразно разделить совокупность по результативному признаку на 7 групп. Получаем интервал для каждой группе 13957,43 рублей, примерно15000 рублей. Из 80 единиц совокупности исключаем те, для которых неизвестны значения показателя ”Средние цены на первичном рынке жилья, руб.” - получаем 71 единицу.

Таблица 5.1 Корреляционная решетка показателей “Среднемесячная начисленная заработная плата, руб.” (X) и ”Средние цены на первичном рынке жилья, руб.”(Y).

X

Y

15000-30000

30000-45000

45000-60000

60000-75000

75000-90000

90000-105000

105000-120000

?

5 000-9 000

11

8

-

-

-

-

-

19

9 000-13 000

12

21

2

-

-

-

-

35

13 000-17 000

-

8

3

-

-

-

-

11

17 000-21 000

-

2

-

-

1

-

-

3

21 000-25 000

-

1

-

-

-

-

1

2

25 000-29 000

-

1

-

-

-

-

-

1

29 000-33 000

-

-

-

-

-

-

-

0

?

23

41

5

0

1

0

1

71

Рисунок 5.1 - Поле корреляции

Оценку тесноты связи проведем с помощью таких показателей, как коэффициент корреляции, ЭКО, коэффициент детерминации, Спирмена, Пирсона, Кэндэла и Фехнера, коэффициенты ассоциации и контенгенции.

Коэффициент корреляции: (Приложение К)

Вывод: коэффициент корреляции характеризует наличие линейной связи между признаками и пороговое значение для него составляет 0,7, то есть можно сказать, что линейная связь между признаками отсутствует.

Эмпирическое корреляционное отношение и коэффициент детерминации:

Считаем среднюю в каждой группе по формуле простой арифметической, и для каждой группы считаем остаточную дисперсию. Потом рассчитывается средняя остаточная дисперсия, как средняя взвешенная из остаточных, где вес - количество единиц в группе. Она составляет 101015032,8 рублей2. Считаем межгрупповую дисперсию (81966384,03) и общую (182981416,8). Расчет и полученные данные представлены в Приложение К. Можно провести проверку, и получим, что общая дисперсия равна сумме средней остаточной и межгрупповой:

101015032,8+81966384,03=182981416,8

Коэффициент детерминации считаем как частное межгрупповая дисперсия от общей, и он составляет примерно 0,45. ЭКО равен корню из коэффициента детерминации и составляет 0,67. Вывод: связь умеренная, так как значения коэффициента детерминации и ЭКО очень близки к пороговым: 0,5 и 0,7 соответственно.

Коэффициент Спирмана (Приложение Л) равен 0,63: согласно данному коэффициенту связь прямая, довольно тесная, так как пороговое значение составляет 0,5.

Коэффициент Кендалла (Приложение М) равен 0,47, это значение немного меньше порогового (0,5) и указывает на то, что связь прямая, слабая.

Значение коэффициент Фехнера (Приложение Н) равно 0,41, что является меньше порогового (0,5), что указывает на отсутствие связи.

Коэффициенты Пирсона и Чупрова рассчитывается на основе корреляционной решетки, представленной в Таблице 5.1. Для расчета данного коэффициента найдем значение (Приложение П). Коэффициент Пирсона будет равен 0,72, а коэффициент Чупрова составил 0,42. Эти коэффициенты указывают на то, что связь достаточно тесная.

Коэффициенты контингенции и ассоциации рассчитывать не имеет смысла, так как они считаются для альтернативных признаков.

Таблица 5.2 - Сводка рассчитанных коэффициентов

Коэффициент

Полученное

значение

Пороговое

значение

Вывод

Коэффициент корреляции

0,60

0,7

Связь умеренная, прямая

ЭКО

0,67

0,7

Связь умеренная

Коэффициент детерминации

0,45

0,5

Связь умеренная

Коэффициент Спирмена

0,63

0,5

Связь тесная, прямая

Коэффициент Кендалла

0,47

0,5

Связь умеренная, прямая

Коэффициент Фехнера

0,41

0,5

Связь умеренная, прямая

Коэффициент Пирсона

0,76

0,3

Связь тесная

Коэффициент Чупрова

0,48

0,3

Связь тесная

Если делать выводы о наличии связи, опираясь на данную таблицу, можно сказать что связь есть, так как коэффициент Пирсона, Чупрова и Спирмена больше пороговых значений, а коэффициенты Фехнера и Кендела очень близки к пороговым значениям. Однако все эти коэффициенты характеризуют связь, исходя из значений рангов или частот проявления признака, а не из значений самого признака. Поэтому в первую очередь необходимо учитывать коэффициенты корреляции, детерминации и ЭКО, которые рассчитываются непосредственно на основании самих значений признака. Их значения не дотягивают до пороговых (однако очень близки к ним), поэтому нельзя с уверенностью сказать о наличии тесной связи.

Построим уравнение парной регрессии.

Чтобы определить вид связи между признаками проведем регрессионный анализ (построим уравнение регрессии).

Чтобы построить уравнение регрессии, воспользуемся методом наименьших квадратов. Суть метода состоит в том, что в качестве линии регрессии выбирается такая линия, которая наиболее точно описывает поле корреляции. Для определения такой линии по каждому предполагаемому варианту линии регрессии (прямая, парабола, гипербола) рассчитывается сумма квадратов отклонений фактических значений признаков от их теоретических значений. В качестве уравнения выбирается то, которому соответствует наименьшее значение суммы квадратов отклонений.

Уравнение прямой можно получить с помощью Excel:

y = 2,1056x + 11331

Как и уравнение параболы:

y = -0,00006x2+ 3,9247x - 904,1

Уравнения гиперболы приведём вручную - расчёты в Приложении Р. Оно получилось

у=33307,05849+24434401,91/х

Из трех вариантов наименьшая сумма квадратов отклонений - у параболы, следовательно, наше уравнение регрессии - параболическое и зависимость - параболическая (Приложение Ж).

Таким образом, можно сделать общий вывод, что связь между признаками - параболическая, прямая, но не очень тесная, т.е. с ростом среднемесячной заработной платы, средние цены на первичном рынке жилья увеличиваются, но это не единственный фактор.

6. АНАЛИЗ РЯДОВ ДИНАМИКИ

Задание: провести анализ рядов динамики, для чего рассчитать показатели тенденции динамики, построить тренд (используя графический метод, метод наименьших квадратов и EXCEL), сделать интервальный прогноз на срок 1/3 от базы прогноза и сделать выводы.

Решение:

Тенденция - это основное направление движения признака.

К показателям тенденции относятся: средний уровень ряда, средний прирост, среднее ускорение уровня ряда, средний темп роста, средний темп прироста. Причем, показатели бывают цепные и базисные. Цепные показатели оценивают отношения статистического признака и его характеристик за смежные периоды времени, а базисные - с одним и тем же заданным базисом (в нашем случае - это будет начальный 2000 год).

1. Рассчитаем показатели для первого ряда динамики - Реальная начисленная заработная плата по РФ за 2000-2007 гг., % к предыдущему году. Ряд представлен в таблице 6.1.

Таблица 6.1 - Реальная начисленная заработная плата по РФ за 2000-2007 гг., в процентах к предыдущему году по РФ*

Показатель

Период времени

Среднее значение

2000

2003

2004

2005

2006

2007

Реальная начисленная заработная плата по РФ, руб.

121,00

111,00

111,00

113,00

113,00

117,00

114,33

Абсолютный цепной прирост, процентные пункты

-

2,00

-

4,00

- 50

Абсолютный базисный прирост, процентные пункты

-

-10,00

-10,00

-8,00

-8,00

-4,00

?

Ускорение уровня ряда, процентные пункты

2,00

-2,00

4,00

1,33

Окончание таблицы 6.1

Показатель

Период времени

Среднее значение

2000

2003

2004

2005

2006

2007

Цепной темп роста, %

100,00%

101,80%

100,00%

103,54%

135,23

Базисный темп роста, %

-

91,74%

91,74%

93,39%

93,39%

96,69%

?

Цепной темп прироста, %

0,00%

1,80%

0,00%

3,54%

35,23

Базисный темп прироста, %

-

-8,26%

-8,26%

-6,61%

-6,61%

-3,31%

?

Цепное абсолютное значение 1% прироста

. . .

1,21

1,11

1,11

1,13

1,13

?

Базисное абсолютное значение 1% прироста

1,21

1,21

1,21

1,21

1,21

1,21

?

*Значения за 1995 г. Были убраны так как являлись несопоставимыми со значениями других годов

Хотя ряд и неполный, но по полученным данным можно сделать вывод, что за весь период с 2000 по 2007 гг. Реальная начисленная заработная плата по Российской Федерации в процентах к предыдущему году составило 114 процентов. Причем в течение указанного периода изменение происходит неравномерно, и в среднем за 8 периодов абсолютный прирост снизился на 0,5 процентных пункта.

Построим тренд, используя графический метод, метод наименьших квадратов, Excel.

Графический метод

Рисунок 6.1 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (графический метод).

Прямая проводиться визуально, примерно на равном расстоянии от точек совокупности. Берутся на ней 2 точки: A и B. С помощью их координат записывается уравнение для графического метода:

y = -0,3t + 115

Метод наименьших квадратов

Таблица 6.2 - Линейная зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

2000

1

121,00

115,19

33,79

2003

2

111,00

114,84

14,78

2004

3

111,00

114,5

12,26

2005

4

113,00

114,16

1,34

2006

5

113,00

113,82

0,67

2007

6

117,00

113,47

12,44

?

X

X

X

75,28

yлиней = -0,3429t + 115,53

Таблица 6.3 - Параболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

2000

1

121,00

119,36

2,70

2003

2

111,00

114,01

9,09

2004

3

111,00

111,17

0,03

2005

4

113,00

110,83

4,72

2006

5

113,00

112,99

0,00

2007

6

117,00

117,64

0,41

?

X

X

X

16.94

= 1,25 t - 9,0929t + 127,2

Таблица 6.4 - Гиперболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

2000

1

121,00

118,85

4,62

2003

2

111,00

115,04

16,28

2004

3

111,00

113,76

7,64

2005

4

113,00

113,13

0,02

2006

5

113,00

112,75

0,06

2007

6

117,00

112,49

20,33

?

X

X

X

48.95

Наименьшая сумма квадратов отклонений теоретических величин от фактических наблюдается при параболической зависимости, следовательно, данный вид зависимости подходит для исследуемой совокупности. Построим тренд:

Рисунок 6.2 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (метод наименьших квадратов).

EXCEL

Теперь построим тренд с помощью EXCEL.

Для того, чтобы построить линию тренда в EXCEL, необходимо сначала построить фактический ряд динамики, а потом добавить линию тренда.

Рисунок 6.3- Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (EXCEL).

Рассчитаем показатели колеблемости (Приложение З).

Таблица 6.5 - Показатели колеблемости

Показатель

Значение

Амплитуда, процентные пункты

5

СЛО от тренда, процентные пункты

2,3

СКО от тренда, процентные пункты

2,4

Относительное лин. отклонение

2,0%

Коэффициент аппроксимации

2,1%

Средний уровень ряда, процентные пункты

114

Анализируя полученные результаты, мы можем сказать, что в среднем фактические значения уровней ряда отклоняются от линии тренда на 1,8 процентных пунктов, что составляет 1,5 % от среднего значения уровня ряда. Это отклонение достаточно невелико, следовательно выбранное уравнение тренда неплохого качества, и оно позволяет произвести прогноз.

Составим интервальный прогноз на 2 года. Для этого необходимо уравнение зависимости, которое получено при расчете сумм квадратов отклонений. В него подставляется номер прогнозного периода и получаем точечный прогноз:

y= 1,25 *8 - 9,0929*8 + 127,2

y= 134,4568

Для расчёта интервального прогноза нужно найти ошибки I и II рода. Ошибка II рода - это полученное значение СКО, а ошибка I рода:

,

где - среднее значение из номеров периодов в ряду динамики;

- среднеквадратическое отклонение фактического значения от тренда;

- база прогноза (число периодов в ряду динамики);

- номер прогнозного периода;

- номера периодов в ряду динамики;

Найдем общую ошибку прогноза:

По таблице определим коэффициент Стьюдента. При степени значимости и числе степеней свободы он примет значение 2,776.

Теперь мы можем рассчитать интервальный прогноз:

125,4355?у?143,4781

Таким образом, с вероятностью 95% можно предположить, что реальной начисленной заработной платы в процентах к предыдущему году по РФ в 2009 году будет находиться в пределах от 125 до 143 процентных пунктов.

2. Реальная начисленная заработная плата по Челябинской в процентах к предыдущему году.

Таблица 6.6 - Реальная начисленная заработная плата по Челябинской за 2000-2007 гг., в процентах к предыдущему году*

Показатель

Период времени

Среднее значение

2000

2003

2004

2005

2006

2007

Реальная начисленная заработная плата по Челябинской области, процентные пункты

119,00

113,00

111,00

111,00

113,00

118,00

114,17

Абсолютный цепной прирост, процентные пункты

-2,00

0,00

2,00

5,00

-13

Абсолютный базисный прирост, процентные пункты

-

-6,00

-8,00

-8,00

-6,00

-1,00

?

Ускорение уровня ряда, процентные пункты

2,00

2,00

3,00

2,33

Цепной темп роста, %

100,00

101,80

100,00

103,54

133,67

Базисный темп роста, %

-

91,74

91,74

93,39

93,39

96,69

?

Цепной темп прироста, %

0,00

1,80

0,00

3,54

33,67

Базисный темп прироста, %

-

-8,26

-8,26

-6,61

-6,61

-3,31

?

Цепное абсолютное значение 1% прироста

. . .

1,19

1,13

1,11

1,11

1,13

?

Базисное абсолютное значение 1% прироста

1,19

1,19

1,19

1,19

1,19

1,19

?

*Значения за 1995 г. Были убраны так как являлись несопоставимыми со значениями других годов

По полученным данным можно сделать вывод, что за весь период с 2000 по 2007 гг. по Челябинской области среднее средняя заработная плата в процентах на человека составило 114,17%. Причем в течение указанного периода каждый год происходит уменьшение заработной платы в 0,13 процентных пункта.

Построим тренд, используя графический метод, метод наименьших квадратов, Excel.

Графический метод

Рисунок 6.4 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (графический метод).

Уравнение для графического метода находится аналогично и имеет вид:

y = - 0,1x + 114

Метод наименьших квадратов

Таблица 6.7 - Линейная зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

2000

1

121,00

114,53

41,90

2003

2

111,00

114,38

11,45

2004

3

111,00

114,24

10,51

2005

4

113,00

114,10

1,21

2006

5

113,00

113,96

0,91

2007

6

117,00

113,81

10,16

?

X

X

X

76,14

yлиней = -0,1429x + 114,67

Таблица 6.8 - Параболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

2000

1

121,00

118,75

0,06

2003

2

111,00

113,54

0,29

2004

3

111,00

110,86

0,02

2005

4

113,00

110,71

0,08

2006

5

113,00

113,11

0,01

2007

6

117,00

118,04

0,00

?

X

X

X

0,46

= 1,2679 t - 9,0179t + 126,5

Таблица 6.9 - Гиперболическая зависимость

Год

ti

yфакт

утеор

(утеор-уфакт)

2000

1

121,00

117,73

1,61

2003

2

111,00

114,86

3,46

2004

3

111,00

113,90

8,43

2005

4

113,00

113,43

5,88

2006

5

113,00

113,14

0,02

2007

6

117,00

112,95

25,54

?

X

X

X

44,94

Наименьшая сумма квадратов отклонений теоретических величин от фактических наблюдается при параболической зависимости, следовательно, данный вид зависимости подходит для исследуемой совокупности. Построим тренд:

Рисунок 6.5 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области за 2000-2007 гг. (метод наименьших квадратов).

EXCEL

Теперь построим тренд с помощью EXCEL. Для того, чтобы построить линию тренда в EXCEL, необходимо сначала построить фактический ряд динамики, а потом добавить линию тренда.

Рисунок 6.6 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области за 2000-2007 гг. (EXCEL).

Таблица 6.10 - Показатели колеблемости

Показатель

Значение

Амплитуда отклонений, процентные пункты

1

Среднее линейное отклонение, процентные пункты

0,3

Среднеквадратическое отклонение, процентные пункты

0,4

Относительное линейное отклонение

0,3%

Коэффициент аппроксимации

0,3%

Среднее значение, процентные пункты

114

Анализируя полученные результаты, мы можем сказать, что в среднем фактические значения уровней ряда отклоняются от линии тренда на 0,3 процентных пункта, что составляет 0,3% от среднего значения уровня ряда. Таким образом, можно сделать вывод, что тенденция динамики исследуемого показателя является достаточно устойчивой и построенное уравнение тренда пригодно для прогнозирования. Т.к. прогнозирование возможно только на 1/3 ретроспективы, следовательно, мы можем сделать прогноз.

Отклонение фактического уровня ряда от теоретического достаточно невелико для рассматриваемых нами данных, это позволяет сделать вывод о том, что составленное нами уравнение тренда имеет хорошее качество.

Составим интервальный прогноз на 2 года. Точечный прогноз равен:

y= 135,50

Итервальный прогноз:

134,009?у? 136,9958

Таким образом, с вероятностью 95% можно предположить, что реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области в 2009 году будет находиться в пределах от 134 до 137 процентных пунктов.

совокупность статистический анализ регрессия

ЗАКЛЮЧЕНИЕ

В курсовой работе был проведен подробный статистический анализ показателя «Среднемесячная начисленная заработная плата, тыс. руб.» в 2007 г. по регионам РФ. Произведенные в результате работы расчеты позволили установить, что среднее значение показателя по РФ составило 11929,2 руб. Величина размаха вариации - 25162,7 тыс. руб. характеризует достаточно высокое расхождение значений признака по единицам статистической совокупности, а, следовательно, и неоднородность изучаемой статистической совокупности.

Вариационный анализ позволяет определить, что распределение близко к нормальному, т.к. значение медианы расположено между значениями моды и средней, т.к. среднее значение больше моды, имеет место правосторонняя асимметрия графика распределения.

В третьем задании было установлено, что распределение среднедушевых денежных доходов по регионам РФ не соответствует нормальному, так как расчетное больше табличного.

При помощи корреляционного анализа было установлено, что между реальной среднемесячной начисленной заработной платой и ценами на первичном рынке жилья по регионам существует тесная прямая связь.

При выполнении оценки параметров генеральной совокупности на основе данных случайного и районированного выборочного наблюдения получили значение средней генеральной характеристики по рассматриваемому признаку с учетом предельной ошибки средней величины, причём среднее значение по генеральной совокупности попало во все рассчитанные интервалы по этой выборке.

Анализ динамики показателя «Среднемесячная заработная плата в процентах к предыдущему году» по РФ и по Челябинской области за 2000-2007 годы позволил найти уравнение тренда, описывающего динамику показателя, посчитаны показатели колеблемости динамики, и проведён прогноз.

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Ефремова М.Р. Общая теория статистики: учебник. - Москва: Изд-во ИНФРА-М, 2005 - 412с

2. Российский статистический ежегодник: Официальное издание. - М.: Госкомстат РФ, 2005

3. Лазарева Г.В., Богданчикова М.Ю. Статистика: Учебное пособие по выполнению курсового проекта. - Челябинск: Изд. ЮУрГУ, 2003.

4. СТО ЮУрГУ 20-2008 Стандарт организации. Учебные рефераты. Общие требования к построению, содержанию и оформлению / составители: Т.И. Парубочая, Н.В. Сырейщикова, В.А. Смолко, Л.В. Винокурова. - Челябинск: Изд-во ЮУрГУ, 2008.

5. Электронный ресурс: www.georus.by.ru

ПРИЛОЖЕНИЯ

ПРИЛОЖЕНИЕ А

Сводная таблица среднемесячная начисленная заработная плата по субъектам РФ за 2007 год.

Таблица А.1 - Исходные данные

Регион

Среднемесячная начисленная заработная плата за 2007 год, руб.

Белгородская область

10479,5

Брянская область

8189,6

Владимирская область

9688,1

Воронежская область

8730,9

Ивановская область

8171,6

Калужская область

10926,8

Костромская область

9058,1

Курская область

8856,8

Липецкая область

10907,1

Московская область

16234,5

Орловская область

8610,7

Рязанская область

9796,6

Смоленская область

9552,1

Тамбовская область

7903

Тверская область

10177

Тульская область

10137,1

Ярославская область

11214,8

г. Москва

23623,3

Республика Карелия

13342,1

Республика Коми

17077,3

Архангельская область

14400,3

Вологодская область

12913,9

Калининградская область

12750,3

Ленинградская область

13154,8

Мурманская область

18581

Новгородская область

11004,9

Псковская область

8950,5

г. Санкт-Петербург

17552

Республика Адыгея

8056,4

Республика Дагестан

5696,4

Республика Ингушетия

7285,4

Кабардино-Балкарская Республика

7213,9

Республика Калмыкия

7101,2

Карачаево-Черкесская Республика

7558,4

Республика Северная Осетия - Алания

7625,8

Чеченская Республика

9916,7

Краснодарский край

10260

Ставропольский край

8647,7

Астраханская область

9866,9

Волгоградская область

9770,2

Ростовская область

9779,6

Республика Башкортостан

11027,1

Республика Марий Эл

8404,3

Республика Мордовия

8103

Республика Татарстан

11468,6

Удмуртская Республика

9838,6

Чувашская Республика

8703,2

Пермский край

11856

Кировская область

8861,5

Нижегородская область

10302

Оренбургская область

9619,6

Пензенская область

8566,4

Самарская область

11920,7

Саратовская область

9108,3

Ульяновская область

8412,7

Курганская область

8883,1

Свердловская область

13986,9

Тюменская область

28565

Челябинская область

11897,5

Республика Алтай

9228,2

Республика Бурятия

11528,6

Республика Тыва

10701,6

Республика Хакасия

11251,2

Алтайский край

7804,7

Красноярский край

15510

Иркутская область

13770

Кемеровская область

12554,9

Новосибирская область

12017,0

Регион

Среднемесячная начисленная заработная плата за 2007 год, руб

Омская область

11003,6

Томская область

14429

Читинская область

12161,5

Республика Саха (Якутия)

19409,2

Камчатский край

21814,7

Приморский край

13174,1

Хабаровский край

15883,5

Амурская область

13534,4

Магаданская область

22101,6

Сахалинская область

23346,3

Еврейская автономная область

11968,9

Чукотский автономный округ

30859,1

Средняя величина - количественная характеристика общего в явлениях и процессах, характеристика статистической закономерности. Формула для расчёта простой арифметической средней величины:

Наименьшее значение показателя в совокупности равно 5696,4 рублей и оно принадлежит республике Дагестан. Наибольшее принадлежит Чукотскому автономному округу. Размах вариации, как разность между наибольшего и наименьшего значения, составил 25162,7 рублей:

ПРИЛОЖЕНИЕ Б

Расчет показателей вариации

Таблица Б.1 - Расчет значений для показателей вариации

Интервалы

Частота,

Середина интервала,

5 000-9 000

23

7000

9 000-13 000

36

11000

13 000-17 000

11

15000

17 000-21 000

4

19000

21 000-25 000

4

23000

25 000-29 000

1

27000

29 000-33 000

1

31000

Рассчитаем среднее значение признака по формуле средней взвешенной:

Показатели структуры вариации.

Мода - наиболее часто встречающееся значение признака.

, (Б.1)

где - начальное значение,

- длина модального интервала,

- частота модального интервала,

- частота интервала, предшествующего данному,

- частота интервала, следующего за данным.

Мо = ;

Медиана.

Сначала находим номер медианного интервала:

, (Б.2)

.

Затем само значение медианы:

, (Б.3)

Ме = ;

Расчет показателей силы вариации.

Среднее линейное отклонение найдем следующим образом:

, (Б.4)

где СЛО - среднее линейное отклонение;

- i-е значение признака (середина интервала);

- среднее значение признака;

- частота признака.

Подставив исходные значения, получим:

;

Расчет дисперсии ():

, (Б.5)

Среднее квадратическое отклонение:

(Б.6)

;

Расчет показателей интенсивности вариации.

Относительный размах вариации ():

, (Б.7)

;

Коэффициент вариации ():

, (Б.9)

ПРИЛОЖЕНИЕ В

Расчеты для проверки гипотезы о нормальном распределении показателя

Таблица В.1 - Расчет частот теоретического ряда распределения

Середеина интервала

частота

t

f(t)

теоретич

округл

7000

23

-0,9763

0,2468

15,90

16

3,063

11000

36

-0,1711

0,3932

25,33

25

4,840

15000

11

0,6341

0,3271

21,07

21

4,762

19000

4

1,4393

0,1415

9,11

9

2,778

23000

4

2,2445

0,0325

2,09

2

1,205

27000

1

3,0497

0,0038

0,24

0

0

31000

1

3,8549

0,0002

0,01

0

0

Так как у нас есть интервалы с частотой меньше 5, нам необходимо объединить некоторые интервалы. После несложных преобразований получаем новые частоты.

Таблица В.2 - Расчет частот теоретического ряда распределения по объединенным интервалам

Интервалы значений признака

Частота,

Частота,

?2расч.

5 000-9 000

23

16

3,06

9 000-13 000

36

25

4,84

13 000-17 000

11

21

4,76

17 000-33 000

10

11

0,09

Итого:

Х

Х

12,76

ПРИЛОЖЕНИЕ Г

Расчет ассиметрии и экцесса

Таблица Г.1 - Расчет ассиметрии и эксцесса

Интервалы значений признака

Середина интервала

Частота

5 000-

9 000

7000

23

-2623 934875000,00

12726084143750000,00

9 000-

13 000

11000

36

-22108500000,00

18792225000000,00

13 000-

17 000

15000

11

343 814625000,00

1083016068750000,00

17 000-

21 000

19000

4

1462103500000,00

10454040025000000,00

21 000-

25 000

23000

4

5544783500000,00

61824336025000000,00

25 000-

29 000

27000

1

3 477265875000,00

52680578006250000,00

29 000-

33 000

31000

1

7 022735875000,00

134485392006250000,00

ИТОГО:

X

80

1520466000000,00

273272238500000000,00

ПРИЛОЖЕНИЕ Д

Расчеты для 20% бесповторных случайной и районированной выборок

Таблица Д.1 - Случайная выборка

Регион

Среднемесячная начисленная зарплата за 2007г., руб.

Ивановская область

8171,6

24810416,3

Липецкая область

10907,1

5042295,2

Тамбовская область

7903,0

27558358,5

Тверская область

10177,0

8854228,4

г. Москва

23623,3

109635442,1

Республика Карелия

13342,1

35908,1

Калининградская область

12750,3

161849,8

Новгородская область

11004,9

4612639,2

г. Санкт-Петербург

17552,0

19354671,5

Республика Адыгея

8056,4

25971311,1

Республика Марий Эл

8404,3

22546405,6

Республика Татарстан

11468,6

2835874,7

Нижегородская область

10302,0

8125952,0

Челябинская область

11897,5

1575290,0

Иркутская область

13770,0

381175,9

Магаданская область

22101,6

80084501,6

Сахалинская область

23346,3

103911406,4

Еврейская автономная область

11968,9

1401158,8

ИТОГО:

236746,9

446898885,3

В соответствии с заданием необходимо рассчитать предельную ошибку выборки, используя значения вероятности 0,977, 0,833, 0,641.

Определим число степеней свободы:

d.f. = n - 1= 18 - 1=17

Рассчитаем значения степеней значимости, используя значения вероятностей 0,977, 0,833, 0,641 соответственно:

Рассчитаем среднее значение сремесячной начисленной заработной платы за 2007 году в выборке:

Далее рассчитаем среднее квадратическое отклонение исследуемого показателя по малой выборке:

Вычислим предельную ошибку средней для исследуемой малой выборки для соответствующих вероятностей:

;

;

.

Определим доверительные интервалы генеральной средней, в который с доверительными вероятностями попадет значение генеральной средней:

10050<?<16255

9650,4<?<16655

11861<?<14444

Таблица Д.2 - Районированная выборка

Субъект

Округ

Среднемеячная з/п за 2007г.

х среднее

х среднее общее

S2 внутригр.

S2 ср.ост.

Белгородская область

Центральный

10479,5

12922,63

12443,47

38643699,16

13269645,60

Воронежская область

8730,9

Курская область

8856,8

Г. Москва

23623,3

Псковская область

Северо-Западный

8950,5

13251,25

18496450,56

г. Санкт-Петеpбуpг

17552

Астраханская область

Южный

9866,9

9805,57

1895,62

Волгоградская область

9770,2

Ростовская область

9779,6

Республика Татарстан

Приволжский

11468,6

10112,33

1421780,86

Нижегородская область

10302

Пензенская область

8566,4

Челябинская область

Уральский

11897,5

11897,50

-

Республика Алтай

Сибирский

9228,2

11636,13

4582140,28

Республика Хакасия

11251,2

Томская область

14429

Хабаровский край

Дальневосточный

15883,5

19614,90

13923345,96

Сахалинская область

23346,3

Рассчитаем средние значения показателя по всем Федеральным округам:

Рассчитаем остаточные дисперсии по всем Федеральным округам:

Найдем среднюю из остаточных дисперсий:

Расчет предельной ошибки средней для исследуемой малой выборки для вероятностей 0,903, 0,870, 0,655:

;

;

.

Определим доверительные интервалы генеральной средней, в который с доверительными вероятностями попадет значение генеральной средней:

10239,428<?<14647,506

9955,229<?<14931,704

11525,618<?<13361,315

ПРИЛОЖЕНИЕ Е

Расчет коэффициента корреляции

Таблица Е.1 - Расчет коэффициента корреляции

Регион

xi

yi

(Xi-Xср)(Yi-Yср)

(Xi-Xср)2

(Yi-Yср)2

Республика Северная Осетия - Алания

7625,8

15799

77327339,3

15238873,69

392385784,2

Республика Калмыкия

7101,2

16896

82861153,96

19609840,89

350128839,6

Еврейская автономная область

11968,9

17711

-7863823,162

193072,36

320292944,7

Республика Дагестан

5696,4

21827

80384376,16

34025055,61

189908519,3

Ставропольский край

8647,7

23092

36067830,71

8304771,24

156643497,4

Республика Мордовия

8103

23898

40123389,85

11740902,25

137117776,7

Республика Адыгея

8056,4

24255

39429166,56

12062423,61

128884478,5

Саратовская область

9108,3

24535

26809293,88

5862209,44

122605349,7

Орловская область

8610,7

25674

28994571,12

8519393,44

98678991,71

Брянская область

8189,6

25714

33044068,83

11154932,01

97885893,31

Республика Хакасия

11251,2

25730

2748972,259

77450,89

97569549,95

Республика Тыва

10701,6

26500

7540289,667

685418,41

82950745,75

Курская область

8856,8

26578

24133759,37

7143325,29

81536023,87

Смоленская область

9552,1

26859

17299738,7

3910110,76

76540276,61

Астраханская область

9866,9

27112

14125000,7

2764238,76

72177428,23

Тамбовская область

7903

27983

27651083,35

13151502,25

58136507,57

Оренбургская область

9619,6

27996

14537643,13

3647718,01

57938433,59

Читинская область

12161,5

28050

-4776485,36

399424

57119282,75

Республика Алтай

9228,2

28877

15489428,95

5295981,69

45302726,33

Новгородская область

11004,9

28989

3472185,758

275205,16

43807586,81

Воронежская область

8730,9

29103

18204137,38

7832161,96

42311512,37

Республика Бурятия

11528,6

29451

5541,057

0,81

37905324,29

Кемеровская область

12554,9

29860

-5893722,342

1051445,16

33036400,15

Ивановская область

8171,6

30224

18078026,97

11275492,41

28984548,71

Ленинградская область

13154,8

30675

-8017166,069

2641600,09

24331825,25

Республика Саха (Якутия)

19409,2

30835

-37607680,58

62089672,09

22778951,65

Ростовская область

9779,6

30841

8341300,827

3062150,01

22721714,89

Продолжение таблицы Е.1

Регион

xi

yi

(Xi-Xср)(Yi-Yср)

(Xi-Xср)2

(Yi-Yср)2

Ульяновская область

8412,7

31355

13254908,86

9714442,24

18085712,45

Республика Марий Эл

8404,3

31591

12553084,6

9766875,04

16134119,89

Республика Карелия

13342,1

31647

-7179219,198

3285518,76

15687382,13

Пензенская область

8566,4

31905

10971559,26

8779961,61

13710209,45

Тульская область

10137,1

32107

4874416,452

1938777,76

12255110,53

Псковская область

8950,5

32344

8417159,67

6651241

10651933,51

Амурская область

13534,4

32499

-6232692,777

4019624,01

9664202,213

Омская область

11003,6

32711

1523390,307

276570,81

8391044,693

Республика Татарстан

11468,6

32765

173122,257

3708,81

8081113,853

Белгородская область

10479,5

32837

2909266,5

1102500

7676944,733

Чувашская Республика

8703,2

33037

7265654,199

7987971,69

6608652,733

Челябинская область

11897,5

33420

-805084,64

135424

4786162,553

Алтайский край

7804,7

35028

2159378,304

13874135,04

336086,8729

Самарская область

11920,7

35468

-54662,376

153037,44

19524,4729

Волгоградская область

9770,2

35571

64619,089

3095136,49

1349,0929

Владимирская область

9688,1

35768

-295121,178

3390753,96

25686,4729

Рязанская область

9796,6

35955

-601784,183

3002942,41

120596,4529

Кировская область

8861,5

36032

-1131952,36

7118224

180005,0329

Томская область

14429

36732

3259820,865

8407100,25

1263983,033

Костромская область

9058,1

37394

-4414587,678

6107817,96

3190760,513

Липецкая область

10907,1

38407

-1742265,648

387381,76

7835912,533

Удмуртская Республика

9838,6

38926

-5610862,743

2859142,81

11010915,79

Калининградская область

12750,3

38996

4136400,016

1490352,64

11480373,59

Вологодская область

12913,9

39155

4910840,588

1916563,36

12583124,45

Тверская область

10177

39446

-5191260,175

1829256,25

14732316,59

Архангельская область

14400,3

39845

12164354,72

8241492,64

17954457,05

Республика Башкортостан

11027,1

39880

-2146388,448

252405,76

18252290,95

Калужская область

10926,8

40032

-2666507,529

363247,29

19574165,03

Краснодарский край

10260

40275

-5925099,265

1611630,25

21783409,25

Камчатский край

21814,7

40280

48055231,4

105785339

21830106,95

Красноярский край

15510

40435,0

19214948,24

15844380,25

23302535,65

Приморский край

13174,1

40731

8425729,842

2704709,16

26247895,49

Хабаровский край

15883,5

41973

27714385,58

18957316

40516662,17

Республика Коми

17077,3

42917

40550368,11

30778084,84

53425427,93

Тюменская область

28565

43171

128844086,1

290208260,3

57203053,09

Новосибирская область

12017

43288

3744131,625

237656,25

58986547,27

Ярославская область

11214,8

43715

-2551357,869

99036,09

65727826,85

Иркутская область

13770

49617

31387769,44

5019840,25

196259645,9

Пермский край

11856

49857

4652386,655

106602,25

203041695,5

Московская область

16234,5

51747

75935265,35

22137025

260476036,1

Свердловская область

13986,9

54261

45838545,7

6038814,76

347944481,7

Нижегородская область

10302

56213

-25292968,93

1506756,25

424577151,8

г. Санкт-Петербург

17552

80251

268864093,6

36270506,25

1993021556

г. Москва

23623,3

113501

942025628,7

146259998,4

6067361511

Итого

818594,4

2528149

2214558152

1051731933

12991680594

Коэффициент корреляции ():

(Е.1)

где xi, yi - индивидуальные значения факторного и результативного признака.

ПРИЛОЖЕНИЕ Ж

Расчет эмпирического корреляционного отношения (ЭКО) и коэффициента детерминации

Для расчета данных показателей воспользуемся группировкой единиц исследуемой совокупности (субъектов РФ) по факторному признаку, которая была проведена ранее.


Подобные документы

  • Проведение статистического наблюдения за деятельностью предприятий. Стоимость основных производственных фондов. Статистический анализ генеральной совокупности. Описательные статистики выборочной совокупности. Распределение единиц выборочной совокупности.

    практическая работа [66,9 K], добавлен 31.01.2012

  • Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.

    контрольная работа [712,1 K], добавлен 30.03.2014

  • Простая сводка данных по показателю "Внешняя торговля по субъектам РФ". Вариационный анализ статистической совокупности. Выборочное наблюдение и генеральная совокупность на основе выборочной. Анализ рядов динамики и корреляционный анализ показателей.

    курсовая работа [1,6 M], добавлен 26.02.2012

  • Понятие и основные виды выборочного наблюдения. Ошибки выборочного статистического наблюдения. Определение генеральной совокупности, проблема соотношения выборки и совокупности. Точечная и интервальная оценка параметров генеральной совокупности.

    контрольная работа [32,6 K], добавлен 02.12.2015

  • Понятие выборочного наблюдения. Определение объема и численности выборки. Практическое применение в статистическом анализе выборочного наблюдения. Формулы предельных ошибок выборочной доли и среднего показателя. Значения гарантийного коэффициента.

    курсовая работа [123,0 K], добавлен 11.02.2015

  • Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.

    курсовая работа [667,1 K], добавлен 14.05.2013

  • Метод статистики, анализ данных, поиск закономерностей. Сводка и группировка данных статистического наблюдения за жилищным фондом. Вариационный анализ показателя площади жилищ, приходящихся в среднем на одного жителя. Выборочное наблюдение субъектов.

    курсовая работа [117,9 K], добавлен 04.10.2008

  • Классификация ошибок наблюдения в зависимости от причин возникновения. Особенности ошибок регистрации и репрезентативности. Преимущества выборочного наблюдения перед сплошным. Допустимый уровень ошибки. Понятие ряда динамики в статистической науке.

    контрольная работа [73,8 K], добавлен 22.06.2015

  • Понятие статистической совокупности и ее структура. Понятие генеральной и выборочной совокупности. Обеспечение репрезентативности выборочной совокупности. Вероятность наступления в выборочной совокупности какого-либо события. Закон больших чисел.

    презентация [76,5 K], добавлен 19.05.2012

  • Характеристика методов выполнения оценок параметров больших множеств по данным выборочного наблюдения. Особенности работы с большими массивами данных. Расчет основных показателей совокупности. Корреляционно-регрессионный анализ. Анализ рядов динамики.

    курсовая работа [1,2 M], добавлен 24.08.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.