Инструменты статистики
Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 29.11.2011 |
Размер файла | 290,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
1. ОПРЕДЕЛЕНИЕ СРЕДНЕГО ЗНАЧЕНИЯ ПОКАЗАТЕЛЯ В СОВОКУПНОСТИ
2. ВАРИАЦИОННЫЙ АНАЛИЗ ПОКАЗАТЕЛЯ
3. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ХАРАКТЕРЕ РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ
4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
5. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ ПОКАЗАТЕЛЯ
6. АНАЛИЗ РЯДОВ ДИНАМИКИ
ЗАКЛЮЧЕНИЕ
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
ПРИЛОЖЕНИЯ
ВВЕДЕНИЕ
На протяжении всего времени своего существования, статистика была незаменимым помощником в ведении хозяйства, управлении государством, направлении социальных процессов.
Предмет статистики - это количественная сторона социально-экономических явлений, которая рассматривается во взаимозависимости с качественной стороной в системе общественного производства. Именно поэтому статистика является столь важной и востребованной в наши дни наукой.
Цель сводки - выявление типичных черт и закономерностей, присущих явлению в целом. На основе группировки рассчитываются сводные показатели по группам, появляется возможность их сравнения, анализа причин различий между группами, изучение взаимосвязей между признаками. Если рассчитать сводные показатели только в целом по совокупности, то мы не можем уловить ее структуры, роли отдельных групп, их специфики. С помощью вариационного анализа можно найти и проанализировать структуру вариаций, силу вариаций, интенсивности вариаций, характер вариации, колеблемость признака, определить распределение признака. Изучение динамики позволяет дать характеристику изменения статистических показателей во времени, изучить развитие данного статистического показателя.
Методы статистики, перечисленные мною выше, будут применены в рамках данного курсового проекта и именно в том случае, если их применение будет являться оправданным и целесообразным. Цель данной курсовой работы - освоить инструменты статистики для дальнейшего применения в решении управленческих задач.
1. ОПРЕДЕЛЕНИЕ СРЕДНЕГО ЗНАЧЕНИЯ ПОКАЗАТЕЛЯ В
СОВОКУПНОСТИ
Формулировка задания: на основании имеющихся данных определить среднее значение показателя в совокупности. Определить размах вариации в исследуемой совокупности на основе имеющихся индивидуальных значений показателя.
Решение: Выполним простую сводку регионов РФ по показателю "Среднемесячная номинальная начисленная заработная плата (в месяц), руб." в 2007 г., т.е. занесем результаты статистического наблюдения в единый документ без какого-либо ранжирования или разделения на группы. Задача сводки - обобщить, систематизировать результаты наблюдения, чтобы стало возможным выявить характерные черты совокупности. Исходные данные были взяты из Российского статистического ежегодника 2008 года. Для дальнейших расчетов из совокупности исключаем, во-первых, те регионы, данных для которых нет в таблице, а во-вторых, субъекты РФ, значения показателя для которых уже входят в данные, приведенные для соответствующих этим субъектам областей. В результате были исключены следующие субъекты: Ненецкий автономный округ, Усть-Ордынский Бурятский автономный округ, Ханты-Мансийский автономный округ - Югра, Ямало-Ненецкий автономный округ, Агинский Бурятский автономный округ, а также Чеченская республика, т.к. по ней данные отсутствуют. В изучаемой совокупность получилось 80 субъектов.
Из приложения А можно рассчитать среднее значение показателя в совокупности. Необходимо учитывать, что оно должно быть рассчитано по формуле средней арифметической взвешенной, однако вес определить достаточно сложно, потому что неизвестно, сколько человек и сколько времени работали за весь 2007 год. Также нельзя точно определить размер заработной платы отдельного работника, поэтому в курсовой работе среднее рассчитано по формуле простой арифметической. Средняя величина - количественная характеристика общего в явлениях и процессах, характеристика статистической закономерности. Формула для расчёта простой арифметической средней величины:
Наименьшее значение показателя в совокупности равно 5696,4 рублей и оно принадлежит республике Дагестан. Наибольшее принадлежит Чукотскому автономному округу. Размах вариации, как разность между наибольшего и наименьшего значения, составил 25162,7 рублей:
Размах вариации является показателем силы вариации, поэтому он показывает насколько велик абсолютный разброс значений признака.
Выводы: В среднем по Российской Федерации на 2007г. среднемесячная номинальная начисленная заработная плата составляла -11929,2 руб. Величина размаха вариации 25162,7 рублей характеризует достаточно высокое расхождение между значениями признаков по единицам статистической совокупности, а, следовательно, и неоднородность изучаемой статистической совокупности.
2. ВАРИАЦИОННЫЙ АНАЛИЗ
Формулировка задания: провести вариационный анализ статистической совокупности по показателю, для чего:
1) построить вариационный ряд и изобразить его графически;
2) построить кумуляту и огиву (в одной системе координат);
3) рассчитать показатели структуры, силы и интенсивности вариации;
4) сделать выводы относительно исследуемой совокупности.
Решение:
1) Первый этап вариационного анализа - построение вариационного ряда. Это упорядоченное распределение единиц совокупности по возрастающим (убывающим) значения признака. На этом этапе важно правильно определить, ряд какого вида целесообразно построить. Т.к. изучаемый признак - номинальная начисленная заработная плата - относится к непрерывному виду, то строим интервальный вариационный ряд. Для построения вариационного ряда определим количество интервалов в ряду и длину интервала.
Воспользуемся формулой Стержесса:
К = 1+3,32lg80 = 7,32
В качестве длины интервала выбирается целочисленное и удобное для восприятия значение в интервале от l1 до l2 .
;
В нашем случае l1 = 3594,67 и l2 = 3145,34. Таким образом, вариационный интервальный ряд по формуле Стержесса должен состоять из 7 интервалов длиной l=3500.Но в нашем случае за длину интервала для наглядности необходимо принять 4000 руб. (Таблица 2.1).
Таблица 2.1 - Вариационный ряд
Среднемесячная начисленная заработная плата, руб. |
Количество регионов |
|
5 000-9 000 |
23 |
|
9 000-13 000 |
36 |
|
13 000-17 000 |
11 |
|
17 000-21 000 |
4 |
|
21 000-25 000 |
4 |
|
25 000-29 000 |
1 |
|
29 000-33 000 |
1 |
Графически интервальный вариационный ряд изображается гистограммой (рисунок 2.1):
Рисунок 2.1 Графическое отображение вариационного ряда
Из графического изображения вариационного ряда видно, что по субъектам Российской Федерации на 2007 год большая доля субъектов имеет уровень среднемесячной заработной платы от 9000 рублей до 13000 рублей (36 субъектов из 80, что составляет 45%).
2) Огива (распределение "больше чем") и кумулята (распределение "меньше чем") строятся по накопленным частотам. Накопленные частоты определяются путем последовательного суммирования частот по группам и показывают значения признака, который меньше или равен рассматриваемому значению. Расчет накопленных частот для огивы и кумуляты представлены в Таблице 2.2 и Таблице 2.3
Таблица 2.2 - Координаты точек пересечения для кумуляты
Граница интервала |
кол-во регионов |
накопленные частоты (кумулята) |
|
5000-9000 |
23 |
23 |
|
9000-13000 |
36 |
59 |
|
13000-17000 |
11 |
70 |
|
17000-21000 |
4 |
74 |
|
21000-25000 |
4 |
78 |
|
25000-29000 |
1 |
79 |
|
29000-33000 |
1 |
80 |
Таблица 2.3 - Координаты точек пересечения для огивы
Граница интервала |
кол-во регионов |
накопленные частоты (огива) |
|
5000-9000 |
23 |
80 |
|
9000-13000 |
36 |
57 |
|
13000-17000 |
11 |
21 |
|
17000-21000 |
4 |
10 |
|
21000-25000 |
4 |
6 |
|
25000-29000 |
1 |
2 |
|
29000-33000 |
1 |
1 |
Графическое изображение кумуляты и огивы выглядит следующим образом (Рисунок 2.2 и рисунок 2.3).
Рисунок 2.2 - Графическое изображение кумуляты
Рисунок 2.3 - Графическое изображение огивы
3) К показателям структуры относятся мода и медиана.
Мода - наиболее часто встречающееся значение признака.
Модальный интервал - это интервал с наибольшей частотой появления признака. В данном случае модальный интервал: от 9000 рублей до 13000 рублей.
Мо = ;
В данной совокупности большинство регионов имеют уровень безработицы близкий к 10368,4 рублей.
Медиана - значение признака, делящее совокупность на две равные части.
Медианный интервал - это интервал, в котором накопленная частота появления признака превышает половину объема совокупности.
В данном случае медианный интервал: от 9000 рублей до 13000 рублей (в данном интервале накопленная частота 59 превышает половину объема совокупности, который равен 40).
Ме = ;
Это означает, что половина регионов РФ имеют уровень среднемесячной зарплаты ниже 11956,5 рублей, а половина - выше.
Значение медианы и моды должны попадать в медианный интервал.
Мо = 10368,4 рублей; Ме = 11456,5 рублей - эти значения попадают в медианный интервал: от 9000 рублей до 13000 рублей.
Среднее значение по формуле средней взвешенной равно 11850 рублей (приложение Б).
К показателям силы вариации относятся среднее линейное отклонение (), среднее квадратическое отклонение () и дисперсия ().
;
В среднем по совокупности значения признака у отдельных единиц отклоняется от среднего значения примерно на 3553,75 рублей, что является довольно значительной цифрой.
;
СКО (корень из дисперсии) показывает, на сколько в среднем фактические значения показателя отклоняются от своего среднего значения (является более точным, чем среднее линейное отклонение). Соотношение СКО к среднему линейному отклонению зависит от наличия в совокупности резких отклонений (чем больше соотношение, тем более неоднородна совокупность). Для нормального распределения ?/d ? 1,25. В нашем же случае эта величина равна 1,40 - то есть наше распределение нельзя считать близким к нормальному. Квадрат среднего квадратического отклонения дает величину дисперсии, которая является мерой рассеивания значений признака по всем единицам совокупности под влиянием всех факторов. Чем меньше ее значение, тем лучше, тем меньше значения признака совокупности отклоняются от своего среднего значения. Полученное значение дисперсии велико, что говорит о сильном разбросе значений признака от среднего.
К показателям интенсивности относятся относительный размах вариации (), относительное линейное отклонение () и коэффициент вариации ().
;
;
.
Они используются для сравнения наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Совокупность можно считать однородной, если коэффициент вариации не превышает 33 %. Значение коэффициента вариации, равное 42%, говорит о неоднородности совокупности (относительное среднее линейное отклонение имеет тот же смысл, но является менее точным показателем: в нашем случае этот коэффициент равен 30%). Относительный размах вариации для нашей совокупности составил 212%. Это говорит о сильном разбросе значений показателя от средней величины.
Таблица 2.4 - Показатели вариации
Показатель |
Значение, рублей |
|
Размах вариации |
25162,70 |
|
Мода |
10 368,40 |
|
Медиана |
11 456,50 |
|
Среднее линейное отклонение |
3 553,75 |
|
Среднее квадратическое отклонение |
4 967,65 |
|
Дисперсия |
24 677 500,00 |
|
Относительный размах вариации |
2,12 |
|
Относительное линейное отклонение |
0,30 |
|
Коэффициент вариации |
0,42 |
3. ПРОВЕРКА ГИПОТЕЗЫ О НОРМАЛЬНОМ ХАРАКТЕРЕ
РАСПРЕДЕЛЕНИЯ ПОКАЗАТЕЛЯ
Задание: Проверить гипотезу о нормальном распределении Показателя, используя критерий Пирсона. Степень значимости принять равной 0,05.
Решение:
Нормальное распределение - распределение, полностью определяющееся двумя параметрами - средним значением и СКО.
Причина частого обращения именно к закону нормального распределения заключается в том, что в этом типе распределения отражается закономерность, возникающая при взаимодействии множества случайных факторов, ни один из которых не является преобладающим.
Проверим гипотезу о нормальном законе распределения. Для этого воспользуемся критерием согласия Пирсона (хи-квадрат). Идея Пирсона заключается в расчете и последующей оценке размера отклонений фактических значений частоты появления признака по интервалам от их теоретических значений, т.е. значений, которые бы имели место в случае нормального распределения. Чем больше размер этих отклонений, тем меньше оснований считать распределение близким к нормальному.
Результаты проверки гипотезы представлены в Приложении Б.
Таким образом, проверка гипотезы показала, что данное распределение не соответствует нормальному. Этот результат не явился неожиданным, т.к. в социально-экономической статистике нормальное распределение практически вообще не встречается; однако сравнение с нормальным распределением важно для выяснения степени и характера отклонений от него фактического распределения.
Проанализируем характер отклонений в параметрах распределения от нормального.
Если , то гипотеза принята;
Если , то гипотеза отклоняется.
Для расчета фактического значения:
рассчитаем нормированное отклонение () для каждого интервала;
найдём плотности вероятности нормирования по таблице;
определим теоретические частоты для каждого интервал (Приложение В);
определим теоретическое значение критерия Пирсона ();
Расчет представлен в Таблице3.1.
Таблица 3.1 - Расчет критерия Пирсона фактического
Интервалы значений признака |
Частота, |
Частота, |
?2расч. |
|
5 000-9 000 |
23 |
16 |
3,06 |
|
9 000-13 000 |
36 |
25 |
4,84 |
|
13 000-17 000 |
11 |
21 |
4,76 |
|
17 000-33 000 |
10 |
11 |
0,09 |
|
Итого: |
Х |
Х |
12,76 |
Для сравнения фактического значения критерия Пирсонас табличным значением рассчитаем число степеней свободы df=4-3=1 (4-число интервалов в вариационном ряду), при уровне значимости 0,05 и при df = 1, табличное значение равно 3,841. Расчётное значение = 12,76, что значительно выше табличного. Следовательно, гипотезу о близости эмпирического распределения к нормальному отвергается с вероятностью 95%.Для наглядности анализа данных, представим распределения теоретических и фактических частот графически (Рисунок 3.1).
Рисунок 3.1 - Распределение частот
Из графика наглядно видно, что данное эмпирическое распределение не соответствует нормальному закону распределения.
Рассчитаем показатели эксцесса и ассиметрии (Приложение Г). Для этого используем формулы коэффициента асимметрии и показателя эксцесса.
Показатель ассиметрии больше нуля, следовательно, имеет место правосторонняя ассиметрия, т.е. основная масса значений смещена в область малых значений. Показатель эксцесса равен 2,61, что больше нуля, следовательно распределение признака является островершинным.
Вывод: гипотеза о близости эмпирического распределения к нормальному отвергается с вероятностью 95%, следовательно, довольно сложно прогнозировать какая доля единиц совокупности попадёт в данный интервал значений признака.
4. ВЫБОРОЧНОЕ НАБЛЮДЕНИЕ
Задание: провести 20%-ную бесповторную выборку двумя способами: случайная и районированная, используя в качестве районов Федеральные округа.
Решение: выборка
Генеральная совокупность 80 субъектов, выборка будет составлять 18 субъектов. Выборка производиться случайным образом с помощью генератора случайных чисел.
Таблица 4.1 - Список 20%-ной выборочной совокупности
Регион |
Среднемесячная начисленная зарплата за 2007г., руб. |
|
Ивановская область |
8171,6 |
|
Липецкая область |
10907,1 |
|
Тамбовская область |
7903,0 |
|
Тверская область |
10177,0 |
|
г. Москва |
23623,3 |
|
Республика Карелия |
13342,1 |
|
Калининградская область |
12750,3 |
|
Новгородская область |
11004,9 |
|
г. Санкт-Петербург |
17552,0 |
|
Республика Адыгея |
8056,4 |
|
Республика Марий Эл |
8404,3 |
|
Республика Татарстан |
11468,6 |
|
Нижегородская область |
10302,0 |
|
Челябинская область |
11897,5 |
|
Иркутская область |
13770,0 |
|
Магаданская область |
22101,6 |
|
Сахалинская область |
23346,3 |
|
Еврейская автономная область |
11968,9 |
Х среднее по формуле простой арифметической получается равным 13297 рублей:
Дисперсию в выборочной () совокупности равна:
Рассчитаем предельную ошибку выборки по формуле:
, (1)
где tст - коэффициент доверия Стьюдента; n - размер выборочной совокупности; S2 - выборочная дисперсия признака в малой выборке. Значение коэффициента доверия Стьюдента выбирается по таблице «Распределение Стьюдента» по двум параметрам: число степеней свободы (d.f.=n-1) и степень значимости (?=1-F(t)).
Таблица 4.3 - Расчет предельной ошибки для случайной 20% бесповторной выборки
F(t) |
a |
t |
предельная ошибка выборки |
интервал для генеральной средней совокупности |
||
0,977 |
0,023 |
2,567 |
3102,200 |
10050 |
16255 |
|
0,833 |
0,167 |
2,898 |
3502,211 |
9650,4 |
16655 |
|
0,641 |
0,359 |
1,069 |
1291,878 |
11861 |
14444 |
Из расчетов видно, что чем больше доверительная вероятность, тем большее значение имеет коэффициент доверия Стьюдента, и тем шире доверительный интервал. Интерпретация полученных результатов:
С вероятностью 97,7 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 10050 руб. до 16255 руб.
С вероятностью 83,3 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 9650,4 руб. до 16655 руб.
С вероятностью 64,1 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 11861 руб. до 14444 руб.
Районированная выборка.
В каждом округе производиться двадцати процентная выборка. В центральном округе 18 субъектов, 18*20%=3,6, округляем в большую сторону до 4 субъектов. В Северо-Западном округе 10 субъектов, выбираем 2 субъекта, в Южном округе 13 субъектов 13*20%=2,6 субъекта, округляем до 3х. В Приволжском округе 14 субъектов, 20% составляет 2,8, примерно 3, в Уральском округе 4 субъекта, 20% составляет 1 субъекта, в Сибирском 12 субъектов, 20% - 2,4, примерно 3 субъекта, в Дальневосточном округе 9 субъектов, 20% - 1,8, примерно 2 субъекта. Всего получается 19 субъектов. Считаем х среднее для каждой группы по формуле простой арифметической средней, х среднее общее по формуле средней взвешанной, где вес-количество субъектов в группе. Считается дисперсия внутри групповая для каждой группы, и средняя остаточная дисперсия. Выборка и расчёты по ней представлены в приложении Д.
Таблица 4.4 - Расчет предельной ошибки для районированной 20% бесповторной выборки
F(t) |
a |
t |
предельная ошибка выборки |
интервал для генеральной средней |
||
0,977 |
0,023 |
2,567 |
2204,039 |
10239,428 |
14647,506 |
|
0,833 |
0,167 |
2,898 |
2488,237 |
9955,229 |
14931,704 |
|
0,641 |
0,359 |
1,069 |
917,849 |
11525,618 |
13361,315 |
С вероятностью 97,7 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 10239,4 руб. до 14647,5 руб.
С вероятностью 83,3 % можно утверждать, что среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 9955,2 руб. до 14931,7 руб.
С вероятностью 64,1 % можно утверждать, среднемесячная начисленная заработная плата за 2007г. в РФ (генеральной совокупности) находятся в пределах от 11525,6 руб. до 13361,3 руб.
Вывод: районированная выборка оказалась более точной, так как при той же вероятности, что и в случае случайной выборки, она обеспечивает меньший доверительный интервал, а значит и более высокую точность.
5 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Задание: для пары признаков, один из которых является факторным (среднемесячная начисленная заработная плата по субъектам РФ за 2007.), а другой результативным (средние цены на первичном рынке жилья по субъектам РФ за 2007г.), провести корреляционно-регрессионный анализ.
Решение:
Для построения поля корреляции понадобиться корреляционная решётка. Группировку по факторному признаку производим используя расчеты из второго задания. Всего получилось 7 интервалов длиной 4000 рублей.
Теперь разделим совокупность на группы по результативному признаку. Размах его вариации равен 97702 рублей. По формуле Стерджесса k =7,20.
Целесообразно разделить совокупность по результативному признаку на 7 групп. Получаем интервал для каждой группе 13957,43 рублей, примерно15000 рублей. Из 80 единиц совокупности исключаем те, для которых неизвестны значения показателя ”Средние цены на первичном рынке жилья, руб.” - получаем 71 единицу.
Таблица 5.1 Корреляционная решетка показателей “Среднемесячная начисленная заработная плата, руб.” (X) и ”Средние цены на первичном рынке жилья, руб.”(Y).
X |
Y |
||||||||
15000-30000 |
30000-45000 |
45000-60000 |
60000-75000 |
75000-90000 |
90000-105000 |
105000-120000 |
? |
||
5 000-9 000 |
11 |
8 |
- |
- |
- |
- |
- |
19 |
|
9 000-13 000 |
12 |
21 |
2 |
- |
- |
- |
- |
35 |
|
13 000-17 000 |
- |
8 |
3 |
- |
- |
- |
- |
11 |
|
17 000-21 000 |
- |
2 |
- |
- |
1 |
- |
- |
3 |
|
21 000-25 000 |
- |
1 |
- |
- |
- |
- |
1 |
2 |
|
25 000-29 000 |
- |
1 |
- |
- |
- |
- |
- |
1 |
|
29 000-33 000 |
- |
- |
- |
- |
- |
- |
- |
0 |
|
? |
23 |
41 |
5 |
0 |
1 |
0 |
1 |
71 |
Рисунок 5.1 - Поле корреляции
Оценку тесноты связи проведем с помощью таких показателей, как коэффициент корреляции, ЭКО, коэффициент детерминации, Спирмена, Пирсона, Кэндэла и Фехнера, коэффициенты ассоциации и контенгенции.
Коэффициент корреляции: (Приложение К)
Вывод: коэффициент корреляции характеризует наличие линейной связи между признаками и пороговое значение для него составляет 0,7, то есть можно сказать, что линейная связь между признаками отсутствует.
Эмпирическое корреляционное отношение и коэффициент детерминации:
Считаем среднюю в каждой группе по формуле простой арифметической, и для каждой группы считаем остаточную дисперсию. Потом рассчитывается средняя остаточная дисперсия, как средняя взвешенная из остаточных, где вес - количество единиц в группе. Она составляет 101015032,8 рублей2. Считаем межгрупповую дисперсию (81966384,03) и общую (182981416,8). Расчет и полученные данные представлены в Приложение К. Можно провести проверку, и получим, что общая дисперсия равна сумме средней остаточной и межгрупповой:
101015032,8+81966384,03=182981416,8
Коэффициент детерминации считаем как частное межгрупповая дисперсия от общей, и он составляет примерно 0,45. ЭКО равен корню из коэффициента детерминации и составляет 0,67. Вывод: связь умеренная, так как значения коэффициента детерминации и ЭКО очень близки к пороговым: 0,5 и 0,7 соответственно.
Коэффициент Спирмана (Приложение Л) равен 0,63: согласно данному коэффициенту связь прямая, довольно тесная, так как пороговое значение составляет 0,5.
Коэффициент Кендалла (Приложение М) равен 0,47, это значение немного меньше порогового (0,5) и указывает на то, что связь прямая, слабая.
Значение коэффициент Фехнера (Приложение Н) равно 0,41, что является меньше порогового (0,5), что указывает на отсутствие связи.
Коэффициенты Пирсона и Чупрова рассчитывается на основе корреляционной решетки, представленной в Таблице 5.1. Для расчета данного коэффициента найдем значение (Приложение П). Коэффициент Пирсона будет равен 0,72, а коэффициент Чупрова составил 0,42. Эти коэффициенты указывают на то, что связь достаточно тесная.
Коэффициенты контингенции и ассоциации рассчитывать не имеет смысла, так как они считаются для альтернативных признаков.
Таблица 5.2 - Сводка рассчитанных коэффициентов
Коэффициент |
Полученное значение |
Пороговое значение |
Вывод |
|
Коэффициент корреляции |
0,60 |
0,7 |
Связь умеренная, прямая |
|
ЭКО |
0,67 |
0,7 |
Связь умеренная |
|
Коэффициент детерминации |
0,45 |
0,5 |
Связь умеренная |
|
Коэффициент Спирмена |
0,63 |
0,5 |
Связь тесная, прямая |
|
Коэффициент Кендалла |
0,47 |
0,5 |
Связь умеренная, прямая |
|
Коэффициент Фехнера |
0,41 |
0,5 |
Связь умеренная, прямая |
|
Коэффициент Пирсона |
0,76 |
0,3 |
Связь тесная |
|
Коэффициент Чупрова |
0,48 |
0,3 |
Связь тесная |
Если делать выводы о наличии связи, опираясь на данную таблицу, можно сказать что связь есть, так как коэффициент Пирсона, Чупрова и Спирмена больше пороговых значений, а коэффициенты Фехнера и Кендела очень близки к пороговым значениям. Однако все эти коэффициенты характеризуют связь, исходя из значений рангов или частот проявления признака, а не из значений самого признака. Поэтому в первую очередь необходимо учитывать коэффициенты корреляции, детерминации и ЭКО, которые рассчитываются непосредственно на основании самих значений признака. Их значения не дотягивают до пороговых (однако очень близки к ним), поэтому нельзя с уверенностью сказать о наличии тесной связи.
Построим уравнение парной регрессии.
Чтобы определить вид связи между признаками проведем регрессионный анализ (построим уравнение регрессии).
Чтобы построить уравнение регрессии, воспользуемся методом наименьших квадратов. Суть метода состоит в том, что в качестве линии регрессии выбирается такая линия, которая наиболее точно описывает поле корреляции. Для определения такой линии по каждому предполагаемому варианту линии регрессии (прямая, парабола, гипербола) рассчитывается сумма квадратов отклонений фактических значений признаков от их теоретических значений. В качестве уравнения выбирается то, которому соответствует наименьшее значение суммы квадратов отклонений.
Уравнение прямой можно получить с помощью Excel:
y = 2,1056x + 11331
Как и уравнение параболы:
y = -0,00006x2+ 3,9247x - 904,1
Уравнения гиперболы приведём вручную - расчёты в Приложении Р. Оно получилось
у=33307,05849+24434401,91/х
Из трех вариантов наименьшая сумма квадратов отклонений - у параболы, следовательно, наше уравнение регрессии - параболическое и зависимость - параболическая (Приложение Ж).
Таким образом, можно сделать общий вывод, что связь между признаками - параболическая, прямая, но не очень тесная, т.е. с ростом среднемесячной заработной платы, средние цены на первичном рынке жилья увеличиваются, но это не единственный фактор.
6. АНАЛИЗ РЯДОВ ДИНАМИКИ
Задание: провести анализ рядов динамики, для чего рассчитать показатели тенденции динамики, построить тренд (используя графический метод, метод наименьших квадратов и EXCEL), сделать интервальный прогноз на срок 1/3 от базы прогноза и сделать выводы.
Решение:
Тенденция - это основное направление движения признака.
К показателям тенденции относятся: средний уровень ряда, средний прирост, среднее ускорение уровня ряда, средний темп роста, средний темп прироста. Причем, показатели бывают цепные и базисные. Цепные показатели оценивают отношения статистического признака и его характеристик за смежные периоды времени, а базисные - с одним и тем же заданным базисом (в нашем случае - это будет начальный 2000 год).
1. Рассчитаем показатели для первого ряда динамики - Реальная начисленная заработная плата по РФ за 2000-2007 гг., % к предыдущему году. Ряд представлен в таблице 6.1.
Таблица 6.1 - Реальная начисленная заработная плата по РФ за 2000-2007 гг., в процентах к предыдущему году по РФ*
Показатель |
Период времени |
Среднее значение |
||||||
2000 |
2003 |
2004 |
2005 |
2006 |
2007 |
|||
Реальная начисленная заработная плата по РФ, руб. |
121,00 |
111,00 |
111,00 |
113,00 |
113,00 |
117,00 |
114,33 |
|
Абсолютный цепной прирост, процентные пункты |
… |
… |
- |
2,00 |
- |
4,00 |
- 50 |
|
Абсолютный базисный прирост, процентные пункты |
- |
-10,00 |
-10,00 |
-8,00 |
-8,00 |
-4,00 |
? |
|
Ускорение уровня ряда, процентные пункты |
… |
… |
… |
2,00 |
-2,00 |
4,00 |
1,33 |
Окончание таблицы 6.1
Показатель |
Период времени |
Среднее значение |
||||||
2000 |
2003 |
2004 |
2005 |
2006 |
2007 |
|||
Цепной темп роста, % |
… |
… |
100,00% |
101,80% |
100,00% |
103,54% |
135,23 |
|
Базисный темп роста, % |
- |
91,74% |
91,74% |
93,39% |
93,39% |
96,69% |
? |
|
Цепной темп прироста, % |
… |
… |
0,00% |
1,80% |
0,00% |
3,54% |
35,23 |
|
Базисный темп прироста, % |
- |
-8,26% |
-8,26% |
-6,61% |
-6,61% |
-3,31% |
? |
|
Цепное абсолютное значение 1% прироста |
. . . |
1,21 |
1,11 |
1,11 |
1,13 |
1,13 |
? |
|
Базисное абсолютное значение 1% прироста |
1,21 |
1,21 |
1,21 |
1,21 |
1,21 |
1,21 |
? |
*Значения за 1995 г. Были убраны так как являлись несопоставимыми со значениями других годов
Хотя ряд и неполный, но по полученным данным можно сделать вывод, что за весь период с 2000 по 2007 гг. Реальная начисленная заработная плата по Российской Федерации в процентах к предыдущему году составило 114 процентов. Причем в течение указанного периода изменение происходит неравномерно, и в среднем за 8 периодов абсолютный прирост снизился на 0,5 процентных пункта.
Построим тренд, используя графический метод, метод наименьших квадратов, Excel.
Графический метод
Рисунок 6.1 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (графический метод).
Прямая проводиться визуально, примерно на равном расстоянии от точек совокупности. Берутся на ней 2 точки: A и B. С помощью их координат записывается уравнение для графического метода:
y = -0,3t + 115
Метод наименьших квадратов
Таблица 6.2 - Линейная зависимость
Год |
ti |
yфакт |
утеор |
(утеор-уфакт) |
|
2000 |
1 |
121,00 |
115,19 |
33,79 |
|
2003 |
2 |
111,00 |
114,84 |
14,78 |
|
2004 |
3 |
111,00 |
114,5 |
12,26 |
|
2005 |
4 |
113,00 |
114,16 |
1,34 |
|
2006 |
5 |
113,00 |
113,82 |
0,67 |
|
2007 |
6 |
117,00 |
113,47 |
12,44 |
|
? |
X |
X |
X |
75,28 |
yлиней = -0,3429t + 115,53
Таблица 6.3 - Параболическая зависимость
Год |
ti |
yфакт |
утеор |
(утеор-уфакт) |
|
2000 |
1 |
121,00 |
119,36 |
2,70 |
|
2003 |
2 |
111,00 |
114,01 |
9,09 |
|
2004 |
3 |
111,00 |
111,17 |
0,03 |
|
2005 |
4 |
113,00 |
110,83 |
4,72 |
|
2006 |
5 |
113,00 |
112,99 |
0,00 |
|
2007 |
6 |
117,00 |
117,64 |
0,41 |
|
? |
X |
X |
X |
16.94 |
= 1,25 t - 9,0929t + 127,2
Таблица 6.4 - Гиперболическая зависимость
Год |
ti |
yфакт |
утеор |
(утеор-уфакт) |
|
2000 |
1 |
121,00 |
118,85 |
4,62 |
|
2003 |
2 |
111,00 |
115,04 |
16,28 |
|
2004 |
3 |
111,00 |
113,76 |
7,64 |
|
2005 |
4 |
113,00 |
113,13 |
0,02 |
|
2006 |
5 |
113,00 |
112,75 |
0,06 |
|
2007 |
6 |
117,00 |
112,49 |
20,33 |
|
? |
X |
X |
X |
48.95 |
Наименьшая сумма квадратов отклонений теоретических величин от фактических наблюдается при параболической зависимости, следовательно, данный вид зависимости подходит для исследуемой совокупности. Построим тренд:
Рисунок 6.2 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (метод наименьших квадратов).
EXCEL
Теперь построим тренд с помощью EXCEL.
Для того, чтобы построить линию тренда в EXCEL, необходимо сначала построить фактический ряд динамики, а потом добавить линию тренда.
Рисунок 6.3- Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (EXCEL).
Рассчитаем показатели колеблемости (Приложение З).
Таблица 6.5 - Показатели колеблемости
Показатель |
Значение |
|
Амплитуда, процентные пункты |
5 |
|
СЛО от тренда, процентные пункты |
2,3 |
|
СКО от тренда, процентные пункты |
2,4 |
|
Относительное лин. отклонение |
2,0% |
|
Коэффициент аппроксимации |
2,1% |
|
Средний уровень ряда, процентные пункты |
114 |
Анализируя полученные результаты, мы можем сказать, что в среднем фактические значения уровней ряда отклоняются от линии тренда на 1,8 процентных пунктов, что составляет 1,5 % от среднего значения уровня ряда. Это отклонение достаточно невелико, следовательно выбранное уравнение тренда неплохого качества, и оно позволяет произвести прогноз.
Составим интервальный прогноз на 2 года. Для этого необходимо уравнение зависимости, которое получено при расчете сумм квадратов отклонений. В него подставляется номер прогнозного периода и получаем точечный прогноз:
y= 1,25 *8 - 9,0929*8 + 127,2
y= 134,4568
Для расчёта интервального прогноза нужно найти ошибки I и II рода. Ошибка II рода - это полученное значение СКО, а ошибка I рода:
,
где - среднее значение из номеров периодов в ряду динамики;
- среднеквадратическое отклонение фактического значения от тренда;
- база прогноза (число периодов в ряду динамики);
- номер прогнозного периода;
- номера периодов в ряду динамики;
Найдем общую ошибку прогноза:
По таблице определим коэффициент Стьюдента. При степени значимости и числе степеней свободы он примет значение 2,776.
Теперь мы можем рассчитать интервальный прогноз:
125,4355?у?143,4781
Таким образом, с вероятностью 95% можно предположить, что реальной начисленной заработной платы в процентах к предыдущему году по РФ в 2009 году будет находиться в пределах от 125 до 143 процентных пунктов.
2. Реальная начисленная заработная плата по Челябинской в процентах к предыдущему году.
Таблица 6.6 - Реальная начисленная заработная плата по Челябинской за 2000-2007 гг., в процентах к предыдущему году*
Показатель |
Период времени |
Среднее значение |
||||||
2000 |
2003 |
2004 |
2005 |
2006 |
2007 |
|||
Реальная начисленная заработная плата по Челябинской области, процентные пункты |
119,00 |
113,00 |
111,00 |
111,00 |
113,00 |
118,00 |
114,17 |
|
Абсолютный цепной прирост, процентные пункты |
… |
… |
-2,00 |
0,00 |
2,00 |
5,00 |
-13 |
|
Абсолютный базисный прирост, процентные пункты |
- |
-6,00 |
-8,00 |
-8,00 |
-6,00 |
-1,00 |
? |
|
Ускорение уровня ряда, процентные пункты |
… |
… |
… |
2,00 |
2,00 |
3,00 |
2,33 |
|
Цепной темп роста, % |
… |
… |
100,00 |
101,80 |
100,00 |
103,54 |
133,67 |
|
Базисный темп роста, % |
- |
91,74 |
91,74 |
93,39 |
93,39 |
96,69 |
? |
|
Цепной темп прироста, % |
… |
… |
0,00 |
1,80 |
0,00 |
3,54 |
33,67 |
|
Базисный темп прироста, % |
- |
-8,26 |
-8,26 |
-6,61 |
-6,61 |
-3,31 |
? |
|
Цепное абсолютное значение 1% прироста |
. . . |
1,19 |
1,13 |
1,11 |
1,11 |
1,13 |
? |
|
Базисное абсолютное значение 1% прироста |
1,19 |
1,19 |
1,19 |
1,19 |
1,19 |
1,19 |
? |
*Значения за 1995 г. Были убраны так как являлись несопоставимыми со значениями других годов
По полученным данным можно сделать вывод, что за весь период с 2000 по 2007 гг. по Челябинской области среднее средняя заработная плата в процентах на человека составило 114,17%. Причем в течение указанного периода каждый год происходит уменьшение заработной платы в 0,13 процентных пункта.
Построим тренд, используя графический метод, метод наименьших квадратов, Excel.
Графический метод
Рисунок 6.4 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по РФ за 2000-2007 гг. (графический метод).
Уравнение для графического метода находится аналогично и имеет вид:
y = - 0,1x + 114
Метод наименьших квадратов
Таблица 6.7 - Линейная зависимость
Год |
ti |
yфакт |
утеор |
(утеор-уфакт) |
|
2000 |
1 |
121,00 |
114,53 |
41,90 |
|
2003 |
2 |
111,00 |
114,38 |
11,45 |
|
2004 |
3 |
111,00 |
114,24 |
10,51 |
|
2005 |
4 |
113,00 |
114,10 |
1,21 |
|
2006 |
5 |
113,00 |
113,96 |
0,91 |
|
2007 |
6 |
117,00 |
113,81 |
10,16 |
|
? |
X |
X |
X |
76,14 |
yлиней = -0,1429x + 114,67
Таблица 6.8 - Параболическая зависимость
Год |
ti |
yфакт |
утеор |
(утеор-уфакт) |
|
2000 |
1 |
121,00 |
118,75 |
0,06 |
|
2003 |
2 |
111,00 |
113,54 |
0,29 |
|
2004 |
3 |
111,00 |
110,86 |
0,02 |
|
2005 |
4 |
113,00 |
110,71 |
0,08 |
|
2006 |
5 |
113,00 |
113,11 |
0,01 |
|
2007 |
6 |
117,00 |
118,04 |
0,00 |
|
? |
X |
X |
X |
0,46 |
= 1,2679 t - 9,0179t + 126,5
Таблица 6.9 - Гиперболическая зависимость
Год |
ti |
yфакт |
утеор |
(утеор-уфакт) |
|
2000 |
1 |
121,00 |
117,73 |
1,61 |
|
2003 |
2 |
111,00 |
114,86 |
3,46 |
|
2004 |
3 |
111,00 |
113,90 |
8,43 |
|
2005 |
4 |
113,00 |
113,43 |
5,88 |
|
2006 |
5 |
113,00 |
113,14 |
0,02 |
|
2007 |
6 |
117,00 |
112,95 |
25,54 |
|
? |
X |
X |
X |
44,94 |
Наименьшая сумма квадратов отклонений теоретических величин от фактических наблюдается при параболической зависимости, следовательно, данный вид зависимости подходит для исследуемой совокупности. Построим тренд:
Рисунок 6.5 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области за 2000-2007 гг. (метод наименьших квадратов).
EXCEL
Теперь построим тренд с помощью EXCEL. Для того, чтобы построить линию тренда в EXCEL, необходимо сначала построить фактический ряд динамики, а потом добавить линию тренда.
Рисунок 6.6 - Динамика реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области за 2000-2007 гг. (EXCEL).
Таблица 6.10 - Показатели колеблемости
Показатель |
Значение |
|
Амплитуда отклонений, процентные пункты |
1 |
|
Среднее линейное отклонение, процентные пункты |
0,3 |
|
Среднеквадратическое отклонение, процентные пункты |
0,4 |
|
Относительное линейное отклонение |
0,3% |
|
Коэффициент аппроксимации |
0,3% |
|
Среднее значение, процентные пункты |
114 |
Анализируя полученные результаты, мы можем сказать, что в среднем фактические значения уровней ряда отклоняются от линии тренда на 0,3 процентных пункта, что составляет 0,3% от среднего значения уровня ряда. Таким образом, можно сделать вывод, что тенденция динамики исследуемого показателя является достаточно устойчивой и построенное уравнение тренда пригодно для прогнозирования. Т.к. прогнозирование возможно только на 1/3 ретроспективы, следовательно, мы можем сделать прогноз.
Отклонение фактического уровня ряда от теоретического достаточно невелико для рассматриваемых нами данных, это позволяет сделать вывод о том, что составленное нами уравнение тренда имеет хорошее качество.
Составим интервальный прогноз на 2 года. Точечный прогноз равен:
y= 135,50
Итервальный прогноз:
134,009?у? 136,9958
Таким образом, с вероятностью 95% можно предположить, что реальной начисленной заработной платы в процентах к предыдущему году по Челябинской области в 2009 году будет находиться в пределах от 134 до 137 процентных пунктов.
совокупность статистический анализ регрессия
ЗАКЛЮЧЕНИЕ
В курсовой работе был проведен подробный статистический анализ показателя «Среднемесячная начисленная заработная плата, тыс. руб.» в 2007 г. по регионам РФ. Произведенные в результате работы расчеты позволили установить, что среднее значение показателя по РФ составило 11929,2 руб. Величина размаха вариации - 25162,7 тыс. руб. характеризует достаточно высокое расхождение значений признака по единицам статистической совокупности, а, следовательно, и неоднородность изучаемой статистической совокупности.
Вариационный анализ позволяет определить, что распределение близко к нормальному, т.к. значение медианы расположено между значениями моды и средней, т.к. среднее значение больше моды, имеет место правосторонняя асимметрия графика распределения.
В третьем задании было установлено, что распределение среднедушевых денежных доходов по регионам РФ не соответствует нормальному, так как расчетное больше табличного.
При помощи корреляционного анализа было установлено, что между реальной среднемесячной начисленной заработной платой и ценами на первичном рынке жилья по регионам существует тесная прямая связь.
При выполнении оценки параметров генеральной совокупности на основе данных случайного и районированного выборочного наблюдения получили значение средней генеральной характеристики по рассматриваемому признаку с учетом предельной ошибки средней величины, причём среднее значение по генеральной совокупности попало во все рассчитанные интервалы по этой выборке.
Анализ динамики показателя «Среднемесячная заработная плата в процентах к предыдущему году» по РФ и по Челябинской области за 2000-2007 годы позволил найти уравнение тренда, описывающего динамику показателя, посчитаны показатели колеблемости динамики, и проведён прогноз.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Ефремова М.Р. Общая теория статистики: учебник. - Москва: Изд-во ИНФРА-М, 2005 - 412с
2. Российский статистический ежегодник: Официальное издание. - М.: Госкомстат РФ, 2005
3. Лазарева Г.В., Богданчикова М.Ю. Статистика: Учебное пособие по выполнению курсового проекта. - Челябинск: Изд. ЮУрГУ, 2003.
4. СТО ЮУрГУ 20-2008 Стандарт организации. Учебные рефераты. Общие требования к построению, содержанию и оформлению / составители: Т.И. Парубочая, Н.В. Сырейщикова, В.А. Смолко, Л.В. Винокурова. - Челябинск: Изд-во ЮУрГУ, 2008.
5. Электронный ресурс: www.georus.by.ru
ПРИЛОЖЕНИЯ
ПРИЛОЖЕНИЕ А
Сводная таблица среднемесячная начисленная заработная плата по субъектам РФ за 2007 год.
Таблица А.1 - Исходные данные
Регион |
Среднемесячная начисленная заработная плата за 2007 год, руб. |
|
Белгородская область |
10479,5 |
|
Брянская область |
8189,6 |
|
Владимирская область |
9688,1 |
|
Воронежская область |
8730,9 |
|
Ивановская область |
8171,6 |
|
Калужская область |
10926,8 |
|
Костромская область |
9058,1 |
|
Курская область |
8856,8 |
|
Липецкая область |
10907,1 |
|
Московская область |
16234,5 |
|
Орловская область |
8610,7 |
|
Рязанская область |
9796,6 |
|
Смоленская область |
9552,1 |
|
Тамбовская область |
7903 |
|
Тверская область |
10177 |
|
Тульская область |
10137,1 |
|
Ярославская область |
11214,8 |
|
г. Москва |
23623,3 |
|
Республика Карелия |
13342,1 |
|
Республика Коми |
17077,3 |
|
Архангельская область |
14400,3 |
|
Вологодская область |
12913,9 |
|
Калининградская область |
12750,3 |
|
Ленинградская область |
13154,8 |
|
Мурманская область |
18581 |
|
Новгородская область |
11004,9 |
|
Псковская область |
8950,5 |
|
г. Санкт-Петербург |
17552 |
|
Республика Адыгея |
8056,4 |
|
Республика Дагестан |
5696,4 |
|
Республика Ингушетия |
7285,4 |
|
Кабардино-Балкарская Республика |
7213,9 |
|
Республика Калмыкия |
7101,2 |
|
Карачаево-Черкесская Республика |
7558,4 |
|
Республика Северная Осетия - Алания |
7625,8 |
|
Чеченская Республика |
9916,7 |
|
Краснодарский край |
10260 |
|
Ставропольский край |
8647,7 |
|
Астраханская область |
9866,9 |
|
Волгоградская область |
9770,2 |
|
Ростовская область |
9779,6 |
|
Республика Башкортостан |
11027,1 |
|
Республика Марий Эл |
8404,3 |
|
Республика Мордовия |
8103 |
|
Республика Татарстан |
11468,6 |
|
Удмуртская Республика |
9838,6 |
|
Чувашская Республика |
8703,2 |
|
Пермский край |
11856 |
|
Кировская область |
8861,5 |
|
Нижегородская область |
10302 |
|
Оренбургская область |
9619,6 |
|
Пензенская область |
8566,4 |
|
Самарская область |
11920,7 |
|
Саратовская область |
9108,3 |
|
Ульяновская область |
8412,7 |
|
Курганская область |
8883,1 |
|
Свердловская область |
13986,9 |
|
Тюменская область |
28565 |
|
Челябинская область |
11897,5 |
|
Республика Алтай |
9228,2 |
|
Республика Бурятия |
11528,6 |
|
Республика Тыва |
10701,6 |
|
Республика Хакасия |
11251,2 |
|
Алтайский край |
7804,7 |
|
Красноярский край |
15510 |
|
Иркутская область |
13770 |
|
Кемеровская область |
12554,9 |
|
Новосибирская область |
12017,0 |
|
Регион |
Среднемесячная начисленная заработная плата за 2007 год, руб |
|
Омская область |
11003,6 |
|
Томская область |
14429 |
|
Читинская область |
12161,5 |
|
Республика Саха (Якутия) |
19409,2 |
|
Камчатский край |
21814,7 |
|
Приморский край |
13174,1 |
|
Хабаровский край |
15883,5 |
|
Амурская область |
13534,4 |
|
Магаданская область |
22101,6 |
|
Сахалинская область |
23346,3 |
|
Еврейская автономная область |
11968,9 |
|
Чукотский автономный округ |
30859,1 |
Средняя величина - количественная характеристика общего в явлениях и процессах, характеристика статистической закономерности. Формула для расчёта простой арифметической средней величины:
Наименьшее значение показателя в совокупности равно 5696,4 рублей и оно принадлежит республике Дагестан. Наибольшее принадлежит Чукотскому автономному округу. Размах вариации, как разность между наибольшего и наименьшего значения, составил 25162,7 рублей:
ПРИЛОЖЕНИЕ Б
Расчет показателей вариации
Таблица Б.1 - Расчет значений для показателей вариации
Интервалы |
Частота, |
Середина интервала, |
|
5 000-9 000 |
23 |
7000 |
|
9 000-13 000 |
36 |
11000 |
|
13 000-17 000 |
11 |
15000 |
|
17 000-21 000 |
4 |
19000 |
|
21 000-25 000 |
4 |
23000 |
|
25 000-29 000 |
1 |
27000 |
|
29 000-33 000 |
1 |
31000 |
Рассчитаем среднее значение признака по формуле средней взвешенной:
Показатели структуры вариации.
Мода - наиболее часто встречающееся значение признака.
, (Б.1)
где - начальное значение,
- длина модального интервала,
- частота модального интервала,
- частота интервала, предшествующего данному,
- частота интервала, следующего за данным.
Мо = ;
Медиана.
Сначала находим номер медианного интервала:
, (Б.2)
.
Затем само значение медианы:
, (Б.3)
Ме = ;
Расчет показателей силы вариации.
Среднее линейное отклонение найдем следующим образом:
, (Б.4)
где СЛО - среднее линейное отклонение;
- i-е значение признака (середина интервала);
- среднее значение признака;
- частота признака.
Подставив исходные значения, получим:
;
Расчет дисперсии ():
, (Б.5)
Среднее квадратическое отклонение:
(Б.6)
;
Расчет показателей интенсивности вариации.
Относительный размах вариации ():
, (Б.7)
;
Коэффициент вариации ():
, (Б.9)
ПРИЛОЖЕНИЕ В
Расчеты для проверки гипотезы о нормальном распределении показателя
Таблица В.1 - Расчет частот теоретического ряда распределения
Середеина интервала |
частота |
t |
f(t) |
теоретич |
округл |
||
7000 |
23 |
-0,9763 |
0,2468 |
15,90 |
16 |
3,063 |
|
11000 |
36 |
-0,1711 |
0,3932 |
25,33 |
25 |
4,840 |
|
15000 |
11 |
0,6341 |
0,3271 |
21,07 |
21 |
4,762 |
|
19000 |
4 |
1,4393 |
0,1415 |
9,11 |
9 |
2,778 |
|
23000 |
4 |
2,2445 |
0,0325 |
2,09 |
2 |
1,205 |
|
27000 |
1 |
3,0497 |
0,0038 |
0,24 |
0 |
0 |
|
31000 |
1 |
3,8549 |
0,0002 |
0,01 |
0 |
0 |
Так как у нас есть интервалы с частотой меньше 5, нам необходимо объединить некоторые интервалы. После несложных преобразований получаем новые частоты.
Таблица В.2 - Расчет частот теоретического ряда распределения по объединенным интервалам
Интервалы значений признака |
Частота, |
Частота, |
?2расч. |
|
5 000-9 000 |
23 |
16 |
3,06 |
|
9 000-13 000 |
36 |
25 |
4,84 |
|
13 000-17 000 |
11 |
21 |
4,76 |
|
17 000-33 000 |
10 |
11 |
0,09 |
|
Итого: |
Х |
Х |
12,76 |
ПРИЛОЖЕНИЕ Г
Расчет ассиметрии и экцесса
Таблица Г.1 - Расчет ассиметрии и эксцесса
Интервалы значений признака |
Середина интервала |
Частота |
|||
5 000- 9 000 |
7000 |
23 |
-2623 934875000,00 |
12726084143750000,00 |
|
9 000- 13 000 |
11000 |
36 |
-22108500000,00 |
18792225000000,00 |
|
13 000- 17 000 |
15000 |
11 |
343 814625000,00 |
1083016068750000,00 |
|
17 000- 21 000 |
19000 |
4 |
1462103500000,00 |
10454040025000000,00 |
|
21 000- 25 000 |
23000 |
4 |
5544783500000,00 |
61824336025000000,00 |
|
25 000- 29 000 |
27000 |
1 |
3 477265875000,00 |
52680578006250000,00 |
|
29 000- 33 000 |
31000 |
1 |
7 022735875000,00 |
134485392006250000,00 |
|
ИТОГО: |
X |
80 |
1520466000000,00 |
273272238500000000,00 |
ПРИЛОЖЕНИЕ Д
Расчеты для 20% бесповторных случайной и районированной выборок
Таблица Д.1 - Случайная выборка
Регион |
Среднемесячная начисленная зарплата за 2007г., руб. |
||
Ивановская область |
8171,6 |
24810416,3 |
|
Липецкая область |
10907,1 |
5042295,2 |
|
Тамбовская область |
7903,0 |
27558358,5 |
|
Тверская область |
10177,0 |
8854228,4 |
|
г. Москва |
23623,3 |
109635442,1 |
|
Республика Карелия |
13342,1 |
35908,1 |
|
Калининградская область |
12750,3 |
161849,8 |
|
Новгородская область |
11004,9 |
4612639,2 |
|
г. Санкт-Петербург |
17552,0 |
19354671,5 |
|
Республика Адыгея |
8056,4 |
25971311,1 |
|
Республика Марий Эл |
8404,3 |
22546405,6 |
|
Республика Татарстан |
11468,6 |
2835874,7 |
|
Нижегородская область |
10302,0 |
8125952,0 |
|
Челябинская область |
11897,5 |
1575290,0 |
|
Иркутская область |
13770,0 |
381175,9 |
|
Магаданская область |
22101,6 |
80084501,6 |
|
Сахалинская область |
23346,3 |
103911406,4 |
|
Еврейская автономная область |
11968,9 |
1401158,8 |
|
ИТОГО: |
236746,9 |
446898885,3 |
В соответствии с заданием необходимо рассчитать предельную ошибку выборки, используя значения вероятности 0,977, 0,833, 0,641.
Определим число степеней свободы:
d.f. = n - 1= 18 - 1=17
Рассчитаем значения степеней значимости, используя значения вероятностей 0,977, 0,833, 0,641 соответственно:
Рассчитаем среднее значение сремесячной начисленной заработной платы за 2007 году в выборке:
Далее рассчитаем среднее квадратическое отклонение исследуемого показателя по малой выборке:
Вычислим предельную ошибку средней для исследуемой малой выборки для соответствующих вероятностей:
;
;
.
Определим доверительные интервалы генеральной средней, в который с доверительными вероятностями попадет значение генеральной средней:
10050<?<16255
9650,4<?<16655
11861<?<14444
Таблица Д.2 - Районированная выборка
Субъект |
Округ |
Среднемеячная з/п за 2007г. |
х среднее |
х среднее общее |
S2 внутригр. |
S2 ср.ост. |
|
Белгородская область |
Центральный |
10479,5 |
12922,63 |
12443,47 |
38643699,16 |
13269645,60 |
|
Воронежская область |
8730,9 |
||||||
Курская область |
8856,8 |
||||||
Г. Москва |
23623,3 |
||||||
Псковская область |
Северо-Западный |
8950,5 |
13251,25 |
18496450,56 |
|||
г. Санкт-Петеpбуpг |
17552 |
||||||
Астраханская область |
Южный |
9866,9 |
9805,57 |
1895,62 |
|||
Волгоградская область |
9770,2 |
||||||
Ростовская область |
9779,6 |
||||||
Республика Татарстан |
Приволжский |
11468,6 |
10112,33 |
1421780,86 |
|||
Нижегородская область |
10302 |
||||||
Пензенская область |
8566,4 |
||||||
Челябинская область |
Уральский |
11897,5 |
11897,50 |
- |
|||
Республика Алтай |
Сибирский |
9228,2 |
11636,13 |
4582140,28 |
|||
Республика Хакасия |
11251,2 |
||||||
Томская область |
14429 |
||||||
Хабаровский край |
Дальневосточный |
15883,5 |
19614,90 |
13923345,96 |
|||
Сахалинская область |
23346,3 |
Рассчитаем средние значения показателя по всем Федеральным округам:
Рассчитаем остаточные дисперсии по всем Федеральным округам:
Найдем среднюю из остаточных дисперсий:
Расчет предельной ошибки средней для исследуемой малой выборки для вероятностей 0,903, 0,870, 0,655:
;
;
.
Определим доверительные интервалы генеральной средней, в который с доверительными вероятностями попадет значение генеральной средней:
10239,428<?<14647,506
9955,229<?<14931,704
11525,618<?<13361,315
ПРИЛОЖЕНИЕ Е
Расчет коэффициента корреляции
Таблица Е.1 - Расчет коэффициента корреляции
Регион |
xi |
yi |
(Xi-Xср)(Yi-Yср) |
(Xi-Xср)2 |
(Yi-Yср)2 |
|
Республика Северная Осетия - Алания |
7625,8 |
15799 |
77327339,3 |
15238873,69 |
392385784,2 |
|
Республика Калмыкия |
7101,2 |
16896 |
82861153,96 |
19609840,89 |
350128839,6 |
|
Еврейская автономная область |
11968,9 |
17711 |
-7863823,162 |
193072,36 |
320292944,7 |
|
Республика Дагестан |
5696,4 |
21827 |
80384376,16 |
34025055,61 |
189908519,3 |
|
Ставропольский край |
8647,7 |
23092 |
36067830,71 |
8304771,24 |
156643497,4 |
|
Республика Мордовия |
8103 |
23898 |
40123389,85 |
11740902,25 |
137117776,7 |
|
Республика Адыгея |
8056,4 |
24255 |
39429166,56 |
12062423,61 |
128884478,5 |
|
Саратовская область |
9108,3 |
24535 |
26809293,88 |
5862209,44 |
122605349,7 |
|
Орловская область |
8610,7 |
25674 |
28994571,12 |
8519393,44 |
98678991,71 |
|
Брянская область |
8189,6 |
25714 |
33044068,83 |
11154932,01 |
97885893,31 |
|
Республика Хакасия |
11251,2 |
25730 |
2748972,259 |
77450,89 |
97569549,95 |
|
Республика Тыва |
10701,6 |
26500 |
7540289,667 |
685418,41 |
82950745,75 |
|
Курская область |
8856,8 |
26578 |
24133759,37 |
7143325,29 |
81536023,87 |
|
Смоленская область |
9552,1 |
26859 |
17299738,7 |
3910110,76 |
76540276,61 |
|
Астраханская область |
9866,9 |
27112 |
14125000,7 |
2764238,76 |
72177428,23 |
|
Тамбовская область |
7903 |
27983 |
27651083,35 |
13151502,25 |
58136507,57 |
|
Оренбургская область |
9619,6 |
27996 |
14537643,13 |
3647718,01 |
57938433,59 |
|
Читинская область |
12161,5 |
28050 |
-4776485,36 |
399424 |
57119282,75 |
|
Республика Алтай |
9228,2 |
28877 |
15489428,95 |
5295981,69 |
45302726,33 |
|
Новгородская область |
11004,9 |
28989 |
3472185,758 |
275205,16 |
43807586,81 |
|
Воронежская область |
8730,9 |
29103 |
18204137,38 |
7832161,96 |
42311512,37 |
|
Республика Бурятия |
11528,6 |
29451 |
5541,057 |
0,81 |
37905324,29 |
|
Кемеровская область |
12554,9 |
29860 |
-5893722,342 |
1051445,16 |
33036400,15 |
|
Ивановская область |
8171,6 |
30224 |
18078026,97 |
11275492,41 |
28984548,71 |
|
Ленинградская область |
13154,8 |
30675 |
-8017166,069 |
2641600,09 |
24331825,25 |
|
Республика Саха (Якутия) |
19409,2 |
30835 |
-37607680,58 |
62089672,09 |
22778951,65 |
|
Ростовская область |
9779,6 |
30841 |
8341300,827 |
3062150,01 |
22721714,89 |
Продолжение таблицы Е.1
Регион |
xi |
yi |
(Xi-Xср)(Yi-Yср) |
(Xi-Xср)2 |
(Yi-Yср)2 |
|
Ульяновская область |
8412,7 |
31355 |
13254908,86 |
9714442,24 |
18085712,45 |
|
Республика Марий Эл |
8404,3 |
31591 |
12553084,6 |
9766875,04 |
16134119,89 |
|
Республика Карелия |
13342,1 |
31647 |
-7179219,198 |
3285518,76 |
15687382,13 |
|
Пензенская область |
8566,4 |
31905 |
10971559,26 |
8779961,61 |
13710209,45 |
|
Тульская область |
10137,1 |
32107 |
4874416,452 |
1938777,76 |
12255110,53 |
|
Псковская область |
8950,5 |
32344 |
8417159,67 |
6651241 |
10651933,51 |
|
Амурская область |
13534,4 |
32499 |
-6232692,777 |
4019624,01 |
9664202,213 |
|
Омская область |
11003,6 |
32711 |
1523390,307 |
276570,81 |
8391044,693 |
|
Республика Татарстан |
11468,6 |
32765 |
173122,257 |
3708,81 |
8081113,853 |
|
Белгородская область |
10479,5 |
32837 |
2909266,5 |
1102500 |
7676944,733 |
|
Чувашская Республика |
8703,2 |
33037 |
7265654,199 |
7987971,69 |
6608652,733 |
|
Челябинская область |
11897,5 |
33420 |
-805084,64 |
135424 |
4786162,553 |
|
Алтайский край |
7804,7 |
35028 |
2159378,304 |
13874135,04 |
336086,8729 |
|
Самарская область |
11920,7 |
35468 |
-54662,376 |
153037,44 |
19524,4729 |
|
Волгоградская область |
9770,2 |
35571 |
64619,089 |
3095136,49 |
1349,0929 |
|
Владимирская область |
9688,1 |
35768 |
-295121,178 |
3390753,96 |
25686,4729 |
|
Рязанская область |
9796,6 |
35955 |
-601784,183 |
3002942,41 |
120596,4529 |
|
Кировская область |
8861,5 |
36032 |
-1131952,36 |
7118224 |
180005,0329 |
|
Томская область |
14429 |
36732 |
3259820,865 |
8407100,25 |
1263983,033 |
|
Костромская область |
9058,1 |
37394 |
-4414587,678 |
6107817,96 |
3190760,513 |
|
Липецкая область |
10907,1 |
38407 |
-1742265,648 |
387381,76 |
7835912,533 |
|
Удмуртская Республика |
9838,6 |
38926 |
-5610862,743 |
2859142,81 |
11010915,79 |
|
Калининградская область |
12750,3 |
38996 |
4136400,016 |
1490352,64 |
11480373,59 |
|
Вологодская область |
12913,9 |
39155 |
4910840,588 |
1916563,36 |
12583124,45 |
|
Тверская область |
10177 |
39446 |
-5191260,175 |
1829256,25 |
14732316,59 |
|
Архангельская область |
14400,3 |
39845 |
12164354,72 |
8241492,64 |
17954457,05 |
|
Республика Башкортостан |
11027,1 |
39880 |
-2146388,448 |
252405,76 |
18252290,95 |
|
Калужская область |
10926,8 |
40032 |
-2666507,529 |
363247,29 |
19574165,03 |
|
Краснодарский край |
10260 |
40275 |
-5925099,265 |
1611630,25 |
21783409,25 |
|
Камчатский край |
21814,7 |
40280 |
48055231,4 |
105785339 |
21830106,95 |
|
Красноярский край |
15510 |
40435,0 |
19214948,24 |
15844380,25 |
23302535,65 |
|
Приморский край |
13174,1 |
40731 |
8425729,842 |
2704709,16 |
26247895,49 |
|
Хабаровский край |
15883,5 |
41973 |
27714385,58 |
18957316 |
40516662,17 |
|
Республика Коми |
17077,3 |
42917 |
40550368,11 |
30778084,84 |
53425427,93 |
|
Тюменская область |
28565 |
43171 |
128844086,1 |
290208260,3 |
57203053,09 |
|
Новосибирская область |
12017 |
43288 |
3744131,625 |
237656,25 |
58986547,27 |
|
Ярославская область |
11214,8 |
43715 |
-2551357,869 |
99036,09 |
65727826,85 |
|
Иркутская область |
13770 |
49617 |
31387769,44 |
5019840,25 |
196259645,9 |
|
Пермский край |
11856 |
49857 |
4652386,655 |
106602,25 |
203041695,5 |
|
Московская область |
16234,5 |
51747 |
75935265,35 |
22137025 |
260476036,1 |
|
Свердловская область |
13986,9 |
54261 |
45838545,7 |
6038814,76 |
347944481,7 |
|
Нижегородская область |
10302 |
56213 |
-25292968,93 |
1506756,25 |
424577151,8 |
|
г. Санкт-Петербург |
17552 |
80251 |
268864093,6 |
36270506,25 |
1993021556 |
|
г. Москва |
23623,3 |
113501 |
942025628,7 |
146259998,4 |
6067361511 |
|
Итого |
818594,4 |
2528149 |
2214558152 |
1051731933 |
12991680594 |
Коэффициент корреляции ():
(Е.1)
где xi, yi - индивидуальные значения факторного и результативного признака.
ПРИЛОЖЕНИЕ Ж
Расчет эмпирического корреляционного отношения (ЭКО) и коэффициента детерминации
Для расчета данных показателей воспользуемся группировкой единиц исследуемой совокупности (субъектов РФ) по факторному признаку, которая была проведена ранее.
Подобные документы
Проведение статистического наблюдения за деятельностью предприятий. Стоимость основных производственных фондов. Статистический анализ генеральной совокупности. Описательные статистики выборочной совокупности. Распределение единиц выборочной совокупности.
практическая работа [66,9 K], добавлен 31.01.2012Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.
контрольная работа [712,1 K], добавлен 30.03.2014Простая сводка данных по показателю "Внешняя торговля по субъектам РФ". Вариационный анализ статистической совокупности. Выборочное наблюдение и генеральная совокупность на основе выборочной. Анализ рядов динамики и корреляционный анализ показателей.
курсовая работа [1,6 M], добавлен 26.02.2012Понятие и основные виды выборочного наблюдения. Ошибки выборочного статистического наблюдения. Определение генеральной совокупности, проблема соотношения выборки и совокупности. Точечная и интервальная оценка параметров генеральной совокупности.
контрольная работа [32,6 K], добавлен 02.12.2015Понятие выборочного наблюдения. Определение объема и численности выборки. Практическое применение в статистическом анализе выборочного наблюдения. Формулы предельных ошибок выборочной доли и среднего показателя. Значения гарантийного коэффициента.
курсовая работа [123,0 K], добавлен 11.02.2015Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.
курсовая работа [667,1 K], добавлен 14.05.2013Метод статистики, анализ данных, поиск закономерностей. Сводка и группировка данных статистического наблюдения за жилищным фондом. Вариационный анализ показателя площади жилищ, приходящихся в среднем на одного жителя. Выборочное наблюдение субъектов.
курсовая работа [117,9 K], добавлен 04.10.2008Классификация ошибок наблюдения в зависимости от причин возникновения. Особенности ошибок регистрации и репрезентативности. Преимущества выборочного наблюдения перед сплошным. Допустимый уровень ошибки. Понятие ряда динамики в статистической науке.
контрольная работа [73,8 K], добавлен 22.06.2015Понятие статистической совокупности и ее структура. Понятие генеральной и выборочной совокупности. Обеспечение репрезентативности выборочной совокупности. Вероятность наступления в выборочной совокупности какого-либо события. Закон больших чисел.
презентация [76,5 K], добавлен 19.05.2012Характеристика методов выполнения оценок параметров больших множеств по данным выборочного наблюдения. Особенности работы с большими массивами данных. Расчет основных показателей совокупности. Корреляционно-регрессионный анализ. Анализ рядов динамики.
курсовая работа [1,2 M], добавлен 24.08.2010