Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам Российской Федерации
Исследование влияния ВРП, объёма инвестиций в основной капитал и численности экономически активного населения на среднемесячную заработную плату работников по регионам. Оценка тесноты связи с помощью показателей корреляции, детерминации, парной регрессии.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 16.09.2017 |
Размер файла | 370,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru//
Размещено на http://www.allbest.ru//
Кафедра Прикладной информатики и моделирования экономических процессов
Факторы, влияющие на среднемесячную номинальную заработную плату населения по регионам Российской Федерации
Специальность: Эконометрика
Выполнила студентка 141 группы
2 курса
Очеретина Анастасия Ивановна
Научный руководитель :
К. ф.-м.н., старший преподаватель
Я.Б. Панкратова
Санкт-Петербург 2016
Введение
Заработная плата уже долгое время привлекает к себе внимание различных специалистов экономической сферы, таких как А. Смита, У. Петти, К. Маркса, М. И. Туган-Барановского и других.
Заработная плата выражает интересы наёмных рабочих, работодателей и государства в целом. Государство заинтересовано в том, чтобы обеспечить рост благосостояния общества и социальную гармонию посредством увеличения заработной платы.
Работодатели, устанавливая заработную плату, стремятся увеличить прибыль своей компании и эффективность труда, рационально использовать ресурсы производства.
Наёмные рабочие заинтересованы в том, чтобы их труд оценивался по заслугам и заработная плата была бы равносильна вложенным усилиям, а также способна была бы удовлетворить материальные и духовные потребности.
Существующий продолжительное время на рынке труда конфликт между интересами работников и работодателей обострился в последние годы. В то время когда работники требуют увеличение оплаты их труда в связи с растущими ценами в магазинах, работодатель стремится получить максимальную прибыль при минимальных затратах, а в ряде случаях незаконно уменьшая работнику заработную плату. Тем самым образуется "замкнутый круг", из которого очень сложно найти выход.
Цель курсовой работы - выявить и изучить факторы, влияющие на размер заработной платы, выбрать наиболее значимые факторы и определить степень влияния данных факторов на среднемесячную номинальную заработную плату работников за 2014 год.
Полученные результаты нельзя с уверенность применять в сегодняшней практике, в силу того, что в 2014 году в России и в мире был экономический кризис. Поэтому изучение данной зависимости по-прежнему остаётся актуальным.
Анализ темы проводится с помощью эконометрических методов по данным Федеральной службы государственной статистики РФ.
Глава 1. Сбор данных и отбор факторов
Для проведения исследования были отобраны следующие факторы, влияющие на среднемесячную заработную плату работников (y) в 2014 году:
X1 - численность населения за 2014 г;
X2 - численность экономически активного населения в 2014 г., тыс. человек;
X3 - ВРП (валовой региональный продукт) на душу населения в млрд. рублей за 2014 г;
X4 - объём инвестиций в основной капитал в 2014 г., млн. руб.
Для исследования использовались данные, выражающие вариацию факторов и результирующего признака по регионом Центрального и Северо-Западного федеральных округов. Не были задействованы данные по двум городам (Москва и Санкт-Петербург), а также по Московской области. Это объясняется тем, что наблюдается серьёзное различие в экономическом развитии и заработной платы, которое отражает поле корреляции.
В исследовании использовались данные Федеральной службы государственной статистики, а также данные из единой межведомственной информационно-статистической системы (ЕМИСС) за 2014 год.
Далее будет изучено влияние каждого из приведённых выше факторов на среднемесячную заработную плату работников в отдельности и влияние всех этих факторов.
Глава 2. Исследование влияния отельных факторов
2.1. Исследование влияния численности населения на среднемесячную заработную плату работников по регионам
Представим исходные данные о среднемесячной номинальной заработной плате и численности населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 1).
Таблица 1
Среднемесячная номинальная заработная плата и численность населения по регионам
Регион |
Численность населения за 2014 г. (x1) |
Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) |
|
Белгородская область |
1 544 108 |
29821 |
|
Брянская область |
1 242 599 |
24668 |
|
Владимирская область |
1 413 321 |
27398 |
|
Воронежская область |
2 328 959 |
30172 |
|
Ивановская область |
1 043 130 |
26508 |
|
Калужская область |
1 004 544 |
34752 |
|
Костромская область |
656 389 |
25560 |
|
Курская область |
1 118 915 |
29183 |
|
Липецкая область |
1 159 866 |
30870 |
|
Орловская область |
769 980 |
27196 |
|
Рязанская область |
1 140 844 |
29678 |
|
Смоленская область |
967 896 |
27282 |
|
Тамбовская область |
1 068 934 |
27302 |
|
Тверская область |
1 325 249 |
30722 |
|
Тульская область |
1 521 497 |
31700 |
|
Ярославская область |
1 271 766 |
31575 |
|
Республика Карелия |
634 402 |
35726 |
|
Республика Коми |
872 057 |
49734 |
|
Архангельская область |
1 191 785 |
45634 |
|
Ненецкий автономный округ |
43 025 |
41980 |
|
Вологодская область |
1 193 371 |
35732 |
|
Калининградская область |
963 128 |
35577 |
|
Ленинградская область |
1 763 924 |
38448 |
|
Мурманская область |
771 058 |
57845 |
|
Новгородская область |
622 430 |
31221 |
|
Псковская область |
656 561 |
25694 |
Для изучения влияния фактора X1 на результирующий признак Y сначала нужно построить поле корреляции (рис. 1).
Рис. 1 «Поле корреляции»
Из вида поля корреляции можно сделать предположение, что между X1 и Y имеется обратная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см табл. 2).
Таблица 2
Модель парной линейной регрессии
b |
a |
|||
-0,004 |
37004,448 |
|||
mb - стандартная ошибка коэфф., b |
0,004 |
4272,704 |
mа - стандартная ошибка коэфф., а |
|
R^2 - коэфф., детерминации |
0,038 |
8014,903 |
Sост. - оценка стандартного отклонения остатков |
|
F статистика |
0,940 |
24,000 |
Число степеней свободы n-2 |
|
Регрессионная сумма квадратов |
60367425,19 |
1541728139 |
Остаточная сумма квадратов |
По найденной таблице было записано уравнение выборочной регрессии (y^=37004,448-0,004х) и экономическая интерпретация коэффициентов линейной регрессии:
b=-0,004 показывает, что при увеличении численности населения на одного человека среднемесячная заработная плата уменьшается на 0,4 копейки.
Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.
Также, были вычислены остатки по формуле () и построен график остатков (см. рис.1).
Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность.
Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=0,29<Fkp=3,43, значит гетероскедастичность отсутствует. Так как |tr|= 1,82<tkp=2,06, то предположение подтвердилось, в модели присутствует гомоскедастичность.
Кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,45 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.
Мною была найдена величина средней ошибки аппроксимации =16,56% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.
Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.
Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).
В результате получаем:
F-статистика= 0,939; F-критическое=4,259.
Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.
Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb<tкр и tr<tкр. (см. табл. 3).
Таблица 3
Показатели значимости коэффициентов
ta |
8,660661979 |
> |
|
2,063898547 |
коэффициент а значим |
|
tb |
-0,969400072 |
< |
tкр |
2,063898547 |
коэффициент b не значим |
|
tr |
-0,969400072 |
< |
|
2,063898547 |
коэффициент r не значим |
Был вычислен доверительный интервал линейной регрессии. Были выявлены следующие результаты и выявлена экономическая интерпретация только для значимых коэффициентов:
Значение параметра б с вероятностью 95% будет находиться в интервале [28186,01978; 45822,87636].
Значение параметра в интерпретировать невозможно, поскольку границы разного знака.
Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 3264200,5. А прогнозное значение показателя у^р равно 25449,96.
Стандартная ошибка прогноза функции регрессии получилась равной 8100,11, а ошибка индивидуального значения - 11395,19. Так же вычислен доверительный интервал параметр для условного математического ожидания: [8732,150812; 42167,77998] и доверительный интервал для индивидуального значения [1931,433686; 48968,49727].
Оценим тесноту связи с помощью показателей корреляции и детерминации.
Коэффициент корреляции rxy =-0,19. Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.
Коэффициент детерминации R2=0,038, говорит о том, что лишь 3,8% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности населения, а остальные 96,2% факторами, не включёнными в модель.
Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.
2.2. Исследование влияния численности экономически активного населения на среднемесячную заработную плату работников по регионам.
Представим исходные данные о среднемесячной номинальной заработной плате и численности экономически активного населения по регионам в виде статистической таблицы, удобной для анализа (см. табл. 4).
Таблица 4
Среднемесячная номинальная заработная плата и численность экономически активного населения по регионам
Регион |
Численность экономически активного населения в 2014 г., тыс. человек, (х2) |
Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) |
|
Белгородская область |
812,2 |
29821 |
|
Брянская область |
627,1 |
24668 |
|
Владимирская область |
746,5 |
27398 |
|
Воронежская область |
1153,6 |
30172 |
|
Ивановская область |
524,2 |
26508 |
|
Калужская область |
541,6 |
34752 |
|
Костромская область |
334,7 |
25560 |
|
Курская область |
569,3 |
29183 |
|
Липецкая область |
594,2 |
30870 |
|
Орловская область |
394,8 |
27196 |
|
Рязанская область |
544,4 |
29678 |
|
Смоленская область |
545,5 |
27282 |
|
Тамбовская область |
512,4 |
27302 |
|
Тверская область |
712,3 |
30722 |
|
Тульская область |
808,1 |
31700 |
|
Ярославская область |
687,9 |
31575 |
|
Республика Карелия |
328,1 |
35726 |
|
Республика Коми |
500,1 |
49734 |
|
Архангельская область |
631,1 |
45634 |
|
Ненецкий автономный округ |
23,3 |
41980 |
|
Вологодская область |
628,2 |
35732 |
|
Калининградская область |
527,1 |
35577 |
|
Ленинградская область |
962,2 |
38448 |
|
Мурманская область |
468,3 |
57845 |
|
Новгородская область |
336,4 |
31221 |
|
Псковская область |
351,5 |
25694 |
Для изучения влияния фактора X2 на результирующий признак Y сначала нужно построить поле корреляции (рис. 2).
Рис. 2 «Поле корреляции»
Из вида поля корреляции можно сделать предположение, что между X2 и Y имеется обратная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии (см. табл. 5).
Таблица 5
Модель парной линейной регрессии
b |
a |
|||
-4,354 |
35642,530 |
|||
mb - стандартная ошибка коэфф., b |
7,235 |
4431,748 |
mа - стандартная ошибка коэфф., а |
|
R^2 - коэфф., детерминации |
0,015 |
8109,345 |
Sост. - оценка стандартного отклонения остатков |
|
F статистика |
0,362 |
24,000 |
Число степеней свободы n-2 |
|
Регрессионная сумма квадратов |
23820146,83 |
1578275417 |
Остаточная сумма квадратов |
По найденной таблице было записано уравнение выборочной регрессии (y^=35642,448-4,354x)и экономическая интерпретация коэффициентов линейной регрессии:
b=-4,354 показывает, что при увеличении численности экономически активного населения на одного человека, среднемесячная заработная плата. уменьшается на 4,3 рубля.
Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.
Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).
Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гомоскедастичность, так как Fg=0,27 < Fkp=3,43. Однако тест Спирмена показал противоположный результат, поскольку tr=2,105 > tкрит=2,063 в модели присутствует гетероскедастичность. Такое разногласие, скорее всего, связано с небольшим объемом выборки. Наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.
Кроме того, Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=1,56 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо - автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.
Мною была найдена величина средней ошибки аппроксимации =16,69% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.
Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.
Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).
В результате получаем:
F-статистика= 0,362; F-критическое=4,259.
Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.
Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb<tкр и tr<tкр. (см. табл. 6).
Таблица 6
Показатели значимости коэффициентов
ta |
8,042544481 |
> |
|
2,063898547 |
коэффициент а значим |
|
tb |
-0,601847474 |
< |
tкр |
2,063898547 |
коэффициент b не значим |
|
tr |
-0,601847474 |
< |
|
2,063898547 |
коэффициент r не значим |
Был вычислен доверительный интервал линейной регрессии. Были выявлены следующие результаты и выявлена экономическая интерпретация только для значимых коэффициентов:
Значение параметра б с вероятностью 95% будет находиться в интервале [26495,85194; 44789,20832].
Значение параметра в интерпретировать невозможно, поскольку границы разного знака.
Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 1715,20. А прогнозное значение показателя у^р равно 28173,80.
Стандартная ошибка прогноза функции регрессии получилась равной 8424,58, а ошибка индивидуального значения - 11693,38. Так же вычислен доверительный интервал параметр для условного математического ожидания: [10786,30456; 45561,29799] и доверительный интервал для индивидуального значения [4039,847983; 48968,49727].
Оценим тесноту связи с помощью показателей корреляции и детерминации.
Коэффициент корреляции rxy =-0,12. Следовательно, по шкале Чеддока наблюдается очень слабая обратная зависимость или вовсе отсутствует.
Коэффициент детерминации R2=0,015, говорит о том, что лишь 1,5% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением численности экономически активного населения, а остальные 98,5% факторами не включёнными в модель
Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.
2.3. Исследование влияния ВРП (на душу населения) на среднемесячную заработную плату работников по регионам
Представим исходные данные о среднемесячной номинальной заработной плате и валовом региональном продукте на душу населения за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 7).
Таблица 7
Среднемесячная номинальная заработная плата и ВРП на душу населения
Регион |
ВРП (валовой региональный продукт) на душу населения в млрд. рублей за 2014 г. (х3) |
Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) |
|
Белгородская область |
619,4 |
29821 |
|
Брянская область |
243,0 |
24668 |
|
Владимирская область |
327,9 |
27398 |
|
Воронежская область |
709,1 |
30172 |
|
Ивановская область |
151,0 |
26508 |
|
Калужская область |
324,9 |
34752 |
|
Костромская область |
146,3 |
25560 |
|
Курская область |
297,4 |
29183 |
|
Липецкая область |
395,7 |
30870 |
|
Орловская область |
179,7 |
27196 |
|
Рязанская область |
297,3 |
29678 |
|
Смоленская область |
234,7 |
27282 |
|
Тамбовская область |
275,8 |
27302 |
|
Тверская область |
307,4 |
30722 |
|
Тульская область |
408,5 |
31700 |
|
Ярославская область |
388,1 |
31575 |
|
Республика Карелия |
185,6 |
35726 |
|
Республика Коми |
480,9 |
49734 |
|
Архангельская область |
356,4 |
45634 |
|
Ненецкий автономный округ |
183,7 |
41980 |
|
Вологодская область |
388,4 |
35732 |
|
Калининградская область |
306,2 |
35577 |
|
Ленинградская область |
714,0 |
38448 |
|
Мурманская область |
320,3 |
57845 |
|
Новгородская область |
205,9 |
31221 |
|
Псковская область |
121,3 |
25694 |
Для изучения влияния фактора X3 на результирующий признак Y сначала нужно построить поле корреляции (рис. 3).
Рис. 5 «Поле корреляции»
Из вида поля корреляции можно сделать предположение, что между X3 и Y имеется прямолинейная зависимость. Поэтому построим модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории «Статистические» построим модель парной линейной регрессии ( см. табл. 8).
Таблица 8
Модель парной линейной регрессии
b |
a |
|||
12,414 |
29061,719 |
|||
mb - стандартная ошибка коэфф., b |
9,992 |
3641,100 |
mа - стандартная ошибка коэфф., а |
|
R^2 - коэфф., детерминации |
0,060 |
7919,635 |
Sост. - оценка стандартного отклонения остатков |
|
F статистика |
1,543 |
24,000 |
Число степеней свободы n-2 |
|
Регрессионная сумма квадратов |
96800688,73 |
1505294875 |
Остаточная сумма квадратов |
По найденной таблице было записано уравнение выборочной регрессии (y^=29061,719+12,414x) и экономическая интерпретация коэффициентов линейной регрессии:
b=12,414 показывает, что при увеличении ВРП на1 млрд. рублей, среднемесячная заработная плата увеличивается на 12,414 рублей.
Коэффициент а интерпретировать невозможно, т.к. Х не может быть равен 0.
Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 3).
Из вида поля корреляции можно сделать предположение, что гетероскедастичность отсутствует, а присутствует гомоскедастичность.
Проверим первое наше предположение по тесту Голдфелда-Квандта и по тесту Спирмена. Оба теста указали на наличие гомоскедастичности. Fg=1,78<Fkp=3,43, значит гетероскедастичность отсутствует. Так как |tr|= 0,35<tkp=2,06, то предположение подтвердилось, в модели присутствует гомоскедастичность.
Из вида поля корреляции можно сделать предположение, что автокорреляция отсутствует. Тест Дарбина-Уотсона показал, что DW=2,05 принадлежит интервалу [du=1,46; 4-du=2,54], следовательно нет основания отклонять Hо - автокорреляция остатков отсутствует, что обеспечивает состоятельность и эффективность оценок выборочных коэффициентов регрессии.
Мною была найдена величина средней ошибки аппроксимации =16,11% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные.
Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.
Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР (5%;1;24).
В результате получаем:
F-статистика= 1,543; F-критическое=4,259
Так как Fстат.< Fкр., то нет основания отвергнуть гипотезу, но модель не значима в целом.
Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициент а является значимым, т.к tа> tкр., а коэффициент b не значим, коэффициент r не значим так как tb<tкр и tr<tкр. (см. табл. 9).
Таблица 9
Показатели значимости коэффициентов
ta |
7,981575687 |
> |
|
2,063898547 |
коэффициент а значим |
|
tb |
1,242321648 |
< |
tкр |
2,063898547 |
коэффициент b не значим |
|
tr |
1,242321648 |
< |
|
2,063898547 |
коэффициент r не значим |
Значение параметра б с вероятностью 95% будет находиться в интервале [21546,85673; 36576,58047].
Значение параметра в интерпретировать невозможно, поскольку границы разного знака.
Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 988,71. А прогнозное значение показателя у^р равно 41335,42.
Стандартная ошибка прогноза функции регрессии получилась равной 6767,08, а ошибка индивидуального значения - 10417,008. Так же вычислен доверительный интервал параметр для условного математического ожидания: [27368,84514; 55302,00355] и доверительный интервал для индивидуального значения [19835,77; 48968,49].
Оценим тесноту связи с помощью показателей корреляции и детерминации.
Коэффициент корреляции rxy =0,24. Следовательно, по шкале Чеддока наблюдается слабая прямо-линейная зависимость.
Коэффициент детерминации R2=0,06, говорит о том, что 6% вариации (дисперсии, разброса) среднемесячной заработной платы объясняется изменением ВРП, а остальные 74% факторами, не включёнными в модель.
Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, не подходит для описания зависимой переменной. Поэтому включение данного фактора в модель множественной регрессии нецелесообразно.
2.4 Исследование влияния объёма инвестиций в основной капитал на среднемесячную заработную плату работников по регионам
Представим исходные данные о среднемесячной номинальной заработной плате и объёме инвестиций в основной капитал за 2014 год в виде статистической таблицы, удобной для анализа (см. табл. 10).
Таблица 10
Среднемесячная номинальная заработная плата и объём инвестиций в основной капитал
Регион |
Объём инвестиций в основной капитал в 2014 г. Млн руб (х4) |
Среднемесячная номинальная з/п работников по полному кругу организаций за 2014 год, рублей (y) |
|
Белгородская область |
120390,6 |
29821 |
|
Брянская область |
66825,4 |
24668 |
|
Владимирская область |
75667 |
27398 |
|
Воронежская область |
243259,8 |
30172 |
|
Ивановская область |
29803,3 |
26508 |
|
Калужская область |
99785,7 |
34752 |
|
Костромская область |
27512,8 |
25560 |
|
Курская область |
71743 |
29183 |
|
Липецкая область |
110101,1 |
30870 |
|
Орловская область |
44931,1 |
27196 |
|
Рязанская область |
58209,9 |
29678 |
|
Смоленская область |
56747,1 |
27282 |
|
Тамбовская область |
112713,1 |
27302 |
|
Тверская область |
74491 |
30722 |
|
Тульская область |
95434,7 |
31700 |
|
Ярославская область |
76491,8 |
31575 |
|
Республика Карелия |
30834,6 |
35726 |
|
Республика Коми |
207421,6 |
49734 |
|
Архангельская область |
148128,8 |
45634 |
|
Ненецкий автономный округ |
84248 |
41980 |
|
Вологодская область |
63880,9 |
35732 |
|
Калининградская область |
64891,5 |
35577 |
|
Ленинградская область |
58501,1 |
38448 |
|
Мурманская область |
178777,4 |
57845 |
|
Новгородская область |
72254,8 |
31221 |
|
Псковская область |
64922,6 |
25694 |
Для изучения влияния фактора X4 на результирующий признак Y сначала нужно построить поле корреляции (рис. 4).
Рис. 4 «Поле корреляции»
При рассмотрении графика сложно точно предположить, какой вид зависимости существует между переменными. Однако мы можем проанализировать следующие виды зависимостей:
Линейная зависимость;
Квадратичная зависимость;
Гиперболическая зависимость;
Степенная зависимость;
Показательная зависимость;
Экспоненциальная зависимость;
Логарифмическая зависимость.
Каждая из рассмотреннчых моделей получилась значимой по критерию Фишера, поскольку Fстат>Fкр. Для того, чтобы выбрать качественную модель, необходимо использовать следующие критерии:
Коэффициент детерминации R^2. С помощью него можно оценить тесноту связи, и чем R^2 ближе к единице, тем лучше регрессия описывает зависимость между зависимой и объясняющими переменными;
Средняя ошибка аппроксимации А. Лучше та модель, у которой наименьшая ошибка аппроксимации. На практике значение этой ошибки в пределах 5-7 % говорит о хорошем соответствии модели выбранным данным;
Стандартная ошибка регрессии Sост. Чем меньше этот показатель, тем лучше построенная модель;
Метод абсолютных отклонений. Лучшая модель та, которая имеет наименьший показатель МАD.
Для выбора лучшей модели рассмотрим таблицу сравнения критериев:
Таблица 11
Таблица сравнения критериев
Тип модели |
R^2 |
A |
Sost |
MAD |
|
1. Линейная |
0,290 |
15,00% |
6886,262 |
5133,171311 |
|
2. Квадратичная |
0,314352636 |
14,86% |
6910,837742 |
5103,553931 |
|
3. Гиперболическая |
0,177 |
16,49% |
7413,272 |
5682,178706 |
|
4. Степенная |
0,262 |
14,50% |
0,188 |
5112,279771 |
|
5. Показательная |
0,2709444 |
14,46% |
0,1866305 |
5057,083385 |
|
6. Экспоненциальная |
0,2709444 |
14,46% |
0,1866305 |
5057,083385 |
|
7. Логарифмическая |
0,2686112 |
15,46% |
6987,3537596 |
5314,151177 |
В результате сравнения полученных критериев наилучшей моделью является показательная и/или экспоненциальная. Она лучше аппроксимирует выборочные данные и имеет более точный прогноз. Однако для исследования факторов X3 и Y была выбрана линейная модель из-за ее простоты. Поэтому построим модель парно-линейной регрессии и исследуем её качество.
С помощью функции ЛИНЕЙН из категории «Статистические» строим модель парной линейной регрессии (см. табл. 12).
Таблица 12 инвестиция регрессия заработный капитал
Модель парной линейной регрессии
b |
a |
|||
0,081 |
25855,921 |
|||
mb - стандартная ошибка коэфф., b |
0,026 |
2695,486 |
mа - стандартная ошибка коэфф., а |
|
R^2 - коэфф., детерминации |
0,290 |
6886,262 |
Sост. - оценка стандартного отклонения остатков |
|
F статистика |
9,785 |
24,000 |
Число степеней свободы n-2 |
|
Регрессионная сумма квадратов |
464001142,5 |
1138094422 |
Остаточная сумма квадратов |
По найденной таблице было записано уравнение выборочной регрессии (y^=25855,921+0,081x) и экономическая интерпретация коэффициентов линейной регрессии:
Коэффициент b=0,081 показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., среднемесячная заработная плата увеличивается на 8,1 коп.
Коэффициент a=25855,921 показывает, что при отсутствии инвестиций в основной капитал (X4=0), среднемесячная заработная плата равна 25855,921 рубл.
Также, были вычислены остатки по формуле () и построен график остатков (см. рис. 4).
Из вида поля корреляции можно сделать предположение, что гомоскедастичность отсутствует, а присутствует гетероскедастичность. Проверим наше предположение по двум тестам: по тесту Голдфелда-Квандта и тесту Спирмена. По тесту Голдфелда-Квандта наше предположение подтвердилось. В модели действительно присутствует гетероскедастичность, так как Fg= 4,1 > Fkp= 3,4. Однако тест Спирмена показал противоположный результат, поскольку tr=1,95<tкрит=2,06 в модели присутствует гомоскедастичность. Такое разногласие, скорее всего, связано с небольшим объемом выборки. Наличие гетероскедастичности приводит к тому, что возникают большие остатки, что приводит к высоким ошибкам прогнозирования.
Кроме того, из вида поля корреляции можно предположить, что в модели присутствует положительная автокорреляция. Используя критерий Дарбина-Уотсона мы выяснили, DW=1,39 принадлежит интервалу [dl=1,3;du=1,46], следовательно гипотеза о положительной автокорреляции отвергается, автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения.
Мною была найдена величина средней ошибки аппроксимации =15,00% и был сделан следующий вывод: поскольку средняя ошибка аппроксимации больше 10%,то построенная модель плохо аппроксимирует выборочные данные. Незначительно превышает 7 %, поэтому можно считать, что построенная модель является удовлетворительной.
Для более уточненного анализа производим проверку значимости регрессии в целом (по критерию Фишера). Находим F-статистика и F-критическое.
Значение F-статистика берем из таблицы (F-статистика), а F-критическое находим при помощи функции FРАСПОБР(5%;1;24).
В результате получаем:
F-статистика= 9,784; F-критическое=4,259.
Так как Fстат.>Fкр., то модель значима в целом.
Говоря о значимости коэффициентов регрессии (по критерию Стьюдента), нужно отметить, что коэффициенты а, b и r являются значимыми, т.к tа> tкр; tb>tкр и tr>tкр. (см. табл. 13).
Таблица 13
Показатели значимости коэффициентов
ta |
9,592303964 |
> |
|
2,063898547 |
коэффициент а значим |
|
tb |
3,128066653 |
> |
tкр |
2,063898547 |
коэффициент b значим |
|
tr |
3,128066653 |
> |
|
2,063898547 |
коэффициент r значим |
Значение параметра а показывает, что при отсутствии инвестиций в основной капитал с вероятностью 0,95 среднемесячная заработная плата принимает значение в диапазоне [20292,7113; 31419,13052].
Значение параметра в показывает, что при увеличении инвестиций в основной капитал на 1 млн. рубл. с вероятностью 0,95 среднемесячная заработная плата увеличивается на значение в диапазоне [0,027606745; 0,134690429].
Далее был построен точечный прогноз значения Y при значении X в 3 раза больше, чем среднее значение X. Прогнозное значение фактора равно 269765,61. А прогнозное значение показателя у^р равно 47747,01. Стандартная ошибка прогноза функции регрессии получилась равной 4857,05, а ошибка индивидуального значения - 8426,83. Так же вычислен доверительный интервал параметр для условного математического ожидания: [37722,55356; 57771,48587] и доверительный интервал для индивидуального значения [30354,88429; 48968,49727].
Оценим тесноту связи с помощью показателей корреляции и детерминации.
Коэффициент корреляции rxy =0,53. Следовательно по шкале Чеддока между Х и У наблюдается заметная прямо-линейная зависимость.
Коэффициент детерминации R2=0,289, говорит о том, что 28,9% вариации (дисперсии, разброса) среднемесячной заработной платы. объясняется изменением численности населения, а остальные 71,1% факторами, не включёнными в модель.
Отсюда можно сделать вывод, что математическая модель, выражающая данную зависимость объясняющей переменной, подходит для описания зависимой переменной. Поэтому данный фактор будет включён в модель множественной регрессии.
Глава 3 Исследование влияния совокупности факторов
3.1 Процедура отбора переменных в множественной линейной регрессии
Для того чтобы построить качественную модель множественной регрессии, необходимо провести пошаговую процедуру включения существенных переменных в анализируемую модель. Для этого вначале построим корреляционную матрицу, найдём коэффициенты корреляции между всеми парами объясняющих переменных и сделаем предположение о наличии или отсутствии мультиколлинеарности (см. табл. 14).
Таблица 14
Корреляционная матрица
|
rx1x2 |
rx1x3 |
rx1x4 |
|
1 |
0,99178466 |
0,796576625 |
0,380174721 |
|
0,99178466 |
1 |
0,822579317 |
0,393064873 |
|
0,796576625 |
0,822579317 |
1 |
0,594123616 |
|
0,380174721 |
0,393064873 |
0,594123616 |
1 |
Можно сделать предположение о наличие мультколлиниарности, поскольку между факторами x1 и x2, x1 и x3, x2 и x3 высокая взаимная зависимость(rxixj>0,7). Значит, не следует включать одновременно факторы в модель.
Для того, чтобы определить, какой из факторов связан с Y в большей степени и в какой последовательности следует включать факторы в модель, необходимо построить скорректированную корреляционную матрицу (см. табл. 15)
Таблица 15
Скорректированная корреляционная матрица
y |
ryx1 |
ryx2 |
ryx3 |
ryx4 |
||
y |
1 |
-0,194114115 |
-0,121934895 |
0,245807435 |
0,538164834 |
|
x1 |
-0,194114115 |
1 |
0,99178466 |
0,796576625 |
0,380174721 |
|
x2 |
-0,121934895 |
0,99178466 |
1 |
0,822579317 |
0,393064873 |
|
x3 |
0,245807435 |
0,796576625 |
0,822579317 |
1 |
0,594123616 |
|
x4 |
0,538164834 |
0,380174721 |
0,393064873 |
0,594123616 |
1 |
Исходя из полученных данных мы можем сделать вывод, что первым в модель следует включать фактор х4 (объём инвестиций в основной капитал), так как он имеет самый высокий коэффициент корреляции с признаком у, затем фактор х3,х1,х2.
Следующим шагом необходимо проверить целесообразность включения фактора х3 (валовый региональный продукт) в модель ух4, используя частный критерий Фишера.
Так как частный критерий Фишера равен 0,28, а табличное значение 4,28, то включение данного фактора в модель yx4 нецелесообразно.
Аналогично с фактором х1 (численность населения), где Fч=8,15 > Fкр=4,28. Из этого следует, что фактор х1 целесообразно включать в модель ух4.
Последний фактор х2 (численность экономически активного населения) включать в модель целесообразно, т.к. Fч=5,23> Fкр=4,28.
Поскольку факторы х1 и х2 в модель yx4 включать целесообразно, проверим целесообразность включения фактора х1 в модель ух2х4.
Получилось следующее: Fч=19,49>Fкр=4,3, значит включение переменной х1 оправдано.
Таким образом, исключив нецелесообразный фактор х3, можно приступить к построению множественной линейной регрессии х1, х2, x4.
3.2 Построение множественной регрессии
Для построения множественной регрессии нужно исследовать влияние таких факторов, как:
X1 - численность населения за 2014 г;
X2 - численность экономически активного населения в 2014 г., тыс. человек;
X4 - объём инвестиций в основной капитал в 2014 г., млн. руб.
Объясняемым фактором по-прежнему является Y - среднемесячная заработная плата работников за 2014 год. Исходные данные представлены выборкой объема n=26.
С помощью функции ЛИНЕЙН из категории «Статистические» построим модель множественной регрессии (см. табл. 16):
Таблица 16
Модель множественной регрессии
b4 |
b2 |
b1 |
a |
|
0,097476688 |
131,4519007 |
-0,074594338 |
30395,69181 |
|
0,019434042 |
33,27883906 |
0,016894172 |
2698,538067 |
|
0,693103801 |
4727,468281 |
#Н/Д |
#Н/Д |
|
16,56182519 |
22 |
#Н/Д |
#Н/Д |
|
1110418525 |
491677039,6 |
#Н/Д |
#Н/Д |
Получим уравнение регрессии: y^=a+b1x1+b2x2 +b4x4, то есть y^= 30395-0,07х1+131,45х2+0,09х4
Дадим экономическую интерпретацию коэффициентов множественной регрессии:
а - показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объёма инвестиций в основной капитал (х4=0), то среднемесячная зарплата составит 30 395 руб.;
b1 - показывает, что при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах.
b2 - показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах.
b4 - показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах.
Проверим значимость уравнения множественной линейной регрессии в целом по критерию Фишера:
Fстатистика |
16,56182519 |
> |
Fкрит |
3,049125006 |
Поскольку Fстат.>Fкрит., значит уравнение регрессии значимо в целом.
Проверим значимость коэффициентов множественной линейной регрессии по критерию Стьюдента при уровне значимости 5% (см. табл. 17):
Таблица 17
Показатели значимости коэффициентов множественной регрессии
ta |
11,26376247 |
> |
|
|
а значим |
|
tb2 |
-4,415388812 |
> |
tкр |
2,073873058 |
b1 значим |
|
tb3 |
3,950014616 |
> |
|
|
b2 значим |
|
tb4 |
5,015770066 |
> |
|
|
b3 значим |
Все факторы значимы, из этого следует, что их можно использовать для дальнейшего исследования.
Для статистически значимых коэффициентов были построены доверительные интервалы (см. табл. 18):
Таблица 18
Доверительные интервалы
б |
24799,26641 |
35992,1172 |
|
в1 |
-0,109630706 |
-0,03955797 |
|
в2 |
62,43581295 |
200,4679884 |
|
в4 |
0,057172951 |
0,137780424 |
Дадим их экономическую интерпретацию:
б - показывает, что если не будет численности населения (х1=0), экономически активного населения (х2=0) и объёма инвестиций в основной капитал (х4=0), то среднемесячная зарплата изменяется в пределах [24799,3; 35992,1] с вероятностью 95%.
в1 - показывает, что при увеличении численности населения на 1 человека, средняя заработная плата изменяется в пределах [-0,109; -0,039] с вероятностью 95%
в2 - показывает, что при увеличении численности экономически активного населения на 1 человека, средняя заработная плата изменяется в пределах [62,435; 200,467] с вероятностью 95%
в4 - показывает, что при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата изменяется в пределах [0,057; 0,137] с вероятностью 95%
Говоря о качестве построенной регрессии следует отметить, что модель имеет неплохую объясняющую способность, поскольку коэффициент детерминации R^2= 0,69 показывает, что 69% изменения средней заработной платы объясняется изменениями факторов, включенных в модель, а остальные 31% не включенными факторами.
Так как RІ близок к 1, уравнение регрессии неплохо аппроксимирует эмпирические данные.
Средняя ошибка аппроксимации (A=11,10% > 10%) незначительно превышает 10%, поэтому можем считать, что построенная модель является удовлетворительной.
Был вычислен скорректированный коэффициент детерминации: R^2adj=0,65.
В ходе исследования были найдены стандартизованные коэффициенты регрессии b'i и частные средние коэффициенты эластичности Эi.
b1'=-4,09;
b2'=3,68;
b4'=0,64.
Поскольку b1' больше, чем все остальные стандартизированные коэффициенты, можем считать, что фактор x1 (численность населения) больше влияет на y (среднемесячная заработная плата), чем другие факторы (x2,х4)
Средней коэффициент эластичности Эср1=-2,44 показывает, что при увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. Средней коэффициент эластичности Эср2=2,26 показывает, что при увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. Средней коэффициент эластичности Эср4=0,26 показывает, что при увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.
Чтобы определить наличие мультиколлинеарности в данной модели, необходимо построить матрицу выборочных коэффициентов корреляции Q с помощью функции КОРЕЛЛ (см. табл. 19).
Таблица 19
Матрица выборочных коэффициентов корреляции Q
rx1х2 |
rx1х4 |
||||
1 |
0,99178466 |
0,380174721 |
|||
rx1х2 |
0,99178466 |
1 |
0,393064873 |
rx2х4 |
|
0,380174721 |
0,393064873 |
1 |
|||
rx1х4 |
rx2х4 |
Проанализировав полученную матрицу, можно предположить, что между факторами х1 и х2 существует мультиколлинеарность, так как rx1x2 больше 0,7.
Необходимо проанализировать частные коэффициенты детерминации, которые были получены в результате возведения в квадрат частных коэффициентов корреляции:
R^2yx1 = 0,47 показывает, что на 47 % изменение средней заработной платы объясняется изменением численности населения, а оставшиеся 53 % - факторами, не включёнными в модель.
R^2yx2 =0,41 показывает, что на 41 % изменение средней заработной платы объясняется изменением численности экономически активного населения, а оставшиеся 59 % - факторами, не включёнными в модель.
R^2yx4 =0,53 показывает, что на 53% изменение средней заработной платы объясняется изменением объёма инвестиций в основной капитал, а оставшиеся 47 % - факторами, не включёнными в модель.
В результате проверки значимости частных коэффициентов корреляции было выявлено, что все коэффициенты значимы, так как tr>tкр по модулю.
tryx1/x2x4 |
-4,415388812 |
|
tryx2/x1x4 |
3,950014616 |
|
tryx4/x1x2 |
5,015770066 |
|
tкр(5%, 22)= |
2,073873058 |
Чтобы убедиться в наличии мультиколлинеарности вычислим определитель матрицы =1,52374E+29. По этому критерию мультиколлиниарность отсутствует, поскольку определитель матрицы не равен нулю.
Таким образом, при построении множественной модели не удалось полностью избежать мультиколенниарность , поскольку между факторами х1 и х2 она существует, так как rx1x2 больше 0,7. Поэтому, необходимо построить модель, состоящую из двух факторов, х2 и х4. О том, какая модель является лучшей будет сказано в заключение.
Заключение
Во время проведения исследования была выявлена и изучена зависимость каждого фактора на результирующий признак как в отдельности, так и в совокупности. Для этого были построены четыре парные линейные регрессии и две модели множественной регрессии.
Проведённое исследование показало, что значимыми можно признать не все построенные модели. Модель, отражающая зависимость среднемесячной номинальной заработной платы от численности населения, а также модель, отражающая зависимость среднемесячной номинальной заработной платы от численности экономически активного населения и модель, отражающая зависимость среднемесячной номинальной заработной платы от валового регионального продукта являются незначимыми. Модель, отражающая зависимость среднемесячной номинальной заработной платы от объёма инвестиций в основной капитал значима.
Для того чтобы построить качественную множественную регрессию, необходимо, во-первых, проверить отсутствие или присутствие мультиколлинеарности в модели, во-вторых проверить целесообразность включения фактора хi в модель, используя частный критерий Фишера. Построив корреляционную матрицу, обнаружилось, что между факторами x1x2, x1x3, x2x3 высокая взаимная зависимость, а значит можно сделать предположение о наличие мультколлиниарности. Это говорит о том, что не следует включать одновременно факторы в модель. Поскольку фактор х4 имеет самый высокий коэффициент корреляции с признаком у, значит его следует включить в модель первым, а затем фактор х3,х1,х2. Как оказалось не все факторы можно включать в модель множественной регрессии. Включение фактора х3 в модель ух4 нецелесообразно, поскольку Fч=0,27<Fкр=4,27. Поэтому фактор х3 был исключён из модели. Сделав проверку включения факторов х1 в модель ух4, а также х2 в модель ух4, а затем х1 в модель ух2х4, оказалось, что включение всех этих факторов целесообразно. Поэтому для исследования была построена модель множественной регрессии y^=a+b1x1+b2x2+b4x4 или y^=30395-0,07х1+131,45х2+0,09х4.
Полученной модели можно дать экономическую интерпретацию: при увеличении численности населения на 1 человека, средняя заработная плата уменьшается на 0,07 рублей, при неизменных остальных факторах; при увеличении численности экономически активного населения на 1 человека, средняя заработная плата увеличивается на 131 рубль, при неизменных остальных факторах; при увеличении объёма инвестиций в основной капитал на 1 млн. рубл., средняя заработная плата увеличивается на 0,09 рублей, при неизменных остальных факторах. Коэффициент а интерпретировать невозможно, так как тяжело представить регион, где не существует людей, способных и желающих работать и где нет инвестиций в основной капитал.
Анализ данной модели установил, что 69% изменения средней заработной платы в 2014 году объясняется изменением численности населения, численности экономически активного населения и объёма инвестиций в основной капитал. При увеличении x1 (численности населения) на 1 %, у (среднемесячная заработная плата) уменьшается на 244%. При увеличении х2 (численности экономически активного населения) на 1%, у (среднемесячная заработная плата) увеличивается на 226%. При увеличении x4 (объёма инвестиций в основной капитал ) на 1 %, y (среднемесячная заработная плата ) увеличивается на 26%.
Данная модель значима в целом по критерию Фишера, с удовлетворительной ошибкой аппроксимации и достаточно большим коэффициентов детерминации, т.е. в целом пригодной для прогнозирования. Однако между факторами х1 и х2 существует мультиколлинеарность в стохастической форме. Определитель матрицы хоть и отличен от нуля, но очень мал. Однако стандартные ошибки коэффициентов регрессии получились небольшими, и коэффициенты получились значимы по t-критерию. Несмотря на то, что свойства несмещённости и эффективности оценок остаются в силе, мультиколлинеарность в любом случае затрудняет разделение влияния объясняющих переменных на поведение зависимой переменной и делает оценки коэффициентов регрессии ненадёжными.
Но следует иметь в виду, что у нескольких факторов, а именно х2 и х4, нельзя точно определить присутствует гомоскедастичность или гетероскедастичность, так как результаты тестов Голдфелда-Квандта и Спирмена противоречат друг другу. Скорее всего, неточность связана с небольшим объёмом выборки. Кроме того, у факторов х1 и х4 автокорреляция находится в зоне неопределенности. Это означает, что у нас нет достаточных оснований для принятия решения. Все этого говорит о том, что в построенной модели возможны ошибки, которые следует принять к сведению при построении прогнозов.
Чтобы уменьшить наличие мультиколлинеарности было решено исключить из модели y^=a+b1x1+b2x2+b4x4 переменную х1.
Была построена множественная регрессия y^=a+b2x2+b4x4 или y^=31806-14,08х2+0,104х4.
Несмотря на отсутствие мультиколлинеарности данная модель, по -моему мнению, получилась хуже.
Сделаем сводную таблицу и сравним модель парной регрессии, которая значима, и модели множественной регрессии по наиболее существенным критериям (см. табл. 20):
Таблица 20
Сравнение моделей
Тип модели |
R^2 |
R^2adj |
Sост |
MAD |
A |
|
Парная y^=a+bx4 |
0,289621389 |
0,26002228 |
6886,261751 |
5133,171311 |
15,00% |
|
y^=a+b1x1+b2x2+b4x4 |
0,693103801 |
0,651254319 |
4727,468281 |
3603,473623 |
11,10% |
|
y^=a+b2x2+b4x4 |
0,421142735 |
0,37080732 |
6349,887562 |
4626,062355 |
13,89% |
Как мы видим, по большинству критериев лучшая модель - множественная модель с тремя факторами y^=a+b1x1+b2x2+b4x4. Данная модель в большей степени влияет на величину заработной платы, чем остальные. Скорее всего это связано с тем, что сами работники, их количество и инвестиции в основной капитал заставляют работодателей изменять величину заработной платы.
В заключении хотелось бы отметить, что данный вопрос требует особого внимания и дальнейшего изучения, так как заработная плата играет значительную роль в развитии экономики, государства и жизни каждого человека. Дальнейшее изучение данного вопроса поможет в построении прогнозов и принятии целесообразных решений, а возможно приведёт к более качественной модели.
Список использованных источников
Евсеев Е.А., Буре В.М., Эконометрика: Учебник, Изд-во МБИ, 2007 г.
Тарашнина С. И., Панкратова Я.Б., Выполнение курсовой работы по эконометрике: учебно-методическое пособие, 2007 г.
Курс эконометрика: электронный ресурс URL: http://eos.ibi.spb.ru/course/view.php?id=608
Сайт федеральной статистики: электронный ресурс URL: http://www.gks.ru/
Федеральная служба государственной статистики (Росстат): электронный ресурс URL: http://government.ru/department/250/events/
Размещено на Allbest.ru
Подобные документы
Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.
контрольная работа [173,8 K], добавлен 22.11.2010Поля корреляции, характеризующие зависимость ВРП на душу населения от размера инвестиций в основной капитал. Оценка параметров уравнения парной линейной регрессии. Коэффициент множественной корреляции. Способы оценки параметров структурной модели.
контрольная работа [215,1 K], добавлен 22.11.2010Этапы и проблемы эконометрических исследований. Параметры парной линейной регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициентов автокорреляции второго порядка для временного ряда расходов на потребление.
контрольная работа [60,3 K], добавлен 05.01.2011Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.
курсовая работа [1,1 M], добавлен 07.08.2011Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.
контрольная работа [136,3 K], добавлен 25.09.2014Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.
курсовая работа [2,5 M], добавлен 26.12.2014Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Расчет параметров уравнений линейной и нелинейной парной регрессии, порядок проведения дисперсионного анализа. Оценка тесноты связи между ценами первичного рынка и себестоимостью с помощью показателей корреляции и детерминации, ошибки аппроксимации.
курсовая работа [923,5 K], добавлен 07.08.2013Параметры парной линейной, линейно-логарифмической функции. Оценка статистической надёжности. Ошибка положения регрессии. Расчёт бета коэффициентов, уравнение множественной регрессии в стандартизованном масштабе. Задача на определение тесноты связи рядов.
контрольная работа [192,2 K], добавлен 23.06.2012Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.
контрольная работа [157,9 K], добавлен 06.08.2010