Построение модели на мультиколлинеарность
Анализ построенной модели на мультиколлинеарность на основе показателей, характеризующих социально-экономическое развитие городов и районов Оренбургской области. Построение линейной зависимости или корреляции между двумя и более объясняющими переменными.
Рубрика | Экономико-математическое моделирование |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 03.02.2015 |
Размер файла | 99,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задание к лабораторной работе № 2
На основе показателей, характеризующих социально-экономическое развитие городов и районов Оренбургской области, провести анализ построенной модели на мультиколлинеарность и в случае необходимости устранить мультиколлинеарность.
Исходные данные для анализа
мультиколлинеарность линейный зависимость экономический
Таблица 1 - Значения социально-экономических показателей, характеризующих города и районы Оренбургской области.
Y |
X1 |
X2 |
X3 |
X4 |
X5 |
|
716,59 |
50 |
0 |
31,35 |
2226,11 |
329,71 |
|
4791,44 |
16,7 |
355 |
2,25 |
135701,34 |
2008,04 |
|
5677,9 |
52,9 |
263 |
0,11 |
-8567,61 |
1458,21 |
|
1571,2 |
45,5 |
26 |
0,17 |
-36522,68 |
1821,81 |
|
3704,46 |
40,9 |
141 |
0,37 |
17280,55 |
2005,23 |
|
3304,59 |
72,7 |
173 |
0,17 |
-23702,21 |
1583,71 |
|
4367,39 |
58,3 |
43 |
0,07 |
2327,56 |
1283,09 |
|
2127,96 |
52,6 |
574 |
0,77 |
-20227,66 |
1556,33 |
|
13657,15 |
16,7 |
67 |
0,15 |
90494,93 |
1543,57 |
|
2252,99 |
55,6 |
90 |
0,22 |
-21387,79 |
2376,39 |
|
2242,38 |
81,8 |
21 |
0,6 |
-66252,5 |
1855,85 |
|
2803,27 |
42,9 |
151 |
2,94 |
-38968,18 |
1780,37 |
|
1984,05 |
41,2 |
319 |
1,83 |
95392,98 |
1746,81 |
|
3618,35 |
25 |
215 |
0,92 |
-6880,28 |
1738,92 |
|
2438,19 |
52,9 |
50 |
0,73 |
-12601,5 |
660,66 |
|
2074,29 |
81,2 |
40 |
0,08 |
-19203,87 |
1614,86 |
|
2172,78 |
11,1 |
51 |
0,12 |
27154,79 |
1479,75 |
|
10893,4 |
61,9 |
1468 |
1,11 |
-88359,71 |
2791,04 |
|
5723,31 |
40,5 |
998 |
1,52 |
53771,06 |
2447,89 |
|
4967,2 |
31,2 |
221 |
0,07 |
6046,84 |
2109,25 |
|
20071,1 |
31,1 |
1984 |
6,9 |
222587,21 |
9987,58 |
|
1795,32 |
17,6 |
161 |
0,11 |
11834,97 |
1600,04 |
|
3561,15 |
30,8 |
110 |
2,12 |
5089,93 |
2466 |
|
2217,02 |
81,8 |
27 |
17,11 |
-4358,73 |
1663,79 |
|
4551,4 |
14,3 |
714 |
2,07 |
47042,61 |
2252,94 |
|
3384,8 |
40 |
554 |
0,39 |
18636,05 |
2442,46 |
|
3775,83 |
64,3 |
739 |
0,28 |
-31576,96 |
3104,97 |
|
2264,2 |
21,4 |
55 |
0,29 |
12573,25 |
2041,39 |
|
1047,46 |
81 |
238 |
1,42 |
-27755,42 |
749,79 |
|
2833,94 |
33,3 |
611 |
0,23 |
-41927,34 |
992,49 |
|
6881,07 |
55,6 |
448 |
0,43 |
19211,06 |
1932,97 |
|
1755,21 |
54,2 |
163 |
0,17 |
2703,44 |
1623,23 |
|
3196,66 |
50 |
260 |
0,14 |
-1805 |
2492,35 |
|
3649,02 |
26,3 |
122 |
2,09 |
29131,25 |
1848,44 |
|
7148,83 |
100 |
0 |
3,86 |
-70126,16 |
2688,39 |
|
2784,39 |
25 |
1062 |
10,65 |
28860,67 |
5245,52 |
|
4229,97 |
38,9 |
3504 |
0,76 |
93608,09 |
6175,02 |
|
61679,53 |
27,7 |
12002 |
6,22 |
8735783,87 |
8125,77 |
|
27338,48 |
10 |
8180 |
0,38 |
1526864,98 |
7199,35 |
|
2012,36 |
27,3 |
2192 |
0,35 |
27775,53 |
7323,76 |
|
11170,01 |
31,2 |
4033 |
2,18 |
321986,13 |
5295,27 |
|
29743,64 |
39,5 |
24413 |
13,08 |
1476312,51 |
6902,37 |
|
21460,65 |
22,3 |
52066 |
26,49 |
144294,97 |
10336,03 |
|
4301,33 |
28,8 |
24492 |
0,47 |
710226,74 |
6455,67 |
|
4401 |
42,9 |
1035 |
0,15 |
29769,64 |
7020,26 |
|
3446,14 |
12,5 |
879 |
0,85 |
40383,38 |
7599,74 |
|
3539,32 |
50 |
4084 |
0,87 |
282356,73 |
7508,34 |
Таблица 2 - Наименование показателей.
Обозначение |
Наименование |
|
Y |
Объем инвестиций в основной капитал на душу населения, рублей |
|
Х1 |
Удельный вес убыточных предприятий и организаций, в процентах от общего числа предприятий |
|
Х2 |
Среднегодовая численность работников, занятых в промышленности, человек |
|
Х3 |
Число зарегистрированных иностранных рабочих, в промилле от численности населения в трудоспособном возрасте |
|
Х4 |
Сальдированный финансовый результат (прибыль минус убыток) на одно предприятие, рублей |
|
Х5 |
Объем платных услуг на душу населения, рублей |
Мультиколлинеарность
Термин «мультиколлинеарность» используется для обозначения линейной зависимости или корреляции между двумя и более объясняющими переменными.
Различают полную и частичную мультиколлинеарность.
Если существует функциональная линейная зависимость между объясняющими переменными, то говорят, что существует полная мультиколлинеарность.
Реальная или частичная мультиколлинеарность возникает в случаях существования достаточно тесных линейных статических связей между объясняющими переменными.
Признаки мультиколлинеарности.
Внешние признаки:
1. Неоправданно большие с экономической точки зрения коэффициенты уравнения регрессии.
2. Небольшие изменения исходных статистических данных приводит к существенному изменению оценок коэффициентов моделей.
3. Неправильные с экономической точки зрения знаки отдельных коэффициентов регрессии.
4. Среди коэффициентов уравнения регрессии много незначимых, хотя сама модель значима.
5. Стандартные ошибки коэффициентов велики настолько, что сравнимы или даже превосходят сами коэффициенты.
6. Доверительные интервалы для коэффициентов уравнения регрессии содержат внутри себя точку 0.
Данные признаки являются необходимыми, но недостаточными.
Формальные признаки:
1. Среди оценок коэффициентов парной корреляции между объясняющими переменными есть такие, которые по абсолютной величине превосходят значение 0,6.
2. Среди оценок коэффициентов детерминации между одной объясняющей переменной и всеми остальными есть такие, которые больше 0,6.
3. Необходимым условием плохой обусловленности является маленькое значение определителя матрицы Хт*Х.
4. Достаточным условием плохой обусловленности является высокое значение числа обусловленности.
Наиболее простой способ устранения мультиколлинеарности построить линейную модель множественной регрессии, исключая незначимые факторы.
Практическая часть
Модель значима, но из пяти коэффициентов при объясняющих переменных значимы только два - при переменных Х4 и Х5.
Исследование модели на наличие мультиколлинеарности опирается на проверку наличия у модели внешних и формальных признаков.
Итак:
1. У коэффициента Х1 отрицательный знак, что с экономической точки зрения неправильно.
2. Три из пяти коэффициентов незначимы, хотя сама модель значима (рисунок 1).
3. Стандартные ошибки коэффициентов велики настолько, что превосходят сами коэффициенты (рисунок 1).
Рисунок 1 - Внешние признаки наличия мультиколлинеарности
Проанализируем оценку матрицы парных коэффициентов корреляции между объясняющими переменными. Считается, что наличие значимых коэффициентов корреляции, по абсолютной величине превосходящих 0,6, свидетельствует о присутствии мультиколлинеарности.
Для вычисления оценки матрицы парных коэффициентов корреляции в GRETL выбираем пункт Корелляционная матрица. После того, как все 5 объясняющих признака будут перенесены в список выбранных переменных, открываем окно для вычисления оценки матрицы парных коэффициентов корреляции (рисунок 2).
Коэффициенты корреляции, наблюдения 1 - 47 5% критические значения (двухсторонние) = 0,2876 для n = 47
X1 |
X2 |
X3 |
X4 |
X5 |
||
1,0000 |
-0,2241 |
0,0125 |
-0,1731 |
-0,3529 |
X1 |
|
1,0000 |
0,5108 |
0,2574 |
0,6122 |
X2 |
||
1,0000 |
0,1000 |
0,2336 |
X3 |
|||
1,0000 |
0,3782 |
X4 |
||||
1,0000 |
X5 |
Рисунок 2 - Окно для вычисления оценки матрицы парных коэффициентов корреляции
Как видно из рисунка 2, между объясняющими переменными Х2 и Х5 наблюдается тесная связь. Это один из признаков мультиколлинеарности.
Таким образом, можно сделать вывод, что перечисленные ранее проблемы, связанные с незначимыми коэффициентами, неверными знаками коэффициентов являются следствием мультиколлинеарности.
Мультиколлинеарность будем устранять построением линейной модели множественной регрессии на основе только значимых коэффициентов (рисунок 3).
Модель 2: МНК, использованы наблюдения 1-47 Зависимая переменная: Y
Коэффициент |
Ст. ошибка |
t-статистика |
P-значение |
|||
const |
1540,23 |
1041,34 |
1,4791 |
0,14624 |
||
X4 |
0,00621106 |
0,000532336 |
11,6676 |
<0,00001 |
*** |
|
X5 |
1,06739 |
0,260773 |
4,0932 |
0,00018 |
*** |
|
Среднее зав. перемен |
6921,888 |
Ст. откл. зав. перемен |
10415,57 |
|||
Сумма кв. остатков |
8,30e+08 |
Ст. ошибка модели |
4343,167 |
|||
R-квадрат |
0,833681 |
Испр. R-квадрат |
0,826121 |
|||
F(2, 44) |
110,2759 |
Р-значение (F) |
7,26e-18 |
|||
Лог. правдоподобие |
-458,8290 |
Крит. Акаике |
923,6580 |
|||
Крит. Шварца |
929,2084 |
Крит. Хеннана-Куинна |
925,7466 |
Рисунок 3 - ЛММР на основе значимых коэффициентов
Получаем следующую оценку модели регрессии:
(1041,34) (0,0005) (0,26)
Проверка подтвердила нормальный характер распределения регрессионных остатков модели (таблица 1)
Таблица 1 - Результаты проверки гипотезы о нормальности регрессионных остатков модели
№ |
Критерий |
Р-значение |
|
1 |
Хи-квадрат |
0,11 |
|
2 |
Дурника-Хансена |
0,11 |
|
3 |
Шапиро-Уилка |
0,002 |
|
4 |
Лиллифорса |
0 |
|
5 |
Жака-Бера |
0,08 |
Для значимых коэффициентов модели можно построить доверительные интервалы, знание которых позволит получить больше информации о диапазоне влияния исследуемых факторов на результативный показатель - Объем инвестиций в основной капитал на душу населения.
Доверительный интервал имеет вид:
,
Где - оценка коэффициента
- стандартная ошибка оценки коэффициента
- 100%-я точка или квантиль уровня г распределения Стьюдента.
Для построения доверительных интервалов нам понадобится tкрит, найденное для числа степеней свободы v=n-k-1=47-2-1=44, тогда tкрит=2,015.
Доверительный интервал для коэффициентов при Х4: 0,0049925?в4?0,0070075
Доверительный интервал для коэффициентов при Х5: 0,5401?в5?1,5879
Интерпретация результатов
Модель регрессии значима, коэффициенты при всех переменных также значимы. Коэффициент детерминации составил 0,83, т.е. 83% вариации объема инвестиций в основной капитал на душу населения можно объяснить сальдированным финансовым результатом на одно предприятие и объемом платных услуг на душу населения, а 17% вариации, вероятно, объясняется неучтенными в модели факторами.
Анализируя отношение результативного и факторных признаков, можем сказать, что при увеличении на 1 единицу сальдированного финансового результата (прибыль минус убыток) на одно предприятие (рублей) объем инвестиций в основной капитал на душу населения (рублей) в среднем увеличится на 0,006 единиц; а при увеличении на 1 единицу объема платных услуг на душу населения (рублей) объем инвестиций в основной капитал на душу населения (рублей) в среднем увеличится на 1,064 единиц.
Размещено на Allbest.ru
Подобные документы
Характеристика зависимости цены автомобиля от его возраста и мощности двигателя на основе полученных статистических данных (линейной зависимости). Расчет мультиколлинеарности между объясняющими переменными, анализ надежности оценок параметров модели.
контрольная работа [60,0 K], добавлен 21.03.2010Мультиколлинеарность в экономических исследованиях и методы ее уменьшения или устранения. Взаимная коррелированность объясняющих переменных. Функциональная и стохастическая (скрытая) формы. Анализ корреляционной матрицы между объясняющими переменными.
реферат [51,6 K], добавлен 30.03.2009Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.
курсовая работа [314,1 K], добавлен 21.01.2011Взаимосвязь между двумя выбранными переменными на фоне действия остальных показателей. Матрица парных коэффициентов корреляции. Уравнение множественной регрессии. Расчет коэффициентов для проверки наличия автокорреляция. Вариации зависимой переменной.
контрольная работа [43,7 K], добавлен 03.09.2013Моделирование экономических процессов с помощью однофакторной регрессии. Оценка параметров проекта методом наименьших квадратов. Расчет коэффициента линейной корреляции. Исследование множественной эконометрической линейной схемы на мультиколлинеарность.
курсовая работа [326,5 K], добавлен 19.01.2011Эконометрика как одна из базовых дисциплин экономического образования во всем мире. Прогноз социально-экономических показателей, характеризующих состояние и развитие анализируемой системы. Понятие и построение модели парной регрессии и корреляции.
контрольная работа [633,2 K], добавлен 10.12.2013Сущность регрессионного анализа и применение его в эконометрике. Инструментарий эконометрического исследования в области мультиколлинеарности, методы ее устранения. Исследование на мультиколлинеарность факторов, влияющих на экономические процессы.
курсовая работа [711,5 K], добавлен 15.02.2017Построение качественной и адекватной эконометрической модели по методу наименьших квадратов и ее анализ на наличие автокорреляции, мультиколлинеарности, гетероскедастичности с применением статистики Дарвина-Уотсона, тестов Парка и Голдфелда-Квандта.
курсовая работа [434,0 K], добавлен 04.12.2013Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.
лабораторная работа [214,2 K], добавлен 17.10.2009