Фиктивные переменные. Динамические эконометрические модели
Необходимость использования фиктивных переменных. Авторегрессионые модели: модель адаптивных ожиданий и частичной корректировки. Метод инструментальных переменных. Полиномиально распределенные лаги Алмон. Сравнение двух регрессий. Суть метода Койка.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 28.07.2013 |
Размер файла | 176,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Контрольная работа
Фиктивные переменные. Динамические эконометрические модели
1. Необходимость использования фиктивных переменных
До сих пор рассматривались модели, в которых все объясняющие переменные были количественными переменными (производительность труда, себестоимость, доход и т.п.). На практике часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней. К числу таких признаков можно отнести: пол (мужской, женский), образование (начальное, среднее, высшее), фактор сезонности (зима, весна, лето, осень) и т.п.
Качественные признаки могут существенно влиять на структуру линейных связей и приводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят об исследовании регрессионных моделей с переменной структурой или о построении регрессионных моделей по неоднородным данным.
Например, необходимо изучить зависимость размера з/п Y не только от количественных факторов х1,…,хр, но и от качественного признака Z1 (например, пола). Можно получить оценки регрессионной модели
для каждого уровня качественного признака, а затем изучать различия между ними. Другой подход позволяет оценивать влияние количественных переменных и качественных признаков по одному уравнению регрессии. Он связан с введением фиктивных переменных (структурных переменных).
В качестве фиктивных переменных обычно используют булевы переменные, принимающие лишь значения «0» и «1».
В этом случае первоначальная регрессионная модель з/п примет вид
, где
Таким образом, принимая эту модель, считается, что з/п у мужчин на выше, чем у женщин. Проверка гипотезы
Н0: может установить существенность влияния фактора «пол» на размер з/п. Следует отметить, что в принципе качественное различие можно формализовать с помощью любой переменной, принимающей два разных значения, не обязательно «0» или «1». Однако, в эконометрической практике почти всегда используются фиктивные переменные типа «0-1», так как при этом интерпретация полученных результатов выглядит наиболее просто. Если качественный признак имеет k уровней, то можно ввести дискретную переменную, принимающую k значений. Однако так не поступают из-за трудности содержательной интерпретации, а вводят (k-1) бинарную переменную. Например, для учета фактора образования можно ввести k = 3 - 1 = 2 бинарные переменные z21 и z22:
,
где
Третьей переменной не требуется, так как если работник имеет начальное образование, то z21 = z22 = 0. Более того, z23 вводить нельзя, так как для любого работника z21 + z22 + z23 = 1, и получался бы столбец в матрице Х из 1 (т.е., уже два таких столбца). И ХТХ была бы вырожденной, следовательно, невозможно получить оценки коэффициентов. Такая ситуация получила название «ловушки». Чтобы избежать её, число вводимых бинарных переменных должно быть на 1 меньше числа уровней качественного признака.
Название «фиктивной» переменной не совсем удачно, так как все процедуры регрессионного анализа (оценка параметров модели, проверка значимости коэффициентов и т.п.) проводятся при включении фиктивных переменных так же, как и количественных переменных. «Фиктивность» состоит только в том, что они количественным образом описывают качественный признак.
2. Модели ANOVA и ANCOVA
Значит, кроме моделей, содержащих только количественные объясняющие переменные, в регрессионном анализе рассматривают также модели, содержащие лишь качественные переменные, либо те и другие одновременно. Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA - моделями (моделями дисперсионного анализа). Например, пусть Y - начальная з/п,
Зависимость можно описать моделью парной регрессии
, очевидно,
,
При этом коэффициент определяет среднюю начальную з/п при отсутствии в.о. Коэффициент указывает, на какую величину отличаются средние начальные з/п при наличии и при отсутствии в.о. Проверяя статистическую значимость коэффициента с помощью t - статистики, либо значимость коэффициента детерминации R2 с помощью F - статистики, можно определить, влияет или нет наличие высшего образования на начальную з/п. Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называют ANCOVA - моделями (моделями ковариационного анализа).
Рассмотрим простейшую ANCOVA - модель с одной количественной и одной качественной переменной, имеющей 2 уровня
где Y - з/п сотрудника фирмы, х - стаж, z - пол, т.е.
Ожидаемое значение з/п при х годах трудового стажа будет:
-для женщин,
- для мужчин.
З/п является линейной функцией стажа, причем для мужчин и женщин з/п меняется с одним и тем же коэффициентом . Отличаются только свободные члены. Проверив с помощью t - статистики значимость коэффициентов и , можно определить, имеет ли место в фирме дискриминация по половому признаку. При > 0 она будет в пользу мужчин, при < 0 - в пользу женщин. Пример. Исследуется эффективность лекарств у в зависимости от возраста пациента х. При этом сравнивается эффективность лекарств а и b.
лекарство |
y |
x |
z |
zx |
|
a |
54 |
69 |
0 |
0 |
|
b |
30 |
48 |
1 |
48 |
|
a |
58 |
73 |
0 |
0 |
|
b |
66 |
64 |
1 |
64 |
|
b |
67 |
60 |
1 |
60 |
|
a |
64 |
62 |
0 |
0 |
|
a |
67 |
70 |
0 |
0 |
|
a |
33 |
52 |
0 |
0 |
|
a |
33 |
63 |
0 |
0 |
|
b |
42 |
48 |
1 |
48 |
|
b |
33 |
46 |
1 |
46 |
|
a |
28 |
55 |
0 |
0 |
|
b |
30 |
40 |
1 |
40 |
|
b |
23 |
41 |
1 |
41 |
|
a |
21 |
55 |
0 |
0 |
|
b |
43 |
45 |
1 |
45 |
|
a |
38 |
58 |
0 |
0 |
|
b |
43 |
58 |
1 |
58 |
|
a |
43 |
64 |
0 |
0 |
|
b |
45 |
55 |
1 |
55 |
|
b |
48 |
57 |
1 |
57 |
|
a |
48 |
63 |
0 |
0 |
|
a |
53 |
60 |
0 |
0 |
|
b |
58 |
62 |
1 |
62 |
Решение
Вводится фиктивная переменная z:
Возможен один из трех вариантов: , или
Какой из вариантов предпочтительнее?
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,690350892 |
||||||
R-квадрат |
0,476584354 |
||||||
Нормированный R-квадрат |
0,452792733 |
||||||
Стандартная ошибка |
10,42269343 |
||||||
Наблюдения |
24 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
2176,084158 |
2176,084158 |
20,03160557 |
0,000188762 |
||
Остаток |
22 |
2389,915842 |
108,6325383 |
||||
Итого |
23 |
4566 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-17,86138614 |
14,09491696 |
-1,267221807 |
0,218326504 |
-47,09245468 |
11,3696824 |
|
x |
1,094059406 |
0,24444605 |
4,47566817 |
0,000188762 |
0,587109328 |
1,601009484 |
|
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,818778974 |
||||||
R-квадрат |
0,670399008 |
||||||
Нормированный R-квадрат |
0,639008438 |
||||||
Стандартная ошибка |
8,465498967 |
||||||
Наблюдения |
24 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
2 |
3061,041872 |
1530,520936 |
21,35670027 |
8,68719E-06 |
||
Остаток |
21 |
1504,958128 |
71,66467277 |
||||
Итого |
23 |
4566 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-53,19211823 |
15,23631493 |
-3,491140638 |
0,00217736 |
-84,87776958 |
-21,50646687 |
|
x |
1,583743842 |
0,242565436 |
6,529140623 |
1,81395E-06 |
1,079301405 |
2,08818628 |
|
z |
14,83743842 |
4,222311121 |
3,514056164 |
0,002062797 |
6,056661791 |
23,61821506 |
|
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,820613512 |
||||||
R-квадрат |
0,673406536 |
||||||
Нормированный R-квадрат |
0,624417516 |
||||||
Стандартная ошибка |
8,634887835 |
||||||
Наблюдения |
24 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
3 |
3074,774242 |
1024,924747 |
13,74607086 |
4,28274E-05 |
||
Остаток |
20 |
1491,225758 |
74,56128792 |
||||
Итого |
23 |
4566 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-61,67248908 |
25,13975551 |
-2,453185715 |
0,02345824 |
-114,1131 |
-9,231878171 |
|
x |
1,720524017 |
0,403481811 |
4,264192264 |
0,00037931 |
0,87887571 |
2,562172325 |
|
z |
27,60406803 |
30,05830936 |
0,918350653 |
0,369378456 |
-35,0964664 |
90,30460246 |
|
zx |
-0,219208228 |
0,510788146 |
-0,429156843 |
0,672396526 |
-1,284693626 |
0,84627717 |
Вывод
Значения фиктивной переменной можно изменять на противоположные. Суть модели от этого не меняется. У коэффициента изменится знак. Значение качественной переменной, для которой принимается Z = 0, называют базовым или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.
Коэффициент иногда называют дифференциальным коэффициентом свободного члена, так как он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной, равной 1, от свободного члена модели при базовом значении фиктивной переменной.
Рассмотрим модель с двумя объясняющими переменными, одна из которых количественная, другая - качественная, имеющая 3 альтернативы. Например, расходы на содержание ребенка могут быть связаны с доходами и возрастом ребёнка: дошкольный, младший школьный и старший школьный. Модель будет иметь вид:
где Y - расходы, х - доходы,
Получим следующие зависимости:
Средний расход на дошкольника
;
Средний расход на младшего школьника:
;
Средний расход на старшего школьника:
;
и - дифференциальные свободные члены. Базовым значением Z является «дошкольник». Таким образом, получаются три регрессионные прямые, параллельные друг другу. Если коэффициенты и окажутся статистически незначимыми, то можно сделать вывод, что возраст ребенка не оказывает существенного влияния на расходы по его содержанию.
Чтобы учесть сезонные колебания аналогично можно вводить фиктивные переменные, например,
3. Сравнение двух регрессий. Тест Чоу.
В рассматриваемых примерах предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена. В более сложных моделях может быть отражено влияние качественного фактора на сами параметры при переменных. Например, можно предположить, что до некоторого года в стране обменный курс валют был фиксированным, а затем плавающим. Или налог на ввозимые автомобили был одним, а затем он существенно изменился. Зависимость может быть выражена так:
,
где
Тогда ожидаемое значение Y определяется следующим образом:
и .
Фиктивная переменная z1 в уравнении используется как в аддитивном виде (z1), так и в мультипликативном (z1x), что позволяет фактически разбивать рассматриваемую зависимость на две части, связанные с периодом изменения качественного фактора. Имеет ли смысл разбивать выборку на части или в этом нет необходимости можно решить с помощью теста Чоу. Задача может быть и противоположной: можно ли объединить две выборки в одну и рассматривать единую модель (без качественного фактора).
Суть теста Чоу состоит в следующем. Пусть выборка имеет объем n, и есть основание предполагать, что целесообразно разбить её на две объёмами n1 и n2: n1 + n2 = n. Строят уравнение общей регрессии и уравнение регрессий по каждой подвыборке. Обозначим
, , .
Очевидно, что возможно лишь при совпадении коэффициентов регрессии для всех трех уравнений. Чем сильнее различие в поведении Y для двух подвыборок, тем больше S0 будет превосходить S1 + S2. Тогда S0 - (S1 + S2) может быть интерпретирована как улучшение качества модели при разбиении. Следовательно, дробь (S0 - (S1 + S2))/(p+1) определяет оценку уменьшения дисперсии регрессии. Проверку проводят с помощью критерия Фишера
(здесь n-2p-2 и р+1 - число степеней свободы необъясненной и объясненной дисперсий).
Если F > Fкр(, р+1, n-2p-2), то разбиение целесообразно. Это означает необходимость введения в уравнение регрессии соответствующей фиктивной переменной.
Если F < Fкр, то различие между S0 и S1 + S2 статистически незначимо и нет смысла разбивать уравнение регрессии на части.
Пример. Рассматривая зависимость между доходом Х и сбережениями Y за 20 лет, обнаружено изменение экономической ситуации на 12-м году наблюдений.
Построить общее уравнение регрессии для всего интервала наблюдений, а также уравнение регрессии, учитывающее изменение ситуации. Проверить с помощью теста Чоу необходимость разбиения интервала наблюдений на два подынтервала.
год |
Y |
X |
Z |
|
75 |
4,7 |
100 |
0 |
|
76 |
6,1 |
105 |
0 |
|
77 |
6,5 |
108 |
0 |
|
78 |
6,8 |
111 |
0 |
|
79 |
5,2 |
115 |
0 |
|
80 |
6,5 |
122 |
0 |
|
81 |
7,5 |
128 |
0 |
|
82 |
8 |
135 |
0 |
|
83 |
9 |
143 |
0 |
|
84 |
9,1 |
142 |
0 |
|
85 |
8,7 |
147 |
0 |
|
86 |
12 |
155 |
1 |
|
87 |
16,2 |
167 |
1 |
|
88 |
18,5 |
177 |
1 |
|
89 |
18 |
188 |
1 |
|
90 |
17,6 |
195 |
1 |
|
91 |
20 |
210 |
1 |
|
92 |
23 |
226 |
1 |
|
93 |
22,5 |
238 |
1 |
|
94 |
24,3 |
255 |
1 |
1) строим уравнение для всего интервала.
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,975998 |
||||||
R-квадрат |
0,952571 |
||||||
Нормированный R-квадрат |
0,949936 |
||||||
Стандартная ошибка |
1,500972 |
||||||
Наблюдения |
20 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
814,4655 |
814,4655 |
361,5159 |
2,3E-13 |
||
Остаток |
18 |
40,55252 |
2,252918 |
||||
Итого |
19 |
855,018 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-9,56407 |
1,208504 |
-7,91397 |
2,86E-07 |
-12,103 |
-7,02509 |
|
X |
0,1394 |
0,007332 |
19,01357 |
2,3E-13 |
0,123997 |
0,154804 |
2) строим уравнение множественной регрессии с фиктивной переменной
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,989934 |
||||||
R-квадрат |
0,979969 |
||||||
Нормированный R-квадрат |
0,977612 |
||||||
Стандартная ошибка |
1,00373 |
||||||
Наблюдения |
20 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
2 |
837,8909 |
418,9455 |
415,8374 |
3,67E-15 |
||
Остаток |
17 |
17,12706 |
1,007474 |
||||
Итого |
19 |
855,018 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-5,43851 |
1,176906 |
-4,62103 |
0,000244 |
-7,92157 |
-2,95546 |
|
X |
0,101714 |
0,009226 |
11,02452 |
3,64E-09 |
0,082248 |
0,121179 |
|
Z |
4,093698 |
0,848963 |
4,821998 |
0,000159 |
2,302542 |
5,884853 |
3) строим уравнение парной регрессии для данных до 86 года
ВЫВОД ИТОГОВ |
|||||||
Множественный R |
0,91651 |
||||||
R-квадрат |
0,83999 |
||||||
Нормированный R-квадрат |
0,822211 |
||||||
Стандартная ошибка |
0,62994 |
||||||
Наблюдения |
11 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
18,74858 |
18,74858 |
47,24651 |
7,28E-05 |
||
Остаток |
9 |
3,571422 |
0,396825 |
||||
Итого |
10 |
22,32 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-3,00135 |
1,481807 |
-2,02546 |
0,073471 |
-6,35343 |
0,350733 |
|
X |
0,081943 |
0,011921 |
6,87361 |
7,28E-05 |
0,054975 |
0,108911 |
4) Парная регрессия для интервала с 86 по 94 годы
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,946876 |
||||||
R-квадрат |
0,896574 |
||||||
Нормированный R-квадрат |
0,881799 |
||||||
Стандартная ошибка |
1,316233 |
||||||
Наблюдения |
9 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
105,1283 |
105,1283 |
60,68116 |
0,000108 |
||
Остаток |
7 |
12,12729 |
1,73247 |
||||
Итого |
8 |
117,2556 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-2,5731 |
2,819436 |
-0,91263 |
0,391785 |
-9,24001 |
4,093808 |
|
Переменная X 1 |
0,107818 |
0,013841 |
7,789811 |
0,000108 |
0,075089 |
0,140546 |
5). Применим тест Чоу.
S0 = 855,018; S1 = 22,32; S2 = 117,256; n = 20; p = 1;
Так как F > Fkp, то разбиение целесообразно, т.е. целесообразно использование фиктивной переменной.
4. Фиктивная зависимая переменная
Иногда фиктивные переменные могут быть использованы для объяснения поведения зависимой переменной. Например, если исследовать зависимость наличия автомобиля от дохода, пола и т.п., то зависимая переменная имеет два возможных значения: 0 - нет машины, 1 - есть.
Если для моделей такого типа использовать обыкновенный МНК, то оценки не будут обладать свойствами наилучших линейных несмещенных оценок. Для определения коэффициентов используют другие методы (например, взвешенный МНК).
Модель LPM.
Рассмотрим модель, в которой зависимая переменная - фиктивная переменная. Объясняющие переменные могут быть и качественными, и количественными. Например, анализ наличия работы у субъекта в зависимости от возраста, образования, семейного положения, доходов остальных членов семьи и т.д. Или, исследование торгового баланса (отрицательный или положительный). Пусть
авторегрессионый модель койка фиктивный
, (*)
где y - результат сдачи экзамена в ГАИ с 1-й попытки, x1- количество часов вождения в автошколе, x2 - средний процент выпускников, сдающих экзамен с 1-й попытки, D1- использование компьютерной методики обучения:
Получим модель
.
Модели такого вида называют линейными вероятностными моделями (LPM).
Применимость МНК к таким моделям имеет определенные ограничения:
1. Случайные отклонения в таких моделях не являются нормальными случайными величинами. Скорее всего, они имеют биномиальное распределение (при оно сходится к нормальному закону).
2. Случайные отклонения не обладают свойством постоянства дисперсии (гомоскедастичности).
3. Использование модели (*) может привести к тому, что некоторые уi будут либо меньше нуля, либо больше 1.
4. Применение модели LPM затруднено с содержательной точки зрения (увеличение x на 1 ед. приводит к изменению y на величину вне зависимости от конкретного значения x и т.п.).
Поэтому, непосредственное использование МНК в модели LPM приводит к серьезным погрешностям и необоснованным выводам, его использование не рекомендуется.
Пример. Исследуется вопрос о наличии собственного дома Y () в зависимости от совокупного дохода семьи Х по выборке объема 40.
семья |
y |
x |
|||||||||
1 |
0 |
10 |
ВЫВОД ИТОГОВ |
||||||||
2 |
1 |
20 |
|||||||||
3 |
1 |
22 |
Регрессионная статистика |
||||||||
4 |
0 |
18 |
Множественный R |
0,72763199 |
|||||||
5 |
0 |
9 |
R-квадрат |
0,52944831 |
|||||||
6 |
0 |
15 |
Нормированный R-квадрат |
0,51706537 |
|||||||
7 |
1 |
25 |
Стандартная ошибка |
0,35013012 |
|||||||
8 |
1 |
30 |
Наблюдения |
40 |
|||||||
9 |
1 |
40 |
|||||||||
10 |
0 |
16 |
Дисперсионный анализ |
||||||||
11 |
0 |
12 |
df |
SS |
MS |
F |
Значимость F |
||||
12 |
0 |
8 |
Регрессия |
1 |
5,241538247 |
5,241538247 |
42,75627105 |
1,04143E-07 |
|||
13 |
1 |
20 |
Остаток |
38 |
4,658461753 |
0,122591099 |
|||||
14 |
0 |
19 |
Итого |
39 |
9,9 |
||||||
15 |
1 |
30 |
|||||||||
16 |
1 |
50 |
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
|||
17 |
1 |
37 |
Y-пересечение |
-0,1694268 |
0,123166627 |
-1,37559031 |
0,17700343 |
-0,418764617 |
0,079911 |
||
18 |
1 |
28 |
x |
0,03022802 |
0,00462285 |
6,538827957 |
1,04143E-07 |
0,020869548 |
0,0395865 |
||
19 |
1 |
45 |
|||||||||
20 |
1 |
38 |
|||||||||
21 |
1 |
30 |
Оценим LPM модель, её качество и вероятность того, что при доходе, равном 18, семья имеет доход. |
||||||||
22 |
0 |
12 |
|||||||||
23 |
0 |
16 |
|||||||||
24 |
1 |
27 |
P (Y=1 / X=18) = |
0,3746775 |
|||||||
25 |
0 |
19 |
|||||||||
26 |
0 |
15 |
|||||||||
27 |
1 |
32 |
|||||||||
28 |
0 |
18 |
|||||||||
29 |
1 |
43 |
|||||||||
30 |
0 |
13 |
|||||||||
31 |
1 |
22 |
|||||||||
32 |
0 |
14 |
|||||||||
33 |
0 |
10 |
|||||||||
34 |
0 |
17 |
|||||||||
35 |
1 |
36 |
|||||||||
36 |
1 |
45 |
|||||||||
37 |
0 |
14 |
|||||||||
38 |
1 |
2 |
|||||||||
39 |
1 |
41 |
|||||||||
40 |
1 |
34 |
Logit модель.
Для преодоления недостатков LPM-моделей необходимо использовать такие модели, в которых не будут, по крайней мере, нарушаться неравенства , и зависимость между и х не будет линейной, а будет удовлетворять закону убывающей эффективности.
Поясним суть logit модели. По модели LPM
(для одной переменной)
Представим
где .
Здесь можно заметить, что при , неравенство не нарушается никогда. Формула зависимости pi от xi не является линейной. Однако, pi не является линейной функцией от параметров и . Это значит, что для их определения неприменим МНК. Преодолеем эту проблему.
.
Отношение является отношением вероятностей, характеризующим во сколько раз больше, чем . Прологарифмировав, получим
. (**)
Модель (**) называют logit моделью, она напоминает полулогарифмическую модель. Однако, для её построения невозможно использовать обычный МНК, так как не неизвестными являются значения
Поэтому предварительно необходимо определить pi. Если имеется выборка по сгруппированным данным, то (относительная частота). В случае несгруппированных данных для определения pi используют метод максимального правдоподобия. И в этом случае использование обычного МНК нецелесообразно в силу проблемы гетероскедастичности. Поэтому при расчетах коэффициентов обычно применяют ВМНК, устраняющий этот недостаток.
Пример. В таблице представлены данные о количестве семей N, имеющих определенный уровень дохода Х, и количестве семей n, имеющих частные дома.
Оценить logit модель по МНК. Оценить logit модель по ВМНК, учитывая при этом, что дисперсии отклонений оцениваются по следующей формуле
; .
Сравните качество построенных регрессий.
Составим таблицу
Xi |
N |
n |
pi |
Zi |
a' |
X' |
Z' |
|||
10 |
35 |
5 |
0,142857 |
-1,79176 |
0,233333 |
0,483046 |
2,070197 |
20,70197 |
-3,70929 |
|
15 |
45 |
10 |
0,222222 |
-1,25276 |
0,128571 |
0,358569 |
2,788867 |
41,833 |
-3,49379 |
|
20 |
60 |
18 |
0,3 |
-0,8473 |
0,079365 |
0,281718 |
3,549648 |
70,99296 |
-3,00761 |
|
25 |
80 |
30 |
0,375 |
-0,51083 |
0,053333 |
0,23094 |
4,330127 |
108,2532 |
-2,21194 |
|
30 |
100 |
45 |
0,45 |
-0,20067 |
0,040404 |
0,201008 |
4,974937 |
149,2481 |
-0,99832 |
|
35 |
130 |
60 |
0,461538 |
-0,15415 |
0,030952 |
0,175933 |
5,683986 |
198,9395 |
-0,87619 |
|
40 |
90 |
55 |
0,611111 |
0,451985 |
0,046753 |
0,216225 |
4,624812 |
184,9925 |
2,090346 |
|
45 |
65 |
45 |
0,692308 |
0,81093 |
0,072222 |
0,268742 |
3,721042 |
167,4469 |
3,017505 |
|
50 |
50 |
38 |
0,76 |
1,15268 |
0,109649 |
0,331133 |
3,019934 |
150,9967 |
3,481016 |
|
55 |
30 |
24 |
0,8 |
1,386294 |
0,208333 |
0,456435 |
2,19089 |
120,499 |
3,037219 |
|
60 |
15 |
13 |
0,866667 |
1,871802 |
0,576923 |
0,759555 |
1,316561 |
78,99367 |
2,464342 |
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,9956 |
||||||
R-квадрат |
0,99122 |
||||||
Нормированный R-квадрат |
0,990244 |
||||||
Стандартная ошибка |
0,114177 |
||||||
Наблюдения |
11 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
1 |
13,24509 |
13,24509 |
1016,002 |
1,45E-10 |
||
Остаток |
9 |
0,117328 |
0,013036 |
||||
Итого |
10 |
13,36241 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-2,34572 |
0,08362 |
-28,0521 |
4,52E-10 |
-2,53488 |
-2,15655 |
|
Xi |
0,0694 |
0,002177 |
31,87479 |
1,45E-10 |
0,064475 |
0,074326 |
|
ВЫВОД ИТОГОВ |
|||||||
Регрессионная статистика |
|||||||
Множественный R |
0,985839 |
||||||
R-квадрат |
0,971879 |
||||||
Нормированный R-квадрат |
0,857643 |
||||||
Стандартная ошибка |
0,507898 |
||||||
Наблюдения |
11 |
||||||
Дисперсионный анализ |
|||||||
df |
SS |
MS |
F |
Значимость F |
|||
Регрессия |
2 |
80,23657 |
40,11829 |
155,5212 |
3,95E-07 |
||
Остаток |
9 |
2,321642 |
0,25796 |
||||
Итого |
11 |
82,55822 |
|||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
0 |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
#Н/Д |
|
a' |
-2,28664 |
0,134015 |
-17,0626 |
3,67E-08 |
-2,5898 |
-1,98348 |
|
X' |
0,067203 |
0,003817 |
17,6074 |
2,78E-08 |
0,058569 |
0,075837 |
5. Общая характеристика ДЭМ
К динамическим эконометрическим моделям (ДЭМ) относят модели, которые в данный момент времени учитывают значения входящих в нее переменных, относящихся к текущему и к предыдущему моментам времени.
Например
ДЭМ, а не является ДЭМ.
Можно выделить два основных типа ДЭМ:
1. К моделям первого типа относятся модели авторегрессии и модели с распределенным лагом, в которых лаговые значения переменных (переменных, относящихся к предыдущим моментам времени) непосредственно включены в модель. Модели авторегрессии - это ДЭМ, в которых в качестве факторных переменных содержатся лаговые значения результативной переменной. Например
- марковский случайный процесс;
- авторегрессионная модель порядка р.
Модели с распределенным лагом - это ДЭМ, в которых содержатся не только текущие, но и лаговые значения факторных переменных. Например
2. Модели второго типа учитывают динамическую информацию в неявном виде. Они включают переменные, характеризующие ожидаемый или желаемый уровень признака-результата или одного из факторов в момент времени t. Этот уровень считается неизвестным и определяется с учетом информации в предыдущий момент времени t-1. В зависимости от способа определения ожидаемых значений показателей различают модели: адаптивных ожиданий, частичной корректировки и рациональных ожиданий. Оценка параметров этих моделей сводится к оценке параметров моделей авторегрессии.
6. Оценка моделей с лагами в независимых переменных. Преобразование Койка
Оценка моделей с распределенным лагом во многом зависит от того, конечное или бесконечное число лагов она содержит:
,
.
В обеих моделях коэффициенты называются краткосрочными мультипликатором, так как он характеризует изменение среднего значения Y под воздействием единичного изменения переменной X в тот же момент времени.
Сумму всех коэффициентов
называют долгосрочным мультипликатором, так как она характеризует изменение Y под воздействием единичного изменения переменной X в каждом из рассматриваемых временных периодов.
Любую сумму коэффициентов
называют промежуточным мультипликатором.
Модель с конечным числом лагов оценивается сведением ее к уравнению множественной регрессии.
Полагают , , ... , и получают уравнение
Для оценки моделей с бесконечным числом лагов разработано несколько методов.
Преобразование Койка
Метод Койка обычно применяют, если в моделях с распределенным лагом величина максимального лага p бесконечна. Предполагается, что коэффициенты при лаговых значениях объясняющей переменной убывают в геометрической прогрессии. Если имеется одна объясняющая переменная, то модель имеет вид
где , , . В модели всего три параметра: . Для их оценивания нельзя использовать обычный МНК, так как:
1) возникает проблема мультиколлинеарности;
2) из полученных оценок МНК не удается вывести (не однозначность).
Для оценки параметров можно использовать два метода: нелинейный МНК и преобразование Койка.
Суть нелинейного МНК. Параметру присваивают последовательно все значения из интервала (0,1) с шагом, например, 0,01; 0,001;... . Для каждого значения рассчитывается переменная с таким значением р, при котором дальнейшие лаговые значения х не оказывают существенного воздействия на z.
С помощью обычного МНК оценивается уравнение регрессии: . Из всех возможных значений выбирается то, при котором коэффициент детерминации будет наибольшим.
Суть метода Койка. Если выражение выполняется для периода t, то оно должно выполняться и для периода (t-1): и вычтем из предыдущего, получим:
или
.
Полученная модель относится к моделям авторегрессии. Эта форма позволяет анализировать краткосрочные и долгосрочные динамические свойства модели.
В краткосрочном аспекте (в текущем периоде) значение нужно рассматривать как фиксированное. Воздействие х на у характеризует коэффициент .
В долгосрочном периоде (без учета ) если стремится к некоторому равновесному значению , то и будут также стремиться к равновесному уровню , определяемому как: , из которого .
Таким образом, долгосрочное воздействие х на у отражается коэффициентом . Если , то этот коэффициент превысит , то есть долгосрочное воздействие оказывается сильнее краткосрочного.
Модель преобразования Койка привлекательна с практической точки зрения, так как оценивание парной регрессии с помощью МНК позволяет получить оценки . Метод Койка требует гораздо меньше усилий, чем нелинейный МНК. Однако его применение сопряжено с одной проблемой - нарушение одной из предпосылок МНК: объясняющая переменная частично зависит от и поэтому коррелирует с одной из случайных составляющих (). В итоге оценки МНК оказываются смещенными и несостоятельными.
7. Авторегрессионые модели: модель адаптивных ожиданий и частичной корректировки. Метод инструментальных переменных
При построении моделей авторегрессии
возникает проблема: нарушается предпосылка линейной регрессионной модели об отсутствии связи между признаком и случайной составляющей. В модели авторегрессии признак связан с . Поэтому применение обычного МНК для оценки параметров уравнения регрессии приводит к получению смещенной оценки параметра при переменной . Для оценки параметров уравнения может быть использован метод инструментальных переменных. Суть его состоит в следующем.
Переменную из правой части уравнения, для которой нарушается предпосылка МНК, заменяют на новую переменную, удовлетворяющую следующим требованиям:
1) она должна тесно коррелировать с ;
2) она не должна коррелировать со случайной составляющей .
Затем оценивать регрессию с новой инструментальной переменной с помощью обычного МНК.
Рассмотрим один из методов получения инструментальной переменной. Так как зависит от , можно предположить, что зависит также от , то есть . Оценка может быть найдена с помощью обычного МНК. Новая переменная тесно коррелирует с и не коррелирует с , то есть может служить инструментальной переменной.
В результате модель авторегрессии примет вид
где .
Оценки параметров данной модели находят обычным МНК. Полученные оценки являются искомыми оценками модели авторегрессии.
Замечание: реализация метода инструментальных переменных осложняется появлением мультиколлинеарности факторов в модели: функциональная связь с приводит к высокой корреляционной связи между и . В некоторых случаях эту проблему можно решить включением в модель фактора времени t.
Модель адаптивных ожиданий
Модель адаптивных ожиданий учитывает желаемое (ожидаемое) значение факторного признака . Например, ожидаемое в будущем значение курса доллара влияет на наши инвестиции в текущем периоде .
В общем виде модель адаптивных ожиданий можно записать так:
.
Механизм формирования ожиданий в модели следующий
, или
То есть значение переменной, ожидаемой в следующий период , формирующееся как среднее арифметическое взвешенное ее реального и ожидаемого значений в текущем периоде. Чем больше величина , тем быстрее ожидаемое значение адаптируется предыдущим реальным значениям. Чем меньше , тем ожидаемое значение в будущем ближе к ожидаемому значению предыдущего периода . Использовать обычный МНК нельзя, так как модель содержит ожидаемое значение факторной переменной. Для оценки параметров модель преобразовывают.
Подставим в модель вместо :
.
Аналогично,
. Вычтем почленно.
или
где .
Полученная модель включает только фактические значения переменных, поэтому ее параметры можно определить обычным МНК, а затем перейти к исходной модели.
Модель частичной корректировки
Модель частичной корректировки учитывает желаемое (ожидаемое) значение результативного признака . В общем виде модель можно записать так
.
В таких моделях предполагается, что фактическое приращение зависимой переменной пропорционально разнице между ее желаемым уровнем и фактическим значением в предыдущий период :
, или
То есть получается как среднее арифметическое взвешенное желаемого уровня и фактического значения этой переменной в предыдущий период . Чем больше , тем быстрее происходит процесс корректировки. Если , то и полная корректировка происходит за 1 период.
Если , то корректировки не происходит совсем.
Аналогично получим:
,
Параметры преобразованного уравнения регрессии , , могут быть оценены с помощью обычного МНК.
8. Полиномиально распределенные лаги Алмон
Лаги Алмон используют для описания модели с распределенным лагом:
,
имеющей полиномиальную структуру лага и конечную величину лага р. Суть метода Алмон состоит в следующем:
1. Формализуют зависимость коэффициентов от величины лага . Модель зависимости представляет собой полином:
· 1й степени ;
· 2й степени
· 3й степени
· k-степени
2. Каждый коэффициент модели - можно выразить следующим образом:
и т.д.
Подставим эти соотношения для в модель и получим:
.
3. Перегруппируем слагаемые:
.
Обозначим слагаемые в скобках при коэффициентах как новые переменные
............................................................................
Модель примет вид
4. Определим параметры новой модели с помощью обычного МНК. Затем от параметров перейдем к параметрам , используя соотношения на 1-ом шаге.
Применение метода сопряжено с рядом проблем:
а) определение максимального лага с использованием показателей тесноты связи: , , ...;
б) определение степени полинома (обычно 2, 3). Степень должна быть на 1 меньше числа экстремумов в структуре лага;
в) мультиколлинеарность.
Литература
1. Айвазян С.А., Иванова С.С. Эконометрика. Краткий курс: учеб. пособие / С.А. Айвазян, С.С. Иванова. - М.: Маркет ДС, 2007. - 104 с.
2. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-у изд., испр. - Т. 2: Айвазян С.А. Основы эконометрики. - М.: ЮНИТИ-ДАНА, 2009. - 432 с.
3. Симчера В.М. Методы многомерного анализа статистических данных: учеб. пособие. - М.: Финансы и статистика, 2008. - 400 с.
4. Чураков Е.П. Прогнозирование эконометрических временных рядов: учеб. пособие / Е.П. Чураков. - М.: Финансы и статистика, 2008. - 208 с.
5. Эконометрика: учеб. / под ред. д-ра экон. наук, проф. В.С. Мхитаряна. - М.: Проспект, 2008. - 384 с.
6. Эконометрика: учеб. / под ред. И.И. Елисеевой М.: Проспект, 2009. - 288 с.
7. Эконометрика: Учебник/И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др., Под ред. И.И. Елисеевой. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2006. - 576 с.
Размещено на Allbest.ru
Подобные документы
Возможные ошибки спецификации модели. Симптомы наличия ошибки спецификации первого типа. Проблемы с использованием замещающих переменных. Построение функции Кобба-Дугласа. Проверка адекватности модели. Переменные социально-экономического характера.
презентация [264,5 K], добавлен 19.01.2015Проектирование регрессионной модели по панельным данным. Скрытые переменные и индивидуальные эффекты. Расчет коэффициентов однонаправленной модели с фиксированными эффектами по панельным данным в MS Excel. Выбор переменных для построения данной регрессии.
курсовая работа [2,3 M], добавлен 26.08.2013Основные проблемы эконометрического моделирования. Использование фиктивных переменных и гармонических трендов. Метод наименьших квадратов и выборочная дисперсия. Смысл коэффициента детерминации. Расчет функции эластичности. Свойства линейной модели.
контрольная работа [18,6 K], добавлен 06.11.2009Исследование зависимости себестоимости 1 тонны литья от брака литья по 11 литейным цехам заводов. Линейная модель регрессии. Результаты вспомогательных расчетов для построения гиперболической и параболической модели регрессии. Спецификация модели.
курсовая работа [140,8 K], добавлен 15.01.2013Общая характеристика экономики Германии, история и основные этапы ее становления и современное состояние. Идентификация двухшаговым методом наименьших квадратов упрощенной модели Клейна. Построение прогноза эндогенных переменных исследуемой модели.
контрольная работа [77,1 K], добавлен 26.04.2010Взаимосвязи экономических переменных. Понятие эконометрической модели. Коэффициент корреляции и его свойства. Линейная парная регрессия. Метод наименьших квадратов. Основные предпосылки и принципы регрессионного анализа. Статистика Дарбина-Уотсона.
шпаргалка [142,4 K], добавлен 22.12.2011Случайная выборка из генеральной совокупности. Сущность метода Монте-Карло. Определение адекватности принятой эконометрической модели. Линейная регрессионная модель вида. Система нормальных уравнений в матричной форме. Параметры регрессионной модели.
контрольная работа [323,5 K], добавлен 08.12.2010Методологические основы эконометрики. Проблемы построения эконометрических моделей. Цели эконометрического исследования. Основные этапы эконометрического моделирования. Эконометрические модели парной линейной регрессии и методы оценки их параметров.
контрольная работа [176,4 K], добавлен 17.10.2014Составление и проверка матрицы планирования. Получение математической модели объекта. Проверка адекватности математического описания. Применение метода случайного баланса для выделения наиболее существенных входных переменных многофакторного объекта.
курсовая работа [568,7 K], добавлен 31.08.2010Альтернативою підходу Койка до дистрибутивно-лагових моделей є поліноміальна дистрибутивно-лагова модель Ш. Альмона. Моделі виявилися дуже корисними в емпіричній економіці, тому що можуть перетворювати моделі на динамічні, за допомогою фактору часу.
контрольная работа [35,8 K], добавлен 12.04.2009