Основы эконометрики
Расчет корреляции между экономическими показателями; построение линейной множественной регрессии в программе Excel. Оценка адекватности построенной модели; ее проверка на отсутствие автокорреляции и на гетероскедастичность с помощью теста Бреуша-Пагана.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 15.03.2013 |
Размер файла | 61,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Государственное образовательное учреждение
высшего профессионального образования
"ЧЕЛЯБИНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ"
Институт экономики отраслей, бизнеса и администрирования
- Основы эконометрики
- Выполнил: Ибатуллин И.А.
- Группа: 28ПС-202
- Проверил: Шатин И.А.
- Челябинск
- 2012
Задание для выполнения практической работы
Работа включает в себя анализ реальных экономических данных при помощи изученных эконометрических моделей.
Работа должны быть выполнена в соответствии со следующими этапами:
1) Рассчитайте корреляцию между, экономическими показателями (не менее 5) из статистических данных по выборке не менее 45 наблюдений (из Интернета, печатных источников или Вашего предприятия). Интерпретируйте полученные данные.
2) Постройте линейную множественную регрессию. Определите теоретическое уравнение множественной регрессии. Оцените адекватность построенной модели. Определите значимость переменных, найдите среднюю ошибку аппроксимации (вручную в экселе), коэффициент детерминации, линейные коэффициенты корреляции между всеми членами регрессии, найти критерий Фишера, Т-статистику и т. д.
3) Проверьте модели на отсутствие автокорреляции.
4) Проверка на гетероскедастичность моделей.
Таблица 1. Данные для анализа
Годы |
Общий валовой внутренний продукт, трлн. руб. |
Оплата труда наемных работников, трлн.руб |
Чистые налоги на производство и импорт, трлн.руб |
Наличие основных фондов в РФ |
Оборот оптовой торговли , трлн. руб. |
|
Y |
X1 |
X2 |
X3 |
X4 |
||
2000 |
7305,6 |
2937,2 |
1248,5 |
14334,8 |
3,1 |
|
2001 |
8943,6 |
3848,4 |
1402,6 |
17464,2 |
4,3 |
|
2002 |
10819,2 |
5065,1 |
1847,2 |
21495,2 |
5,5 |
|
2003 |
13208,2 |
6231,4 |
2112,5 |
26333,3 |
6,8 |
|
2004 |
17027,2 |
7845,0 |
2875,5 |
32173,3 |
8,9 |
|
2005 |
21609,8 |
9474,3 |
4248,4 |
34873,7 |
11,4 |
|
2006 |
26917,2 |
11985,9 |
5386,7 |
41493,6 |
15,6 |
|
2007 |
33247,5 |
15526,1 |
6334,3 |
47489,5 |
19,9 |
|
2008 |
41276,8 |
19559,8 |
8218,4 |
60391,5 |
24,0 |
|
2009 |
38808,7 |
20412,5 |
6474,5 |
74441,1 |
31,1 |
|
2010 |
45166,0 |
22531,6 |
8252,3 |
82303,0 |
28,3 |
|
2011 |
54369,1 |
26757,2 |
10919,2 |
93185,6 |
32,0 |
1. Коррелямция
Коррелямция (корреляционная зависимость) -- статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин приводят к систематическому изменению значений другой или других величин.
На основании данных таблицы 1 проведем корреляционный анализ зависимости Потребления электроэнергии от 4 факторов.
Анализ производим с помощью пакета анализа данных в программе MS Excel. Результаты анализа внесем в таблицу 2.
корреляция регрессия гетероскедастичность еxcel
Таблица 2. Корреляционная зависимость
Y |
X1 |
X2 |
X3 |
X4 |
||
Y |
1 |
|||||
X1 |
0,99677508 |
1 |
||||
X2 |
0,992734543 |
0,981151785 |
1 |
|||
X3 |
0,97816225 |
0,98936714 |
0,953116118 |
1 |
||
X4 |
0,975846077 |
0,98654557 |
0,946253028 |
0,980103417 |
1 |
По данным таблицы видно, что наибольшее влияние на общий валовой внутренний продукт оказывает оплата труда наемных работников.
2. Построим линейную множественную регрессию
Таблица 3. Регрессионная статистика
Множественный R |
0,999749182 |
|
R-квадрат |
0,999498426 |
|
Нормированный R-квадрат |
0,999211813 |
|
Стандартная ошибка |
444,1809142 |
|
Наблюдения |
12 |
Если знак при коэффициенте регрессии - положительный, связь зависимой переменной с независимой будет положительной. В нашем случае знак коэффициента регрессии положительный, следовательно, связь также является положительной.
Для анализа общего качества уравнения регрессии используют обычно множественный коэффициент детерминации R2, называемый также квадратом коэффициента множественной корреляции R. R2 (мера определенности) всегда находится в пределах интервала [0;1].
Если значение R2 близко к единице, это означает, что построенная модель объясняет почти всю изменчивость соответствующих переменных. И наоборот, значение R-квадрата, близкое к нулю, означает плохое качество построенной модели, в нашем случае построенная модель объясняет почти всю изменчивость соответствующих переменных.
Коэффициент детерминации R2 показывает, на сколько процентов () найденная функция регрессии описывает связь между исходными значениями факторов X и Y
где - объясненная вариация; - общая вариация.
В нашем случае, функция регрессии описывает связь между исходными значениями факторов X и Y на 99,97%.
Таблица 4. Дисперсионный анализ
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
4 |
2752106540 |
688026634,9 |
3487,269116 |
1,2712E-11 |
|
Остаток |
7 |
1381076,79 |
197296,6846 |
|||
Итого |
11 |
2753487616 |
Число регрессоров m = 4 число n-m-1 = 12-4-1=7, где n - число наблюдений.
Для уровня значимости б = 0,05 и при степенях свободы 4, 7 табличное значение критерия Фишера Fтаб = 4,12. Значение F=3487,27 выше табличного, данное уравнение регрессии будет статистически значимым. Уравнение регрессии является пригодным для практического использования, т.к. F расч > Fтаб не менее чем в 4 раза.
Таблица 5. Коэффициенты регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
1882,373846 |
322,7076624 |
5,833062133 |
0,00064155 |
1119,29148 |
2645,45621 |
|
Переменная X 1 |
1,21497104 |
0,421875014 |
2,879931261 |
0,02365391 |
0,21739515 |
2,21254693 |
|
Переменная X 2 |
1,973119612 |
0,428183437 |
4,608117553 |
0,00246044 |
0,96062667 |
2,98561255 |
|
Переменная X 3 |
-0,035488734 |
0,050250561 |
-0,706235581 |
0,50286322 |
-0,15431243 |
0,08333496 |
|
Переменная X 4 |
70,97386696 |
117,4208705 |
0,604439966 |
0,56462024 |
-206,682371 |
348,630105 |
В столбце "Коэффициенты" получены коэффициенты уравнения регрессии:
у=1882,37+1,21Х1+1,97Х2-0,035Х3+70,97Х4
Видно, что отрицательное влияние на показатель Общий валовой внутренний продукт оказывает переменная Х3 - наличие основных фондов в РФ.
Стандартные ошибки mi, t-статистики ti могут быть вычислены по формулам
,
Где уY - среднее квадратическое отклонение для отклика Y,
уXi - среднее квадратическое отклонение для регрессора Xi (X1, X2, …)
R2- коэффициент детерминации для уравнения множественной регрессии,
- коэффициент детерминации для зависимости отклика Y от всех регрессоров кроме Xi,
- коэффициент детерминации для зависимости Xi от всех регрессоров кроме Xi.
Табличные t-критерии Стьюдента зависят от принятого уровня значимости и от числа степеней свободы (n-m-1). Если вычисленные значения t-критерия превышают табличные, то говорят, что соответствующий коэффициент регрессии является статистически значимым и на него можно опираться в анализе и прогнозе.
Более того, используя табличное значение t-критерия и стандартную ошибку mi коэффициента регрессии bi можно с вероятностью 1 - б сделать вывод о том, что истинное значение коэффициента регрессии попадет в интервал (bi - tтаб*mi , bi + tтаб*mi).
Для нашего примера:
m(X1) =0,42188,
m(X2) =0,42818,
m(X3) =0,05025,
m(X4) =117,42087,
m(y) =322,707662
t(X1) =2,87993,
t(X2) =4,60812,
t(X3) -0,70624,
t(X4) =0,60444,
t(y) =5,833062
Табличное значение t-критерия Стьюдента при уровне значимости б = 0,05 и числе степеней свободы 7 tтаб =3,335. Коэффициенты t- статистики при регрессорах Х2, Х3 и Х4 меньше t таб., и согласно t-критерию не являются статистически значимыми. Регрессор Х1, больше t таб. И является статистически значимым.
По величине Р-значения возможно определять значимость коэффициентов, не находя критическое значение t-статистики. Если значение t-статистики велико, то соответствующее значение вероятности значимости мало - меньше 0,05, и можно считать, что коэффициент регрессии значим. И наоборот, если значение t-статистики мало, соответственно вероятность значимости больше 0,05 - коэффициент считается незначимым.
Для коэффициентов b0, b1,b2 значения вероятности меньше 0,05 и для них коэффициент регрессии значим. Для коэффициентов b3, b4 значения вероятности стремятся к единице и следовательно, коэффициенты незначимы.
Таблица 6. Относительная ошибка аппроксимации
Наблюдение |
Предсказанное Y |
Остатки Е |
Стандартные остатки |
|
1 |
7628,114123 |
-322,4678232 |
-0,910067939 |
|
2 |
9007,906163 |
-64,32376269 |
-0,181534373 |
|
3 |
11309,22878 |
-490,0165306 |
-1,382923511 |
|
4 |
13171,03006 |
37,20372121 |
0,104996255 |
|
5 |
16576,47912 |
450,7117376 |
1,271997615 |
|
6 |
21348,95794 |
260,8075472 |
0,736050452 |
|
7 |
26710,01154 |
207,1898359 |
0,584730672 |
|
8 |
32973,10354 |
274,4096897 |
0,774438387 |
|
9 |
41424,11435 |
-147,2651676 |
-0,415611413 |
|
10 |
39026,03672 |
-217,2888587 |
-0,613232111 |
|
11 |
44625,22264 |
540,8239548 |
1,526312105 |
|
12 |
54898,86821 |
-529,7843435 |
-1,49515614 |
|
СУММА |
18,52 |
|||
Средняя ошибка аппроксимации |
1,54% |
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
В нашем случае средняя ошибка аппроксимации составляет 1,54 %. Это значит, что качество тренда, исходя из относительных отклонений по каждому наблюдения, признается хорошим, так в норме средняя ошибка аппроксимации колеблется в пределах до 10%.
3. Проверка модели на отсутствие автокорреляции
Автокорреляция в остатках свидетельствует о неудачном подборе модели, о ее несовершенстве. Наличие автокорреляции может быть выявлено при помощи d-критерия Дарбина-Уотсона. Значение критерия вычисляется по формуле:
Таблица 7. Расчет критерия d - Дарбина-Уотсона
№ |
Yтеор |
e=Yтеор-Yпракт |
e(t)-e(t-1) |
{e(t)-e(t-1)}^2 |
e^2 |
|
1 |
7616,608284 |
4679,41 |
4679,41 |
21896861,89 |
21896861,89 |
|
2 |
8992,915076 |
7744,42 |
3065,01 |
9394266,64 |
59975964,87 |
|
3 |
11288,76759 |
9886,17 |
2141,75 |
4587103,85 |
97736309,70 |
|
4 |
13146,3031 |
11299,06 |
1412,89 |
1996262,60 |
127668738,07 |
|
5 |
16544,19681 |
14431,68 |
3132,62 |
9813308,35 |
208273364,90 |
|
6 |
21305,60371 |
18430,15 |
3998,47 |
15987794,90 |
339670550,07 |
|
7 |
26653,83973 |
22405,48 |
3975,33 |
15803224,87 |
502005547,36 |
|
8 |
32899,29085 |
27512,58 |
5107,10 |
26082460,95 |
756942023,66 |
|
9 |
41330,66224 |
34996,35 |
7483,77 |
56006752,70 |
1224744185,41 |
|
10 |
38940,62487 |
30722,22 |
-4274,12 |
18268105,61 |
943855100,73 |
|
11 |
44527,58441 |
38053,09 |
7330,86 |
53741536,78 |
1448037415,48 |
|
12 |
54777,209 |
46524,87 |
8471,79 |
71771156,44 |
2164563780,92 |
|
СУММА |
161568036,73 |
3338913545,92 |
||||
Критерий d |
0,048389404 |
В таблице значений критерия Дарбина-Уотсона для уровня значимости 5% при m=4и n=7 критические значения d1=0,048, d2=1,739,
В нашем расчете значение d-критерия попадает в интервал от 0 до d1, автокорреляция положительна.
4. Проверка на гетероскедастичность моделей
Для проверки на гетероскедастичность воспользуемся тестом Бреуша-Пагана и данными таблиц 6, 7.
Затем строим регрессию, в которой за зависимую переменную берется столбец квадратов остатков еi2, а за зависимые переменные - переменные Х1, Х2, Х3, Х4 (табл. 8).
Таблица 8. Данные для проверки на гетероскедастичность моделей
Y |
X1 |
X2 |
X3 |
X4 |
||
1 |
21896861,89 |
2937,2 |
1248,5 |
14334,8 |
3,1 |
|
2 |
9394266,64 |
3848,4 |
1402,6 |
17464,2 |
4,3 |
|
3 |
4587103,85 |
5065,1 |
1847,2 |
21495,2 |
5,5 |
|
4 |
1996262,60 |
6231,4 |
2112,5 |
26333,3 |
6,8 |
|
5 |
9813308,35 |
7845,0 |
2875,5 |
32173,3 |
8,9 |
|
6 |
15987794,90 |
9474,3 |
4248,4 |
34873,7 |
11,4 |
|
7 |
15803224,87 |
11985,9 |
5386,7 |
41493,6 |
15,6 |
|
8 |
26082460,95 |
15526,1 |
6334,3 |
47489,5 |
19,9 |
|
9 |
56006752,70 |
19559,8 |
8218,4 |
60391,5 |
24,0 |
|
10 |
18268105,61 |
20412,5 |
6474,5 |
74441,1 |
31,1 |
|
11 |
53741536,78 |
22531,6 |
8252,3 |
82303,0 |
28,3 |
|
12 |
71771156,44 |
26757,2 |
10919,2 |
93185,6 |
32,0 |
Таблица 9. Регрессионная статистика
Множественный R |
0,930497653 |
|||||
R-квадрат |
0,865825882 |
|||||
Нормированный R-квадрат |
0,789154957 |
|||||
Стандартная ошибка |
10373968,8 |
|||||
Наблюдения |
12 |
|||||
Таблица 10. Дисперсионный анализ |
||||||
df |
SS |
MS |
F |
Значимость F |
||
Регрессия |
4 |
4,86127E+15 |
1,21532E+15 |
11,29275 |
0,003566 |
|
Остаток |
7 |
7,53335E+14 |
1,07619E+14 |
|||
Итого |
11 |
5,6146E+15 |
Таблица 11. Коэффициенты регрессии
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
||
Y-пересечение |
-7716696,169 |
7531171,974 |
-1,024634 |
0,339634688 |
-25525088,1 |
10091695,7 |
|
X 1 |
8591,412764 |
9901,407348 |
0,867696123 |
0,414314396 |
-14821,695 |
32004,521 |
|
X 2 |
1338,454016 |
10043,71882 |
0,133262792 |
0,897735707 |
-22411,167 |
25088,075 |
|
X 3 |
-160,0918196 |
1171,530429 |
-0,1366519 |
0,895153163 |
-2930,321083 |
2610,1374 |
|
X 4 |
-4722028,49 |
2779183,309 |
-1,6990705 |
0,133108615 |
-11293752,74 |
1849695,8 |
Найдена статистика:
Х2наб = nR2=12*0,865825882=10,38991
Так как Х2набл=10,38991 > Х2крит =9,49, то гипотеза о гетероскедастичности подтверждается и модель считается гетероскедастичной. Критическое значение распределения Кси-квадрат найдено с помощью действий: fx>Статистические>ХИ2ОБР(m), где m - число переменных, входящих в уравнение регрессии.
Выводы
Наибольшее влияние на образование общего валового внутреннего продукта оказывает размер оплаты труда наемных работников.
Функция регрессии описывает связь между исходными значениями факторов X и Y на 99,97%.
Значение F=3487,27 выше табличного, данное уравнение регрессии будет статистически значимым. Уравнение регрессии является пригодным для практического использования, т.к. F расч > Fтаб не менее чем в 4 раза.
Уравнение регрессии: у=1882,37+1,21Х1+1,97Х2-0,035Х3+70,97Х4
Видно, что отрицательное влияние на показатель Общий валовой внутренний продукт оказывает переменная Х3 - наличие основных фондов в РФ.
Коэффициенты t- статистики при регрессорах Х2, Х3 и Х4 меньше t таб., и согласно t-критерию не являются статистически значимыми. Регрессор Х1, больше t таб. И является статистически значимым.
Для коэффициентов b0, b1,b2 значения вероятности меньше 0,05 и для них коэффициент регрессии значим. Для коэффициентов b3, b4 значения вероятности стремятся к единице и следовательно, коэффициенты незначимы.
Средняя ошибка аппроксимации составляет 1,54 %. Это значит, что качество тренда, исходя из относительных отклонений по каждому наблюдения, признается хорошим, так в норме средняя ошибка аппроксимации колеблется в пределах до 10%.
Значение d-критерия попадает в интервал от 0 до d1, автокорреляция положительна.
Х2наб =1,169121. Так как Х2набл=1,578< Х2крит =9,48, то гипотеза о гетероскедастичности подтверждена и модель считается гетероскедастичной.
Литература
1. Берндт Э. Р. Практика эконометрики: классика и современность: Учебник для студентов вузов. - М.: ЮНИТИ-ДАНА, 2005. - 863 с.
2. Луговская Л.В. Эконометрика в вопросах и ответах: учебное пособие. - М.: ТК Велби, Изд-во Проспект, 2006. - 208 с.
3. Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. - М.: Финансы и статистика, 2006. - 344 с.
4. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. - Т. 1. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика. - М.: ЮНИТИ-ДАНА, 2001. - 656 с.
5. Эконометрика: Учебник / Тихомиров Н.П., Дорохина Е.Ю. - М.: Издательство "Экзамен", 2003. - 512 с
6. Эконометрика: учебное пособие / А.В. Гладилин, А.Н. Герасимов, Е.И. Громов. - М.: КНОРУС, 2008. - 232 с.
Размещено на Allbest.ru
Подобные документы
Статистическая адекватность и проверка модели линейной регрессии на мультиколлинеарность. Исследование автокорреляции с помощью критерия Дарбина-Уотсона, тестов Сведа-Эйзенхарта и Бреуша-Годфри. Анализ гетероскедастичности и корректировка модели.
курсовая работа [1,5 M], добавлен 29.03.2015Построение качественной модели линейной регрессии и доказательство справедливости соответствующего ей теоретического уравнения экономической теории. Демонстрация работы тестов Бреуша-Годфри и Q-теста, позволяющих определить наличие автокорреляции.
курсовая работа [108,6 K], добавлен 02.11.2009Построение обобщенной линейной модели множественной регрессии, ее суть; теорема Айткена. Понятие гетероскедастичности, ее обнаружение и методы смягчения проблемы: тест ранговой корреляции Спирмена, метод Голдфелда-Квандта, тесты Глейзера, Парка, Уайта.
контрольная работа [431,2 K], добавлен 28.07.2013Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Анализ влияния основных социально-экономических показателей на результативный признак. Особенности классической линейной модели множественной регрессии, ее анализ на наличие или отсутствие гетероскедастичности в регрессионных остатках и их автокорреляции.
лабораторная работа [573,8 K], добавлен 17.02.2014Основы построения и тестирования адекватности экономических моделей множественной регрессии, проблема их спецификации и последствия ошибок. Методическое и информационное обеспечение множественной регрессии. Числовой пример модели множественной регрессии.
курсовая работа [3,4 M], добавлен 10.02.2014Проблема гетероскедастичности и способы ее устранения. Построение базовой регрессионной модели и оценка её качества. Исследование проблемы гетероскедастичности с помощью тестов Вайта, Бреуша-Пагана-Годфри и Парка. Устранение гетероскедастичности в модели.
курсовая работа [972,0 K], добавлен 09.12.2010Оценка распределения переменной Х1. Моделирование взаимосвязи между переменными У и Х1 с помощью линейной функции и методом множественной линейной регрессии. Сравнение качества построенных моделей. Составление точечного прогноза по заданным значениям.
курсовая работа [418,3 K], добавлен 24.06.2015Методика расчета параметров множественной регрессии и корреляции. Тест на выбор "длинной" или "короткой" регрессии. Тест Чоу на однородность зависимости объясняемой переменной от объясняющих. Тест Бреуша – Пагана. Тест Дарбина на наличие автокорреляции.
лекция [40,3 K], добавлен 13.02.2011Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016