Проверка истинности моделей множественной регрессии
Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 26.01.2010 |
Размер файла | 352,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Министерство образования и науки Российской Федерации
Государственное образовательное учреждение высшего профессионального образования
АЛТАЙСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ им. И.И. ПОЛЗУНОВА
ИНСТИТУТ ЭКОНОМИКИ И УПРАВЛЕНИЯ РЕГИОНАЛЬНЫМ РАЗВИТИЕМ
Расчётное задание
по дисциплине: Эконометрика
Проверка истинности моделей множественной регрессии
Выполнил:
Филатов М.И.
2010
Исходные данные
|
Численность студентов (на 1000 человек населения) |
Динамика Валового Внутреннего Продукта (в постоянных ценах) |
Динамика валового накопления основного капитала (в постоянных ценах) |
|
|
x1 |
y |
x2 |
|
Россия |
64 |
131,2 |
103 |
|
Австралия |
50 |
123 |
169 |
|
Австрия |
29 |
117 |
115 |
|
Азербайджан |
22 |
177,3 |
103,4 |
|
Армения |
34 |
184,1 |
263,5 |
|
Беларусь |
195 |
164,9 |
162,2 |
|
Бельгия |
39 |
115 |
120 |
|
Венгрия |
42 |
139 |
178 |
|
Германия |
28 |
110 |
102 |
|
Грузия |
42 |
169,3 |
112,4 |
|
Дания |
40 |
114 |
134 |
|
Италия |
34 |
111 |
125 |
|
Казахстан |
61 |
163,4 |
126,7 |
|
Канада |
42 |
121 |
156 |
|
Киргизия |
46 |
134,7 |
83,3 |
|
Китай |
15 |
184 |
420 |
|
Мексика |
22 |
122 |
175 |
|
Нидерланды |
33 |
119 |
129 |
|
Норвегия |
47 |
120 |
130 |
|
Польша |
54 |
140 |
154 |
|
Республика Молдова |
34 |
129,1 |
134,1 |
|
Румыния |
32 |
115 |
132 |
|
Соединенное Королевство Великобритания |
38 |
122 |
146 |
|
США |
58 |
117 |
143 |
|
Таджикистан |
21 |
116,4 |
143,5 |
|
Украина |
51 |
122,7 |
122,6 |
|
Финляндия |
58 |
130 |
154 |
|
Франция |
36 |
115 |
129 |
|
Швеция |
48 |
121 |
129 |
|
Япония |
32 |
105 |
91№ |
Все данные взяты за 2003 год. Данные взяты из статистического сборника Регионы России Социально-экономические показатели.
2003. Федеральная служба государственной статистики Построение модели множественной регрессии
Расчет параметров
Рассчитаем необходимые параметры:
Признак |
Ср. знач. |
СКО |
Характеристики тесноты связи |
вi |
bi |
Коэф-ты частной корр. |
F-критерий фактический |
Табличный F-критерий |
||
y |
131,77 |
22,74 |
Ryx1x2=0,5963 |
|||||||
x1 |
44,9 |
30,41 |
ryx1=0,2152 |
0,2639 |
0,1973 |
0,0672 |
ryx1х2=0,3112 |
Fx1факт=2,8954 |
4,21 |
|
x2 |
146,19 |
60,57 |
ryx2=0,5353 |
0,5583 |
0,2097 |
0,2326 |
ryx2х1=0,5695 |
Fx2факт=12,95 |
4,21 |
|
rx1x2=-0,0872 |
a=92,26 |
rx1х2у=-0,2453 |
Fфакт=7,45 |
3,35 |
Уравнение регрессии в стандартизованном масштабе:
ty =2639tx1+0,5583tx2
Уравнение множественной регрессии в естественной форме:
yтеор =92,26+0,1973x1 +0,2097x2
Рассчитаем по этой формуле теоретические значения динамики ВВП и определим среднюю ошибку аппроксимации. Она равна 9,5254.
Выбор фактора, оказывающего большее влияние
1. Динамика валового накопления основного капитала оказывает большее влияние на динамику ВВП, чем численность студентов, так как
|в2|=0,5583 > |в1|=0,2639.
2. С помощью средних коэффициентов эластичности можно оценить относительную силу влияния динамики валового накопления основного капитала (х2) и числа студентов (х1) на динамику ВВП (у):
=0,0672, =0,2326,
следовательно, с увеличением валового накопления основного капитала на 1% от их среднего значения, динамика ВВП возрастает на 0,23% от своего среднего значения. А при увеличении числа студентов на 1% от своего среднего значения, динамика ВВП увеличится на 0,067% от своего среднего значения. Очевидно, что сила влияния второго фактора (динамики валового накопления основного капитала) на результативный признак (динамику ВВП) значительно больше, чем сила влияния первого фактора (числа студентов).
3.Сравнивая коэффициенты парной и частной корреляции
ryx1 |
0,2152 |
ryx2 |
0,5353 |
|
ryx1x2 |
0,3112 |
ryx2x1 |
0,5695 |
Коэффициенты парной и частной корреляции отличаются незначительно что говорит о слабой межфакторной связи. Связь между динамикой валового накопления основного капитала и динамикой валового внутреннего продукта (связь прямая и средне тесная) выше, чем связь между числом студентов и динамикой ВВП (связь прямая слабая).
4. По коэффициенту множественной корреляции: Rуx1x2=0,5963 можно сделать вывод, что зависимость динамики ВВП от динамики валового накопления основного капитала и числа студентов характеризуется как средне тесная, в которой 59,63% вариации результативного признака определяется вариацией учтённых в модели факторов. Прочие факторы, не включённые в модель, составляют соответственно 35,56% от общей вариации.
4. Так как F - критерий Фишера превышает табличное значение:
Fфакт=7,45 >Fтабл=3,35
то можно говорить о статистической значимости и надёжности уравнения регрессии.
5. Сравнивая частные F - критерии фактические с пороговой константой Fтабл=4,21, делаем вывод: Fх2факт=12,95 > Fтабл, следовательно статистически подтверждена целесообразность включения в модель динамики валового накопления основного капитала, после числа студентов, т.к. этот фактор оказывает большее влияние.
Построение парных моделей регрессии
Представим данные полученные при построении парных моделей в таблице:
Модель |
Aср. |
r (с) |
Уравнение |
Fфакт |
|
Линейная |
10,89 |
0,5353 |
у=102,38+0,201х1 |
11,24 |
|
Степенная |
11,008 |
0,4934 |
у=38,26Чх10,2481 |
9,01 |
|
Показательная |
10,47 |
0,5350 |
у=106,53Ч1,001х1 |
11,23 |
|
Гиперболическая |
12,59 |
0,3786 |
у=165,92-4546,04/х1 |
4,68 |
Определение лучшей модели
1. Недопустимую ошибку аппроксимации имеют все 4 модели, однако у показательной модели она наименьшая, это говорит о том что линейная модель лучше аппроксимирует исходные данные чем остальные модели.
2. У линейной модели теснота связи самая сильная по сравнению с другими моделями. Это говорит о том, что показательная модель лучше подходит к нашим данным.
3. Проверив гипотезу о стат. значимости и надежности, получив значения Fфакт больше табличного во всех случаях, получаем, что все 4 уравнения являются стат. значимыми и надежными. Хотя линейная модель имеет наибольшее Fфакт по сравнению с другими моделями, это говорит о большей точности линейной модели.
По двум показателям линейная модель лучше остальных, это говорит о том, что линейная модель лучше аппроксимирует исходные данные. Однако множественная модель, на мой взгляд, лучше аппроксимирует данные, чем линейная, потому что множественная модель имеет допустимую ошибку аппроксимации и большую тесноту связи.
Проверка предпосылок МНК
1.Первую предпосылку проверим путём вычисления суммы значений остатков:
x1 |
x2 |
y |
x1x2 |
yx1 |
yx2 |
y^x |
y-y^x |
|
64 |
103 |
131,2 |
6592 |
8396,8 |
13513,6 |
126,48 |
4,72 |
|
50 |
169 |
123 |
8450 |
6150 |
20787 |
137,56 |
-14,56 |
|
29 |
115 |
117 |
3335 |
3393 |
13455 |
122,09 |
-5,09 |
|
22 |
103,4 |
177,3 |
2274,8 |
3900,6 |
18332,82 |
118,28 |
59,02 |
|
34 |
263,5 |
184,1 |
8959 |
6259,4 |
48510,35 |
154,21 |
29,89 |
|
195 |
162,2 |
164,9 |
31629 |
32155,5 |
26746,78 |
164,75 |
0,15 |
|
39 |
120 |
115 |
4680 |
4485 |
13800 |
125,11 |
-10,11 |
|
42 |
178 |
139 |
7476 |
5838 |
24742 |
137,87 |
1,13 |
|
28 |
102 |
110 |
2856 |
3080 |
11220 |
119,17 |
-9,17 |
|
42 |
112,4 |
169,3 |
4720,8 |
7110,6 |
19029,32 |
124,11 |
45,19 |
|
40 |
134 |
114 |
5360 |
4560 |
15276 |
128,25 |
-14,25 |
|
34 |
125 |
111 |
4250 |
3774 |
13875 |
125,18 |
-14,18 |
|
61 |
126,7 |
163,4 |
7728,7 |
9967,4 |
20702,78 |
130,86 |
32,54 |
|
42 |
156 |
121 |
6552 |
5082 |
18876 |
133,25 |
-12,25 |
|
46 |
83,3 |
134,7 |
3831,8 |
6196,2 |
11220,51 |
118,80 |
15,90 |
|
15 |
420 |
184 |
6300 |
2760 |
77280 |
183,27 |
0,73 |
|
22 |
175 |
122 |
3850 |
2684 |
21350 |
133,29 |
-11,29 |
|
33 |
129 |
119 |
4257 |
3927 |
15351 |
125,82 |
-6,82 |
|
47 |
130 |
120 |
6110 |
5640 |
15600 |
128,79 |
-8,79 |
|
54 |
154 |
140 |
8316 |
7560 |
21560 |
135,20 |
4,80 |
|
34 |
134,1 |
129,1 |
4559,4 |
4389,4 |
17312,31 |
127,08 |
2,02 |
|
32 |
132 |
115 |
4224 |
3680 |
15180 |
126,25 |
-11,25 |
|
38 |
146 |
122 |
5548 |
4636 |
17812 |
130,37 |
-8,37 |
|
58 |
143 |
117 |
8294 |
6786 |
16731 |
133,69 |
-16,69 |
|
21 |
143,5 |
116,4 |
3013,5 |
2444,4 |
16703,4 |
126,49 |
-10,09 |
|
51 |
122,6 |
122,7 |
6252,6 |
6257,7 |
15043,02 |
128,03 |
-5,33 |
|
58 |
154 |
130 |
8932 |
7540 |
20020 |
135,99 |
-5,99 |
|
36 |
129 |
115 |
4644 |
4140 |
14835 |
126,41 |
-11,41 |
|
48 |
129 |
121 |
6192 |
5808 |
15609 |
128,78 |
-7,78 |
|
32 |
91 |
105 |
2912 |
3360 |
9555 |
117,65 |
-12,65 |
|
сумма |
0,0000 |
2.Случайный характер остатков. Проверим графически:
Из графика зависимости остатков еi от теоретических значений результативного признака видно, что точки распределены случайно, следовательно, еi представляют собой случайные величины и МНК оправдан.
3. Наличие гомоскедастичности. Воспользуемся методом Гольдфельда - Квандта. Число исключаемых центральных наблюдений примем равным 8. Тогда в каждой группе будет по 11 наблюдений. Результаты расчетов представим в таблице:
x1 |
x2 |
y |
x1x2 |
yx1 |
yx2 |
y^x |
y-y^x |
Ai |
(y-y^x)^2 |
|
46 |
83,3 |
134,7 |
3831,8 |
6196,2 |
11220,51 |
132,15 |
2,55 |
1,8961 |
6,52 |
|
32 |
91 |
105 |
2912 |
3360 |
9555 |
128,41 |
-23,41 |
22,2973 |
548,13 |
|
28 |
102 |
110 |
2856 |
3080 |
11220 |
127,98 |
-17,98 |
16,3451 |
323,27 |
|
64 |
103 |
131,2 |
6592 |
8396,8 |
13513,6 |
139,08 |
-7,88 |
6,0058 |
62,09 |
|
22 |
103,4 |
177,3 |
2274,8 |
3900,6 |
18332,82 |
126,24 |
51,06 |
28,7972 |
2606,87 |
|
42 |
112,4 |
169,3 |
4720,8 |
7110,6 |
19029,32 |
133,02 |
36,28 |
21,4308 |
1316,41 |
|
29 |
115 |
117 |
3335 |
3393 |
13455 |
129,22 |
-12,22 |
10,4468 |
149,40 |
|
39 |
120 |
115 |
4680 |
4485 |
13800 |
132,65 |
-17,65 |
15,3447 |
311,40 |
|
51 |
122,6 |
122,7 |
6252,6 |
6257,7 |
15043,02 |
136,51 |
-13,81 |
11,2549 |
190,71 |
|
34 |
125 |
111 |
4250 |
3774 |
13875 |
131,48 |
-20,48 |
18,4460 |
419,23 |
|
61 |
126,7 |
163,4 |
7728,7 |
9967,4 |
20702,78 |
139,87 |
23,53 |
14,4012 |
553,73 |
|
0,0000 |
15,1514 |
6487,74 |
x1 |
x2 |
y |
x1x2 |
yx1 |
yx2 |
y^x |
y-y^x |
Ai |
(y-y^x)^2 |
|
21 |
143,5 |
116,4 |
3013,5 |
2444,4 |
16703,4 |
119,32 |
-2,92 |
2,5060 |
8,51 |
|
38 |
146 |
122 |
5548 |
4636 |
17812 |
124,14 |
-2,14 |
1,7530 |
4,57 |
|
58 |
154 |
130 |
8932 |
7540 |
20020 |
131,22 |
-1,22 |
0,9407 |
1,50 |
|
54 |
154 |
140 |
8316 |
7560 |
21560 |
130,25 |
9,75 |
6,9625 |
95,01 |
|
42 |
156 |
121 |
6552 |
5082 |
18876 |
127,90 |
-6,90 |
5,7020 |
47,60 |
|
195 |
162,2 |
164,9 |
31629 |
32155,5 |
26746,78 |
166,75 |
-1,85 |
1,1203 |
3,41 |
|
50 |
169 |
123 |
8450 |
6150 |
20787 |
133,47 |
-10,47 |
8,5103 |
109,57 |
|
22 |
175 |
122 |
3850 |
2684 |
21350 |
128,35 |
-6,35 |
5,2041 |
40,31 |
|
42 |
178 |
139 |
7476 |
5838 |
24742 |
134,04 |
4,96 |
3,5697 |
24,62 |
|
34 |
263,5 |
184,1 |
8959 |
6259,4 |
48510,35 |
155,95 |
28,15 |
15,2883 |
792,18 |
|
15 |
420 |
184 |
6300 |
2760 |
77280 |
195,01 |
-11,01 |
5,9854 |
121,29 |
|
0,0000 |
5,2311 |
1248,57 |
Величина R=0,1924 (1248,57/6487,74), меньше табличного значения F-критерия, следовательно, наличие гомоскедастичности и отсутствие гетероскедастичности.
4.Отсутствие автокорреляции. Тест Дарбина-Уотсона:
x1 |
x2 |
y |
y^ |
lу-у^l |
(lу-у^l/у)*100 |
у-у^ |
ei-ei-1 |
(ei-ei-1)^2 |
(у-у^)^2 |
|
64 |
103 |
131 |
126,48 |
4,715497 |
3,594 |
-4,715 |
-4,7155 |
22,2 |
22,24 |
|
50 |
169 |
123 |
137,56 |
14,55865 |
11,836 |
14,559 |
19,27414 |
371,5 |
211,95 |
|
29 |
115 |
117 |
122,09 |
5,093094 |
4,353 |
5,093 |
-9,46555 |
89,6 |
25,94 |
|
22 |
103 |
177 |
118,28 |
59,02032 |
33,288 |
-59,020 |
-64,1134 |
4110,5 |
3483,40 |
|
34 |
264 |
184 |
154,21 |
29,88682 |
16,234 |
-29,887 |
29,13349 |
848,8 |
893,22 |
|
195 |
162 |
165 |
164,75 |
0,151302 |
0,092 |
-0,151 |
29,73552 |
884,2 |
0,02 |
|
39 |
120 |
115 |
125,11 |
10,11485 |
8,796 |
10,115 |
10,26615 |
105,4 |
102,31 |
|
42 |
178 |
139 |
137,87 |
1,133281 |
0,815 |
-1,133 |
-11,2481 |
126,5 |
1,28 |
|
28 |
102 |
110 |
119,17 |
9,170267 |
8,337 |
9,170 |
10,30355 |
106,2 |
84,09 |
|
42 |
112 |
169 |
124,11 |
45,18646 |
26,690 |
-45,186 |
-54,3567 |
2954,7 |
2041,82 |
|
40 |
134 |
114 |
128,25 |
14,24733 |
12,498 |
14,247 |
59,43379 |
3532,4 |
202,99 |
|
34 |
125 |
111 |
125,18 |
14,17636 |
12,771 |
14,176 |
-0,07097 |
0,0 |
200,97 |
|
61 |
127 |
163 |
130,86 |
32,53879 |
19,914 |
-32,539 |
-46,7152 |
2182,3 |
1058,77 |
|
42 |
156 |
121 |
133,25 |
12,25437 |
10,128 |
12,254 |
44,79316 |
2006,4 |
150,17 |
|
46 |
83,3 |
135 |
118,80 |
15,89794 |
11,802 |
-15,898 |
-28,1523 |
792,6 |
252,74 |
|
15 |
420 |
184 |
183,27 |
0,725914 |
0,395 |
-0,726 |
15,17202 |
230,2 |
0,53 |
|
22 |
175 |
122 |
133,29 |
11,29077 |
9,255 |
11,291 |
12,01669 |
144,4 |
127,48 |
|
33 |
129 |
119 |
125,82 |
6,817621 |
5,729 |
6,818 |
-4,47315 |
20,0 |
46,48 |
|
47 |
130 |
120 |
128,79 |
8,790167 |
7,325 |
8,790 |
1,972546 |
3,9 |
77,27 |
|
54 |
154 |
140 |
135,20 |
4,796736 |
3,426 |
-4,797 |
-13,5869 |
184,6 |
23,01 |
|
34 |
134 |
129 |
127,08 |
2,015804 |
1,561 |
-2,016 |
2,780932 |
7,7 |
4,06 |
|
32 |
132 |
115 |
126,25 |
11,24923 |
9,782 |
11,249 |
13,26503 |
176,0 |
126,55 |
|
38 |
146 |
122 |
130,37 |
8,368454 |
6,859 |
8,368 |
-2,88077 |
8,3 |
70,03 |
|
58 |
143 |
117 |
133,69 |
16,68649 |
14,262 |
16,686 |
8,318035 |
69,2 |
278,44 |
|
21 |
144 |
116 |
126,49 |
10,08938 |
8,668 |
10,089 |
-6,59711 |
43,5 |
101,80 |
|
51 |
123 |
123 |
128,03 |
5,32814 |
4,342 |
5,328 |
-4,76124 |
22,7 |
28,39 |
|
58 |
154 |
130 |
135,99 |
5,992662 |
4,610 |
5,993 |
0,664522 |
0,4 |
35,91 |
|
36 |
129 |
115 |
126,41 |
11,40967 |
9,921 |
11,410 |
5,417008 |
29,3 |
130,18 |
|
48 |
129 |
121 |
128,78 |
7,777864 |
6,428 |
7,778 |
-3,63181 |
13,2 |
60,50 |
|
32 |
91 |
105 |
117,65 |
12,65349 |
12,051 |
12,653 |
4,875628 |
23,8 |
160,11 |
|
19110,43 |
10002,65 |
Исходя из статистики Дарбина-Уотсона, можно сделать вывод, что автокорреляция отсутствует, так как 1,91 находится в промежутке (1,339;2,661) (d2; 4-d2). Следовательно, значения остатков распределены независимо друг от друга. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии.
Таким образом, не все предпосылки выполнились, это говорит о недостаточной надежности уравнения множественной регрессии. Возможно, можно было бы и получить надежную модель, если исключить из данных страны значение динамики ВВП, которых сильно отличается от других.
Подобные документы
Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.
контрольная работа [68,7 K], добавлен 21.09.2009Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.
контрольная работа [1,2 M], добавлен 05.08.2010Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.
контрольная работа [77,6 K], добавлен 20.07.2010Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Определение наличия зависимости показателя Заработная плата от Возраста и Стажа с использованием корреляционной матрицы. Нормальность распределения остатков по: гистограмме остатков, числовым характеристикам асимметрии и эксцессу, критерию Пирсона.
курсовая работа [1,1 M], добавлен 05.12.2013Составление математической модели для предприятия, характеризующей выручку предприятия "АВС" в зависимости от капиталовложений (млн. руб.) за последние 10 лет. Расчет поля корреляции, параметров линейной регрессии. Сводная таблица расчетов и вычислений.
курсовая работа [862,4 K], добавлен 06.05.2009Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Построение математической модели технологического процесса напыления резисторов методами полного и дробного факторного эксперимента. Составление матрицы планирования. Рандомизация и проверка воспроизводимости. Оценка коэффициентов уравнения регрессии.
курсовая работа [694,5 K], добавлен 27.12.2021