Главная База знаний "Allbest" Экономико-математическое моделирование Множественная регрессия и пошаговая регрессия

Множественная регрессия и пошаговая регрессия

Использование пакета программ статистической обработки данных Statistica. Значение парных коэффициентов корреляции. Выборка, среднее стандартное отклонение. Дисперсионный анализ и регрессионная сумма. Значение критерия Фишера, статистика Дарбина-Уотсона.

Рубрика	Экономико-математическое моделирование
Вид	контрольная работа
Язык	русский
Дата добавления	23.05.2012
Размер файла	1,7 M

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки РФ

Государственное образовательное учреждение высшего профессионального образования

Ульяновский Государственный Технический Университет

Типовой расчет

по дисциплине «Эконометрика»

Тема:

Множественная регрессия и пошаговая регрессия

Вариант № 16

Выполнил:

студент группы БАз-21

Гафурова Л.Ф.

Ульяновск 2011

Содержание:

1.Задание

2.Таблица экспериментальных данных

3. Результаты

3.1 Множественная регрессия

3.1.1 Результаты

3.1.2 Оценка качества

3.1.3 Диагностика соблюдения условия РА-МНК

3.2 Пошаговая регрессия

3.2.1 Результаты

3.2.2 Оценка качества

3.2.3 Диагностика соблюдения условия РА-МНК

Выводы

Графики

Список литературы:

1.Задание

Применить процедуры MR и ПР с Ро

Оценить качество постулируемой (MR) и оптимальной (ПР) моделей по F и R- критериям.

Проверить соблюдение условий РА-МНК для постулируемой и оптимальной модели.

Сделать общие выводы по анализу.

2.Таблица экспериментальных данных

По данным, представленным в таблице, изучается зависимость общего объема кредитования населения города на покупку жилья у от переменных:

Х1 - среднедневной душевой доход, руб.

Х2 - доля расходов на покупку продовольственных товаров в общих расходах

ХЗ - доля общих среднедневных расходов в среднедневных доходах одного работающего

Х4 - средняя цена одного кв. метра площади, тыс. руб.;

Х5 - среднегодовая процентная ставка по ипотечным кредитам, %

№	Y Общий объём кредитования населения города на покупку жилья, млн. руб.	X1Среднедневной душевой доход, руб.	X2 Доля расходов на покупку продовольственных товаров в общих расходах	X3 Доля общих среднедневных расходов в среднедневных доходах одного работающего	X4 Средняя цена одного кв. метра площади, тыс. руб.	X5 Среднегодовая процентная ставка по ипотечным кредитам, %
1.	88,60	217,00	0,76	0,95	47,30	17,80
2.	801,30	604,00	0,84	0,53	37,50	13,80
3.	489,60	339,00	0,74	0,93	41,60	16,00
4.	660,30	429,00	0,65	0,71	41,90	12,90
5.	356,70	587,00	0,54	0,61	44,60	15,00
6.	430,80	604,00	0,65	0,74	47,20	14,00
7.	78,60	166,00	0,68	0,68	36,10	18,00
8.	88,60	127,00	0,85	0,78	36,50	19,00
9.	902,60	715,00	0,89	0,63	36,30	11,50
10.	150,80	219,00	0,58	0,91	36,60	14,00
11.	220,70	507,00	0,41	0,88	31,10	11,00
12.	336,40	668,00	0,47	0,92	47,30	18,00
13.	208,60	319,00	0,71	0,70	37,30	18,00
14.	989,60	357,00	0,83	0,58	57,80	11,00
15.	178,60	258,00	0,62	0,98	37,50	17,90
16.	502,60	339,00	0,85	0,72	40,00	14,00
17.	499,50	361,00	0,81	0,69	51,60	13,00
18.	178,50	208,00	0,65	0,96	41,90	13,80
19.	477,80	329,00	0,36	0,62	43,40	11,50
20.	889,60	730,00	0,38	0,62	44,60	13,90
21.	656,70	507,00	0,38	0,63	45,30	14,00
22.	660,30	587,00	0,52	0,55	47,20	13,30
23.	1030,80	994,00	0,32	0,63	69,30	12,00
24.	800,50	604,00	0,48	0,74	51,40	13,50
25.	301,60	468,00	0,51	0,87	52,80	15,90
26.	623,30	914,00	0,39	0,38	44,60	12,80
27.	526,70	585,00	0,70	0,70	48,30	11,30
28.	450,80	568,00	0,65	0,79	37,80	15,80
29.	589,60	439,00	0,58	0,71	41,90	14,00
30.	778,60	628,00	0,48	0,85	44,60	13,30
31.	1078,50	767,00	0,41	0,42	57,20	13,30
32.	689,60	994,00	0,41	0,58	52,80	14,00
33.	360,30	304,00	0,54	0,71	36,10	19,30
34.	1130,80	987,00	0,68	0,62	67,10	12,00
35.	856,50	639,00	0,36	0,83	45,30	12,50
36.	801,30	604,00	0,84	0,62	37,50	13,80
37.	356,70	587,00	0,54	0,79	44,60	15,00
38.	78,60	209,00	0,68	0,78	36,10	18,00
39.	902,60	258,00	0,89	0,98	36,30	11,50
40.	150,80	208,00	0,58	0,68	36,60	14,00
41.	220,70	404,00	0,41	0,88	31,10	14,00
42.	989,60	868,00	0,83	0,58	57,80	13,80
43.	499,50	528,00	0,81	0,69	51,60	11,50
44.	656,70	507,00	0,38	0,63	45,30	13,50
45.	1030,80	1094,00	0,22	0,53	69,30	11,30
46.	800,50	604,00	0,48	0,74	51,40	13,30
47.	450,80	568,00	0,65	0,79	37,80	12,00
48.	778,60	628,00	0,36	0,62	44,60	13,80
49.	689,60	994,00	0,32	0,63	41,90	14,00
50.	360,30	304,00	0,39	0,70	36,10	19,30
51.	1130,80	908,00	0,41	0,62	36,30	12,00
52.	856,50	639,00	0,84	0,68	37,30	13,80
53.	660,30	429,00	0,74	0,71	43,40	15,00
54.	430,80	639,00	0,89	0,74	69,30	19,00
55.	88,60	266,00	0,81	0,78	41,90	18,00
56.	902,60	619,00	0,69	0,93	67,10	17,90
57.	989,60	994,00	0,83	0,78	44,60	11,50
58.	178,60	294,00	0,92	0,98	31,10	17,90
59.	477,80	639,00	0,36	0,62	43,40	11,50
60.	889,60	730,00	0,38	0,63	44,60	13,90

3. Результаты

Решение данного типового расчета осуществлялось с использованием пакета программ статистической обработки данных STATISTICA.

3.1Множественная регрессия

3.1.1 Результаты

Зададим зависимую переменную Y и независимые X1, Х2, Х3, Х4, Х5 Итоги анализа с использованием пакета STATISTICA

Результаты множ. регрессии

Зав.перем.:Y Множест. R = ,82291525 F = 22,65616

R2= ,67718950 сс = 5,54

Число набл.: 60 скоррект.R2= ,64729964 p = ,000000

Стандартная ошибка оценки:184,39683277

Своб.член: 608,02662453 Ст.ошибка: 273,7725 t( 54) = 2,2209 p = ,0306

X1 бета=,501 X2 бета=,153 X3 бета=-,12

X4 бета=,166 X5 бета=-,32

(выделены значимые бета)

Программа выделяет значимые регрессоры. Значимыми оказались X1 и Х5.

Объем выборки, среднее стандартное отклонение:

Means

Std.Dev.

N

X1

543,1667

244,6487

60

X2

0,5988

0,1909

60

X3

0,7210

0,1375

60

X4

44,9467

9,5387

60

X5

14,3400

2,4282

60

Y

573,9450

310,4921

60

Стандартное отклонение показывает вариацию признака относительно среднего значения.

Матрица корреляций:

X1

X2

X3

X4

X5

Y

X1

1,000000

-0,382598

-0,524580

0,529433

-0,477591

0,742958

X2

-0,382598

1,000000

0,285537

-0,129108

0,216740

-0,161846

X3

-0,524580

0,285537

1,000000

-0,285167

0,372517

-0,500947

X4

0,529433

-0,129108

-0,285167

1,000000

-0,167995

0,497819

X5

-0,477591

0,216740

0,372517

-0,167995

1,000000

-0,594804

Y

0,742958

-0,195242

-0,500947

0,497819

-0,602422

1,000000

Матрица корреляций показывает значение парных коэффициентов корреляции между откликом и факторами и межфакторной корреляции. Парные коэффициенты корреляции rx1x2, rx1x3, rx1x4, rx1x5 значительно отличаются от нуля, значит присутствует мультиколлинеарность.

Дисперсионный анализ:

Sums of

df

Mean

F

p-level

Regress.

3851796

5

770359,1

22,65616

0,000000

Residual

1836118

54

34002,2

Total

5687914

Дисперсионный анализ - статистический метод, позволяющий анализировать влияние различных факторов (признаков) на исследуемую (зависимую) переменную. Так как F = 22,65616- значение статистики, р = 0- вероятность слишком мала, чтобы поверить в истинность гипотезы Н0 об отсутствии влияния факторов. Вывод: факторы X1, Х2, Х3, Х4, Х5 влияют на переменную У.

Регрессионная сумма:

Beta

Std.Err.

B

Std.Err.

t(54)

p-level

Intercept

608,02662

273,77249

2,22092

0,03057

X1

0,50127

0,11467

0,63617

0,14553

4,37136

0,00006

X2

0,15334

0,08457

249,35156

137,52001

1,81320

0,07536

X3

-0,11624

0,09261

-262,50298

209,12788

-1,25523

0,21480

X4

0,16574

0,09218

5,39506

3,00037

1,79813

0,07775

X5

-0,31749

0,08982

-40,59804

11,48574

-3,53465

0,00085

В столбце Beta показаны стандартизованные коэффициенты регрессии, а в столбце В - нестандартизованные.

Стандартизированные коэффициенты Beta позволяют провести ранжирование предикторов по степени их влияния на отклик. Из таблицы следует, что предикторы можно проранжировать по степени влияния на отклик в следующем порядке:X1, X5, X4, X2, X3 В этой таблице немаловажное значение имеет p-level - показатель, находящийся в убывающей зависимости от надежности результата. Более высокий p-level соответствует более низкому уровню доверия к найденной в выборке зависимости между переменными. P-level не должен превышать 0,05. В нашем случае удовлетворяют условию регрессоры Х1 и Х5. Метод можно улучшить, исключив незначимые факторы. Искомая модель имеет вид:

Y=608,02662+0,63617X1+249,35156 X2-262,50298X3+5,39506X4-40,59804X5

Статистика Дарбина - Уотсона:

Durbin-

Serial

Estimate

1,950929

0,007937

Статистика Дарбина-Уотсона имеет небольшое значение (1,950929) при умеренной сериальной корреляции (0,007937). Это свидетельствует о некоторой зависимости наблюдений, следовательно, можно говорить о недостаточной устойчивости некоторых значений коэффициентов регрессии, а значит о невысокой адекватности модели изучаемому процессу.

3.1.2 Оценка качества

Так как фактическое значение критерия Фишера больше, чем табличное, то необходимо сделать вывод о значимости модели уравнения регрессии, исследуемая зависимая переменная хорошо описывается переменными X1 и Х5. Из приведенных результатов анализа следует, что зависимость между откликом и предикторами высокая (0,7<R=0,82291525<0,9). Свободный член является статистически значим (p=0,03057<0,05).

3.1.3 Диагностика соблюдения условия РА-МНК

Проверим соблюдение основных предположений РА <2.1> - <5.2>.

Соблюдение предположений <1.1> - <1.4> экспериментатор старается обеспечить при организации эксперимента.

<2.1> В случае с множественной регрессией модель избыточна, т.к. для регрессоров Х2, ХЗ, Х4 р-level превышает уровень значимости = 0,05, не превышает только для Х1, Х5.

<2.2> Специальных признаков нарушения <2.2> не существует. Косвенными признаками могут быть признаки нарушения предположения <3.1>, а именно, значимые коэффициенты парной корреляции.

<3.1> Нарушение этого предположения трактуется как явление мультиколлинеарности. Наиболее часто мультиколлинеарность обнаруживается по коэффициентам парной корреляции ХУ матрицы R.

статистический регрессионный выборка отклонение

X1

X2

X3

X4

X5

Y

X1

1,000000

-0,382598

-0,524580

0,529433

-0,477591

0,742958

X2

-0,382598

1,000000

0,285537

-0,129108

0,216740

-0,161846

X3

-0,524580

0,285537

1,000000

-0,285167

0,372517

-0,500947

X4

0,529433

-0,129108

-0,285167

1,000000

-0,167995

0,497819

X5

-0,477591

0,216740

0,372517

-0,167995

1,000000

-0,594804

Y

0,742958

-0,195242

-0,500947

0,497819

-0,602422

1,000000

Парные коэффициенты корреляции rx1x2, rx1x3, rx1x4, rx1x5 значительно отличаются от нуля, значит присутствует мультиколлинеарность.

<3.2> О нарушении условия неслучайности rij можно судить по косвенному признаку - резкому различию между внутренней и внешней точности прогноза.

<4.1> Обычно нарушение предположения об аддитивности е происходит при переходе от нелинейной по модели (внутренне линейной) к линейной. В данном примере мы имеем дело с линейной моделью.

<4.2> Ошибки , распределены нормально, что видно из графиков: за пределами полосы З? точек нет.

<4.3> Условие М[], = 0, не требует особого внимания при наличии 0 в модели.

<4.4> Как видно из графиков, условие однородности наблюдений не нарушается.

<4.5> Авторегрессия положительна, т.к. D находится в интервале 0-2:

Durbin-

Serial

Estimate

1,950929

0,007937

<5.1> Основным признаком нарушения условия о точной идентификации является несоблюдение условия <3.1>. Формальным признаком является применение неполного метода перебора.

<5.2> Для многооткликовой задачи правомерно применение МНК к каждой из регрессий в отдельности. В данном случае модели однооткликовые.

3.2 Пошаговая регрессия

3.2.1 Результаты

Зададим зависимую переменную Y и независимые X1, Х2, Х3, Х4, Х5 Итоги анализа с использованием пакета STATISTICA

Шаг 0

Результаты множ. регрессии(Шаг 0)

Зав.перем.:Y Множест. R = ,82291525 F = 22,65616

R2= ,67718950 сс = 5,54

Число набл.: 60 скоррект.R2= ,64729964 p = ,000000

Стандартная ошибка оценки:184,39683277

Своб.член: 608,02662453 Ст.ошибка: 273,7725 t( 54) = 2,2209 p = ,0306

X1 бета=,501 X2 бета=,153 X3 бета=-,12

X4 бета=,166 X5 бета=-,32

(выделены значимые бета)

Шаг 1

Результаты множ. регрессии(Шаг 1)

Зав.перем.:Y Множест. R = ,81717234 F = 27,63707

R2= ,66777064 сс = 4,55

Число набл.: 60 скоррект.R2= ,64360850 p = ,000000

Стандартная ошибка оценки:185,35921149

Своб.член: 425,37895333 Ст.ошибка: 233,1118 t( 55) = 1,8248 p = ,0735

X1 бета=,547 X2 бета=,142 X4 бета=,170

X5 бета=-,34

(выделены значимые бета)

Уравнение регрессии значимо, так как Ft(4,55)<Ff=27,63707

Шаг 2

Результаты множ. регрессии(Шаг 2)

Зав.перем.:Y Множест. R = ,80665645 F = 34,77272

R2= ,65069463 сс = 3,56

Число набл.: 60 скоррект.R2= ,63198184 p = ,000000

Стандартная ошибка оценки:188,35846060

Своб.член: 575,72466483 Ст.ошибка: 218,7626 t( 56) = 2,6317 p = ,0110

X1 бета=,487 X4 бета=,184 X5 бета=-,33

(выделены значимые бета)

Уравнение статистически значимо, так как Ft(3,56)<Ff=34,77272

Шаг 3

Результаты множ. регрессии(шаг 3, оконч. решение)

другие F-исключить не выше указ. значения

Зав.перем.:Y Множест. R = ,79157512 F = 47,82385

R2= ,62659117 сс = 2,57

Число набл.: 60 скоррект.R2= ,61348911 p = ,000000

Стандартная ошибка оценки:193,03291779

Своб.член: 734,19552600 Ст.ошибка: 208,4142 t( 57) = 3,5228 p = ,0008

X1 бета=,594 X5 бета=-,31

(выделены значимые бета)

Уравнение статистически значимо, так как Ft(2,57)<Ff=47,82385

Программа выделяет значимые регрессоры. Значимыми оказались Х1 и Х5. Значения коэффициента детерминации R, близкое к единице, говорит о хорошем приближении линии регрессии к наблюдаемым данным и о возможности построения качественного прогноза.

Регрессионная сумма:

Beta

Std.Err.

B

Std.Err.

t(57)

p-level

Intercept

734,19553

208,41417

3,52277

0,00085

X1

0,59448

0,09212

0,75448

0,11692

6,45308

0,00000

X5

-0,31088

0,09212

-39,75302

11,77997

-3,37463

0,00134

На третьем шаге нами получена оптимальная искомая модель:

Y=734,19553+0,75448 X1-39,75302X5

Дисперсионный анализ:

Sums of

df

Mean

F

p-level

Regress.

3563997

2

1781998

47,82385

0,000000

Residual

2123917

57

37262

Total

5687914

Статистика Дарбина - Уотсона:

Durbin-

Serial

Estimate

2,005139

-0,010950

3.2.2 Оценка качества

Так как фактическое значение критерия Фишера больше, чем табличное, то необходимо сделать вывод о значимости модели уравнения регрессии, исследуемая зависимая переменная хорошо описывается переменными X1 и Х5. Из приведенных результатов (0,7<R=0,79157512<0,9). Свободный член статистически значим (p=0,00085.

3.2.3 Диагностика соблюдения условия РА-МНК

Проверим соблюдение основных предположений РА <2.1> - <5.2>.

Соблюдение предположений <1.1> - <1.4> экспериментатор старается обеспечить при организации эксперимента.

<2.1> В случае с пошаговой регрессией модель неизбыточна, т.к. для регрессоров Х1, Х5, р-level не превышает уровень значимости = 0,05.

<2.2> Специальных признаков нарушения <2.2> не существует. Косвенными признаками могут быть признаки нарушения предположения <3.1>, а именно, значимые коэффициенты парной корреляции.

<3.1> Нарушение этого предположения трактуется как явление мультиколлинеарности. Наиболее часто мультиколлинеарность обнаруживается по коэффициентам парной корреляции ху матрицы R.

X1

X5

Y

X1

1,00000

-0,48528

0,74296

X5

-0,48528

1,00000

-0,60242

Y

0,74296

-0,60242

1,00000

Парный коэффициент корреляции rx1x5,значительно отличается от нуля, значит присутствует мультиколлинеарность.

<3.2> О нарушении условия неслучайности rij можно судить по косвенному признаку - резкому различию между внутренней и внешней точности прогноза.

<4.1> Обычно нарушение предположения об аддитивности е происходит при переходе от нелинейной по модели (внутренне линейной) к линейной. В данном примере мы имеем дело с линейной моделью.

<4.2> Ошибки , распределены нормально, что видно из графиков: за пределами полосы З? точек нет.

<4.3> Условие М[], = 0, не требует особого внимания при наличии 0 в модели.

<4.4> Как видно из графиков, условие однородности наблюдений не нарушается.

<4.5> Авторегрессия незначительна, т.к. D близко к 2.

Durbin-

Serial

Estimate

2,005139

-0,010950

<5.1> Основным признаком нарушения условия о точной идентификации является несоблюдение условия <3.1>. Формальным признаком является применение неполного метода перебора.

<5.2> Для многооткликовой задачи правомерно применение МНК к каждой из регрессий в отдельности. В данном случае модели однооткликовые.

Выводы

Вывод для множественной регрессии.

В настоящее время множественная регрессия - один из наиболее распространённых методов в эконометрике. Основная цель множественной регрессии -- построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, в также совокупное их воздействие на моделируемый показатель. В нашем примере мы получили следующую модель:

Y=608,02662+0,63617X1+249,35156 X2-262,50298X3+5,39506X4-40,59804X5

Проанализировав эту модель мы можем сделать выводы. Коэффициенты регрессии при переменной X1 показывает, что с ростом среднедневного душевого дохода на 1 ед. общий объем кредитования растет в среднем на 0,636 млн. руб., с ростом, при переменной X5 показывает, что с ростом среднегодовой процентной ставки по ипотечным кредитам на 1 % общий объем кредитования снижается в среднем на 40,598 млн. руб.

Проанализируем качество постулируемой модели.

Значимость уравнения множественной регрессии в целом оценим с помощью F -критерия Фишера. Задача состоит в проверке нулевой гипотезы Но о статистической не значимости уравнения регрессии в целом. Анализ выполняется при сравнении фактического и табличного значения F-критерия Фишера Fтабл и Fфакт. Сравнивая Fтабл и Fфакт. получим:

Fфакт. = 22,65616; Fтабл (5,54)=2,39, следовательно Fфакт.> Fтабл . С вероятностью

1-?=0,95 приходим к выводу о необходимости отклонить гипотезу Но и делаем заключение о статистической значимости уравнения.

Оценим уравнение регрессии о возможности использовать для прогноза. Для этого воспользуемся следующей формулой: Fфакт.>4Fтабл. В нашем уравнении: Fфакт =22,65616, а 4Fтабл=4·2,39=9,56, следовательно с вероятностью 1-?=0,95 приходим к выводу о значимости уравнения в целом и уравнение следует использовать для прогноза.

Оценим модель по коэффициенту детерминации. Для оценки качества подбора функции рассчитывается коэффициент детерминации (R2). Величина коэффициента детерминации служит одним из критериев оценки качества модели. Он характеризует долю дисперсии результативного признака Y объясняемую регрессией в общей дисперсии результативного признака. В нашем случае R2 = 0, 67906710.

Следовательно уравнением регрессии объясняется 68%, дисперсии результативного признака, а на долю прочих факторов приходится 32% ее дисперсии.

Результаты диагностики:

По результатам диагностики <2.1> мы можем сделать следующий вывод, что модель линейна по ; в ней нет лишних слагаемых и все регрессоры присутствуют.

Результаты диагностики <3.1 >. По значениям коэффициентов парной корреляции мультиколлениарность обнаружена (коэффициенты rx1x2, rx1x3, rx1x4, rx1x5 значимо отличаются от нуля)

Результаты диагностики <4.2>. Данное нарушение проверили по графикам остатков. Сделаем вывод о том, что условие не нарушено

Результаты диагностики <4.4>. Данное нарушение проверили по графикам остатков. Явного нарушения условия нет.

Результаты диагностики <4.5>. Для проверки данного условия независимости ошибок из-за неучёта фактора времени воспользуемся графиком остатков (d,T), где Т - время или номер наблюдения, а также статистику Дарбина - Уотсона. В нашем примере Авторегрессия положительна, т.к. D находится в интервале 0-2.

Выводы для пошаговой регрессии.

Во втором случае, когда используем пошаговую регрессию, регрессоры Х2, Х3, Х4 оказались не значимыми. Результат улучшения модели:

Y=734,19553+0,75448 X1-39,75302X5

Проанализируем качество постулируемой модели.

Значимость уравнения множественной регрессии в целом оценим с помощью F -критерия Фишера. Задача состоит в проверке нулевой гипотезы Но о статистической не значимости уравнения регрессии в целом. Анализ выполняется при сравнении фактического и табличного значения F-критерия Фишера Fтабл и Fфакт. Сравнивая Fтабл и Fфакт. получим:

Fфакт. = 47,82385, a Fтабл (2,57)=3,16, следовательно Fфакт.> Fтабл С вероятностью 1-?=0,95 приходим к выводу о необходимости отклонить гипотезу Но и делаем заключение о статистической значимости уравнения.

Оценим уравнение регрессии о возможности использовать для прогноза. Для этого воспользуемся следующей формулой: Fфакт.>4Fтабл. В нашем уравнении: Fфакт =47,82385, а 4Fтабл=4·3,16=12,64, следовательно с вероятностью 1-?=0,95 приходим к выводу о значимости уравнения в целом и уравнение следует использовать для прогноза.

Оценим модель по коэффициенту детерминации. Для оценки качества подбора функции рассчитывается коэффициент детерминации (R2). Величина коэффициента детерминации служит одним из критериев оценки качества модели. Он характеризует долю дисперсии результативного признака Y объясняемую регрессией в общей дисперсии результативного признака. В нашем случае R2 =0,62659117.

Следовательно уравнением регрессии объясняется 63%, .дисперсии результативного признака, а на долю прочих факторов приходится 37% ее дисперсии.

Результаты диагностики:

По результатам диагностики <2.1> мы можем сделать следующий вывод, что модель линейна по ; в ней нет лишних слагаемых и все регрессоры присутствуют.

Результаты диагностики <3.1 >. По значениям коэффициентов парной корреляции мультиколлениарность обнаружена (коэффициенты rx1x5 значимо отличается от нуля)

Результаты диагностики <4.2>. Данное нарушение проверили по графикам остатков. Сделаем вывод о том, что условие не нарушено

Результаты диагностики <4.4>. Данное нарушение проверили по графикам остатков. Явного нарушения условия нет.

Результаты диагностики <4.5>. Для проверки данного условия независимости ошибок из-за неучёта фактора времени воспользуемся графиком остатков (d,T), где Т - время или номер наблюдения, а также статистику Дарбина - Уотсона. В нашем примере авторегрессия положительна, т.к. D находится в интервале 0-2.

Вывод: Модель, полученная в результате пошаговой регрессии предпочтительнее, т.к. в ней нет лишних слагаемых и все регрессоры значимы. Авторегрессия для данной модели незначительна.

Графики

Диаграммы рассеяния

Графики остатков

Список литературы

1. Валеев С.Г. Регрессионное моделирование при обработке данных. - Казань: ФЭН. 2001.-296 с.

2. Валеев С.Г., Куркина С.В. Эконометрика - Ульяновск: УлГТУ, 2008-99с.

Размещено на Allbest.ru

контрольная работа "Множественная регрессия и пошаговая регрессия" скачать

Подобные документы

Использование критерия Дарбина–Уотсона и оценка качества эконометрической модели с использованием коэффициента детерминации
Публикация данных: источники информации и влияние факторов на деятельность. Статистическая автокоррелированность ряда и проверка ее порядков, статистика Дарбина–Уотсона. Регрессионные зависимости и леммы эконометрической модели, доверительный интервал.

практическая работа [327,4 K], добавлен 15.03.2009
Парная и множественная регрессия и корреляция
Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.

контрольная работа [3,6 M], добавлен 29.05.2010
Эконометрика
Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.

контрольная работа [1,6 M], добавлен 14.05.2008
Зависимость цены от качества
Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

лабораторная работа [30,9 K], добавлен 05.12.2010
Основы эконометрики
Взаимосвязи экономических переменных. Понятие эконометрической модели. Коэффициент корреляции и его свойства. Линейная парная регрессия. Метод наименьших квадратов. Основные предпосылки и принципы регрессионного анализа. Статистика Дарбина-Уотсона.

шпаргалка [142,4 K], добавлен 22.12.2011
Множественная линейная регрессия
Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.

контрольная работа [179,4 K], добавлен 25.03.2014
Уравнения регрессии. Коэффициент эластичности, корреляции, детерминации и F-критерий Фишера
Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

контрольная работа [681,9 K], добавлен 03.08.2010
Корреляционный и регрессионный анализ
Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

контрольная работа [141,3 K], добавлен 05.05.2010
Исследование проблемы автокорреляции (первого порядка) случайных отклонений с помощью теста Сведа-Эйзенхарта и статистики Дарбина-Уотсона, а также графических методов
Статистическая адекватность и проверка модели линейной регрессии на мультиколлинеарность. Исследование автокорреляции с помощью критерия Дарбина-Уотсона, тестов Сведа-Эйзенхарта и Бреуша-Годфри. Анализ гетероскедастичности и корректировка модели.

курсовая работа [1,5 M], добавлен 29.03.2015
Множественная регрессия и корреляция
Методика расчета параметров множественной регрессии и корреляции. Тест на выбор "длинной" или "короткой" регрессии. Тест Чоу на однородность зависимости объясняемой переменной от объясняющих. Тест Бреуша – Пагана. Тест Дарбина на наличие автокорреляции.

лекция [40,3 K], добавлен 13.02.2011

Другие документы, подобные "Множественная регрессия и пошаговая регрессия"

весь список подобных работ

скачать работу можно здесь

сколько стоит заказать работу?

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.

	Means	Std.Dev.	N
X1	543,1667	244,6487	60
X2	0,5988	0,1909	60
X3	0,7210	0,1375	60
X4	44,9467	9,5387	60
X5	14,3400	2,4282	60
Y	573,9450	310,4921	60

	X1	X2	X3	X4	X5	Y
X1	1,000000	-0,382598	-0,524580	0,529433	-0,477591	0,742958
X2	-0,382598	1,000000	0,285537	-0,129108	0,216740	-0,161846
X3	-0,524580	0,285537	1,000000	-0,285167	0,372517	-0,500947
X4	0,529433	-0,129108	-0,285167	1,000000	-0,167995	0,497819
X5	-0,477591	0,216740	0,372517	-0,167995	1,000000	-0,594804
Y	0,742958	-0,195242	-0,500947	0,497819	-0,602422	1,000000

	Sums of	df	Mean	F	p-level
Regress.	3851796	5	770359,1	22,65616	0,000000
Residual	1836118	54	34002,2
Total	5687914

	Beta	Std.Err.	B	Std.Err.	t(54)	p-level
Intercept			608,02662	273,77249	2,22092	0,03057
X1	0,50127	0,11467	0,63617	0,14553	4,37136	0,00006
X2	0,15334	0,08457	249,35156	137,52001	1,81320	0,07536
X3	-0,11624	0,09261	-262,50298	209,12788	-1,25523	0,21480
X4	0,16574	0,09218	5,39506	3,00037	1,79813	0,07775
X5	-0,31749	0,08982	-40,59804	11,48574	-3,53465	0,00085

	X1	X5	Y
X1	1,00000	-0,48528	0,74296
X5	-0,48528	1,00000	-0,60242
Y	0,74296	-0,60242	1,00000

Множественная регрессия и пошаговая регрессия

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

1.Задание

Применить процедуры MR и ПР с Ро

Оценить качество постулируемой (MR) и оптимальной (ПР) моделей по F и R- критериям.

Проверить соблюдение условий РА-МНК для постулируемой и оптимальной модели.

Сделать общие выводы по анализу.

2.Таблица экспериментальных данных

По данным, представленным в таблице, изучается зависимость общего объема кредитования населения города на покупку жилья у от переменных:

Х1 - среднедневной душевой доход, руб.

Х2 - доля расходов на покупку продовольственных товаров в общих расходах

ХЗ - доля общих среднедневных расходов в среднедневных доходах одного работающего

Х4 - средняя цена одного кв. метра площади, тыс. руб.;

Х5 - среднегодовая процентная ставка по ипотечным кредитам, %

3. Результаты

Решение данного типового расчета осуществлялось с использованием пакета программ статистической обработки данных STATISTICA.

3.1Множественная регрессия

3.1.1 Результаты

Зададим зависимую переменную Y и независимые X1, Х2, Х3, Х4, Х5 Итоги анализа с использованием пакета STATISTICA

Результаты множ. регрессии

Зав.перем.:Y Множест. R = ,82291525 F = 22,65616

R2= ,67718950 сс = 5,54

Число набл.: 60 скоррект.R2= ,64729964 p = ,000000

Стандартная ошибка оценки:184,39683277

Своб.член: 608,02662453 Ст.ошибка: 273,7725 t( 54) = 2,2209 p = ,0306

X1 бета=,501 X2 бета=,153 X3 бета=-,12

X4 бета=,166 X5 бета=-,32

(выделены значимые бета)

Программа выделяет значимые регрессоры. Значимыми оказались X1 и Х5.

Объем выборки, среднее стандартное отклонение:

Стандартное отклонение показывает вариацию признака относительно среднего значения.

Матрица корреляций:

Дисперсионный анализ:

Регрессионная сумма:

В столбце Beta показаны стандартизованные коэффициенты регрессии, а в столбце В - нестандартизованные.

Y=608,02662+0,63617X1+249,35156 X2-262,50298X3+5,39506X4-40,59804X5

Статистика Дарбина - Уотсона:

3.1.2 Оценка качества

3.1.3 Диагностика соблюдения условия РА-МНК

Проверим соблюдение основных предположений РА <2.1> - <5.2>.

Соблюдение предположений <1.1> - <1.4> экспериментатор старается обеспечить при организации эксперимента.

<2.1> В случае с множественной регрессией модель избыточна, т.к. для регрессоров Х2, ХЗ, Х4 р-level превышает уровень значимости = 0,05, не превышает только для Х1, Х5.

статистический регрессионный выборка отклонение

Парные коэффициенты корреляции rx1x2, rx1x3, rx1x4, rx1x5 значительно отличаются от нуля, значит присутствует мультиколлинеарность.

<3.2> О нарушении условия неслучайности rij можно судить по косвенному признаку - резкому различию между внутренней и внешней точности прогноза.

<4.2> Ошибки , распределены нормально, что видно из графиков: за пределами полосы З? точек нет.

<4.3> Условие М[], = 0, не требует особого внимания при наличии 0 в модели.

<4.4> Как видно из графиков, условие однородности наблюдений не нарушается.

<4.5> Авторегрессия положительна, т.к. D находится в интервале 0-2:

<5.2> Для многооткликовой задачи правомерно применение МНК к каждой из регрессий в отдельности. В данном случае модели однооткликовые.

3.2 Пошаговая регрессия

3.2.1 Результаты

Зададим зависимую переменную Y и независимые X1, Х2, Х3, Х4, Х5 Итоги анализа с использованием пакета STATISTICA

Шаг 0

Результаты множ. регрессии(Шаг 0)

Зав.перем.:Y Множест. R = ,82291525 F = 22,65616

R2= ,67718950 сс = 5,54

Число набл.: 60 скоррект.R2= ,64729964 p = ,000000

Стандартная ошибка оценки:184,39683277

Своб.член: 608,02662453 Ст.ошибка: 273,7725 t( 54) = 2,2209 p = ,0306

X1 бета=,501 X2 бета=,153 X3 бета=-,12

X4 бета=,166 X5 бета=-,32

(выделены значимые бета)

Шаг 1

Результаты множ. регрессии(Шаг 1)

Зав.перем.:Y Множест. R = ,81717234 F = 27,63707

R2= ,66777064 сс = 4,55

Число набл.: 60 скоррект.R2= ,64360850 p = ,000000

Стандартная ошибка оценки:185,35921149

Своб.член: 425,37895333 Ст.ошибка: 233,1118 t( 55) = 1,8248 p = ,0735

X1 бета=,547 X2 бета=,142 X4 бета=,170

X5 бета=-,34

(выделены значимые бета)

Уравнение регрессии значимо, так как Ft(4,55)<Ff=27,63707

Шаг 2

Результаты множ. регрессии(Шаг 2)

Зав.перем.:Y Множест. R = ,80665645 F = 34,77272

R2= ,65069463 сс = 3,56

Число набл.: 60 скоррект.R2= ,63198184 p = ,000000

Стандартная ошибка оценки:188,35846060