Построение и анализ модели множественной регрессии

Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 17.01.2016
Размер файла 243,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Построение и анализ модели множественной регрессии

По исходным данным требуется:

1. Построить классическую линейную модель множественной регрессии, выполнить экономический анализ основных показателей модели: коэффициентов "чистой" регрессии, индекса корреляции, индекса детерминации, оценить значимость модели в целом (F-критерий Фишера) и отдельных ее параметров (t-статистика Стьюдента).

2. Проанализировать матрицу парных коэффициентов корреляции на наличие мультиколлинеарности. Если мультиколлинеарность присутствует - устранить (или ослабить) ее методом пошагового отбора переменных.

3. Построить линейную модель регрессии только со значимыми факторами (на основании выводов, сделанных в п.п. 1 и 2). Дать экономическую интерпретацию коэффициентов модели. Оценить качество построенной модели (индексы корреляции и детерминации, F-критерий Фишера, средняя относительная ошибка аппроксимации). Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности, в- и Д- коэффициентов.

4. Построить и проанализировать линейную модель парной регрессии с наиболее значимым фактором. Сравнить качество моделей, построенных в п.п. 3 и 4.

5. Осуществить прогнозирование (точечный прогноз и доверительный интервал прогноза) среднего значения показателя Y при уровне значимости = 0,1 при условии, что прогнозное значения фактора X составит 80% от его максимального значения (для однофакторной модели).

6. Представить графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).

Изучите зависимость стоимости квартиры от ряда основных факторов.

Таблица 1 - Исходные данные

№ п/п

Х1 - общая площадь квартиры (м2)

X2 - жилая площадь квартиры (м2)

X3 - тип дома (1 - кирпичный, 0 - другой)

X4 - наличие балкона (1 - есть, 0 - нет)

Y - цена квартиры, тыс. долл.

1

39,0

20,0

0

1

15,9

2

68,4

40,5

0

1

27,0

3

34,8

16,0

0

1

13,5

4

39,0

20,0

0

1

15,1

5

54,7

28,0

0

1

21,1

6

74,7

46,3

0

1

28,7

7

71,1

45,9

0

0

27,2

8

74,5

47,5

0

0

28,3

9

137,7

87,2

0

1

52,3

10

40,0

17,7

1

1

22,0

11

53,0

31,1

1

1

28,0

12

86,0

48,7

1

1

45,0

13

98,0

65,8

1

1

51,0

14

62,6

21,4

1

1

34,4

15

45,3

20,6

1

1

24,7

16

56,4

29,7

1

1

30,8

17

37,0

17,8

0

1

15,9

18

67,5

43,5

0

1

29,0

19

37,0

17,8

0

1

15,4

20

69,0

42,4

0

1

28,6

21

40,0

20,0

0

0

15,6

22

69,1

41,3

0

1

27,7

23

68,1

35,4

1

1

34,1

24

75,3

41,4

1

1

37,7

25

83,7

48,5

1

1

41,9

26

48,7

22,3

1

1

24,4

27

39,9

18,0

1

0

21,3

28

68,6

35,5

1

1

36,7

29

39,0

20,0

1

0

21,5

30

48,6

31,0

1

0

26,4

регрессия корреляция интервал прогноз

Решение

Линейная модель множественной регрессии имеет вид:

,

где - расчётные значения исследуемой переменной,

- факторные переменные.

- коэффициенты уравнения, каждый из которых показывает, насколько изменится значение исследуемого признака при изменении соответствующего фактора на 1 при неизменных прочих факторных переменных.

Рассмотрим факторные признаки для построения регрессионной модели.

Цена квартиры - это зависимая переменная Y;

Независимые объясняющие переменные:

- общая площадь квартиры Х1;

- жилая площадь квартиры Х2;

- тип дома Х3;

- наличие балкона Х4

1. Построим классическую модель множественной регрессии

Классическая линейная модель множественной регрессии можно представить в виде:

Проведем регрессивный анализ, используя инструмент Excel "Регрессия" (Сервис - Анализ данных - Регрессия).

Таблица 2 - Протокол выполнения регрессивного анализа многофакторной модели

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,9899

R-квадрат

0,9800

Нормированный R-квадрат

0,9768

Стандартная ошибка

1,5612

Наблюдения

30

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

4

2979,3358

744,8339

305,5792

7,88E-21

Остаток

25

60,9362

2,4374

Итого

29

3040,2720

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

-1,4274

1,0985

-1,2994

0,2057

-3,6897

0,8350

-3,6897

0,8350

Переменная X 1

0,3541

0,0663

5,3387

0,0000

0,2175

0,4907

0,2175

0,4907

Переменная X 2

0,0743

0,0905

0,8207

0,4196

-0,1121

0,2607

-0,1121

0,2607

Переменная X 3

8,1470

0,6364

12,8010

0,0000

6,8363

9,4578

6,8363

9,4578

Переменная X 4

1,6286

0,7845

2,0759

0,0483

0,0129

3,2443

0,0129

3,2443

Из анализа получаем коэффициенты уравнения.

Уравнение регрессии зависимости цены квартиры от независимых объясняющих переменных принимает вид:

y = -1,4274 + 0,3541 x1 + 0,0743 x2 + 8,1470 x3 + 1,6286 x4

Оценим качество модели.

Определим коэффициент детерминации.

R2 =

Коэффициент детерминации показывает, что около 98% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.

Коэффициент множественной корреляции R = 0,9899

Он показывает высокую тесноту связи зависимой переменной Y с двумя включенными в модель объясняющими факторами.

Оценим значимость модели в целом на основе вычисления F-критерия Фишера.

По данным дисперсионного анализа F = 305,5792

Табличное значение F-критерия со степенями свободы

х 1= k и х2 = (n - k - 1),

где n = 30 (количество наблюдений), k = 4 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()

F табл = 2,7587

Поскольку F > Fтабл, уравнение регрессии следует признать адекватным.

С помощью t-статистики Стьюдента оценим статистическую значимость отдельных параметров.

По данным дисперсионного анализа:

tb0 = -1,2994, tb1 = 5,3387, tb2 = 0,8207, tb3 = 12,8010, tb4 = 2,0759

Табличное значение t-статистики Стьюдента найдем с помощью функции СТЬЮДРАСПОБР()

t табл = 2,0595

Среди всех коэффициентов значимыми (tb > tтабл) являются коэффициенты b1, b3 и b4.

По такой модели прогноз сделать не представляется возможным, поскольку большинство коэффициентов регрессии при переменных не значимы.

2. Проведем корреляционный анализ для исключения незначимых факторов и устранения мультиколлинеарности.

Используем инструмент Excel "Корреляция" (Сервис - Анализ данных - Корреляция).

Таблица 3 - Матрица коэффициентов парной корреляции

y - цена квартиры, тыс. долл.

x1 - общая площадь квартиры (м2)

x2 - жилая площадь квартиры (м2)

x3 - тип дома (1- кирпичный, 0 - другой)

x4 - наличие балкона (1- есть, 0 - нет)

y - цена квартиры, тыс. долл.

1

x1 - общая площадь квартиры (м2)

0,9066

1

x2 - жилая площадь квартиры (м2)

0,8438

0,9725

1

x3 - тип дома (1- кирпичный, 0 - другой)

0,3927

-0,0005

-0,0976

1

x4 - наличие балкона (1- есть, 0 - нет)

0,2313

0,1967

0,1133

0

1

Анализ матрицы показывает, что цена квартиры имеет тесную связь с индексами:

x1 - общая площадь квартиры (0,9066)

x2 - жилая площадь квартиры (0,8438)

Факторы х1 и х2 тесно связаны между собой (0,9725 > 0,8438), т. е. наблюдается мультиколлинеарность, поэтому оставляем в модели фактор х1.

После исключения незначимых факторов n = 30, k = 1

3. Построим линейную модель регрессии только со значимыми факторами.

Таблица 3 - Протокол выполнения регрессионного анализа только со значимыми факторами

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R

0,9066

R-квадрат

0,8220

Нормированный R-квадрат

0,8156

Стандартная ошибка

4,3968

Наблюдения

30

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

1

2498,9831

2498,9831

129,2684

5,26E-12

Остаток

28

541,2889

19,3317

Итого

29

3040,2720

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение

2,9342

2,3495

1,2488

0,2221

-1,8786

7,7470

-1,8786

7,7470

Переменная X 1

0,4123

0,0363

11,3696

0,0000

0,3380

0,4866

0,3380

0,4866

Из анализа получаем коэффициенты уравнения регрессии а0, а1.

Уравнение регрессии зависимости цены квартиры только от общей площади квартиры принимает вид:

y = 2,9342 + 0,4123x1

Это означает, что величина стоимости квартиры в среднем по совокупности возрастала на 412,3 долларов при увеличении общей площади квартиры на 1 м2.

Оценим качество построенной модели, определив коэффициент детерминации.

R2 = 1 -

Коэффициент детерминации показывает, что около 82,2% вариации зависимой переменной учтено в модели и обусловлено влиянием наиболее значимого фактора.

Коэффициент множественной корреляции R = 0,9066

Он показывает высокую тесноту связи зависимой переменной у с объясняющим фактором.

Оценим значимость модели в целом на основе вычисления F-критерия Фишера.

По данным дисперсионного анализа F = 129,2684

Табличное значение F-критерия со степенями свободы

х1= k и х2 = (n - k - 1),

где n = 30 (количество наблюдений), k = 1 (количество факторов, включенных в модель) найдем при помощи функции FРАСПОБР()

Fтабл = 4,19597

Поскольку F > Fтабл, уравнение регрессии следует признать адекватным.

Определим среднюю относительную ошибку аппроксимации:

Еотн.ср. 14,85

Поскольку Eотн.ср. меньше 15%, следовательно точность считается удовлетворительной.

4. Осуществим прогнозирование среднего значения показателя Y при условии, что прогнозное значения фактора X составит 80% от его максимального значения.

Точечный прогноз вычисляем путём подстановки в уравнение прогнозного значения факторной переменной:

Для однофакторной модели максимальное значение

Х = 137,7 Ч 80% = 110,16

= 48,3547

Доверительный интервал прогноза зависит от стандартной ошибки, удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза б:

Стандартная ошибка Sст = 4,3968 (по данным таблицы 3).

t0,1 = СТЬЮДРАСПОБР(0,1; 28) = 1,7011

Доверительный интервал L = 1,3204

Фактические значения исследуемого признака с вероятностью (1 - б) попадут в интервал

.

5. Представим графически: фактические и модельные значения, точечный прогноз и доверительный интервал прогноза (для однофакторной модели).

Таблица 4 - Прогнозирование цены

№ п/п

Фактическое y - цена квартиры, тыс. долл.

x1 - общая площадь квартиры, (м2)

Предсказанное y - цена квартиры, тыс. долл.

1

15,9

39

19,0144

2

27

68,4

31,1365

3

13,5

34,8

17,2827

4

15,1

39

19,0144

5

21,1

54,7

25,4878

6

28,7

74,7

33,7341

7

27,2

71,1

32,2497

8

28,3

74,5

33,6516

9

52,3

137,7

59,7098

10

22

40

19,4268

11

28

53

24,7868

12

45

86

38,3932

13

51

98

43,3410

14

34,4

62,6

28,7451

15

24,7

45,3

21,6120

16

30,8

56,4

26,1887

17

15,9

37

18,1898

18

29

67,5

30,7654

19

15,4

37

18,1898

20

28,6

69

31,3839

21

15,6

40

19,4268

22

27,7

69,1

31,4251

23

34,1

68,1

31,0128

24

37,7

75,3

33,9814

25

41,9

83,7

37,4449

26

24,4

48,7

23,0139

27

21,3

39,9

19,3855

28

36,7

68,6

31,2189

29

21,5

39

19,0144

30

26,4

48,6

22,9727

31

110,16

48,3547

Таблица 5 - Результаты прогнозных оценок

Прогнозируемое значение

48,3547

Уровень значимости

0,1

Стандартная ошибка

4,3968

Размер выборки

30

Число степеней свободы

28

Табличное t-статистики Стьюдента

1,7011

Доверительный интервал

1,3204

Нижняя граница Y

47,0343

Верхняя граница Y

49,6751

Размещено на Allbest.ru


Подобные документы

  • Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.

    задача [142,0 K], добавлен 20.03.2010

  • Анализ влияния основных социально-экономических показателей на результативный признак. Особенности классической линейной модели множественной регрессии, ее анализ на наличие или отсутствие гетероскедастичности в регрессионных остатках и их автокорреляции.

    лабораторная работа [573,8 K], добавлен 17.02.2014

  • Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.

    контрольная работа [914,4 K], добавлен 01.12.2013

  • Основы построения и тестирования адекватности экономических моделей множественной регрессии, проблема их спецификации и последствия ошибок. Методическое и информационное обеспечение множественной регрессии. Числовой пример модели множественной регрессии.

    курсовая работа [3,4 M], добавлен 10.02.2014

  • Оценка распределения переменной Х1. Моделирование взаимосвязи между переменными У и Х1 с помощью линейной функции и методом множественной линейной регрессии. Сравнение качества построенных моделей. Составление точечного прогноза по заданным значениям.

    курсовая работа [418,3 K], добавлен 24.06.2015

  • Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

    контрольная работа [108,5 K], добавлен 28.03.2018

  • Построение линейной модели и уравнения регрессии зависимости цены на квартиры на вторичном рынке жилья в Москве в 2006 г. от влияющих факторов. Методика составления матрицы парных коэффициентов корреляции. Экономическая интерпретация модели регрессии.

    лабораторная работа [1,8 M], добавлен 25.05.2009

  • Факторы, формирующие цену квартир в строящихся домах в Санкт-Петербурге. Составление матрицы парных коэффициентов корреляции исходных переменных. Тестирование ошибок уравнения множественной регрессии на гетероскедастичность. Тест Гельфельда-Квандта.

    контрольная работа [1,2 M], добавлен 14.05.2015

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Расчет линейного коэффициента парной и частной корреляции. Статистическая значимость параметров регрессии и корреляции. Анализ корреляционного поля данных. Точность прогноза, расчет ошибки и доверительный интервал. Коэффициент множественной детерминации.

    контрольная работа [155,8 K], добавлен 11.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.