Множественная линейная регрессия
Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 19.12.2013 |
Размер файла | 814,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ АРХИТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ (СИБСТРИН)
Кафедра прикладной математики
Индивидуальное задание
По дисциплине «Математическое моделирование»
Тема: «Множественная линейная регрессия»
Студент: Филиппов А.В.
Специальность «Экспертиза, оценка и управление недвижимостью»
группа 115-маг-з
Руководитель работы: Воскобойников Ю.Е.
Новосибирск 2013
Исходные данные
регрессия дисперсия детерминация интервал
Имеются следующие данные о потреблении некоторого продукта У (в условных единицах). В зависимости от уровня урбанизации (доли городского населения) - переменная X1, относительного образовательного уровня - X2, относительного заработка - переменная X3, для девяти географических районов.
Конкретные значения представлены в таблице 1.
Таблица 1.
Номер района |
xi1 |
xi2 |
xi3 |
yi |
|
1 |
42,2 |
11,2 |
31,9 |
197 |
|
2 |
48,6 |
10,6 |
13,2 |
204 |
|
3 |
42,6 |
10,6 |
28,7 |
130 |
|
4 |
39 |
10,4 |
26,1 |
193 |
|
5 |
34,7 |
9,3 |
30,1 |
110 |
|
6 |
44,5 |
10,8 |
8,5 |
144 |
|
7 |
39,1 |
10,7 |
24,3 |
193 |
|
8 |
40,1 |
10 |
18,6 |
144 |
|
9 |
45,9 |
12 |
20,4 |
215 |
Решение
1. Для данного задания может быть построена линейная множественная регрессия вида:
Y=в0+в1xi1+ в2xi2+ в3xi3+еi, (1)
где в0, в1, в2, в3 - коэффициенты регрессионной модели, е - возмущение; i - 1,2…9.
Тогда оценка для данной регрессии имеет вид:
y=b0+b1x1+ b2x2+ b3x3, (2)
где b0, b1, b2, b3 - коэффициенты уравнения регрессии.
Введем матричные обозначения и матричные вычисления, тогда справедливы следующие формулы
(3)
(4)
(5)
Коэффициенты уравнения множественной регрессии находятся по формуле:
b=(XT*X)-1*(XT*y), (6)
Решение представлено на рисунке 1.
Рисунок 1 - Расчет коэффициентов линейной множественной регрессии
Таким образом уравнение регрессии имеет вид:
y=-241.085+1,14xi1+ 33.422xi2+ 0.373xi3,
где i = 1,2 …9.
2. Для определения дисперсий найденных коэффициентов уравнения регрессии нужно рассчитать оценку дисперсии случайной составляющей s2:
, (7)
где n- объем выработки (n=9), m-число оцениваемых параметров (m=k+1=4), ei-невязка i-го измерения.
ei=yi- yi, (8)
Тогда оценка дисперсии коэффициента уравнения регрессии bj, рассчитывается по формуле:
(9)
где - j-й диагональный элемент матрицы .
Отсюда следует, что коэффициент bjзначим (принимается гипотеза H1: bj?0), если выполняется условие:
|Tbj|=|| >t(1-б, n-m),
где m - количество коэффициентов регрессии, б - уровень значимости (0,05).
Решение представлено на рисунке 2.
Рисунок 2 - Расчет дисперсий коэффициентов уравнения регрессии и проверка их значимости.
Как видно из расчетов, неравенство значимости коэффициента не выполняется для всех коэффициентов (x1,x2,x3,x4).
3. Коэффициент детерминации рассчитывается по формуле:
, (10)
где (yi- yi)2 - вектор, состоящий из квадратов невязки можно взять из предыдущего расчета, yср - вектор размерности n=9, составленный из средних значений.
Если известен коэффициент детерминации, то скорректированный коэффициент детерминации:
(11)
Расчет представлен на рисунке 3.
Рисунок 3 - Расчет коэффициента детерминации, скорректированного коэффициента детерминации и значение коэффициента F.
, (12)
,
то есть уравнение множественной регрессии статистически не значимо (гипотеза H0).
4. 95%-ный доверительный интервал для коэффициентов вj:
, (13)
Результаты представлены на рисунке 4.
Рисунок 4 - Интервальная оценка коэффициентов уравнения регрессии.
Интервалы:
для в0 - [-724,179; 242,009];
для в1 - [-12.37;14.649];
для в2 - [-27,043; 93.886];
для в3 - [-4,899; 5.645].
5. Доверительный интервал для f(x) = M(Y/x):
, (14)
где Sy(x) рассчитывается по формуле:
, (15)
где -вектор, координаты которого определяют значения объясняющих переменных, при которых вычисляется значение регрессии y. Расчет представлен на рисунке 5 (ун - нижняя граница, ув - верхняя граница).
Рисунок 5 - Доверительный интервал для f(x) = M(Y/x).
6. Рассматриваемая классическая модель множественной линейной регрессии в данном случае не отражает в должной мере количественную зависимость между экономическими явлениями. Построенное уравнение регрессии с помощью существующих независимых переменных объясняет изменение зависимой переменной на 53,7%, а в скорректированном виде - на 25,9%. Таким образом, получаем не значимость уравнения регрессии, и не значимость всех коэффициентов, что может быть вызвано недостатком объясняющих переменных и мультиколлинеарностью (стохастической) - наличием высокой взаимной коррелированности между объясняющими переменными.
7. Для исключения мультиколлинеарности и повышения точности построенной регрессионной модели проводим пошаговое введение наиболее информативных объясняющих моделей с построением корреляционной таблицы и расчетом обыкновенного и скорректированного коэффициентов детерминации для каждого шага. Расчет представлен на рисунке 6. На рисунке 7 представлен расчет коэффициентов детерминации на втором шаге.
Выбирается та переменная, которая больше другой коррелированна с у. В нашем случае это x2. Выбираем ее для того, чтобы в дальнейших расчетах получить большее значение скорректированного коэффициента детерминации чем в исходной модели. Для построенной модели рассчитываются обыкновенный и скорректированный коэффициенты детерминации. Причем для парной регрессии обыкновенный коэффициент детерминации равен квадрату соответствующего коэффициента корреляции.
Рисунок 6 - Отбор объясняющих переменных регрессионной модели.
Рисунок 7 - Построение регрессионной модели на шаге 2 отбора объясняющих переменных и расчет коэффициентов уравнения регрессии для новой модели.
8. На втором шаге в модель попеременно добавляются переменныеx1 и x3. Для этих уравнений рассчитываются коэффициенты уравнения (рисунок 7), коэффициенты детерминации, скорректированные коэффициенты детерминации, F-критерии.
Оценивая найденные значения можно сказать, что введение дополнительных переменных на втором шаге снижает значение коэффициента детерминации и уравнение регрессии становится статически не значимо.
Расчет всех необходимых параметров для уравнения регрессии с переменной x2 приведен на рисунке 8.
Рисунок 8 - Расчет параметров уравнения парной регрессии
Согласно расчета, только второй коэффициент уравнения регрессии является значимыми, как и само уравнение регрессии. Произведены расчеты для определения доверительных интервалов вjи доверительного интервала f(x) = M(Y/x).
9. Скорректированный коэффициент детерминации для второго уравнения больше, чем для первого, что говорит о большей адекватности второго варианта, предпочтительность второй регрессии можно доказать и через F-критерий.
То есть неравенство выполняется, можно сделать вывод о значимости построенного уравнения регрессии, следовательно, исследуемая зависимость у достаточно хорошо описывается включенной в регрессионную модель переменной x1. В первой же модели это условие не выполняется, поэтому первое регрессионное уравнение незначимо.
10. Прогноз с использованием второго уравнения регрессии:
при x1=34 x2=10,3 x3=26,2.
y=37,1xi1, = 382,13.
Рисунок 9 -Построение интервальной оценки для M(Y/x).
Общий вывод
Классическая линейная модель в рамках множественного регрессионного анализа не всегда адекватно и точно отражает зависимость между переменными. В случае наличия мультиколлинеарности, недостатка или переизбытка объясняющих переменных, попадая в уравнение регрессии случайной составляющей, применяют специальные методы выявления и устранения проблем. В итоге с упором на принцип наименьшей сложности и высокой информативности может быть построена эффективная регрессионная модель.
Размещено на Allbest.ru
Подобные документы
Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.
контрольная работа [68,7 K], добавлен 21.09.2009Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010Определение числовых характеристик производной случайной функции. Расчет корреляционной функции и дисперсии спектральной плотности. Группировка заданной выборки, построение выборочной функции распределения и гистограммы, доверительного интервала.
контрольная работа [681,0 K], добавлен 02.06.2010Вычисление среднего одномерных случайных величин. Определение доверительного интервала для математического ожидания и для дисперсии. Построение эмпирической и приближенной линий регрессии Y по X. Дисперсионный анализ греко-латынского куба второго порядка.
курсовая работа [698,0 K], добавлен 08.05.2012Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.
контрольная работа [77,6 K], добавлен 20.07.2010Понятие доверительной вероятности и доверительного интервала и его границ. Закон распределения оценки. Построение доверительного интервала, соответствующего доверительной вероятности для математического ожидания. Доверительный интервал для дисперсии.
презентация [124,9 K], добавлен 01.11.2013Получение интервальной оценки. Построение доверительного интервала. Возникновение бутстрапа или практического компьютерного метода определения статистик вероятностных распределений, основанного на многократной генерации выборок методом Монте-Карло.
курсовая работа [755,6 K], добавлен 22.05.2015Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015Нахождение вероятности события, используя формулу Бернулли. Составление закона распределения случайной величины и уравнения регрессии. Расчет математического ожидания и дисперсии, сравнение эмпирических и теоретических частот, используя критерий Пирсона.
контрольная работа [167,7 K], добавлен 29.04.2012