Построение и тестирование адекватности эконометрических моделей множественной регрессии: выбор функциональной формы модели
Основы построения и тестирования адекватности экономических моделей множественной регрессии, проблема их спецификации и последствия ошибок. Методическое и информационное обеспечение множественной регрессии. Числовой пример модели множественной регрессии.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 10.02.2014 |
Размер файла | 3,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Согласно проведенной регрессионной статистики мы видим следующие результаты:
1. Коэффициент множественной корреляции (множественный R) равен 0,994. Следовательно, связь между факторами весьма тесная (по шкале Чудока)
2. Значение R2=0,9883 свидетельствует о том, что вариация зависимой переменной Y (объём валового национального продукта) в основном (на 98,78%) можно объяснить вариацией включенных в модель объясняющих переменных Х2 (инвестиции) и Х1. Это свидетельствует об адекватности модели.
3. По результатам дисперсионного анализа мы получили расчетное значение F-критерия Фишера, которое составляет 295,50. Рассчитаем с помощью Excel табличное значение Фишера (результат см. рис.7). Для этого в ячейке Е14 (см. рис 4) обратимся к мастеру функций f (x) и выберем категорию: Статистические функции - функцию FРАСПОБР, как показано на рис.5.
Рис.5. Мастер функции.
Затем зададим нужные аргументы: Вероятность б=0,05. Степень свободы 1 - количество факторов Х. Степень свободы 2 - это число степеней свободы: n-m-1=10-2-1=7, где n - число наблюдений (в нашем случае 10), m - число объясняющих переменных (в нашем примере равно 2) (см. рис.6).
Рис.6. Аргументы функции (расчет табличного значения Фишера в Microsoft Office Excel).
Рис.7. Результат расчета табличного значения Фишера с помощью редактора Microsoft Office Excel.
Сравнивая расчетное значение F-критерия Фишера 295,50 с табличным 4,74 мы видим, что 295,50> 4,74.
Следовательно, в целом, уравнение регрессии значимо.
Значимость F=1,735*10-7, что меньше 0,05. Это так же говорит о значимости уравнения.
Далее оценим значимость отдельных параметров построенной модели.
Границы доверительного интервала для коэффициентов регрессии не содержат противоречивых результатов:
С надежностью 0,95 (с вероятностью 95%) коэффициент b1 лежит в интервале 0,55? b1? 0,66.
Сравним полученное значение t-статистики с табличным, которое рассчитаем с помощью мастера функций (рис.8,9)
Рис.8 Мастер функций.
Рис.9. Аргументы функции.
Результат расчета представлен на рис.10 в ячейке D20.
Рис.10. Результаты регрессии с рассчитанными табличными значениями F и t-статистики.
Сравнивая расчетные значения t-статистики с табличным 2,36 мы ещё раз убеждаемся, что значение переменной Х1 не значимое, так как 0,53< 2,36. А значение переменной Х2 является значимым, так как оно больше порогового 5,52>2,36.
Таким образом, модель балансовой прибыли предприятия торговли запишется в следующем виде:
=-0,26+0,47*Х1+0,57*X2.
Теперь построим в Excel заново нашу регрессию с выведением остатков:
Рис.11. Регрессия с остатками.
Получим:
Рис.12. Регрессия с рассчитанными остатками.
Найдём долю ошибки в Y (по модулю): ошибка аппроксимации (выравнивания) А=||*100%. Разделим ошибку аппроксимации на число наблюдений и получим среднюю ошибку аппроксимации:
= ?||*100%.
Для нахождения А с помощью редактора Microsoft Office Excel воспользуемся математическими функциями:
Рис.13. Мастер функций.
Зададим аргументы функций (рис.14.)
Рис.14. Аргументы функции.
Найдём среднюю ошибку аппроксимации (рис.15)
Рис.15. Расчет ошибки аппроксимации и средней ошибки аппроксимации.
Мы получили среднюю ошибку аппроксимации равную =2,027. Это говорит о том, что исследуемая модель является точной (так как <10).
2. Рассмотрим экономическую интерпретацию параметров модели.
=-0,26+0,47*Х1+0,57*X2.
Коэффициент b1=0,47 означает, что при увеличении потребления на 1 млрд. долл. объём валового национального продукта возрастёт на 0,47 млрд. долл. Коэффициент b2=0,57 означает, что увеличение инвестиций на 1 млрд. долл. приведёт к увеличению объёма валового национального продукта на 0,57 млрд. долл.
3. Проверим выполнение условия гомоскедастичности остатков, применив тест Голдфельда-Квандта.
Разобьём модель на 3 части (см. рис.16). Найдём регрессию 1-ой и 3-ей части (результат на рис.17).
Рис.16. Модель разбили на 3 части.
Рис. 17 Регрессия для 1 и 3 частей модели.
Определим значимость модели по формуле:
F= |
? ei2 (1) |
|
? ei2 (2) |
На рисунке 17 видно, что для нахождения F необходимо разделить результат ячейки С11 на результат ячейки С29. Получим:
F= |
0,018 |
=0,429 |
|
0,042 |
Для того, чтобы узнать табличное значение, воспользуемся встроенной в EXCEL функцией FРАСПОБР с параметрами б=0,05. В данном случае К1=К2=n| - m=4-2=2 (см. рис. 18)
Рис. 18. Аргументы функции.
Рис. 19 Расчет табличного F.
Статистика Fрасч. =0,429 меньше табличного значения Фишера F=FРАСПОБР (0,05; 2;
2) =19. Следовательно, в данной моделе отсутствует гетероскедастичность остатков.
4. Проверим полученную модель на наличие автокорреляции остатков с помощью теста Дарбина-Уотсона.
Если прослеживается влияние результатов предыдущих наблюдений на результаты последующих, случайные величины (ошибки) ?i в регрессионной модели не оказываются независимыми. Такие модели называются моделями с наличием автокорреляции.
Как правило, если автокорреляция присутствует, то наибольшее влияние на последующее наблюдение оказывает результат предыдущего наблюдения. Наличие автокорреляции между соседними уровнями ряда можно определить с помощью теста Дарбина-Уотсона. Расчетное значение определяется по следующей формуле:
dw= |
? (?i - ?i-1) 2 |
|
? ?i 2 |
Определим его с помощью редактора EXCEL.
Таким образом, мы нашли расчетное значение dw=1,84. Найдём табличное значение статистики Дарбина-Уотсона для m=2 и n=10. Согласно таблицы получим d1= 0,7 и d2=1,64.
Значение статистики Дарбина-Уотсона распределено в интервале от 0 до 4. Соответственно, идеальное значение статистики равно 2 (автокорреляция отсутствует). Если расчетное значение:
0<dw<d1, то присутствует положительная автокорреляция.
4-d1<dw<4, то присутствует отрицательная автокорреляция.
d2<dw<4-d2, то автокорреляция отсутствует.
d1<dw<d2 и 4-d2<dw<4-d1, то вопрос о наличии или отсутствии автокорреляции остается открытым (расчетное значение попадает в зону неопределённости).
Для нахождения автокорреляции разобьём числовую прямую.
Наше расчетное значение dw=1,84 попадает в область, где автокорреляции нет.
5. Проверим, адекватно ли предположение об однородности исходных данных в регрессионном смысле. Можно ли объединить две выборки (по первым 5 и остальным 5 наблюдениям) в одну и рассматривать единую модель регрессии Y по X?
Для проверки предположения об однородности исходных данных в регрессионном смысле применим тест Чоу.
В соответствии со схемой теста построим уравнение регрессии по первым n1=5 наблюдениям и остальным n2=5 наблюдениям. Результаты представлены на рис.22.
Результаты регрессионного и дисперсионного анализа модели, построенной по всем n=n1 + n2=10 наблюдениям.
Рассчитаем статистику F по формуле:
Fрасч. = |
(ESS-ESS1-ESS2) / (2+1) |
= |
(1,158-0,023-0,070) /3 |
=15,43 |
|
(ESS1+ESS2) / (10-2*2-2) |
(0,023+0,070) /4 |
Находим табличное значение Fтабл. =FРАСПОБР (0,05; 3;
4) с помощью редактора EXCEL. Получаем Fтабл. =6,59.
Так как Fрасч. >Fтабл. (15,43>6,59), то можно сделать вывод, что использовать единую модель по всем наблюдениям нельзя, то есть объединить две выборки (по первым 5 и остальным 5 наблюдениям) в одну и рассматривать единую модель регрессии Y по X не целесообразно.
Заключение
Итак, многочисленные наблюдения и исследования показывают, что в окружающем нас мире величины существуют не изолированно друг от друга, а напротив, они связаны определенным образом.
Не важно рассматриваем мы экономическую сферу деятельности или какую-либо другую, везде существуют факторы, оказывающие влияние на объект/итог какого-либо процесса. Для верной интерпретации этого явления была разработаны методы математической статистики.
Наиболее простым методом, используемым в экономике для определения зависимости переменных, является модель линейной регрессии. Также она может случить началом эконометрического анализа. Известно что на любой экономический показатель, как правило, оказывают влияние несколько факторов, поэтому чаще всего при построении модели используется множественная регрессия.
Но построение модели лишь половина дела, необходимо быть уверенным, что она соответствует реальности. Для проводят анализ качества модели, состоящий из нескольких этапов.
Одним из способов проверки является проверка общего качества уравнения регрессии. Для проведения этой проверки используют коэффициент детерминации. Этот показатель используют как универсальную меру связи одной случайной величины от другой. После расчета коэффициента детерминации специалисты смотрят на его величину, она может варьироваться от нуля до единицы, чем ближе полученная цифра к единице, тем сильнее влияние факторов на изучаемую величину.
Однако стандартный коэффициент детерминации имеет сильную зависимость от числа факторов. Чтобы исправить этот недостаток был веден скорректированный коэффициент детерминации. Эта величина рассчитывается на основе обычного коэффициента и дает штраф за дополнительно включенные факторы. Кроме того его можно применять для сравнении моделей с разным числом факторов или при последовательность включении факторов в модель с целью выяснения их влияния на зависимую переменную.
По итогам проведенных расчетов мною была построена модель множественной линейной регрессии и на ее основе рассчитаны коэффициенты детерминации, общий и скорректированный. Была выявлена обратная зависимость между количеством малоимущего населения и количеством безработного населения и среднедушевого дохода. Эта зависимость подтверждает, что чем больше значение детерминирующего фактора А, тем ниже значения факторов Б и В. Кроме того, полученные мною результаты доказывают целесообразность использования в анализе данных такого показателя как скорректированный коэффициент детерминации чтобы получать оценку тесноты связи, не зависящую от числа факторов.
Список использованных источников
1. Айвазян С.А. Методы эконометрики. Учебник. - М.: Инфра-М, 2010.
2. Айвазян С.А., Иванова С.С. Эконометрика. Краткий курс. Учебное пособие. - М.: Маркет ДС, 2010.
3. Белько И.В., Криштапович Е.А. Эконометрика. Практикум. Учебное пособие. - М.: Издательство Гревцова, 2011.
4. Валентинов В.А. Эконометрика. Практикум. - М.: Дашков, 2009
5. Валентинов В.А. Эконометрика. Учебник. - М.: Дашков, 2010.
6. И.И. Елисеева, "Эконометрика", Москва - 2007 г.
7. Молчанов И.Н., Герасимова И. А, "Компьютерный практикум по начальному курсу эконометрики (реализация на Eviews)", Ростов-н/Д., - 2001.
8. Мхитарян В.С. Эконометрика. Учебник. - М.: Проспект, 2010.
9. Сайт Федеральной служба государственной статистики: www.gks.ru
10. Эконометрика. Учебник. / Елисеева И.И., Курышева С.В., Нерадовская Ю.В. Под ред. И.И. Елисеевой. - М.: Проспект, 2010.
Размещено на Allbest.ru
Подобные документы
Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.
курсовая работа [243,1 K], добавлен 17.01.2016Оценка распределения переменной Х1. Моделирование взаимосвязи между переменными У и Х1 с помощью линейной функции и методом множественной линейной регрессии. Сравнение качества построенных моделей. Составление точечного прогноза по заданным значениям.
курсовая работа [418,3 K], добавлен 24.06.2015Построение модели множественной линейной регрессии по заданным параметрам. Оценка качества модели по коэффициентам детерминации и множественной корреляции. Определение значимости уравнения регрессии на основе F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [914,4 K], добавлен 01.12.2013Факторы, формирующие цену квартир в строящихся домах в Санкт-Петербурге. Составление матрицы парных коэффициентов корреляции исходных переменных. Тестирование ошибок уравнения множественной регрессии на гетероскедастичность. Тест Гельфельда-Квандта.
контрольная работа [1,2 M], добавлен 14.05.2015Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Анализ влияния основных социально-экономических показателей на результативный признак. Особенности классической линейной модели множественной регрессии, ее анализ на наличие или отсутствие гетероскедастичности в регрессионных остатках и их автокорреляции.
лабораторная работа [573,8 K], добавлен 17.02.2014Использование метода оценки параметров в стандартных масштабах для определения неизвестных параметров линейной модели множественной регрессии. Специфика изучения взаимосвязей по временным рядам. Моделирование взаимосвязей и тенденций в финансовой сфере.
контрольная работа [326,7 K], добавлен 22.04.2016Построение обобщенной линейной модели множественной регрессии, ее суть; теорема Айткена. Понятие гетероскедастичности, ее обнаружение и методы смягчения проблемы: тест ранговой корреляции Спирмена, метод Голдфелда-Квандта, тесты Глейзера, Парка, Уайта.
контрольная работа [431,2 K], добавлен 28.07.2013Расчет параметров A и B уравнения линейной регрессии. Оценка полученной точности аппроксимации. Построение однофакторной регрессии. Дисперсия математического ожидания прогнозируемой величины. Тестирование ошибок уравнения множественной регрессии.
контрольная работа [63,3 K], добавлен 19.04.2013Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.
курсовая работа [449,1 K], добавлен 22.01.2015