Изучение моделей регрессии
Функциональные преобразования переменных в линейной регрессии. Формулы расчета коэффициентов эластичности. Характеристика экзогенных и эндогенных переменных. Построение одно- и двухфакторного уравнений. Прогнозирование значения результативного признака.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 27.01.2016 |
Размер файла | 714,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Введение
Из всего многообразия методов моделирования структурно-сложных экономических систем можно выделить два основных «работающих» класса:
* эконометрика;
* имитационное моделирование.
В отличие от систем физических или биологических, которые достаточно хорошо изучены, точность предсказания будущего поведения экономических объектов (рынок, отрасль, регион, предприятие, банк) относительно не высока. Возможно, именно сложность объекта привлекает исследователей: количество научных работ растет почти экспоненциально.
Изучение моделей множественного выбора в настоящее время является очень актуальным вопросом, так как они применяются в социологических, социально-экономических и медицинских выборочных обследованиях. Это даёт возможность проводить более грамотную экономическую политику и как следствие приносит большую прибыль предприятиям.
Методы эконометрики используются для поиска и проверки общих закономерностей, связывающих траекторные переменные системы и переменные внешней среды. А поскольку измерение любых величин, в особенности экономических, связано со случайными ошибками, то применение аппарата математической статистики для анализа вероятностных свойств этих величин неизбежно. Использование эконометрических моделей предполагает представление объекта в виде «черного ящика» и формальное исследование зависимостей между переменными, например, на основе системы одновременных уравнений.
Целью написания работы является изучение моделей регрессии.
Объектом исследования является модель лог-регрессии.
Предмет исследования -? использование модели лог-регрессии в эконометрических исследованиях.
Для изучения темы использовалась тематическая литература таких авторов как: Магнус Л.Р, Тихомиров Н.П., Дорохина Е.Ю., а так же труды ведущих отечественных экономистов: В.Н. Афанасьева, И.И. Елисеевой, А.К. Шалабанова. Так же в работе использованы интернет источники.
В работе были использованы ряд статистических методов, таких как: метод массового статистического наблюдения, анализ и синтез данных, а также эконометрические методы: метод наименьших квадратов и конфлюэнтный анализ.
Работа состоит из введения, двух глав (теоретической и практической), выводов (заключения), списка использованных источников.
1. Теоретическая часть
1.1 Функциональные преобразования переменных в линейной регрессии
В линейной регрессии иногда переменные выражены в нелинейном виде или они имеют разные размерности. В этих случаях требуется преобразование данных. Применяют чаще всего два вида преобразований:
· логарифмирование данных;
· переход к безразмерным величинам путем деления на некоторые известные величины, той же размерности, что и исходные данные.
Покажем на примере линеаризации нелинейных моделей регрессии как проводят подобные преобразования.
При нелинейной зависимости признаков, приводимых к линейному виду, параметры множественной регрессии определяются по МНК, который используется не к исходной информации, а к преобразованным данным. Так, рассматривая степенную функцию
,
преобразовываем ее в линейный вид:
,
где переменные выражены в логарифмах.
Далее обработка МНК такая же: строится система нормальных уравнений и определяются неизвестные параметры. Потенцируя значение , находим параметр a и соответственно общий вид уравнения степенной функции. Оценка нелинейной регрессии по включенным переменным определяется МНК или его модификациями, как и в линейной регрессии. Так, в двухфакторном уравнении нелинейной регрессии
может быть проведена линеаризация, введением в него новых переменных . В результате получается четырехфакторное уравнение линейной регрессии
.
Если между экономическими явлениями существуют нелинейные соотношения, то они выражаются с помощью соответствующих нелинейных функций.
Различают два класса нелинейных регрессий:
1. Регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, например
- полиномы различных степеней , ;
- равносторонняя гипербола ;
- полулогарифмическая функция .
2. Регрессии, нелинейные по оцениваемым параметрам, например
- степенная ;
- показательная ;
- экспоненциальная .
Регрессии нелинейные по включенным переменным приводятся к линейному виду простой заменой переменных, а дальнейшая оценка параметров производится с помощью метода наименьших квадратов. Рассмотрим некоторые функции.
Парабола второй степени приводится к линейному виду с помощью замены: . В результате приходим к двухфакторному уравнению , оценка параметров которого при помощи МНК.
Парабола второй степени обычно применяется в случаях, когда для определенного интервала значений фактора меняется характер связи рассматриваемых признаков: прямая связь меняется на обратную или обратная на прямую.
Равносторонняя гипербола может быть использована для характеристики обратной связи между факторами (например, удельных расходов сырья, материалов, топлива от объема выпускаемой продукции, времени обращения товаров от величины товарооборота, процента прироста заработной платы от уровня безработицы, расходов на непродовольственные товары от доходов или общей суммы расходов). Гипербола приводится к линейному уравнению простой заменой: .
Аналогичным образом приводятся к линейному виду зависимости , и другие.
Среди нелинейных моделей наиболее часто используется степенная функция , которая приводится к линейному виду логарифмированием:
;
;
,
где . Т.е. МНК применяется для преобразованных данных:
а затем потенцированием находим искомое уравнение.
Для определения неизвестных коэффициентов линеаризованной формы показательной функции методом наименьших квадратов необходимо минимизировать сумму квадратов отклонений логарифмов наблюдаемых значений результативной переменной У от теоретических значений ? (значений, рассчитанных на основании модели регрессии), т. е. минимизировать функционал МНК вида:
Оценки неизвестных коэффициентов А и В линеаризованной формы показательной функции находятся при решении системы нормальных уравнений вида:
Данная система является системой нормальных уравнений относительно коэффициентов А и В для функции вида Yi=A+Bхi+E.
Однако основным недостатком полученных МНК-оценок неизвестных коэффициентов моделей регрессии, сводимых к линейному виду, является их смещённость.
1.2 Лог-линейная регрессия, как модель с постоянной эластичностью
Регрессия, линейная в логарифмах, именуется лог-линейной регрессией.
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии (-1 ? ? 1):
,
где - среднее квадратическое отклонение в ряду x,
- среднее квадратическое отклонение в ряду y.
Линейный коэффициент корреляции как измеритель тесноты линейной связи признаков связан не только с коэффициентом регрессии b, но и с коэффициентом эластичности, который является показателем силы связи, выраженным в процентах.
Коэффициент эластичности отражает, на сколько процентов изменится значение y при изменение значения фактора на 1%. Коэффициент эластичности рассчитывается как .
Обобщающий (средний) коэффициент эластичности рассчитывается для среднего значения :
и показывает, на сколько процентов изменится y относительно своего среднего уровня при росте x на 1% относительно своего среднего уровня.
Точечный коэффициент эластичности рассчитывается для конкретного значения x=x0:
и показывает, на сколько процентов изменится y относительно своего уровня y(x0) при увеличении на 1% от уровня x0.
Степенная функция является примером нелинейной по параметрам регрессии. Данная модель нелинейна относительно оцениваемых параметров, т.к. включает параметры a и b неаддитивно. Однако ее можно считать внутренне линейной, так как логарифмирование приводит ее к линейному виду: .
При исследовании взаимосвязей среди функций, использующих ln y, в эконометрике преобладают степенные зависимости - это кривые спроса и предложения, кривые освоения для характеристики связи между трудоемкостью продукции и масштабами производства в период освоения выпуска нового вида изделий, а также зависимость валового национального дохода от уровня занятости.
Для оценки параметров степенной функции применяется МНК к линеаризованному уравнению , т.е. решается система нормальных уравнений:
Параметр b определяется непосредственно из системы, а параметр a - косвенным путем после потенцирования величины ln a.
Так как в виде степенной функции изучается не только эластичность спроса, но и предложения, то обычно параметром b<0 характеризуется эластичность спроса, а параметром b>0 - эластичность предложения.
Если же модель представить в виде:
,
то она становится внутренне нелинейной, так как ее невозможно превратить в линейный вид, то же относится к моделям вида:
,
так как эти уравнения не могут быть преобразованы в уравнения, линейные по коэффициентам.
Ниже представлены формулы расчета коэффициентов эластичности (табл. 1).
Широкое использование степенной функции связано с тем, что параметр в ней имеет четкое экономическое истолкование - он является коэффициентом эластичности. Коэффициент эластичности фактора - результата Y по фактору X показывает, на сколько процентов изменится в среднем результат Y, если фактор X изменится на 1%.
Таблица 1. Формулы коэффициентов точечной эластичности и средних коэффициентов эластичности
Вид функции |
Точечный коэффициент эластичности |
Средний коэффициент эластичности |
|
Линейная |
|||
Парабола |
|||
Равносторонняя гипербола |
|||
Степенная |
|||
Показательная |
Формула для расчета коэффициента эластичности имеет вид:
.
Так как для остальных функций коэффициент эластичности не является постоянной величиной, а зависит от соответствующего значения фактора X, то обычно рассчитывается средний коэффициент эластичности:
.
Приведем дополнительные формулы расчета средних коэффициентов эластичности для наиболее часто используемых типов уравнений регрессии (табл.2)
Возможны случаи, когда расчет коэффициента эластичности не имеет смысла. Это происходит тогда, когда для рассматриваемых признаков бессмысленно определение изменения в процентах.
В двухфакторном регрессионном анализе найти уравнение регрессии в стандартизированном масштабе можно через формулы:
, .
На основе линейного уравнения множественной регрессии:
могут быть найдены частные уравнения регрессии:
В отличие от парной регрессии частные уравнения регрессии характеризуют изолированное влияние фактора на результат, ибо другие факторы закреплены на неизменном среднем уровне. Это позволяет на основе частных уравнений регрессии определять частные коэффициенты эластичности:
где bj - коэффициент регрессии при j-ом факторе;
? частное уравнение регрессии.
Для того чтобы оценить сравнительную силу влияния факторов, по каждому фактору рассчитывают средние коэффициенты эластичности.
,
где -- среднее значение j-го факторного признака;
-- среднее значение результативного признака;
-- коэффициент регрессии при j-м факторном признаке.
Расчет коэффициента эластичности дополняет экономический анализ. Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.
2. Практическая часть
2.1 Характеристика экзогенных и эндогенных переменных. Построение двухфакторного уравнения регрессии. Построение однофакторных уравнений линейной регрессии. Прогнозирование значения результативного признака
Список переменных, используемых в модели
У - индекс человеческого развития (ИЧР) - безразмерная величина;
Х1 - ВВП 1997 г., % к 1990 г. - безразмерная величина;
Х6 - ожидаемая продолжительность жизни при рождении в 1997 г., число лет дожития
Эндогенной переменной в модели Y=F(X1, X6) является У (ее значение будет определятся в модели), соответственно, Х1, Х6 - это экзогенные переменные (их значения задаются извне).
Таблица 2. Исходные значения переменных
Страна |
У |
Х1 |
Х6 |
|
Австрия |
0,904 |
115 |
77 |
|
Австралия |
0,922 |
123 |
78,2 |
|
Белоруссия |
0,763 |
74 |
68 |
|
Бельгия |
0,923 |
111 |
77,2 |
|
Великобритания |
0,918 |
113 |
77,2 |
|
Германия |
0,906 |
110 |
77,2 |
|
Дания |
0,905 |
119 |
75,7 |
|
Индия |
0,545 |
146 |
62,6 |
|
Испания |
0,894 |
113 |
78 |
|
Италия |
0,9 |
108 |
78,2 |
|
Канада |
0,932 |
113 |
79 |
|
Казахстан |
0,74 |
71 |
67,6 |
|
Китай |
0,701 |
210 |
69,8 |
|
Латвия |
0,744 |
94 |
68,4 |
|
Нидерланды |
0,921 |
118 |
77,9 |
|
Норвегия |
0,927 |
130 |
78,1 |
|
Польша |
0,802 |
127 |
72,5 |
|
Россия |
0,747 |
61 |
66,6 |
|
США |
0,927 |
117 |
76,7 |
|
Украина |
0,721 |
46 |
68,8 |
|
Финляндия |
0,913 |
107 |
76,8 |
|
Франция |
0,918 |
110 |
78,1 |
|
Чехи |
0,833 |
99,2 |
73,9 |
|
Швейцария |
0,914 |
101 |
78,6 |
|
Швеция |
0,923 |
105 |
78,5 |
Подготовим данные к обработке - проранжируем их, проследим, какие связи между ними. Поле рассеяния Х1, Х6 на У показано на рис.1. На графике видно, что наличествует прямая линейная зависимость Х6 от У. Для Х1 не прослеживается определенная зависимость результирующего признака У от фактора Х6. График распадается на 2 части: в диапазоне У от 0,55 до 0,7 связь прямая и линейная, затем слом уровня Х6 в 5 раз и опять проступает повышательный тренд в диапазоне 0,7 до 1. Эти графические наблюдения показывают, что для линейной регрессии У от Х6 мало оснований.
Строим многофакторную линейную регрессию для модели
Y=a+b1*X1+b2*X6
Применив МНК, получаем такое эмпирическое уравнение регрессии (полные результаты приведены в Прил.1)
Y = -0,63377-0,000552*X1 + 0,020747*X6
Рис.1
Примечание: из-за разной масштабности Х1 и Х6 данные по Х6 отложены на правой шкале.
Множественный коэффициент корреляции (Индекс множественной корреляции).
Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции. В отличии от парного коэффициента корреляции, который может принимать отрицательные значения, он принимает значения от 0 до 1. Поэтому R не может быть использован для интерпретации направления связи. Чем плотнее фактические значения Yi располагаются относительно линии регрессии, тем меньше остаточная дисперсия и, следовательно, больше величина Ry(x1,...,xm).
Таким образом, при значении R близком к 1, уравнение регрессии лучше описывает фактические данные и факторы сильнее влияют на результат. При значении R близком к 0 уравнение регрессии плохо описывает фактические данные и факторы оказывают слабое воздействие на результат.
Аналогичный результат получим при использовании других формул:
Связь между признаком Y и факторами Xi очень высокая.
Расчёт коэффициента корреляции выполним, используя известные значения линейных коэффициентов парной корреляции и в-коэффициентов.
Коэффициент детерминации,
R2= 0,9762 = 0,952. Эта величина показывает, что 95,2 % колебаний У объяснено этим уравнением, оставшиеся 4,8% относятся на ошибки спецификации и случайную ошибку. Коэффициент детерминации также равен доле факторной дисперсии в общей дисперсии. Такое высокое значение - хороший результат.
Проверка общего качества уравнения множественной регрессии.
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =... = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).
Для ее проверки используют F-критерий Фишера.
При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.
По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости б (0,05) и двумя числами степеней свободы k1=m и k2=n-m-1.
F-статистика. Критерий Фишера.
Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.
Более объективной оценкой является скорректированный коэффициент детерминации:
Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.
Проверим гипотезу об общей значимости - гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:
H0: R2 = 0; в1 = в2 = ... = вm = 0.
H1: R2 ? 0.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка). =
Если F < Fkp = Fб ; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 25 - 2 - 1 = 22, Fkp(2;22) = 3,44
Отметим значения на числовой оси.
Таблица 3
Принятие H0 |
Отклонение H0, принятие H1 |
|
95% |
5% |
|
3,44 |
219,61 |
Поскольку фактическое значение F=219,61 > Fkp =3,44, нулевую гипотезу принимаем, соответственно, коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
Оценка значимости дополнительного включения фактора (частный F-критерий).
Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака. Это может быть связано с последовательностью вводимых факторов (т. к. существует корреляция между самими факторами).
Мерой оценки значимости улучшения качества модели, после включения в нее фактора хj, служит частный F-критерий - Fxj:
где m - число оцениваемых параметров.
В числителе - прирост доли вариации у за счет дополнительно включенного в модель фактора хj.
Если наблюдаемое значение Fxj больше Fkp, то дополнительное введение фактора xj в модель статистически оправдано.
Частный F-критерий оценивает значимость коэффициентов «чистой» регрессии (bj). Существует взаимосвязь между частным F-критерием - Fxj и t-критерием, используемым для оценки значимости коэффициента регрессии при j-м факторе:
Оценим с помощью частного F-критерия:
1) целесообразность включения в модель регрессии факторов х1 после введения хj (Fx1).
Определим наблюдаемое значение частного F-критерия:
R2(X6,xn = r2(X6) = 0,9622 = 0,926
Fkp(k1=1;k2=22) = 4,3
Сравним наблюдаемое значение частного F-критерия с критическим:
Fx1>4,3, следовательно, фактор Х1 целесообразно включать в модель после введения факторов Хj.
2) целесообразность включения в модель регрессии факторов Х6 после введения хj (FX6).
Определим наблюдаемое значение частного F-критерия:
R2(x1,xn = r2(x1) = -0,004342 = 1,9E-5
Сравним наблюдаемое значение частного F-критерия с критическим:
FX6>4,3, следовательно, фактор х6 целесообразно включать в модель после введения факторов хj.
Таким образом, по уравнению множественной регрессии можно сделать вывод о его статистической надежности.
Теперь вычислим оценки парных регрессий.
Y=a+b*X1
Y=a+b*X6
Для регрессии У на Х1 получаем такие оценки (см. Прил.2)
Y = -0,000014451*X1 + 0,8513
Видно, что оценка при Х1 настолько близка к 0, что этот фактор практически не работает в уравнении.
Линейный коэффициент корреляции рассчитывается по формуле:
Линейный коэффициент корреляции принимает значения от -1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0,1 < rxy < 0,3: слабая;
0,3 < rxy < 0,5: умеренная;
0,5 < rxy < 0,7: заметная;
0,7 < rxy < 0,9: высокая;
0,9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X1 слабая и обратная.
Коэффициент эластичности.
Коэффициенты регрессии нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака Х, как это имеет место в данном случае. Для этих целей вычисляются коэффициенты эластичности и бета - коэффициенты.
Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат У от своей средней величины при изменении фактора X1 на 1% от своего среднего значения.
Коэффициент эластичности находится по формуле:
Коэффициент эластичности меньше 1. Следовательно, при изменении Х1 на 1%, Y изменится менее чем на 1%. Другими словами - влияние Х1 на Y не существенно.
Бета - коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:
Т.е. увеличение x на величину среднеквадратического отклонения Sx приведет к уменьшению среднего значения Y на 0,43% среднеквадратичного отклонения Sy.
Для линейной регрессии индекс корреляции равен коэффициенту корреляции rx1y = -0.00434. Полученная величина rx1y свидетельствует о том, что фактор x1 никак не влияет на Y
Значимость коэффициента корреляции.
Выдвигаем гипотезы:
H0: rxy = 0, нет линейной взаимосвязи между переменными;
H1: rxy ? 0, есть линейная взаимосвязь между переменными;
Для того чтобы при уровне значимости б проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ? 0, надо вычислить наблюдаемое значение критерия (величина случайной ошибки)
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости б и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит -- нулевую гипотезу отвергают.
По таблице Стьюдента с уровнем значимости б=0,05 и степенями свободы k=23 находим
tкрит: tкрит (n-m-1;б/2) = (23;0,025) = 2,069
где m = 1 - количество объясняющих переменных.
Если |tнабл| > tкритич, то полученное значение коэффициента корреляции признается значимым (нулевая гипотеза, утверждающая равенство нулю коэффициента корреляции, отвергается).
Поскольку |tнабл| < tкрит, то принимаем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически незначим
Отметим значения на числовой оси.
Таблица 4
Принятие H0 |
Отклонение H0, принятие H1 |
|
95% |
5% |
|
0,0208 |
2,069 |
Нулевую гипотезу отвергаем.
Результаты регрессии У на Х6.
Y = 0,02018*X6 -0,6521
Линейный коэффициент корреляции считаем по формуле:
В нашем примере связь между признаком Y фактором X6 весьма высокая и прямая.
Смысл оценок параметров регрессии:
коэффициент регрессии b = 0,0202 показывает среднее изменение результативного показателя (в единицах измерения У) с повышением или понижением величины фактора Х6 на единицу его измерения. В данном примере с увеличением на 1 единицу Y повышается в среднем на 0,0202.
Коэффициент a = -0,65 формально показывает прогнозируемый уровень У, но только в том случае, если х6=0 находится близко с выборочными значениями.
Но если х6=0 находится далеко от выборочных значений х6, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х6, можно определить выровненные (предсказанные) значения результативного показателя y(x6) для каждого наблюдения.
Связь между У и Х определяет знак коэффициента регрессии b (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.
Коэффициент эластичности.
Коэффициент эластичности находится по формуле:
В нашем примере коэффициент эластичности больше 1. Следовательно, при изменении Х6 на 1%, Y изменится более чем на 1%. Другими словами, Х6 существенно влияет на Y.
Бета - коэффициент показывает, на какую часть величины своего среднего квадратичного отклонения изменится в среднем значение результативного признака при изменении факторного признака на величину его среднеквадратического отклонения при фиксированном на постоянном уровне значении остальных независимых переменных:
Т.е. увеличение x6 на величину среднеквадратического отклонения Sx6 приведет к увеличению среднего значения Y на 96,2% среднеквадратичного отклонения Sy.
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
R2= 0,9622 = 0,9255
т,е. в 92,55 % случаев изменения Х6 приводят к изменению Y. Соответственно, точность подбора уравнения регрессии высокая. Остальные 7,45 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Анализ данных этой таблицы показывает, что регрессия для Х1 не может быть принята для дальнейшего использования - она статистически ненадежна. Сравнение многофакторной регрессии и парной регрессии У на Х6 показывает, что многофакторная регрессия лучше, но из-за того, что в ней оценки фактора Х1 ненадежны (t набл = -3,512859127 при уровне критическом в 2,073873068 с 95% вероятностью незначима), этот фактор следует удалить.
Таблица 5 Сравним полученные регрессии по основным оценкам качества
Показатель |
Y=F(X1,X6) Y=-0,633774523-0,000552295*Х1 +0,020746702*Х6 |
Y=F(X1) Y=0,851304526-0,000014451*Х1 |
Y=F(X6) Y=-0,652063486+ 0,020178753*Х6 |
|
R-квадрат (коэффициент детерминации) |
0,952276652 |
1,88287E-05 |
0,925507804 |
|
Нормированный R-квадрат |
0,947938166 |
-0,043458614 |
0,922269013 |
|
F-статистика |
219,4951453 |
0,000433068 |
285,7571736 |
|
Значимость F |
2,92442E-15 |
0,983576471 |
1,82412E-14 |
|
Эластичность |
||||
Х1 |
-0,071268188 |
-0,001864763 |
||
Х6 |
1,817130969 |
1,767386299 |
||
В-коэффициент |
||||
Х1 |
-0,165837354 |
-0,004339206 |
||
Х6 |
0,989110446 |
0,962033161 |
||
Средняя ошибка аппроксимации |
2,148463212 |
10,8769876 |
2,659652795 |
|
Статистика Дарбина-Уотсона (крит. значение = 2,064) |
1,753086257 |
0,130093972 |
0,965789921 |
|
Прогноз по средним значениям факторов (Усреднее = 0,84972) |
0,849719984 |
0,852889049 |
0,849720027 |
Поэтому для применения наилучшим образом подходит уравнение парной регрессии
Y= Y = 0,02018*X6 -0,6521
Покажем эти различия на графике (см. рис.2), на котором видно, что регрессия У на Х1 ничего не предсказывает, кроме среднего значения У. Множественная и парная регрессии, почти совпадая по оценкам параметров, дают расчетные значения очень близкие и соответственно их графики накладываются друг на друга и достаточно хорошо аппроксимируют фактические значения У.
Таким образом, проанализировав колебания значений переменных У - индекс человеческого развития; Х1 - ВВП 1997г., % к 1990 г.; Х6 - ожидаемая продолжительность жизни при рождении в 1997 г., число лет дожития получили результат, что для предсказания изменения индекса человеческого развития по 25 странам Европы достаточно собрать информацию об ожидаемой продолжительности жизни для поколения рождения в 1997 г. С надежностью в 92,5% будет предсказано значение У для данных 25 стран со средней ошибкой в 2,7%.
Распространять эти результаты на более широкую выборку стран и иной период наблюдения некорректно.
Рис.2 Сравнение фактических и расчетных значений по всем регрессиям
Заключение
Связь между (y и xx1 ), (y и xx6 ) является несущественной.
Непосредственное влияние фактора X1 на результат Y в уравнении регрессии измеряется вj и составляет -0,166; косвенное (опосредованное) влияние данного фактора на результат определяется как: rx1X6в2 = 0,163 * 0,989 = 0,1615.
Регрессия для Х1 не может быть принята для дальнейшего использования - она статистически ненадежна. Сравнение многофакторной регрессии и парной регрессии У на Х6 показывает, что многофакторная регрессия лучше, но из-за того, что в ней оценки фактора Х1 ненадежны (t набл = -3,512859127 при уровне критическом в 2,073873068 с 95% вероятностью незначима), этот фактор следует удалить. Поэтому для применения наилучшим образом подходит уравнение парной регрессии
Y= Y = 0,02018*X6 -0,6521
Проанализировав колебания значений переменных У - индекс человеческого развития; Х1 - ВВП 1997г., % к 1990 г.; Х6 - ожидаемая продолжительность жизни при рождении в 1997 г., число лет дожития получили результат, что для предсказания изменения индекса человеческого развития по 25 странам Европы достаточно собрать информацию об ожидаемой продолжительности жизни для поколения рождения в 1997 г. С надежностью в 92,5% будет предсказано значение У для данных 25 стран со средней ошибкой в 2,7%.
регрессия эластичность эндогенный
Основная литература
1. Эконометрика: Учебник / И.И. Елисеева, С.В. Курышева, Т.В. Костеева и др. Ї М.: Финансы и статистика, 2014. - 244 с.
2. Эконометрика: Учебник для вузов / Под ред. проф. Кремера Н.Ш. Ї М.: ЮНИТИ-ДАНА, 2005. - 311 с.
Дополнительная литература
1. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. - М.: ЮНИТИ, 1998. - 1022 с.
2. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. - М.: Дело, 2001. - 400 с.
3. Катышев П.К., Магнус Я.Р., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. - М.: Дело, 2002. - 208 с.
4. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютерах /Под ред. В.Э. Фигурнова. -- М Инфра-М, 1998.
Приложение 1
Таблица 1 Многофакторная линейная регрессия
ВЫВОД ИТОГОВ |
Регрессионная статистика |
||||||||
Множественный R |
0,9758 |
||||||||
R-квадрат |
0,9523 |
||||||||
Нормированный R-квадрат |
0,9479 |
||||||||
Стандартная ошибка |
0,0231 |
||||||||
Наблюдения |
25 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
2 |
0,2345 |
0,1173 |
219,5 |
3E-15 |
||||
Остаток |
22 |
0,0118 |
0,0005 |
||||||
Итого |
24 |
0,2463 |
|||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
-0,634 |
0,073 |
-8,677 |
1E-08 |
-0,785 |
-0,482 |
-0,785 |
-0,482 |
|
Х1 |
-6E-04 |
0,0002 |
-3,513 |
0,002 |
-9E-04 |
-2E-04 |
-9E-04 |
-2E-04 |
|
Х6 |
0,0207 |
0,001 |
20,952 |
5E-16 |
0,0187 |
0,0228 |
0,0187 |
0,0228 |
|
Среднее |
Эл |
СКО |
В-коэф |
||||||
0,8497 |
0,1013 |
||||||||
109,65 |
-0,071 |
30,416 |
-0,166 |
||||||
74,424 |
1,8171 |
4,8294 |
0,9891 |
||||||
ВЫВОД ОСТАТКА |
ВЫВОД ВЕРОЯТНОСТИ |
||||||||
Наблюдение |
Предсказанное У |
Остатки |
Стандартные остатки |
Персентиль |
У |
A |
|||
1 |
0,5843 |
-0,039 |
-1,777 |
2 |
0,545 |
0,0722 |
|||
2 |
0,6984 |
0,0026 |
0,1191 |
6 |
0,701 |
0,0038 |
|||
3 |
0,7682 |
-0,047 |
-2,133 |
10 |
0,721 |
0,0655 |
|||
4 |
0,7295 |
0,0105 |
0,475 |
14 |
0,74 |
0,0142 |
|||
5 |
0,7334 |
0,0106 |
0,4797 |
18 |
0,744 |
0,0143 |
|||
6 |
0,7143 |
0,0327 |
1,4793 |
22 |
0,747 |
0,0438 |
|||
7 |
0,7361 |
0,0269 |
1,2142 |
26 |
0,763 |
0,0352 |
|||
8 |
0,8002 |
0,0018 |
0,0804 |
30 |
0,802 |
0,0022 |
|||
9 |
0,8446 |
-0,012 |
-0,525 |
34 |
0,833 |
0,0139 |
|||
10 |
0,9221 |
-0,028 |
-1,268 |
38 |
0,894 |
0,0314 |
|||
11 |
0,929 |
-0,029 |
-1,309 |
42 |
0,9 |
0,0322 |
|||
12 |
0,9002 |
0,0038 |
0,1714 |
46 |
0,904 |
0,0042 |
|||
13 |
0,871 |
0,034 |
1,5352 |
50 |
0,905 |
0,0375 |
|||
14 |
0,9071 |
-0,001 |
-0,051 |
54 |
0,906 |
0,0012 |
|||
15 |
0,9005 |
0,0125 |
0,5659 |
58 |
0,913 |
0,0137 |
|||
16 |
0,9411 |
-0,027 |
-1,226 |
62 |
0,914 |
0,0297 |
|||
17 |
0,9055 |
0,0125 |
0,5666 |
66 |
0,918 |
0,0137 |
|||
18 |
0,9258 |
-0,008 |
-0,352 |
70 |
0,918 |
0,0085 |
|||
19 |
0,9172 |
0,0038 |
0,1707 |
74 |
0,921 |
0,0041 |
|||
20 |
0,9207 |
0,0013 |
0,0594 |
78 |
0,922 |
0,0014 |
|||
21 |
0,9066 |
0,0164 |
0,7426 |
82 |
0,923 |
0,0178 |
|||
22 |
0,9369 |
-0,014 |
-0,626 |
86 |
0,923 |
0,015 |
|||
23 |
0,9147 |
0,0123 |
0,5538 |
90 |
0,927 |
0,0132 |
|||
24 |
0,8929 |
0,0341 |
1,5419 |
94 |
0,927 |
0,0368 |
|||
25 |
0,9428 |
-0,011 |
-0,488 |
98 |
0,932 |
0,0116 |
|||
DW |
1,7531 |
2,1485 |
|||||||
RS |
0,2883 |
||||||||
Стьюдент. обр. 2Х |
2,0639 |
Рис. 1 График остатков Х1
Рис. 2 График остатков Х6
Рис. 3 График подбора Х1
Рис. 3 График подбора Х6
Рис. 5 График нормального распределения
Таблица 2
Признаки X и Y |
|||||
Для Y и X1 |
888,142 |
0,00985 |
29,802 |
0,0992 |
|
Для Y и X6 |
22,39 |
0,00985 |
4,732 |
0,0992 |
|
Для X1 и X6 |
22,39 |
888,142 |
4,732 |
29,802 |
Таблица 3 Матрица парных коэффициентов корреляции R:
- |
y |
x1 |
X6 |
|
y |
1 |
-0,00434 |
0,962 |
|
x1 |
-0,00434 |
1 |
0,163 |
|
X6 |
0,962 |
0,163 |
1 |
Приложение 2
Таблица 1 Парная регрессия У на Х1
ВЫВОД ИТОГОВ |
Регрессионная статистика |
||||||||
Множественный R |
0,004339 |
||||||||
R-квадрат |
1,88E-05 |
||||||||
Нормированный R-квадрат |
-0,04346 |
||||||||
Стандартная ошибка |
0,103474 |
||||||||
Наблюдения |
25 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
4,64E-06 |
4,64E-06 |
0,000433 |
0,983576 |
||||
Остаток |
23 |
0,246258 |
0,010707 |
||||||
Итого |
24 |
0,246263 |
|||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
0,851305 |
0,078904 |
10,78916 |
1,79E-10 |
0,68808 |
1,014529 |
0,68808 |
1,014529 |
|
Х1 |
-1,4E-05 |
0,000694 |
-0,02081 |
0,983576 |
-0,00145 |
0,001422 |
-0,00145 |
0,001422 |
|
Среднее |
Эл |
Сто |
В-коэф |
||||||
0,84972 |
0,101296 |
||||||||
109,648 |
-0,00186 |
30,41624 |
-0,00434 |
||||||
ВЫВОД ОСТАТКА |
ВЫВОД ВЕРОЯТНОСТИ |
||||||||
Наблюдение |
Предсказанное У |
Остатки |
Стандартные остатки |
Персентиль |
У |
A |
|||
1 |
0,849195 |
-0,30419 |
-3,00304 |
2 |
0,545 |
0,558155 |
|||
2 |
0,84827 |
-0,14727 |
-1,45386 |
6 |
0,701 |
0,210085 |
|||
3 |
0,85064 |
-0,12964 |
-1,27982 |
10 |
0,721 |
0,179806 |
|||
4 |
0,850279 |
-0,11028 |
-1,08868 |
14 |
0,74 |
0,149025 |
|||
5 |
0,849946 |
-0,10595 |
-1,04591 |
18 |
0,744 |
0,142401 |
|||
6 |
0,850423 |
-0,10342 |
-1,021 |
22 |
0,747 |
0,138451 |
|||
7 |
0,850235 |
-0,08724 |
-0,8612 |
26 |
0,763 |
0,114332 |
|||
8 |
0,849469 |
-0,04747 |
-0,46862 |
30 |
0,802 |
0,059189 |
|||
9 |
0,849871 |
-0,01687 |
-0,16655 |
34 |
0,833 |
0,020253 |
|||
10 |
0,849672 |
0,044328 |
0,437615 |
38 |
0,894 |
0,049584 |
|||
11 |
0,849744 |
0,050256 |
0,496135 |
42 |
0,9 |
0,05584 |
|||
12 |
0,849643 |
0,054357 |
0,536622 |
46 |
0,904 |
0,06013 |
|||
13 |
0,849585 |
0,055415 |
0,547065 |
50 |
0,905 |
0,061232 |
|||
14 |
0,849715 |
0,056285 |
0,555653 |
54 |
0,906 |
0,062125 |
|||
15 |
0,849758 |
0,063242 |
0,62433 |
58 |
0,913 |
0,069268 |
|||
16 |
0,849845 |
0,064155 |
0,633346 |
62 |
0,914 |
0,070191 |
|||
17 |
0,849672 |
0,068328 |
0,674546 |
66 |
0,918 |
0,074432 |
|||
18 |
0,849715 |
0,068285 |
0,674118 |
70 |
0,918 |
0,074385 |
|||
19 |
0,849599 |
0,071401 |
0,704876 |
74 |
0,921 |
0,077525 |
|||
20 |
0,849527 |
0,072473 |
0,715461 |
78 |
0,922 |
0,078604 |
|||
21 |
0,8497 |
0,0733 |
0,723621 |
82 |
0,923 |
0,079414 |
|||
22 |
0,849787 |
0,073213 |
0,722765 |
86 |
0,923 |
0,079321 |
|||
23 |
0,849426 |
0,077574 |
0,76582 |
90 |
0,927 |
0,083683 |
|||
24 |
0,849614 |
0,077386 |
0,763966 |
94 |
0,927 |
0,08348 |
|||
25 |
0,849672 |
0,082328 |
0,812756 |
98 |
0,932 |
0,088335 |
|||
DW |
0,130094 |
10,87699 |
|||||||
RS |
0,065399 |
||||||||
Стьюдент.Обр.2Х |
2,063899 |
Рис. 1 График остатков Х1
Рис. 2 График подбора Х1
Рис. 3 График нормального распределения
Приложение 3
Таблица 1 Парная регрессия У на Х6
ВЫВОД ИТОГОВ |
Регрессионная статистика |
||||||||
Множественный R |
0,962033 |
||||||||
R-квадрат |
0,925508 |
||||||||
Нормированный R-квадрат |
0,922269 |
||||||||
Стандартная ошибка |
0,028242 |
||||||||
Наблюдения |
25 |
||||||||
Дисперсионный анализ |
|||||||||
df |
SS |
MS |
F |
Значимость F |
|||||
Регрессия |
1 |
0,227918 |
0,227918 |
285,7572 |
1,82E-14 |
||||
Остаток |
23 |
0,018345 |
0,000798 |
||||||
Итого |
24 |
0,246263 |
|||||||
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Нижние 95,0% |
Верхние 95,0% |
||
Y-пересечение |
-0,65206 |
0,089019 |
-7,32496 |
1,88E-07 |
-0,83621 |
-0,46791 |
-0,83621 |
-0,46791 |
|
Х6 |
0,020179 |
0,001194 |
16,90435 |
1,82E-14 |
0,017709 |
0,022648 |
0,017709 |
0,022648 |
|
Среднее |
Эл |
СКО |
В-коэф |
||||||
0,84972 |
0,101296 |
||||||||
74,424 |
1,767386 |
4,829362 |
0,962033 |
||||||
ВЫВОД ОСТАТКА |
ВЫВОД ВЕРОЯТНОСТИ |
||||||||
Наблюдение |
Предсказанное У |
Остатки |
Стандартные остатки |
Персентиль |
У |
A |
|||
1 |
0,611126 |
-0,06613 |
-2,3918 |
2 |
0,545 |
0,121333 |
|||
2 |
0,756413 |
-0,05541 |
-2,00431 |
6 |
0,701 |
0,079049 |
|||
3 |
0,736235 |
-0,01523 |
-0,55104 |
10 |
0,721 |
0,02113 |
|||
4 |
0,71202 |
0,02798 |
1,012035 |
14 |
0,74 |
0,037811 |
|||
5 |
0,728163 |
0,015837 |
0,57282 |
18 |
0,744 |
0,021286 |
|||
6 |
0,691841 |
0,055159 |
1,995095 |
22 |
0,747 |
0,07384 |
|||
7 |
0,720092 |
0,042908 |
1,552001 |
26 |
0,763 |
0,056236 |
|||
8 |
0,810896 |
-0,0089 |
-0,32177 |
30 |
0,802 |
0,011092 |
|||
9 |
0,839146 |
-0,00615 |
-0,22231 |
34 |
0,833 |
0,007379 |
|||
10 |
0,921879 |
-0,02788 |
-1,0084 |
38 |
0,894 |
0,031185 |
|||
11 |
0,925915 |
-0,02591 |
-0,93735 |
42 |
0,9 |
0,028794 |
|||
12 |
0,9017 |
0,0023 |
0,083175 |
46 |
0,904 |
0,002544 |
|||
13 |
0,875468 |
0,029532 |
1,068174 |
50 |
0,905 |
0,032632 |
|||
14 |
0,905736 |
0,000264 |
0,009541 |
54 |
0,906 |
0,000291 |
|||
15 |
0,897665 |
0,015335 |
0,55468 |
58 |
0,913 |
0,016797 |
|||
16 |
0,933986 |
-0,01999 |
-0,72291 |
62 |
0,914 |
0,021867 |
|||
17 |
0,905736 |
0,012264 |
0,443583 |
66 |
0,918 |
0,013359 |
|||
18 |
0,923897 |
-0,0059 |
-0,2133 |
70 |
0,918 |
0,006424 |
|||
19 |
0,919861 |
0,001139 |
0,041185 |
74 |
0,921 |
0,001236 |
|||
20 |
0,925915 |
-0,00391 |
-0,14161 |
78 |
0,922 |
0,004246 |
|||
21 |
0,905736 |
0,017264 |
0,624434 |
82 |
0,923 |
0,018704 |
|||
22 |
0,931969 |
-0,00897 |
-0,3244 |
86 |
0,923 |
0,009717 |
|||
23 |
0,923897 |
0,003103 |
0,112233 |
90 |
0,927 |
0,003347 |
|||
24 |
0,895647 |
0,031353 |
1,134049 |
94 |
0,927 |
0,033822 |
|||
25 |
0,942058 |
-0,01006 |
-0,3638 |
98 |
0,932 |
0,010792 |
|||
DW |
0,96579 |
2,659653 |
|||||||
RS |
0,275477 |
||||||||
СТЬЮДЕНТ.ОБР.2Х |
2,063899 |
Рис. 1 График остатков Х6
Рис. 2 График подбора Х6
Рис. 3 График нормального распределения
Размещено на Allbest.ru
Подобные документы
Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.
задача [142,0 K], добавлен 20.03.2010Построение диаграммы рассеяния, иллюстрирующей взаимосвязь переменных, гипотеза о виде их функциональной зависимости. Сущность линейной однофакторной регрессии, интервальные оценки ее коэффициентов. Расчет значения линейного коэффициента корреляции.
контрольная работа [235,6 K], добавлен 04.11.2013Методика определения параметров линейной регрессии, составления экономической интерпретации коэффициентов регрессии. Проверка выполнения предпосылок МНК. Графическое представление физических и модельных значений. Нахождение коэффициентов детерминации.
контрольная работа [218,0 K], добавлен 25.05.2009Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.
контрольная работа [108,5 K], добавлен 28.03.2018Особенности расчета параметров уравнений линейной, степенной, полулогарифмической, обратной, гиперболической парной и экспоненциальной регрессии. Методика определения значимости уравнений регрессии. Идентификация и оценка параметров системы уравнений.
контрольная работа [200,1 K], добавлен 21.08.2010Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.
контрольная работа [817,3 K], добавлен 01.04.2010Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.
контрольная работа [110,4 K], добавлен 28.07.2012Определение параметров уравнения линейной регрессии. Экономическая интерпретация коэффициента регрессии. Вычисление остатков, расчет остаточной суммы квадратов. Оценка дисперсии остатков и построение графика остатков. Проверка выполнения предпосылок МНК.
контрольная работа [1,4 M], добавлен 25.06.2010