Регрессионный анализ

Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 28.03.2018
Размер файла 108,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Контрольная работа

Регрессионный анализ

Содержание

1. Задачи и этапы регрессионного анализа. Зависимые и независимые переменные

2. Парная линейная регрессия. Линейное уравнение парной регрессии

3. Метод наименьших квадратов для парной регрессии, как метод оценивания параметров линейной регрессии

4. Анализ статистической значимости коэффициентов линейной регрессии

5. Ошибка коэффициентов регрессии. Доверительные интервалы линии регрессии

6. Множественная линейная регрессия

1. Задачи и этапы регрессионного анализа. Зависимые и независимые переменные

Аналитическая зависимость между X и Y называется уравнением регрессии и записывается в виде

Y = f (X).

Эта зависимость может быть линейной:

а) .

либо нелинейной:

б) ;

в) ;

г) .

Нелинейные соотношения можно с помощью не сложных математических операций привести к линейным. Эта процедура называется линеаризация. Выражения б) и в) прологарифмируем

Заменим

Получим:

А в выражении г) проведем замену переменных (1/X)=X', тогда г) запишется в виде:

.

Изучая экономику на любом уровне, прежде всегда возникает проблема установления и изучения основных экономических показателей и взаимосвязей между ними.

Экономические показатели называются факторами, переменными, предикаторами.

Все факторы делятся на группы для каждой из них строятся математические зависимости, соответствующие математическую модель задачи.

Для каждой задачи (проблемы) таких зависимостей может быть одна или несколько. При рассмотрении экономических процессов идет обработка больших массивов информации и часто целесообразно строить не одну математическую модель, а систему взаимосвязанных математических зависимостей. Их называют экономическими, либо эконометрическими моделями.

Модели имеют особенности, характерные для всех уровней моделирования.

1. Математическая модель является упрощением действительности, но включает главные характеристики изучаемого объекта.

2. Предполагается, что изменение экономических переменных рассчитывается с помощью совместных и одновременных операций нескольких экономических соотношений.

3. Цель построения математической модели - изучение реальной действительности, предсказание ее будущего, постановка возможных экспериментов и управление ими в целях улучшения состояния экономического объекта.

Экономико-математические модели записанные с помощью алгебраических формул являются точными функциональными соотношениями. Однако, изучения поведения экономической системы показывает, что между показателями существуют случайные колебания, не учитывать которые нельзя. Следовательно, необходимо ввести в модель стохастический член.

Для однофакторной модели

Y = f (X1, U ),

гдеX1 - самая важная независимая переменная;

U - переменная отражающая суммарный эффект от воздействия всех остальных факторов.

Таким образом, в процессе моделирования экономического процесса проходит несколько этапов.

Прежде всего проводится идентификация, т.е. проводится взаимно однозначное соответствие между экономическими показателями и переменными Xi.

Размещено на http://www.allbest.ru/

Где А - множество экономических показателей;

В - множество переменных.

Следующим этапом является спецификация формы связи между Y и Xi.

Одни и те же экономические показатели могут быть связаны различными функциональными соотношениями. Требуется среди множества альтернативных вариантов выбрать варианты, адекватно описывающий процесс.

Наиболее простой формой связи является линейная. Существует два критерия для ее построения.

1. Включить как можно больше переменных (предикаторов) в модель, чтобы прогноз по этой модели был более надежен.

2. Сбор информации и ее контроль качества связан с большими затратами, то стремятся строить регрессионные модели с меньшим числом переменных, но она должна отражать адекватно процесс.

Среди существующих методов выбора "наилучшего" уравнения регрессии следует выделить 10 основных

1. Метод всех возможных регрессий с использованием трех критериев: R2, S2 и критерия Маллоуза Cp.

2. Метод наилучшего подмножества регрессий с применением критериев R2, R2 (приведенного) и критерия Маллоуза Cp.

3. Метод исключения.

4. Шаговый регрессионный метод.

5. Некоторые вариации предыдущих методов.

6. Гребневую регрессию.

7. ПРЕСС.

8. Регрессию на главные компоненты.

9. Регрессию на собственные числа.

10. Ступенчатый регрессионный анализ.

От качества модели, от степени ее изоморфности изучаемой системы во многом зависят все дальнейшие результаты анализа, выбор значимых переменных, определяющих поведение системы в динамике, точность прогнозирования развития системы. Для управления объектом или системой необходима модель этой системы с выбором структуры и параметров системы управления.

Направление, разрабатывающее подходы и методы построения математической модели получило название идентификации.

Определение наилучшей модели в условиях реально существующей системы по данным статистическим данным и является главной задачей идентификации.

В узком смысле слова идентификация - оценка параметров при заданной структуре модели для обобщенных, преобразованных агрегированных временных рядов. Разработка математических моделей, которые описываются не только уравнениями регрессии, но и алгоритмически приводит к применению имитационных моделей. Для их идентификации служит более тонкий, чем регрессионный анализ, математический аппарат. Сюда относятся методы функционального анализа, теории групп, топологии и т.д.

2. Парная линейная регрессия. Линейное уравнение парной регрессии

Наиболее простым уравнением регрессии является его линейная форма:

Y = a0 + a1X - однофакторная

Y = a0 + a1X1 + a2X2 +...+ an Xn - многофакторная

Модели с включением обобщенного случайного предикатора

Y = a0 + a1X + U - однофакторная

Y = a0 + a1X1 + a2X2 +...+ anXn + U - многофакторная.

Математическая модель может содержать несколько уравнений и тождеств. Каждое из них является структурным соотношением модели. Совокупность структурных соотношений с предложениями о свойствах стохастического возмущения, записанным в виде математических выражений (условий) составляют полную спецификацию модели.

Набор численных значений неизвестных параметров:a0, a1, a2,...,an и 2 - позволяют выделить специфическую структуру в рамках рассматриваемой модели.

Спецификация опирается на интуитивные представления, знания и экономические теории. Если элементы матрицы А и В получают численные значения, мы получаем внутреннюю структуру данной модели. Коэффициенты матриц А и В могут принимать нулевые значения, если эти переменные в данном соотношении отсутствуют. Специфическая конфигурация матриц А и В отражает априорные знания о системе и возмущающих воздействиях.

Если спецификации модели выбрана правильно, оцениваем значения параметров этой структуры и идентифицируем ее с изучаемым процессом. Так как возмущения носят стохастический характер, то для оценивания строят функции правдоподобия для выборочных наблюдений и вывод - оценок структурных параметров из условия минимизации функции правдоподобия.

В эконометрике мы предполагаем стохастические связи между зависимой и независимыми переменными. Простая форма стохастической связи между переменными Y и X называется линейной регрессионной моделью. Формально эта модель может быть представлена

Y = + X + ,(1)

где Y - зависимая переменная, X - независимая переменная и является стохастической ошибкой. и являются параметрами регрессионной модели, которые необходимо вычислить по эмпирическим статистическим данным.

Значения Y и X могут быть наблюдены, но значения нет. Наблюдения значений Y и X могут быть получены из статистических временных динамических рядов или по наблюдением отдельных предприятий, отраслей или рыночных агентов. Тогда эти данные называются пространственной выборкой.

Стохастический характер регрессионной модели означает, что каждому значению X соответствует полная вероятность распределения значений Y. Другими словами оценка Y никогда точно предсказать невозможно. Так как неопределенность параметров Y появляется в силу присутствия в уравнении (1) стохастической ошибки .

Например, мы вычислим производственную функцию фирмы. Предположим, что выпуск продукции зависит только от количества затрат рабочей силы, так как другие, материальные затраты в краткосрочном периоде фиксированы. Но и в этом случае некоторое количество рабочей силы может привести к получению различного количества выпуска в силу изменения погоды, человеческих усилий, работы (поломки) машин и оборудования и других факторов. Выпуск, который в данном случае является переменной не только зависит от количества рабочей силы (независимой, объясняющей переменной), но и от многих случайных причин, которые суммированы в значении ошибки . Поэтому вероятность распределения Y определяются значениями независимой переменной X и вероятностью распределения ошибки .

Необходимо отметить, что полная спецификация регрессионной модели включает не только оценку регрессионного уравнения (1), но и спецификацию вероятности распределения ошибки, а также определение значений независимой переменной. Эта информация дана в первоначальных допущениях.

Рассмотрим однофакторную линейную зависимость. Аналитическая зависимость или уравнение регрессии будет

,

где, a0, a1 - параметры - постоянные величины (const);

Y - значение результативного признака, рассчитанного только от факторного признака.

Теснота связи между факторами X и Y опреляется с помощью коэффициента корреляции (r) для линейной формы связи:

, (2)

где- средняя произведения XY;

- средняя фактора X;

- средняя фактора Y;

x - среднее квадратическое отклонение X;

y - среднее квадратическое отклонение Y.

Для вычисления доли дисперсии, образующейся под влиянием фактора X в доле дисперсии используется коэффициент детерминации (D).

(D) = r 2.

Величина (1-r 2) называется коэффициентом остаточной дисперсии и характеризует долю вариации за счет неучтенных факторов.

Оценка надежности показателя тесноты связи производится по формуле:

,

где r - коэффициент корреляции;

n - число наблюдений.

Если r>3r при n>50, то считают, что связь действительно существует.

В случае нелинейной связи теснота связи оценивается с помощью индекса корреляции. В случае линейной зависимости индекс корреляции равен коэффициенту корреляции. Индекс корреляции рассчитывается по формуле:

,

Где - общая вариация, за счет всех факторов;

- остаточная дисперсия.

При построении линейной однофакторной модели следует обратить внимание на некоторые ее недостатки:

1. Нельзя адекватно отразить процесс в модели только с помощью одного, хотя и самого существенного фактора.

Например, изучая объем валового сбора хлопка-сырца можно за основной самый существенный фактор взять - урожайность, но при более тщательном рассмотрении необходимо учитывать и такие факторы как количество и качество земель, удобрения (их количество, качество, сроки внесения), полив, температурный режим и т.д. Таким образом, количество "основных" факторов может возрасти до бесконечности. Выход: переходить от однофакторной к многофакторной модели. Но и это не исключает ошибок в расчетах за счет того, что кроме основных факторов на функцию влияет еще множество случайных второстепенных факторов. Часто их влияние незначительно и носит противоположный характер. Суммарный эффект от всех этих факторов оценивается случайной переменной "U", которая может принимать то положительные, то отрицательные значения. Линейная зависимость будет:

Y = f (X1, U),

или

Y = f (X1, X2, ..., Xn, U).

Переменная "U" выступает как стохастическое возмущение или ошибка, обладающая свойствами:

- обладает вероятностным нормальным распределением;

- имеет нулевую среднюю;

- имеет конечную дисперсию ;

- является ошибкой измерения.

Занимаясь сбором статистического материала, исследователь часто вместо истинных значений параметров закладывает параметры со скрытой ошибкой (они могут носит как объективный так и субъективный характер, неточность расчетов параметров, нечеткий документооборот, субъективные оценки отдельных параметров и т.д.). Все выше перечисленные недостатки приводят к тому, что ошибки измерения перейдут в ошибку уравнения.

Y = a0 + a1X + W,

где W = U +V, W - совокупная ошибка; U - стохастическое возмущение; V - ошибка измерения.

Наиболее простой связью является линейная однофакторная, либо линейная многофакторная модель с принятием некоторых гипотез относительно случайного возмущения:

- среднее равно нулю;

- дисперсия const и не зависит от основных факторов;

- случайные возмущения не зависят друг от друга.

В случае линейной однофакторной зависимости графически это будет выглядеть так:

Y=a0+a1 X

Рис. 1.

Из рис.1 видно, что точки располагаются вблизи некоторой прямой Y=a0+a1X, в случае многофактороной:

Yi = a0i + a1iXi + Ui.

Коэффициенты a0 и a1 можно определить, исходя из условий:

E(U)= 0,iN

.

3. Метод наименьших квадратов для парной регрессии, как метод оценивания параметров линейной регрессии

При рассмотрении простых экономических моделей задачу расчета параметров модели можно решить с помощью стандартных методов. Классическим является метод наименьших квадратов. Однако, в более сложных ситуациях при рассмотрении сложных эконометрических моделей необходима разработка новых методов с использованием сложных технических приемов.

Способ наименьших квадратов.

Проблема оценки параметров регрессионной модели может рассматриваться как вычисление параметров вероятности распределения зависимой переменной Y. Как видно из вышеуказанных, в силу принятых предположений в модели Yi нормально распределен со средней

E(Y)=+ X

и вариацией

var (Y)=2.

Проблема оценки регрессионных параметров и эквивалентно проблема вычисления средней Yi. Она может быть разрешена множеством способов.

Рассмотрим способ наименьших квадратов. В этом способе принцип вычисления состоит в том, чтобы найти минимум суммы квадратов отклонений наблюденных значений Yi от их среднего значения. Следовательно, нам необходимо найти среднюю, которая делает требуемую сумму отклонений минимальной. Таким образом:

,

или

где, S - сумма квадратов отклонений.

Для нахождения значений и , минимизирующих сумму требуется взять первую производную S относительно и :

Приравняв нулю значения каждой производной нулю и обозначая вычисленные значения и соответственно , мы получим:

или эквивалентно:

(*)

Эти уравнения известны как нормальные уравнения наименьших квадратов. Поэтому, мы можем записать:

где ее представляют остатки наименьших квадратов и нормальные уравнения наименьших квадратов могут быть представлены в простой форме:

.

Уравнения () могут быть решены относительно . Решение относительно есть :

Это уравнение можно записать в несколько иной формуле:

которое является числителем для оценки . А также

которое является знаменателем при оценке . Следовательно, мы можем записать:

.

После нахождения значения оценку параметра можно получить из первого уравнения (). Таким образом,

(3)

который означает, что теоретическая линия, проходит через средние точки и оценочные параметры для модели с k - ми переменными может быть получены как прежде с применением способа наименьших квадратов, но нахождение суммы квадратов отклонений сводится к решению линейных уравнений с k-ми неизвестными. Система уравнений выглядеть довольно сложной и задача сводится к нахождению неизвестных параметров.

Эта система уравнений выглядит:

В вышеприведенных уравнениях все суммы: суммы квадратов и суммы продуктов представляют количества, которые вычисляются по исходным данным, касающимся наблюдений над зависимой переменной Y и над всеми независимыми переменными от X2 до Xk. Все суммы изменяются от единицы до n (t=1, 2, ... , n). Первое уравнение выглядит иначе, чем остальные. Вспомним, что X1t=1; t =1, 2, ... , n.

Так,

и

Если необходимо вычислить параметры модели, которая не содержит точку пересечения, то можно исключить из вычисления X1, вычисляя независимые переменные от X2 до Xk.

Порядок вычисления параметров независимых переменных рассмотрим на конкретном примере. Предположим, что нужно вычислить параметры 1, 2 и 3 в модели

Yt = 1 + 2X2t + 3X3t + U, (4)

при наличии наблюденных значений Y, X2 и X3 .

t

Yt

X2t

X3t

1

10

10

12

2

13

8

14

3

15

6

18

4

20

5

30

5

18

3

25

n=5

Yt=76

X2t=32

X3t=99

В случае k=3 уравнения (4) выглядит конкретно

Рассчитывая другие колонки, можем составит таблицу

100

120

100

144

120

104

182

64

196

112

90

270

36

324

108

100

600

25

900

150

54

450

9

625

75

=234

=2189

Используя вышеприведенные значения решаемая система нормальных уравнений записана как

Приведенная система линейных уравнений может быть решена методом последовательного исключения Гаусса. Для этого первое уравнение умножим и вычитая результат из второго уравнения, исключим 1 из второго уравнения:

или

Умножая первое уравнение на (99/5 = 19.8) и вычитая результат из третьего уравнения возможно исключить из третьего уравнения:

Теперь два уравнения с двумя неизвестными и :

Исключение дает

[228.8+ 68.6(2.3493)]= [117.2+ 38.4 (2.3493)],

[228.8 + 161.16]= [117.2 + 90.21],

389.96 = 207.41,

= 207.41/389.96 = 0.5318.

При известности значения вычислить параметр можно подставляя оценку =0.5318 в одно из уравнения (7)

[29.2 - 68.6(0.5318)] = - 38.4,

29.2 - 36.4815 = - 38.4.

Отсюда

Следовательно =- 0.0657.

И наконец, оценка может быть проведена используя одно из уравнений (6):

5+ 32( - 0.0657) + 99(0.5318) = 76,

5 - 2.1024 + 52.648 = 76,

5= 76 + 2.1024 - 52.648,

= 25.454/5,

= 5.091.

Так, вычисленное уравнение регрессии записывается как

Если проверить правильность решения, то она отклоняется на точность округления данных.

В уравнении регрессии с двумя неизвестными возможно найти другое приближенное решение подставляя значения отклонений, полученных из статистических данных. Если предположить, что k=3 и система нормальных уравнений может быть выражена в форме отклонений искомых переменных:

Сопоставление уравнений (5) и (8) показывает, что, чтобы получить нормальное уравнение в форме отклонений, первое уравнение исключено из системы, часть исключено из последующих других уравнений и все оставшиеся уравнения переписаны в отклонениях, полученных из выборочных данных.

Уравнения (8) используются для вычисления параметров неизвестных. Коэффициент пересечения кривой с осью ординаты вычисляется в конце решения из уравнения

В случае, когда k равен 3 вышеприведенное уравнение записывается как

Завершая параграф, можно сказать, что выше описанный способ вычисления рассматривается как множественная регрессия Y от неизвестных X1, X2, ..., Xk. В нем искомые параметры , , ..., являются коэффициентами регрессии.

4. Анализ статистической значимости коэффициентов линейной регрессии

Для проверки значимости уравнения регрессии воспользуемся критерием дисперсионного анализа (F-критерием). Предполагается, что вектор имеет нормальный закон распределения.

Предварительно докажем тождество

YTY (Y- Xb)T(Y- Xb)+(Xb)T (Xb)

Преобразуем правую часть тождества и поставим в него выражение

(Y- bTXT)(Y- Xb)+(bTXT)(Xb)=YT Y - YTXb - bTXTY+2bTXTXb=

= YT Y - YTXb - (YTXb)T +2 bT(XTX)(XTX)-1 XTY = YTY.

Так как есть скалярная величина, то

(YTXb)=(YTXb)T.

Мы доказали справедливость тождества. Проанализируем теперь смысл слагаемых этого тождества.

Уравнение регрессии. без свободного члена, поэтому . Тогда Qобщ = YTY= есть сумма квадратов отклонения yi от средней .

Первое слагаемое тождества

есть сумма квадратов остатков или сумма квадратов отклонения результатов наблюдения yi от регрессии

Второе слагаемое

QR =(Xb)T(Xb) =

есть сумма квадратов отклонений от общей средней , обусловленных регрессией.

Таким образом, согласно

Qобщ=QR + Qост .

Мы имеем разложение общей вариации на составляющие.

Так как ранг n квадратичной формы Qобщ уравнения (22) равен сумме рангов k и (n - k) квадратичных форм QR и Qост , стоящих в правой части (22), то, согласно теореме Кохрана, слагаемые правой части QR и Qост независимы.

Согласно

Определим теперь математическое ожидание второго слагаемого QR

M QR = M [(X b)T (X b)] = M (bT XT X b).

Подставив выражения (11) и (15) и учитывая, что bT= YT X(XT X)-1, будем иметь

M QR = M[(T +TXT)X(XT X)-1 XT(X +)] =

=M[TX(XTX)-1 XT]+TXTX =

= K2 +TXTXb.

Если предположить, что =0, где 0 - нулевой вектор, то

M QR = K2

Откуда

Мы показали, что при выполнении условия =0, т.е. когда

1=2=3 ... k=0,

являются независимыми оценками одной и той же дисперсии 2.

В этой связи для проверки гипотезы H0 : = 0 используется статистика

которая при выполнении гипотезы H0 имеет F-распределение с k и n-k степенями свободы.

Если уравнение регрессии незначимо, т.е. все коэффициенты уравнения регрессии для генеральной совокупности равны нулю, то на этом анализ уравнения заканчивается.

Если же нулевая гипотеза H0: = 0 отвергается, то представляет интерес проверить значимость отдельных коэффициентов регрессии и построить интервальные оценки для значимых коэффициентов.

Значимость коэффициентов регрессии можно проверить с помощью F - критерия, основанного на статистике

которая имеет при выполнении гипотезы H0 : = 0 распределение Фишера-Снедокора с числом степеней свободы 1 и n - k.

5. Ошибка коэффициентов регрессии. Доверительные интервалы линии регрессии

Пусть вектор ошибок имеет нормальное распределение. В этом случае вектор Y наблюдений (11) также имеет нормальное распределение и из некоррелированности наблюдений следует их независимость.

Согласно (15) оценка bj (j=1,2,...,k) имеет нормальный закон распределения с математическим ожиданием j и дисперсией

D(bj)=2 [(XTX)-1 )]jj .

Откуда

имеет нормированный нормальный закон распределения.

Согласно (21), статистика

имеет распределение 2 с n-k степенями свободы.

Подставив Z и U в получим выборочную характеристику

которая имеет распределение Стьюдента с n-k степенями свободы. Используя (24), построим с надежностью интервальную оценку для j.

или

Полная спецификация простой линейной регрессионной модели состоит из регрессионного уравнения (1) и пяти первоначальных допущений. Приступим к рассмотрению этих допущений. Первые два предположения касаются того, что для каждого значения X ошибки распределены нормально вокруг значения ноль. Предполагается, что j является непрерывной величиной, изменяющей от - до + , которая симметрично распределена вокруг средней и ее распределение полностью определяется двумя параметрами: средней и вариацией. Следовательно:

Первое предположение: i нормально распределена.

Второе предположение: E(ii)=0 средняя ошибки равна нулю.

В действительности мы можем рассматривать каждое значение стохастической ошибки как результат множества причин, в котором, каждая причина незначительно отклоняет зависимую переменную от того значения, когда она являлась бы детерминистической. При таком рассмотрении аналогия ошибки измерения с ошибкой распределения правильна и поэтому предположения о нормальности и нулевой средней ошибки идентичны.

Третье предположение относится к гомоскедичности, означающая, что каждая ошибка имеет одну и ту же вариацию 2, значение которой неизвестно. Это предположение согласуется с утверждением, о том, например, что возможность дисперсии ошибки для больших значений X, такая же как для малых значений. В производственной функции, рассмотренной выше, согласно этому предположению вариация в выпуске, такая же не зависимо от значений рабочей силы, например, 20, 100 или другие количества рабочих.

Третье предположение: Гомоскедичность: var(i)= 2.

Четвертое предположение связано с автокорреляцией в остатках. Предполагается, что между ошибками нет автокорреляции, т.е. отсутствие автокорреляции

cov(i , j)=0 ( i j ).

Это предположение означает тот факт, что если сегодня фактический выпуск больше чем ожидаемый и отсюда нельзя сделать вывод, что завтра выпуск будет больше (или меньше). регрессия уравнение множественный

Первое и четвертое утверждение вместе позволяют сказать с позиции вероятности, что ошибки распределения независимы. Поэтому 1, 2,..., n могут быть рассмотрены как идентичные и независимые распределения переменной. Так как E(i)=0 и это означает var(i)=E()2. Отсюда

cov(i, j) = E(i, j).

Заключительное, пятое, предположение утверждает, что независимая переменная X нестохастическая. Другими словами, предполагается, что значения X контролируемы или полностью прогнозируемы. Важное применение этого предположения состоит в том, что E(i, Xj) = XjE(i)=0 для всех значений i и j.

Пятое предположение: Нестахостичность значений X, которые в выборке идентичны независимо от размера выборки

(11)

и отличен от нуля и ее лимит n конечное число.

На практике, конечно, трудно точно соблюсти абсолютное наличие указанных предположений, однако мы удовлетворяемся если эти предположения соблюдаются приблизительно. Вышеуказанные предположения для составления классической линейной регрессионной модели необходимы для вычисления параметров регрессии.

Так как ошибки распределения предполагаются нормальными и равными нулю, неизвестной является дисперсия отклонений 2. В регрессионной модели (11) неизвестными являются значения параметров и , а также вариация ошибок 2.

После полной спецификации регрессионной модели, представленной регрессионным уравнением и пятью предположениями рассмотрим теперь ее некоторые особенности. Прежде всего, вернемся к вероятности распределения зависимой переменной Y.

Первое, среднее функции Yi может быть получено как математическое ожидание двух частей уравнения (1)

E(Yi) = E(+Xi + i) = +Xi. (12)

Это следует из спецификации параметров и и нестохастичности Xi (это заданное число) и средняя i=-0 (предположение второе). Далее, вариация Yi есть

var(Yi)=E [Yi - E (Yi)]2 = E[( + Xi + i) - (+Xi)]2 =E(i2) =2. (13)

Уравнение (12), которое дает усредненное значение переменной Y для каждой зависимой переменной X, называется эмпирическая линия регрессии.

Пересечение этой линии с ординатой соответствует величине , измеряющей оценку Y при значении X равном нулю. Наклон линии , измеряет изменение значения Y на каждое дополнительную единицу значения X. Если, например, Y представляет агрегированное потребление, X - агрегированный доход, то измеряет уровень потребления при нулевом доходе и представляет предельную склонность к потреблению. Так как значения этих параметров неизвестны, эмпирическая линия регрессии неизвестна. Когда мы вычисляем значения параметров и , получим теоретическую линию регрессии. Если значения и , вычислены, соответственно как , тогда теоретическая линия регрессии задана уравнением

где сглаженные значения Y. Многие, если не все, значения эмпирические Y значения не лежат на теоретической линии, поэтому значения Yi и не совпадают. Эти разницы называются остатками и обозначаются ei. Поэтому мы различаем следующие уравнения:

Yi =+Xi + i (эмпирическая),

(теоретическая).

Следует заметит, что, в общем, значения еi отличаются от значений i, так как различаются от значений и . Фактически, можно сказать, что остатки еi являются оценками ошибок I. Альтернативно можно сказать, что ei используются для приблизительной оценки распределения i. Это показано на рисунке 2.

Y ei IE(Y)=X

Yi XiX

Рис. 2.

6. Множественная линейная регрессия

Зависимая переменная, представленная в экономической системе как зависимая от одной независимой переменной является упрощением. Теперь необходимо предположить более общую форму зависимости, которая рассматривает множество независимых переменных. Обозначим, как прежде, зависимую переменную Y и множество независимых переменных вектором X.

Единичное наблюдение объяснимой переменной обозначается как Xjt, где j - нумерация переменной (j=1,2,...,k), а t - нумерация наблюдения. Полный перечень обозначений Yt , где t=1,2,...,n и Xjt, j=1,2,..., k; t=1,2, ..., n.

Необходимо различать степень зависимости независимых переменных в модели и эти параметры обозначены Bj, j= 1,2,...,k.

В рамках данного анализа можно рассмотреть точку пересечения, переменной X1, которая рассматривает единственное (одно) значение X1t=1 для всех t. Если это справедливо 1 является точкой пересечения функции с линией ординаты и линейная модель с k - ми переменными записывается как:

Yt = 1 +2X2t + 3X3t + ...+ kXkt + Ut, (t=1,2,...,n) (14)

Как обозначено выше, k является нумерацией объяснимых переменных, включая искусственную переменную X1. Следовательно, модель с k-ми переменными включает Y, X2, X3, ... , Xk.

Например, модель с двумя переменными записывается как

Yt = 1 +2X2t + Ut, (t=1, 2, ... , n)

где две главные переменные Y и X2, однако объяснимой (независимой) переменной является X2, и опущенная искусственная переменная X1.

Уравнение (14) выглядит довольно сложным, однако его можно детально рассмотреть для случая с двумя переменными. Для изучения смысла параметров модели, временно, допустим отвлечемся от наличия ошибок в уравнении и рассмотрим только линейную зависимость переменных

Y = 1 +2X2 + 3X3 + ...+ kXkt, (15)

Уравнение (15) имеет те же свойства как между линейными зависимостями двух переменных, например, изменения объяснимой переменной Xj на одну единицу может привести (сопровождается) к изменению j в зависимой переменной и это справедливо для всех возможных значений Xj. Каждый параметр j (кроме 1) представляет наклон функции. Наклон кривой это свойство линейной зависимости, который измеряется постоянными параметрами, независящими от принимаемых значений переменных. Параметр j измеряет влияние изменения Xj на Y при фиксированных значениях всех остальных переменных.

Простой способ представления изменений объяснимых переменных многомерной связи это сгруппировать переменную и постоянную части

Y = точка пересечения + j Xj .

В таком представлении j измеряет наклон функции, однако такая интерпретация справедливо для одной переменной при фиксированных значениях остальных (ceteris paribus). В этой главе объяснимые переменные рассмотрены неслучайными. Экономическая интерпретация такого допущения может опираться на предположении политики как стабильной. Другое объяснение неслучайности объяснимых переменных может опираться на том, что значения переменных другими зависимостями.

Рассмотрим случай с функцией потребления. Допустим, что в дополнение к располагаемому доходу (Д), уровень ликвидности активов (Л) домашних хозяйств является главным показателем потребительских расходов (П).

Пt = 1 + 2Дt + 3Лt +Ut , t = 1, 2, ... , n (16)

Все переменные выражены в реальных измерениях. Было бы нереалистичным допустить располагаемый доход и ликвидные активы фиксированными политикой. Поэтому правильно интерпретировать, что количество обеих указанных переменных определены другими переменными в системе, например, включая законодательных инструментов фискальной и монетарной политики. Было бы идеально включить эти переменные в модель, однако тогда модель стало бы сложной. Использование уравнения (3) может отмечено как частный случай многомерной зависимости с условием того, что значения дохода и ликвидных активов сформированы экзогенно.

Независимо от типа рассмотрения (стохастический или нестохастический) неслучайных переменных, ясно, что нужно использовать единицы измерения. В уравнении (16) параметр 2 представляет меру изменения в располагаемом доходе при фиксированных значениях ликвидных активов. Следует отметить, что в действительности "чистое" изменение потребления от уровня располагаемого дохода в истории экономических систем не встречается. Несмотря на такую трудность, объектом анализа должен быть изоляция "чистого" эффекта от изменения дохода. И этот "чистый" эффект влияния представлен параметром 2.

Литература

1. Бородич С.А. Эконометрика. Минск: Новое знание, 2011.

2. Нименья И.Н. Эконометрика. СПб.:Издательский Дом «Нева», 2013.

3. Ежеманская С.Н. Эконометрика. Ростов - на Дону, Феникс, 2013.

4. Замков О.О. Математические методы и модели. -М.: ДиС, 2010.

5. Замков О.О. Эконометрические методы в макроэкономическом анализе. М 2003.

6. Магнус Я.Р. и другие. Эконометрика. М.: Дело,2010.

7. К.Доугерти. Введение в эконометрику. ИНФРА-М,2009.

8. Н.Ш.Кремер, Путко Б.А. Эконометрика.М.:ЮНИТИ-ДАНА,2012.

9. Айвазян С.А., Мхитарян В.С. Прикладная статистка и эконометрика. М.:МЭСИ,2010.

10. Моделирование и прогнозирование экономических показателей на основе информационных технологий: Учеб. пос./Н.М.Махмудов. -Т.: ТГЭУ, 2012.

Размещено на Allbest.ru


Подобные документы

  • Определение параметров линейной регрессии и корреляции с использованием формул и табличного процессора MS Excel. Методика расчета показателей парной нелинейной регрессии и корреляции. Вычисление значений линейных коэффициентов множественной детерминации.

    контрольная работа [110,4 K], добавлен 28.07.2012

  • Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.

    курсовая работа [233,1 K], добавлен 21.03.2015

  • Параметры уравнения и экономическое толкование коэффициента линейной регрессии. Расчет коэффициентов детерминации и средних относительных ошибок аппроксимации. Построение структурной формы модели с использованием косвенного метода наименьших квадратов.

    контрольная работа [99,2 K], добавлен 27.04.2011

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

  • Понятие модели множественной регрессии. Сущность метода наименьших квадратов, который используется для определения параметров уравнения множественной линейной регрессии. Оценка качества подгонки регрессионного уравнения к данным. Коэффициент детерминации.

    курсовая работа [449,1 K], добавлен 22.01.2015

  • Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.

    лабораторная работа [100,5 K], добавлен 02.06.2014

  • Выбор факторных признаков для двухфакторной модели с помощью корреляционного анализа. Расчет коэффициентов регрессии, корреляции и эластичности. Построение модели линейной регрессии производительности труда от факторов фондо- и энерговооруженности.

    задача [142,0 K], добавлен 20.03.2010

  • Описание классической линейной модели множественной регрессии. Анализ матрицы парных коэффициентов корреляции на наличие мультиколлинеарности. Оценка модели парной регрессии с наиболее значимым фактором. Графическое построение интервала прогноза.

    курсовая работа [243,1 K], добавлен 17.01.2016

  • Выборка и генеральная совокупность. Модель множественной регрессии. Нестационарные временные ряды. Параметры линейного уравнения парной регрессии. Нахождение медианы, ранжирование временного ряда. Гипотеза о неизменности среднего значения временного ряда.

    задача [62,0 K], добавлен 08.08.2010

  • Расчет параметров уравнения линейной регрессии, экономическая интерпретация ее коэффициента. Проверка равенства математического ожидания уровней ряда остатков нулю. Построение степенной модели парной регрессии. Вариация объема выпуска продукции.

    контрольная работа [771,6 K], добавлен 28.04.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.