Основы эконометрики

Взаимосвязи экономических переменных. Понятие эконометрической модели. Коэффициент корреляции и его свойства. Линейная парная регрессия. Метод наименьших квадратов. Основные предпосылки и принципы регрессионного анализа. Статистика Дарбина-Уотсона.

Рубрика Экономико-математическое моделирование
Вид шпаргалка
Язык русский
Дата добавления 22.12.2011
Размер файла 142,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Понятие регрессии. Функция регрессии

Парной линейной регрессией называется зависимость

= b0 + b1x выборочного условного математического ожидания от переменной х. Термин «парная» означает зависимость двух переменных Y, X. Термин «линейная» означает их линейную зависимость.Условное выборочное математическое ожидание - это выборочное среднее значение величины Y при условии, что переменная X приняла значение х.

Модель наблюдения): yi = b0 + b1x + ei,

b0 - оценка свободного члена 0,

b1 - оценка углового коэффициента 1.

Если прибегают к исследованию средних показателей, которые в той или иной степени определяют данный процесс, то зависимость такого типа через среднюю величину выражается

МО(У(х))=f(х) и называется функцией регрессии переменной У на переменную Х, где

Х - независимая (объясняющая) переменная;

У - зависимая (объясняемая) переменная;

Х-регрессор.

2. Взаимосвязи экономических переменных

Ковариация, ее свойства и недостатки. Многие экономические показатели определяются несколькими числами, являясь по сути многомерными СВ. например, издержки предприятия включают в себя фиксированную и переменную составляющие; уровень жизни населения подразумевает использование большого числа показателей: ВНП на душу населения, распределение доходов, наличие товаров и услуг, продолжительность жизни и т.д.Значения ряда экономических показателей предопределяют величины других показателей. Поэтому одна из центральных задач экономического анализа - выявить наличие и определить силу взаимосвязи между различными экономическими показателями (фактически между СВ). например, между доходом и потреблением; между спросом на товар и его ценой; между уровнем инфляции и уровнем безработицы; между ВНП и уровнем жизни. Вследствие этого при проведении эконометрического анализа одно из главных мест занимает исследование взаимосвязей СВ, при которых реализация одной из СВ влияет на вероятность определенной реализации других СВ.Для анализа степени взаимосвязи СВ обычно используют числовые характеристики: смешанные моменты распределения, ковариацию и коэффициент корреляции.

Для описания связи между СВ X и Y применяют центральный момент порядка 1,1, который называется ковариацией СВ X и Y:

Ковариация является абсолютной (зависящей от размерностей) мерой взаимосвязи переменных.

Свойства ковариации:

1. .

2. .

3. Если X и Y независимые СВ, то .

4.

5. cov(a + bX, c + dY) = bdcov(X,Y), где a,b,c,d - константы.

В принципе ковариация может служить индикатором наличия положительной (переменные изменяются в одном направлении) либо отрицательной (переменные изменяются в разных направлениях) связи между СВ - ковариация в этом случае положительна либо отрицательна. Однако существенным недостатком ковариации является ее зависимость от размерностей рассматриваемых СВ. поэтому при различных единицах измерения СВ одна и та же зависимость может выражаться различными значениями ковариаций. Кроме того, ковариация не позволяет определить силы (строгости) зависимости между рассматриваемыми СВ. Для устранения данных недостатков вводится относительная мера взаимосвязи (безразмерная величина) - коэффициент корреляции.

3.Коэффициент корреляции и его свойства

Коэффициентом корреляции называют величину

,

где - стандартные отклонения соответственно величин х, у;

= - выборочная ковариация величин х, у.

Зависимость между СВ X и Y, характеризуемая коэффициентом корреляции, называется корреляцией. СВ X и Y называется некоррелированными, если , что равносильно равенству . Если же , то СВ X и Y называют коррелированными. Свойства коэффициента корреляции:

1. .

2. .

3.

4. Если X и Y независимые СВ, то .

5. тогда и только тогда, когда Y=a+bx (т.е. между СВ X и Y существует линейная функциональная зависимость).

4. Понятие экономической модели. Понятие эконометрической модели

Экономическая модель.Основным элементом экономического исследования является анализ и построение взаимосвязей экономических переменных. Математическое выражение таких взаимосвязей называется экономической моделью.

Пример.С = 0 + 1I,I - располагаемый доход семьи;C - потребление. Построение экономических моделей осложнено следующими факторами

1) часто эти взаимосвязи не являются строгими, функциональными зависимостями;

2) очень трудно выявлять все факторы, влияющие на данный зависимый экономический показатель;

3) воздействие многих факторов является случайным;

4) экономисты обладают ограниченным набором данных статистических наблюдений, которые к тому же содержат различного рода ошибки.

Если удаётся преодолеть эти трудности, тогда можно построить экономическую модель, выражающую функциональную зависимость некоторой зависимой величины от формирующих её значение факторов. Особенность функциональной зависимости состоит в том, что по значению независимой величины (переменной) можно однозначно, абсолютно точно вычислить, предсказать значение зависимой величины. Эконометрическая модель. Рассмотрим набор реальных статистических данных (Ck,Ik) и изобразим эти данные точками в координатах (C,I).

Таким образом, зависимость между величинами Ck, Ik не функциональная, а стохастическая, случайная. Но эта случайность не такова, что абсолютно невозможно предсказать или объяснить по величине Ik величину Ck, поскольку видна достаточно устойчивая тенденция роста (в среднем). Другими словами, взаимосвязь между величинами Ck, Ik такова: точное значение Ck не вычисляется по значению Ik, однако с ростом Ik значение Ck в среднем увеличивается. Такой характер зависимости выражается следующим образом:Ck = 0 + 1Ik + k, k = 1, 2,…,N (1)

В общем случае, характер зависимости нелинейный:

yk = (xk,0, 1,… n) + k; k = 1, 2,…,N (2).

Соотношение (2) называется эконометрической моделью. Таким образом, эконометрическая модель - это выражение статистической зависимости между переменными. Эконометрическая модель строится на основе экономической теории и статистических данных.

5.Линейная парная регрессия

Парной линейной регрессией называется зависимость

= b0 + b1x

выборочного условного математического ожидания от переменной х. Термин «парная» означает зависимость двух переменных Y, X. Термин «линейная» означает их линейную зависимость.

Условное выборочное математическое ожидание - это выборочное среднее значение величины Y при условии, что переменная X приняла значение х.

Модель наблюденияyi = b0 + b1x + ei,

b0 - оценка свободного члена 0,

b1 - оценка углового коэффициента 1.

6.Принцип, метод наименьших квадратов

Согласно принципу наименьших квадратов неизвестные параметры b0, b1 выбираются таким образом, чтобы была минимальна сумма квадратов невязок или остатков

S(b0,b1) = ( - yi)2 = (b0 + b1xi - yi)2 min.

Следует отметить, что для оценки параметров b0, b1 возможны и другие подходы. Например, можно находить эти параметры при минимизации суммы абсолютных величин невязок | - yi|2. Однако вычислительные процедуры, соответствующие принципу наименьших квадратов существенно проще. Эти вычислительные процедуры получили название «Метод наименьших квадратов» (МНК).

Исходя из необходимого условия экстремума функции двух переменных S(b0,b1) приравниваем к нулю её частные производные

= 2(b0 + b1xi - yi) = 0;

= 2(b0 + b1xi - yi)xi = 0;

откуда после преобразований получим систему нормальных уравнений для определения параметров линейной регрессии:

b0n + b1xi = yi;

b0xi + b1xi2 = xiyi.

Теперь разделим обе части уравнений на n, получим систему нормальных уравнений в виде

b0 + b1= ;

b0 + b1= ,

где = n1xi ; = n1yi ; = n1x2i ; = n1xiyi.

Подставляя значение

b0 = - b1 из первого уравнения системы в уравнение регрессии, получим

= - b1 + b1x;

- = b1( - x).

Коэффициент b1 называется выборочным угловым коэффициентом регрессии У по Х.Коэффициент b1 показывает, на сколько единиц в среднем изменяется выборочное условное среднее при увеличении переменной Х на одну единицу.

Из нормальной системы получаем

b1 = = ,

где sx2 - выборочная дисперсия переменной Х;

(X,Y) - выборочная ковариация величин X,Y;

величину b0 можно найти через коэффициент b1:

b0 = - b1.

Через коэффициент b1 также можно выразить выборочный коэффициент корреляции r = b1

7.Сформулируем основные предпосылки и принципы регрессионного анализа

Сформулируем основные предпосылки и принципы регрессионного анализа.

1. Объективно существует зависимость одного экономического показателя Y от другого X. Эта зависимость не функциональная, так как на основное течение процесса, экономическую тенденцию накладываются различные случайные факторы. Поэтому для данного значения независимого показателя Х = х зависимый показатель может принять значение из некоторого множества с какой-то вероятностью. То есть для каждого значения Х величина Y является случайной величиной, распределённой по некоторому закону.

2. Значит, каждому значению Х соответствует условное математическое ожидание Mx(Y). То есть функциональной является зависимость не самого значения Y от Х, а его условного математического ожидания: Mx(Y) = (x, 0, 1,…, n). Эта зависимость называется модельной регрессией. В общем случае ни вид функции, ни точные значения параметров 0, 1,…, n неизвестны, поскольку недоступны генеральные совокупности значений переменной Y при заданных Х.

3. Реальным выражением зависимости Y от X является статистическая выборка (xi,yi). По этой выборке методами регрессионного анализа получают приближённую функциональную зависимость = (x,b0, b1,…,bn) выборочного условного среднего Y от х.

4.

Функциональным зависимостям Mx(Y) = (x, 0, 1,…,n),

= (x,b0, b1,…,bn) соответствуют модели наблюдений - зависимости между реальными статистическими данными (xi,yi):

yi = (xi, 0, 1,…, n) + i,yi = (xi,b0, b1,…,bn) + ei,

где i = yi - (xi, 0, 1,…, n) = yi - Mxi(Y) - отклонение наблюдаемого значения yi от своего условного математического ожидания;

i - ошибка, возмущение - результат воздействия неучтённых факторов;ei = yi - (xi,b0, b1,…,bn) - отклонение наблюдаемого значения yi от вычисленного по теоретической функции регрессии; фактически невязки ei являются выборочными значениями величин i.ei - невязка.

2.Методы регрессионного анализа используются для подбора по возможности более точной спецификации (x,b0, b1,…,bn) и оценок параметров b0, b1,…,bn с тем, чтобы выборочная линия регрессии (x,b0, b1,…,bn) приближалась к модельной (x,0,1,…, n).

8. Модельное уравнение регрессии и его параметры

В регрессионном анализе рассматриваются односторонняя зависимость случайной переменной Y от одной (или нескольких) неслучайной независимой переменной X. Такая зависимость может возникнуть, например, в случае, когда при каждом фиксированном значении X соответствующие значения Y подвержены случайному разбросу за счет действия ряда неконтролируемых факторов. При этом зависимую переменную Y называют также функцией отклика, объясняемой, выходной, результирующей, эндогенной переменной, результативным признаком, а независимую переменную X - объясняющей, входной предсказывающей, предикторной, экзогенной переменной, фактором, регрессором, факторным признаком.Уравнение Mx(Y) = (x, 0, 1,…, n)

называется модельным уравнением регрессии (или просто уравнением регрессии), а функция (х) - модельной функцией регрессии (или просто функцией регрессии), а ее график -- модельной линией регрессии (или просто линией регрессии). 0, 1,…, n - параметры функциональной зависимости.

9. Выборочное уравнение регрессии и его параметры

Для точного описания уравнения регрессии необходимо знать условный закон распределения зависимой переменной Y при условии, что переменная X примет значение х. В статистической практике такую информацию получить, как правило, не удается, так как обычно исследователь располагает лишь выборкой пар значений (хi , уi) ограниченного объема п. В этом случае речь может идти только об оценке (приближенном выражении, аппроксимации) по выборке функции регрессии. Такой оценкой является выборочная функция (кривая) регрессии:

= (x,b0, b1,…,bn) где - выборочное условное среднее переменной Y при фиксированном значении переменной Х= х, b0, b1,…,bn - параметры функции .

Это уравнение называется выборочным уравнением регрессии или моделью регрессионной зависимости Y от X.

Вид функции (x,b0, b1,…,bn) называется спецификацией модели выборочной регрессии.

11. Регрессионный анализ и его задачи

Задачами регрессионного анализа являются следующие:

1. Оценка (выбор) спецификации модели - установление конкретного выражения функции (x,b0, b1,…,bn). Достаточно часто эта задача может быть решена точно в том случае, если заранее известен характер изменения величины Y при изменении X: линейный, экспоненциальный,… Вид зависимости может быть известен теоретически, как результат уже проводившихся исследований или определён визуально при анализе статистических данных (хi , уi). Например, для выборки, представленной на следующей диаграмме

линейный характер зависимости очевиден.

2.После выбора спецификации производится оценка параметров спецификации b0, b1,…,bn. Для разных спецификаций набор параметров различен. Например, при выборе линейной спецификации

= b0 + b1x

следует вычислить два параметра: b0, b1. Даже в том случае, если спецификация модели определена точно, значения b0, b1 будут являться только оценками истинных параметров уравнения регрессии

y = 0 + x.

3. Производится оценка качества полученной регрессии.

12.Свойства оценок параметров парной линейной регрессии

Для того чтобы полученные МНК оценки а и b обладали желательными свойствами, необходимо, чтобы выполнялись следующие условия:

1) величина i, является случайной переменной;

2) математическое ожидание i равно нулю: М(е) = 0;

3) дисперсия i постоянна: D(i) = D(i) = а2 для всех i;

4) значения i независимы между собой.

По теореме Гаусса-Маркова если условия 1)-4) выполняются, то оценки, сделанные с помощью МНК, обладают следующими свойствами:

1) Оценки являются несмещенными, т.е. математическое ожидание оценки каждого параметра равно его истинному значению: М(b0) = 0; М(b1) = 1. Это вытекает из того, что М(i)=0, и говорит об отсутствии систематической ошибки в определении положения линии регрессии.

2) Оценки состоятельны, так как дисперсия оценок параметров при возрастании числа наблюдений стремится к нулю: limD(b0) = 0; limD(b1) = 0. Иначе говоря, если п достаточно велико, то практически наверняка b0 близко к 0, a b1 близко к 1: надежность оценки при увеличении выборки растет.

3) Оценки эффективны, они имеют наименьшую дисперсию по сравнению с любыми другими оценками данного параметра, линейными относительно величин уi. В англоязычной литературе такие оценки называются BLUE (Best Linear Unbiased Estimators - наилучшие линейные несмещенные оценки).

Перечисленные свойства не зависят от конкретного вида распределения величин i, тем не менее обычно предполагается, что они распределены нормально N(0;y2). Эта предпосылка необходима для проверки статистической значимости сделанных оценок и определения для них доверительных интервалов. При ее выполнении оценки МНК имеют наименьшую дисперсию не только среди линейных, но среди всех несмещенных оценок.Если предположения 3) и 4) нарушены, то есть дисперсия возмущений непостоянна и/или значения i связаны друг с другом, то свойства несмещенности и состоятельности сохраняются, но свойство эффективности - нет.

13.Дискретные, непрерывные случайные величины

Случайной называется величина, принимающая непредсказуемые, случайные значения. Случайные величины возникают при проведении каких-либо испытаний, опытов, в результате которых измеряется некоторый экономический показатель. Объем ВНП, количество реализованной продукции, прибыль фирмы, размер чистого экспорта за год и т.д. являются случайными величинами (СВ). Различают дискретные и непрерывные СВ.

Дискретной называют такую СВ, которая принимает отдельные, изолированные значения с определенными вероятностями.

Непрерывной называют такую СВ, которая может принимать любое значение из некоторого конечного или бесконечного числового промежутка. Большинство СВ, рассматриваемых в экономике, имеют настолько большое число возможных значений, что их удобнее представлять в виде непрерывных СВ. например, курсы валют, доход, объемы ВНП, ВВП и т.п. обычно рассматриваются как непрерывные СВ.Для описания дискретной СВ необходимо установить соответствие между всеми возможными значениями СВ и их вероятностями. Такое соответствие называется законом распределения дискретной СВ. его можно задать таблично, аналитически (в виде формулы) либо графически.

14.Статистика Дарбина-Уотсона

В некоторой фирме имеются статистические данные (xi, yi).xi - независимая(объясняющая) переменная - расходы на рекламу продукции фирмы;

yi - зависимая(объясняемая) переменная - объём продаж, соответствующий расходам xi.

Следует построить линейную регрессионную модель, объясняющую, как повышение бюджета на рекламу влияет на объём продаж.

После применения обычного МНК получено уравнение линейной регрессии y = ax + b.

Остатки вычисляются следующим образом:

ei = yi - (axi + b).

Следует выяснить, являются ли остатки ei независимыми. Для этого вычисляется статистика Дарбина-Уотсона

DW = .

Если линейная регрессия неадекватна имеющимся статистическим данным, тогда большие серии экспериментальных точек лежат выше либо ниже линии регрессии. В таком случае соседние невязки еi, еi-1 имеют, как правило, одинаковые знаки и примерно равные абсолютные величины. Поэтому, большинство слагаемых (ei - ei-1)2 в числителе величины DW близки к 0. Поэтому статистика Дарбина-Уотсона близка к 0. Таким образом, если DW0, тогда следует сделать вывод о нелинейной зависимости показателя у от показателя х;Если линейная модель регрессии подходит для описания статистических данных, тогда линия регрессии проходит между экспериментальных точек. В это случае примерно половина соседних невязок ei-1 имеет такой же знак, а половина противоположный невязке ei. В первом случае (ei - ei-1)2 0, во втором (ei - ei-1)2 4ei2. Следовательно, если линейная регрессия адекватна, тогда

DW = 2.

Таким образом, если DW2, тогда зависимость у от х линейна.

15.Характеристики парной регрессии: коэффициент и индекс корреляции, средний коэффициент эластичности

Тесноту связи изучаемых явлений оценивает линейный коэффициент корреляции rxy для линейной регрессии

r = b1= =

и индекс корреляции ху для нелинейной регрессии.

xy = .

Средний коэффициент эластичности показывает, на сколько процентов в среднем изменится результат у от своей средней величины при изменении фактора х на 1% от своего среднего значения:

= f(x).

16.Характеристики парной регрессии: показатели дисперсии, коэффициент детерминации

Показатели дисперсии

( y)2 = ( x)2 + (y x)2;где

( y)2 общая дисперсия результативного признака;

( x)2 сумма квадратов отклонений от линии регрессии, обусловленная регрессией, «объяснённая» или «факторная» дисперсия;

(y x)2 остаточная сумма квадратов отклонений.

Доля дисперсии, объясняемая моделью регрессии, в общей дисперсии результативного признака y характеризует коэффициент детерминации R2:

R2 = .

Коэффициент детерминации это квадрат коэффициента или индекса корреляции.

F-тест оценивание качества уравнения регрессии состоит в проверке гипотезы Н0 о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического Fтабл значений F-критерия Фишера. Fфакт определяется из отношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:

Fфакт = = (n 2),

где

n объём выборочной совокупности,

m число параметров при переменной х.

Fтабл это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости . Уровень значимости это вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно принимается равным 0,05 или 0,01.

Если Fтабл < Fфакт , то Н0 гипотеза о случайной природе оцениваемых характеристик отклоняется и признаётся их статистическая значимость и надёжность. Если Fтабл > Fфакт , то Н0 не отклоняется и признаётся статистическая незначимость, ненадёжность модели регрессии.

17.Определение статистической значимости уравнения регрессии и параметров регрессии и корреляции

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, то есть незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится сопоставлением их значений с величиной случайной ошибки:

tb = ; ta = ; ta = .

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

mb = (y x)2/(n 2); ( x)2;

ma = ,

mr = .

Сравнивая фактическое и критическое(табличное) значения t-статистики tтабл и tфакт принимаем или отвергаем гипотезу Н0.

Если tтабл < tфакт, то Н0 отклоняется, т.е. a, b, rxy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если tтабл > tфакт , то Н0 не отклоняется и признаётся случайная природа формирования a, b, r.

Для расчёта доверительных интервалов определяются предельные ошибки каждого показателя:

a = tтаблma, b = tтаблmb.

Доверительные интервалы

a tтаблma < a < a + tтаблma, b tтаблmb < b < b + tтаблmb.

18. Множественная регрессия. Расчетные формулы для вычисления параметров линейной регрессии

Множественная регрессия уравнение связи с несколькими независимыми переменными:y = f(x1, x2,..., xp).

Для построения модели множественной регрессии используются следующие функции:

линейная y = a + b1x1 + b2x2 + ... + bpxp + ;

степенная y = ax1b1x2b2 ...xpbp;

экспоненциальная y = exp(a + b1x1 + b2x2 + ... + bpxp + );

гипербола y = .

Последние три функции легко линеаризуются модификацией переменных.

Для оценки параметров линейной регрессии также используется метод наименьших квадратов.Расчётные формулы для этих параметров

a = , b1 = , ..., bp = ,

где определитель системы нормальных уравнений

=

n

x1

x2

...

xp

x1

x12

x2x1

...

xpx1

x2

x1x2

x22

xpx2

................................................................

xp

x1xp

x2xp

xp2

a, b1, b2,..., bp частные определители, которые получаются заменой соответствующего столбца определителя системы на столбец правых частей

y

yx1

...

yxp

18. Понятие генеральной совокупности и выборки.

Под генеральной совокупностью мы подразумеваем все возможные наблюдения интересующего нас показателя, все исходы случайного испытания или всю совокупность реализаций случайной величины X. Пример генеральной совокупности - данные о доходах всех жителей какой-либо страны, о результатах голосования населения по какому-либо вопросу и т.д. Однако в большинстве случаев мы имеем дело только с частью возможных наблюдений, взятых из генеральной совокупности, и называем это множество (точнее подмножество) значений выборкой. Таким образом, выборка - это множество наблюдений, составляющих лишь часть генеральной совокупности. Выборка объема п - это результат наблюдения случайной величины в вероятностном эксперименте, который повторяется п раз в одних и тех же условиях (которые могут контролироваться), а следовательно, и при неизменном распределении случайной величины X. Процесс, который приводит к получению выборочных данных, называют выборочным исследованием.

Выборку называют репрезентативной (представительной), если она достаточно полно представляет изучаемые признаки и параметры генеральной совокупности.

19. Множественная регрессия. Коэффициенты множественной корреляции и детерминации

Множественная регрессия уравнение связи с несколькими независимыми переменными:

y = f(x1, x2,..., xp).

Для построения модели множественной регрессии используются следующие функции:

линейная y = a + b1x1 + b2x2 + ... + bpxp + ;

степенная y = ax1b1x2b2 ...xpbp;

экспоненциальная y = exp(a + b1x1 + b2x2 + ... + bpxp + );

гипербола y = .

Последние три функции легко линеаризуются модификацией переменных.

Для линейной модели регрессии тесноту совместного влияния факторов на результат оценивает коэффициент множественной корреляции

Ryx1x2...xp = ,

r определитель матрицы парных коэффициентов корреляции, r11 определитель матрицы межфакторной корреляции

r =

1

ryx1

ryx2

...

ryxp

ryx1

1

rx1x2

...

rx1xp

ryx2

rx2x1

1

rx2xp

................................................................

ryxp

rxpx1

rxpx2

1

r11 =

1

rx1x2

rx1x3

...

rx1xp

rx2x1

1

rx2x3

...

rx2xp

................................................................

rxpx1

rxpx2

rxpx3

...

1

Коэффициент множественной детерминации рассчитывается как квадрат коэффициента множественной корреляцииR2 = R2yx1x2...xp

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера

F = .

20. Гомо- и гетероскедастичность остатков

Свойства оценок коэффициентов регрессии напрямую зависят от свойств случайного члена в уравнении регрессии. Для получения качественных оценок необходимо следить за выполнимостью предпосылок МНК (условий Гаусса-Маркова), так как при их нарушении МНК может давать оценки с плохими статистическими свойствами. Одной из ключевых предпосылок МНК является условие постоянства дисперсий случайных отклонений (D(i)=D(j)=2 для любых наблюдений i и j).

Гомоскедастичность остатков означает, что дисперсии возмущающих воздействий постоянны:

2i = 2j, i, j = 1, 2,..., n.

Гетероскедастичность означает непостоянство этих дисперсий.

Непосредственное применение МНК даёт неточные оценки параметров регрессии. Для коррекции гетероскедастичности применяют взвешенный МНК, суть которого в том, чтобы «взвешивать» каждое наблюдение. При этом минимизируется взвешенная сумма квадратов отклонений

(yi a bxi)2.

Проблема заключается в оценке этих дисперсий.Для экономических данных достаточно часто величина средней ошибки может быть пропорциональна абсолютному значению независимой величины. В этом случае коррекция гетероскедастичности достаточно проста: следует перейти к модифицированным данным

yi* = , xi* = .

Соотношения между оценками исходной и модифицированной регрессии:

a = b*, b = a*.

Не существует какого-либо однозначного метода определения гетероскедастичности. Наиболее популярные: графический анализ отклонений, тест ранговой корреляции Спирмена и др.

21. Понятия временного ряда

Последовательность (набор) данных х1, …,хn - называется временным рядом, в тех случаях, когда важным является порядок следования каждого из зарегистрированных значений; так как обычно данные получаются в результате их регистрации в определённые моменты времени.

Основная гипотеза при рассмотрении случайной величины (см. выше) заключается в предположении о независимости отдельных выборочных значений. В этих условиях данные можно перемешивать, меняя их местами, то есть выявить зависимость от времени в этих условиях нельзя. Строго говоря, любые данные представляют собой временной ряд, но в некоторых случаях зависимостью от времени можно пренебречь.

Когда возникает необходимость предсказания будущих значений в регистрируемой последовательности, адекватным является понятие временного ряда.

Предсказание будущих значений ряда может обоснованно осуществить только, если будет выявлено некоторая тенденция их поведения. Именно в силу наличия тенденции, оказывается важным порядок следования значений временного ряда.

Таким образом, важнейшей задачей анализа временного ряда является определение схемы генерации их значений, которые описывают искомые тенденции.

22. Тренд временного ряда. Трендовые модели. Проверка гипотезы о наличии тренда

Тренд - неслучайная функция времени, которая описывает основную тенденцию поведения временного ряда.

Обычное математическое представление трендовых моделей имеет вид:

xt = f(t) + (t),где f(t) - тренд;

(t) - «невязка», характеризующая неточность совпадения значений временного ряда со значениями тренда.

Предполагается выполнение условий несмещённости и некоррелированности:

E(t) = 0;

E(t1t2) = .

Проверка гипотезы о наличии тренда во временном ряде

Даны значения временного ряда x(1), x(2),..., x(n). Необходимо определить, имеет ли этот ряд неслучайную компоненту, зависящую от времени - тренд.

Пусть xmed - выборочная медиана этого временного ряда. Образуем ряд z(1), z(2),..., z(n) следующим образом:

z(i) = знак(x(i) - xmed).

Серия - это группа подряд идущих +1 или -1.

Обозначим (n) - количество серий; (n) - длина самой протяжённой серии.

Критерий, основанный на выборочной медиане состоит в следующем:

если выполняются оба неравенства

(n) > 0,5(n + 2 - 1,96),

(n) < 1,43ln(n+1),

тогда с вероятностью, заключённой между 0,9025 и 0,95 делается вывод о неизменности среднего значения ряда и об отсутствии тренда. Если хотя бы одно из неравенств не выполняется, тогда с такой же вероятностью следует сделать вывод о наличии тренда.

23.Сглаживание: понятие, виды сглаживания и их краткая характеристика

После того, как установлено, что временной ряд имеет тренд, необходимо выделить этот тренд. Процедура выделения тренда временного ряда называется сглаживанием. Выделение тренда из временного ряда эквивалентно удалению нерегулярной, случайной компоненты временного ряда, после чего этот ряд приобретает «гладкий» вид. По этой причине выделение тренда называется сглаживанием.

Методы выделения тренда (сглаживания) можно условно разделить на два типа:

аналитические,

алгоритмические.

Аналитические методы основаны на допущении, что известен общий вид, спецификация неслучайной составляющей. Например, тренд ряда может иметь линейную спецификациюf(t) = 0 + 1t.

Тогда задача выделения тренда сводится к построению оценок 0, 1 для параметров 0, 1. Эти методы называются аналитическими, потому что позволяют получить аналитическое выражение тренда.

Алгоритмические методы не используют предположение о виде тренда, поэтому имеют более широкую область применения. Алгоритмические методы заключаются в выработке алгоритма, способа расчёта значения величины тренда для любого заданного момента времени.

24. Алгоритмическое сглаживание. Метод скользящего среднего

В основном методы алгоритмического сглаживания - это различные модификации скользящего среднего.

В основе этих методов лежит следующее соображение: если индивидуальный разброс значений временного ряда x(t) вокруг тренда f(t) характеризуется дисперсией 2, то разброс среднего из N членов временного ряда (x(1) + x(2) +…+ x(N))/N около того же значения будет характеризоваться дисперсией 2/N.

Алгоритм скользящего среднего заключается в следующем:

(t) = wkx(t + k), t = m+1, m+2,…, n-m, (1)

где wk - некоторые весовые коэффициенты, в сумме равные 1, т.е.

wk = 1.

эконометрический модель корреляция регрессия

Поскольку, изменяя t от m+1 до n-m диапазон суммирования скользит по временному ряду (при переходе от t к t+1 в составе слагаемых происходит замена только одного слагаемого x(t - m) слагаемым x(t + m + 1)), то и методы, основанные на формуле (1) называются методами скользящего среднего (МСС).

Один МСС отличается от другого выбором параметров m и весов wk.

Определение весов wk основано на следующей процедуре.

Для 2m+1 элементов временного ряда x(1), x(2),…, x(2m+1) строится полином степени p методом наименьших квадратов

значение этого полинома используют для расчёта значений оценки тренда (t) в средней точке этого отрезка ряда m + 1, т.е.

(m + 1) = 1(m + 1).

Эта же процедура выполняется для отрезка временного ряда x(2),…, x(2m+2).

Оказалось, что такая процедура приводит к процедуре взвешенного скользящего суммирования, по которой веса определяются из следующей таблицы:

m

веса

1

1/3, 1/3, 1/3 (средняя арифметическая)

2

-3/35, 12/35, 17/35, 12/35, -3/35

3

-2/21, 3/21, 6/21, 7/21, 6/21, 3/21, -2/21

25. Алгоритмическое сглаживание. Метод Брауна

В задачах прогноза, в которых сглаженная функция (t) используется обычно для формирования прогнозов на несколько тактов вперёд, недавние значения x(t) очевидно ценнее, чем значения ряда в далёком прошлом, так как ряд далее будет вести себя так, какова сформировавшаяся тенденция в настоящем и недалёком прошлом.Эта идея реализована в методе экспоненциально взвешенного скользящего среднего Брауна

(t) = kx(t-k), 0<<1. (2)

(t) = (x(t) + x(t-1) + 2x(t-2) + … + t-1x(1))

При использовании метода Брауна значения временного ряда тоже сглаживаются, однако существуют следующие отличия методе экспоненциально взвешенного скользящего среднего Брауна от обычного МСС

1) скользит только правый край интервала усреднения (левый край закреплён в точке t = 1),

2) веса при x(t - k) экспоненциально уменьшаются по мере «удаления в прошлое»,

3) формула (2) даёт оценку сглаженного значения временного ряда не в средней, а в правой, конечной точке усреднения,

4) нет проблемы крайних значений.

Дисперсия остаточной случайной компоненты после сглаживания

D(t) = 2,где

(t) - остаточная нерегулярная компонента после сглаживания.

2 = Dx(t);

поэтому при значениях , не слишком близких к 1, и для достаточно удалённых от прошлого значений t случайные остатки (t) подвержены существенно меньшему разбросу.

26. Аналитическое сглаживание. Метод конечных разностей

В эконометрике основное внимание уделяется методу аналитического выравнивания. Данный метод заключается в построении уравнения регрессии, характеризующего зависимость уровней ряда от временной переменной: Х = f(t).При выборе вида функции тренда можно воспользоваться методом конечных разностей (обязательным условием применения данного подхода является равенство интервалов между уровнями ряда).Конечными разностями первого порядка являются разности между последовательными уровнями ряда:

.

Конечными разностями второго порядка являются разности между последовательными конечными разностями 1-го порядка:

Конечными разностями j-го порядка являются разности между последовательными конечными разностями (j-1)-го порядка:

.

Если общая тенденция выражается линейным уравнением , тогда конечные разности первого порядка постоянны: , а разности второго порядка равны нулю.

Если общая тенденция выражается параболой второго порядка: , то получим постоянными конечные разности второго порядка: , нулевыми - разности третьего порядка.

Порядок конечных разностей j, остающихся примерно равными друг другу, принимается за степень выравнивающего многочлена:

Если примерно постоянными оказываются темпы роста, то для выравнивания применяется показательная функция:

.

При выборе формы уравнения следует исходить из объема имеющейся информации. Чем больше параметров содержит уравнение, тем больше должно быть наблюдений при одной и той же степени надежности оценивания.Выбор формы кривой может осуществляться и на основе принятого критерия качества уравнения регрессии, в качестве которого может служить сумма квадратов отклонений фактических значений уровня ряда от значений уровней, рассчитанных по уравнению тренда. Из совокупности кривых выбирается та, которой соответствует минимальное значение критерия. Другим статистическим критерием является коэффициент множественной детерминации R2.

Интерпретация параметров линейного тренда:

,

где а - уровень ряда за период времени t=0;

b - средний абсолютный прирост уровня ряда за единичный промежуток времени.

Интерпретация параметров тренда, имеющего вид показательной функции:

,

где а - уровень ряда за период (в момент) времени t = 0;

b - средний коэффициент роста за единичный промежуток времени.

27. Расчет параметров уравнения тренда при аналитическом выравнивании

Расчет параметров при аналитическом выравнивании чаще всего производится с помощью метода наименьших квадратов (МНК). При этом поиск параметров для линейного уравнения тренда можно упростить, если отсчет времени производить так, чтобы сумма показателей времени изучаемого ряда динамики была равна нулю. То есть вводится новая условная переменная времени ty, такая, что сумма значений этой переменной по всем элементам динамического ряда равна нулю: .

При нечетном числе уровней ряда динамики для получения уровень, находящийся в середине ряда, принимается за условное начало отсчета времени (периоду или моменту времени, соответствующему данному уровню, присваивается нулевое значение). Даты времени, расположенные левее этого уровня, обозначаются натуральными числами со знаком минус (-1, -2, -3 …), а даты времени, расположенные правее этого уровня - натуральными числами со знаком плюс (1, 2, 3 …).

Если число уровней ряда четное, периоды времени левой половины ряда (до середины) нумеруются -1, -3, -5 и т.д. А периоды правой половины +1, +3, +5 и т.д. При этом .

При оценке параметров линейного тренда: методом наименьших квадратов система нормальных уравнений преобразуется к виду:

Тогда параметры линейного уравнения тренда рассчитываются по формулам:

28. Стационарные временные ряды: основные понятия

Использование автокорреляции для выявления структуры временного ряда.После того, как решена задача сглаживания временного ряда, необходимо проанализировать остаточную нерегулярную случайную компоненту (t), так как это необходимо для формирования более точных прогнозов. Визуальный анализ показывает, что значения (t) колеблются вокруг 0, то есть не изменяется математическое ожидание (t). Мера разброса, дисперсия значений (t) тоже постоянна. Такие временные ряды, статистические свойства которых не изменяются по времени, называются стационарными.Среднее значениеМ(t) = a;дисперсия

D(t) = M((t) - a)2 = 2.

Оценки

= N-1(t);

= N-1((t) - )2.

Использование автокорреляции для выявления структуры временного рядаДля выявления структуры ряда (т.е. состава компонент) строят автокорреляционную функцию. Дело в том, что при наличии во временном ряде трендовой и циклической компонент значения последующего уровня ряда зависят от предыдущих. Автокорреляция уровней ряда - корреляционная между последовательными уровнями одного и того же ряда динамики (сдвинутыми на определенный промежуток времени L - лаг). То есть связь между рядом: Х1, Х2, …Хn-L и рядом Х1+L, Х2+L, …Хn, где L - положительное целое число. Автокорреляция может быть измерена коэффициентом автокорреляции:

где

- средний уровень ряда (Х1+L, Х2+L, …Xn).

- средний уровень ряда (Х1, Х2, …Xn-L).

t t-L - средние квадратические отклонения, для рядов (Х1+L, Х2+L, …Хn) и (Х1, Х2, …Хn-L) соответственно.Лаг (сдвиг во времени) определяет порядок коэффициента автокорреляции. Если L = 1, то имеем коэффициент автокорреляции 1-го порядка rt,t-1, если L = 2, то коэффициент автокорреляции 2-го порядка rt,t-2 и т.д. Следует учитывать, что с увеличением лага на единицу число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается на 1. Поэтому обычно рекомендуют максимальный порядок коэффициент автокорреляции, равный n/4.

Рассчитав несколько коэффициентов автокорреляции, можно определить лаг (1), при котором автокорреляция (rt,t-1) наиболее высокая, выявив тем самым структуру временного ряда. Если наиболее высоким оказывается значение rt,t-1, то исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался rt,t-L, то ряд содержит (помимо тенденции) колебания периодом L. Если ни один из rt,t-1 (l=1; L) не является значимым, можно сделать одно из двух предположений:

либо ряд не содержит тенденции и циклических колебаний, а его уровень определяется только случайной компонентой;

либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ.

Последовательность коэффициентов автокорреляции 1, 2 и т.д. порядков называют автокорреляционной функцией временного ряда. График зависимости значений коэффициентов автокорреляции от величины лага (порядка коэффициента автокорреляции) называют коррелограммой.

29. Корреляционная функция стационарного временного ряда

Так как значения временного ряда в моменты времени t, t + являются случайными величинами, можно рассмотреть коэффициент корреляции между ними…

K(t,) =

Корреляционной функцией стационарного временного ряда называется функция

K() = ,

для стационарного временного ряда

D(t) = D(t + ) = 2,поэтому

K() = ,

таким образом, корреляционная функция в точке - это коэффициент корреляции между значениями ряда, отстоящими друг от друга на временной промежуток .

Оценка корреляционной функции

() =

при сильной положительной зависимости (t), (t+) в числителе будет много положительных слагаемых, и корреляционная функция будет иметь большое положительное значение; при сильной отрицательной зависимости (при (t) > с большой вероятностью (t) < ) в числителе будет много отрицательных слагаемых, и корреляционная функция будет иметь малое отрицательное значение; при слабой зависимости (t), (t+) примерно одинаковое количество слагаемых будут иметь положительные и отрицательные знаки, в это случае корреляционная функция будет мала по абсолютной величине.

1.K(0) = = 1, что очевидно должно быть так как измеряется коэффициент корреляции между одинаковыми случайными величинами.

2.Чем больше , т.е. сильнее разнесены во времени значения временного ряда (t), (t+), тем слабее взаимосвязь между этими значениями, тем должна быть меньше по абсолютной величине K(). Поэтому K() 0 при .

3.|K()|1.

30. Авторегрессионные модели стационарных временных рядов. Модель авторегрессии 1-го порядка

Модели, в которых прогноз будущих значений формируется по предыдущим, называются авторегрессионными.

(t) = (t - 1) + (t), (3)где || < 1.

Из представления (3) следует, что (t) формируется только на основе предыдущего значения (t-1) и не зависит от всех прошлых. При этом на значение (t) влияние текущее значение возмущения (t).

Процессы авторегрессии 1-го порядка также называются марковскими.

Для марковских процессов доказано, что

1) M(t) = 0,2) K() = ,

Таким образом, большое положительное (близкое к 1) значение означает сильную коррелированность значений временного ряда, отстоящих на небольшое значение , и медленное затухание этой зависимости с ростом . Временной ряд при таких имеет более плавный характер. При малом значении степень зависимости значений временного ряда быстро уменьшается. При этом ряд имеет более изрезанный «дёрганный характер».

K(1) = ,

то есть величина - это коэффициент корреляции соседних значений временного ряда. 3) D(t) = , = 1 - 2

Из последнего соотношения следует, что, если значение || близко к 1, тогда дисперсия (t) будет значительно больше дисперсии возмущения (t). То есть, если соседние значения ряда (t) сильно коррелированны, то ряд довольно слабых возмущений (t) будет порождать размашистые колебания остатков (t).Из соотношения K(1) = ,следует способ идентификации модели авторегрессии 1-го порядка.Оценка величины формируется как оценка корреляционной функции в точке 1:

= (1) = .

31. Оценивание параметров моделей авторегрессии. Метод инструментальных переменных

При построении моделей авторегрессии:

уt=a + b0 xt + c1 yt-1 + ut

возникает проблема: нарушается 1-я предпосылка нормальной линейной модели регрессии об отсутствии связи между факторным признаком и случайной составляющей. В модели авторегрессии факторный признак уt-1 связан со случайной составляющей ut-1. Поэтому применение обычного МНК для оценки параметров уравнения регрессии приводит к получению смещенной оценки параметра при переменной уt-1.Для оценивания параметров уравнения регрессии может быть использован метод инструментальных переменных.

Суть метода инструментальных переменных состоит в следующем.Переменную уt-1 из правой части уравнения, для которой нарушается предпосылка МНК, заменяют на новую переменную, удовлетворяющую следующим требованиям:

1.она должна тесно коррелировать с уt-1;

2.она не должна коррелировать со случайной составляющей ut.

Затем оценивают регрессию с новой инструментальной переменной с помощью обычного МНК.

32.Авторегрессионные модели стационарных временных рядов. Модель авторегрессии 2-го порядка

Модели, в которых прогноз будущих значений формируется по предыдущим, называются авторегрессионными.

(t) = 1(t - 1) + 2(t - 2) + (t).

Условие стационарности (t):|1| < 2,

2 < 1 - |1|.Доказано, что

1 = ;

2 = ;

на основе этих соотношений строятся оценки параметров 1, 2.

Для корреляционных функций процессов авторегрессии 2-го порядка уже не удаётся получить аналитическое выражение для корреляционной функции, однако существует рекуррентный алгоритм вычисления всех значений:K() = 1K( - 1) + 2K( - 2).

20 = 2 - 1K(1) - 2K(2).

Размещено на Allbest.ru


Подобные документы

  • Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.

    лабораторная работа [67,8 K], добавлен 26.12.2010

  • Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.

    курсовая работа [1,1 M], добавлен 22.05.2015

  • Суть эконометрики как научной дисциплины, ее предмет и метод. Парная и множественная регрессия в экономических исследованиях. Регрессионные модели с переменной структурой. Обобщенный метод наименьших квадратов. Анализ систем экономических уравнений.

    реферат [279,2 K], добавлен 11.09.2013

  • Публикация данных: источники информации и влияние факторов на деятельность. Статистическая автокоррелированность ряда и проверка ее порядков, статистика Дарбина–Уотсона. Регрессионные зависимости и леммы эконометрической модели, доверительный интервал.

    практическая работа [327,4 K], добавлен 15.03.2009

  • Понятие взаимосвязи между случайными величинами. Ковариация и коэффициент корреляции. Модель парной линейной регрессии. Метод наименьших квадратов, теорема Гаусса-Маркова. Сравнение регрессионных моделей. Коррекция гетероскедастичности, логарифмирование.

    курс лекций [485,1 K], добавлен 02.06.2011

  • Оценка коэффициентов парной линейной регрессии, авторегрессионное преобразование. Трехшаговый и двухшаговый метод наименьших квадратов, его гипотеза и предпосылки. Системы одновременных уравнений в статистическом моделировании экономических ситуаций.

    курсовая работа [477,2 K], добавлен 05.12.2009

  • Построение качественной и адекватной эконометрической модели по методу наименьших квадратов и ее анализ на наличие автокорреляции, мультиколлинеарности, гетероскедастичности с применением статистики Дарвина-Уотсона, тестов Парка и Голдфелда-Квандта.

    курсовая работа [434,0 K], добавлен 04.12.2013

  • Эконометрика как одна из базовых дисциплин экономического образования во всем мире. Прогноз социально-экономических показателей, характеризующих состояние и развитие анализируемой системы. Понятие и построение модели парной регрессии и корреляции.

    контрольная работа [633,2 K], добавлен 10.12.2013

  • Понятие о взаимосвязях в эконометрике. Сопоставление параллельных рядов. Корреляция альтернативных признаков. Оценка надежности параметров парной линейной регрессии и корреляции. Коэффициенты эластичности в парных моделях. Парная нелинейная корреляция.

    курсовая работа [1,9 M], добавлен 29.06.2015

  • Моделирование экономических процессов с помощью однофакторной регрессии. Оценка параметров проекта методом наименьших квадратов. Расчет коэффициента линейной корреляции. Исследование множественной эконометрической линейной схемы на мультиколлинеарность.

    курсовая работа [326,5 K], добавлен 19.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.