Методы обнаружения гетероскедастичности
Особенности гетероскедастичности (определение, последствия, методы обнаружения и устранения). Проблемы пи проведении регрессионного анализа, основанного на методе наименьших квадратов, связанные с выполнимостью свойств случайных отклонений моделей.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 11.05.2019 |
Размер файла | 319,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
Федеральное государственное бюджетное образовательное учреждение высшего образования
Рыбинский государственный авиационный технический университет имени П.А. Соловьева
Факультет заочного обучения
Кафедра "Экономики, менеджмента и экономических информационных систем"
КОНТРОЛЬНАЯ РАБОТА
по дисциплине "ЭКОНОМЕТРИКА"
Студент: Савельева Н.Н.
Группа: ЗЭП-16
Преподаватель: Камакина О.В.
Рыбинск 2018
Содержание
- 1. Гетероскедастичность (определение, последствия, методы обнаружения и устранения)
- 2. Задание № 1
- 3. Задание № 2
- Список использованных источников
- Приложение А
1. Гетероскедастичность (определение, последствия, методы обнаружения и устранения)
При проведении регрессионного анализа, основанного на методе наименьших квадратов, на практике следует обратить серьезное внимание на проблемы, связанные с выполнимостью свойств случайных отклонений моделей. Для получения качественных оценок необходимо следить за выполнимостью предпосылок МНК (условий Гаусса? Маркова), т.к. при их нарушении МНК может давать оценки с плохими статистическими свойствами.
Одной из предпосылок МНК является условие постоянства дисперсии случайных отклонений - гомоскедастичность. Нарушение этого условия, т.е. изменение дисперсии случайных отклонений при изменении значений фактора xi называют гетероскедастичностью.
Поскольку наличие гетероскедастичности является нарушением одной из предпосылок МНК, при ее обнаружении необходимо выявить ее причину и устранить ее.
Существует несколько методов обнаружения гетероскедастичности:
графический метод;
тест ранговой корреляции Спирмена;
тест Голдфельда-Квандта.
Графический метод обнаружения гетероскедастичности заключается в построении диагностической диаграммы - точечной графической зависимости между прогнозируемыми значениями результирующего показателя yi и эмпирическими случайными отклонениями ei (в случае парной регрессии можно также рассматривать зависимость случайных отклонений ei от значений фактора xi).
Если дисперсии случайных отклонений приблизительно одинаковые для разных значений yi (или xi), т.е. точки на диаграмме представляют собой полосу вокруг оси абсцисс приблизительно равной ширины, значит, присутствует гомоскедастичность.
Если дисперсии случайных отклонений различаются для разных значений yi (или xi), т.е. разброс точек вокруг оси абсцисс на диаграмме постепенно увеличивается или уменьшается, значит, присутствует гетероскедастичность.
Пример диагностической диаграммы при наличии гетероскедастичности представлен на рисунке 1.
Рис.1 Пример диагностической диаграммы при наличии гетероскедастичности
Суть теста ранговой корреляции Спирмена для обнаружения гетероскедастичности сводится к оценке коэффициента корреляции между рангами значений переменной Х (для множественной регрессии Y) и модуля случайных отклонений |е|.
Ранг - это место данного числового значения среди упорядоченных значений анализируемого показателя.
Коэффициент ранговой корреляции рассчитывается по формуле:
гетероскедастичность регрессионный анализ отклонение модель
где - разность между рангами значений переменной Х и модуля е.
Необходимо проверить значимость коэффициента ранговой корреляции с помощью механизма проверки статистических гипотез.
Для этого формулируется гипотеза:
Н0: rx,e = 0 - коэффициент ранговой корреляции незначим
Н1: rx,e ? 0 - коэффициент ранговой корреляции значим
Проверка гипотезы осуществляется по критерию Стьюдента. Наблюдаемое значение критерия Стьюдента находится по формуле:
Критерий T имеет число степеней свободы = n - 2.
По таблице критических точек Стьюдента определяется значение критической точки tкр, которое зависит от следующих показателей:
уровня значимости б, значение которого задается при проверке гипотезы;
числа степеней свободы .
Чтобы сделать вывод о значимости коэффициента ранговой корреляции необходимо сравнить между собой рассчитанное значение критерия Т и значение критической точки tкр.
Если значение критерия Т попадает в область принятия гипотезы (-tкр< Т <tкр), можно сделать следующие выводы:
коэффициент ранговой корреляции признается незначимым; в генеральной совокупности наблюдается гомоскедастичность, т.е. дисперсия случайных отклонений постоянна.
Если значение критерия Т попадает в одну из критических областей Т - tкр или Т tкр), выводы оказываются следующими:
коэффициент ранговой корреляции признается значимым; в генеральной совокупности наблюдается гетероскедастичность, т.е. дисперсия случайных отклонений не является постоянной.
Тест Голдфельда-Квандта для обнаружения гетероскедастичности проводится по следующему алгоритму:
вся совокупность наблюдений размерностью п упорядочивается по возрастанию значений фактора Х (или Y для множественной регрессии);
упорядоченная совокупность делиться на 3 части размерностью k, п - 2*k, k - соответственно;
строятся отдельные уравнения регрессии для 1-ой и 3-ей частей выборки, и рассчитываются остаточные дисперсии для каждой из рассматриваемых частей по формулам:
,
где - квадрат значения случайного отклонения из первой части выборки;
m - число факторов в регрессионной модели m (в парной регрессионной модели m = 1).
,
где - квадрат значения случайного отклонения из третьей части выборки;
проверяется гипотеза о равенстве дисперсий двух совокупностей:
Н0: Sе32 = Sе12 - дисперсии двух частей выборки практически не отличаются друг от друга
Н1: Sе32>Sе12 - дисперсия третьей части выборки значимо больше дисперсии первой части
Для проверки гипотезы используется критерий Фишера, наблюдаемое значение которого рассчитывается по формуле:
Критерий F имеет распределение Фишера с числами степеней свободы н1=н2=k-m-1.
По таблице критических точек Фишера определяется значение критической точки fкр, которое зависит от следующих показателей:
уровня значимости б, значение которого задается при проверке гипотезы;
числа степеней свободы 1;
числа степеней свободы 2.
Необходимо сравнить между собой рассчитанное значение критерия F и значение критической точки fкр.
Если значение критерия F попадает в область принятия гипотезы (F<fкр), можно сделать следующие выводы: разница между остаточными дисперсиями признается незначимой; наблюдается гомоскедастичность.
Если значение критерия F попадает в критическую область (Ffкр), выводы оказываются следующими: разница между остаточными дисперсиями признается значимой; наблюдается гетероскедастичность.
Если при расчете остаточных дисперсий оказывается, что Sе12>Sе32, то гипотеза преобразуется следующим образом:
Н0: Sе12 = Sе32
Н1: Sе12>Sе32
Для проверки гипотезы используется критерий:
т.е. значение критерия F всегда должно быть больше единицы.
При обнаружении значительной гетероскедастичности необходимо выяснить причины ее возникновения и предложить способ устранения.
Основными причинами наличия гетероскедастичности в регрессионных моделях являются:
ошибки спецификации - влияние значимого фактора, не учтенного в модели; для устранения гетероскедастичности в этом случае необходимо изменить спецификацию модели;
внутренние свойства изучаемых переменных (например, при анализе зависимости спроса от дохода потребителя выясняется, что чем больше доход, тем больше индивидуальное значение спроса колеблется относительно ожидаемого значения); в этом случае необходимо использовать специальные методы построения эконометрической модели.
2. Задание № 1
В следующей таблице приведены статистические данные по располагаемому доходу домохозяйств (Х) и затратам домохозяйств на розничные покупки (Y) за 22 года:
Х |
9,098 |
9,137 |
9,095 |
9,280 |
9,230 |
9,348 |
9,525 |
9,755 |
|
Y |
5,490 |
5,540 |
5,305 |
5,505 |
5,420 |
5,320 |
5,540 |
5,690 |
Х |
10,280 |
10,665 |
11,020 |
11,305 |
11,430 |
11,450 |
11,697 |
|
Y |
5,870 |
6,157 |
6,342 |
5,905 |
6,125 |
6,185 |
6,225 |
Х |
11,870 |
12,018 |
12,525 |
12,055 |
12,088 |
12,215 |
12,495 |
|
Y |
6,495 |
6,720 |
6,920 |
6,470 |
6,395 |
6,555 |
6,755 |
а) Построить корреляционное поле и по его виду определить формулу зависимости между Yи X.
б) Оценить уравнение регрессии y= x+
в) Оценить качество и значимость построенной модели на 5% -ном уровне.
г) Провести анализ модели на наличие гетероскедастичности и
автокорреляции.
д) Сделать выводы о качестве построенной модели.
Решение:
а) Корреляционное поле, построенное по исходным данным представлено на рисунке 2 в программе Microsoft Excel.
Рис. 2 Корреляционное поле
На основании поля корреляции можно выдвинуть гипотезу о том, что связь между всеми возможными значениями X иY носит линейный характер. Линейное уравнение регрессии имеет видy = x+ .
б) Оценочное уравнение регрессии y= x+ будет иметь вид y = x+ +, где - наблюдаемые значения ошибок , соответственно оценки параметров и регрессионной модели, которую следуют найти.
Для оценки параметров и - используют МКТ (метод наименьших квадратов).
Находим по МКТ (подробные вычисления представлены в приложении А):
Уравнение регрессии имеет вид: = 0,3816x + 1,9217
График линии регрессии предоставлен на рисунке 3.
Рис. 3 Линия регрессии
Линейное уравнение регрессии имеет вид y = 0,38 x + 1,92
Коэффициентам уравнения линейной регрессии можно придать экономический смысл. Коэффициент регрессии = 0,38 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0,38. Коэффициент = 1,92 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями. Но если х=0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y (x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии (если > 0 - прямая связь, иначе - обратная). В нашем примере связь прямая.
в) Полученное уравнение регрессии проверяем на качество и значимости, для этого используем коэффициент детерминации и расчетное значение критерия Фишера.
Коэффициент детерминации (подробные вычисления предоставлен в приложении):
Значение коэффициента детерминации свидетельствует о высоком качестве уравнения регрессии.
Расчетное значение критерия Фишера (подробные вычисления представлены в приложении А):
Табличное значение критерия Фишера на уровне значимости 0,05:
Так как табличное значение меньше расчетного (, то уравнение регрессии статистически значимо на уровне 0,05.
г) Проведем анализ модели на наличие гетероскедастичностии автокорреляции.
Проверка наличия гетероскедастичности проведем с помощью теста Голдфельда-Квандта:
1. Упорядочим все значения по величине X.
2. Находим размер подвыборки k = (22 - 5) /2 = 9,где c = 4n/15 = 4*22/15 = 5
3. Оценим регрессию для первой подвыборки (kпервый наблюдатель) и для второй подвыборки (kпоследних наблюдений). k=9n=22. Проверяется гипотеза о равенстве дисперсий двух подвыборок (первой и последней). Для этого вычисляются суммы квадратов отклонений первых 10 наблюдений
и последних 10 наблюдений
и вычисляется критерий Фишера, как отношение большей суммы квадратов отклонений к меньшей.
Табличное значение критерия Фишера на уровне значимости 0,05:
Расчётное значение критерия Фишера меньше табличного (, то гипотеза об отсутствии гетероскедастичности принимается.
C помощью метода рядов определим наличие автокорреляции. Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений n, то вполне вероятна положительная автокорреляция. (В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых неучтенных в модели факторов). Если же рядов слишком много, то вероятна отрицательная автокорреляция. Для более детального анализа предлагается следующая процедура. Пусть
п - объем выборки;
п1 - общее количество знаков "+" при п наблюдениях;
п2 - общее количество знаков "-" при п наблюдениях;
k - количество рядов.
n=22, n1=9, n2=13, k=11. по таблицам критических значений Сведа и Эйзенхарта определим значения k1,k2. k1=6,k2 = 17 так как k1<k< k2 то автокорреляция отсутствует.
д) Выводы о качестве модели.
Значение коэффициента детерминации свидетельствует о высоком качестве уравнения регрессии. Уравнение регрессии статистически значимо на 5% -ном уровне. Тест Голдфельда-Квандта свидетельствуют об отсутствии в модели гетероскедастичности. Следовательно, модель является качественной.
3. Задание № 2
Имеются данные о потреблении некоторого продукта Y (ден. ед.) в зависимости от уровня урбанизации (доли городского населения) X1, относительного образования уровня Х2 и относительного заработка Х3 для девяти географических районов:
Таблица 2.1 - Исходные данные
Номер района |
Х1 |
Х2 |
Х3 |
Y |
|
1 |
42,2 |
11,2 |
31,9 |
167,1 |
|
2 |
48,6 |
10,6 |
13,2 |
174,4 |
|
3 |
42,6 |
10,6 |
28,7 |
160,8 |
|
4 |
39 |
10,4 |
26,1 |
162 |
|
5 |
34,7 |
9,3 |
30,1 |
140,8 |
|
6 |
44,5 |
10,8 |
8,5 |
174,6 |
|
7 |
39,1 |
10,7 |
24,3 |
163,7 |
|
8 |
40,1 |
10 |
18,6 |
174,5 |
|
9 |
45,9 |
12 |
20,4 |
185,7 |
а) оцените коэффициенты регрессионной модели ;
б) Оцените значимость полученного уравнения на 5-% уровне;
в) Проведите анализ модели на наличие мультиколлинеарности с помощью корреляционной матрицы;
г) при наличии мультиколлинеарности исключить ее.
Решение:
а) оценим коэффициенты регрессионной модели
Для оценки параметров уравнения множественной регрессии применяют МНК.
Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX) - 1XTY
К матрице с переменными Xj добавляем единичный столбец:
Представим ход решения и расчеты в excel.
Таблица 2.1 - Матрица Х
1 |
42.2 |
11.2 |
31.9 |
|
1 |
48.6 |
10.6 |
13.2 |
|
1 |
42.6 |
10.6 |
28.7 |
|
1 |
39 |
10.4 |
26.1 |
|
1 |
34.7 |
9.3 |
30.1 |
|
1 |
44.5 |
10.8 |
8.5 |
|
1 |
39.1 |
10.7 |
24.3 |
|
1 |
40.1 |
10 |
18.6 |
|
1 |
45.9 |
12 |
20.4 |
Таблица 2.2 - Матрица Y
167.1 |
|
174.4 |
|
160.8 |
|
162 |
|
140.8 |
|
174.6 |
|
163.7 |
|
174.5 |
|
185.7 |
Таблица 2.3 - Матрица XT
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
42.2 |
48.6 |
42.6 |
39 |
34.7 |
44.5 |
39.1 |
40.1 |
45.9 |
|
11.2 |
10.6 |
10.6 |
10.4 |
9.3 |
10.8 |
10.7 |
10 |
12 |
|
31.9 |
13.2 |
28.7 |
26.1 |
30.1 |
8.5 |
24.3 |
18.6 |
20.4 |
Таблица 2.4 - Умножаем матрицы, (XTX)
9 |
376.7 |
95.6 |
201.8 |
|
376.7 |
15906.53 |
4018.44 |
8283.29 |
|
95.6 |
4018.44 |
1019.94 |
2135.4 |
|
201.8 |
8283.29 |
2135.4 |
5027.62 |
В матрице, (XTX) число 9, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы X
Таблица 2.5 - Умножаем матрицы, (XTY)
1503.6 |
|
63272.75 |
|
16029.55 |
|
33209.8 |
Находим обратную матрицу (XTX) - 1
=
Вектор оценок коэффициентов регрессии равен:
= =
Расчет в Еxcel:
Уравнение регрессии (оценка уравнения регрессии)
Y = 60.0143 + 0.2392X1 + 10.7183X2-0.7517X3
б) Оценим значимость полученного уравнения на 5-% уровне
Составим таблицу 2.6 с расчетом промежуточных данных
Таблица 2.6 - Расчет промежуточных значений
п/п |
Y |
X1 |
X2 |
X3 |
Y расч |
е^2 |
(Y-Ycp) ^2 |
|
1 |
167,1 |
42,2 |
11,2 |
31,9 |
166,22 |
0,767 |
0,001 |
|
2 |
174,4 |
48,6 |
10,6 |
13,2 |
175,37 |
0,945 |
53,778 |
|
3 |
160,8 |
42,6 |
10,6 |
28,7 |
162,29 |
2,227 |
39,271 |
|
4 |
162 |
39 |
10,4 |
26,1 |
161,24 |
0,581 |
25,671 |
|
5 |
140,8 |
34,7 |
9,3 |
30,1 |
145,41 |
21,275 |
689,938 |
|
6 |
174,6 |
44,5 |
10,8 |
8,5 |
180,06 |
29,832 |
56,751 |
|
7 |
163,7 |
39,1 |
10,7 |
24,3 |
165,83 |
4,534 |
11,334 |
|
8 |
174,5 |
40,1 |
10 |
18,6 |
162,85 |
135,795 |
55,254 |
|
9 |
185,7 |
45,9 |
12 |
20,4 |
184,32 |
1,896 |
347, 201 |
|
Итого: |
1503,6 |
376,7 |
95,6 |
201,8 |
1503,6 |
197,9 |
1279,2 |
|
Среднее |
167,07 |
41,86 |
10,62 |
22,42 |
Определим коэффициент детерминации:
Оценка значимости уравнения множественной регрессии осуществляется путем проверки гипотезы о равенстве нулю коэффициент детерминации рассчитанного по данным генеральной совокупности: R2 или b1 = b2 =. = bm = 0 (гипотеза о незначимости уравнения регрессии, рассчитанного по данным генеральной совокупности).
Для ее проверки используют F-критерий Фишера.
При этом вычисляют фактическое (наблюдаемое) значение F-критерия, через коэффициент детерминации R2, рассчитанный по данным конкретного наблюдения.
По таблицам распределения Фишера-Снедоккора находят критическое значение F-критерия (Fкр). Для этого задаются уровнем значимости б (равно 0,05) и двумя числами степеней свободы k1=m и k2=n-m-1.
Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера.
Если F < Fkp = Fб; n-m-1, то нет оснований для отклонения гипотезы H0.
Табличное значение при степенях свободы k1 = 3 и k2 = n-m-1 = 9 - 3 - 1 = 5, Fkp (3;5) = 5.41
Вывод: Поскольку фактическое значение F (9,11) > Fkp (5,41), то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно.
в) Проведём анализ модели на наличие мультиколлинеарности с помощью корреляционной матрицы
Коллинеарность - зависимость между факторами. В качестве критерия мультиколлинеарности может быть принято соблюдение следующих неравенств:
r (xjy) > r (xkxj); r (xky) > r (xkxj).
Если одно из неравенств не соблюдается, то исключается тот параметр xk или xj, связь которого с результативным показателем Y оказывается наименее тесной.
Для отбора наиболее значимых факторов xi учитываются следующие условия:
связь между результативным признаком и факторным должна быть выше межфакторной связи;
связь между факторами должна быть не более 0.7. Если в матрице есть межфакторный коэффициент корреляции rxjxi > 0.7, то в данной модели множественной регрессии существует мультиколлинеарность.;
при высокой межфакторной связи признака отбираются факторы с меньшим коэффициентом корреляции между ними.
Наиболее полным алгоритмом исследования мультиколлинеарности является алгоритм Фаррара-Глобера. С его помощью тестируют три вида мультиколлинеарности:
1. Всех факторов (ч2 - хи-квадрат).
2. Каждого фактора с остальными (критерий Фишера).
3. Каждой пары факторов (критерий Стьюдента).
Анализ модели на наличие мультиколлинеарности с помощью корреляционной матрицы это метод №2 (Критерий Фишера)
Составим матрицу парных коэффициентов R.
Число наблюдений n = 9. Число независимых переменных в модели равно 3, а число регрессоров с учетом единичного вектора равно числу неизвестных коэффициентов. С учетом признака Y, размерность матрицы становится равным 5. Матрица, независимых переменных Х имеет размерность (9 х 5).
Таблица 2.7 - Матрица A, составленная из Y и X
1 |
167.1 |
42.2 |
11.2 |
31.9 |
|
1 |
174.4 |
48.6 |
10.6 |
13.2 |
|
1 |
160.8 |
42.6 |
10.6 |
28.7 |
|
1 |
162 |
39 |
10.4 |
26.1 |
|
1 |
140.8 |
34.7 |
9.3 |
30.1 |
|
1 |
174.6 |
44.5 |
10.8 |
8.5 |
|
1 |
163.7 |
39.1 |
10.7 |
24.3 |
|
1 |
174.5 |
40.1 |
10 |
18.6 |
|
1 |
185.7 |
45.9 |
12 |
20.4 |
Таблица 2.8 - Транспонированная матрица.
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
1 |
|
167.1 |
174.4 |
160.8 |
162 |
140.8 |
174.6 |
163.7 |
174.5 |
185.7 |
|
42.2 |
48.6 |
42.6 |
39 |
34.7 |
44.5 |
39.1 |
40.1 |
45.9 |
|
11.2 |
10.6 |
10.6 |
10.4 |
9.3 |
10.8 |
10.7 |
10 |
12 |
|
31.9 |
13.2 |
28.7 |
26.1 |
30.1 |
8.5 |
24.3 |
18.6 |
20.4 |
Таблица 2.9 - Матрица XTX.
9 |
1503.6 |
376.7 |
95.6 |
201.8 |
|
1503.6 |
252480.64 |
63272.75 |
16029.55 |
33209.8 |
|
376.7 |
63272.75 |
15906.53 |
4018.44 |
8283.29 |
|
95.6 |
16029.55 |
4018.44 |
1019.94 |
2135.4 |
|
201.8 |
33209.8 |
8283.29 |
2135.4 |
5027.62 |
Полученная матрица имеет следующее соответствие:
Таблица 2.10 - Структура корреляционной матрицы
?n |
?y |
?x1 |
?x2 |
?x3 |
|
?y |
?y2 |
?x1 y |
?x2 y |
?x3 y |
|
?x1 |
?yx1 |
?x1 2 |
?x2 x1 |
?x3 x1 |
|
?x2 |
?yx2 |
?x1 x2 |
?x2 2 |
?x3 x2 |
|
?x3 |
?yx3 |
?x1 x3 |
?x2 x3 |
?x3 2 |
Найдем парные коэффициенты корреляции.
Таблица 2.11 - Расчет промежуточных параметров
Признаки x и y |
?xi |
?yi |
?xiyi |
||||
Для y и x1 |
376.7 |
41.856 |
1503.6 |
167.067 |
63272.75 |
7030.306 |
|
Для y и x2 |
95.6 |
10.622 |
1503.6 |
167.067 |
16029.55 |
1781.061 |
|
Для y и x3 |
201.8 |
22.422 |
1503.6 |
167.067 |
33209.8 |
3689.978 |
|
Для x1 и x2 |
95.6 |
10.622 |
376.7 |
41.856 |
4018.44 |
446.493 |
|
Для x1 и x3 |
201.8 |
22.422 |
376.7 |
41.856 |
8283.29 |
920.366 |
|
Для x2 и x3 |
201.8 |
22.422 |
95.6 |
10.622 |
2135.4 |
237.267 |
Таблица 2.12 - Дисперсии и среднеквадратические отклонения.
Признаки x и y |
|||||
Для y и x1 |
15.505 |
142.133 |
3.938 |
11.922 |
|
Для y и x2 |
0.495 |
142.133 |
0.704 |
11.922 |
|
Для y и x3 |
55.868 |
142.133 |
7.475 |
11.922 |
|
Для x1 и x2 |
0.495 |
15.505 |
0.704 |
3.938 |
|
Для x1 и x3 |
55.868 |
15.505 |
7.475 |
3.938 |
|
Для x2 и x3 |
55.868 |
0.495 |
7.475 |
0.704 |
Таблица 2.13 - Матрица парных коэффициентов корреляции:
- |
y |
x1 |
x2 |
x3 |
|
y |
1 |
0.8018 |
0.768 |
-0.6287 |
|
x1 |
0.8018 |
1 |
0.6837 |
-0.616 |
|
x2 |
0.768 |
0.6837 |
1 |
-0.1725 |
|
x3 |
-0.6287 |
-0.616 |
-0.1725 |
1 |
Проверим с помощью статистической функции Excel - корреляция
Расчет в Excel:
Вывод: в нашем случае (y и xx2), имеют |r|>0.7, что говорит о мультиколлинеарности факторов и о необходимости исключения одного из них из дальнейшего анализа.
г) при наличии мультиколлинеарности исключить ее.
Определяем обратную матрицу D = R-1:
6.4654 |
-0.5122 |
-4.0899 |
3.0442 |
|
-0.5122 |
3.6525 |
-1.8259 |
1.6129 |
|
-4.0899 |
-1.8259 |
4.8974 |
-2.8514 |
|
3.0442 |
1.6129 |
-2.8514 |
3.4157 |
Вычисляем F-критерии Фишера:
где dkk - диагональные элементы матрицы.
Рассчитанные значения критериев сравниваются с табличными при v1=n-m и v2=m-1 степенях свободы и уровне значимости б. Если Fk > FТабл, то k-я переменная мультиколлинеарна с другими.
v1=9-3 = 7; v2=3-1 = 3. FТабл (7;3) = 8.89
Поскольку F1 > Fтабл, то переменная y мультиколлинеарна с другими.
Поскольку F2 ? Fтабл, то переменная x1 немультиколлинеарна с другими.
Поскольку F3 > Fтабл, то переменная x2 мультиколлинеарна с другими.
Поскольку F4 ? Fтабл, то переменная x3 немультиколлинеарна с другими.
Можно сделать вывод, что при построении регрессионного уравнения следует отобрать факторы x2.
Уравнение регрессии после устранения мультиколлинеарности:
Y = 60.0143 + 0.2392X1 - 0.7517X3
Список использованных источников
1 Айвазян, С.А. Эконометрика / С.А. Айвазян, С.С. Иванова. - М.: Маркет ДС, 2017. - 104 с.
2 Артамонов, Н.В. Введение в эконометрику / Н.В. Артамонов. - М.: МЦНМО, 2015. - 204 c.
3 Гладилин, А.В. Практикум по эконометрике / А.В. Гладилин, А.Н. Герасимов, Е.И. Громов. - М.: Феникс, 2016. - 336 c.
4 Кочетыгов, А.А. Основы эконометрики / А.А. Кочетыгов, Л.А. Толоконников. - М.: Издательский центр "МарТ", 2015. - 352 c.
5 Новак, Эдвард. Введение в методы эконометрики. Сборник задач / Эдвард Новак. - М.: Финансы и статистика, 2016. - 248 c.
6 Теория статистики с элементами эконометрики. Учебник. В 2 томах (комплект). - Москва: СИНТЕГ, 2015. - 682 c.
7 Эконометрика / Под редакцией В.Б. Уткина. - М.: Дашков и Ко, 2017. - 562 c.
8 Яновский, Л.П. Введение в эконометрику / Л.П. Яновский, А.Г. Буховец. - М.: КноРус, 2017. - 256 c.
Приложение А
X |
Y |
X*2 |
X*Y |
Yрасч |
e*2 |
(Y-Yср) *2 |
||||
1 |
9,098 |
5,490 |
82,774 |
49,948 |
5,393 |
0,00938 |
0,305 |
|||
2 |
9,137 |
5,540 |
83,485 |
50,619 |
5,408 |
0,01742 |
0,252 |
|||
3 |
9,095 |
5,305 |
82,719 |
48,249 |
5,392 |
0,00757 |
0,544 |
|||
4 |
9,280 |
5,505 |
86,118 |
51,086 |
5,463 |
0,00180 |
0,289 |
|||
5 |
9,230 |
5,420 |
85, 193 |
50,027 |
5,443 |
0,00055 |
0,387 |
|||
6 |
9,348 |
5,320 |
87,385 |
49,731 |
5,489 |
0,02840 |
0,522 |
|||
7 |
9,525 |
5,540 |
90,726 |
52,769 |
5,556 |
0,00026 |
0,252 |
|||
8 |
9,755 |
5,690 |
95,160 |
55,506 |
5,644 |
0,00213 |
0,124 |
|||
9 |
10,280 |
5,870 |
105,678 |
60,344 |
5,844 |
0,00067 |
0,030 |
S1*2 |
0,06818 |
|
10 |
10,665 |
6,157 |
113,742 |
65,664 |
5,991 |
0,02754 |
0,013 |
|||
11 |
11,020 |
6,342 |
121,440 |
69,889 |
6,127 |
0,04644 |
0,090 |
|||
12 |
11,305 |
5,905 |
127,803 |
66,756 |
6,235 |
0,10906 |
0,019 |
|||
13 |
11,430 |
6,125 |
130,645 |
70,009 |
6,283 |
0,02495 |
0,007 |
|||
14 |
11,450 |
6,185 |
131,103 |
70,818 |
6,291 |
0,01115 |
0,020 |
|||
15 |
11,697 |
6,225 |
136,820 |
72,814 |
6,385 |
0,02554 |
0,033 |
|||
16 |
11,870 |
6,495 |
140,897 |
77,096 |
6,451 |
0,00195 |
0, 205 |
|||
17 |
12,018 |
6,720 |
144,432 |
80,761 |
6,507 |
0,04524 |
0,459 |
|||
18 |
12,525 |
6,920 |
156,876 |
86,673 |
6,701 |
0,04807 |
0,770 |
|||
19 |
12,055 |
6,470 |
145,323 |
77,996 |
6,521 |
0,00264 |
0,183 |
|||
20 |
12,088 |
6,395 |
146,120 |
77,303 |
6,534 |
0,01932 |
0,124 |
|||
21 |
12,215 |
6,555 |
149, 206 |
80,069 |
6,582 |
0,00075 |
0,263 |
|||
22 |
12,495 |
6,755 |
156,125 |
84,404 |
6,689 |
0,00432 |
0,508 |
|||
сумма |
237,5810 |
132,9290 |
2599,7696 |
1448,5298 |
|
0,4352 |
5,3998 |
S3*2 |
0,15899 |
|
среднее |
10,7991 |
6,0422 |
118,1713 |
65,8423 |
|
|
|
|
||
b1 |
b0 |
R*2 = |
0,9194 |
Fрасч= |
2,3318 |
|||||
0,3816 |
1,9217 |
Fрасч = |
228,1785 |
Размещено на Allbest.ru
Подобные документы
Проблема гетероскедастичности и способы ее устранения. Построение базовой регрессионной модели и оценка её качества. Исследование проблемы гетероскедастичности с помощью тестов Вайта, Бреуша-Пагана-Годфри и Парка. Устранение гетероскедастичности в модели.
курсовая работа [972,0 K], добавлен 09.12.2010Применение метода наименьших квадратов при оценке параметров уравнения регрессии. Зависимость случайных остатков. Предпосылка о нормальном распределении остатков. Особенности определения наличия гомо- и гетероскедастичности. Расчет основных коэффициентов.
курсовая работа [252,1 K], добавлен 26.04.2012Понятие взаимосвязи между случайными величинами. Ковариация и коэффициент корреляции. Модель парной линейной регрессии. Метод наименьших квадратов, теорема Гаусса-Маркова. Сравнение регрессионных моделей. Коррекция гетероскедастичности, логарифмирование.
курс лекций [485,1 K], добавлен 02.06.2011Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.
курсовая работа [1,1 M], добавлен 22.05.2015Гетероскедастичность случайного возмущения: основные причины и последствия. Тесты на наличие или отсутствие гетероскедастичности. Тест ранговой корреляции Спирмена. Тест Голдфеда–Квандта. Тест Глейзера. Количественные характеристики вектора возмущений.
реферат [149,8 K], добавлен 06.01.2015Построение качественной и адекватной эконометрической модели по методу наименьших квадратов и ее анализ на наличие автокорреляции, мультиколлинеарности, гетероскедастичности с применением статистики Дарвина-Уотсона, тестов Парка и Голдфелда-Квандта.
курсовая работа [434,0 K], добавлен 04.12.2013Принципы и методы построения линейных, нелинейных моделей спроса, применение эконометрических моделей на практике. Эконометрическое моделирование спроса на автомобили в РФ, проверка значимости коэффициентов, автокорреляции, наличия гетероскедастичности.
дипломная работа [3,9 M], добавлен 30.01.2016Статистическая адекватность и проверка модели линейной регрессии на мультиколлинеарность. Исследование автокорреляции с помощью критерия Дарбина-Уотсона, тестов Сведа-Эйзенхарта и Бреуша-Годфри. Анализ гетероскедастичности и корректировка модели.
курсовая работа [1,5 M], добавлен 29.03.2015Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Оценка влияния разных факторов на среднюю ожидаемую продолжительность жизни по методу наименьших квадратов. Анализ параметров линейной двухфакторной эконометрической модели с помощью метода наименьших квадратов. Графическое изображение данной зависимости.
практическая работа [79,4 K], добавлен 20.10.2015