Классическая модель линейной регрессии
Расчет параметров линейного уравнения множественной регрессии с перечнем факторов по данным о деятельности компаний США. Оценка силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности. Доверительный интервал прогноза.
Рубрика | Экономика и экономическая теория |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 21.04.2015 |
Размер файла | 666,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Лабораторная работа № 2
Тема "Классическая модель линейной регрессии"
Задания По данным приложения А:
1) рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.
2) дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
3) оцените с помощью F-критерия Фишера - Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
4) оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.
5) оцените качество уравнения через среднюю ошибку аппроксимации.
6) рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
7) постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
8) постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
9) рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
10) рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .
11) по полученным результатам сделайте экономический вывод.
Реализация типовых заданий
1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным о деятельности крупнейших компаний США в 2007 г.
Имеются данные о деятельности 25 крупнейших компаний США (таблица 8.2.1).
Построим уравнение множественной линейной регрессии следующего вида:
.
Для этого проведем регрессионный анализ данных факторов с помощью табличного редактора МС Excel.
Таблица 8.2.1 - Исходные данные для проведения корреляционного и регрессионного анализа
№ п/п |
|||||||
1 |
45,9 |
34 |
68 |
12,5 |
43,3 |
2,3 |
|
2 |
46,7 |
16,1 |
49,3 |
18,8 |
42,9 |
3,9 |
|
3 |
45,7 |
7,2 |
66,6 |
7 |
41,3 |
1,7 |
|
4 |
46,7 |
12,7 |
17,3 |
14,6 |
40,9 |
2,6 |
|
5 |
47,6 |
22,7 |
78,5 |
30,7 |
39,7 |
3,1 |
|
6 |
46,3 |
17,7 |
20,9 |
28 |
28,9 |
0,6 |
|
7 |
49,1 |
139,8 |
356,4 |
100,6 |
39,4 |
5,1 |
|
8 |
46,6 |
20,6 |
72,4 |
24,8 |
39,2 |
2,6 |
|
9 |
51,9 |
168,1 |
218,2 |
216,1 |
38,7 |
4,5 |
|
10 |
45,4 |
4,7 |
5 |
1,2 |
37,7 |
1,9 |
|
11 |
46,3 |
9,5 |
28,8 |
7,8 |
37,7 |
3 |
|
12 |
46,9 |
29,8 |
68 |
12,4 |
37,4 |
3,6 |
|
13 |
46,9 |
16,1 |
47,5 |
17,9 |
28,6 |
3,7 |
|
14 |
46,4 |
12,5 |
45,4 |
61,5 |
35,5 |
2,5 |
|
15 |
45,4 |
22,2 |
43,9 |
30,5 |
35,1 |
3,1 |
|
16 |
45,8 |
9,5 |
11,5 |
9,7 |
34,5 |
0,3 |
|
17 |
46,8 |
29,7 |
46,8 |
41,2 |
32,9 |
2,2 |
|
18 |
45,9 |
15,1 |
24,8 |
27,8 |
32,2 |
3,5 |
|
19 |
46,1 |
20,4 |
54 |
40,6 |
27,8 |
4,1 |
|
20 |
46,9 |
15,4 |
42,8 |
17,2 |
31,7 |
4,3 |
|
21 |
44,1 |
24,1 |
5,8 |
38 |
31,6 |
2,9 |
|
22 |
46,3 |
16,2 |
31 |
20,5 |
31,6 |
3,5 |
|
23 |
47 |
16,1 |
41,4 |
19 |
31,5 |
4 |
|
24 |
45,6 |
6,9 |
6,8 |
6,7 |
30,3 |
2,6 |
|
25 |
45,7 |
18,2 |
20,9 |
23,4 |
29,6 |
4 |
где y - чистый доход, млрд. долл. x1 - оборот капитала, млрд. долл. x2 - использованный капитал, млрд. долл. x3 - численность служащих, тыс. чел. x4 - рыночная капитализация компаний, млрд. долл. x5 - заработная плата служащих, тыс. долл.
Для построения модели можно воспользоваться инструментом анализа данных Регрессия. Порядок действий следующий:
а) в главном меню выберите Сервис/Анализ данных/Регрессия. Щелкните по кнопке ОК;
б) заполните диалоговое окно ввода данных и параметров ввода (рисунок 8.2.1):
классическая модель линейная регрессия
Рисунок 8.2.1 - Диалоговое окно ввода параметров инструмента "Регрессия"
Входной интервал Y - диапазон, содержащий данные результативного признака;
Входной интервал Х - диапазон, содержащий данные всех пяти факторов;
Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет;
Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового листа.
Результаты регрессионного анализа представлены на рисунке 8.2.2.
Рисунок 8.2.2 - Результат применения инструмента Регрессия для факторов
Составим уравнение множественной регрессии:
.
Коэффициенты регрессии показывают среднее изменение результативного признака с изменением на 1 единицу своего измерения данного фактора при условии постоянства всех остальных.
Таким образом, коэффициент регрессии при х1 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,0136 млрд. долл., при х2 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,003 млрд. долл., х3 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,012 тыс. чел., х4 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,025 млрд. долл., х5 показывает, что с увеличением оборотного капитала на 1 млрд. долл. чистый доход увеличится в среднем на 0,07 тыс. долл., при фиксированном значении остальных факторов.
Параметр экономического смысла не имеет.
2. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
Средние коэффициенты эластичности показывают, на сколько процентов от значения своей средней изменяется результат при изменении фактора на 1 % от своей средней и при фиксированном воздействии на y всех прочих факторов, включенных в уравнение регрессии. Для линейной зависимости
,
где - коэффициент регрессии при в уравнении множественной регрессии.
Результаты вычисления соответствующих показателей для каждого признака представлены на рисунке 8.2.3.
Рисунок 8.2.3 - Результат применения инструмента "Описательная статистика"
Здесь ,
,
,
,
.
По значениям средних коэффициентов эластичности можно сделать вывод о более сильном влиянии на результат y признаков факторов и , чем признаков факторов , и .
Средний коэффициент эластичности , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,008 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,003 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,009 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,019 %, при условии, что другие факторы остаются постоянными, , показывает, что с увеличением оборотного капитала на 1 %, чистый доход увеличивается в среднем на 0,005 %, при условии, что другие факторы остаются постоянными.
3. Оцените с помощью F-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
Оценку надежности уравнения регрессии в целом и показателя тесноты связи дает F-критерий Фишера:
.
Для проверки значимости уравнения выдвигаем две гипотезы:
Н0: уравнение регрессии статистически не значимо;
Н1: уравнение регрессии статистически значимо.
По данным таблиц дисперсионного анализа, представленным на рисунке 8.2.2, =11.52. Вероятность случайно получить такое значение F-критерия составляет 0,00003, что не превышает допустимый уровень значимости 5 %; об этом свидетельствует величина P - значение из этой же таблицы. Следовательно, полученное значение не случайно, оно сформировалось под влиянием существенных факторов, т.е. подтверждается статистическая значимость всего уравнения и показателя тесноты связи . =0,00003. > следовательно уравнение регрессии является статистически значимым.
4. Оцените статистическую значимость коэффициентов регрессии с помощью t - критерия Стьюдента.
Выдвигаем две гипотезы: Н0: коэффициенты регрессии статистически не значим, т.е. равны о; Н1: коэффициенты регрессии статистически значимы, т.е. отличны от нуля. Значения случайных ошибок параметров с учетом округления равны (рисунок 8.2.2):
Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 8.2.2):
.
Если значения t-критерия меньше 2,09, можно сделать вывод о неслучайной природе данного значения параметра, т. е о том, что он статистически значим и надежен. Tтабл=
5. Оцените качество уравнения через среднюю ошибку аппроксимации.
Рассчитаем среднюю ошибку аппроксимации по формуле средней арифметической простой:
Таблица 8.2.2 - Данные для расчета средней ошибки аппроксимации
№ п/п |
||||
1 |
2 |
3 |
4 |
|
1 |
45,9 |
46,58 |
1,48 |
|
2 |
46,7 |
46,46 |
0,52 |
|
3 |
45,7 |
46,05 |
0,77 |
|
4 |
46,7 |
46,12 |
1,23 |
|
5 |
47,6 |
46,64 |
2,01 |
|
6 |
46,3 |
45,92 |
0,81 |
|
7 |
49,1 |
50,04 |
1,91 |
|
8 |
46,6 |
46,48 |
0,26 |
|
9 |
51,9 |
51,34 |
1,09 |
|
10 |
45,4 |
45,69 |
0,64 |
|
11 |
46,3 |
46,82 |
1,13 |
|
12 |
46,9 |
46,47 |
0,93 |
|
13 |
46,9 |
46,07 |
1,77 |
|
14 |
46,4 |
46,63 |
0,49 |
|
15 |
45,4 |
46,41 |
2,23 |
|
16 |
45,8 |
45,68 |
0,25 |
|
17 |
46,8 |
46,54 |
0,57 |
|
18 |
45,9 |
46,18 |
0,62 |
|
19 |
46,1 |
46,43 |
0,71 |
|
20 |
46,9 |
46,16 |
1,58 |
|
21 |
44,1 |
46,36 |
5,12 |
|
22 |
46,3 |
46,11 |
0,40 |
|
23 |
47 |
46,16 |
1,79 |
|
24 |
45,6 |
45,65 |
0,12 |
|
25 |
45,7 |
46,13 |
0,94 |
|
1164,00 |
1165,13 |
29,38 |
Таким образом, фактические значения результативного признака отличаются от теоретических значений на 117,5 %. Следовательно, построенная модель не является удовлетворительной.
i. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
Значения линейных коэффициентов парной корреляции определяют тесноту попарно связанных переменных, использованных в данном уравнении множественной регрессии.
Парные коэффициенты корреляции рассчитываются по формулам:
; .
Рисунок 8.2.4 - Матрица коэффициентов парной корреляции
Из матрицы можно заметить, что факторы и , и мультиколлинеарны, т.к. коэффициенты корреляции превышают 0,7. Таким образом, можно сказать, что они дублируют друг друга.
При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. В нашем примере получаем, информативными факторами являются: и .
Построим новое уравнение множественной регрессии с информативными факторами.
7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
Построим уравнение множественной линейной регрессии следующего вида:
.
Параметры вычисляем аналогично пункту 1 (рисунок 8.2.7).
Рисунок 8.2.7 - Результат применения инструмента "Регрессия"
Получаем уравнение следующего вида: .
Уравнение в целом, а также его параметры являются статистически значимыми.
8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
Уравнение в стандартизованном масштабе имеет вид:
.
Расчет в - коэффициентов выполним по формулам
; .
Парные коэффициенты корреляции берутся из матрицы (рисунок 8.2.6):
Получим уравнение .
Стандартизованные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результативный признак, если соответствующий фактор изменится на 1 сигму при неизменном среднем уровне других факторов.
В нашем случае, при увеличении использования капитала на 1 сигму чистый доход увеличится на 1,07 сигм, при условии, что численность служащих остаются на прежнем уровне, при увеличении использования капитала на 1 сигму чистый доход уменьшится на 0,46 сигм, при условии, что численность служащих остаются на прежнем уровне.
9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
Рассчитаем ожидаемое прогнозное значение чистого дохода как точечный прогноз путем подстановки в уравнение регрессии прогнозные значения факторов:
1) найдем максимальное значение для фактора (рисунок 8.2.4):
2) найдем максимальное значение для фактора (рисунок 8.2.4):
3) найдем прогнозные значения факторов:
для фактора :
для фактора :
4) подставим прогнозные значения факторов в уравнение
В результате получим:
Таким образом, при прогнозных значениях использованного капитала 356 млдр. долл. и численности служащих 216,1 тыс. чел. чистый доход крупнейших компаний США составит 92,21 млрд. долл.
Размещено на Allbest.ru
Подобные документы
Классическая линейную модель множественной регрессии. Значимость уравнения регрессии и его коэффициентов. Доверительный интервал. Матрица парных коэффициентов корреляции. Модель множественной регрессии. Автокорреляция.
контрольная работа [172,9 K], добавлен 17.01.2004Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.
контрольная работа [932,7 K], добавлен 09.06.2012Составление матрицы парных коэффициентов корреляции переменных. Построение линейного уравнения регрессии, характеризирующее зависимость цены от факторов. Оценка статистической значимости параметров в регрессионной модели с помощью t-критерия Стьюдента.
лабораторная работа [1,6 M], добавлен 13.04.2010Экономическая интерпретация коэффициентов регрессии. Графическое представление фактических и модельных значений точки прогноза, уравнений регрессии (гиперболической, степенной, показательной). Нахождение коэффициентов детерминации и эластичности.
контрольная работа [324,1 K], добавлен 13.04.2010Порядок построения линейного уравнения парной регрессии, расчет коэффициентов и оценка статической значимости параметров регрессии и корреляции. Точность прогноза. Множественная регрессия и корреляция. Системы эконометрических уравнений. Временные ряды.
контрольная работа [1,3 M], добавлен 24.09.2013Проверка выполнения предпосылок МНК. Значимость параметров уравнения регрессии с помощью t-критерия Стьюдента и F-критерия Фишера. Средняя относительная ошибка аппроксимации. Гиперболические, степенные и показательные уравнения нелинейной регрессии.
контрольная работа [253,4 K], добавлен 17.03.2011Расчет параметров уравнения линейной регрессии, экономическая интерпретация регрессии. Определение остаточной суммы квадратов. Выполнение предпосылок МНК. Расчет коэффициента детерминации, проверка значимости уравнения регрессии с помощью критерия Фишера.
контрольная работа [317,0 K], добавлен 11.05.2009Основные этапы многофакторного корреляционного анализа и интерпретация его параметров. Назначение коэффициентов эластичности и стандартизированных бетта-коэффициентов. Расчет значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента.
контрольная работа [605,2 K], добавлен 29.07.2010Изучение и оценка коэффициентов и уравнения линейной регрессии показателей грузоперевозок по РБ за 2011-2012 гг. Проверка гипотез о значениях коэффициентов регрессии, построение доверительных интервалов, анализ статистической однородности и независимости.
курсовая работа [773,3 K], добавлен 23.10.2012Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.
контрольная работа [513,5 K], добавлен 02.05.2015