Регрессионный анализ
Понятие, задачи и основные цели регрессионного анализа. Прогнозирование, основанное на использовании моделей временных рядов. Определение степени детерминированности вариации критериальной переменной предикторами. Ошибки, возникающие при измерении данных.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 13.11.2011 |
Размер файла | 785,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание:
1. Регрессионный анализ: понятие, задачи, основные цели
2. Прогнозирование, основанное на использовании моделей временных рядов
3.Задача№1
4.Задача№2
5.Список используемой литературы
1.Регрессионный анализ: понятие, задачи, основные цели
Регрессиомнный (линейный) анализ -- статистический метод исследования зависимости между зависимой переменной Y и одной или несколькими независимыми переменными X1,X2,...,Xp. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные -- критериальными. Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных (см. Ложная корреляция), а не причинно-следственные отношения. Цели регрессионного анализа
Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)
Предсказание значения зависимой переменной с помощью независимой(-ых)
Определение вклада отдельных независимых переменных в вариацию зависимой
Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.
Регрессионным анализом называется определение аналитического выражения связи между исследуемыми переменными, в котором изменение результативной переменной происходит под влиянием факторной переменной.
Модель регрессии или уравнение регрессии позволяет количественно оценить взаимосвязь между исследуемыми переменными.
Предположим, что имеется набор значений двух переменных: yi (результативная переменная) и xi (факторная переменная). Между этими переменными существует зависимость вида: y = f (x).
Задача регрессионного анализа состоит в том, чтобы по данным наблюдений определить такую функцию ? = f (x), которая наилучшим образом описывала исследуемую зависимость между переменными.
Для определения аналитической формы зависимости между исследуемыми переменными применяются следующие методы:
1) графический метод или визуальная оценка характера связи. В этом случае на линейном графике по оси абсцисс откладываются значения факторной переменной х, а по оси ординат - значения результативной переменной у. Затем на пересечении соответствующих значений отмечаются точки. Полученный точечный график в системе координат (х, у) называется корреляционным полем. Линия, которая соединяет точки на графике, называется эмпирической линией. По её виду можно судить не только о наличии, но и о форме зависимости между изучаемыми переменными;
2) на основе теоретического и логического анализа природы изучаемых явлений, их социально-экономической сущности;
3) определение аналитической формы зависимости между переменными экспериментальным путём.
При исследовании зависимости между двумя переменными чаще всего используется линейная форма связи. Это связано с двумя обстоятельствами:
1) чёткая экономическая интерпретация параметров линейной модели регрессии;
2) в большинстве случаев нелинейные модели регрессии преобразуются к линейному виду.
Общий вид модели парной регрессии зависимости переменной у от переменной х:
yi=?0+?1xi+?i,
где yi- результативные переменные,
xi- факторные переменные,
?0, ?1 - параметры модели регрессии, подлежащие оцениванию;
?i - случайная ошибка модели регрессии. Данная величина является случайной, она характеризует отклонения реальных значений результативных переменных от теоретических, рассчитанных по уравнению регрессии.
Присутствие случайной ошибки в модели регрессии порождено следующими источниками:
1) нерепрезентативность выборки. Модель парной регрессии в большинстве случаев является большим упрощением истинной зависимости между переменными, потому что в модель входит только одна факторная переменная, не способная полностью объяснить вариацию результативной переменной. При этом результативная переменная может быть подвержена влиянию множества других факторных переменных в гораздо большей степени;
2) ошибки, возникающие при измерении данных;
3) неправильная функциональная спецификация модели.
Коэффициент ?1, входящий в модельпарной регрессии, называется коэффициентом регрессии. Он характеризует, на сколько в среднем изменится результативная переменная у при условии изменения факторной переменной х на единицу своего измерения. Знак коэффициента регрессии указывает на направление связи между переменными:
1) если ?1›0, то связь между изучаемыми переменными (с уменьшением факторной переменной х уменьшается и результативная переменная у, и наоборот);
2) если ?1‹0, то связь между изучаемыми переменными (с увеличением факторной переменной х результативная переменная у уменьшается, и наоборот).
Коэффициент ?0, входящий в модель парной регрессии, трактуется как среднее значение результативной переменной у при условии, что факторная переменная х равна нулю. Но если факторная переменная не имеет и не может иметь нулевого значения, то подобная трактовка коэффициента ?0 не имеет смысла.
Общий вид модели парной регрессии в матричном виде:
Y= X* ?+ ?, Где
- случайный вектор-столбец значений результативной переменной размерности n x 1;
- матрица значений факторной переменной размерности n x 2. Первый столбец является единичным, потому что в модели регрессии коэффициент ?0 умножается на единицу;
- вектор-столбец неизвестных коэффициентов модели регрессии размерности 2 x 1
- случайный вектор-столбец ошибок модели регрессии размерности n x 1.
2. Прогнозирование, основанное на использовании моделей временных рядов
Характерной чертой адаптивных методов прогнозирования является их способность непрерывно учитывать эволюцию динамических характеристик изучаемых процессов, «адаптироваться» к этой эволюции, придавая тем больший вес, тем более высокую информационную ценность имеющимся наблюдениям, чем ближе они к текущему моменту прогнозирования.
В основе процедуры адаптации лежит метод проб и ошибок. По модели делается прогноз на один интервал по времени. Через один шаг моделирования анализируется результат: насколько он далек от фактического значения. Затем в соответствии с моделью происходит корректировка. После этого процесс повторяется. Таким образом, адаптация осуществляется рекуррентно с получением каждой новой фактической точки ряда.
Методы экспоненциального сглаживания. Модель Брауна.
Пусть анализируемый временной ряд x(t) представлен в виде:
x(t) = a0 + ?(t),
где a0 - неизвестный параметр, не зависящий от времени, ?(t) - случайный остаток со средним значением, равным нулю, и конечной дисперсией.
В соответствии с методом Брауна прогноз x*(t+?) для неизвестного значения x(t+?) по известной до момента времени t траектории ряда x(t) строится по формуле:
x*(t; ?) = S(t),
где значение экспоненциально взвешенной скользящей средней S(t) определяется по рекуррентной формуле:
S(t)= ?x(t) + (1-?) S(t-1).
Коэффициент сглаживания ? можно интерпретировать как коэффициент дисконтирования, характеризующий меру обесценивания информации за единицу времени. Из формулы следует, что экспоненциально взвешенная скользящая средняя является взвешенной суммой всех уровней ряда x(t), причем веса уменьшаются экспоненциально по мере удаления в прошлое.
В качестве S(0) берется, как правило, среднее значение ряда динамики или среднее значение нескольких начальных уровней ряда.
Случай линейного тренда:
x(t) = a0 + a1t + ?(t).
В этом случае прогноз x*(t; ?) будущего значения определяется соотношением:
x*(t; ?) = ,
а пересчет коэффициентов осуществляется по формулам:
Начальные значения коэффициентов берутся из оценки тренда линейной функцией.
Модель Хольта.
В модели Хольта введено два параметра сглаживания ?1 и ? 2 (0< ? 1, ? 2 <1). Прогноз x*(t;l) на l шагов по времени определяется формулой:
x*(t; ?) = ,
а пересчет коэффициентов осуществляется по формулам:
Модель Хольта-Уинтерса.
Эта модель помимо линейного тренда учитывает и сезонную составляющую. Прогноз x*(t;?) на ? шагов по времени определяется формулой:
x*(t;?) = ,
где f(t) - коэффициент сезонности, а T - число временных тактов (фаз), содержащихся в полном сезонном цикле.
Видно, что в данной модели сезонность представлена мультипликативно. Формулы обновления коэффициентов имеют вид:
Модель Тейла-Вейджа.
Если исследуемый временной ряд имеет экспоненциальную тенденцию с мульти-пликативной сезонностью, то после логарифмирования обеих частей уравнения получается модель с линейной тенденцией и аддитивной сезонностью или модель Тейла-Вейджа.
Имеется модель:
x(t) = a0(t) + g(t) + ?(t),
a0(t) = a0(t-1) + a1(t).
Здесь a0(t) - уровень процесса после устранения сезонных колебаний, a1(t) - аддитивный коэффициент роста, ?(t) - аддитивный коэффициент сезонности и ?(t) - белый шум.
Прогноз x*(t;?) на ? шагов по времени определяется формулой:
x*(t;?) = .
Коэффициенты вычисляются рекуррентным способом по формулам:
Для определения оптимальных значений параметров адаптации перебирают различные наборы их значений и сравнивают получающиеся при этом среднеквадратические ошибки прогнозов.
Задача 1.
В табл. 1 приведены данные о личных потребительских расходах и располагаемом личном доходе населения США (млрд. дол., в ценах 1972 г.) за период с 1959 г. по 1983 г.
а) Постройте уравнение для функции спроса (Y) на данный товар или вид услуг в зависимости от располагаемого личного дохода (X). Постройте таблицу дисперсионного анализа. Вычислите коэффициент детерминации R2.
Проверьте регрессию на значимость с помощью F-теста (? = 0,05 - критерий значимости). Вычислите 95% доверительные интервалы для истинных значений коэффициентов в этом уравнении. Изобразите диаграмму рассеяния и прямую регрессии.
б) Постройте линейный временной тренд для функции спроса.
в) Рассмотрите функцию спроса (Y) как функцию двух переменных: располагаемого дохода (X) и реальной цены на товар или вид услуг (P). (Реальная цена вычисляется по формуле
P = (Z / L) • 100%). (Z, L см. табл. 1).
Постройте уравнение множественной регрессии Y на X и P. С помощью МНК оцените коэффициенты в этом уравнении (замените Y, X и P на их логарифмы).
Дайте экономическую интерпретацию коэффициентов в уравнении. Вычислите коэффициенты эластичности функции спроса. Интерпретируйте эти коэффициенты.
Таблица 1
Исходные данные о личных потребительских расходах и располагаемом личном доходе
Год |
Личныйрасполагаемыйдоход,млрд. $ |
Текущиерасходына бензин |
Дефляторы цендля личныхпотребительскихрасходов |
Цены |
|
T |
X |
Y |
Z |
L |
|
1959 |
440,4 |
13,7 |
82,2 |
70,6 |
|
1960 |
452,0 |
14,2 |
84,5 |
71,9 |
|
1961 |
461,4 |
14,3 |
83,9 |
72,6 |
|
1962 |
482,0 |
14,9 |
84,5 |
73,7 |
|
1963 |
500,5 |
15,3 |
84,5 |
74,8 |
|
1964 |
528,0 |
16,0 |
84,4 |
75,9 |
|
1965 |
557,5 |
16,8 |
87,5 |
77,2 |
|
1966 |
646,8 |
17,8 |
89,5 |
79,4 |
|
1967 |
673,5 |
18,4 |
92,4 |
81,4 |
|
1968 |
701,3 |
19,9 |
93,8 |
84,6 |
|
1969 |
722,5 |
21,4 |
97,0 |
88,4 |
|
1970 |
751,6 |
22,9 |
97,9 |
92,5 |
|
1971 |
779,2 |
24,2 |
98,7 |
96,3 |
|
1972 |
810,3 |
25,4 |
109,0 |
100,0 |
|
1973 |
865,3 |
26,2 |
109,4 |
105,7 |
|
1974 |
858,4 |
24,8 |
147,7 |
116,3 |
|
1975 |
875,8 |
25,6 |
157,7 |
125,2 |
|
1976 |
906,8 |
26,8 |
164,3 |
131,7 |
|
1977 |
942,9 |
27,7 |
173,7 |
139,3 |
|
1978 |
988,8 |
28,3 |
181,3 |
149,1 |
|
1979 |
1015,5 |
27,4 |
243,2 |
162,5 |
|
1980 |
1021,6 |
25,1 |
337,9 |
179,0 |
|
1981 |
1049,3 |
25,1 |
376,4 |
194,3 |
|
1982 |
1058,3 |
25,3 |
356,6 |
206,0 |
|
1983 |
1095,4 |
26,1 |
344,9 |
213,6 |
Решение
а) Постройте уравнение для функции спроса (Y) на данный товар или вид услуг в зависимости от располагаемого личного дохода (X). Постройте таблицу дисперсионного анализа. Вычислите коэффициент детерминации R2.
Проверьте регрессию на значимость с помощью F-теста (? = 0,05 - критерий значимости). Вычислите 95% доверительные интервалы для истинных значений коэффициентов в этом уравнении. Изобразите диаграмму рассеяния и прямую регрессии.
Идентифицируем переменные: x - независимая переменная (фактор) y - зависимая переменная (показатель).
Пусть эконометрическая модель специфицирована в линейной форме:
y = ax + b + u
где a, b - параметры модели u - стохастическая составляющая (остатки).
Используем метод наименьших квадратов [ЛЕЩ, с.29].
Запишем систему нормальных уравнений, используя в качестве неизвестной переменной - переменную x:
где n - количество наблюдений.
Построим вспомогательную таблицу 1.
Табл. 1.
№ |
x |
y |
x2 |
xy |
|
1 |
440,4 |
13,7 |
193952,16 |
6033,48 |
|
2 |
452,0 |
14,2 |
204304,00 |
6418,40 |
|
3 |
461,4 |
14,3 |
212889,96 |
6598,02 |
|
4 |
482,0 |
14,9 |
232324,00 |
7181,80 |
|
5 |
500,5 |
15,3 |
250500,25 |
7657,65 |
|
6 |
528,0 |
16,0 |
278784,00 |
8448,00 |
|
7 |
557,5 |
16,8 |
310806,25 |
9366,00 |
|
8 |
646,8 |
17,8 |
418350,24 |
11513,04 |
|
9 |
673,5 |
18,4 |
453602,25 |
12392,40 |
|
10 |
701,3 |
19,9 |
491821,69 |
13955,87 |
|
11 |
722,5 |
21,4 |
522006,25 |
15461,50 |
|
12 |
751,6 |
22,9 |
564902,56 |
17211,64 |
|
13 |
779,2 |
24,2 |
607152,64 |
18856,64 |
|
14 |
810,3 |
25,4 |
656586,09 |
20581,62 |
|
15 |
865,3 |
26,2 |
748744,09 |
22670,86 |
|
16 |
858,4 |
24,8 |
736850,56 |
21288,32 |
|
17 |
875,8 |
25,6 |
767025,64 |
22420,48 |
|
18 |
906,8 |
26,8 |
822286,24 |
24302,24 |
|
19 |
942,9 |
27,7 |
889060,41 |
26118,33 |
|
20 |
988,8 |
28,3 |
977725,44 |
27983,04 |
|
21 |
1015,5 |
27,4 |
1031240,25 |
27824,70 |
|
22 |
1021,6 |
25,1 |
1043666,56 |
25642,16 |
|
23 |
1049,3 |
25,1 |
1101030,49 |
26337,43 |
|
24 |
1058,3 |
25,3 |
1119998,89 |
26774,99 |
|
25 |
1095,4 |
26,1 |
1199901,16 |
28589,94 |
|
? |
19185,1 |
543,6 |
15835512,07 |
441628,55 |
Получим систему уравнений:
Решение системы найдем по формулам Крамера [ГЕТ, с.30]:
где ? - главный определитель системы.
Следовательно, уравнение линейной модели имеет вид:
y = 4,8705 + 0,0220x.
Это значит, что при увеличении или уменьшении значения фактора на 1 у.е. показатель увеличивается или уменьшается на 0,022 у.е., то есть между эконометрическими параметрами существует прямая пропорциональная или положительная зависимость.
Свободный член регрессии b = 4,8705 указывает значение показателя при нулевом значении фактора. Он имеет лишь расчетное значение, поскольку такой случай невозможен в реальной экономической ситуации.
Для проведения исследования модели построим вспомогательную таблицу 2.
Табл. 2.
№ |
x |
y |
yx |
u2 = (y - yx)2 |
|||||
1 |
440,4 |
13,7 |
14,5539 |
64,7059 |
106931,6160 |
2630,4202 |
51,6973 |
0,7292 |
|
2 |
452,0 |
14,2 |
14,8090 |
56,9119 |
99479,6832 |
2379,4078 |
48,0945 |
0,3709 |
|
3 |
461,4 |
14,3 |
15,0157 |
55,4131 |
93638,4480 |
2277,8938 |
45,2705 |
0,5122 |
|
4 |
482,0 |
14,9 |
15,4686 |
46,8403 |
81455,4432 |
1953,3050 |
39,3805 |
0,3233 |
|
5 |
500,5 |
15,3 |
15,8754 |
41,5251 |
71237,7452 |
1719,9294 |
34,4407 |
0,3311 |
|
6 |
528,0 |
16,0 |
16,4800 |
32,9935 |
57314,2752 |
1375,1366 |
27,7092 |
0,2304 |
|
7 |
557,5 |
16,8 |
17,1287 |
24,4431 |
44059,6892 |
1037,7654 |
21,3011 |
0,1080 |
|
8 |
646,8 |
17,8 |
19,0922 |
15,5551 |
14545,3248 |
475,6622 |
7,0321 |
1,6698 |
|
9 |
673,5 |
18,4 |
19,6793 |
11,1823 |
8817,9612 |
314,0150 |
4,2631 |
1,6365 |
|
10 |
701,3 |
19,9 |
20,2905 |
3,4003 |
4369,7388 |
121,8958 |
2,1126 |
0,1525 |
|
11 |
722,5 |
21,4 |
20,7567 |
0,1183 |
2016,3692 |
15,4470 |
0,9748 |
0,4139 |
|
12 |
751,6 |
22,9 |
21,3965 |
1,3363 |
249,7664 |
-18,2694 |
0,1208 |
2,2605 |
|
13 |
779,2 |
24,2 |
22,0034 |
6,0319 |
139,1456 |
28,9710 |
0,0673 |
4,8252 |
|
14 |
810,3 |
25,4 |
22,6872 |
13,3663 |
1840,0668 |
156,8278 |
0,8896 |
7,3594 |
|
15 |
865,3 |
26,2 |
23,8965 |
19,8559 |
9583,6268 |
436,2246 |
4,6333 |
5,3061 |
|
16 |
858,4 |
24,8 |
23,7448 |
9,3391 |
8280,2720 |
278,0838 |
4,0032 |
1,1135 |
|
17 |
875,8 |
25,6 |
24,1274 |
14,8687 |
11749,6928 |
417,9750 |
5,6805 |
2,1686 |
|
18 |
906,8 |
26,8 |
24,8090 |
25,5631 |
19431,2448 |
704,7862 |
9,3942 |
3,9641 |
|
19 |
942,9 |
27,7 |
25,6028 |
35,4739 |
30798,8460 |
1045,2542 |
14,8900 |
4,3984 |
|
20 |
988,8 |
28,3 |
26,6120 |
42,9811 |
49016,1888 |
1451,4722 |
23,6974 |
2,8493 |
|
21 |
1015,5 |
27,4 |
27,1991 |
31,9903 |
61551,6252 |
1403,2310 |
29,7578 |
0,0404 |
|
22 |
1021,6 |
25,1 |
27,3332 |
11,2627 |
64615,6064 |
853,0818 |
31,2391 |
4,9872 |
|
23 |
1049,3 |
25,1 |
27,9423 |
11,2627 |
79465,3548 |
946,0430 |
38,4184 |
8,0784 |
|
24 |
1058,3 |
25,3 |
28,1401 |
12,6451 |
84620,4828 |
1034,4262 |
40,9107 |
8,0664 |
|
25 |
1095,4 |
26,1 |
28,9559 |
18,9747 |
107581,3760 |
1428,7506 |
52,0114 |
8,1561 |
|
? |
19185,1 |
543,6 |
- |
608,0416 |
1112789,5896 |
24467,7356 |
537,9904 |
70,0512 |
|
?/n |
767,404 |
21,744 |
- |
24,3217 |
44511,5836 |
978,7094 |
21,5196 |
2,8020 |
Оценим параметры модели альтернативным способом:
Линейное уравнение регрессии аналогично: yx = 0,022x + 4,8705.
Вычислим для зависимой переменной y общую дисперсию, дисперсию, что объясняет регрессию, дисперсию ошибок [ЛУК, с. 56]:
Суммы квадратов связанные с определенным источником вариации, а также со степенями свободы и средними квадратами. Сведем их всех в таблице, которая называется базовой таблицей дисперсионного анализа - ANOVA-таблицей [ЛУК, с. 61].
Построим ANOVA-таблицу о зависимости между показателем и фактором:
Источник вариации |
Количество |
Сумма квадратов |
Средние квадраты |
|
Предопределено регрессией (модель) |
1 |
|||
Необъяснимо с помощью |
n - 2 = 23 |
|||
Общее |
n - 1 = 24 |
- |
Определим коэффициенты детерминации R2 и корреляции r [ЛУК, c. 57]:
Этот результат значит, что 88,48% вариации результативного признака зависит от вариации уровня факторного признака, а 11,52% приходится на другие факторы.
Поскольку 0,7 < r < 1, то между факторным и результативным признаком корреляционная связь сильная.
Проверим адекватность модели по критерию Фишера или F-критерию, который вычисляется по формуле:
Поскольку табличное значение F(0,05; 1; 23) = 4,28 и |F| > Fтаб, то делаем вывод об адекватности эконометрической модели.
Оценим статистическую значимость параметров регрессии.
Табличное значение t-критерия Стьюдента при заданном уровне значимости 0,95 и n - 2 = 23 степенях свободы равно 2,07.
Найдем матрицу погрешностей C-1, обратную к матрице системы уравнений:
? = |C| = 27819739,74,
Определим стандартные погрешности оценок параметров модели, учитывая дисперсию остатков:
где
Рассчитаем t-критерий Стьюдента для каждого из коэффициентов
Поскольку tm = 2,07 и это значение больше t-критериев для каждого из коэффициентов, то делаем вывод об их статистической значимости.
Определим интервалы доверия для параметров регрессии [ЕЛИ, с. 57].
Для расчета доверительного интервала определяем предельную погрешность для каждого коэффициента:
?a = tтаб.ma = 2,0690 · 0,0017 = 0,0034,
?b = tтаб.mb = 2,0690 · 1,3167 = 2,7242,
Следовательно, экстремальные значения для каждого коэффициента следующие:
min a = a - ?a = 0,0220 - 0,0034 = 0,0186, max a = a + ?a = 0,0220 + 0,0034 = 0,0254,
min b = b - ?b = 4,8705 - 2,7242 = 2,1463, max b = b + ?b = 4,8705 + 2,7242 = 7,5947.
Таким образом, доверительные интервалы для коэффициентов регрессии следующие:
a (0,0186; 0,0254),
b (2,1463; 7,5947).
Изобразим диаграмму рассеяния и прямую регрессии.
б) Постройте линейный временной тренд для функции спроса.
Идентифицируем переменные: t - независимая временная переменная (фактор), y - зависимая переменная (показатель). Пусть модель специфицирована в линейной форме:
y = at + b + u,
где a, b - параметры модели, u - стохастическая составляющая (остатки).
Используем метод наименьших квадратов [ЛЕЩ, с.29].
Запишем систему нормальных уравнений, используя в качестве неизвестную переменную - переменную t:
Расчет параметров значительно упрощается, если за начало счета времени (t = 0) принять центральный интервал (момент).
При нечетном числе уровней (например, 25), значения t = 0 - условного обозначения времени будет отвечать среднему 1971 году:
t |
-12 |
-11 |
-10 |
-9 |
-8 |
-7 |
-6 |
-5 |
-4 |
-3 |
-2 |
-1 |
0 |
|
Y |
13,7 |
14,2 |
14,3 |
14,9 |
15,3 |
16 |
16,8 |
17,8 |
18,4 |
19,9 |
21,4 |
22,9 |
24,2 |
|
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
||
Y |
25,4 |
26,2 |
24,8 |
25,6 |
26,8 |
27,7 |
28,3 |
27,4 |
25,1 |
25,1 |
25,3 |
26,1 |
Поскольку ?t = 0, поэтому система нормальных уравнений принимает вид:
Построим вспомогательную таблицу:
№ |
t |
y |
t2 |
ty |
|
1 |
-12 |
13,7 |
144 |
-164,4 |
|
2 |
-11 |
14,2 |
121 |
-156,2 |
|
3 |
-10 |
14,3 |
100 |
-143,0 |
|
4 |
-9 |
14,9 |
81 |
-134,1 |
|
5 |
-8 |
15,3 |
64 |
-122,4 |
|
6 |
-7 |
16,0 |
49 |
-112,0 |
|
7 |
-6 |
16,8 |
36 |
-100,8 |
|
8 |
-5 |
17,8 |
25 |
-89,0 |
|
9 |
-4 |
18,4 |
16 |
-73,6 |
|
10 |
-3 |
19,9 |
9 |
-59,7 |
|
11 |
-2 |
21,4 |
4 |
-42,8 |
|
12 |
-1 |
22,9 |
1 |
-22,9 |
|
13 |
0 |
24,2 |
0 |
0,0 |
|
14 |
1 |
25,4 |
1 |
25,4 |
|
15 |
2 |
26,2 |
4 |
52,4 |
|
16 |
3 |
24,8 |
9 |
74,4 |
|
17 |
4 |
25,6 |
16 |
102,4 |
|
18 |
5 |
26,8 |
25 |
134,0 |
|
19 |
6 |
27,7 |
36 |
166,2 |
|
20 |
7 |
28,3 |
49 |
198,1 |
|
21 |
8 |
27,4 |
64 |
219,2 |
|
22 |
9 |
25,1 |
81 |
225,9 |
|
23 |
10 |
25,1 |
100 |
251,0 |
|
24 |
11 |
25,3 |
121 |
278,3 |
|
25 |
12 |
26,1 |
144 |
313,2 |
|
? |
- |
543,6 |
1300 |
819,6 |
Получим систему уравнений:
Находим решение:
a = 819,6 / 1300 = 0,6305,
b = 543,6 / 25 = 21,744.
Следовательно, уравнение линейного тренда имеет вид:
y = 21,7440 + 0,6305t.
Это значит, что при увеличении или уменьшении значения временного фактора на 1 ед., показатель увеличивается или уменьшается на 0,6305 у.е., то есть между параметрами существует прямая пропорциональная или положительная зависимость.
Свободный член регрессии b = 21,744 указывает значение показателя при нулевом значении условного времени.
в) Рассмотрите функцию спроса (Y) как функцию двух переменных: располагаемого дохода (X) и реальной цены на товар или вид услуг (P). (Реальная цена вычисляется по формуле
P = (Z / L) • 100%). (Z, L см. табл. 1).
Постройте уравнение множественной регрессии Y на X и P. С помощью МНК оцените коэффициенты в этом уравнении (замените Y, X и P на их логарифмы).
Дайте экономическую интерпретацию коэффициентов в уравнении. Вычислите коэффициенты эластичности функции спроса. Интерпретируйте эти коэффициенты.
Искомое уравнение множественной регрессии выражается производственной функцией или функцией Кобба-Дугласа [НАК, c.140]:
Y = c Xa Pb,
где c - коэффициент, что отображает уровень технологической производительности, показатели a и b - коэффициенты элластичности объема производства Y по фактору производства, то есть по капиталу X и реальной цене P соответственно.
Для оценки параметров производственной регрессии сведем ее к линейной форме. После логарифмирования и замены величин получим приведенную линейную регрессию:
lgY = lg(c Xa Pb),
lgY = lgc + a lgX + b lgP.
Обозначим:
lgY = y, lgc = a0, a = a1, b = a2, lgX = x1, lgP = x2,
где X - количество фактора 1, P - количество фактора 2, Y - показатель.
Получили эконометрическую модель, которая специфицирована в линейной форме:
y = a0 + a1x1 + a2x2 + u,
где a0, a1, a2 - параметры модели u - стохастическая составляющая (остатки).
Запишем исходные данные в такой форме.
№ |
Y |
X |
P |
|
1 |
13,7 |
440,4 |
116,43 |
|
2 |
14,2 |
452 |
117,52 |
|
3 |
14,3 |
461,4 |
115,56 |
|
4 |
14,9 |
482 |
114,65 |
|
5 |
15,3 |
500,5 |
112,97 |
|
6 |
16,0 |
528 |
111,2 |
|
7 |
16,8 |
557,5 |
113,34 |
|
8 |
17,8 |
646,8 |
112,72 |
|
9 |
18,4 |
673,5 |
113,51 |
|
10 |
19,9 |
701,3 |
110,87 |
|
11 |
21,4 |
722,5 |
109,73 |
|
12 |
22,9 |
751,6 |
105,84 |
|
13 |
24,2 |
779,2 |
102,49 |
|
14 |
25,4 |
810,3 |
109 |
|
15 |
26,2 |
865,3 |
103,5 |
|
16 |
24,8 |
858,4 |
127 |
|
17 |
25,6 |
875,8 |
125,96 |
|
18 |
26,8 |
906,8 |
124,75 |
|
19 |
27,7 |
942,9 |
124,69 |
|
20 |
28,3 |
988,8 |
1215,96 |
|
21 |
27,4 |
1015,5 |
149,66 |
|
22 |
25,1 |
1021,6 |
188,77 |
|
23 |
25,1 |
1049,3 |
193,72 |
|
24 |
25,3 |
1058,3 |
173,11 |
|
25 |
26,1 |
1095,4 |
161,47 |
После логарифмирования получим исходные данные для расчетов.
№ |
y |
x1 |
x2 |
№ |
y |
x1 |
x2 |
||
1 |
1,1367 |
2,6438 |
2,0661 |
14 |
1,4048 |
2,9086 |
2,0374 |
||
2 |
1,1523 |
2,6551 |
2,0701 |
15 |
1,4183 |
2,9372 |
2,0149 |
||
3 |
1,1553 |
2,6641 |
2,0628 |
16 |
1,3945 |
2,9337 |
2,1038 |
||
4 |
1,1732 |
2,6830 |
2,0594 |
17 |
1,4082 |
2,9424 |
2,1002 |
||
5 |
1,1847 |
2,6994 |
2,0530 |
18 |
1,4281 |
2,9575 |
2,0960 |
||
6 |
1,2041 |
2,7226 |
2,0461 |
19 |
1,4425 |
2,9745 |
2,0958 |
||
7 |
1,2253 |
2,7462 |
2,0544 |
20 |
1,4518 |
2,9951 |
3,0849 |
||
8 |
1,2504 |
2,8108 |
2,0520 |
21 |
1,4378 |
3,0067 |
2,1751 |
||
9 |
1,2648 |
2,8283 |
2,0550 |
22 |
1,3997 |
3,0093 |
2,2759 |
||
10 |
1,2989 |
2,8459 |
2,0448 |
23 |
1,3997 |
3,0209 |
2,2872 |
||
11 |
1,3304 |
2,8588 |
2,0403 |
24 |
1,4031 |
3,0246 |
2,2383 |
||
12 |
1,3598 |
2,8760 |
2,0246 |
25 |
1,4166 |
3,0396 |
2,2081 |
||
13 |
1,3838 |
2,8916 |
2,0107 |
Построим модель множественной линейной регрессии.
Пусть эконометрическая модель специфицирована в линейной форме [ЛЕЩ, c. 58]:
Y = a0 + a1X1 + a2X2 + u,
где a0, a1, a2 - параметры модели u - стохастическая составляющая (остатки), X1, X2 - факторы Y - показатель. Оценим параметры модели методом МНК:
A = (X 'X)-1X 'Y,
где матрица X характеризует все независимые переменные модели. Поскольку модель имеет свободный член a0, для которого все xi = 1, то матрицу нужно дополнить первым столбцом, в котором все члены являются единицами, X ' - транспонированная матрица к данной, а вектор Y - вектор зависимой переменной.
Транспонируем данную матрицу:
Найдем произведение транспонированной матрицы и данной:
Вычислим обратную матрицу:
Найдем произведение транспонированной матрицы и вектора Y:
Умножив обратную матрицу на предыдущую, получим искомые коэффициенты:
Таким образом, a0 = -0,9638, a1 = 0,8074, a2 = -0,0122.
Следовательно, линейная эконометрическая модель имеет вид:
Y = -0,9638 + 0,8074X1 - 0,0122X2.
Проверку правильности решения можно выполнить, использовав стандартную функцию Excel ЛИНЕЙН() [ЛАВ, c. 249]. Задав первым ее параметром значения диапазона Y, а вторым - диапазона X, получим аналогичный результат.
С экономической точки зрения вычисленные коэффициенты регрессии значат следующее:
- если значение фактора x1 () изменится на 1, то показатель увеличится или уменьшится на 0,8074 ед.;
- если значение фактора x2 () изменится на 1, то показатель увеличится или уменьшится на 0,0122 ед.;
Свободный член регрессии a0 = -0,9638 указывает значение результативного признака при нулевых значениях всех факторов. Он имеет лишь расчетное значение, поскольку такой случай невозможный в реальной экономической ситуации.
Коэффициент c функции Кобба-Дугласа определяем потенцированием:
c = eao = e-0,9638 = 0,1087
a = a1 = 0,8074
b = a2 = -0,0122
Следовательно, функция Кобба-Дугласа следующая:
Y = 0,1087·X0,8074·P-0,0122.
Влияние отдельных факторов в многофакторных моделях может быть охарактеризовано с помощью коэффициентов частной эластичности, которые в случае данной двуфакторной модели они равны вычисленным коэффициентам a = 0,8074 и b = -0,0122.
Коэффициенты частной эластичности показывают, на сколько процентов изменится результативный признак, если значение одной из факторных признаков изменится на 1%, а значение другого факторного признака останется неизменным.
Задача 2
Объем продаж рекламного времени частной радиостанции за 21 неделю представлен в табл. 2. Проанализировать кривую объемов продаж рекламного времени и сделать вывод о возможности повышения прибыльности этого вида деятельности.
При решении этой задачи необходимо выполнить следующие операции:
1) проанализировать ряд количества проданного рекламного времени и построить его график;
2) выбрать общую статистическую модель;
3) оценить трендовую составляющую Ui;
4) оценить адекватность построенных моделей тренда и оценить их точность;
5) осуществить прогноз объемов продаж рекламного времени на следующие 4 недели.
В задаче необходимо применить три аппроксимирующих, полинома (линейный, параболический и гиперболический), провести их сравнение и выбор наилучшего.
Таблица 2
Исходные данные об объеме продаж рекламного времени
Числонедель |
Количество проданноговремени, мин. |
|
1 |
195 |
|
2 |
144 |
|
3 |
195 |
|
4 |
371 |
|
5 |
412 |
|
6 |
128 |
|
7 |
84 |
|
8 |
287 |
|
9 |
275 |
|
10 |
181 |
|
11 |
295 |
|
12 |
178 |
|
13 |
237 |
|
14 |
240 |
|
15 |
410 |
|
16 |
236 |
|
17 |
231 |
|
18 |
225 |
|
19 |
231 |
|
20 |
200 |
|
21 |
187 |
Решение
Проанализируем ряд количества проданного рекламного времени и построим для наглядности диаграмму рассеивания или график ряда.
Проанализировав размещение точек, приходим к выводу о хаотичности их размещения в первой половине рассмативаемых недель. Во второй половине точки находятся уже ближе к некоторой прямой линии, свидетельствующей об уменьшении количества проданного рекламного времени.
Для возможности построения адекватных економико-математических моделей и определения тенденции продаж увеличим интервал от одной недели до трех и вычислим скользящие средние, то есть выполним сглаживание ряда с помощью трехчленной скользящей:
Число недель |
Количество проданного, времени, мин. |
|||
Одна неделя |
Сумма 3 недель |
Среднее 3 недель |
||
1 |
195 |
- |
- |
|
2 |
144 |
534 |
178,00 |
|
3 |
195 |
710 |
236,67 |
|
4 |
371 |
978 |
326,00 |
|
5 |
412 |
911 |
303,67 |
|
6 |
128 |
624 |
208,00 |
|
7 |
84 |
499 |
166,33 |
|
8 |
287 |
646 |
215,33 |
|
9 |
275 |
743 |
247,67 |
|
10 |
181 |
751 |
250,33 |
|
11 |
295 |
654 |
218,00 |
|
12 |
178 |
710 |
236,67 |
|
13 |
237 |
655 |
218,33 |
|
14 |
240 |
887 |
295,67 |
|
15 |
410 |
886 |
295,33 |
|
16 |
236 |
877 |
292,33 |
|
17 |
231 |
692 |
230,67 |
|
18 |
225 |
687 |
229,00 |
|
19 |
231 |
656 |
218,67 |
|
20 |
200 |
618 |
206,00 |
|
21 |
187 |
- |
- |
Построим диаграмму сглаженного ряда.
Как и предполагалось, разброс точек значительно уменьшился.
Таким образом, получен рабочий набор данных для проведения анализа продаж рекламного времени.
Построим линейный, параболический и гиперболический тренд и в дальнейшем определим лучший из них.
1. Линейная модель
Пусть модель специфицирована в линейной форме:
y = at + b + u,
где a, b - параметры модели, u - стохастическая составляющая (остатки).
Используем метод наименьших квадратов.
Запишем систему нормальных уравнений, используя в качестве неизвестную переменную - переменную t:
Расчет параметров значительно упрощается, если за начало счета времени (t = 0) принять центральный интервал (момент).
При нечетном числе уровней (например, 19), значения t = 0 - условного обозначения времени будет отвечать средней 11 неделе:
t |
-9 |
-8 |
-7 |
-6 |
-5 |
-4 |
-3 |
-2 |
-1 |
0 |
|
Y |
178,00 |
236,67 |
326,00 |
303,67 |
208,00 |
166,33 |
215,33 |
247,67 |
250,33 |
218,00 |
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
Y |
236,67 |
218,33 |
295,67 |
295,33 |
292,33 |
230,67 |
229,00 |
218,67 |
206,00 |
Поскольку ?t = 0, поэтому система нормальных уравнений принимает вид:
регрессионный анализ данное прогнозирование
Построим вспомогательную таблицу:
№ |
t |
y |
t2 |
ty |
|
1 |
-9 |
178,00 |
81 |
-1602,00 |
|
2 |
-8 |
236,67 |
64 |
-1893,36 |
|
3 |
-7 |
326,00 |
49 |
-2282,00 |
|
4 |
-6 |
303,67 |
36 |
-1822,02 |
|
5 |
-5 |
208,00 |
25 |
-1040,00 |
|
6 |
-4 |
166,33 |
16 |
-665,32 |
|
7 |
-3 |
215,33 |
9 |
-645,99 |
|
8 |
-2 |
247,67 |
4 |
-495,34 |
|
9 |
-1 |
250,33 |
1 |
-250,33 |
|
10 |
0 |
218,00 |
0 |
0,00 |
|
11 |
1 |
236,67 |
1 |
236,67 |
|
12 |
2 |
218,33 |
4 |
436,66 |
|
13 |
3 |
295,67 |
9 |
887,01 |
|
14 |
4 |
295,33 |
16 |
1181,32 |
|
15 |
5 |
292,33 |
25 |
1461,65 |
|
16 |
6 |
230,67 |
36 |
1384,02 |
|
17 |
7 |
229,00 |
49 |
1603,00 |
|
18 |
8 |
218,67 |
64 |
1749,36 |
|
19 |
9 |
206,00 |
81 |
1854,00 |
|
? |
- |
4572,67 |
570 |
97,33 |
Получим систему уравнений:
Находим решение:
a = 97,33 / 570 = 0,1708,
b = 4572,67 / 19 = 240,6668.
Следовательно, уравнение линейного тренда имеет вид:
y = 240,6668 + 0,1708t.
Это значит, что при увеличении или уменьшении значения фактора на 1 у.е., показатель увеличивается или уменьшается на 0,1708 у.е., то есть между параметрами существует прямая пропорциональная или положительная зависимость.
Свободный член регрессии b = 240,6668 указывает значение показателя при нулевом значении условного времени.
Вычислим теоретические значения уровней ряда динамики по аналитической формуле и трендовую составляющую Ui.
№ |
t |
T |
y |
p |
Ui |
|
1 |
-9 |
2 |
178,00 |
239,1301 |
-61,1301 |
|
2 |
-8 |
3 |
236,67 |
239,3008 |
-2,6308 |
|
3 |
-7 |
4 |
326,00 |
239,4716 |
86,5284 |
|
4 |
-6 |
5 |
303,67 |
239,6423 |
64,0277 |
|
5 |
-5 |
6 |
208,00 |
239,8131 |
-31,8131 |
|
6 |
-4 |
7 |
166,33 |
239,9838 |
-73,6538 |
|
7 |
-3 |
8 |
215,33 |
240,1546 |
-24,8246 |
|
8 |
-2 |
9 |
247,67 |
240,3253 |
7,3447 |
|
9 |
-1 |
10 |
250,33 |
240,4961 |
9,8339 |
|
10 |
0 |
11 |
218,00 |
240,6668 |
-22,6668 |
|
11 |
1 |
12 |
236,67 |
240,8376 |
-4,1676 |
|
12 |
2 |
13 |
218,33 |
241,0084 |
-22,6784 |
|
13 |
3 |
14 |
295,67 |
241,1791 |
54,4909 |
|
14 |
4 |
15 |
295,33 |
241,3499 |
53,9801 |
|
15 |
5 |
16 |
292,33 |
241,5206 |
50,8094 |
|
16 |
6 |
17 |
230,67 |
241,6914 |
-11,0214 |
|
17 |
7 |
18 |
229,00 |
241,8621 |
-12,8621 |
|
18 |
8 |
19 |
218,67 |
242,0329 |
-23,3629 |
|
19 |
9 |
20 |
206,00 |
242,2036 |
-36,2036 |
Выполним построение корреляционного поля с изображением на нем тренда.
Вычислим для зависимой переменной y общую дисперсию, дисперсию, что объясняет регрессию, дисперсию ошибок [ЛУК, с. 56]:
Определим коэффициенты детерминации R2 и корреляции r [ЛУК, c. 57]:
Этот результат значит, что 0,05% вариации результативного признака зависит от вариации уровня факторного признака, а 99,95% приходится на другие факторы.
Поскольку |r| < 0,4, то между факторным и результативным признаком корреляционной связи нет.
Оценим точность модели или среднюю ошибку аппроксимации как среднюю арифметическую простую по формуле [ЕЛИ, с. 87]:
Получим:
Поскольку A > 7%, то делаем вывод о плохом подборе модели для исходных данных.
Проверим адекватность модели по критерию Фишера или F-критерию, который вычисляется по формуле:
Поскольку табличное значение F(0,05; 1; 17) = 4,45 и |F| < Fтаб, то делаем вывод об неадекватности эконометрической модели.
Методом математической экстраполяции составим прогноз показателя на следующие 4 недели.
Y(22) = 240,6668 + 0,1708 · 11 = 242,5451,
Y(23) = 240,6668 + 0,1708 · 12 = 242,7159,
Y(24) = 240,6668 + 0,1708 · 13 = 242,8866,
Y(25) = 240,6668 + 0,1708 · 14 = 243,0574.
2. Гиперболическая модель
Пусть эконометрическая модель специфицирована в нелинейной, гиперболической форме:
y = a0 + a1 / x + u.
где a, b - параметры модели u - стохастическая составляющая (остатки).
Для оценки параметров нелинейной регрессии сведем ее к линейной форме, то есть линеаризуем ее [ЕЛИ, с. 62]. Преобразуем начальное уравнение, записав его следующим образом:
y = a0 + a1 / x.
Произведя замену X = 1 / x, b = a0, a = a1, получим линейную эконометрическую модель:
y = b + aX.
Запишем исходные данные в форме, учитывая на замену.
№ |
x |
y |
1/x |
|
1 |
2 |
178,00 |
0,5000 |
|
2 |
3 |
236,67 |
0,3333 |
|
3 |
4 |
326,00 |
0,2500 |
|
4 |
5 |
303,67 |
0,2000 |
|
5 |
6 |
208,00 |
0,1667 |
|
6 |
7 |
166,33 |
0,1429 |
|
7 |
8 |
215,33 |
0,1250 |
|
8 |
9 |
247,67 |
0,1111 |
|
9 |
10 |
250,33 |
0,1000 |
|
10 |
11 |
218,00 |
0,0909 |
|
11 |
12 |
236,67 |
0,0833 |
|
12 |
13 |
218,33 |
0,0769 |
|
13 |
14 |
295,67 |
0,0714 |
|
14 |
15 |
295,33 |
0,0667 |
|
15 |
16 |
292,33 |
0,0625 |
|
16 |
17 |
230,67 |
0,0588 |
|
17 |
18 |
229,00 |
0,0556 |
|
18 |
19 |
218,67 |
0,0526 |
|
19 |
20 |
206,00 |
0,0500 |
Используем метод наименьших квадратов [ЛЕЩ, с.29].
Запишем систему нормальных уравнений, используя в качестве неизвестной переменной - переменную x:
где n - количество наблюдений.
Построим вспомогательную таблицу.
№ |
x |
y |
x2 |
xy |
|
1 |
0,5000 |
178,00 |
0,25000000 |
89,000000 |
|
2 |
0,3333 |
236,67 |
0,11111111 |
78,890000 |
|
3 |
0,2500 |
326,00 |
0,06250000 |
81,500000 |
|
4 |
0,2000 |
303,67 |
0,04000000 |
60,734000 |
|
5 |
0,1667 |
208,00 |
0,02777778 |
34,666667 |
|
6 |
0,1429 |
166,33 |
0,02040816 |
23,761429 |
|
7 |
0,1250 |
215,33 |
0,01562500 |
26,916250 |
|
8 |
0,1111 |
247,67 |
0,01234568 |
27,518889 |
|
9 |
0,1000 |
250,33 |
0,01000000 |
25,033000 |
|
10 |
0,0909 |
218,00 |
0,00826446 |
19,818182 |
|
11 |
0,0833 |
236,67 |
0,00694444 |
19,722500 |
|
12 |
0,0769 |
218,33 |
0,00591716 |
16,794615 |
|
13 |
0,0714 |
295,67 |
0,00510204 |
21,119286 |
|
14 |
0,0667 |
295,33 |
0,00444444 |
19,688667 |
|
15 |
0,0625 |
292,33 |
0,00390625 |
18,270625 |
|
16 |
0,0588 |
230,67 |
0,00346021 |
13,568824 |
|
17 |
0,0556 |
229,00 |
0,00308642 |
12,722222 |
|
18 |
0,0526 |
218,67 |
0,00277008 |
11,508947 |
|
19 |
0,0500 |
206,00 |
0,00250000 |
10,300000 |
|
? |
2,5977 |
4572,67 |
0,59616324 |
611,534102 |
Получим систему уравнений:
Решение системы найдем по формулам Крамера [ГЕТ, с.30]:
где ? - главный определитель системы.
Следовательно, уравнение линейной модели имеет вид:
y = 248,4142 - 56,6645x.
Откуда получим следующее уравнение нелинейной модели:
y = 248,4142 - 56,6645 / x.
Выполним построение корреляционного поля с изображением на нем линии регрессии.
Для проведения исследования модели построим вспомогательную таблицу.
№ |
x |
y |
yx |
u2 = (y - yx)2 |
|||||
1 |
2 |
178,00 |
220,0819 |
3927,1331 |
81,0000 |
564,0016 |
423,7382 |
1770,8897 |
|
2 |
3 |
236,67 |
229,5260 |
15,9747 |
64,0000 |
31,9747 |
124,1178 |
51,0364 |
|
3 |
4 |
326,00 |
234,2481 |
7281,7478 |
49,0000 |
-597,3321 |
41,2007 |
8418,4175 |
|
4 |
5 |
303,67 |
237,0813 |
3969,3979 |
36,0000 |
-378,0189 |
12,8562 |
4434,0562 |
|
5 |
6 |
208,00 |
238,9701 |
1067,1226 |
25,0000 |
163,3342 |
2,8789 |
959,1475 |
|
6 |
7 |
166,33 |
240,3193 |
5525,9661 |
16,0000 |
297,3474 |
0,1208 |
5474,4109 |
|
7 |
8 |
215,33 |
241,3311 |
641,9556 |
9,0000 |
76,0105 |
0,4413 |
676,0587 |
|
8 |
9 |
247,67 |
242,1181 |
49,0442 |
4,0000 |
-14,0063 |
2,1063 |
30,8232 |
|
9 |
10 |
250,33 |
242,7477 |
93,3766 |
1,0000 |
-9,6632 |
4,3301 |
57,4907 |
|
10 |
11 |
218,00 |
243,2629 |
513,7857 |
0,0000 |
0,0000 |
6,7394 |
638,2127 |
|
11 |
12 |
236,67 |
243,6921 |
15,9747 |
1,0000 |
-3,9968 |
9,1525 |
49,3106 |
|
12 |
13 |
218,33 |
244,0554 |
498,9345 |
4,0000 |
-44,6737 |
11,4822 |
661,7953 |
|
13 |
14 |
295,67 |
244,3667 |
3025,3474 |
9,0000 |
165,0095 |
13,6891 |
2632,0259 |
|
14 |
15 |
295,33 |
244,6366 |
2988,0608 |
16,0000 |
218,6526 |
15,7586 |
2569,8252 |
|
15 |
16 |
292,33 |
244,8727 |
2669,0819 |
25,0000 |
258,3158 |
17,6889 |
2252,1992 |
|
16 |
17 |
230,67 |
245,0810 |
99,9369 |
36,0000 |
-59,9811 |
19,4847 |
207,6765 |
|
17 |
18 |
229,00 |
245,2662 |
136,1152 |
49,0000 |
-81,6679 |
21,1537 |
264,5880 |
|
18 |
19 |
218,67 |
245,4318 |
483,8611 |
64,0000 |
-175,9747 |
22,7053 |
716,1965 |
|
19 |
20 |
206,00 |
245,5810 |
1201,7899 |
81,0000 |
-312,0016 |
24,1486 |
1566,6528 |
|
? |
209 |
4572,67 |
- |
34204,6068 |
570,0000 |
97,3300 |
773,7933 |
33430,8135 |
|
?/n |
11 |
240,6668 |
- |
1800,2425 |
30,0000 |
5,1226 |
40,7260 |
1759,5165 |
Вычислим для зависимой переменной y общую дисперсию, дисперсию, что объясняет регрессию, дисперсию ошибок [ЛУК, с. 56]:
Определим коэффициенты детерминации R2 и корреляции r [ЛУК, c. 57]:
Этот результат значит, что 2,26% вариации результативного признака зависит от вариации уровня факторного признака, а 97,74% приходится на другие факторы.
Поскольку |r| < 0,4, то между факторным и результативным признаком корреляционной связи нет.
Найдем среднюю ошибку аппроксимации как среднюю арифметическую простую по формуле [ЕЛИ, с. 87]:
Получим:
Поскольку A > 7%, то делаем вывод о плохом подборе модели для исходных данных.
Проверим адекватность модели по критерию Фишера или F-критерию,
который вычисляется по формуле:
Поскольку табличное значение F(0,05; 1; 17) = 4,45 и |F| < Fтаб, то делаем вывод об неадекватности эконометрической модели.
Методом математической экстраполяции составим прогноз показателя на следующие 4 недели.
Y(22) = 248,4142 - 56,6645 / 22 = 245,8385,
Y(23) = 248,4142 - 56,6645 / 23 = 245,9505,
Y(24) = 248,4142 - 56,6645 / 24 = 246,0532,
Y(25) = 248,4142 - 56,6645 / 25 = 246,1476.
3. Параболическая модель
Пусть эконометрическая модель специфицирована в параболической форме [ЛЕЩ, c. 58]:
Y = a0 + a1X + a2X2 + u,
где a0, a1, a2 - параметры модели u - стохастическая составляющая (остатки), X - фактор, Y - показатель.
Оценим параметры модели методом МНК:
A = (X 'X)-1X 'Y,
где матрица X характеризует все независимые переменные модели. Поскольку модель имеет свободный член a0, для которого все xi = 1, то матрицу нужно дополнить первым столбцом, в котором все члены являются единицами, X ' - транспонированная матрица к данной, а вектор Y - вектор зависимой переменной.
Транспонируем данную матрицу:
Найдем произведение транспонированной матрицы и данной:
Вычислим обратную матрицу:
Найдем произведение транспонированной матрицы и вектора Y:
Умножив обратную матрицу на предыдущую, получим искомые коэффициенты:
Таким образом a0 = 214,2489, a1 = 6,1034, a2 = -0,2697.
Следовательно, параболическая модель имеет вид:
Y = 214,2489 + 6,1034X - 0,2697X2.
Проверку правильности решения можно выполнить, использовав стандартную функцию Excel ЛИНЕЙН() [ЛАВ, c. 249]. Задав первым ее параметром значения диапазона Y, а вторым - диапазона X, получим аналогичный результат.
Выполним построение корреляционного поля с изображением на нем линии регрессии.
Найдем совокупный коэффициент детерминации и коэффициент множественной корреляции и охарактеризуем степень совместимого влияния факторов на показатель.
Для этого построим расчетную таблицу.
№ |
Y |
X1 |
X2 |
(X1 - X1c)2 |
(X2 - X2c)2 |
Yp |
(Y - Yc)2 |
(Y - Yp)2 |
|
1 |
178 |
2 |
4 |
81 |
21609 |
225,3771 |
3927,1331 |
2244,5880 |
|
2 |
236,67 |
3 |
9 |
64 |
20164 |
230,1322 |
15,9747 |
42,7433 |
|
3 |
326 |
4 |
16 |
49 |
18225 |
234,3479 |
7281,7478 |
8400,1063 |
|
4 |
303,67 |
5 |
25 |
36 |
15876 |
238,0243 |
3969,3979 |
4309,3554 |
|
5 |
208 |
6 |
36 |
25 |
13225 |
241,1614 |
1067,1226 |
1099,6785 |
|
6 |
166,33 |
7 |
49 |
16 |
10404 |
243,7591 |
5525,9661 |
5995,2732 |
|
7 |
215,33 |
8 |
64 |
9 |
7569 |
245,8176 |
641,9556 |
929,4917 |
|
8 |
247,67 |
9 |
81 |
4 |
4900 |
247,3367 |
49,0442 |
0,1111 |
|
9 |
250,33 |
10 |
100 |
1 |
2601 |
248,3164 |
93,3766 |
4,0546 |
|
10 |
218 |
11 |
121 |
0 |
900 |
248,7568 |
513,7857 |
945,9822 |
|
11 |
236,67 |
12 |
144 |
1 |
49 |
248,6579 |
15,9747 |
143,7101 |
|
12 |
218,33 |
13 |
169 |
4 |
324 |
248,0197 |
498,9345 |
881,4764 |
|
13 |
295,67 |
14 |
196 |
9 |
2025 |
246,8421 |
3025,3474 |
2384,1645 |
|
14 |
295,33 |
15 |
225 |
16 |
5476 |
245,1252 |
2988,0608 |
2520,5235 |
|
15 |
292,33 |
16 |
256 |
25 |
11025 |
242,8689 |
2669,0819 |
2446,3960 |
|
16 |
230,67 |
17 |
289 |
36 |
19044 |
240,0734 |
99,9369 |
88,4234 |
|
17 |
229 |
18 |
324 |
49 |
29929 |
236,7385 |
136,1152 |
59,8839 |
|
18 |
218,67 |
19 |
361 |
64 |
44100 |
232,8642 |
483,8611 |
201,4762 |
|
19 |
206 |
20 |
400 |
81 |
62001 |
228,4507 |
1201,7899 |
504,0322 |
|
? |
4572,67 |
209,00 |
2869,00 |
570,0000 |
289446,0000 |
- |
34204,6068 |
33201,4706 |
Средние значения переменных соответственно равны:
Вычислим дисперсии независимых переменных, зависимой переменной и остатков:
Коэффициент детерминации R2 показывает, какая часть движения зависимой переменной описывается данным регрессионным уравнением и вычисляется по формуле [ЛЕЩ, c. 48]:
и коэффициент корреляции:
Поскольку |r| < 0,4, то между факторным и результативным признаком корреляционной связи нет.
Коэффициент детерминации равен: R2 = 0,0293. А это значит, что 2,93% вариации результативного признака зависит от вариации уровня факторных признаков, а 97,07% приходится на другие факторы.
Найдем среднюю ошибку аппроксимации как среднюю арифметическую простую по формуле [ЕЛИ, с. 87]:
Получим:
Поскольку ? > 7%, то делаем вывод о плохом подборе модели для исходных данных.
Проверим адекватность модели по критерию Фишера или F-критерию, который вычисляется по формуле [ЛЕЩ, c. 53]:
Поскольку F(0,05; 2; 16) = 3,6337 и |F*| > Fтаб, то делаем вывод о неадекватности эконометрической модели.
Методом математической экстраполяции составим прогноз показателя на следующие 4 недели.
Y(22) = 214,2489 + 6,1034 • 22 - 0,2697 • 222 = 217,9889,
Y(23) = 214,2489 + 6,1034 • 23 - 0,2697 • 232 = 211,9558,
Y(24) = 214,2489 + 6,1034 • 24 - 0,2697 • 242 = 205,3833,
Y(25) = 214,2489 + 6,1034 • 25 - 0,2697 • 252 = 198,2714.
Таким образом, делаем вывод о несостоятельности исходных данних для построения адекватной модели. Об этом свидетельствует непредсказуемость объемов продаж рекламного времени.
Для возможности повышения прибыльности этого вида деятельности нужно кардинально менять подход в работе персонала, вид рекламируемых продуктов и качество их подачи.
Нужно делать ставку на долгосрочные контракты с новыми заказчиками рекламы и находить компромисс с прежними клиентами. Для этого нужно усовершенствовать тарифные планы рекламных пакетов.
Список используемых источников
1. Гетманцев В. Д. Лінійна алгебра і лінійне програмування: Навчальний посібник. - К.: Либідь. 2001. - 256 с. [ГЕТ]
2. Елисеева И. И. Практикум по эконометрике. М.: ФиС. - 2002, 192 ст. [ЕЛП]
3. Елисеева И. И. Эконометрика. М.: ФиС. - 2004, 344 ст. [ЕЛИ]
4. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов. - М.: ЮНИТИ-ДАНА, 2005. - 311 с. [КРЕ]
5. Лавренов С.М. Excel: Сборник примеров и задач. - М.: ФиС, 2003. - 336 с. [ЛАВ]
6. Лещинський О. Л. Економетрія. - К.:МАУП 2003. - 208 с. [ЛЕЩ]
7. Лук'яненко І. Г., Краснікова Л. П. - Економетрика. - К.:Знання 1998. - 494 с. [ЛУК]
8. Наконечний C. І., Терещенко Т. О. Економетрія. - К.:КНЕУ, 2006. - 528 с. [НАК]
9. Толбатов Ю. А. Економетрика: Підручник для студентів. - Тернопіль: Підручники і посібники, 2008. - 288 с. [ТОЛ]
Размещено на Allbest.ru
Подобные документы
Структурные компоненты детерминированной составляющей. Основная цель статистического анализа временных рядов. Экстраполяционное прогнозирование экономических процессов. Выявление аномальных наблюдений, а также построение моделей временных рядов.
курсовая работа [126,0 K], добавлен 11.03.2014Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.
контрольная работа [37,6 K], добавлен 03.06.2009Теоретические основы прикладного регрессионного анализа. Проверка предпосылок и предположений регрессионного анализа. Обнаружение выбросов в выборке. Рекомендации по устранению мультиколлинеарности. Пример практического применения регрессионного анализа.
курсовая работа [1,2 M], добавлен 04.02.2011Связь между случайными переменными и оценка её тесноты как основная задача корреляционного анализа. Регрессионный анализ, расчет параметров уравнения линейной парной регрессии. Оценка статистической надежности результатов регрессионного моделирования.
контрольная работа [50,4 K], добавлен 07.06.2011Понятие и особенности прогнозирования. Стандартная ошибка предсказываемого среднего значения. Прогнозирование при наличии авторегрессии ошибок. Точечное и интервальное прогнозирование, основанное на модели линейной регрессии, коэффициент ее детерминации.
контрольная работа [827,9 K], добавлен 08.01.2016Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.
контрольная работа [1,6 M], добавлен 18.06.2012Определение задачи регрессионного анализа как установления формы корреляционной связи (линейной, квадратичной, показательной). Графическая интерпретация коэффициента детерминации. Виды регрессий: линейная, нелинейная, гипербола, экспонента и парабола.
доклад [131,5 K], добавлен 13.12.2011Рассмотрение процедуры регрессионного анализа на основе данных (цена продажи и жилая площадь) о 23 объектах недвижимости. Расчет параметров уравнения линейной регрессии и проверка его адекватности исследуемому процессу (используя приложение MS Exсel).
лабораторная работа [1,2 M], добавлен 13.03.2014Изучение качества продукции и услуг с помощью системы общих и частных статистических показателей: сводка и группировка, средние величины и показатели вариации, корреляционно-регрессионный анализ. Прогнозирование качества продукции, его цели и задачи.
курсовая работа [438,0 K], добавлен 23.09.2016Теоретические выкладки в области теории хаоса. Методы, которые используются в математике, для прогнозирования стохастических рядов. Анализ финансовых рядов и рядов Twitter, связь между сентиметными графиками и поведением временного финансового ряда.
курсовая работа [388,9 K], добавлен 01.07.2017