Основы эконометрики
Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 25.09.2014 |
Размер файла | 136,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задание
Экономист, изучая зависимость уровня издержек обращения (тыс. руб.) от объема товарооборота (тыс. руб.), обследовал 10 магазинов, торгующих одинаковым ассортиментом товаров, и получил следующие данные (таблица 1).
Таблица 1
№ п/п |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
х* |
|
Х |
140 |
110 |
120 |
90 |
130 |
80 |
100 |
75 |
135 |
60 |
125 |
|
У |
5,4 |
4,1 |
5,6 |
3,3 |
4,2 |
2,9 |
3,6 |
2,5 |
4,9 |
3,0 |
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной и гиперболической регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените с помощью средней ошибки аппроксимации качество уравнений регрессии.
6. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в п.п. 3-5 и данном пункте, выберите лучшее уравнение регрессии и дайте обоснование этого шага.
7. Для выбранной лучшей модели постройте таблицу дисперсионного анализа и найдите доверительные интервалы для параметров регрессии и коэффициента корреляции.
8. Сделать прогноз значения при (см. задание) и найти доверительные интервалы прогноза для двух уравнений регрессии
.
9. Оценить полученные результаты и сделать вывод.
Решение
уравнение корреляция регрессия аппроксимация
1. Построим диаграмму рассеивания по исходным данным для своего варианта
Y
4 2 50 100 150 X
Из диаграммы следует, что между показателями и действительно наблюдается зависимость. Но сделать вывод какая именно, трудно, поэтому рассмотрим все три регрессии, а затем выберем лучшую.
А) Рассмотрим линейную регрессию.
Составим исходную расчетную таблицу. Для удобства можно добавить в нее еще два столбца: , чтобы сразу получить общую сумму квадратов.
№ п/п |
Объем товарооборота (тыс. руб.) |
Издержки (тыс. руб.) |
|
|
|
|
||||
1 |
140 |
5,4 |
19600 |
29,16 |
756 |
5,25 |
0,15 |
0,02 |
2,78 |
|
2 |
110 |
4,1 |
12100 |
16,81 |
451 |
4,2 |
-0,1 |
0,01 |
2,43 |
|
3 |
120 |
5,6 |
14400 |
31,36 |
672 |
4,55 |
1,05 |
1,1 |
18,75 |
|
4 |
90 |
3,3 |
8100 |
10,89 |
297 |
3,5 |
-0,2 |
0,04 |
6,06 |
|
5 |
130 |
4,2 |
16900 |
17,64 |
546 |
4,9 |
-0,7 |
0,49 |
16,67 |
|
6 |
80 |
2,9 |
6400 |
8,41 |
232 |
3,15 |
-0,25 |
0,06 |
8,62 |
|
7 |
100 |
3,6 |
10000 |
12,96 |
360 |
3,85 |
-0,25 |
0,06 |
6,94 |
|
8 |
75 |
2,5 |
5625 |
6,25 |
187,5 |
2,98 |
-0,38 |
0,14 |
15,2 |
|
9 |
135 |
4,9 |
18225 |
24,01 |
661,5 |
5,07 |
-0,17 |
0,03 |
3,47 |
|
10 |
60 |
3,0 |
3600 |
9 |
180 |
2,45 |
0,55 |
0,30 |
18,33 |
|
Итого |
1040 |
39,5 |
114950 |
166,49 |
4343 |
39,5 |
0 |
2,25 |
99,25 |
|
Средн.зн. |
104 |
3,95 |
11495 |
16,65 |
434,3 |
3,95 |
- |
- |
9,925 |
Функция издержек выразится зависимостью: .
Для определения коэффициентов «a» и «b» воспользуемся методом наименьших квадратов (МНК):
(1)
Домножим уравнение (1) системы на (-104), получим систему, которую решим методом алгебраического сложения.
6790b = 235или b = 0,03461.
Коэффициент корреляции b можно находить по формуле (2), не решая систему (1) непосредственно:
(2) ,
Результат аналогичен.
Теперь найдем коэффициент «a» из уравнения (1) системы (1):
10a = 39,5-1040b; a = 0,35.
Или можно «a» вычислить по формуле (3) ,
.
Уравнение регрессии будет иметь вид: =0,35 + 0,035 x
Затем, подставляя различные значения из столбца 2, получим теоретические значения для столбца 7:
,
аналогично для … и .
В столбце 8 находим разность текущего значения и (теоретического), найденного по формуле (4).
Для расчета используем следующие формулы:
, , ,
, , .
Коэффициент аппроксимации определим по формуле:
.
Средняя ошибка аппроксимации:
.
Допустимый предел значений - не более 10%, это говорит о том, что уравнение регрессии точно аппроксимирует исходную зависимость.
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции . Найдем его по формуле для
.
Коэффициент . Характер связи устанавливается по таблице Чеддока:
Диапазон измерения |
0,1-0,3 |
0,3-0,5 |
0,5-0,7 |
0,7-0,9 |
0,9-0,99 |
|
Характер тесноты связи |
слабая |
умеренная |
заметная |
высокая |
весьма высокая |
В примере получилась связь прямая, высокая.
Для вычисления коэффициента , используются и другие формулы:
.
3. Дисперсионный анализ. Общая сумма квадратов отклонений (т.е. общая дисперсия) равна:
,
где - общая сумма квадратов отклонений,
- сумма отклонений, обусловленная регрессией (факторная),
- остаточная сумма квадратов отклонений.
.
Остаточная сумма определена в таблице в 9 столбце и равна 2,25. Тогда объясненная (факторная) сумма квадратов будет равна
Долю дисперсии, объясняемую регрессией, в общей доле дисперсии характеризует индекс детерминации . Он определяется отношением объясненной дисперсии к общей
.
Качество всего уравнения регрессии в целом, проверяется F-тестом.
Составим таблицу дисперсионного анализа:
Источники вариации |
Число степеней свободы |
квадр. отклонений. |
Дисперсия на 1 степ. свободы. |
F отн |
||
Факт |
табл. (0,05) |
|||||
общая |
9 |
10,465 |
8,215 |
29,21 |
5,32 |
|
объясненная |
1 |
8,215 |
||||
остаточная |
8 |
2,25 |
0,281 |
Fтабл определяем по [1] в зависимости от уровня значимости (б = 0,05) и числа степеней свободы (df=8). Fтабл=5,32.
F-тест состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи rху.
Если Fфакт >Fтабл (29,21>5,32), то гипотеза Но о случайной природе оцениваемых характеристик отклоняется и признается их значимость и надежность.
Б) Степенная регрессия
Для того, чтобы построить степенную модель, необходимо линеаризовать переменные путем логарифмирования обеих частей уравнения :
Пусть , тогда
Рассчитываем и b по формулам:
Все необходимые расчеты представлены в таблице 2.
№ п/п |
x |
y |
X |
Y |
XY |
X2 |
Y2 |
||||
1 |
140 |
5,4 |
4,9416 |
1,686 |
8,3335 |
24,414 |
2,843 |
5,1 |
0,3 |
0,09 |
|
2 |
110 |
4,1 |
4,7005 |
1,411 |
6,6324 |
22,097 |
1,990 |
4,1 |
0 |
0 |
|
3 |
120 |
5,6 |
4,7875 |
1,722 |
8,2479 |
22,922 |
2,968 |
4,4 |
1,2 |
1,44 |
|
4 |
90 |
3,3 |
4,4998 |
1,193 |
5,3723 |
20,242 |
1,424 |
3,5 |
-0,2 |
0,04 |
|
5 |
130 |
4,2 |
4,8675 |
1,435 |
6,9853 |
23,696 |
2,055 |
4,8 |
-0,6 |
0,36 |
|
6 |
80 |
2,9 |
4,3820 |
1,064 |
4,6655 |
19,201 |
1,133 |
3,2 |
-0,3 |
0,09 |
|
7 |
100 |
3,6 |
4,6052 |
1,2809 |
5,8988 |
21,2079 |
1,6407 |
3,8 |
- 0,2 |
0,04 |
|
8 |
75 |
2,5 |
4,3175 |
0,9163 |
3,9561 |
18,6408 |
0,8396 |
3,0 |
-0,5 |
0,25 |
|
9 |
135 |
4,9 |
4,9053 |
1,5892 |
7,7955 |
24,0620 |
2,5256 |
4,9 |
0 |
0 |
|
10 |
60 |
3,0 |
4,0943 |
1,0986 |
4,4980 |
16,7633 |
1,2069 |
2,5 |
0,5 |
0,25 |
|
Итого |
1040 |
39,5 |
46,1012 |
13,398 |
62,3853 |
213,251 |
18,634 |
39,3 |
0,2 |
2,56 |
|
Средн.зн. |
104 |
3,95 |
4,61012 |
1,3398 |
6,23853 |
21,3251 |
1,8634 |
Параметры будут равны:
Подставим их в уравнение и получим линейное уравнение:
Потенцируя которое, получим:
По этому уравнению заполняется вторая половина таблицы.
В) Уравнение гиперболы
Линеаризуется при замене , тогда
Все необходимые расчеты представим в таблице 6.
№ п/п |
x |
y |
|
|
|||||
1 |
140 |
5,4 |
0,007143 |
0,038572 |
0,000051 |
4,9 |
0,5 |
0,25 |
|
2 |
110 |
4,1 |
0,009090 |
0,037269 |
0,000082 |
4,3 |
-0,2 |
0,04 |
|
3 |
120 |
5,6 |
0,008333 |
0,046667 |
0,000069 |
4,6 |
1 |
1 |
|
4 |
90 |
3,3 |
0,011111 |
0,036667 |
0,000123 |
3,7 |
-0,4 |
0,16 |
|
5 |
130 |
4,2 |
0,007692 |
0,032306 |
0,000059 |
4,8 |
-0,6 |
0,36 |
|
6 |
80 |
2,9 |
0,0125 |
0,03625 |
0,000156 |
3,3 |
-0,4 |
0,16 |
|
7 |
100 |
3,6 |
0,01 |
0,036 |
0,0001 |
4,0 |
-0,4 |
0,16 |
|
8 |
75 |
2,5 |
0,013333 |
0,033332 |
0,000177 |
3,0 |
-0,5 |
0,25 |
|
9 |
135 |
4,9 |
0,007407 |
0,036294 |
0,000054 |
4,8 |
0,1 |
0,01 |
|
10 |
60 |
3,0 |
0,016667 |
0,05 |
0,000277 |
2,0 |
1 |
1 |
|
Сумма |
1040 |
39,5 |
0,103276 |
0,383357 |
0,001148 |
39,4 |
3,39 |
||
Ср. знач. |
104 |
3,95 |
0,0103276 |
0,0383357 |
0,000115 |
Найдем параметры и , используя МНК.
Для этого решим систему (1), учитывая, что .
Таким образом, получили систему уравнений:
::
Можно воспользоваться формулами.
Итак, получим уравнение:
.
Оценим тесноту связи результативным фактором и факторным признаком с помощью индекса корреляции (для нелинейных моделей) и коэффициента детерминации , которые рассчитываются по следующим формулам:
,
Для степенной регрессии:
Для уравнения гиперболы получим:
Найдем средний коэффициент эластичности по формулам, представленным в таблице 7.
Таблица 7
Вид регрессии |
Формула для расчета |
|
Линейная |
||
Степенная |
||
Гиперболическая |
Найдем среднюю ошибку аппроксимации по формуле:
, где .
Оценим статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера:
.
Для степенной регрессии имеем:
.
Для уравнения гиперболы получим:
.
Для линейном модели уже строили таблицу дисперсионного анализа.
Для сравнения полученных уравнений регрессии построим следующую таблицу:
Вид регрессии |
, |
R2, r2 |
F |
||||
Линейная |
0,886 |
0,785 |
9,925 |
0,9123 |
29,21 |
2,25 |
|
Степенная |
0,869 |
0,755 |
9,989 |
0,85 |
24,65 |
3,32 |
|
Гиперболическая |
0,822 |
0,676 |
13,87 |
1,0002 |
16,69 |
11,33 |
Из итоговой таблицы видно, что коэффициент корреляции наибольший для линейной регрессии, коэффициент детерминации max, а коэффициент аппроксимации минимален, поэтому можно сделать вывод: наиболее сильное влияние на уровень издержек в зависимости от товарооборота получается при использовании в качестве аппроксимирующей функции линейную функцию.
Для всех моделей , следовательно, все модели являются адекватными.
Из таблицы видно, что лучшим уравнением регрессии является линейная функция, так как коэффициент детерминации для этой функции является наибольшим из представленных в таблице, сумма квадратов отклонений фактических значений результативного признака от расчетных является наименьшей и средний коэффициент аппроксимации является наименьшим.
Если получается, что коэффициент детерминации для нелинейной регрессии больше коэффициента детерминации для линейной регрессии, надо рассмотреть модуль . Если разность небольшая, т.е. условие модуля выполняется, то все равно выбираем линейную регрессию для дальнейших расчетов.
Чем больше кривизна линии регрессии, тем <. Если превышает 0,1, то предположение о линейной форме связи считается не оправданным. В этом случае проводится оценка существенности различия по критерию Стьюдента.
- ошибка разности между и
Если t < 2, то различия между и несущественны, и возможно применение линейной регрессии.
Если t >2, то различия существенны и замена нелинейной регрессии уравнением линейной функции невозможна.
В нашем примере лучшей является линейная модель. Для линейной регрессии выполним дальнейшие расчеты.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитывают t-критерий.
Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
, , ;
,
где , или из табл. дисперсионного анализа (0,281).
, .
Для примера определим стандартную ошибку для параметра «b»:
Критерий Стьюдента для параметра «b» равен 5,46.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством: , 5,462=29,81.
Табличное значение tтабл критерия Стьюдента определяем по [1] для и уровня значимости 0,05 и числа степеней свободы df = 8, , т.к. > , то гипотезу о несущественности коэффициента регрессии можно отклонить.
Для расчета доверительного интервала определяем предельную ошибку для каждого показателя:
Доверительный интервал: , .
Для расчета доверительного интервала для параметра а, найдем:
, т. к. критерий Стьюдента двусторонний, а параметр а - положительный, то он значим. Найдем для него доверительный интервал:
Найдем доверительный интервал для параметра r:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательная, а верхняя положительная, то оцениваемый параметр принимается нулевым, т. к. не может одновременно принимать и положительное и отрицательное значения.
Прогнозное значение определяется путем подстановки в уравнение регрессии:
Вычислим ошибку прогноза для уравнения :
.
И для уравнения :
(*) ,
,
.
Для * ,
,
,
,
,
.
Для уравнения с :
,
.
Вывод: Целью данной контрольно-курсовой работы было определение количественной взаимосвязи между объемом товарооборота и объемом издержек на основе статистических данных. Для этого были построены уравнения линейной, степенной, гиперболической парной регрессии.
В ходе проведенного исследования выяснилось, что лучшей моделью для описания взаимосвязи между объемом товарооборота и объемом издержек является линейная функция =0,35 + 0,035 x.
На основе последнего уравнения можно предположить, что с увеличением товарооборота на 1 тыс. руб. потребительские расходы на душу населения увеличатся на 0,035 тыс. руб.
При выполнении расчетов выяснилось, средний коэффициент эластичности для линейной модели составляет 0,9123, т.е. с увеличением объема товарооборота на 1% объем издержек увеличивается в среднем на 0,9123%.
Коэффициент детерминации для линейной модели составил 0,785. Это означает, что уравнением регрессии объясняется 78,5% дисперсии результативного признака (объем издержек), а на долю прочих факторов приходится 21,5%, следовательно, линейная модель хорошо аппроксимирует исходные данные и ей можно пользоваться для прогноза значений результативного признака.
Так, полагая, что объем товарооборота составит 125 тыс. руб., то прогнозное значение для объема издержек окажется 4,725 тыс. руб., при этом с вероятностью 0,95 можно утверждать, что доверительные интервалы прогноза индивидуального значения результативного признака составят .
Литература
1. Новиков А.И. Эконометрика: Учеб. пособие. - М.: ИНФРА-М, 2010. - 144 с.
2. Доугерти К. Введение в эконометрику. - М.: ИНФРА-М, 2001. - XIV, - 402 с.
3 Елисеева И.И. Эконометрика: Учебник. - М.: Финансы и статистика, 2007. - 576 с.
4. Елисеева И.И., Курышева С.В., Гордиенко Н.М. Практикум по эконометрике: Учебное пособие. - М.: Финансы и статистика, 2008 - 344 с.
5. Магнусян Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. - М.: Дело, 2001. - 454 с.
6. Кремер Н.Ш. Теория вероятностей и математическая статистика. - М.: ЮНИТИ-ДАНА, 2003. - 573 с.
7. Кремер Н.Ш., Путко Б.А. Эконометрика. - М.: ЮНИТИ-ДАНА, 2002. - 435 с.
8. Домбровский В.В. Эконометрика - М.: Новый учебник, 2004. - 342 с.
Размещено на Allbest.ru
Подобные документы
Построение поля корреляции. Оценка данной зависимости линейной, степенной и гиперболической регрессией. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициента эластичности. Определение доверительного интервала прогноза.
контрольная работа [508,1 K], добавлен 13.11.2011Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации. Определение средней ошибки аппроксимации. Статистическая надежность моделирования с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [58,3 K], добавлен 17.10.2009Построение поля корреляции. Расчет параметров уравнений парной регрессии. Зависимость средней ожидаемой продолжительности жизни от некоторых факторов. Изучение "критерия Фишера". Оценка тесноты связи с помощью показателей корреляции и детерминации.
контрольная работа [173,8 K], добавлен 22.11.2010Расчет параметров уравнения линейной регрессии, оценка тесноты связи с помощью показателей корреляции и детерминации; определение средней ошибки аппроксимации. Статистическая надежность регрессионного моделирования с помощью критериев Фишера и Стьюдента.
контрольная работа [34,7 K], добавлен 14.11.2010Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.
курсовая работа [1,1 M], добавлен 07.08.2011Расчет уравнений линейной и нелинейной парной регрессии. Оценка тесноты связи расходов на перевозки и грузооборота с помощью показателей корреляции и детерминации. Оценка ошибки аппроксимации уравнений регрессии. Расчет прогнозного значения расходов.
курсовая работа [2,5 M], добавлен 26.12.2014Построение поля корреляции по данным, гипотеза о форме связи. Оценка тесноты связи с помощью показателей корреляции и детерминации. Определение коэффициента эластичности и индекса корреляции. Расчет критериев Фишера. Модель денежного и товарного рынков.
контрольная работа [353,7 K], добавлен 21.06.2011Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.
контрольная работа [157,9 K], добавлен 06.08.2010