Парная регрессия
Сущность и основные этапы проведения регрессионного анализа. Виды ошибок и возможности их прогнозирования. Построение поля корреляции и гипотеза о форме связи. Порядок произведения расчета прогнозного значения результата по линейному уравнению регрессии.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 29.04.2010 |
Размер файла | 372,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
27
Смысл регрессионного анализа - построение функциональных зависимостей между двумя группами переменных величин Х1, Х2, … Хр и Y. При этом речь идет о влиянии переменных Х (это будут аргументы функций) на значения переменной Y (значение функции). Переменные Х мы будем называть факторами, а Y - откликом.
Наиболее простой случай - установление зависимости одного отклика y от одного фактора х. Такой случай называется парной (простой) регрессией.
Парная регрессия - уравнение связи двух переменных у и x:
,
где у - зависимая переменная (результативный признак);
х - независимая, объясняющая переменная (признак-фактор).
Различают линейные и нелинейные регрессии.
Линейная регрессия:.
Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.
Регрессии, нелинейные по объясняющим переменным:
* полиномы разных степеней
*равносторонняя гипербола
Регрессии, нелинейные по оцениваемым параметрам:
степенная ;
показательная
экспоненциальная
Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна, т.е.
Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно а и b:
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии
и индекс корреляции - для нелинейной регрессии ():
Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации.
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
Допустимый предел значений - не более 8 - 10%.
Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения:
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:
где - общая сумма квадратов отклонений;
- сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
- остаточная сумма квадратов отклонений.
Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R2:
Коэффициент детерминации - квадрат коэффициента или индекса корреляции.
F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:
п - число единиц совокупности;
т - число параметров при переменных х.
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости а. Уровень значимости а - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно а принимается равной 0,05 или 0,01.
Если Fтабл < Fфакт, то H0 - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Н0 не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью f-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:
Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и критическое (табличное) значения t-статистики - tтабл и tфакт - принимаем или отвергаем гипотезу Hо.
Связь между F-критерием Фишера и t-статистикой Стьюдента выражается равенством
Если tтабл < tфакт, то Hо отклоняется, т.е. а, b и не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора х. Если tтабл > tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования a, b или .
Для расчета доверительного интервала определяем предельную ошибку ? для каждого показателя:
Формулы для расчета доверительных интервалов имеют следующий вид:
Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения.
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения . Вычисляется средняя стандартная ошибка прогноза :
где
и строится доверительный интервал прогноза:
где
Задача:
По 22 регионам страны изучается зависимость розничной продажи телевизоров, y от среднедушевых денежных доходов в месяц, x (табл. 1):
№ региона |
X |
Y |
|
1,000 |
2,800 |
28,000 |
|
2,000 |
2,400 |
21,300 |
|
3,000 |
2,100 |
21,000 |
|
4,000 |
2,600 |
23,300 |
|
5,000 |
1,700 |
15,800 |
|
6,000 |
2,500 |
21,900 |
|
7,000 |
2,400 |
20,000 |
|
8,000 |
2,600 |
22,000 |
|
9,000 |
2,800 |
23,900 |
|
10,000 |
2,600 |
26,000 |
|
11,000 |
2,600 |
24,600 |
|
12,000 |
2,500 |
21,000 |
|
13,000 |
2,900 |
27,000 |
|
14,000 |
2,600 |
21,000 |
|
15,000 |
2,200 |
24,000 |
|
16,000 |
2,600 |
34,000 |
|
17,000 |
3,300 |
31,900 |
|
19,000 |
3,900 |
33,000 |
|
20,000 |
4,600 |
35,400 |
|
21,000 |
3,700 |
34,000 |
|
22,000 |
3,400 |
31,000 |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессий.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. С помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку силы связи фактора с результатом.
5. Качество уравнений оцените с помощью средней ошибки аппроксимации.
6. С помощью F-критерия Фишера определите статистическую надежность результатов регрессионного моделирования. Выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата по линейному уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости ?=0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
1. Поле корреляции для:
· Линейной регрессии y=a+b*x:
·
Гипотеза о форме связи: чем больше размер среднедушевого денежного дохода в месяц (факторный признак), тем больше при прочих равных условиях розничная продажа телевизоров (результативный признак). В данной модели параметр b называется коэффициентом регрессии и показывает, насколько в среднем отклоняется величина результативного признака у при отклонении величины факторного признаках на одну единицу.
· Степенной регрессии :
Гипотеза о форме связи: степенная функция имеет вид Y=axb.
Параметр b степенного уравнения называется показателем эластичности и указывает, на сколько процентов изменится у при возрастании х на 1%. При х = 1 a = Y.
· Экспоненциальная регрессия :
· Равносторонняя гипербола :
Гипотеза о форме связи: В ряде случаев обратная связь между факторным и результативным признаками может быть выражена уравнением гиперболы: Y=a+b/x.
· Обратная гипербола :
· Полулогарифмическая регрессия :
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессий.
· Рассчитаем параметры уравнений линейной парной регрессии. Для расчета параметров a и b линейной регрессии y=a+b*x решаем систему нормальных уравнений относительно a и b:
По исходным данным рассчитываем ?y, ?x, ?yx, ?x2, ?y2 (табл. 2):
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
Y^cp |
Y-Y^cp |
Ai |
|
1 |
2,800 |
28,000 |
78,400 |
7,840 |
784,000 |
25,719 |
2,281 |
0,081 |
|
2 |
2,400 |
21,300 |
51,120 |
5,760 |
453,690 |
22,870 |
-1,570 |
0,074 |
|
3 |
2,100 |
21,000 |
44,100 |
4,410 |
441,000 |
20,734 |
0,266 |
0,013 |
|
4 |
2,600 |
23,300 |
60,580 |
6,760 |
542,890 |
24,295 |
-0,995 |
0,043 |
|
5 |
1,700 |
15,800 |
26,860 |
2,890 |
249,640 |
17,885 |
-2,085 |
0,132 |
|
6 |
2,500 |
21,900 |
54,750 |
6,250 |
479,610 |
23,582 |
-1,682 |
0,077 |
|
7 |
2,400 |
20,000 |
48,000 |
5,760 |
400,000 |
22,870 |
-2,870 |
0,144 |
|
8 |
2,600 |
22,000 |
57,200 |
6,760 |
484,000 |
24,295 |
-2,295 |
0,104 |
|
9 |
2,800 |
23,900 |
66,920 |
7,840 |
571,210 |
25,719 |
-1,819 |
0,076 |
|
10 |
2,600 |
26,000 |
67,600 |
6,760 |
676,000 |
24,295 |
1,705 |
0,066 |
|
11 |
2,600 |
24,600 |
63,960 |
6,760 |
605,160 |
24,295 |
0,305 |
0,012 |
|
12 |
2,500 |
21,000 |
52,500 |
6,250 |
441,000 |
23,582 |
-2,582 |
0,123 |
|
13 |
2,900 |
27,000 |
78,300 |
8,410 |
729,000 |
26,431 |
0,569 |
0,021 |
|
14 |
2,600 |
21,000 |
54,600 |
6,760 |
441,000 |
24,295 |
-3,295 |
0,157 |
|
15 |
2,200 |
24,000 |
52,800 |
4,840 |
576,000 |
21,446 |
2,554 |
0,106 |
|
16 |
2,600 |
34,000 |
88,400 |
6,760 |
1156,000 |
24,295 |
9,705 |
0,285 |
|
17 |
3,300 |
31,900 |
105,270 |
10,890 |
1017,610 |
29,280 |
2,620 |
0,082 |
|
19 |
3,900 |
33,000 |
128,700 |
15,210 |
1089,000 |
33,553 |
-0,553 |
0,017 |
|
20 |
4,600 |
35,400 |
162,840 |
21,160 |
1253,160 |
38,539 |
-3,139 |
0,089 |
|
21 |
3,700 |
34,000 |
125,800 |
13,690 |
1156,000 |
32,129 |
1,871 |
0,055 |
|
22 |
3,400 |
31,000 |
105,400 |
11,560 |
961,000 |
29,992 |
1,008 |
0,033 |
|
Итого |
58,800 |
540,100 |
1574,100 |
173,320 |
14506,970 |
540,100 |
0,000 |
||
сред значение |
2,800 |
25,719 |
74,957 |
8,253 |
690,808 |
0,085 |
|||
станд. откл |
0,643 |
5,417 |
Система нормальных уравнений составит:
Ур-ие регрессии: = 5,777+7,122•x. Данное уравнение показывает, что с увеличением среднедушевого денежного дохода в месяц на 1 тыс. руб. доля розничных продаж телевизоров повышается в среднем на 7,12%.
· Рассчитаем параметры уравнений степенной парной регрессии. Построению степенной модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 3:
№ рег |
X |
Y |
XY |
X^2 |
Y^2 |
Yp^cp |
y^cp |
|
1 |
1,030 |
3,332 |
3,431 |
1,060 |
11,104 |
3,245 |
25,67072 |
|
2 |
0,875 |
3,059 |
2,678 |
0,766 |
9,356 |
3,116 |
22,56102 |
|
3 |
0,742 |
3,045 |
2,259 |
0,550 |
9,269 |
3,004 |
20,17348 |
|
4 |
0,956 |
3,148 |
3,008 |
0,913 |
9,913 |
3,183 |
24,12559 |
|
5 |
0,531 |
2,760 |
1,465 |
0,282 |
7,618 |
2,827 |
16,90081 |
|
6 |
0,916 |
3,086 |
2,828 |
0,840 |
9,526 |
3,150 |
23,34585 |
|
7 |
0,875 |
2,996 |
2,623 |
0,766 |
8,974 |
3,116 |
22,56102 |
|
8 |
0,956 |
3,091 |
2,954 |
0,913 |
9,555 |
3,183 |
24,12559 |
|
9 |
1,030 |
3,174 |
3,268 |
1,060 |
10,074 |
3,245 |
25,67072 |
|
10 |
0,956 |
3,258 |
3,113 |
0,913 |
10,615 |
3,183 |
24,12559 |
|
11 |
0,956 |
3,203 |
3,060 |
0,913 |
10,258 |
3,183 |
24,12559 |
|
12 |
0,916 |
3,045 |
2,790 |
0,840 |
9,269 |
3,150 |
23,34585 |
|
13 |
1,065 |
3,296 |
3,509 |
1,134 |
10,863 |
3,275 |
26,4365 |
|
14 |
0,956 |
3,045 |
2,909 |
0,913 |
9,269 |
3,183 |
24,12559 |
|
15 |
0,788 |
3,178 |
2,506 |
0,622 |
10,100 |
3,043 |
20,97512 |
|
16 |
0,956 |
3,526 |
3,369 |
0,913 |
12,435 |
3,183 |
24,12559 |
|
17 |
1,194 |
3,463 |
4,134 |
1,425 |
11,990 |
3,383 |
29,4585 |
|
19 |
1,361 |
3,497 |
4,759 |
1,852 |
12,226 |
3,523 |
33,88317 |
|
20 |
1,526 |
3,567 |
5,443 |
2,329 |
12,721 |
3,661 |
38,90802 |
|
21 |
1,308 |
3,526 |
4,614 |
1,712 |
12,435 |
3,479 |
32,42145 |
|
22 |
1,224 |
3,434 |
4,202 |
1,498 |
11,792 |
3,408 |
30,20445 |
|
итого |
21,115 |
67,727 |
68,921 |
22,214 |
219,361 |
67,727 |
537,270 |
|
сред зн |
1,005 |
3,225 |
3,282 |
1,058 |
10,446 |
3,225 |
||
стан откл |
0,216 |
0,211 |
Рассчитаем С и b:
Получим линейное уравнение: . Выполнив его потенцирование, получим:
Подставляя в данное уравнение фактические значения х, получаем теоретические значения результата y.
· Рассчитаем параметры уравнений экспоненциальной парной регрессии. Построению экспоненциальной модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем логарифмирования обеих частей уравнения:
где
Для расчетов используем данные табл. 4:
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
Yp |
y^cp |
|
1 |
2,800 |
3,332 |
9,330 |
7,840 |
11,104 |
3,225 |
25,156 |
|
2 |
2,400 |
3,059 |
7,341 |
5,760 |
9,356 |
3,116 |
22,552 |
|
3 |
2,100 |
3,045 |
6,393 |
4,410 |
9,269 |
3,034 |
20,777 |
|
4 |
2,600 |
3,148 |
8,186 |
6,760 |
9,913 |
3,170 |
23,818 |
|
5 |
1,700 |
2,760 |
4,692 |
2,890 |
7,618 |
2,925 |
18,625 |
|
6 |
2,500 |
3,086 |
7,716 |
6,250 |
9,526 |
3,143 |
23,176 |
|
7 |
2,400 |
2,996 |
7,190 |
5,760 |
8,974 |
3,116 |
22,552 |
|
8 |
2,600 |
3,091 |
8,037 |
6,760 |
9,555 |
3,170 |
23,818 |
|
9 |
2,800 |
3,174 |
8,887 |
7,840 |
10,074 |
3,225 |
25,156 |
|
10 |
2,600 |
3,258 |
8,471 |
6,760 |
10,615 |
3,170 |
23,818 |
|
11 |
2,600 |
3,203 |
8,327 |
6,760 |
10,258 |
3,170 |
23,818 |
|
12 |
2,500 |
3,045 |
7,611 |
6,250 |
9,269 |
3,143 |
23,176 |
|
13 |
2,900 |
3,296 |
9,558 |
8,410 |
10,863 |
3,252 |
25,853 |
|
14 |
2,600 |
3,045 |
7,916 |
6,760 |
9,269 |
3,170 |
23,818 |
|
15 |
2,200 |
3,178 |
6,992 |
4,840 |
10,100 |
3,061 |
21,352 |
|
16 |
2,600 |
3,526 |
9,169 |
6,760 |
12,435 |
3,170 |
23,818 |
|
17 |
3,300 |
3,463 |
11,427 |
10,890 |
11,990 |
3,362 |
28,839 |
|
19 |
3,900 |
3,497 |
13,636 |
15,210 |
12,226 |
3,526 |
33,978 |
|
20 |
4,600 |
3,567 |
16,407 |
21,160 |
12,721 |
3,717 |
41,140 |
|
21 |
3,700 |
3,526 |
13,048 |
13,690 |
12,435 |
3,471 |
32,170 |
|
22 |
3,400 |
3,434 |
11,676 |
11,560 |
11,792 |
3,389 |
29,638 |
|
Итого |
58,800 |
67,727 |
192,008 |
173,320 |
219,361 |
67,727 |
537,053 |
|
сред зн |
2,800 |
3,225 |
9,143 |
8,253 |
10,446 |
|||
стан откл |
0,643 |
0,211 |
Рассчитаем С и b:
Получим линейное уравнение: . Выполнив его потенцирование, получим:
Для расчета теоретических значений y подставим в уравнение значения x.
· Рассчитаем параметры уравнений полулогарифмической парной регрессии. Построению полулогарифмической модели предшествует процедура линеаризации переменных. В примере линеаризация производится путем замены:
где
Для расчетов используем данные табл. 5:
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
y^cp |
|
1 |
1,030 |
28,000 |
28,829 |
1,060 |
784,000 |
26,238 |
|
2 |
0,875 |
21,300 |
18,647 |
0,766 |
453,690 |
22,928 |
|
3 |
0,742 |
21,000 |
15,581 |
0,550 |
441,000 |
20,062 |
|
4 |
0,956 |
23,300 |
22,263 |
0,913 |
542,890 |
24,647 |
|
5 |
0,531 |
15,800 |
8,384 |
0,282 |
249,640 |
15,525 |
|
6 |
0,916 |
21,900 |
20,067 |
0,840 |
479,610 |
23,805 |
|
7 |
0,875 |
20,000 |
17,509 |
0,766 |
400,000 |
22,928 |
|
8 |
0,956 |
22,000 |
21,021 |
0,913 |
484,000 |
24,647 |
|
9 |
1,030 |
23,900 |
24,608 |
1,060 |
571,210 |
26,238 |
|
10 |
0,956 |
26,000 |
24,843 |
0,913 |
676,000 |
24,647 |
|
11 |
0,956 |
24,600 |
23,506 |
0,913 |
605,160 |
24,647 |
|
12 |
0,916 |
21,000 |
19,242 |
0,840 |
441,000 |
23,805 |
|
13 |
1,065 |
27,000 |
28,747 |
1,134 |
729,000 |
26,991 |
|
14 |
0,956 |
21,000 |
20,066 |
0,913 |
441,000 |
24,647 |
|
15 |
0,788 |
24,000 |
18,923 |
0,622 |
576,000 |
21,060 |
|
16 |
0,956 |
34,000 |
32,487 |
0,913 |
1156,000 |
24,647 |
|
17 |
1,194 |
31,900 |
38,086 |
1,425 |
1017,610 |
29,765 |
|
19 |
1,361 |
33,000 |
44,912 |
1,852 |
1089,000 |
33,351 |
|
20 |
1,526 |
35,400 |
54,022 |
2,329 |
1253,160 |
36,895 |
|
21 |
1,308 |
34,000 |
44,483 |
1,712 |
1156,000 |
32,221 |
|
22 |
1,224 |
31,000 |
37,937 |
1,498 |
961,000 |
30,406 |
|
Итого |
21,115 |
540,100 |
564,166 |
22,214 |
14506,970 |
540,100 |
|
сред зн |
1,005 |
25,719 |
26,865 |
1,058 |
690,808 |
||
стан откл |
0,216 |
5,417 |
Рассчитаем a и b:
Получим линейное уравнение: .
· Рассчитаем параметры уравнений обратной парной регрессии. Для оценки параметров приведем обратную модель к линейному виду, заменив , тогда
Для расчетов используем данные табл. 6:
№ региона |
X |
Y |
XY |
X^2 |
Y^2 |
Y^cp |
|
1 |
2,800 |
0,036 |
0,100 |
7,840 |
0,001 |
24,605 |
|
2 |
2,400 |
0,047 |
0,113 |
5,760 |
0,002 |
22,230 |
|
3 |
2,100 |
0,048 |
0,100 |
4,410 |
0,002 |
20,729 |
|
4 |
2,600 |
0,043 |
0,112 |
6,760 |
0,002 |
23,357 |
|
5 |
1,700 |
0,063 |
0,108 |
2,890 |
0,004 |
19,017 |
|
6 |
2,500 |
0,046 |
0,114 |
6,250 |
0,002 |
22,780 |
|
7 |
2,400 |
0,050 |
0,120 |
5,760 |
0,003 |
22,230 |
|
8 |
2,600 |
0,045 |
0,118 |
6,760 |
0,002 |
23,357 |
|
9 |
2,800 |
0,042 |
0,117 |
7,840 |
0,002 |
24,605 |
|
10 |
2,600 |
0,038 |
0,100 |
6,760 |
0,001 |
23,357 |
|
11 |
2,600 |
0,041 |
0,106 |
6,760 |
0,002 |
23,357 |
|
12 |
2,500 |
0,048 |
0,119 |
6,250 |
0,002 |
22,780 |
|
13 |
2,900 |
0,037 |
0,107 |
8,410 |
0,001 |
25,280 |
|
14 |
2,600 |
0,048 |
0,124 |
6,760 |
0,002 |
23,357 |
|
15 |
2,200 |
0,042 |
0,092 |
4,840 |
0,002 |
21,206 |
|
16 |
2,600 |
0,029 |
0,076 |
6,760 |
0,001 |
23,357 |
|
17 |
3,300 |
0,031 |
0,103 |
10,890 |
0,001 |
28,398 |
|
19 |
3,900 |
0,030 |
0,118 |
15,210 |
0,001 |
34,844 |
|
20 |
4,600 |
0,028 |
0,130 |
21,160 |
0,001 |
47,393 |
|
21 |
3,700 |
0,029 |
0,109 |
13,690 |
0,001 |
32,393 |
|
22 |
3,400 |
0,032 |
0,110 |
11,560 |
0,001 |
29,301 |
|
Итого |
58,800 |
0,853 |
2,296 |
173,320 |
0,036 |
537,933 |
|
сред знач |
2,800 |
0,041 |
0,109 |
8,253 |
0,002 |
||
стан отклон |
0,643 |
0,009 |
Рассчитаем a и b:
Получим линейное уравнение: . Выполнив его потенцирование, получим:
Для расчета теоретических значений y подставим в уравнение значения x.
· Рассчитаем параметры уравнений равносторонней гиперболы парной регрессии. Для оценки параметров приведем модель равносторонней гиперболы к линейному виду, заменив , тогда
Для расчетов используем данные табл. 7:
№ региона |
X=1/z |
Y |
XY |
X^2 |
Y^2 |
Y^cp |
|
1 |
0,357 |
28,000 |
10,000 |
0,128 |
784,000 |
26,715 |
|
2 |
0,417 |
21,300 |
8,875 |
0,174 |
453,690 |
23,259 |
|
3 |
0,476 |
21,000 |
10,000 |
0,227 |
441,000 |
19,804 |
|
4 |
0,385 |
23,300 |
8,962 |
0,148 |
542,890 |
25,120 |
|
5 |
0,588 |
15,800 |
9,294 |
0,346 |
249,640 |
13,298 |
|
6 |
0,400 |
21,900 |
8,760 |
0,160 |
479,610 |
24,227 |
|
7 |
0,417 |
20,000 |
8,333 |
0,174 |
400,000 |
23,259 |
|
8 |
0,385 |
22,000 |
8,462 |
0,148 |
484,000 |
25,120 |
|
9 |
0,357 |
23,900 |
8,536 |
0,128 |
571,210 |
26,715 |
|
10 |
0,385 |
26,000 |
10,000 |
0,148 |
676,000 |
25,120 |
|
11 |
0,385 |
24,600 |
9,462 |
0,148 |
605,160 |
25,120 |
|
12 |
0,400 |
21,000 |
8,400 |
0,160 |
441,000 |
24,227 |
|
13 |
0,345 |
27,000 |
9,310 |
0,119 |
729,000 |
27,430 |
|
14 |
0,385 |
21,000 |
8,077 |
0,148 |
441,000 |
25,120 |
|
15 |
0,455 |
24,000 |
10,909 |
0,207 |
576,000 |
21,060 |
|
16 |
0,385 |
34,000 |
13,077 |
0,148 |
1156,000 |
25,120 |
|
17 |
0,303 |
31,900 |
9,667 |
0,092 |
1017,610 |
29,857 |
|
19 |
0,256 |
33,000 |
8,462 |
0,066 |
1089,000 |
32,564 |
|
20 |
0,217 |
35,400 |
7,696 |
0,047 |
1253,160 |
34,829 |
|
21 |
0,270 |
34,000 |
9,189 |
0,073 |
1156,000 |
31,759 |
|
22 |
0,294 |
31,000 |
9,118 |
0,087 |
961,000 |
30,374 |
|
Итого |
7,860 |
540,100 |
194,587 |
3,073 |
14506,970 |
540,100 |
|
сред знач |
0,374 |
25,719 |
9,266 |
0,146 |
1318,815 |
||
стан отклон |
0,079 |
25,639 |
Рассчитаем a и b:
Получим линейное уравнение: . Получим уравнение регрессии: .
3. Оценка тесноты связи с помощью показателей корреляции и детерминации:
· Линейная модель. Тесноту линейной связи оценит коэффициент корреляции. Был получен следующий коэффициент корреляции rxy=b=7,122*, что говорит о прямой сильной связи фактора и результата. Коэффициент детерминации r?xy=(0,845)?=0,715. Это означает, что 71,5% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией фактора х - среднедушевой денежный доход в месяц.
· Степенная модель. Тесноту нелинейной связи оценит индекс корреляции. Был получен следующий индекс корреляции =, что говорит о очень сильной тесной связи, но немного больше чем в линейной модели. Коэффициент детерминации r?xy=0,7175. Это означает, что 71,75% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией фактора х - среднедушевой денежный доход в месяц.
· Экспоненциальная модель. Был получен следующий индекс корреляции ?xy=0,8124, что говорит о том, что связь прямая и очень сильная, но немного слабее, чем в линейной и степенной моделях. Коэффициент детерминации r?xy=0,66. Это означает, что 66% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией фактора х - среднедушевой денежный доход в месяц.
· Полулогарифмическая модель. Был получен следующий индекс корреляции ?xy=0,8578, что говорит о том, что связь прямая и очень сильная, но немного больше чем в предыдущих моделях. Коэффициент детерминации r?xy=0,7358. Это означает, что 73,58% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией фактора х - среднедушевой денежный доход в месяц.
· Гиперболическая модель. Был получен следующий индекс корреляции ?xy=0,8448 и коэффициент корреляции rxy=-0,1784 что говорит о том, что связь обратная очень сильная. Коэффициент детерминации r?xy=0,7358. Это означает, что 73,5% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией фактора х - среднедушевой денежный доход в месяц.
· Обратная модель. Был получен следующий индекс корреляции ?xy=0,8114 и коэффициент корреляции rxy=-0,8120, что говорит о том, что связь обратная очень сильная. Коэффициент детерминации r?xy=0,6584. Это означает, что 65,84% вариации результативного признака (розничная продажа телевизоров, у) объясняется вариацией фактора х - среднедушевой денежный доход в месяц.
Вывод: по полулогарифмическому уравнению получена наибольшая оценка тесноты связи: ?xy=0,8578 (по сравнению с линейной, степенной, экспоненциальной, гиперболической, обратной регрессиями).
4. С помощью среднего (общего) коэффициента эластичности дайте сравнительную оценку силы связи фактора с результатом.
Рассчитаем коэффициент эластичности для линейной модели:
· Для уравнения прямой: y = 5,777+7,122•x
· Для уравнения степенной модели :
· Для уравнения экспоненциальной модели:
Для уравнения полулогарифмической модели :
· Для уравнения обратной гиперболической модели :
· Для уравнения равносторонней гиперболической модели :
Сравнивая значения , характеризуем оценку силы связи фактора с результатом:
·
·
·
·
·
·
Известно, что коэффициент эластичности показывает связь между фактором и результатом, т.е. на сколько% изменится результат y от своей средней величины при изменении фактора х на 1% от своего среднего значения. В данном примере получилось, что самая большая сила связи между фактором и результатом в полулогарифмической модели, слабая сила связи в обратной гиперболической модели.
5. Оценка качества уравнений с помощью средней ошибки аппроксимации.
Подставляя в уравнение регрессии фактические значения х, определим теоретические (расчетные) значения . Найдем величину средней ошибки аппроксимации :
В среднем расчетные значения отклоняются от фактических на:
· Линейная регрессия. = *100%= 8,5%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Степенная регрессия. =*100%= 8,2%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Экспоненциальная регрессия. =*100%= 9%, что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Полулогарифмическая регрессия. =*100%= 7,9 что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Гиперболическая регрессия. =*100%= 9,3 что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
· Обратная регрессия. =*100%= 9,9 3 что говорит о повышенной ошибке аппроксимации, но в допустимых пределах.
Качество построенной модели оценивается как хорошее, так как не превышает 8 -10%.
6. Рассчитаем F-критерий:
· Линейная регрессия. = *19= 47,579
где =4,38<
· Степенная регрессия. =*19= 48,257
где =4,38<
· Экспоненциальная регрессия. =*19= 36,878
где =4,38<
· Полулогарифмическая регрессия. =*19= 52,9232
где =4,38<
· Гиперболическая регрессия. =*19= 47,357
где =4,38<
· Обратная регрессия. =*19= 36,627
где =4,38<
Для всех регрессий =4,38< , из чего следует, что уравнения регрессии статистически значимы.
Вывод: остается на допустимом уровне для всех уравнений регрессий.
А |
R^2 |
Fфакт |
||
Линейная модель |
8,5 |
0,714 |
47,500 |
|
Степенная модель |
8,2 |
0,718 |
48,250 |
|
Полулогарифмическая модель |
7,9 |
0,736 |
52,920 |
|
Экспоненциальная модель |
9,0 |
0,660 |
36,870 |
|
Равносторонняя гипербола |
9,3 |
0,714 |
47,350 |
|
Обратная гипербола |
9,9 |
0,453 |
15,700 |
Все уравнения регрессии достаточно хорошо описывают исходные данные. Некоторое предпочтение можно отдать полулогарифмической функции, для которой значение R^2 наибольшее, а ошибка аппроксимации - наименьшая
7. Рассчитаем прогнозное значение результата по линейному уравнению регрессии, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определим доверительный интервал прогноза для уровня значимости ?=0,05:
Прогнозное значение определяется путем подстановки в уравнение регрессии соответствующего (прогнозного) значения .
5,777+7,122*2,996=27,114
где = =2,8*1,07=2,996
Средняя стандартная ошибка прогноза :
==3,12
где = =0,697886
Предельная ошибка прогноза:
Доверительный интервал прогноза
где
=27,116,53;
27,11-6,53 = 20,58
27,11+6,53 = 33,64
Выполненный прогноз среднедушевых денежных доходов в месяц, x оказался надежным (р = 1 - ? = 1 - 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границ доверительного интервала составляет 2,09 раза:
= = =1,63
Подобные документы
Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.
контрольная работа [157,9 K], добавлен 06.08.2010Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Основные методы анализа линейной модели парной регрессии. Оценки неизвестных параметров для записанных уравнений парной регрессии по методу наименьших квадратов. Проверка значимости всех параметров модели (уравнения регрессии) по критерию Стьюдента.
лабораторная работа [67,8 K], добавлен 26.12.2010Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.
контрольная работа [179,4 K], добавлен 25.03.2014Методика расчета линейной регрессии и корреляции, оценка их значимости. Порядок построения нелинейных регрессионных моделей в MS Exсel. Оценка надежности результатов множественной регрессии и корреляции с помощью F-критерия Фишера и t-критерия Стьюдента.
контрольная работа [3,6 M], добавлен 29.05.2010Построение поля корреляции и формулирование гипотезы о форме связи. Параметры уравнений линейной, степенной и гиперболической регрессии. Оценка тесноты связи с помощью показателей корреляции и детерминации. Оценка средней ошибки аппроксимации уравнения.
контрольная работа [136,3 K], добавлен 25.09.2014Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Построение математической модели выбранного экономического явления методами регрессионного анализа. Линейная регрессионная модель. Выборочный коэффициент корреляции. Метод наименьших квадратов для модели множественной регрессии, статистические гипотезы.
курсовая работа [1,1 M], добавлен 22.05.2015Построение поля корреляции по данным, гипотеза о форме связи. Оценка тесноты связи с помощью показателей корреляции и детерминации. Определение коэффициента эластичности и индекса корреляции. Расчет критериев Фишера. Модель денежного и товарного рынков.
контрольная работа [353,7 K], добавлен 21.06.2011Взаимосвязи экономических переменных. Понятие эконометрической модели. Коэффициент корреляции и его свойства. Линейная парная регрессия. Метод наименьших квадратов. Основные предпосылки и принципы регрессионного анализа. Статистика Дарбина-Уотсона.
шпаргалка [142,4 K], добавлен 22.12.2011