Парный регрессионный и корреляционный анализ

Построение поля рассеяния, его визуальный анализ. Определение точечных оценок параметров методом наименьших квадратов. Расчет относительной ошибки аппроксимации. Построение доверительных полос для уравнения регрессии при доверительной вероятности У.

Рубрика Экономико-математическое моделирование
Вид контрольная работа
Язык русский
Дата добавления 21.12.2013
Размер файла 304,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Контрольная работа 2

по дисциплине «Эконометрика»

ТЕМА: ПАРНЫЙ РЕГРЕССИОННЫЙ И КОРРЕЛЯЦИОННЫЙ АНАЛИЗ

Имеются данные по 14 субъектам Уральского и Западно-Сибирского региона о денежных доходах и потребительских расходах на душу населения за 2004 г., которые приведены в следующей таблице:

п/п

Субъект Российской

Федерации

Денежные доходы

(тыс. руб.)

Потребительские

расходы

(тыс. руб.)

1

Республика Башкортостан

26,5

18,7

2

Удмуртская республика

28,6

21,4

3

Курганская область

22,2

16,0

4

Оренбургская область

26,0

18,3

5

Пермская область

35,1

25,5

6

Свердловская область

33,4

24,2

7

Челябинская область

29,5

20,4

8

Республика Алтай

25,4

16,8

9

Алтайский край

20,3

15,5

10

Кемеровская область

36,2

24,9

11

Новосибирская область

28,9

24,2

12

Омская область

30,7

25,1

13

Томская область

33,0

22,0

14

Тюменская область

62,6

30,3

На основе имеющихся данных требуется:

1. Построить поле рассеяния и на основе его визуального анализа выдвинуть гипотезу о виде зависимости потребительских расходов от денежных доходов в Уральском и Западно-Сибирском регионах; записать эту гипотезу в виде математической модели.

2. Методом наименьших квадратов найти точечные оценки параметров, если регрессионная модель: а) линейная; б) логарифмическая; в) степенная;

г) показательная.

3. Вычислить среднюю относительную ошибку аппроксимации

для моделей а) - г) п.2 и с ее помощью выбрать наилучшую модель. Дальнейший анализ проводить с выбранной моделью.

4. Найти интервальные оценки для параметров выбранной модели и проверить их значимость при доверительной вероятности г.

5. Построить доверительные полосы для уравнения регрессии и модели при доверительной вероятности г и представить их графически.

6. Вычислить коэффициенты корреляции и детерминации между денежными доходами и потребительскими расходами; проверить значимость корреляции между ними с вероятностью г.

7. Провести дисперсионный анализ рассматриваемой модели: определить долю вариации потребительских расходов, объясняемую уравнением регрессии, и долю вариации потребительских расходов, объясняемую случайными причинами.

8. При помощи критерия Фишера проверить адекватность выбранной модели имеющимся данным с доверительной вероятностью г.

9. Дать с вероятностью г точечный и интервальный прогноз для среднего и ожидаемого значений потребительских расходов в наудачу выбранном субъекте РФ в 2006 г., если ожидается, что денежные доходы в этом субъекте РФ увеличатся на 30% по сравнению со средним значением в 2004 г.

10. Проверить выполнение основных предположений регрессионного и корреляционного анализа относительно «возмущений» модели с доверительной вероятностью г:

а) постоянство дисперсии;

б) некоррелированность;

в) нормальность распределения.

Внимание! При выполнении задания общие данные следует заменить своими конкретными.

Решение

аппроксимация уравнение регрессия вероятность

1.График:

Гипотеза: зависимость между доходами и расходами прямо пропорциональная, т.е. чем больше человек получает, тем больше тратит. На графике точки поля рассеяния наиболее близки к графику некоторой прямой y=ax+b, но линия тренда также похожа и на другие графики функций.

Модели:

Me=0

Y=aX+b+e

Или

др. (см 2б, 2в,2г и 2д)

2. Нахождение точечных оценок параметров

а) линейная регрессионная модель

Y=aX+b+e

y=ax+b

y*=a*x+b*

a*

0,285315

b*

13,72454

y*=0.285x+13.725

Y=0.285X+13.725+e

x

y

y*

|(y-y*)/y|

1

28,500

21,650

21,856

0,010

2

30,600

22,050

22,455

0,018

3

24,200

21,250

20,629

0,029

4

28,300

21,950

21,799

0,007

5

37,100

24,450

24,310

0,006

6

35,400

23,150

23,825

0,029

7

31,500

22,950

22,712

0,010

8

27,400

20,950

21,542

0,028

9

22,300

19,650

20,087

0,022

10

38,200

24,250

24,624

0,015

11

30,900

22,950

22,541

0,018

12

32,700

23,750

23,054

0,029

13

35,000

24,150

23,711

0,018

14

64,600

32,150

32,156

0,000

Итого

466,700

325,300

325,300

0,241

б) логарифмическая

Y=aLnX+b+e

X”=LnX

Y=aX”+b+e

a*

11,24036

b*

-15,8085

y*=11.248lnx-15.808

Y=11.248lnX-15.808+e

x

y

x"

x"y

x"2

y*

|(y-y*)/y|

1

28,500

21,650

3,350

72,525

11,222

21,846

0,009

2

30,600

22,050

3,421

75,433

11,703

22,645

0,027

3

24,200

21,250

3,186

67,710

10,153

20,007

0,058

4

28,300

21,950

3,343

73,376

11,175

21,766

0,008

5

37,100

24,450

3,614

88,353

13,058

24,810

0,015

6

35,400

23,150

3,567

82,569

12,721

24,283

0,049

7

31,500

22,950

3,450

79,177

11,902

22,971

0,001

8

27,400

20,950

3,311

69,356

10,960

21,403

0,022

9

22,300

19,650

3,105

61,005

9,638

19,088

0,029

10

38,200

24,250

3,643

88,339

13,270

25,138

0,037

11

30,900

22,950

3,431

78,736

11,770

22,754

0,009

12

32,700

23,750

3,487

82,825

12,162

23,391

0,015

13

35,000

24,150

3,555

85,862

12,640

24,155

0,000

14

64,600

32,150

4,168

134,008

17,374

31,044

0,034

Итого

466,700

325,300

48,630

1139,274

169,750

325,300

0,312

в) гиперболическая

Y=a/X+b+e

X'=1/X

Y=aX'+b+e

a

-379,226

b

35,31371

Y=35.314-379.226/X+e

x

y

x'

x'y

x'2

y*

|(y-y*)/y|

1

28,500

21,650

0,035

0,760

0,001

22,008

0,017

2

30,600

22,050

0,033

0,721

0,001

22,921

0,039

3

24,200

21,250

0,041

0,878

0,002

19,643

0,076

4

28,300

21,950

0,035

0,776

0,001

21,913

0,002

5

37,100

24,450

0,027

0,659

0,001

25,092

0,026

6

35,400

23,150

0,028

0,654

0,001

24,601

0,063

7

31,500

22,950

0,032

0,729

0,001

23,275

0,014

8

27,400

20,950

0,036

0,765

0,001

21,473

0,025

9

22,300

19,650

0,045

0,881

0,002

18,308

0,068

10

38,200

24,250

0,026

0,635

0,001

25,386

0,047

11

30,900

22,950

0,032

0,743

0,001

23,041

0,004

12

32,700

23,750

0,031

0,726

0,001

23,717

0,001

13

35,000

24,150

0,029

0,690

0,001

24,479

0,014

14

64,600

32,150

0,015

0,498

0,000

29,443

0,084

Итого

466,700

325,300

0,446

10,113

0,015

325,300

0,480

г) степенная

Y=bX^ae

lnY=lnb+alnX+lne

X”=lbX, Y”=lnY, e”=lne, b”=lnb

Y”=b”+aX”+e”

a

0,442878

b

4,95742

b"

1,600886

y=4,957x^0,443

x

y

x"

y"

x"y"

x"2

y*

|(y-y*)/y|

1

28,500

21,650

3,350

3,075

10,301

11,222

21,856

0,010

2

30,600

22,050

3,421

3,093

10,582

11,703

22,555

0,023

3

24,200

21,250

3,186

3,056

9,739

10,153

20,329

0,043

4

28,300

21,950

3,343

3,089

10,325

11,175

21,788

0,007

5

37,100

24,450

3,614

3,197

11,551

13,058

24,564

0,005

6

35,400

23,150

3,567

3,142

11,207

12,721

24,059

0,039

7

31,500

22,950

3,450

3,133

10,810

11,902

22,847

0,004

8

27,400

20,950

3,311

3,042

10,071

10,960

21,479

0,025

9

22,300

19,650

3,105

2,978

9,246

9,638

19,606

0,002

10

38,200

24,250

3,643

3,188

11,615

13,270

24,884

0,026

11

30,900

22,950

3,431

3,133

10,750

11,770

22,653

0,013

12

32,700

23,750

3,487

3,168

11,047

12,162

23,228

0,022

13

35,000

24,150

3,555

3,184

11,321

12,640

23,938

0,009

14

64,600

32,150

4,168

3,470

14,465

17,374

31,403

0,023

Итого

466,700

325,300

48,630

43,950

153,030

169,750

325,189

0,252

д) показательная

Y=ba^Xe

lnY=lnb+Xlna+lne

Y”=lnY, e”=lne, a”=lna, b”=lnb

Y”=b”+a”X+e”

x

y

y"

x2

xy"

y*

|(y-y*)/y|

1

28,500

21,650

3,075

812,250

87,638

21,884

0,011

2

30,600

22,050

3,093

936,360

94,655

22,398

0,016

3

24,200

21,250

3,056

585,640

73,964

20,867

0,018

4

28,300

21,950

3,089

800,890

87,412

21,836

0,005

5

37,100

24,450

3,197

1376,410

118,595

24,068

0,016

6

35,400

23,150

3,142

1253,160

111,227

23,620

0,020

7

31,500

22,950

3,133

992,250

98,700

22,623

0,014

8

27,400

20,950

3,042

750,760

83,355

21,619

0,032

9

22,300

19,650

2,978

497,290

66,411

20,433

0,040

10

38,200

24,250

3,188

1459,240

121,798

24,363

0,005

11

30,900

22,950

3,133

954,810

96,820

22,473

0,021

12

32,700

23,750

3,168

1069,290

103,580

22,925

0,035

13

35,000

24,150

3,184

1225,000

111,450

23,516

0,026

14

64,600

32,150

3,470

4173,160

224,189

32,627

0,015

Итого

466,700

325,300

43,950

16886,510

1479,791

325,253

0,273

a"

0,0110629

a

1,011124

b"

2,7704698

b

15,96613

y=15,966*1,011^x

3. Для каждой модели рассчитаем среднюю ошибку аппроксимации. Минимальная=наилучшая - у логарифмической модели.

Модель

А

Линейная

1,72%

Логарифмическая

0,16%

Гиперболическая

3,43%

Степенная

0,17%

Показательная

1,95%

Y=11.248lnX-15.808+e

4. Найдем интервальные оценки параметров модели.

y*=11.248x'-15.808, x'=lnx

Sa*== 0,782

Sb*== 2,521

)=0.782*2,1788 (t0.975(12))= 1,703807

=2.524*2,1788 (t0.975(12))= 5,492717

=

=

Таким образом, с вероятностью 0,95 истинное значение параметра а накрывается интервалом (9,537;12,944), а истинное значение параметра b накрывается интервалом (-21,301;-10,316).

Проверим значимость оценок a* и b* параметров a и b с надежностью 0,95.

ta*=a*/Sa*= 14,37398

и tb*=b*/Sb*= -6,27079

Модули ta; tb > tквант => нулевые гипотезы отвергаются, и делается вывод о значимом отличии оценок а* и b* от нуля.

Таким образом, оба коэффициента уравнения Y=11.248lnX-15.808+e

Являются статистически значимыми с надежностью 0,95.

5. Построим доверительную полосу.

Syi*=Se*

Se== 0,712043

yiн=yi*-

yiв=yi*+

=tквант*Syi*

x"

y*

(x"-x"cp)2

(y-y*)2

(y-ycp)2

(y*-ycp)2

Sy*

y*H

y*B

dely

3,350

21,846

0,015

0,038

2,514

1,932

0,213

21,185

22,115

0,465

3,421

22,645

0,003

0,354

1,406

0,349

0,195

21,626

22,474

0,424

3,186

20,007

0,082

1,545

3,943

10,423

0,294

20,609

21,891

0,641

3,343

21,766

0,017

0,034

1,653

2,159

0,216

21,479

22,421

0,471

3,614

24,810

0,020

0,129

1,474

2,478

0,220

23,972

24,928

0,478

3,567

24,283

0,009

1,283

0,007

1,096

0,204

22,706

23,594

0,444

3,450

22,971

0,001

0,000

0,082

0,070

0,191

22,533

23,367

0,417

3,311

21,403

0,027

0,205

5,224

3,358

0,229

20,451

21,449

0,499

3,105

19,088

0,136

0,316

12,857

17,203

0,346

18,897

20,403

0,753

3,643

25,138

0,029

0,789

1,029

3,620

0,232

23,745

24,755

0,505

3,431

22,754

0,002

0,038

0,082

0,232

0,193

22,529

23,371

0,421

3,487

23,391

0,000

0,129

0,264

0,024

0,191

23,335

24,165

0,415

3,555

24,155

0,007

0,000

0,836

0,845

0,201

23,713

24,587

0,437

4,168

31,044

0,483

1,224

79,464

60,964

0,576

30,896

33,404

1,254

48,630

325,300

0,829

6,084

110,837

104,753

 

 

 

 

6. Посчитаем выборочный коэффициент парной корреляции

x"

y

xy

x2

y2

3,350

21,650

72,52542

11,22186

468,7225

3,421

22,050

75,43305

11,70324

486,2025

3,186

21,250

67,70999

10,15284

451,5625

3,343

21,950

73,37582

11,17473

481,8025

3,614

24,450

88,35293

13,05823

597,8025

3,567

23,150

82,56938

12,72143

535,9225

3,450

22,950

79,17721

11,90241

526,7025

3,311

20,950

69,35588

10,9597

438,9025

3,105

19,650

61,00513

9,638458

386,1225

3,643

24,250

88,33876

13,27025

588,0625

3,431

22,950

78,73585

11,77009

526,7025

3,487

23,750

82,82516

12,16178

564,0625

3,555

24,150

85,86166

12,6405

583,2225

4,168

32,150

134,0081

17,37401

1033,623

48,630

325,300

1139,274

169,750

7669,415

rxy=(14*1139,274-48,63*325,3)/КОРЕНЬ((14*169,75-48,63^2)*(14*7669,415-325,3^2))= 0,972

Значение rxy ([0.7;1)) позволяет сделать вывод о сильной зависимости.

Проверим, значительно ли отличается от 0 величина rxy.

(теоретический к. корреляции)

Выдвигаем гипотезу о нулевой корреляции, т.е. об отсутствии корреляции между исследуемыми переменными:

Для проверки гипотезы рассчитаем t статистику. t=(rxy*корень(14-2))/корень(1-rxy^2)= 14,329. t квант=2,1788 (t0.975(12))

tстат>tквант=> с надежностью 0,95 выборочный коэффициент парной корреляции rxy существенно отличается от нуля,и, следовательно, между переменными X и Y существует значимая зависимость, являющаяся либо логарифмической, либо близкой к логарифмической.

Вычислим коэффициент детерминации

Qy==110,837

Qy*==104,753

R^2=Qy*/Qy=0,945

Таким образом, 94,5% изменения переменной Y объясняется построенным уравнением регрессии. Случайными причинами объясняется 5,5% вариации переменной Y. Коэффициент детерминации близок к 1, а значит модель обладает хорошим качеством.

7. см коэффициент детерминации в №6.

8. При помощи критерия Фишера проверим адекватность выбранной модели имеющимся данным с доверительной вероятностью 0,95.

F=R^2(n-2)/(1-R^2)

F

206,611

Fквант0,95(1;12)

4,75

Уравнение регрессии адекватно исходным данным на уровне значимости 0,05.

9. Прогнозы.

Точечный прогноз:

xcp= 33.336

xp=1.3xcp= 43.337

y*p=y*(x”p)= =11.248*ln43.337-15.808=26.586

Интервальный прогноз:

x”p=lnx=3.769

Sy=0,712043*корень(1/14+(3,769-3,474)^2)/0,829)=0,299

Delyp=0.299*2.1788=0.652

Доверительный интервал:

25,934

27.238

Таким образом, если в нескольких субъектах денежные доходы окажутся постоянными и равными 43.337, то средние потребительские расходы с вероятностью 0,95 будут накрыты данным интервалом.

Доверительный интервал для индивидуального значения:

Sy=0,712043*корень(1+1/14+(3,769-3,474)^2)/0,829)=0.842

Delyp=0.842*2.1788=1.835

(24,751;28,421)

Таким образом, если в каком-нибудь субъекте доходы окажутся равными 43,337 тыс. руб., то траты с вероятностью 0,95 будут в давнном интервале.

А. Постоянство дисперсии

x

y

x"

y*

ei

ei-1

|ei|

r(x")

r(ei)

di2

(ei-ei-1)2

1

28,500

21,650

3,350

21,846

-0,196

 

0,196

5

6

1,000

 

2

30,600

22,050

3,421

22,645

-0,595

-0,196

0,595

6

3

9,000

0,159

3

24,200

21,250

3,186

20,007

1,243

-0,595

1,243

2

14

144,000

3,376

4

28,300

21,950

3,343

21,766

0,184

1,243

0,184

4

9

25,000

1,122

5

37,100

24,450

3,614

24,810

-0,360

0,184

0,360

12

5

49,000

0,295

6

35,400

23,150

3,567

24,283

-1,133

-0,360

1,133

11

1

100,000

0,597

7

31,500

22,950

3,450

22,971

-0,021

-1,133

0,021

8

7

1,000

1,237

8

27,400

20,950

3,311

21,403

-0,453

-0,021

0,453

3

4

1,000

0,187

9

22,300

19,650

3,105

19,088

0,562

-0,453

0,562

1

12

121,000

1,030

10

38,200

24,250

3,643

25,138

-0,888

0,562

0,888

13

2

121,000

2,103

11

30,900

22,950

3,431

22,754

0,196

-0,888

0,196

7

10

9,000

1,175

12

32,700

23,750

3,487

23,391

0,359

0,196

0,359

9

11

4,000

0,027

13

35,000

24,150

3,555

24,155

-0,005

0,359

0,005

10

8

4,000

0,133

14

64,600

32,150

4,168

31,044

1,106

-0,005

1,106

14

13

1,000

1,235

Итого

466,700

325,300

48,630

325,300

 

 

 

 

 

590,000

12,676

Rxe спирм=1-6*590/(14*(14*14-1))=-0,3

tстат=-0,3*корень(12)/корень(1-(-0,3)^2)=-1.09

tстат<tквант=> принимаем гипотезу об отсутствии гетероскедастичности, а, следовательно, принимается и нулевая гипотеза о постоянстве дисперсии возмущений. (на уровне значимости 0,05)

Б. Некоррелированность

d== 12.676/6.084=2.083- статистика Дарбина- Уотсона

dн=1.158; dв=1.391

(0;1,158)

(1.158;1.391)

(1,391;4-1,391=2,609) автокорреляция отсутствует на уровне значимости 0,05 (найденная статистика Д-У попадает в данный интервал)

(2,609;2,842)

(2,842; 4)

В. Нормальность распределения

ei

(ei-ecp)^2

(ei-ecp)^3

(ei-ecp)^4

-0,196

0,038

-0,007

0,001

-0,595

0,354

-0,210

0,125

1,243

1,545

1,920

2,386

0,184

0,034

0,006

0,001

-0,360

0,129

-0,047

0,017

-1,133

1,283

-1,453

1,645

-0,021

0,000

0,000

0,000

-0,453

0,205

-0,093

0,042

0,562

0,316

0,177

0,100

-0,888

0,789

-0,701

0,622

0,196

0,038

0,007

0,001

0,359

0,129

0,046

0,017

-0,005

0,000

0,000

0,000

1,106

1,224

1,354

1,498

0,000

6,084

1,000

6,456

0,000

 

 

 

m2

0,434576

 

 

m3

0,0714357

 

 

m4

0,4611382

 

 

b1

0,249354

 

 

b2

-0,5582597

 

 

sigma(b1)

0,6076436

 

 

sigma(b2)

0,7812033

 

 

u0,95=23.7

Нулевая гипотеза принимается на уровне значимости 0,05, удовлетворяющем неравенствам 2(1-0,95)<alfa<4(1-0.95) при одновременном выполнении двух неравенств:

0,249/0,608<23.7 и |(-0.558+6/15)/0.781|<23.7.

Поскольку оба неравенства выполнены, то гипотеза о нормальном законе распределения «возмущения» модели принимается на уровне значимости 0.1<alfa<0.2.

Размещено на Allbest.ru


Подобные документы

  • Проведение корреляционно-регрессионного анализа в зависимости выплаты труда от производительности труда. Построение поля корреляции, выбор модели уравнения и расчет его параметров. Вычисление средней ошибки аппроксимации и тесноту связи между признаками.

    практическая работа [13,1 K], добавлен 09.08.2010

  • Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.

    контрольная работа [261,1 K], добавлен 23.03.2010

  • Расчет уравнения линейной регрессии. Построение на экран графика и доверительной области уравнения. Разработка программы, генерирующей значения случайных величин, имеющих нормальный закон распределения для определения параметров уравнения регрессии.

    лабораторная работа [18,4 K], добавлен 19.02.2014

  • Построение уравнения множественной регрессии в линейной форме, расчет интервальных оценок его коэффициентов. Создание поля корреляции, определение средней ошибки аппроксимации. Анализ статистической надежности показателей регрессионного моделирования.

    контрольная работа [179,4 K], добавлен 25.03.2014

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Параметры уравнения и экономическое толкование коэффициента линейной регрессии. Расчет коэффициентов детерминации и средних относительных ошибок аппроксимации. Построение структурной формы модели с использованием косвенного метода наименьших квадратов.

    контрольная работа [99,2 K], добавлен 27.04.2011

  • Анализ метода наименьших квадратов для парной регрессии, как метода оценивания параметров линейной регрессии. Рассмотрение линейного уравнения парной регрессии. Исследование множественной линейной регрессии. Изучение ошибок коэффициентов регрессии.

    контрольная работа [108,5 K], добавлен 28.03.2018

  • Построение корреляционного поля зависимости между y и x1, определение формы и направления связи. Построение двухфакторного уравнения регрессии y, x1, x2, оценка показателей тесноты связи. Оценка модели через F-критерий Фишера и t-критерий Стьюдента.

    лабораторная работа [1,0 M], добавлен 23.01.2011

  • Построение гипотезы о форме связи денежных доходов на душу населения с потребительскими расходами в Уральском и Западно-Сибирском регионах РФ. Расчет параметров уравнений парной регрессии, оценка их качества с помощью средней ошибки аппроксимации.

    контрольная работа [4,5 M], добавлен 05.11.2014

  • Исследование зависимости сменной добычи угля на одного рабочего от мощности пласта путем построения уравнения парной линейной регрессии. Построение поля корреляции. Определение интервальных оценок заданных коэффициентов. Средняя ошибка аппроксимации.

    контрольная работа [2,1 M], добавлен 09.08.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.