Описательная статистика. Частоты

Корреляция, линейная и нелинейная регрессия. Дисперсионный, лискриминантный и кластерный анализ. Линейное программирование. Параметрические и непараметрические критерии. Определение существования взаимосвязи между рентабельностью и затратами на рекламу.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 13.01.2015
Размер файла 502,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

1. Описательная статистика. Частоты

2. Корреляция

3. Линейная и нелинейная регрессия

4. Дисперсионный анализ

5. Дискриминантный анализ

6. Кластерный анализ

7. Линейное программирование

8. Параметрические и непараметрические критерии

1. Описательная статистика. Частоты

Для показателей: уровень рентабельности, прибыль, полная себестоимость, цена реализации, рассчитать среднее значение, max, min, размах, эксцесс, асимметрию, дать интерпретацию каждому параметру.

Таблица 1 - Описательная статистика

N

Размах

Minimum

Maximum

Среднее

Среднее отклонение

Дисперсия

Ассимметрия

Эксцесс

Statistic

Statistic

Statistic

Statistic

Statistic

Стат.велич

Стат.велич

Стат.велич

Станд.ош

Стат.велич.

Станд.ош

Уровень рентабельности

91

279

-64,55

214,6

31,45

45,95

2111,70

1,216

0,2

3,9

0,5

Прибыль убыток тыс./руб.

91

10410

-76664

27440

1790

10648

113400

-4,337

0,2

33

0,5

Полная себестоимость за 1 ц/руб.

91

1017

89,79

1107

392,3

157

24850

1,785

0,2

4,9

0,5

Средняя цена реализации за 1 ц/руб.

91

879

164,52

1043

471,1

142,2

20245

1,19

0,2

2,3

0,5

Анализ представлен за 2008-2009 год по 91 предприятию по Верхнеуральскому, Варненскому, Октябрьскому районам. Нами были рассчитаны показатели: рентабельность, средняя цена реализации, прибыль и полная себестоимость. Таким образом:

Ср. значение по уровню рентабельности 31,46; по прибыли 1790,6; по полной себестоимости 392,37; по ср. цене реализации 471,2.

Max по уровню рентабельности 214,0036; по прибыли 27440, по полной себестоимости 1107,3; по ср.цене реализации 1043,7.

Min по уровню рентабельности -64,5; по прибыли -76664; по полной себестоимости 89,8; по ср.цене реализации 164,5.

Размах по уровню рентабельности 279,2; по прибыли 104104; по полной себестоимости 1017,5; по ср. цене реализации 879,1.

Эксцесс по уровню рентабельности 3,91 (полновершинное распределение); по прибыли 33,7 (полновершинное распределение); по полной себестоимости 4,9 (полновершинное распределение); по ср.цене реализации 2,4 (полновершинное распределение).

Асимметрия по уровню рентабельности 1,2 (сдвиг в сторону меньших значений, т.е. предприятия с меньшей рентабельностью); по прибыли -4,33 (сдвиг в сторону больших значений, т.е. предприятия с большей рентабельностью); по полной себестоимости 1,78 (сдвиг в сторону меньших значений, т.е. предприятия с меньшей рентабельностью); по ср. цене реализации 1,19 (сдвиг в сторону меньших значений, т.е. предприятия с меньшей рентабельностью).

1) Построить гистограмму распределения уровня рентабельности на предприятии;

2) Построить гистограмму прибыли и убытков;

3) Сформировать гистограмму средняя цена реализации;

4) Построить столбиковую диаграмму полной себестоимости.

Таблица 2 - Средняя цена реализации за 1ц/руб.

Ведомство

Среднее

Кол-во предпр.

Стандарт, отклонение

Медиана

Варненский район

506,939517632340300

28

126,042600783486530

484,088987040895200

Верхнеуральский район

410,536216344213240

29

96,888364694753300

400,347372991749860

Октябрьский район

493,490505325712600

34

171,529677556912000

453,785062517926100

Общее кол-во

471,192680755625800

91

142,287229951379860

436,488970588235250

В таблице 2 представлены средние значения цены реализации 1 тонны пшеницы по предприятиям Варненского района - 506,9 р., Верхнеуральского района - 410,5 р. и Октябрьского района - 493,5 р. за 2008-2009 год.

1) На графике представлен уровень рентабельности предприятия, и он приближен к нормальному распределению.

Рисунок 1 - Уровень рентабельности

регрессия корреляция программирование рентабельность

2) На графике представлены прибыли и убытки, анализируемые данные распределены по нормальному распределению.

Рисунок 2 - Прибыли и убытков

3) На графике представлена средняя цена реализации, анализируемые данные распределены по нормальному распределению.

Рисунок 3 - Средняя цена реализации за 1 ц/руб.

4) На графике представлена полная себестоимость, анализируемые данные распределены по нормальному распределению.

Рисунок 4 - Полная себестоимость за 1 ц/руб.

Рассматривалась столбиковая гистограмма по полной себестоимости. Шкала от 90 до 1100 рублей. Из полученных данных можно сделать вывод о том, что приблизительно в у 20 предприятий себестоимость за 1ц составила 400 руб. В среднем у 4-х предприятий данный показатель составил 200 руб., у 7-ми - 250 руб., у 10-ти - 350 руб., у 9-ти - 500 руб., у 2-х - 600 руб., у 3-х - 800 руб.

2. Корреляция

1) Определить существует ли взаимосвязь между рентабельностью и затратами на рекламу;

2) Определить существует ли взаимосвязь между затратами на содержание основных средств и урожайностью, рентабельностью;

3) Определить существует ли взаимосвязь между затратами на ГСМ и рентабельностью.

Таблица 3 - Связь между рентабельностью и затратами на рекламу

Рентабельность

Затраты на рекламу, руб.

Рентабельность

Корреляция Пирсона

1

0,430**

Sig. (2-tailed)

0,002

Кол-во

48

48

Затраты на рекламу, руб.

Корреляция Пирсона

0,430**

1

Sig. (2-tailed)

0,002

Кол-во

48

48

Между рентабельностью и затратами существует взаимосвязь, но она незначительная, так как отдалена от коэффициента 1, и она составляет 0,43. Между двумя признаками образована прямая связь. Следовательно, при увеличении одного признака, увеличивается и второй признак.

Таблица 4 - Взаимосвязь между затратами на содержание ОС и урожайностью.

Основные средства

Урожайность пшеницы, ц/га

Основные средства

Корреляция Пирсона

1

-0,113

Sig. (2-tailed)

0,372

Кол-во

64

64

Урожайность пшеницы, ц/га

Корреляция Пирсона

-0,113

1

Sig. (2-tailed)

0,372

Кол-во

64

64

Между урожайностью и основными средствами очень слабая взаимосвязь, так как коэффициент равен -0,113. Связь обратная, с увеличением одного фактора происходит уменьшение второго фактора.

Таблица 5 - Взаимосвязь между затратами на содержание ОС и рентабельностью.

Основные средства

Рентабельность

Основные средства

Корреляция Пирсона

1

-0,161

Sig. (2-tailed)

0,204

Кол-во

64

64

Рентабельность

Корреляция Пирсона

-0,161

1

Sig. (2-tailed)

0,204

Кол-во

64

64

Между рентабельностью и основными средствами очень слабая взаимосвязь, так как коэффициент равен - 0,161. Связь обратная, с увеличением значения одного фактора происходит уменьшение значения второго фактора.

Таблица 6 - Связь между затратами на ГСМ и рентабельностью.

Затраты на ГСМ 1цруб

Рентабельность

Затраты на ГСМ 1ц руб.

Корреляция Пирсона

1

-0,181

Sig. (2-tailed)

0,103

Кол-во

82

82

Рентабельность

Корреляция Пирсона

-0,181

1

Sig. (2-tailed)

0,103

Кол-во

82

82

Между рентабельностью и затратами на ГСМ очень слабая взаимосвязь, так как коэффициент равен - 0,181. Связь обратная, поэтому с увеличением значения одного фактора происходит уменьшение значения второго фактора.

3. Линейная и нелинейная регрессия

Требуется построить модель зависимости объема прибыли от премиальных выплат с помощью полинома 2-й степени. Исходные данные и результаты расчетов отобразить на графике.

Таблица 7

у

x1

x2

x3

x4

x5

x6

Корреляция Пирсона

у

1,000

0,203

0,725

0,872

0,854

0,021

0,486

x1

0,203

1,000

0,101

0,069

0,100

-0,194

-0,023

x2

0,725

0,101

1,000

0,809

0,891

-0,016

0,222

x3

0,872

0,069

0,809

1,000

0,955

0,084

0,633

x4

0,854

0,100

0,891

0,955

1,000

0,002

0,506

x5

0,021

-0,194

-0,016

0,084

0,002

1,000

0,150

x6

0,486

-0,023

0,222

0,633

0,506

0,150

1,000

Построив матрицу парных коэффициентов корреляции, мы анализируем коллинеарность факторов. Мы видим, что между фактором х1 и у существует слабая взаимосвязь, коэффициент равен 0,203. между фактором х2 и у существует сильная взаимосвязь, коэффициент равен 0,725. Между факторами х2 и х3 существует очень сильная взаимосвязь. Также фактор х3 сильно взаимодействует с факторами х4 и х6, и фактор х2 сильно взаимодействует с х4, поэтому исключим x2 и x4.

Model

R

R Square

1

0,889a

0,791

В результате анализа мы получили коэффициент корреляции, который равен 0,889, а коэффициент детерминации равен 0,791. Коэффициент корреляции говорит нам о том, что между зависимым фактором У и независимыми факторами Х существует очень сильная взаимосвязь. Благодаря коэффициенту детерминации мы можем сказать, что фактор У находится под влиянием практических всех независимых факторов. Модель адекватна и качественна.

Таблица 8

Model

Нестандартизир.коэф-ты

Стандартиз. коэф-ты

Стат-ка коллинеар-ти

B

Std. Error

Beta

Tolerance

VIF

1

(Constant)

-15,320

17,190

x1

14,215

5,930

0,132

0,950

1,053

x2

-7,614

7,033

-0,158

0,135

7,412

x3

1,507

0,409

0,836

0,056

17,917

x4

0,714

0,720

0,249

0,045

22,036

x5

-0,087

0,786

-0,006

0,892

1,122

x6

-2,403

1,657

-0,130

0,355

2,814

Модель множественной линейной регрессии:

У= -15,3+14,2х1-7,6х2+1,5х3+0,7х4-0,087х5-2,4х6

Таблица 9

у

x1

x3

x5

x6

Корреляция Пирсона

у

1,000

0,203

0,872

0,021

0,486

x1

0,203

1,000

0,069

-0,194

-0,023

x3

0,872

0,069

1,000

0,084

0,633

x5

0,021

-0,194

0,084

1,000

0,150

x6

0,486

-0,023

0,633

0,150

1,000

Таблица 10

Model

Нестандартиз.коэф-ты

Стат-ка коллинеарн-ти

B

Std. Error

Tolerance

VIF

1

(Constant)

-23,026

14,680

x1

14,418

5,899

0,951

1,051

x3

1,664

0,125

0,593

1,687

x5

-0,219

0,762

0,941

1,063

x6

-1,715

1,283

0,588

1,701

Модель множественной линейной регрессии :

У= -23,026+14,4х1+1,66х3-0,21х5-1,71х6

На формирование цены квартиры, значимо влияет фактор x3-общая площадь квартиры, также фактором, оказывающим сильное влияние на формирование цены является фактор x6 площадь кухни.

Таблица 11

Parameter Estimates

Parameter

Estimate

Std. Error

95% Confidence Interval

Lower Bound

Upper Bound

a0

-712,105

54,372

-837,486

-586,724

a1

2,391

0,151

2,042

2,740

a2

-0,002

0,000

-0,002

-0,001

Y=-712,105+2,391x1-0,002x^2

Рисунок 5

По мере увеличения премиальных выплат работникам увеличивается прибыль от реализации, достигается максимальный пик увеличения, после чего при увеличении выплат происходит спад прибыли. Максимальная точка (710;155).

Рисунок 6

По мере увеличения премиальных выплат увеличиваются предсказуемые значения. После достижения максимальной точки происходит спад.

4. Дисперсионный анализ

По результатам испытаний требуется выяснить: а) значимы ли различия в средней урожайности различных сортов пшеницы, независимо от типа удобрения. б) значимо ли влияние типа применяемого удобрения на урожайность, независимо от сорта.

Выдвинем две нулевые гипотезы:

1) различия в средней урожайности пшеницы, вызванные влиянием типа удобрения (фактор А), выраженные не более, чем различия, обусловленные случайными причинами.

2) различия в средней урожайности пшеницы, вызванные влиянием сорта (фактор Б), выраженные не более, чем различия, обусловленные случайными причинами.

Таблица 12

Source

Type III Sum of Squares

df

Mean Square

F

Sig.

Partial Eta Squared

Corrected Model

2474,450a

9

274,939

6,162

0,000

0,735

16008,300

1

16008,300

358,780

0,000

0,947

Удобрения

1875,500

5

375,100

8,407

0,000

0,678

Сорт

598,950

4

149,738

3,356

0,030

0,402

Error

892,375

20

44,619

Total

19375,125

30

Corrected Total

3366,825

29

a. R Squared = ,735 (Adjusted R Squared = ,616)

Таблица оценки эффектов межгрупповых факторов содержит результаты проверки основных гипотез дисперсионного анализа: 1) переменная удобрения оказывает статистическое достоверное влияние на распределение зависимых переменных урожайности, поскольку F=8,4(табл.F-критерия) и при расчетном значении 0,00; 2) переменная сорт оказывает статистически значимое влияние на урожайность, поскольку F-табличное=3,35, расчетная = 0,03. В результате и сорт, и удобрения оказывают достоверное влияние на переменную (урожайность).

Таблица 13 - Многократные сравнения

Зависимая переменная: Урожайность

(I) Удобрения

(J) Удобрения

Mean Difference (I-J)

Std. Error

Sig.

95% Confidence Interval

Lower Bound

Upper Bound

Удобрения А

Удобрения Б

1,1000

4,22463

1,000

-14,4536

16,6536

Удобрения В

-2,2000

4,22463

,998

-17,7536

13,3536

Удобрения Г

-6,0500

4,22463

,836

-21,6036

9,5036

Удобрения Д

-18,1500*

4,22463

,016

-33,7036

-2,5964

Удобрения Е

-17,6000*

4,22463

,020

-33,1536

-2,0464

Удобрения Б

Удобрения А

-1,1000

4,22463

1,000

-16,6536

14,4536

Удобрения В

-3,3000

4,22463

,986

-18,8536

12,2536

Удобрения Г

-7,1500

4,22463

,720

-22,7036

8,4036

Удобрения Д

-19,2500*

4,22463

,009

-34,8036

-3,6964

Удобрения Е

-18,7000*

4,22463

,012

-34,2536

-3,1464

Удобрения В

Удобрения А

2,2000

4,22463

,998

-13,3536

17,7536

Удобрения Б

3,3000

4,22463

,986

-12,2536

18,8536

Удобрения Г

-3,8500

4,22463

,972

-19,4036

11,7036

Удобрения Д

-15,9500*

4,22463

,042

-31,5036

-,3964

Удобрения Е

-15,4000

4,22463

,053

-30,9536

,1536

Удобрения Г

Удобрения А

6,0500

4,22463

,836

-9,5036

21,6036

Удобрения Б

7,1500

4,22463

,720

-8,4036

22,7036

Удобрения В

3,8500

4,22463

,972

-11,7036

19,4036

Удобрения Д

-12,1000

4,22463

,195

-27,6536

3,4536

Удобрения Е

-11,5500

4,22463

,236

-27,1036

4,0036

Удобрения Д

Удобрения А

18,1500*

4,22463

,016

2,5964

33,7036

Удобрения Б

19,2500*

4,22463

,009

3,6964

34,8036

Удобрения В

15,9500*

4,22463

,042

,3964

31,5036

Удобрения Г

12,1000

4,22463

,195

-3,4536

27,6536

Удобрения Е

,5500

4,22463

1,000

-15,0036

16,1036

Удобрения Е

Удобрения А

17,6000*

4,22463

,020

2,0464

33,1536

Удобрения Б

18,7000*

4,22463

,012

3,1464

34,2536

Удобрения В

15,4000

4,22463

,053

-,1536

30,9536

Удобрения Г

11,5500

4,22463

,236

-4,0036

27,1036

Удобрения Д

-,5500

4,22463

1,000

-16,1036

15,0036

В таблице 14 представлены результаты расчета теста Шеффе. По результатам теста можно увидеть, что удобрения Е и Д наиболее значимы по своему воздействию на урожайность пшеницы. Чем больше значение теста, тем меньше вклад, той или иной комбинации.

Таблица 14 - Урожайность

Удобрения

N

Subset

1

2

3

Удобрения Б

5

14,8500

Удобрения А

5

15,9500

Удобрения В

5

18,1500

18,1500

Удобрения Г

5

22,0000

22,0000

22,0000

Удобрения Е

5

33,5500

33,5500

Удобрения Д

5

34,1000

Sig.

,720

,053

,195

Выделяются три объекта и 3 группы: 1 группа (наименьшее воздействие), 2 группа (среднее воздействие), 3 группа (те удобрения, которые оказывают наибольшее воздействие).

Группа удобрений Г Е и Д оказывают наибольшее влияние на урожайность, а группа Б А В Г оказывают наименьшее влияние на урожайность.

Таблица 15 - Урожайность

Сорт

N

Subset

1

2

Сорт 4

6

16,5000

Сорт 2

6

22,0000

22,0000

Сорт 5

6

22,0000

22,0000

Сорт 1

6

24,7500

24,7500

Сорт 3

6

30,2500

Sig.

,365

,365

Выделяются 2 группы: 1 группа (оказывает наименьшее воздействие), 2 группа (оказывает наибольшее воздействие). Сорт оказывает меньше влияния, чем удобрения(внесение гербицидов). И сорта и удобрения одновременно могут входить в одну или несколько групп.

Рис. 7

Из данного графика видно, что наибольший эффект на среднюю урожайность оказывает влияние удобрения Д и Е, наименьший эффект удобрение А и Б. Если рассмотреть влияние сорта, можно заметить, что наиболее урожайным является сорт 3, наименее сорт 4. Поскольку сорта 2 и 5 имеют одинаковые средние значения, то соответственно две линии слились в одну.

5. Дискриминантный анализ

Имеются данные по 2-м группам сельскохозяйственных предприятий отраслей:

x1 - среднегодовая стоимость основных производственных фондов;

x2 - среднесписочная численность персонала;

x3 - балансовая прибыль.

Требуется провести классификацию (дискриминацию) 3-х новых предприятий.

Таблица 16. Групповые статистики

Группы

Среднее

Стд.отклонение

Кол-во валидных (искл. целиком)

Невзвешенные

Взвешенные

1

Стоимость ОПФ

168,90525

36,949497

4

4,000

Персонал

14,04775

2,743931

4

4,000

Прибыль

18,33250

5,709310

4

4,000

2

Стоимость ОПФ

45,79060

13,501905

5

5,000

Персонал

4,77800

,681709

5

5,000

Прибыль

10,75800

2,681023

5

5,000

Итого

Стоимость ОПФ

100,50822

69,379127

9

9,000

Персонал

8,89789

5,188907

9

9,000

Прибыль

14,12444

5,635112

9

9,000

Приводится среднее значение, стандартное отклонение, и количество наблюдений для всех переменных, по средним значениям заметен более высокий уровень переменных в первой группе предприятий, чем во второй.

Таблица 17. Критерий равенства групповых средних

Лямбда Уилкса

F

ст.св1

ст.св2

Знч.

Стоимость ОПФ

,125

48,866

1

7

,000

Персонал

,113

54,677

1

7

,000

Прибыль

,498

7,053

1

7

,033

Результаты теста на значимость между переменными, находящимися в разных группах приведены в таблице, критерии равенства групповых средних, с помощью этих данных выясняется существенность различий (т.е. присутствует ли разделяющие способности) в данном примере получены весьма значимые различия между группами.

Каждый из факторов дискриминирует данную совокупность, так как они меньше 0,5.Все 3 фактора используются, и оказывают влияние на дискриминацию.

Таблица 18. Объединенные внутригрупповые матрицы

Стоимость ОПФ

Персонал

Прибыль

Корреляция

Стоимость ОПФ

1,000

,552

,570

Персонал

,552

1,000

,733

Прибыль

,570

,733

1,000

Данная таблица используется для анализа взаимосвязи между переменными. Так как коэффициент корреляции равен 0,57 то связь существует.

Таблица 19. Лямбда Уилкса

Проверка функции(й)

Лямбда Уилкса

Хи-квадрат

ст.св.

Знч.

1

,069

14,745

3

,002

По критерию проверяется значимость дискриминантной функции, поскольку функция значима на уровне 0,002, то имеет смысл использовать ее для дальнейшей классификации.

Таблица 20. Нормированные коэффициенты канонической дискриминантной функции

Функция

1

Стоимость ОПФ

629

Персонал

1,026

Прибыль

839

Стандартизированные коэффициенты позволяют непосредственно сравнить вклад каждой независимой переменной в различие 2-х групп.

Наибольший вклад вносит персонал, затем стоимость и прибыль.

Таблица 21. Структурная матрица

Функция

1

Персонал

758

Стоимость ОПФ

716

Прибыль

272

Объединенные внутригрупповые корреляции между дискриминантными переменными и нормированными каноническими дискриминантными функциями.

Переменные упорядочены по абсолютной величине корреляций внутри функции.

Главным фактором является персонал, затем ОПФ и прибыль, в подтверждении прошлой таблицы

Таблица 22. Поточечные статистики

Номер наблюдения

Фактическая группа

Наивероятнейшая группа

Вторая вероятнейшая группа

Дискриминантные баллы

Квадрат расстояния Махалонобиса до центра

Группа

P(G=g | D=d)

Квадрат расстояния Махалонобиса до центра

Функция 1

Предсказанная группа

P(D>d | G=g)

P(G=g | D=d)

Исходные

1

1

1

36

1

1,000

4,377

2

0

74,597

5,728

2

1

1

576

1

1,000

,314

2

0

35,819

3,076

3

1

1

415

1

1,000

,663

2

0

32,836

2,821

4

1

1

473

1

1,000

,515

2

0

33,956

2,918

5

2

2

809

1

1,000

,058

1

0

46,052

-3,150

6

2

2

357

1

1,000

,850

1

0

31,619

-1,987

7

2

2

710

1

1,000

,138

1

0

47,840

-3,281

8

2

2

986

1

1,000

,000

1

0

43,070

-2,927

9

2

2

771

1

1,000

,084

1

0

46,724

-3,199

10

несгруппированные

2

014

1

,995

6,074

1

5

16,648

-,444

11

несгруппированные

1

004

1

,926

8,327

2

74

13,389

,750

12

несгруппированные

1

863

1

1,000

,030

2

0

40,599

3,463

В данной таблице мы видим процентную вероятность отношения к той или иной группе. Так из таблицы мы видим, что 10 номер с 99% в 2 группе, 11номер с 92 % в 1групе и 12 номер с 100% в 1группе.

Таблица 23. Коэффициенты канонической дискриминантрой функции

Функция

1

Стоимость ОПФ

24

Персонал

549

Прибыль

197

(Константа)

4,507

D(x)=-4,507+0,024х1+0,549х2-0,197х3

Кредитный отдел коммерческого банка провел выборочное обследование заемщиков. Общий размер выборки составил 30 наблюдений. По каждому заемщику была собрана информация по следующим показаниям: х1-брал ли заемщик кредит в банке ранее,

х2 - среднемесячный доход семьи заемщика,

х3 - срок погашения кредита,

х4 - размер выданного кредита,

х5 - состав семьи заемщика,

х6 - возраст заемщика,

y - вероятность своевременного погашения выданного кредита (Н -низкая, С - средняя, В - высокая).

Таблица 24 - Результаты выборочного обследования заемщиков банка

Брался ли кредит ранее (1-да, 2-нет)

Среднемесячный доход семьи заемщика, тыс. руб.

Период погашения кредита, лет.

Размер кредита, тыс. руб.

Состав семьи заемщика, человек

Возраст заемщика, лет

Вероятность погашения кредита

1

1

25,20

5

180,0

3

43

С2

2

1

35,25

6

270,0

4

51

В3

3

1

31,50

7

150,0

6

42

В3

4

1

24,35

7

170,0

5

56

Н1

5

1

26,35

6

120,0

4

45

В3

6

1

37,50

8

370,0

5

48

В3

7

1

25,10

5

130,0

3

52

С2

8

1

28,50

2

180,0

6

51

С2

9

1

32,00

7

250,0

4

53

В3

10

1

34,05

7

160,0

5

45

С2

11

1

36,70

6

170,0

5

44

В3

12

1

35,90

5

200,0

4

41

В3

13

1

28,15

3

180,0

6

54

С2

14

1

24,65

4

120,0

3

56

В3

15

1

31,00

5

160,0

2

48

В3

16

2

16,05

5

140,0

3

58

Н1

17

2

18,10

3

130,0

2

55

Н1

18

2

21,65

2

150,0

2

37

С2

19

2

25,20

5

220,0

4

33

С2

20

2

22,05

6

360,0

3

42

С2

21

2

19,15

3

160,0

2

45

Н1

22

2

27,50

1

120,0

2

57

С2

23

2

23,05

3

150,0

3

51

Н1

24

2

17,58

10

400,0

5

44

Н1

25

2

18,65

2

90,0

4

54

Н1

26

2

20,90

5

310,0

3

36

С2

27

2

28,50

8

480,0

2

36

В3

28

2

16,70

6

280,0

2

26

Н1

29

2

18,35

3

220,0

3

28

Н1

30

2

20,65

3

250,0

2

42

Н1

Таблица 25 - Групповые статистики

Veroyatnost

Mean

Std. Deviation

Valid N (listwise)

Unweighted

Weighted

1,00

istoria

1,9000

,31623

10

10,000

doxod

19,2530

2,67843

10

10,000

srok

4,5000

2,50555

10

10,000

kredit

199,0000

91,22012

10

10,000

semya

3,1000

1,19722

10

10,000

vozrasn

45,9000

11,34754

10

10,000

2,00

istoria

1,5000

,52705

10

10,000

doxod

25,6300

4,03844

10

10,000

srok

4,1000

1,96921

10

10,000

kredit

199,0000

77,95298

10

10,000

semya

3,7000

1,49443

10

10,000

vozrasn

45,0000

8,24621

10

10,000

3,00

istoria

1,1000

,31623

10

10,000

doxod

31,9350

4,44116

10

10,000

srok

6,2000

1,31656

10

10,000

kredit

229,0000

117,42137

10

10,000

semya

3,9000

1,28668

10

10,000

vozrasn

46,4000

6,02218

10

10,000

Total

istoria

1,5000

,50855

30

30,000

doxod

25,6060

6,41398

30

30,000

srok

4,9333

2,13240

30

30,000

kredit

209,0000

94,62631

30

30,000

semya

3,5667

1,33089

30

30,000

vozrasn

45,7667

8,52454

30

30,000

В таблице групповые статистики приводятся средние значения, стандартные отклонения и количество наблюдений для всех переменных, по средним значениям заметен более высокий уровень переменных в первой группе предприятий, чем во второй. Результаты теста на значимости различий между переменных находящихся в разных группах приведены в таблице критерия равенства групповых средних. С помощью этих данных выявляется существенность различий. В данном примере весьма значимые различия между группами.

Таблица 26. Критерий равенства групповых средних

Wilks' Lambda

F

df1

df2

Sig.

istoria

,573

10,047

2

27

,001

doxod

,326

27,918

2

27

,000

srok

,811

3,137

2

27

,060

kredit

,977

,319

2

27

,729

semya

,933

,977

2

27

,389

vozrasn

,995

,065

2

27

,937

Наиболее значимыми переменными являются история и доход. Если значение больше 0,005, то данную переменную можно выбраковать и она является не дискриминантной.

Таблица 27. Объединенные внутригрупповые матрицы

istoria

doxod

srok

kredit

semya

vozrasn

Correlation

istoria

1,000

-,474

-,103

,426

-,578

-,426

doxod

-,474

1,000

,069

-,065

,503

,203

srok

-,103

,069

1,000

,616

,321

-,233

kredit

,426

-,065

,616

1,000

-,047

-,465

semya

-,578

,503

,321

-,047

1,000

,213

vozrasn

-,426

,203

-,233

-,465

,213

1,000

Используются для анализа взаимосвязи между отдельными переменными. Существенная связь между сроком и кредитом, так как коэффициент равен 0,616. По критерию Лямбда Уилкса проверяется значимость дискриминантной функции. Он позволяет определить, значимо ли различаются между собой средние значения функции. Дискриминантная функция значима на уровне 0,000, поэтому имеет смысл использовать ее в дальнейшем.

Таблица 28. Лямбда Уилкса

Test of Function(s)

Wilks' Lambda

Chi-square

Df

Sig.

1 through 2

,208

38,460

12

0

2

,830

4,561

5

472

Таблица 29. Нормированные коэффициенты канонической дискриминантной функции

Function

1

2

istoria

559

479

doxod

926

065

srok

172

1,415

kredit

172

745

semya

658

535

vozrasn

150

428

Самый значимый фактор для дискриминантной функции - это семья (вносит самый большой вклад = 0,658), а второй фактор - срок (вносит наибольший фактор = 1,415).

Таблица 30. Canonical Discriminant Function Coefficients

Function

1

2

istoria

1,401

1,199

doxod

-,244

,017

srok

-,086

,711

kredit

-,002

-,008

semya

,494

-,401

vozrasn

,017

,049

(Constant)

2,401

-4,926

Unstandardized coefficients

Данная таблица отражает уравнение дискриминантной функции. D1 (x) = 2,401 + 1,401х2 - 2,44х2 - 0,086х3 - 0,002х4 +0,494х5 + 0,017х6 D2 (x) = -4,926 + 1,199х2 - 0,017х2 - 0,711х3 - 0,008х4 -0,401х5 + 0,49х6

Дискриминантная функция значима на уровне 0,000, поэтому имеет смысл использовать ее в дальнейшем.

6. Кластерный анализ

1. Для начала проведем предварительную классификацию, которая позволит определить наиболее целесообразное количество кластеров.

Таблица 31. Agglomeration Schedule (График, список скопления)

Stage

Cluster Combined

Coefficients

Stage Cluster First Appears

Next Stage

Cluster 1

Cluster 2

Cluster 1

Cluster 2

1

9

12

43,430

0

0

10

2

1

4

62,260

0

0

3

3

1

16

87,850

2

0

8

4

5

13

88,850

0

0

6

5

8

11

89,440

0

0

16

6

5

6

132,115

4

0

11

7

3

15

139,910

0

0

9

8

1

14

156,987

3

0

11

9

3

7

168,525

7

0

12

10

9

17

266,345

1

0

13

11

1

5

298,305

8

6

12

12

1

3

386,649

11

9

14

13

9

10

460,167

10

0

15

14

1

2

523,984

12

0

15

15

1

9

1012,915

14

13

16

16

1

8

1265,510

15

5

0

Анализируя таблицу, мы видим скачкообразное изменение данных, начиная с 14 строки. Всего 17 строк. В нашем случае мы выделяем 3 кластера (17-14=3).

Рисунок 8

2. Теперь организуем для каждого наблюдения вывод информации о принадлежности кластеров.

Таблица 32. Cluster Membership (Кол-во в группе)

Case

3 Clusters

1:Белгород

1

2:Брянская

1

3:Владимир

1

4:Воронежс

1

5:Ивановск

1

6:Калужска

1

7:Костромс

1

8:Курская

2

9:Липецкая

3

10:Московск

3

11:Орловска

2

12:Рязанска

3

13:Смоленск

1

14:Тамбовск

1

15:Тверская

1

16:Тульская

1

17:Ярославс

3

Анализируя таблицу принадлежность кластеров, можно сделать вывод, что 11 областей относятся к первому кластеру, 2 области относятся ко второму кластеру, 4 области относятся к третьему кластеру.

Пока неясно, что означает полученные три кластера. Разобраться в этом помогут кластерные профили.

CLU3_1-принадлежность к тому или иному кластеру.

3. Проведем сравнение средних Report (Отчет)

Мы видим, что в первый кластер попали области, имеющие примерно одинаковый уровень цен по всем 5 секторам. Второй кластер отличается высоким индексом цен на реализованную с/х продукцию. Предприятия из 3 кластера характеризуются высоким индексом тарифа на грузовые перевозки.

Таблица 33

Average Linkage (Between Groups)

Область потребительских цен

Индекс цен производителей промышленной продукции

Индекс цен производителей на реализованную с.х. продукцию

Индекс цен производителей в строительстве

Индекс тарифов на грузовые перевозки

область

1

Mean

113,3909

117,5636

114,8364

115,2364

110,0000

N

11

11

11

11

11

11

Std. Deviation

1,76434

6,00871

8,22658

3,50550

6,98570

2

Mean

114,2000

115,5000

146,0000

112,7000

115,0000

N

2

2

2

2

2

2

Std. Deviation

2,82843

,84853

5,65685

1,41421

1,41421

3

Mean

112,9750

118,6000

116,6250

110,7000

136,7000

N

4

4

4

4

4

4

Std. Deviation

1,49081

7,59737

8,46891

3,88244

4,03898

Total

Mean

113,3882

117,5647

118,9235

113,8706

116,8706

N

17

17

17

17

17

17

Std. Deviation

1,72840

5,85096

12,73551

3,82079

12,84040

7. Линейное программирование

Задание:

Х1 - затраты на посевной материалы

Х2 - затраты на обработку почвы

Х3 - затраты на применение минер. Удобрений

Х4 - затраты на применение гербицидов

Х5 - фактор сезонности

Х6 - предшественник

Линейное программирование - наука об исследованиях экстремальных значений линейной функции.

1) Нахождение целевых функций

Засушливый, вторая пшеница

Урожайность:

У=х1-0,003х2+0,001х3+0,001х4

Рентабельность:

У=-0,017х1-0,037х2-0,01х3-0,04х4

Засушливый, механический пар

Урожайность:

У=-00,1х1-0,007х2-х3+0,003х4

Рентабельность:

У=-0,019х1-0,066х2-0,013х3+0,006х4

Засушливый, первая пшеница

Урожайность:

У=х1-0,002х2+х3+0,001х4

Рентабельность:

У=-0,011х1-0,031х2-0,014х3-0,006х4

Засушливый, химический пар

Урожайность:

У=-0,001х1-0,002х2+0,001х3

Рентабельность:

У=-0,028х1-0,039х2-0,012х3

Обычный, вторая пшеница

Урожайность:

У=-0,02х1+0,006х2+0,001х3+0,004х4

Рентабельность:

У=-0,036х1+0,029х2-0,01х3+0,015х4

Обычный, первая пшеница

Урожайность:

У=х1+0,005х2+0,001х3+0,004х4

Рентабельность:

У=-0,019х1+0,014х2-0,014х3+0,011х4

Обычный, мех пар

Урожайность:

У=0,003х1+0,002х2+0,001х2+0,005х4

Рентабельность:

У=х1-0,006х2-0,006х3+0,020х4

Обычный, пар - химический

Урожайность:

У=-0,006х1+0,002х2+0,003х3

Рентабельность:

У=-0,062х1-0,012х2-0,003х3

Увлажненный, мех пар

Урожайность:

У=-0,005х1+х2+0,003х3+0,006х4

Рентабельность:

У=-0,043х1-0,016х2+0,002х3+0,022х4

Увлажненный, первая пшеница

Урожайность:

У=-0,004х1+х2+0,003х3+0,006х4

Рентабельность:

У=-0,055х1-0,022х2-0,003х3+0,021х4

Увлажненный, вторая пшеница

Урожайность:

У=-0,003х1+х2+0,003х3+0,005х4

Рентабельность:

У=-0,045х1-0,023х2-0,02х3+0,017х4

Увлажненный, хим. пар

Урожайность:

У=-0,010х1-0,006х2+0,003х3

Рентабельность:

У=-0,085х1-0,063х2+0,002х3

Засушливый период

Программа предполагает для того чтобы получить макс рентабельность, необходимо сократить затраты на максимально на фактор х1, однако существует определенная технология поэтому оставляем значения согласно технологоии-250руб. Хотя для максимизации рентабельности, по идеи программа предполагает сократить полностью затраты. Распределение затрат происходит между факторами х2 и х3, и программа распределяет большинство ресурсов на фактор х2=1325 руб. Фактор х4 программа считает незначимым согласно технологии в засушливом периоде, поэтому мы можем отказать от обработки гербицидами.

Обычный период

Программа предлагает израсходовать 300 руб. на фактор х1 согласно технологии. Для максимизации рентабельности программа распределяет затраты между факторами х2, х3 и х4, и большинство ресурсов приходится на фактор х2=786 руб.

Увлажненный период

На фактор х2 программа считает наименее значимым согласно технологии в увлажненном периоде и мы можем сократить затраты на него до 450 руб. Самые значимые затраты на х3.

8. Параметрические и непараметрические критерии

1) Критерий Манна-Уитни

Таблица 34

пол

N

Mean Rank

Sum of Ranks

отметка2

ЖЕН

61

56,21

3429,00

МУЖ

39

41,56

1621,00

Total

100

Средний ранг для девушек равен 56,21 , для юношей - 41,56. Это означает, что у девушек успеваемость выше, чем у юношей

Таблица 35. Test Statisticsa

отметка2

Mann-Whitney U

841,000

Wilcoxon W

1621,000

Z

-2,469

Asymp. Sig. (2-tailed)

,014

a. Grouping Variable: пол

Две совокупности статистически достоверны, так как коэффициент равен 0,014, который не превышает коэффициент 0,05. Если бы он превышал наш коэффициент, то появились бы сомнения. Сравнение 2х связанных выборок а) Критерий знаков с помощью этого критерия сравним результаты учащихся по второму тесту и четвертому.

Таблица 36. Frequencies

N

осведомленность - числовые ряды

Negative Differencesa

39

Positive Differencesb

57

Tiesc

4

Total

100

a. осведомленность < числовые ряды

b. осведомленность > числовые ряды

c. осведомленность = числовые ряды

Полученные результаты говорят о том, что в 39 случаях значение переменной тест 2 оказались меньшими, чем значения переменной тест 4, в 57 случаях значения переменной тест 2 превысили значения переменной тест 4 и 4 раза было установлено равенство.

Таблица 37. Test Statisticsa

осведомленность - числовые ряды

Z

-1,735

Asymp. Sig. (2-tailed)

,083

a. Sign Test

Тест является недостоверным, так как значение больше коэффициента 0,05. Скорее всего, этот тест не подойдет для дальнейших исследований. б) Критерий Уилкоксона Недостатком критерия знаков является то, что он никак не учитывает величину разницы двух значений

Таблица 38. Ranks

N

Mean Rank

Sum of Ranks

осведомленность - числовые ряды

Negative Ranks

39a

42,26

1648,00

Positive Ranks

57b

52,77

3008,00

Ties

4c

Total

100

a. осведомленность < числовые ряды

b. осведомленность > числовые ряды

c. осведомленность = числовые ряды

Таблица 39. Test Statisticsa

осведомленность - числовые ряды

Z

-2,493b

Asymp. Sig. (2-tailed)

,013

a. Wilcoxon Signed Ranks Test

b. Based on negative ranks.

Тест является недостоверным, так как значение не превышает коэффициента 0,05. Скорее всего, этот тест Уилсона подходит для дальнейших исследований.

Размещено на Allbest.ru


Подобные документы

  • Виды и формы связей между явлениями. Методы изучения взаимосвязи экономических явлений. Статистические методы изучения взаимосвязи. Метод аналитических группировок. Дисперсионный и корреляционно-регрессионный анализ. Непараметрические методы оценки связи.

    курсовая работа [235,9 K], добавлен 10.12.2008

  • Предмет, метод и организация статистики - науки, изучающей количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной. Причинность, регрессия, корреляция, как основные статистические методы выявления взаимосвязи.

    учебное пособие [3,8 M], добавлен 05.02.2011

  • Применение различных способов представления и обработки статистических данных. Пространственные статистические выборки. Парная регрессия и корреляция. Временные ряды. Построение тренда. Практические примеры и методика их решения, формулы и их значение.

    курс лекций [6,9 M], добавлен 26.02.2009

  • Статистика розничного и оптового товарооборота: показательная регрессия, построение регрессии. Дисперсионный анализ для линейной регрессии, изучение ее качества. Доверительные интервалы для оцененных параметров и критерий Фишера значимости регрессии.

    контрольная работа [300,4 K], добавлен 21.08.2008

  • Парная регрессия и корреляция в эконометрических исследованиях, методика и основные этапы ее построения, анализ полученных результатов и их интерпретация. Проверка структурной формы модели на идентификацию, исходя из заданной гипотетической модели.

    контрольная работа [33,8 K], добавлен 19.03.2012

  • Анализ гистограмм и основных показателей. Задачи на нормальное распределение. Типы анализа и принципы их проведения: кластерный, корреляционный, дисперсионный и регрессионный. Ненаправленная гипотеза о зависимости золотой медали и даты основания школы.

    курсовая работа [1,9 M], добавлен 20.09.2014

  • Парная линейная регрессия. Полный регрессионный анализ. Коэффициент корреляции и теснота линейной связи. Стандартная ошибка регрессии. Значимость уравнения регрессии. Расположение доверительных интервалов. Расчет параметров множественной регрессии.

    контрольная работа [932,7 K], добавлен 09.06.2012

  • Дисперсионный анализ статистической совокупности на однородность. Определение тесноты взаимосвязи показателей признака доход на душу населения с импортом в РФ из стран СНГ и дальнего зарубежья. Использование коэффициентов вариации и ранговой корреляции.

    курсовая работа [42,9 K], добавлен 26.11.2014

  • Понятие и основные этапы реализации дисперсионного анализа как статистического метода, позволяющего анализировать влияние различных факторов на исследуемую переменную. История его разработки и использование. Статистика Фишера и принципы F-распределения.

    презентация [2,1 M], добавлен 23.02.2017

  • Расчет корреляции между экономическими показателями. Построение линейной и не линейной множественной регрессии. Проверка на гетероскедастичность моделей с использованием теста Бреуша-Пагана. Корреляция между наблюдаемыми экономическими показателями.

    курсовая работа [82,2 K], добавлен 23.03.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.