Изучение взаимосвязей социально-экономических явлений и процессов на примере рынка автомобилей в Москве и Московской области за 2014 год (марка автомобиля Suzuki Liana)

Выборочное наблюдение 50 предлагаемых на продажу автомобилей Suzuki Liana на сайте сайт auto.ru. Выявления зависимости признака Y (цена) от признаков-факторов X (время эксплуатации и пробег). Распределение Y с помощью интервального вариационного ряда.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 17.12.2015
Размер файла 368,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ МОСКОВСКОЙ ОБЛАСТИ

Государственное образовательное учреждение высшего профессионального образования

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ОБЛАСТНОЙ УНИВЕРСИТЕТ (МГОУ)

Кафедра «Прикладная математика и информатика»

КУРСОВАЯ РАБОТА

по дисциплине «Теория статистики»

тема: Изучение взаимосвязей социально-экономических явлений и процессов на примере рынка автомобилей в Москве и Московской области за 2014 год (марка автомобиля Suzuki Liana)

Научный руководитель:

старший преподаватель Жигирева Е.Г.

(ученая степень, ученое звание, фамилия, инициалы)

Москва

2014

Оглавление

Введение

1. Исходные данные

2. Аналитические группировки

3. Многомерная группировка

4. Интервальный вариационный ряд

5. Критерий Пирсона

6. Определение доверительного интервала и оптимального объема выборки

7. Корреляционно-регрессионный анализ

Заключение

Список литературы

Введение

наблюдение вариационный ряд

В наше время проведение выборочных статистических наблюдений является особо актуальным, поскольку всё больше и больше факторов влияют на стоимость тех или иных товаров и услуг.

Цель курсовой работы получить представление об изучаемом объекте, установить взаимосвязи и зависимости различных сторон изучаемого явления, определить влияние факторов на результативный признак. В нашем случае мы будем определять зависимость цены машины Suzuki Liana от времени её эксплуатации и пробега.

Задачи курсовой работы:

1. Используя сайт auto.ru, провести выборочное наблюдение 50 предлагаемых на продажу автомобилей марки Suzuki Liana.

2. Для выявления зависимости результативного признака Y (цена) от признаков-факторов X (время эксплуатации) и X (пробег) провести аналитические группировки автомобилей.

3. На основании данных статистического наблюдения, применяя метод многомерной средней, выделить три группы автомобилей.

4. Исследовать статистическое распределение Y с помощью интервального вариационного ряда.

· построить интервальный ряд;

· построить графическое изображение (гистограмму и кумуляту);

· вычислить показатели центра (среднюю, моду и медиану), вариации (дисперсию, среднее квадратическое отклонение и коэффициент вариации) и формы (коэффициенты асимметрии и эксцесса)

5. Провести проверку с помощью критерия согласия Пирсона, соответствие эмпирических распределений нормальному распределению на уровне значимости .

6. На основании данных выборочного наблюдения определить доверительный интервал, в котором заключена средняя цена продаваемых машин, гарантируя результат с вероятностью 0,9 и 0,95.

7. На основании данных выборочного наблюдения:

· составить уравнение множественной регрессии результативного признака , обосновав систему факторов, включённых в модель;

· определить множественный коэффициент корреляции и частные коэффициенты корреляции;

· сопоставить роль признаков-факторов и в формировании результативного признака , вычислив коэффициенты эластичности.

Объектом исследования является выборка 50 машин марки Suzuki Liana.

1. Исходные данные

С помощью сайта Авто.ру http://moscow.auto.ru/cars/suzuki/liana/all/ Продажа Suzuki Liana. Дата обращения к странице: 3 октября 2014 года. составим сводную таблицу автомобилей, в которую будут включены данные по 50 автомобилям Suzuki Liana: цена, время эксплуатации и пробег.

Табл. 1.1

№ автомобиля

Цена, тыс. рублей

(Y)

Время эксплуатации, лет

(Х1)

Пробег, тыс. км

(Х2)

1

165

10

170

2

170

11

124

3

195

10

189

4

195

7

87

5

203

8

150

6

205

11

124

7

210

11

210

8

216

9

93

9

218

8

148

10

220

10

112

11

225

10

95

12

230

10

101

13

230

9

202

14

235

8

91

15

237

10

117

16

239

7

101

17

245

9

144

18

248

10

138

19

250

8

160

20

255

7

90

21

260

9

117

22

265

7

93

23

265

9

181

24

267

8

104

25

267

8

71

26

270

9

138

27

270

10

119

28

270

7

98

29

275

7

111

30

278

7

112

31

280

8

93

32

285

8

108

33

292

6

84

34

295

6

80

35

296

6

81

36

300

9

115

37

305

9

85

38

310

7

96

39

315

7

115

40

317

6

74

41

320

7

78

42

328

6

128

43

340

8

83

44

345

7

73

45

347

7

112

46

350

7

150

47

350

8

134

48

360

7

173

49

364

7

70

50

389

6

76

Итого

13566

406

5798

2. Аналитические группировки

С целью выявления зависимости результативного признака Y от признаков факторов X1 и X2 проведём аналитические группировки продаваемых автомобилей по времени эксплуатации и пробегу.

Аналитическая группировка - группировка, выявляющая взаимосвязи между изучаемыми явлениями и их признаками http://studopedia.ru/3_187786_statisticheskaya-svodka-i-gruppirovka.html Студопедия. Студенческая энциклопедия. Статистическая сводка и группировка. Дата обращения к странице - 10 октября 2014 года. . Аналитические группировки используются для исследования взаимных связей, существующих между показателями, характеризующими рассматриваемую совокупность данных.

Количество интервалов группировки вычисляется по формуле Стерджесса:

m = 1 + 3,322lgn (2.1)

m = 1 + 3,322lg50 = 6,64, где n - объём выборки.

Округлим 6,64 до целого, получим число интервалов, равное 7.

Ширина интервалов вычисляется по формуле:

h = (xmax - xmin)/m, (2.2)

где m - количество интервалов

h1 = (11 - 6)/7 = 5/7 - сократим количество интервалов до 6

h2 = (210 - 70)/7 = 20

Табл. 2.1

Аналитическая группировка по времени эксплуатации автомобиля

Группы автомобилей по времени эксплуатации

Средняя цена, тыс. руб.

6

319,50

7

299,20

8

269,50

9

261,38

10

223,75

11

195,00

Итого

По результатам данной аналитической группировки можно сделать вывод: цена автомобиля снижается с увеличением времени его эксплуатации.

Табл. 2.2

Аналитическая группировка по пробегу автомобиля

Группы автомобилей по пробегу

Средняя цена, тыс. руб.

70 - 90

306,15

90 - 110

256,55

110 - 130

268,08

130 - 150

269,14

150 - 170

207,50

170 - 190

273,33

190 - 210

220,00

Итого

Из результатов аналитической группировки видно: в целом цена автомобиля снижается при увеличении его пробега, но данное влияние не столь однозначно, как в случае влияния времени эксплуатации.

3. Многомерная группировка

На основании данных статистического наблюдения, применяя метод многомерной средней, выделим три типа автомобилей.

В случае сложной группировки комбинация двух признаков ещё позволяет сохранить обозримость статистической таблицы, но комбинация трех и более признаков дает неудовлетворительный результат. Число подгрупп сильно возрастает, и в них становится не- возможной равномерность статистических единиц. Сохранить сложность описания групп и преодолеть недостатки комбинационной группировки позволяет метод многомерных группировок, или метод многомерной классификации. Простейший вариант многомерной классификации - метод многомерной средней Статистика. Конспект лекций для студентов заочного отделения / Ю.М. Протасов. - М. : Флинта, 2012. - 152 с. - С.32.

Цель многомерной группировки: выявить усредненное влияние признаков-факторов (времени эксплуатации и пробега) на результат.

Нормированный уровень признака вычисляется по формуле:

; (3.1)

где Xс - средняя величина исследуемого признака, Xj -j-й элемент

; (3.2)

где УXi - сумма значений признака для всех элементов совокупности

Многомерное среднее находим по формуле:

; (3.3)

Табл. 3.1

Нормированные уровни признаков

многомерная средняя

автомобиля

Q

P1

P2

 (P1+P2)/2

1

0,61

1,23

1,47

1,35

2

0,63

1,35

1,07

1,21

3

0,72

1,23

1,63

1,43

4

0,72

0,86

0,75

0,81

5

0,75

0,99

1,29

1,14

6

0,76

1,35

1,07

1,21

7

0,77

1,35

1,81

1,58

8

0,80

1,11

0,80

0,96

9

0,80

0,99

1,28

1,14

10

0,81

1,23

0,97

1,10

11

0,83

1,23

0,82

1,03

12

0,85

1,23

0,87

1,05

13

0,85

1,11

1,74

1,43

14

0,87

0,99

0,78

0,89

15

0,87

1,23

1,01

1,12

16

0,88

0,86

0,87

0,87

17

0,90

1,11

1,24

1,18

18

0,91

1,23

1,19

1,21

19

0,92

0,99

1,38

1,19

20

0,94

0,86

0,78

0,82

21

0,96

1,11

1,01

1,06

22

0,98

0,86

0,80

0,83

23

0,98

1,11

1,56

1,34

24

0,98

0,99

0,90

0,95

25

0,98

0,99

0,61

0,80

26

1,00

1,11

1,19

1,15

27

1,00

1,23

1,03

1,13

28

1,00

0,86

0,85

0,86

29

1,01

0,86

0,96

0,91

30

1,02

0,86

0,97

0,92

31

1,03

0,99

0,80

0,90

32

1,05

0,99

0,93

0,96

33

1,08

0,74

0,72

0,73

34

1,09

0,74

0,69

0,72

35

1,09

0,74

0,70

0,72

36

1,11

1,11

0,99

1,05

37

1,12

1,11

0,73

0,92

38

1,14

0,86

0,83

0,85

39

1,16

0,86

0,99

0,93

40

1,17

0,74

0,64

0,69

41

1,18

0,86

0,67

0,77

42

1,21

0,74

1,10

0,92

43

1,25

0,99

0,72

0,86

44

1,27

0,86

0,63

0,75

45

1,28

0,86

0,97

0,92

46

1,29

0,86

1,29

1,08

47

1,29

0,99

1,16

1,08

48

1,33

0,86

1,49

1,18

49

1,34

0,86

0,6

0,73

итого

50

50

50

50

среднее

значение

признаков

1,00

1,00

1,00

1,00

Распределим автомобили на три типа, для этого вычислим ширину интервала по формуле:

= (1,58 - 0,69)/3 = 0,3

Табл. 3.2

Группы автомобилей по многомерной средней

Средняя цена, тыс. руб.

0,69 - 0,99

292,22

0,99 - 1,29

256,16

1,29 - 1,59

217,50

Итого

50

Вывод: Многомерный анализ показывает усреднённое влияние времени эксплуатации и пробега на цену автомобиля. Здесь, как и в аналитических группировках, прослеживается обратная зависимость между результативным признаком (цена) и факторными (пробег и время эксплуатации).

4. Интервальный вариационный ряд

Исследовать статистическое распределение результативного признака Y с помощью интервального вариационного ряда, для чего:

-построить интервальный ряд;

-дать его графическое изображение (гистограмма и кумулята);

-вычислить показатели центра (среднюю, моду и медиану), вариации (дисперсию, среднее квадратическое отклонение и коэффициент вариации) и формы (коэффициенты ассиметрии и эксцесса).

Интервальным вариационным рядом называют упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или относительными частотами попаданий в каждый из них значений величины http://umk.portal.kemsu.ru/uch-mathematics/papers/posobie/t4-2.htm К.Е. Афанасьев, С.В. Стуколов, А.В. Демидов, В.В. Малышенко. Многомерные вычислительные системы и параллельное программирование. Учебно-методический комплекс. Дата обращения к странице - 20 октября 2014 года..

Для построения интервального вариационного ряда нужно определить: количество интервалов по формуле Стерджесса: = 1 + 3,322lg50 = 6,64, где n - количество автомобилей, участвующих в исследовании. Как и в аналитических группировках, количество интервалов будет равняться 7.

Ширину интервалов определяется по формуле:

(4.1)

(тыс. рублей)

где m - количество интервалов,

R - размах вариации, равен разнице между максимальным и минимальным значением признака.

Табл. 4.1

Интервалы цен, тыс. рублей, Yi

Количество автомобилей, ni

niнак

165 - 197

4

4

197 - 229

7

11

229 - 261

9

20

261 - 293

14

34

293 - 325

7

41

325 - 357

6

47

357 - 389

3

50

Итого

50

Гистограмма (см. рис. 1) - это диаграмма, построенная в столбиковой форме, в которой величина показателя изображается графически в виде столбика http://dic.academic.ru/dic.nsf/econ_dict/4562 Академик. Экономический словарь. Дата обращения к странице: 1 ноября 2014 года..

Кумулята (см. рис. 2) - это графическое изображение статистического ряда накопленных данных, полученной информации http://jur.vslovar.org.ru/7791.html Визуальный словарь. Дата обращения к странице: 1 ноября 2014 года.

Рис. 4.1. Гистограмма

Показатели центра. Средняя арифметическая - одна из наиболее распространённых мер центральной тенденции.

(4.2)

Y`i - середина соответствующего интервала

- частота соответствующего интервала

Рис. 4.2. Кумулята

Табл. 4.2

интервалы

цен Yi

кол-во

авто ni

Y`i

Y`ini

165 - 197

4

181

724

197 - 229

7

213

1491

229 - 261

9

245

2205

261 - 293

14

277

3878

293 - 325

7

309

2163

325 - 357

6

341

2046

357 - 389

3

373

1119

итого

50

13626

(тыс. рублей)

Мода - это значение признака, наиболее часто встречающееся в изучаемой совокупности http://studopedia.net/1_13308_pokazateli-tsentra-raspredeleniya-i-strukturnie-harakteristiki-variatsionnogo-ryada.html. Показатели центра распределения и структурные характеристики вариационного ряда. Дата обращения к странице: 5 ноября..

(4.3)

где

Ymо - нижняя граница модального интервала

h - интервальный шаг (величина модального интервала)

nмо, мо+1, мо-1 - частоты модального, предмодального и послемодального интервала (тыс. рублей)

Медиана - это значение варьирующего признака, которое делит ряд распределения на две равные части по объёму частот или частостей.

Определим медианный интервал. Разделим 50 на 2, получим 25. Накопительное 25 находится между 20 и 34, берём наибольшее число - 34. Таким образом, медианный интервал - это 261 - 293.

(4.4)

где

YMe - нижняя граница медианного интервала

h - величина медианного интервала

nMе-1нак - накопленная частота предмедианного интервала

nме - частота медианного интервала

(тыс. рублей)

Вывод: так как, можно предположить, что распределение данного признака близко к симметричному, но требуется дальнейшее исследование.

Показатели вариации. Дисперсия - мера разброса величины, то есть её отклонения от математического ожидания http://ru.wikipedia.org/wiki/Дисперсия_случайной_величины Дата обращения к странице - 10 ноября 2014 года..

(4.5)

где Yi' - середина соответствующего интервала;

- среднее;

ni - количество автомобилей в соответствующем интервале

Табл. 4.3

Интервалы цен Yi

кол-во

авто ni

Y`i

Y`i -

(Y`i -)2

(Y`i -)2ni

165 - 197

4

181

-91,52

8375,91

33503

197 - 229

7

213

-59,52

3542,63

24798

229 - 261

9

245

-27,52

757,35

6816

261 - 293

14

277

6,48

42,00

588

293 - 325

7

309

38,48

1480,71

10365

325 - 357

6

341

70,48

4967,43

29805

357 - 389

3

373

104,48

10916,07

32748

Итого

50

138623

(тыс. рублей)2

Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются конкретные варианты признака от среднего значения.

(4.6)

(тыс. рублей)

Коэффициент вариации - это процентное отношение СКО к средней величине признака.

(4.7)

где - среднее квадратическое отклонение;

- среднее

Так как , что меньше 33%, то можно считать данную совокупность однородной.

Проверим распределение на нормальность, используя правило «трёх сигм»(тыс. рублей), = 52,65 (тыс. руб.)

Находим интервалы по среднему квадратическому отклонению (±1; ±2;±3), в таблице приведены полученные результаты

Табл. 4.4.

Результаты по правилу «трёх сигм»

Интервал по СКО

кол-во

авто, шт.

Эмпирическое распределение, %

Нормальное распределение, %

209,87 - 335,17

37

74

68,3

147,22 - 397,82

50

100

95,44

84,57 - 460,47

50

100

99,72

Сравнив эмпирическое распределение с нормальным, можно сделать вывод, что эмпирическое распределение близко к нормальному, но не совпадает с ним.

Табл. 4.5

Показатели формы распределения признака

Интервалы цен Yi

кол-во

авто ni

Y`i

Y`i -

(Y`i -)3

(Y`i -)3ni

(Y`i -)4

(Y`i -)4ni

165 - 197

4

181

-91,52

-766563

-3066253

70155875

280623500

197 - 229

7

213

-59,52

-210857

-1476002

12550230,2

87851611

229 - 261

9

245

-27,52

-20842,3

-187581

573579,628

5162216,7

261 - 293

14

277

6,48

272,0978

3809,369

1763,19369

24684,712

293 - 325

7

309

38,48

56977,74

398844,2

2192503,29

15347523

325 - 357

6

341

70,48

350104,5

2100627

24675364,8

148052189

357 - 389

3

373

104,48

1140511

3421533

119160593

357481779

Итого

50

1194978

894543503

Коэффициент асимметрии - величина, характеризующая асимметрию распределения данной случайной величины

(4.8)

где центральный момент 3-го порядка;

среднее квадратическое отклонение.

(4.9)

где Yi' - середина соответствующего интервала;

- среднее;

ni - количество автомобилей в соответствующем интервале

1194978

Вывод: так как коэффициент асимметрии положительный, то в выборке присутствует правосторонняя асимметрия, а это значит, что в распределении преобладают дешевые машины. Асимметрия незначительна, так как ее значение меньше 0,25.

Коэффициент эксцесса - показатель, характеризующий степень остроты пика распределения случайной величины.

(4.10)

где центральный момент 4-го порядка;

среднее квадратическое отклонение.

= (4.11)

где Yi' - середина соответствующего интервала;

- среднее;

ni - количество автомобилей в соответствующем интервале

= 894543503

Вывод: коэффициент эксцесса меньше 0, распределение имеет сглаженную вершину.

5. Критерий Пирсона

Цель: сравнить распределение цен на автомобили с нормальным распределением и доказать, что их отличие статистически незначимо.

Нормальное распределение играет особую роль в статистике. Разнообразные статистические данные с хорошей степенью точности можно считать реализациями случайной величины, имеющей нормальное распределение. Можно предполагать нормальное распределение у случайной величины, если на её отклонение от некоторого фиксированного значения влияет множество различных факторов, причем влияние каждого из них вносит малый вклад в это отклонение, а их действия почти независимы http://www.exponenta.ru/educat/systemat/shelomovsky/lab/lab04.asp Образовательный математический сайт. Дата обращения к странице: 15 ноября 2014 года..

Сформулируем две гипотезы:

Н0 - Эмпирическое распределение цен на автомобили статистически незначимо отличается от нормального.

H1 - Эмпирическое распределение цен на автомобили статистически значимо отличается от нормального.

(5.1)

где ni - количество автомобилей в соответствующем интервале,

- теоретическое количество автомобилей в соответствующем интервале

Произведем вспомогательные расчеты:

(5.2)

где Yi' - середина соответствующего интервала;

- среднее;

- среднее квадратическое отклонение. (5.3)

где n - количество автомобилей в исследуемой совокупности;

h - ширина ценового интервала;

- среднее квадратическое отклонение;

ti - расчётный коэффициент t для соответствующего интервала.

Табл. 5.1

интервалы

цен Yi

кол-во

авто ni

Y`i

Y`i -

ti

niтеор

(ni - niтеор)2/niтеор

165 - 197

4

181

-91,52

-1,74

2,67

0,66

197 - 229

7

213

-59,52

-1,13

6,40

0,06

229 - 261

9

245

-27,52

-0,52

10,59

0,24

261 - 293

14

277

6,48

0,12

12,03

0,32

293 - 325

7

309

38,48

0,73

9,29

0,56

325 - 357

6

341

70,48

1,34

4,94

0,23

357 - 389

3

373

104,48

1,98

1,71

0,97

итого

50

47,63

3,04

Рис. 5.1 Сравнение эмпирических и теоретических частот

Определим с помощью таблицы критических значений .

k = m - r - 1 = 7 - 2 - 1 = 4 (т.к. закон нормальный, то r = 2)

(0,05; 4) = 9,488

Теоретическое распределение больше эмпирического, следовательно, мы принимаем Н0.

Вывод: Эмпирическое распределение цен на автомобили статистически незначимо отличается от теоретического.

6. Определение доверительного интервала и оптимального объёма выборки

Выборочным называется несплошное наблюдение, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использованием специальных методов, а полученные в процессе обследования результаты с определенным уровнем вероятности распространяются на всю исходную совокупность.

Данная выборка является повторной собственно-случайной.

Цель: Определить в каком интервале колеблется цена на автомобиль Suzuki Liana в генеральной совокупности.

1. Определить среднюю ошибку выборки. При повторном отборе попавшая в выборку единица подвергается обследованию, т.е. регистрации значений ее признаков, возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора

(6.1)

где

2 - дисперсия

n - объём выборки;

2. Определить предельную ошибку выборки. Предельная ошибка выборки связана с заданным уровнем вероятности.

(6.2)

где, t - коэффициент доверия, зависящий от вероятности гамма (г), с которой определяется предельная ошибка;

мх - стандартная ошибка выборки;

3. Построить доверительный интервал

(6.3)

где- середина доверительного интервала;

- средняя цена;

- предельная ошибка выборки.

Вывод: На основании проведенного выборочного обследования с вероятностью 0,954 можно заключить, что средняя цена на автомобиль Suzuki Liana лежит в пределах интервала от 257,62 до 287,42 тыс. рублей.

Определение оптимального объема выборки.

(6.4)

где t - коэффициент доверия

- среднее квадратическое отклонение

? - предельная ошибка выборки

При Д = 10 тыс. руб. и вероятностью 0,95 t=2

Вывод: Необходимая численность выборки для определения средней цены продаваемых автомобилей равна 111.

Корреляционно-регрессионный анализ. Цель: на основании данных выборочного наблюдения:

-составить уравнение множественной регрессии результативного признака Y, обосновав систему факторов, включенных в модель.

-сопоставить роль признаков-факторов Х1 и Х2 в формировании результативного признака Y, вычислив коэффициенты эластичности.

-провести корреляционный анализ.

Составим уравнение множественной регрессии результативного признака.

Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии.

Используем метод приведения параллельных данных, которое позволит установить наличие связи и получить представление о ее характере.

Данные приведены в расчетной таблице:

Табл. 7.1

X1*Y

X2*Y

X1*X2

X1-

(X1-)2

X2-

(X2-)2

Y-

(Y- )2

1

1650

28050

1700

1,88

3,5344

54,04

2920,322

-106,32

11303,94

2

1870

21080

1364

2,88

8,2944

8,04

64,6416

-101,32

10265,74

3

1950

36855

1890

1,88

3,5344

73,04

5334,842

-76,32

5824,742

4

1365

16965

609

-1,12

1,2544

-28,96

838,6816

-76,32

5824,742

5

1624

30450

1200

-0,12

0,0144

34,04

1158,722

-68,32

4667,622

6

2255

25420

1364

2,88

8,2944

8,04

64,6416

-66,32

4398,342

7

2310

44100

2310

2,88

8,2944

94,04

8843,522

-61,32

3760,142

8

1944

20088

837

0,88

0,7744

-22,96

527,1616

-55,32

3060,302

9

1744

32264

1184

-0,12

0,0144

32,04

1026,562

-53,32

2843,022

100

2200

24640

1120

1,88

3,5344

-3,96

15,6816

-51,32

2633,742

11

2250

21375

950

1,88

3,5344

-20,96

439,3216

-46,32

2145,542

12

2300

23230

1010

1,88

3,5344

-14,96

223,8016

-41,32

1707,342

13

2070

46460

1818

0,88

0,7744

86,04

7402,882

-41,32

1707,342

14

1880

21385

728

-0,12

0,0144

-24,96

623,0016

-36,32

1319,142

15

2370

27729

1170

1,88

3,5344

1,04

1,0816

-34,32

1177,862

16

1673

24139

707

-1,12

1,2544

-14,96

223,8016

-32,32

1044,582

17

2205

35280

1296

0,88

0,7744

28,04

786,2416

-26,32

692,7424

18

2480

34224

1380

1,88

3,5344

22,04

485,7616

-23,32

543,8224

19

2000

40000

1280

-0,12

0,0144

44,04

1939,522

-21,32

454,5424

20

1785

22950

630

-1,12

1,2544

-25,96

673,9216

-16,32

266,3424

21

2340

30420

1053

0,88

0,7744

1,04

1,0816

-11,32

128,1424

22

1855

24645

651

-1,12

1,2544

-22,96

527,1616

-6,32

39,9424

23

2385

47965

1629

0,88

0,7744

65,04

4230,202

-6,32

39,9424

24

2136

27768

832

-0,12

0,0144

-11,96

143,0416

-4,32

18,6624

25

2136

18957

568

-0,12

0,0144

-44,96

2021,402

-4,32

18,6624

26

2430

37260

1242

0,88

0,7744

22,04

485,7616

-1,32

1,7424

27

2700

32130

1190

1,88

3,5344

3,04

9,2416

-1,32

1,7424

28

1890

26460

686

-1,12

1,2544

-17,96

322,5616

-1,32

1,7424

29

1925

30525

777

-1,12

1,2544

-4,96

24,6016

3,68

13,5424

30

1946

31136

784

-1,12

1,2544

-3,96

15,6816

6,68

44,6224

31

2240

26040

744

-0,12

0,0144

-22,96

527,1616

8,68

75,3424

32

2280

30780

864

-0,12

0,0144

-7,96

63,3616

13,68

187,1424

33

1752

24528

504

-2,12

4,4944

-31,96

1021,442

20,68

427,6624

34

1770

23600

480

-2,12

4,4944

-35,96

1293,122

23,68

560,7424

35

1776

23976

486

-2,12

4,4944

-34,96

1222,202

24,68

609,1024

36

2700

34500

1035

0,88

0,7744

-0,96

0,9216

28,68

822,5424

37

2745

25925

765

0,88

0,7744

-30,96

958,5216

33,68

1134,342

38

2170

29760

672

-1,12

1,2544

-19,96

398,4016

38,68

1496,142

39

2205

36225

805

-1,12

1,2544

-0,96

0,9216

43,68

1907,942

40

1902

23458

444

-2,12

4,4944

-41,96

1760,642

45,68

2086,662

41

2240

24960

546

-1,12

1,2544

-37,96

1440,962

48,68

2369,742

42

1968

41984

768

-2,12

4,4944

12,04

144,9616

56,68

3212,622

43

2720

28220

664

-0,12

0,0144

-32,96

1086,362

68,68

4716,942

44

2415

25185

511

-1,12

1,2544

-42,96

1845,562

73,68

5428,742

45

2429

38864

784

-1,12

1,2544

-3,96

15,6816

75,68

5727,462

46

2450

52500

1050

-1,12

1,2544

34,04

1158,722

78,68

6190,542

47

2800

46900

1072

-0,12

0,0144

18,04

325,4416

78,68

6190,542

48

2520

62280

1211

-1,12

1,2544

57,04

3253,562

88,68

7864,142

49

2548

25480

490

-1,12

1,2544

-45,96

2112,322

92,68

8589,582

50

2334

29564

456

-2,12

4,4944

-39,96

1596,802

117,68

13848,58

Сумма

107362

1538769

48310

105,28

61601,92

139396,88

Среднее

2152,64

30773,58

966,2

Множественная модель регрессии строится при условии неколлинеарности факторов. Проверим факторы на коллинеарность с помощью линейного коэффициента корреляции, который определяет тесноту и направление связи при линейной зависимости:

(7.1)

Также найдем и :

(7.2)

(7.3)

Результативный показатель - цена Y.

Факторные признаки:

Время эксплуатации X1, пробег X2.

уY= = 52,8

уX1= = 1,45

уX2= = 35,1

= (966,2 - (8,12*115,96)) / (1,45*35,1) ? 0,48

Связь между пробегом (X2) и временем эксплуатации (X1) умеренная прямая. = (2152,64 - (271,32*8,12))/(52,8*1,45) ? -0,66

Связь между результативным признаком Y (цена) и Х1 (время эксплуатации) обратная заметная. = (30773,58 - (271,32*115,96))/52,8*35,1) ? -0,37

Связь между результативным признаком Y (цена) и Х2 (пробег) обратная умеренная.

Так как rX1/X2< 0,7, то X1 и X2 - неколлинеарные, множественную модель можно построить, а также вычислить коэффициент множественной корреляции.

Множественная модель регрессии. Регрессионный анализ помогает определить форму связи и показывает насколько изменится результат, если фактор изменится на единицу.

Множественная модель регрессии описывается уравнением:

=0 + 5N1X1 + 5N2X2 (7.4)

где

а0 -показывает усредненное влияние неучтенных факторов на признак результат;

а1- коэффициент регрессии, который показывает на сколько в среднем изменится значение результативного признака при изменении 1 единицы факторного признака X1.

a2- коэффициент регрессии, который показывает на сколько в среднем изменится значение результативного признака при изменении 1 единицы факторного признака X2.

Найдем параметры уравнения регрессии с помощью системы нормальных уравнений:

(7.5)

0 = 468,19

1 = -22,75

2 = -0,1

Множественная модель имеет вид: = 468,19 - 22,75X1 - 0,1X2

Вывод: неучтенные факторы сильно влияют на результат. При увеличении времени эксплуатации автомобиля на 1 год цена уменьшается на 22,75 тысяч рублей, а при увеличении пробега на 1 тыс. км цена уменьшается на 0,1 тысячу рублей.

Проверим адекватность выбранной модели регрессии.

Гипотезы:

: коэффициент регрессии незначим, модель регрессии выбрана неверно;

: коэффициент регрессии значим, модель регрессии адекватна

Для доказательства адекватности модели необходимо найти ошибку аппроксимации.

(7.6)

Табл. 7.3

Расчетные данные для нахождения ошибки аппроксимации

№ n. n.

Цена тыс. руб., Y

Время эксплуатации лет, X1

Пробег, тыс. км

(Х2)

Y ?

1

165

10

170

223,69

0,3557

2

170

11

124

205,54

0,20906

3

195

10

189

221,79

0,13738

4

195

7

87

300,24

0,53969

5

203

8

150

271,19

0,33591

6

205

11

124

205,54

0,00263

7

210

11

210

196,94

0,06219

8

216

9

93

254,14

0,17657

9

218

8

148

271,39

0,24491

10

220

10

112

229,49

0,04314

11

225

10

95

231,19

0,02751

12

230

10

101

230,59

0,00257

13

230

9

202

243,24

0,05757

14

235

8

91

277,09

0,17911

15

237

10

117

228,99

0,033797

16

239

7

101

298,84

0,25038

17

245

9

144

249,04

0,01649

18

248

10

138

226,89

0,085121

19

250

8

160

270,19

0,08076

20

255

7

90

299,94

0,17624

21

260

9

117

251,74

0,031769

22

265

7

93

299,64

0,13072

23

265

9

181

245,34

0,074189

24

267

8

104

275,79

0,03292

25

267

8

71

279,09

0,04528

26

270

9

138

249,64

0,075407

27

270

10

119

228,79

0,15263

28

270

7

98

299,14

0,10793

29

275

7

111

297,84

0,08305

30

278

7

112

297,74

0,07101

31

280

8

93

276,89

0,011107

32

285

8

108

275,39

0,033719

33

292

6

84

323,29

0,10716

34

295

6

80

323,69

0,09725

35

296

6

81

323,59

0,09321

36

300

9

115

251,94

0,1602

37

305

9

85

254,94

0,164131

38

310

7

96

299,34

0,034387

39

315

7

115

297,44

0,055746

40

317

6

74

324,29

0,023

41

320

7

78

223,69

0,300969

42

328

6

128

205,54

0,373354

43

340

8

83

221,79

0,347676

44

345

7

73

300,24

0,129739

45

347

7

112

271,19

0,218473

46

350

7

150

205,54

0,412743

47

350

8

134

196,94

0,437314

48

360

7

173

254,14

0,294056

49

364

7

70

271,39

0,254423

50

389

6

76

229,49

0,410051

 Сумма

13566

406

5798

7,380341

Среднее арифм.

271,32

8,12

115,96

0,147 или 14,7%

Вывод: модель регрессии можно считать адекватной, так как ошибка аппроксимации равна 14,7%, что не превышает 12-15%. По форме модель является двухфакторной, линейной, прямой.

Корреляция

Определим множественный коэффициент корреляции, который характеризует тесноту и направление связи между коррелируемыми признаками.

R = (7.7)

Множественный коэффициент корреляции равен:

Таким образом, множественный коэффициент корреляции показывает заметную связь между элементами выборки.

Определим значимость множественного коэффициента корреляции.

Сформулируем 2 гипотезы:

H0 - корреляционная связь между исследуемыми признаками статистически значимо не отличается от 0.

Н1 - корреляционная связь между исследуемыми признаками статистически значимо отличается от 0.

Проверим корреляционную связь на статистическую значимость, используя t-критерий Стьюдента.

(7.8)

где

r - линейный коэффициент корреляции

n- объем статистической совокупности

6,09

Определим степень свободы:

v = n - k - 1

v = 48

По таблице Стьюдента tтеор. = 3,460 (б = 0,001, v = 48).

6,09 >3,46

Вывод: подтверждается альтернативная гипотеза H1, так как > tтеор. Следовательно, коэффициент корреляции статистически значим.

Коэффициенты эластичности

Определение роли признаков-факторов Х1 и Х2 в формировании результативного признака Y, с помощью вычисления коэффициентов эластичности. Коэффициент эластичности показывает, на сколько процентов изменится Y при изменении соответствующего Хi на 1% http://www.grandars.ru/student/vysshaya-matematika/ekonometricheskaya-model.html Энциклопедия экономиста. Дата обращения к странице - 1 ноября 2014 года..

Коэффициент эластичности показывает, на сколько процентов изменится значение Y при изменении значения фактора на 1 %.

Коэффициент эластичности вычисляется по формуле:

(7.9)

где

- коэффицинт эластичности;

- среднее значение соответствующего факторного признака;

-среднее значение результативного признака;

- коэффициент регрессии при соответствующем факторном признаке.

Вывод: при увеличении времени эксплуатации автомобиля на 1% его цена уменьшится в среднем на 68%

Вывод: при увеличении пробега автомобиля на 1% его цена уменьшится в среднем на 4%

Заключение

По итогам данной курсовой работы можно сделать следующие выводы.

Аналитические группировки автомобилей по времени эксплуатации и пробегу показали: цена автомобиля неизменно падает при повышении времени эксплуатации и имеет менее сильную тенденцию к падению при увеличении пробега.

Многомерный анализ показывает усреднённое влияние времени эксплуатации и пробега на цену автомобиля. Здесь, как и в аналитических группировках, прослеживается обратная зависимость между результативным признаком (цена) и факторными (пробег и время эксплуатации).

Исследование статистического распределения результативного признака Y с помощью построения показало, что распределение является однородным, асимметричным с правосторонней асимметрией и со сглаженной вершиной.

Проверка распределения с помощью правила «трёх сигм» и критерия Пирсона на соответствие статистического распределения результативного признака Y нормальному закону распределения на уровне значимости б = 0,05 показала, что распределение соответствует нормальному закону.

Определение необходимого объёма выборки показало, что выборка в случае увеличения её с 50 до 111 автомобилей была бы наиболее репрезентативной.

Уравнение регрессии показало, что цена автомобиля сильно зависит от неучтённых факторов.

Множественный коэффициент корреляции показал умеренную зависимость результативного признака Y и признаков-факторов X1 и X2 друг от друга.

Коэффициенты эластичности показали в процентах, как меняется цена при изменении каждого из факторов на 1%.

Таким образом, цель исследования была достигнута, задачи - выполнены.

Список литературы

1. http://moscow.auto.ru/cars/suzuki/liana/all/ Продажа Suzuki Liana. Дата обращения к странице: 3 октября 2014 года.

2. http://studopedia.ru/3_187786_statisticheskaya-svodka-i-gruppirovka.html Студопедия. Студенческая энциклопедия. Статистическая сводка и группировка. Дата обращения к странице - 10 октября 2014 года.

3. Статистика. Конспект лекций для студентов заочного отделения / Ю.М. Протасов. - М. : Флинта, 2012. - 152 с. - С.32

4. http://umk.portal.kemsu.ru/uch-mathematics/papers/posobie/t4-2.htm К.Е. Афанасьев, С.В. Стуколов, А.В. Демидов, В.В. Малышенко. Многомерные вычислительные системы и параллельное программирование. Учебно-методический комплекс. Дата обращения к странице - 20 октября 2014 года.

5. http://dic.academic.ru/dic.nsf/econ_dict/4562 Академик. Экономический словарь. Дата обращения к странице: 1 ноября 2014 года.

6. http://jur.vslovar.org.ru/7791.html Визуальный словарь. Дата обращения к странице: 1 ноября 2014 года.

7. http://studopedia.net/1_13308_pokazateli-tsentra-raspredeleniya-i-strukturnie-harakteristiki-variatsionnogo-ryada.html. Показатели центра распределения и структурные характеристики вариационного ряда. Дата обращения к странице: 5 ноября.

8. http://ru.wikipedia.org/wiki/Дисперсия_случайной_величины Дата обращения к странице - 10 ноября 2014 года.

9. http://www.exponenta.ru/educat/systemat/shelomovsky/lab/lab04.asp Образовательный математический сайт. Дата обращения к странице: 15 ноября 2014 года.

10. Статистика: Учеб. пособие/Под. Ред. проф. М.Р. Ефимовой. М.: ИНФРА-М, 2006. - 336 с. - С. 177

11. http://www.grandars.ru/student/vysshaya-matematika/ekonometricheskaya-model.html Энциклопедия экономиста. Дата обращения к странице - 20 ноября 2014 года

Размещено на Allbest.ru


Подобные документы

  • Составление характеристики непрерывного признака. Методы составления приближенного распределения признака, имеющего непрерывное распределения. Относительные частоты и их плотности. Статистическое распределение частот интервального вариационного ряда.

    творческая работа [17,8 K], добавлен 10.11.2008

  • Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.

    курсовая работа [110,0 K], добавлен 23.07.2009

  • Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.

    курсовая работа [593,2 K], добавлен 28.06.2009

  • Исследование сходимости числового ряда. Использование признака Даламбера. Исследование на сходимость знакочередующегося ряда. Сходимость рядов по признаку Лейбница. Определение области сходимости степенного ряда. Сходимость ряда на концах интервала.

    контрольная работа [131,9 K], добавлен 14.12.2012

  • Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.

    презентация [140,3 K], добавлен 01.11.2013

  • Исторические аспекты развития статистики, ее предмет. Понятие статистической методологии. Организация государственной и международной статистики. Программа и формы статистического наблюдения. Формы вариационного ряда. Средняя арифметическая и ее свойства.

    шпаргалка [37,9 K], добавлен 12.12.2010

  • Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.

    контрольная работа [55,2 K], добавлен 23.07.2009

  • Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.

    курсовая работа [263,6 K], добавлен 14.06.2015

  • Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.

    курсовая работа [988,5 K], добавлен 19.01.2011

  • Таблица значений выборки дискретных случайных величин в упорядоченном виде. Таблица интервального статистического ряда относительных частот. Задание эмпирической функции распределений и построение ее графика. Полигон и распределение случайной величины.

    практическая работа [109,3 K], добавлен 26.07.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.