Информационная система исследования влияния экономических, социальных и экологических факторов на условия жизни в городе Елабуга

Разработки модели комфортности проживания жителей в городе, состоящей из совокупности регрессионных моделей. Анализ показателей уровня жизни людей с учетом влияния на них экономических, социальных и экологических факторов с помощью программы Statistica.

Рубрика Экономико-математическое моделирование
Вид курсовая работа
Язык русский
Дата добавления 24.03.2016
Размер файла 306,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Информационная система исследования влияния экономических, социальных и экологических факторов на условия жизни в городе Елабуга

1. Объект исследования

Объектом исследования в соответствии с заданием является город Елабуга.

Елабуга - город республиканского подчинения, центр Елабужского района.

Город Елабуга - небольшой и тихий, имеющий богатую, более чем двухсотлетнюю историю, известный в царской России и за ее пределами как торгово-купеческий - переживает свое новое рождение.

Город расположен на правом берегу реки Кама, в 210 км на восток от г. Казани и находится в географическом центре промышленно развитого региона. В радиусе 300-350 км размещены предприятия:

· металлургии - г. Ижевск;

· автомобилестроения - г.г. Набережные Челны, Ижевск, Ульяновск, Тольятти;

· нефтехимии в г.г. Нижнекамск, Уфа, Пермь, Казань;

· приборостроения - г.г. Казань, Чистополь;

· электростанции - Кармановская, Заинская, Нижнекамская.

2. Цели и задачи, подлежащие решению

Целью проведения данного исследования является повышение эффективности исследования влияния экономических, социальных и экологических факторов на условия проживания жителей в городе Елабуга.

В данной работе поставлены и решены следующие задачи.

Исследование степени влияния экономических, экологических и социальных факторов на показатели комфортности проживания людей в городе. Для решения данной задачи требуется обеспечить:

· Ввод исходных статистических данных (ИСД).

· Вычисление основных статистических характеристик ИСД.

· Проверку исходных данных на нормальность.

· Представление результатов в графическом виде.

· Регрессионный анализ.

3. Исследование экономических, социальных и экологических показателей города Елабуга

a. Предварительный анализ комфортности проживания людей в городе Елабуга и постановка задачи

Для исследования влияния экономических, социальных и экологических факторов комфортности проживания жителей в г.Елабуга, далее называемым городом, использованы годовые значения статистических данных за 2004-2014 гг., приведенные в Таблице 1. В качестве откликов выбраны 27 показателей комфортности проживания жителей в городе, такие как рождаемость, смертность, естественный прирост, количество зарегистрированных браков, разводов и разность между ними - yj, j=. В качестве влияющих на них факторов выбраны экономические, социальные и экологические факторы, характеризующие среду обитания населения - xi, i=. Эти отклики и факторы представляют собой совокупность переменных - vj, . Перечень переменных приведен в Таблице 1.

Таблица 1. Перечень переменных

Факторы:

X1

Численность населения (чел.)

X2

Численность населения трудоспособного возраста (чел.)

X3

Численность работающих на крупных предприятиях (чел.)

X4

Уровень безработицы (%)

X5

Объем промышленной продукции (млн. руб., до 2006г. - млрд. руб.)

X6

Среднемесячная заработная плата (руб., до 2006г. - тыс. руб.)

X7

Прожиточный минимум на члена семьи (руб., до 2006г. - тыс. руб.)

X8

Стоимость набора из 25 основных продуктов питания (руб., до 2006г. - тыс. руб.)

X9

Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.)

X10

Ввод жилых домов (кв. м. общ. пл.)

X11

Объем реализации платных услуг в расчете на 1 жителя (руб., до 2006г. - тыс. руб.)

X12

Объем реализации бытовых услуг в расчете на 1 жителя (руб., до 2006г. - тыс. руб.)

X13

Оборот розничной торговли на душу населения (руб., до 2006г. - тыс. руб.)

X14

Оборот общественного питания на душу населения (руб., до 2006г. - тыс. руб.)

X15

Обеспеченность населения больничными койками (на 1000 чел.)

X16

Обеспеченность населения врачами (на 1000 чел.)

X17

Обеспеченность населения средним медицинским персоналом (на 1000 чел.)

X18

Общая раскрываемость преступлений (%)

X19

Потребление чистой воды (млн. куб. л.)

X20

Выброс вредных веществ в атмосферу (кг)

X21

Выброс вредных веществ в водоемы

Отклики:

Y1

Средняя продолжительность жизни (лет)

Y2

Рождаемость (чел.)

Y3

Количество умерших (чел.)

Y4

Естественный прирост (чел.)

Y5

Количество зарегистрированных браков (шт.)

Y6

Количество расторгнутых браков (шт.)

Y7

Разница между заключенными и расторгнутыми браками (шт.)

Y8

Число умерших людей в возрасте до 1 года ( на 1000 чел.)

Y9

Заболеваемость туберкулезом (на 100 тыс. чел)

Y10

Заболеваемость онкологическими заболеваниями (на 100 тыс. чел)

Y11

Заболевания органов дыхания (на 1000 чел.)

Y12

Заболеваемость системы кровообращения (на 1000 чел.)

Y13

Общее количество преступлений(шт.)

Y14

Количество особо тяжких преступлений (шт.)

Y15

Количество тяжких преступлений (шт.)

Y16

Количество преступлений средней тяжести (шт.)

Y17

Количество преступлений небольшой тяжести (шт.)

Y18

Количество умышленных убийств (шт.)

Y19

Количество причинений вреда здоровью (шт.)

Y20

Количество умышленных причинений тяжкого вреда здоровью (шт.)

Y21

Количество краж (шт.)

Y22

Количество мошенничеств (шт.)

Y23

Количество грабежей (шт.)

Y24

Количество разбоев (шт.)

Y25

Количество вымогательств (шт.)

Y26

Количество неправомерных завладений АМТ (шт.)

Y27

Количество хулиганств (шт.)

Квартальные значения статистических данных за 2004-2014 годы по переменным Таблицы 1. приведены в Таблице 2.

В Таблице 2 количество строк равно количеству квартальных значений по экономических, социальным и экологическим факторам, а также рождаемости, смертности, естественному приросту, количеству зарегистрированных браков, разводов, их разности (по всем рассматриваемым переменным). По столбцам Таблицы 2 записаны значения, принимаемые переменными в квартальных отчетах.

Для наглядности исходные статистические данные (ИСД) представлены в виде временных графиков на рис. 1-12.

Рис. 1. График изменения численности населения за 2004 - 2014 годы

Таблица 2. Квартальные статистические данные

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17

2004(1)

65876

38272

28900

1,8

144,7

205,1

238,4

135,3

16

9083

50

8,1

568,1

23,1

125,8

37

162,6

2004(2)

65911

38415

28100

2

150,1

280,7

238,4

142,4

16,1

10015

54

7,6

570,2

22,7

125,6

36,9

162,6

2004(3)

66053

38574

27410

2,3

155,2

342,6

238,4

145,7

16,25

9865

54

9,2

579,3

22,4

125,3

36,3

162,6

2004(4)

66271

38732

26800

2,8

128,8

473,6

238,4

149,8

16,4

7372

56

8

597,8

22,7

124,8

36,2

162,6

2005(1)

66394

38911

26935

3,1

200

548,9

292,6

152,3

16,4

7515

140,2

17,5

798,9

38,5

124,7

36,3

162,6

2005(2)

66875

39241

27027

3,4

199,95

611,3

292,6

154,5

16,3

7800

141,1

18,3

850,6

41,1

124,5

36,7

162,6

2005(3)

67012

39610

27120

3,5

202,6

717,1

292,6

159,4

16,3

7950

150,1

16,6

897

40,7

124,3

36,7

162,6

2005(4)

67356

39942

27300

3,7

197,25

779,2

292,6

164,5

16,3

8601

158,4

21,5

1006,1

43,2

123,9

37,1

162,6

2006(1)

67403

40105

27421

4

220,6

812,5

350,1

170,2

16,5

9980

180,9

22,3

911,1

40,5

120,1

37

164,5

2006(2)

67584

40318

27243

4,2

245,7

867,6

350,1

176,4

16,8

11500

165,7

22,1

862,1

39,9

118,2

36,8

167,8

2006(3)

67666

40513

27130

4,4

253,7

897,4

350,1

180,3

16,9

12200

191,9

24,9

812,6

42,3

115,3

36,8

169,5

2006(4)

67851

40684

27041

4,55

240,5

938,8

350,1

184,6

17

12155

235,4

27,5

870,3

38,5

114,8

36,7

170,7

2007(1)

67925

40876

27010

5,1

50,1

950,1

539,9

200,8

17

6805

200,3

32,2

690,3

40,2

100,3

36,4

170,5

2007(2)

67997

40917

26815

5,7

55,2

960,7

539,9

250,7

17

6570

235,4

35,7

711,6

42,8

90,2

36,2

169

2007(3)

68139

41324

26300

5,9

46,3

970,3

539,9

287,7

17

6800

226,8

32,2

710,8

41,9

85,8

35,5

169

2007(4)

68350

41655

25742

6,27

50,5

1045

539,9

318,56

17

7045

195,2

39,1

697

41,5

84,3

35

168,9

2008(1)

68627

41819

25786

6,1

99,8

1070

757,6

348,1

17,2

5550

315,2

50,3

805,8

45,7

84,3

34,9

167

2008(2)

68211

41943

26304

5,4

102,3

1124,5

757,6

370,5

17,3

4970

310,1

57,8

875,1

49,1

84,3

34,5

166,5

2008(3)

67789

42058

26258

5,1

104,6

1198,2

757,6

398,1

17,4

5160

320,7

52,1

887,6

47,5

84,2

34,45

165,4

2008(4)

68426

42258

26207

4,8

96,7

1301

757,6

435,39

17,5

5448

307,4

53,9

934,2

51,4

84,2

34,4

163

2009(1)

68401

42347

26118

4,1

116

1500,6

881,4

457,3

17,8

7970

425,6

71,2

1187,5

125,6

88,6

34,7

163

2009(2)

68334

42416

25987

3,2

152

1640

881,4

488,8

17,9

8245

431,8

74,9

1207,1

173,5

89

34,8

163

2009(3)

68225

42552

25756

2,5

140

1780

881,4

512,3

18

8543

455,8

66,8

1224,3

190,1

92,5

34,9

162,8

2009(4)

68101

42684

25698

1,87

151,8

2098

881,4

528,68

18,2

8225

489,1

72,8

1198,1

205,55

96,7

35,1

162,8

2010(1)

68006

42847

25711

1,8

200

2169

981,62

550,4

18,3

4900

638,9

96,2

1650,8

285,3

96,7

35,2

163

2010(2)

67986

42916

25689

1,7

208,6

2570

981,62

586

18,5

5045

651,3

99,3

1589,3

290,4

97

35,4

163,9

2010(3)

67982

43081

25986

1,6

246,2

2768,5

981,62

621,3

18,6

5005

654,9

100,9

1668,1

292,5

97,1

35,7

164,5

2010(4)

67969

43180

26095

1,55

203,3

3098,3

981,62

662,93

18,7

5377

647

98,7

1488,8

292,8

97,71

34,9

165,8

2011(1)

68015

43281

26541

1,6

232,8

3302,6

1548,75

712,4

18,8

6045

1350,17

131

1847,5

356,1

95,3

35,2

164,9

2011(2)

67987

43458

26582

1,7

312,5

3458,8

1548,75

745,6

18,8

5990

1401,2

129,4

1925

374,5

94,1

35,3

165,7

2011(3)

67972

43513

36645

1,7

359,8

3684

1548,75

778,9

18,9

6103

1357,8

135,2

1715,4

380,3

93,4

35,8

166,2

2011(4)

67647

43601

26903

1,85

252,7

3983,5

1548,75

801,43

19

6045

1246,2

132

1857,1

387,1

91,28

36

166,8

2012(1)

67996

43874

26315

1,85

467,2

3999,1

1768,25

824,6

19

6700

1368,1

149

2487,3

420,8

90,5

36

166,8

2012(2)

68100

44521

26046

1,9

538,1

4102

1768,25

864,1

19

6200

1423,5

156,5

2214,8

427,1

89,8

36,1

165,4

2012(3)

68547

44986

25936

1,9

528,5

4184

1768,25

879,5

19

5970

1411,1

164,2

2187,5

431,5

89,8

36,1

165

2012(4)

69145

45352

25280

1,92

480

4529,3

1768,25

895,21

19

7915

1584

156,7

2683,9

428,6

88,1

36,6

165

Продолжение Таблицы 2.

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

121

110

-11

110

103

7

14,3

50

201,2

197

211

14

81

74

7

11,5

50,1

202,2

211

235

24

96

70

26

10,2

50,2

204

135

209

74

75

48

27

7,2

50,5

204,5

86

123

37

89

86

3

10,6

65,6

204

218

214

-4

48

111

-63

15,8

70,1

203,3

173

219

46

108

68

40

17,4

78,7

202,1

202

214

12

87

55

32

19,3

83,8

201

64

98

34

67

94

-27

18,9

77,4

199

214

189

-25

101

86

15

19,1

70,5

195,6

220

231

11

111

79

32

19,3

66,4

194

148

217

69

54

58

-4

19,4

60,3

192,5

132

74

-58

74

75

-1

20,6

70,1

183,4

144

211

67

78

66

12

21,8

75,9

178,8

158

115

-43

98

57

41

23,2

77,7

164

184

274

90

68

53

15

24,8

80,4

156,9

49

84

35

88

93

-5

24,2

78,7

198

217

159

-58

70

72

-2

23,7

75,21

210,3

238

260

22

101

46

55

23,1

73,8

225,5

106

209

103

91

49

42

22,3

72,2

247,1

57

112

55

80

102

-22

18,8

73,8

237

128

201

73

67

81

-14

15,1

75,5

230,5

243

172

-71

107

59

48

14,3

77,4

224,4

214

219

5

90

77

13

13,9

78,5

221,5

98

215

117

186

166

20

14,6

78

225,4

157

158

1

158

153

5

15,1

77,8

230,1

218

223

5

82

41

41

16,8

77,7

232,4

206

234

28

35

24

11

18

77,6

234,1

96

203

107

187

211

-24

18,3

75,1

240,1

183

217

34

86

81

5

16,4

73

241,1

269

228

-41

113

116

-3

10,8

70,5

246,7

254

202

-52

127

84

43

11

68,9

251,2

126

125

-1

215

184

31

10,8

60,8

248,7

216

234

18

79

111

-32

9,7

59

245,1

220

238

18

153

90

63

9,7

57,4

245

229

219

-10

90

82

8

9,3

56,4

244,9

Y15

Y16

Y17

Y18

Y19

Y20

Y21

Y22

Y23

Y24

Y25

Y26

Y27

2004(1)

0

0

0

2

0

5

123

15

12

2

2

2

49

2004(2)

0

0

0

4

0

13

327

216

35

21

7

6

7

2004(3)

0

0

0

7

0

17

460

302

39

25

11

7

18

2004(4)

0

0

0

15

0

22

595

399

39

33

15

12

24

2005(1)

117

0

0

3

18

8

74

2

10

1

4

3

26

2005(2)

245

0

0

11

22

7

281

178

15

22

2

4

14

2005(3)

332

0

0

14

39

9

404

263

28

26

6

4

23

2005(4)

432

0

0

18

45

13

530

342

29

33

8

4

30

2006(1)

121

52

64

6

20

7

130

77

8

5

1

1

11

2006(2)

229

103

113

9

22

11

264

163

14

15

3

2

15

2006(3)

347

128

176

12

46

15

385

245

21

19

6

2

20

2006(4)

465

160

208

17

62

21

508

319

36

28

8

5

20

2007(1)

135

40

62

3

20

8

146

94

17

5

6

2

0

2007(2)

266

85

107

9

54

23

271

193

29

19

7

1

1

2007(3)

428

137

212

15

72

29

452

330

43

24

11

7

11

2007(4)

691

224

324

17

94

33

778

622

41

36

15

10

13

2008(1)

256

62

92

1

26

11

294

243

8

17

7

4

2

2008(2)

476

147

200

7

47

16

567

436

19

37

13

8

8

2008(3)

713

259

367

11

83

21

885

648

35

46

13

15

10

2008(4)

897

366

472

12

113

35

1095

802

62

56

20

22

14

2009(1)

191

87

109

4

22

10

246

188

16

8

2

5

2

2009(2)

407

195

223

7

49

6

520

401

26

25

7

9

2

2009(3)

597

287

353

14

77

12

777

581

59

27

13

13

5

2009(4)

816

374

491

16

95

17

1049

790

68

45

19

18

6

2010(1)

229

63

97

5

33

9

260

194

14

23

4

9

1

2010(2)

457

162

205

14

62

18

505

364

33

44

9

10

5

2010(3)

672

241

340

17

83

22

752

518

38

64

14

20

6

2010(4)

904

309

489

22

108

33

1010

710

50

85

22

26

9

2011(1)

200

78

113

7

23

11

231

165

8

28

4

8

5

2011(2)

375

125

204

9

45

18

397

273

25

60

5

13

9

2011(3)

517

206

275

14

77

27

567

382

29

85

16

14

23

2011(4)

662

323

392

16

97

32

809

570

37

109

23

18

30

2012(1)

102

144

109

1

16

7

228

158

7

30

10

4

12

2012(2)

197

266

276

6

36

12

443

326

10

53

20

8

15

2012(3)

304

373

423

9

51

18

686

494

30

72

25

13

31

2012(4)

412

479

524

14

70

27

915

656

41

112

30

15

37

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

2013(1)

69158

45541

25320

1,95

494,9

4790,1

1962,25

917,5

19

4152

1811,3

161,5

2956,8

450

85,6

36,6

2013(2)

69203

46125

25450

1,95

602,7

4830

1962,25

967

19,1

3871

1915,6

169,8

3005,8

461

84,4

36,8

2013(3)

69341

46274

25480

2

589,5

4952,6

1962,25

988,4

19,1

4213

1907,1

167,8

3001,7

455,2

83,5

36,8

2013(4)

69400

46511

25658

2,01

594

5264,6

1962,25

1044,81

19,2

4607

1906

166,1

3120,7

471,8

83

37

2014(1)

69546

46712

25782

2,1

541,2

5345,1

2155,8

1102

19,2

4273

1917,5

172,5

3115,1

478,2

83,5

37

2014(2)

69687

46874

25751

2,1

617,3

5387,2

2155,8

1245

19,2

4545

1958,7

177,4

3250,2

481,5

84,2

37,5

2014(3)

69875

47022

25731

2,2

601,1

5406,7

2155,8

1322

19,4

4680

2015

176,7

3114,3

485,6

84,2

37,7

X18

X19

X20

Y1

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

Y11

Y12

Y13

2013(1)

1,85

20,2

61,2

118

126

8

113

78

35

8,8

52,8

241,5

282,1

16,7

376

2013(2)

3,4

25,1

61,8

226

268

42

94

76

18

8,5

50,1

238,4

274

17,1

865

2013(3)

3,45

25,6

61,8

273

187

-86

208

73

135

7,3

44,4

236

278,1

17,5

1293

2013(4)

2,17

16,2

62

228

280

52

162

64

98

6,7

41,3

235,4

280,6

18,8

1691

2014(1)

2,01

17,8

62,4

180

152

-28

145

84

61

6,8

42,1

215

278,4

20,1

426

2014(2)

3,5

25,8

62,4

215

214

-1

79

52

27

7,05

46,7

200,4

279,6

25,4

798

2014(3)

3,4

23,5

62,5

314

165

-149

197

77

120

7,3

48,6

174

276,5

29,1

1428

Y15

Y16

Y17

Y18

Y19

Y20

Y21

Y22

Y23

Y24

Y25

Y26

Y27

2013(1)

89

133

125

4

19

15

246

178

15

22

7

5

10

2013(2)

208

355

261

6

44

26

573

406

28

58

15

12

29

2013(3)

279

519

444

8

72

37

837

586

50

85

18

20

46

2013(4)

390

681

562

10

95

46

1111

777

64

133

22

27

49

2014(1)

129

158

111

7

24

11

275

180

16

47

8

8

3

2014(2)

214

288

256

9

49

21

484

316

34

79

13

8

20

2014(3)

325

577

474

11

96

34

910

621

70

130

17

12

28

Рис. 2. График изменения объема промышленной продукции за 2004 - 2014 годы.

Рис. 3. График изменения средней заработной платы за 2004 - 2014 годы.

Рис. 4. График изменения уровня безработицы за 2004 - 2014 годы.

Рис. 5. График изменения общей раскрываемости преступлений за 2004 - 2014 годы.

Рис. 6. График изменения средней продолжительности жизни за 2004 - 2014 годы.

Рис. 7. График изменения рождаемости за 2004 - 2014 годы.

Рис. 8. График изменения смертности за 2004 - 2014 годы.

Рис. 9. График изменения количества зарегистрированных браков за 2004 - 2014 годы.

Рис. 10. График изменения заболеваемости онкологическими заболеваниями за 2004 - 2014 годы.

Рис. 11. График изменения общего количества преступлений за 2004 - 2014 годы.

Рис. 12. График изменения количества краж за 2004 - 2014 годы.

Характер изменения переменных во времени (рис. 1.- 12.) убедительно показывает наличие в них случайности. Так как все отобранные для исследования переменные (таблица 1) непрерывные и количественные, то для исследования целесообразно применять регрессионный анализ. Поскольку имеется сравнительно большое количество факторов (М = 20) то целесообразно проведение факторного анализа, который позволяет значительно уменьшить количество факторов, используемых при исследовании.

Ставится задача разработки модели комфортности проживания жителей в городе, состоящего из совокупности регрессионных моделей, функционально представляемых в следующем виде:

;(1)

,

где yj - j-й показатель комфортности проживания жителей в городе;

K - количество показателей комфортности проживания жителей в городе;

xi - i-й фактор, влияющий на комфортность проживания жителей в городе;

M - общее количество экономических, экологических и социальных факторов.

По зависимостям (2.1.1) можно произвести оценку степени влияния факторов на показатели комфортности жизни жителей в городе по коэффициентам эластичности и бета-коэффициентам.

Для временного прогнозирования найдем зависимости переменных от времени, функционально представляемых в следующем виде:

;(2)

,

где M - количество факторов;

K - количество откликов.

Задача факторного анализа заключается в сокращении в исследовании количества факторов, которых у нас сорок два, и выделении из них общих скрытых факторов Fz, , которые далее будем называть просто общими факторами, и характерных факторов Ui, . Если у фактора только одна нагрузка, значительно отличающаяся от нуля, то он называется характерным фактором. Требуется найти зависимости:

; (3)

.

При условии, что R много меньше M и все Fz ортогональны по отношению друг к другу и требуется оценить степень влияния общих факторов Fz, и характерных факторов Ui, , на экономические показатели деятельности предприятия (yj) [8].

Для получения математических зависимостей (1) - (3) в аналитическом виде и обеспечения корректности получаемых результатов предлагается методика, которая должна включать в себя следующие этапы:

1) Выбор совокупности основных статистических показателей, описывающих условия проживания жителей в городе и сбор ИСД по ним за двенадцать лет.

2) Вычисление основных статистических характеристик ИСД: оценок математического ожидания (среднего); среднего квадратического (стандартного) отклонения; ошибки вычисления среднего значения; асимметрии, эксцесса и их ошибок; построение доверительных интервалов.

3) Оценка нормальности распределения ИСД (их подчинения нормальному закону);

4) Факторный анализ.

5) Вычисление парных коэффициентов линейной корреляции.

6) Получение уравнений регрессии, представляющих собой зависимость комфортности проживания жителей в городе от влияющих на факторов.

b. Основные статистические характеристики исходных данных. Вычисление основных статистических характеристик ИСД. Проверка «нормальности»

Важным способом "описания" переменной является форма ее распределения, которая показывает, с какой частотой значения переменной попадают в определенные интервалы. Нас интересует, насколько точно распределение можно аппроксимировать нормальным распределением. Простые описательные статистики дают об этом некоторую информацию. Первоначальное самое общее представление о распределении случайных величин может быть получено на основе анализа их основных статистических характеристик. Будем обозначать и называть их так, как это принято в пакете Statistica 6.0.

Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы. Точная форма нормального распределения (характерная "колоколообразная кривая") определяется только двумя параметрами: средним и стандартным отклонением.

Характерное свойство нормального распределения состоит в том, что 68% всех его наблюдений лежат в диапазоне ±1 стандартное отклонение от среднего, а диапазон ±2 стандартных отклонения содержит 95% значений. Другими словами, при нормальном распределении, стандартизованные наблюдения, меньшие -2 или большие +2, имеют относительную частоту менее 5%. (Стандартизованное наблюдение означает, что из исходного значения вычтено среднее и результат поделен на стандартное отклонение (корень из дисперсии))[22].

Итак, первоначально дадим определение основным статистическим характеристикам и попытаемся найти их оценки. А далее, оценим насколько распределение выбранных нами переменных близко к нормальному распределению. Среднее - среднее арифметическое значение (оценка математического ожидания):

; (4)

,

где n - количество учитываемых временных интервалов;

M - количество факторов;

К - количество откликов;

vij - значение j-й переменной на i-ом временном интервале;

- среднее арифметическое значение j-той переменной по n экспериментальным значениям;

i - номер строки, в таблицах исходных данных;

j - номер столбца, в таблицах исходных данных.

Далее во всех формулах данного раздела используются одни и те же обозначения переменных, что применялись выше, поэтому нет необходимости их дальнейшего пояснения.

Стандартное отклонение (оценка среднего квадратического отклонения) - это мера того, насколько широко распределены экспериментальные данные относительно их среднего значения:

; (5)

.

Дисперсия.

Квадрат среднего квадратичного отклонения даёт величину дисперсии :

; (6)

.

Стандартная ошибка среднего - отношение стандартного отклонения к корню квадратному из количества учитываемых временных интервалов:

; (7)

,

где - стандартное отклонение, вычисленное по формуле (6).

Медиана - это число, которое является серединой совокупности случайных чисел, то есть половина случайных чисел имеют значения, меньшие, чем медиана, а другая половина чисел имеют значения, большие, чем медиана.

Асимметрия характеризует степень несимметричности распределения относительно его среднего. Для нормального закона асимметрия равна нулю. Положительная асимметрия указывает на отклонение распределения в сторону положительных значений. Отрицательная асимметрия указывает на отклонение в сторону отрицательных значений. Оценка асимметрии вычисляется по формуле:

; (8)

.

Стандартная ошибка асимметрии:

, (9)

где n - количество учитываемых временных интервалов.

Эксцесс характеризует относительную остроконечность или сглаженность распределения по сравнению с нормальным распределением. Для нормального распределения эксцесс равен нулю. Положительный эксцесс соответствует относительно остроконечному распределению. Отрицательный эксцесс соответствует относительно сглаженному распределению:

;(10)

.

Средняя ошибка эсцесса:

, (11)

где n - количество учитываемых временных интервалов.

Минимум - минимальное значение.

Максимум - максимальное значение.

Счет - количество экспериментальных данных.

Вычисленные по формулам 4-11 статистические характеристики приведены в таблице 3.

Закон распределения. Наиболее существенной характеристикой распределения случайных величин является закон распределения, который наиболее полно показывает, с какой частотой значения переменной попадают в определенные интервалы. Эти интервалы, называются интервалами группировки.

Таблица 3. Основные статистические характеристики ИСД

Описательная статистика

Счет

Среднее

Медиана

Сумма

Минимум

Максимум

Дисперсия выборки

Стандартное отклонение

x1

43

68007,88

67997,00

2924339

65876,00

69875,00

946234

972,746

x2

43

42461,28

42416,00

1825835

38272,00

47022,00

6280301

2506,053

x3

43

26635,09

26258,00

1145309

25280,00

36645,00

3049195

1746,195

x4

43

3,05

2,20

131

1,55

6,27

2

1,483

x5

43

269,18

203,30

11575

46,30

617,30

32898

181,379

x6

43

2347,41

1640,00

100939

205,10

5406,70

3033068

1741,570

x7

43

1017,46

881,40

43751

238,40

2155,80

438434

662,144

x8

43

535,38

488,80

23021

135,30

1322,00

119297

345,395

x9

43

17,82

17,90

766

16,00

19,40

1

1,121

X10

43

6907,05

6570,00

297003

3871,00

12200,00

4727123

2174,195

x11

43

759,45

431,80

32656

50,00

2015,00

473748

688,293

x12

43

83,34

71,20

3584

7,60

177,40

3623

60,188

x13

43

1519,39

1198,10

65334

568,10

3250,20

772109

878,698

x14

43

212,11

173,50

9121

22,40

485,60

33103

181,942

x15

43

98,63

92,50

4241

83,00

125,80

246

15,693

x16

43

36,02

36,20

1549

34,40

37,70

1

0,908

x17

43

165,25

165,00

7106

162,60

170,70

5

2,330

x18

43

66,80

69,70

2872

47,30

81,70

146

12,075

x19

43

2,72

2,70

117

1,60

4,00

1

0,730

x20

43

20,31

20,20

873

15,44

25,80

8

2,785

y1

43

62,51

62,40

2688

60,50

65,40

2

1,334

y2

43

178,72

197,00

7685

49,00

314,00

3888

62,355

y3

43

191,81

211,00

8248

74,00

280,00

2744

52,383

y4

43

13,09

14,00

563

-149,00

117,00

2937

54,196

y5

43

105,77

91,00

4548

35,00

215,00

1884

43,409

y6

43

83,93

77,00

3609

24,00

211,00

1361

36,886

y7

43

21,84

15,00

939

-63,00

135,00

1394

37,336

y8

43

14,92

15,10

642

6,70

24,80

31

5,586

y9

43

66,07

70,50

2841

41,30

83,80

158

12,560

y10

43

216,43

221,50

9306

156,90

251,20

613

24,764

y11

43

276,38

274,10

11884

230,30

339,40

1144

33,830

y12

43

18,58

18,00

799

9,70

29,10

14

3,729

y13

43

884,72

814,00

38043

235,00

1844,00

218299

467,225

y14

43

37,35

32,00

1606

0,00

142,00

1069

32,703

y15

43

344,79

304,00

14826

0,00

904,00

57580

239,958

y16

43

190,37

147,00

8186

0,00

681,00

28547

168,960

y17

43

215,19

204,00

9253

0,00

562,00

29264

171,067

y18

43

9,84

9,00

423

1,00

22,00

27

5,177

y19

43

49,44

46,00

2126

0,00

113,00

1022

31,972

y20

43

18,44

17,00

793

5,00

46,00

100

10,003

y21

43

520,93

484,00

22400

74,00

1111,00

82924

287,964

y22

43

365,65

326,00

15723

2,00

802,00

46535

215,720

y23

43

30,42

29,00

1308

7,00

70,00

298

17,277

y24

43

44,05

33,00

1894

1,00

133,00

1138

33,741

y25

43

11,35

10,00

488

1,00

30,00

51

7,111

y26

43

9,67

8,00

416

1,00

27,00

45

6,718

y27

43

16,26

13,00

699

0,00

49,00

171

13,081

Описательная статистика

Стандартная ошибка

Асимметричность

Стандартная ошибка ассиметричности

Эксцесс

Сиандартная ошибка эксцесса

x1

148,3423

-0,370816

0,361358

0,20546

0,709035

x2

382,1695

0,159959

0,361358

-0,79825

0,709035

x3

266,2922

4,702195

0,361358

26,58146

0,709035

x4

0,2262

0,837132

0,361358

-0,69592

0,709035

x5

27,6600

0,792158

0,361358

-0,76510

0,709035

x6

265,5870

0,514599

0,361358

-1,28102

0,709035

x7

100,9760

0,427622

0,361358

-1,31017

0,709035

x8

52,6722

0,511764

0,361358

-0,84256

0,709035

x9

0,1710

-0,146950

0,361358

-1,55993

0,709035

X10

331,5616

0,809377

0,361358

0,09733

0,709035

x11

104,9637

0,685823

0,361358

-1,17096

0,709035

x12

9,1786

0,288999

0,361358

-1,50186

0,709035

x13

134,0001

0,783642

0,361358

-0,79451

0,709035

x14

27,7459

0,302610

0,361358

-1,70022

0,709035

x15

2,3932

0,812490

0,361358

-0,99516

0,709035

x16

0,1384

-0,237886

0,361358

-1,10816

0,709035

x17

0,3554

0,673924

0,361358

-0,26805

0,709035

x18

1,8414

-0,325754

0,361358

-1,53445

0,709035

x19

0,1113

0,107436

0,361358

-1,36638

0,709035

x20

0,4246

0,259291

0,361358

-0,56386

0,709035

y1

0,2035

0,456552

0,361358

-0,30285

0,709035

y2

9,5091

-0,294371

0,361358

-0,50524

0,709035

y3

7,9884

-0,636641

0,361358

-0,39261

0,709035

y4

8,2648

-0,498234

0,361358

0,84165

0,709035

y5

6,6199

1,090615

0,361358

0,54642

0,709035

y6

5,6250

1,701841

0,361358

3,56164

0,709035

y7

5,6937

0,886719

0,361358

2,09139

0,709035

y8

0,8519

0,098642

0,361358

-1,22610

0,709035

y9

1,9154

-0,578830

0,361358

-1,11316

0,709035

y10

3,7765

-0,483950

0,361358

-0,58495

0,709035

y11

5,1590

0,360644

0,361358

-1,22705

0,709035

y12

0,5687

0,347621

0,361358

0,73213

0,709035

y13

71,2511

0,456941

0,361358

-0,82229

0,709035

y14

4,9871

1,223421

0,361358

1,80437

0,709035

y15

36,5932

0,681457

0,361358

-0,10805

0,709035

y16

25,7662

1,001447

0,361358

0,68341

0,709035

y17

26,0875

0,425861

0,361358

-0,97691

0,709035

y18

0,7896

0,192700

0,361358

-0,72543

0,709035

y19

4,8757

0,265400

0,361358

-0,95536

0,709035

y20

1,5255

0,782571

0,361358

-0,07017

0,709035

y21

43,9142

0,494795

0,361358

-0,76096

0,709035

y22

32,8970

0,448414

0,361358

-0,71240

0,709035

y23

2,6347

0,641488

0,361358

-0,24552

0,709035

y24

5,1455

1,123610

0,361358

0,66943

0,709035

y25

1,0844

0,621171

0,361358

-0,29549

0,709035

y26

1,0245

0,870505

0,361358

0,18668

0,709035

y27

1,9948

0,979832

0,361358

0,40829

0,709035

Выскажем гипотезу, что исходные статистические данные подчинены нормальному закону, и в качестве параметров нормального закона примем оценки математического ожидания и среднего квадратического отклонения, вычисленные по (4) и (5).

Функция плотности нормального закона имеет вид:

, (12)

Так как в нашем случае количество реализаций переменных сравнительно невелико, то для оценки предположения о нормальности принимают критерий Колмогорова - Смирнова [9], используемый в пакете прикладных программ (ППП) Statistica 6.0 [4] .

; (13)

где: F*(vij) - эмпирическая функция распределения j-ой переменной для i-го значения;

F(vij) - гипотетическая функция распределения j-ой переменной для i-го значения;

dj - абсолютная величина разности между эмпирической и гипотетической функциями распределения.

Значения гипотетической функции распределения находятся по статистическим таблицам .

; (14)

Если коэффициент доверия Pк предположению о нормальности эмпирического распределения, который можно найти по статистическим таблицам, например, в [9] превосходит 0,20, то предположение о нормальности не отвергается. Если Рк <0,20, то предположение о нормальности рекомендуется отвергнуть.

Если количество реализаций переменной представляется достаточным для построения гистограммы (не менее семи интервалов и не менее семи попаданий случайной величины в любой из интервалов), то используют критерий согласия Пирсона, более известной как . Он является двухпараметрическим. Один параметр оценивает степень расхождения эмпирических и гипотетических данных, а второй - количество степеней свободы.

, (15)

(16)

где: - мера расхождения эмпирического и гипотетического распределения j-й случайной переменной;

- количество интервалов гистограммы для j-й случайной переменной;

n - количество реализаций случайной величины в эмпирическом распределении;

- частота (количество попаданий) в i-й интервал гистограммы эмпирического распределения j-й случайной величины;

- вероятность попадания j-й случайной величины в i-й интервал гистограммы гипотетического распределения;

- количество степеней свободы j-й случайной величины;

- количество параметров гипотетического распределения для j-й случайной величины (для нормального закона два: и ).

Вероятность попадания в i-ый интервал гистограммы гипотетического распределения вычисляется по формуле:

(17)

где: - левая и правая граница i-го интервала гистограммы;

f(x) - функция плотности гипотетического распределения.

По вычисленным значениям (13) и (16) по статистическим таблицам находится коэффициент доверия . Если укладывается в рекомендуемый десятипроцентный доверительный интервал 0,1??0,9, то предположение о подчинении эмпирического распределения нормальному закону не отвергается, если же наблюдаемое значение выходит за границы десятипроцентного доверительного интервала, то предположение рекомендуется отвергнуть.

Соответствие эмпирического и гипотетического распределений можно визуально проследить по графикам. При использовании критерия согласия Колмогорова предпочтительнее использовать функции распределения, при использовании критерия согласия предпочтительнее использовать функции плотности. Такие графики строятся и выдаются в специальных программных процедурах ППП Statistica 6.0 и Excel 2011 , на которые производится ориентация вычислений по излагаемому математическому аппарату.

Графики определения нормальности ИСД для распределений случайных величин представлены на рис.13 - 25.

Рис. 13. Эмпирическая и гипотетическая функция плотности распределения X1.

Рис. 14. Эмпирическая и гипотетическая функция плотности распределения X5.

Рис. 15. Эмпирическая и гипотетическая функция плотности распределения X10.

Рис. 16. Эмпирическая и гипотетическая функция плотности распределения X12.

Рис. 17. Эмпирическая и гипотетическая функция плотности распределения X15.

Рис. 18. Эмпирическая и гипотетическая функция плотности распределения X20.

Рис. 19. Эмпирическая и гипотетическая функция плотности распределенияY1.

Рис. 20. Эмпирическая и гипотетическая функция плотности распределенияY7.

Рис. 21. Эмпирическая и гипотетическая функция плотности распределенияY15.

Рис. 22. Эмпирическая и гипотетическая функция плотности распределенияY19.

Рис. 23. Эмпирическая и гипотетическая функция плотности распределенияY23.

Рис. 24. Эмпирическая и гипотетическая функция плотности распределенияY27.

Для анализа «нормальности» исходных статистических данных применен метод Колмогорова - Смирнова. Результаты представлены в виде таблицы 4. Коэффициент доверия найден по статистическим таблицам [9].

Таблица 4. Проверка ИСД на «нормальность»

ПЕРЕМЕННЫЕ

d

Коэффициент доверия

X1

0,14047

0,92112

X2

0,06882

0,45128

X3

0,25656

1,68238

X4

0,22846

1,49811

X5

0,23168

1,51923

X6

0,19144

1,25536

X7

0,17275

1,13280

X8

0,13598

0,89168

X9

0,15726

1,03122

X10

0,11586

0,75974

X11

0,21153

1,38709

X12

0,14092

0,92407

X13

0,18964

1,24355

X14

0,27658

1,81366

X15

0,22093

1,44873

X16

0,13231

0,86761

X17

0,1588

1,04132

X18

0,16144

1,05863

X19

0,15156

0,99385

X20

0,06673

0,43758

Y1

0,09429

0,61830

Y2

0,13951

0,91483

Y3

0,19751

1,29516

Y4

0,09716

0,63712

Y5

0,20128

1,31988

Y6

0,19856

1,30204

Y7

0,12263

0,80414

Y8

0,13092

0,85850

Y9

0,18398

1,20644

Y10

0,12819

0,84060

Y11

0,12584

0,82519

Y12

0,10222

0,67030

Y13

0,11807

0,77424

Y14

0,12671

0,83089

Y15

0,0964

0,63214

Y16

0,14807

0,97096

Y17

0,14347

0,94080

Y18

0,11489

0,75338

Y19

0,11712

0,76801

Y20

0,12539

0,82224

Y21

0,11025

0,72296

Y22

0,10179

0,66748

Y23

0,10691

0,70106

Y24

0,16411

1,07614

Y25

0,14627

0,95916

Y26

0,1333

0,87411

Y27

0,14289

0,93699

c. Вычисление парных коэффициентов корреляции

Тесноту связи между переменными принято характеризовать парными коэффициентами линейной корреляции, вычисляемыми по формуле:

(18)

;

где: n- количество экспериментальных данных;

M- количество факторов ;

K- количество откликов yi (yj);

- значение i-той (j-той) переменной в g-ой точке плана.

Парные коэффициенты линейной корреляции принимают значения от -1 до +1. Значение, близкое к +1, указывает на наличие сильной положительной линейной зависимости между переменными. Значение, близкое к -1, указывает на наличие сильной отрицательной зависимости между переменными. Значение, близкое к 0, указывает на независимость переменных друг от друга. Для более достоверной оценки гипотезы о линейности можно использовать математический аппарат, изложенный в [22], при допущении о нормальности распределения коэффициентов линейной корреляции.

Вычисляется стандартная ошибка оценки коэффициента корреляции:

; (19)

где: n - количество случайных чисел в ИСД;

rij - коэффициент линейной корреляции между I -ой и j- ой переменными.

По статистическим таблицам, например, для рекомендуемого уровня значимости 0,05 [9] и количеству степеней свободы n-2 находим критическое значение tкрит=2,25. Вычисляется критерий Стьюдента:

; (20)

Если вычисленное значение tij>tкрит, то считается, что имеющиеся статистические данные не противоречат предположению о наличии существенной связи между i-ой и j-ой переменными, i= , в противном случае предположение о существенности зависимости между переменными следует отвергнуть.

Путем несложных преобразований (19) и (20) можно получить формулу для непосредственного вычисления критического значения коэффициента линейной корреляции, начиная с которого и выше его по абсолютной величине связь между переменными можно считать существенной.

,; (21)

где - критическое значение критерия Стьюдента для рекомендуемого уровня значимости , определяемого по статистическим таблицам при n - 2 = 43 - 2 = 41 степенях свободы [9].

n = 43 - количество значений в ИСД.

По (21) находим

= (22)

Таблица 5. Парные коэффициенты линейной корреляции

Переем.

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

X11

X12

X13

X14

X15

X16

X17

X18

X19

X20

X1

1,00

X2

0,91

1,00

X3

-0,38

-0,30

1,00

X4

-0,06

-0,42

-0,06

1,00

X5

0,61

0,79

-0,13

-0,60

1,00

X6

0,77

0,96

-0,19

-0,60

0,89

1,00

X7

0,79

0,96

-0,19

-0,55

0,85

0,98

1,00

X8

0,80

0,97

-0,21

-0,57

0,84

0,98

0,98

1,00

X9

0,78

0,95

-0,20

-0,57

0,74

0,95

0,95

0,95

1,00

X10

-0,60

-0,70

0,24

0,25

-0,41

-0,65

-0,69

-0,69

-0,67

1,00

X11

0,75

0,93

-0,15

-0,58

0,91

0,99

0,98

0,97

0,91

-0,63

1,00

X12

0,78

0,96

-0,19

-0,59

0,85

0,99

0,99

0,98

0,97

-0,68

0,97

1,00

X13

0,77

0,93

-0,26

-0,60

0,93

0,98

0,96

0,96

0,89

-0,62

0,98

0,96

1,00

X14

0,69

0,92

-0,16

-0,71

0,86

0,98

0,97

0,96

0,96

-0,63

0,97

0,98

0,96

1,00

X15

-0,85

-0,81

0,32

-0,02

-0,35

-0,65

-0,72

-0,71

-0,76

0,72

-0,62

-0,71

-0,59

-0,60

1,00

X16

0,01

0,08

0,10

-0,27

0,56

0,25

0,16

0,16

-0,04

0,19

0,30

0,13

0,34

0,20

0,38

1,00

X17

0,33

0,17

0,02

0,47

0,03

0,09

0,09

0,06

0,11

0,05

0,09

0,07

0,03

0,01

-0,31

0,08

1,00

X18

-0,69

-0,85

0,14

0,40

-0,77

-0,88

-0,91

-0,87

-0,82

0,72

-0,89

-0,89

-0,85

-0,85

0,69

-0,14

-0,19

1,00

X19

0,27

0,32

0,05

-0,09

0,24

0,26

0,27

0,31

0,34

-0,22

0,25

0,31

0,21

0,27

-0,35

-0,14

0,16

-0,27

1,00

X20

0,27

0,43

-0,04

-0,44

0,44

0,43

0,45

0,48

0,45

-0,29

0,44

0,47

0,42

0,46

-0,27

-0,02

-0,15

-0,38

0,70

1,00

Продолжение Таблицы 5.

Y1

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

Y11

Y12

Y13

Y14

Y15

Y16

Y17

Y18

Y19

Y20

Y21

Y22

Y23

X1

-0,15

0,25

0,06

-0,22

0,33

-0,05

0,43

-0,20

-0,20

0,22

-0,57

-0,09

0,30

0,45

0,25

0,72

0,63

0,03

0,49

0,45

0,39

0,42

0,28

X2

-0,48

0,38

0,17

-0,26

0,48

0,08

0,48

-0,49

-0,38

0,47

-0,52

0,00

0,35

0,52

0,18

0,77

0,66

0,00

0,44

0,46

0,42

0,43

0,27

X3

-0,07

0,12

0,02

-0,12

-0,10

0,12

-0,24

0,00

0,07

0,01

0,30

-0,04

-0,14

-0,18

-0,06

-0,27

-0,23

0,05

-0,10

-0,06

-0,19

-0,23

-0,16

X4

0,75

-0,31

-0,22

0,14

-0,42

-0,32

-0,17

0,79

0,44

-0,64

-0,09

-0,45

-0,17

-0,32

0,14

-0,28

-0,20

0,00

0,03

-0,04

-0,14

-0,09

-0,11

X5

-0,48

0,44

0,22

-0,29

0,48

0,12

0,44

-0,77

-0,70

0,40

-0,03

0,20

0,13

0,20

-0,22

0,60

0,38

-0,14

0,08

0,29

0,18

0,14

0,09

X6

-0,59

0,42

0,19

-0,29

0,52

0,15

0,46

-0,66

-0,50

0,53

-0,35

0,06

0,29

0,46

0,04

0,71

0,57

-0,01

0,32

0,43

0,34

0,33

0,21

X7

-0,62

0,36

0,14

-0,27

0,54

0,21

0,42

-0,61

-0,48

0,54

-0,42

0,01

0,24

0,39

0,01

0,68

0,54

-0,12

0,28

0,38

0,29

0,29

0,15

X8

-0,60

0,42

0,18

-0,30

0,52

0,13

0,47

-0,62

-0,47

0,50

-0,42

0,11

0,33

0,48

0,09

0,73

0,61

-0,02

0,37

0,44

0,38

0,38

0,26

X9

-0,61

0,35

0,19

-0,22

0,50

0,22

0,37

-0,51

-0,29

0,63

-0,53

-0,02

0,36

0,61

0,22

0,71

0,65

0,04

0,43

0,41

0,40

0,41

0,22

X10

0,45

-0,13

-0,05

0,11

-0,36

-0,06

-0,36

0,26

0,15

-0,37

0,62

0,11

-0,24

-0,40

-0,16

-0,44

-0,38

0,08

-0,32

-0,40

-0,29

-0,31

-0,14

X11

-0,59

0,39

0,17

-0,28

0,54

0,19

0,44

-0,68

-0,56

0,50

-0,30

0,05

0,21

0,34

-0,06

0,66

0,50

-0,11

0,23

0,40

0,26

0,25

0,15

X12

-0,64

0,37

0,18

-0,24

0,53

0,23

0,40

-0,61

-0,44

0,59

-0,45

0,01

0,27

0,47

0,06

0,69

0,57

-0,07

0,31

0,38

0,32

0,32

0,15

X13

-0,55

0,37

0,16

-0,27

0,54

0,16

0,47

-0,70

-0,57

0,48

-0,26

0,15

0,21

0,35

-0,07

0,67

0,48

-0,10

0,22

0,36

0,27

0,25

0,16

X14

-0,68

0,39

0,20

-0,25

0,55

0,25

0,39

-0,69

-0,46

0,60

-0,35

0,09

0,26

0,47

0,02

0,65

0,53

-0,03

0,27

0,35

0,29

0,28

0,16

X15

0,31

-0,16

-0,06

0,14

-0,29

-0,01

-0,33

0,03

0,04

-0,33

0,81

0,35

-0,35

-0,50

-0,38

-0,65

-0,65

0,03

-0,54

-0,47

-0,42

-0,48

-0,26

X16

0,10

0,27

-0,01

-0,32

0,16

-0,07

0,25

-0,54

-0,64

-0,27

0,66

0,36

-0,24

-0,32

-0,55

0,04

-0,21

-0,12

-0,31

0,00

-0,23

-0,31

-0,06

X17

0,47

0,10

-0,05

-0,17

-0,05

-0,11

0,05

0,34

0,04

-0,36

-0,12

-0,61

-0,08

0,10

0,11

0,12

0,15

0,09

0,21

0,26

-0,05

-0,04

-0,08

X18

0,58

-0,28

-0,04

0,28

-0,51

-0,22

-0,37

0,49

0,48

-0,44

0,44

0,17

-0,12

-0,29

0,08

-0,55

-0,41

0,24

-0,16

-0,36

-0,19

-0,19

0,01

X19

-0,14

0,58

0,37

-0,31

0,02

-0,14

0,16

-0,04

0,00

0,15

-0,37

-0,10

0,29

0,40

0,27

0,34

0,37

0,21

0,34

0,25

0,30

0,31

0,22

X20

-0,41

0,56

0,38

-0,28

0,10

-0,05

0,17

-0,30

-0,20

0,36

-0,24

0,20

0,28

0,31

0,14

0,35

0,34

0,04

0,19

0,16

0,29

0,29

0,24

Продолжение Таблицы 5.

Y1

Y2

Y3

Y4

Y5

Y6

Y7

Y8

Y9

Y10

Y11

Y12

Y13

Y14

Y15

Y16

Y17

Y18

Y19

Y20

Y21

Y22

Y23

Y1

1,00

Y2

-0,22

1,00

Y3

-0,21

0,57

1,00

Y4

0,06

-0,60

0,32

1,00

Y5

-0,41

0,14

-0,06

-0,23

1,00

Y6

-0,35

-0,33

-0,24

0,14

0,58

1,00

Y7

-0,13

0,49

0,16

-0,40

0,59

-0,32

1,00

Y8

0,64

-0,36

-0,16

0,26

-0,42

-0,12

-0,37

1,00

Y9

0,32

-0,29

-0,09

0,24

-0,31

0,07

-0,43

0,79

1,00

Y10

-0,74

0,08

0,21

0,11

0,29

0,31

0,02

-0,40

-0,11

1,00

Y11

0,28

0,00

-0,09

-0,09

-0,11

-0,08

-0,05

-0,27

-0,36

-0,32

1,00

Y12

-0,10

0,16

0,00

-0,18

0,17

0,04

0,16

-0,45

-0,21

-0,03

0,42

1,00

Y13

-0,22

0,59

0,58

-0,12

0,00

-0,48

0,47

-0,10

0,01

0,27

-0,34

0,04

1,00

Y14

-0,24

0,38

0,32

-0,13

0,06

-0,19

0,25

-0,06

0,14

0,40

-0,57

-0,11

0,73

1,00

Y15

0,06

0,33

0,40

0,00

-0,19

-0,37

0,15

0,39

0,51

0,18

-0,50

-0,17

0,79

0,73

1,00

Y16

-0,32

0,58

0,39

-0,29

0,34

-0,22

0,62

-0,38

-0,34

0,35

-0,40

0,02

0,75

0,65

0,47

1,00

Y17

-0,28

0,54

0,42

-0,21

0,18

-0,29

0,49

-0,16

-0,09

0,37

-0,53

-0,10

0,85

0,80

0,70

0,94

1,00

Y18

0,12

0,47

0,52

-0,04

-0,25

-0,46

0,17

0,15

0,32

-0,07

-0,11

0,02

0,72

0,58

0,73

0,28

0,46

1,00

Y19

-0,03

0,49

0,43

-0,15

0,04

-0,38

0,42

0,13

0,23

0,15

-0,50

-0,12

0,86

0,78

0,90

0,75

0,87

0,68

1,00

Y20

-0,11

0,51

0,48

-0,13

0,14

-0,43

0,59

-0,15

-0,24

0,08

-0,29

-0,21

0,77

0,58

0,51

0,75

0,75

0,52

0,76

1,00

Y21

-0,22

0,59

0,57

-0,13

0,05

-0,47

0,52

-0,12

-0,05

0,27

-0,37

0,03

0,99

0,70

0,76

0,81

0,88

0,65

0,86

0,79

1,00

Y22

-0,22

0,56

0,56

-0,10

0,04

-0,45

0,48

-0,07

0,00

0,27

-0,44

-0,01

0,98

0,71

0,78

0,80

0,89

0,62

0,86

0,76

0,99

1,00

Y23

-0,05

0,55

0,42

-0,22

0,06

-0,53

0,59

-0,16

-0,13

-0,01

-0,14

0,23

0,87

0,54

0,59

0,69

0,72

0,61

0,75

0,75

0,87

0,85

1,00

Рассмотрим корреляционную матрицу (см. Таблицу 5.)

Проанализируем силу связи показателей комфортности жизни жителей исследуемого города Елабуга между собой. Положительная, близкая к линейной, связь существует между y13 и y17, y13 и y19, y13 и y21, y13 и y22, y13 и y23, y13 и y25, y13 и y26, y14 и y17, y15 и y19, y16 и y17, y16 и y21, y16 и y22, y16 и y24, y17 и y19, y17 и y21, y17 и y22, y17 и y24, y17 и y25, y17 и y26, y19 и y21, y19 и y22, y21 и y22, y21 и y23, y21 и y25, y21 и y26, y22 и y23, y22 и y25, y22 и y26, y24 и y25. Наименее связанными с другими показателями комфортности жизни жителей являются y1, y4, y12 и y5, где

Таблица 6. Показатели комфортности жизни людей

Y1

Средняя продолжительность жизни (лет)

Y4

Естественный прирост (чел.)

Y5

Количество зарегистрированных браков (шт.)

Y12

Заболеваемость системы кровообращения (на 1000 чел.)

Y13

Общее количество преступлений(шт.)

Y14

Количество особо тяжких преступлений (шт.)

Y15

Количество тяжких преступлений (шт.)

Y16

Количество преступлений средней тяжести(шт.)

Y17

Количество преступлений небольшой тяжести (шт.)

Y19

Количество причинений вреда здоровью (шт.)

Y21

Количество краж (шт.)

Y22

Количество мошенничеств (шт.)

Y23

Количество грабежей (шт.)

Y24

Количество разбоев (шт.)

Y25

Количество вымогательств (шт.)

Y26

Количество неправомерных завладений АМТ (шт.)

Проанализируем силу связи показателей комфортности жизни жителей с их средой обитания между собой в исследуемом городе Елабуга по абсолютным значениям

Наиболее сильная положительная, близкая к линейной, связь обнаруживается между откликами Yj, j=1,k и факторами Xi, i=1,n:

Y1 - Средняя продолжительность жизни (лет) связан со следующими факторами:

X4 - Уровень безработицы (%);

Y16 - Обеспеченность населения врачами (на 1000 чел.):

X1 - Численность населения (чел.);

X2 - Численность населения трудоспособного возраста (чел.);

X6 - Среднемесячная заработная плата (руб., до 2006г. - тыс. руб.);

X8 - Стоимость набора из 25 основных продуктов питания (руб., до 2006г. - тыс. руб.);

X9 - Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.);

Y24 - Естественный прирост (чел.):

X2 - Численность населения трудоспособного возраста (чел.);

X6 - Среднемесячная заработная плата (руб., до 2006г. - тыс. руб.);

X7 - Прожиточный минимум на члена семьи (руб., до 2006г. - тыс. руб.);

X8 - Стоимость набора из 25 основных продуктов питания (руб., до 2006г. - тыс. руб.);

X9 - Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.);

X10 - Ввод жилых домов (кв. м. общ. пл.);

X11 - Объем реализации платных услуг в расчете на 1 жителя (руб., до 2006г. - тыс. руб.);

X13 -Оборот розничной торговли на душу населения (руб., до 2006г. - тыс. руб.);

Наиболее сильную отрицательную связь, близкую к линейной, можно выделить между откликами (Y) и факторами (X):

Y1 - Средняя продолжительность жизни (лет) связан со следующими факторами:

X7 - Прожиточный минимум на члена семьи (руб., до 2006г. - тыс. руб.);

X8 - Стоимость набора из 25 основных продуктов питания (руб., до 2006г. - тыс. руб.);

X9 - Обеспеченность населения общей площадью жилья на 1 жителя (кв. м.);

X11 - Объем реализации платных услуг в расчете на 1 жителя (руб., до 2006г. - тыс. руб.);

Y9 - Заболеваемость туберкулезом (на 100 тыс. чел):

X16 - Обеспеченность населения врачами (на 1000 чел.);

Y10 - Заболеваемость онкологическими заболеваниями (на 100 тыс. чел):

X4 - Уровень безработицы (%);

Y16 - Количество преступлений средней тяжести (шт.):

X15 - Обеспеченность населения больничными койками (на 1000 чел.);

Y17 - Количество преступлений небольшой тяжести (шт.):

X15 - Обеспеченность населения больничными койками (на 1000 чел.);

Рассмотрим взаимосвязь факторов между собой. Положительная близкая к линейной связь имеется между следующими факторами:

Х1: х2, х6, х7, х,8 ,х9, х11, х12, х13;

X2: x5, х6, x7, х8, x9, x11, x12, x13, x14;

X5: x2, x6, x7, x8, x9, х11, x12, x13, x14;

X6: x1, x2, x5, x7, x8, x9, x11, x12, x13, x14;

X7: x1, x2, x5, x6, x8, x9, x11, x12, x13, х14;

X8: x1, x2, x5, x6, x7, х9, x11, x12, x13, x14;

X9: х1, x2, х6, x7, x8, x11, x12, x13, x14;

X10: x2, x5, x6, x7, x8, x9;

Отрицательная близкая к линейной связь имеется между следующими факторами:

X1: x15, х18;

X2: x10, x15, x18;

Х4: х14;

Х5: х18;

Х6: х18;

Х7: х15, х18;

Х8: х15, х18;

Х8: х15, х18;

Вычисленные значение (22) и результаты анализа таблицы 5 позволяют сделать следующие обобщенные выводы:

Во-первых, коэффициенты линейной корреляции между откликами и факторами примерно в половине случаев по абсолютной величине превышают критическое значение. Поэтому уравнения регрессии могут содержать в себе факторы в первой и второй степени, а также в виде функций от факторов.

Во-вторых, коэффициенты линейной корреляции между факторами в некоторых случаях превышают по абсолютной величине найденное критическое значение и достигают значения более 0,8. В таких случаях можно ожидать, что некоторые факторы могут не входить в уравнения регрессии и оказывать влияние на отклики через другие факторы с сильной корреляционной связью между ними.

В третьих, сила связи между показателями эффективности и факторами варьируется в весьма широких пределах. Абсолютная величина коэффициента линейной корреляции, меняющаяся в диапазоне от 0,01 до 0,99, показывает, что для сохранения всех переменных в уравнениях регрессии целесообразно использовать нелинейную регрессию.

Для коэффициентов линейной корреляции можно построить доверительные интервалы для принятой доверительной вероятности

; ; (23)

d. Регрессионный анализ

Так как все переменные, используемые для исследования являются количественными и непрерывными величинами, то в этом случае наиболее целесообразно применение регрессионного анализа [21], основанного на методе наименьших квадратов (МНК), который требует, чтобы сумма квадратов отклонений экспериментальных значений от вычисленных по аппроксимирующей зависимости была минимальной:

(24)

где yij - экспериментальное значение j-го отклика в i-ом варианте;

fj(xi1, xi2, …, xiM) - значение j-го отклика в i-ом варианте, вычисленное по аппроксимирующей зависимости;

n - количество вариантов;

M - количество факторов.

В последнее время наряду с требованием (24) для оценки качества аппроксимации начали использовать и другие показатели, как правило, основанные на дисперсионном анализе [13]. Следует отметить, что если МНК не накладывает на исходные данные каких-либо ограничений [9], то дисперсионный анализ требует “нормальности” анализируемых статистических данных.

Поставлена задача минимизации количества переменных, входящих в уравнения регрессии из совокупности заданных переменных.

(25)

где: L - общее количество переменных, представленных для отбора в уравнения регрессии;

Qj- число переменных в j - ом уравнении регрессии;

Uij- коэффициент, принимающий значение «1», если i -ая переменная входит в j - ое уравнение регрессии и «0», если не входит;

K - количество откликов (уравнений регрессий).

На получаемые уравнения регрессии наложены следующие ограничения:

1. Количество степеней свободы:

(26)

2.Отношение стандартной ошибки к среднему значению должно быть не более 0,05:

(27)

3.Уровень значимости множественного коэффициента детерминации, показывающий в долях от единицы насколько изменение переменных, вошедших в уравнение регрессии, определяет изменение показателя эффективности, не должен превышать 0,05:

(28)

4.Уровень значимости уравнения регрессии по критерию Фишера должен быть не более 0,05:

Pfj <0,05; (29)

5.Все коэффициенты уравнения регрессии должны иметь уровень значимости по критерию Стьюдента не более 0,05.

PSt ij<0,05, (30)

Кроме того, желательно чтобы в уравнения регрессии входило как можно большее количество факторов, хотя бы в виде каких-либо математических функций. Желательно, чтобы в уравнения регрессии не входили произведения факторов между собой. Если это условие удается выполнить, то облегчается анализ степени влияния факторов на показатели эффективности, который можно производить в этом случае для каждого фактора независимо от других факторов.

Для решения поставленной задачи с удовлетворением условия (4.2.1) требуется вычислять коэффициенты аппроксимирующих зависимостей по формуле:

Bj=(XTX)-1(XTYj) (31)

где: Bj - матрица - столбец коэффициентов аппроксимирующей зависимости j - го отклика;

Х - матрица планов (вариантов) переменных х;

ХТ - транспонированная матрица планов;

ХТХ - информационная матрица;

(ХTХ)-1 = А - матрица, обратная информационной;

Yj - матрица - столбец j - го отклика.

Параметры, перечисленные в постановке задачи (25-30) вычисляются по следующим формулам:

Коэффициент множественной корреляции j-го уравнения регрессии:

(32)

где: SSjобъясн - объясненная сумма квадратов j - го уравнения регрессии,

SSjост - остаточная сумма квадратов j - го уравнения регрессии.

- коэффициент множественной детерминации j - го уравнения регрессии:

(33)

Скорректированный коэффициент множественной детерминации j - го уравнения регрессии:

(34)

где: n- количество вариантов экспериментальных данных (точек плана);

Qj - количество переменных в j - ом уравнении регрессии;

Критерий Фишера j - го уравнения регрессии.

(4.2.12)

Стандартная ошибка вычисления, показывающая дисперсию экспериментальных значений относительно уравнения регрессии:

(35)

где: - вычисленное значение j-го отклика для i-ых значений факторов;

n- количество вариантов экспериментальных данных (точек плана);

M- количество факторов;

yij - экспериментальное значение j - го отклика в i-ом варианте.

Регрессионная сумма квадратов (объясненная сумма квадратов) j - го уравнения регрессии:

(36)

с количеством степеней свободы df jобъясн=Qj;

где: n- количество вариантов экспериментальных данных (точек плана);

M- количество факторов;

Qj- количество переменных в j-ом уравнении регрессии;

К - количество откликов (уравнений регрессий);

- вычисленное значение j-го отклика для i-ых значений факторов;

- среднее значение j-го отклика, вычисленное по экспериментальным значениям n точек плана.

Остаточная сумма квадратов отклонений фактических значений от расчетных:

(37)

с количеством степеней свободы: dfjост =n-Qj -1 ,

где: n - количество экспериментальных данных (точек плана);

Qj - количество переменных в j-ом уравнении регрессии;

yji - экспериментальное значение j-го отклика в i-ом варианте;

- вычисленное значение j-го отклика для i-ых значений факторов.

Общая сумма квадратов j - го уравнения регрессии:

(38)

с количеством степеней свободы:

dfобщj=n-1

Дисперсия объясненной суммы квадратов:

(39)

Дисперсия остаточной суммы квадратов:

(40)

Так как коэффициенты уравнений регрессии вычисляются по случайным переменным (31), то они и сами являются случайными величинами и можно оценить ошибку их вычисления и уровень значимости [13].

Стандартная ошибка вычисления коэффициентов уравнения регрессии вычисляется по формуле:

(41)

где: i - порядковый номер коэффициента уравнения регрессии;

Qj -количество переменных в j-ом уравнении регрессии;

Scmj - стандартная ошибка j-го уравнения регрессии;

аii - диагональный элемент матрицы обратной информационной А=(Хт Х)-1.

Вычисляется критерий Стьюдента для всех коэффициентов, входящих в уравнения регрессии:

(42)

с количеством степеней свободы:

dfj = n-Qj-1

По статистическим таблицам, например [13], находим уровень значимости коэффициентов по критерию Стьюдента Pstij. Должно выполняться условие постановки задачи (30).

Уравнения регрессии, связывающие показатели комфортности жизни людей в городе Елабуга с влияющими на них факторами, получены с помощью процедуры пошаговой регрессии пакета прикладных программ Statistica 6.0 [4]-[6], которая в диалоговом режиме системы человек-машина позволила отобрать в уравнения регрессии наиболее существенно влияющие на показатели эффективности факторы. Далее приведем результаты регрессионного анализа и анализа остатков для всех показателей комфортности по 12 годам.

Multiple Regression Results

Dependent: y1 Multiple R = ,97591130 F = 22,01063

R?= ,95240286 df = 20,22

No. of cases: 43 adjusted R?= ,90913273 p = ,000000

Standard error of estimate: ,402258828

Intercept: -83,67455487 Std.Error: 25,16755 t( 22) = -3,325 p = ,0031

x1 beta=,438 x2 beta=1,23 x3 beta=-,07

x4 beta=,020 x5 beta=-,12 x6 beta=-,73

x7 beta=,669 x8 beta=-,20 x9 beta=1,13

X10 beta=-,32 x11 beta=,097 x12 beta=-1,4

x13 beta=,378 x14 beta=-1,4 x15 beta=1,09

x16 beta=,168 x17 beta=,441 x18 beta=,116

x19 beta=,123 x20 beta=-,07

Таблица 6

Beta

Std.Err.

B

Std.Err.

t(22)

p-level

Intercept

-83,6746

25,16755

-3,32470

0,003076

x1

0,43788

0,421541

0,0006

0,00058

1,03876

0,310201

x2

1,22737

1,067631

0,0007

0,00057

1,14962

0,262646

x3

-0,06512

0,066695

-0,0000

0,00005

-0,97645

0,339457

x4

0,02017

0,322398

0,0182

0,29009

0,06258

0,950669

x5

-0,12380

0,318083

-0,0009

0,00234

-0,38922

0,700856

x6

-0,72887

0,849565

-0,0006

0,00065

-0,85793

0,400180

x7

0,66938

0,924378

0,0013

0,00186

0,72415

0,476607

x8

-0,20429

0,461882

-0,0008

0,00178

-0,44230

0,662592

x9

1,13108

0,677727

1,3460

0,80652

1,66893

0,109302

X10

-0,31919

0,111955

-0,0002

0,00007

-2,85102

0,009291

x11

0,09675

0,621965

0,0002

0,00121

0,15556

0,877796

x12

-1,37745

1,038716

-0,0305

0,02303

-1,32611

0,198409

x13

0,37845

0,519503

0,0006

0,00079

0,72848

0,474005

x14

-1,40502

0,864626

-0,0103

0,00634

-1,62501

0,118402

x15

1,09181

0,329064

0,0928

0,02798

3,31793

0,003126

x16

0,16750

0,199093

0,2462

0,29264

0,84133

0,409214

x17

0,44072

0,137928

0,2524

0,07898

3,19530

0,004178

x18

0,11639

0,186981

0,0129

0,02066

0,62247

0,540031

x19

0,12297

0,094959

0,2248

0,17362

1,29498

0,208754

x20

-0,06764

0,096903

-0,0324

0,04644

-0,69799

0,492497

Dependent: y1 Multiple R : ,97591130 F = 22,01063

R?: ,95240286 df = 20,22

No. of cases: 43 adjusted R?: ,90913273 p = ,000000

Standard error of estimate: ,402258828


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.