Обработка экспериментальных данных методами математической статистики

Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

Рубрика Математика
Вид задача
Язык русский
Дата добавления 17.10.2012
Размер файла 409,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

Государственное образовательное учреждение

Высшего и профессионального образования

«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

пищевых производств»

Зачётная работа по теме

«Обработка экспериментальных данных

методами математической статистики»

Вариант №

Работу выполнил:

студент группы 10-ТПМ-14

Работу проверил:

Галушкина Ю.И.

Москва 2012

Обработать эти данные методом математической статистики

X

Y

X

Y

X

Y

X

Y

75

65

63

65

68

78

69

61

65

66

59

63

80

64

71

76

71

70

55

74

61

67

64

52

77

66

58

61

69

67

70

63

64

71

83

49

68

62

56

71

52

70

68

77

59

55

71

73

63

69

76

74

56

59

77

70

62

67

73

65

Задача 1. Обработка одномерной выборки признака Х методами математического статистического анализа

1. n =; xнм =; xнб =; hx =

Вариационный ряд

2. Число интервалов

Тогда длина интервала =

Статистический ряд

Интервалы

xi xi+1

Середины

x?i

Частота

mi

Относительная частота pi*=

Кумулятивная частота F*n (x)

1

49-54

51,5

3

0,05

0,05

2

54-59

56,5

8

0,133

0,183

3

59-64

61,5

12

0,2

0,383

4

64-69

66,5

15

0,25

0,633

5

69-74

71,5

13

0,217

0,85

6

74-79

76,5

7

0,117

0,967

7

79-84

81,5

2

0,033

1

8

У

3. Оценки числовых характеристик.

Интервалы

xi - xi+1

Середина ?xi

pi*

F*n (x)

?xi pi*

?xi - x?i

(?xi - x?i)2pi*

(?xi - x?i)3pi*

(?xi - x?i)4pi*

1

49-54

51,5

0,05

0,05

2,575

-14,67

10,7604

-157,8557

2315,7435

2

54-59

56,5

0,133

0,183

7,515

-9,67

12,4367

-120,2627

1162,9406

3

59-64

61,5

0,2

0,383

12,300

-4,67

4,3618

-20,3695

95,1256

4

64-69

66,5

0,25

0,633

16,625

0,33

0,0272

0,0090

0,0030

5

69-74

71,5

0,217

0,85

15,516

5,33

6,1647

32,8580

175,1332

6

74-79

76,5

0,117

0,967

8,951

10,33

12,4849

128,9694

1332,2544

7

79-84

81,5

0,033

1

2,690

15,33

7,7553

118,8887

1822,5630

8

У

66,170

53,9911

-17,7629

6903,7634

x? = Уi ?xi pi* = 66,170

Mo=64 +5

Me =

S2 = У (?xi - x?i)2pi* = 53,9911

S=== 7,3479

V= 100% =100%=11,1046%

A===-0,0448

E=3=3= -0,6317

x?

Mo

Me

Sx2

Sx

V%

A

E

Поправки Шеппарда

S2 = У (?xi - x?i)2pi* - 53,9911-2,0833=51,9078

Sx=7,2047

V=100% = 10,8882%

A==-0,0475

E=3=-0,4727

x?

Mo

Me

Sx2

Sx

V%

A

E

Выводы: 1. x? , Mo , Me - принадлежат одному интервалу;

2. Интервал (x? - 3S; x? +3S) ? () содержит выборку;

3. А= длинная часть лежит от центра;

4. Е=, распределение имеет в окрестности центра более вершину.

Для сравнения гистограммы и кривой нормального распределения заполним следующую таблицу:

Интервалы

Середины

x?i

pi*

Нормированные середины

1

2

3

4

5

6

7

8

У

Здесь нормированные середины:

, =

На графике представлена гистограмма статистического ряда, а также подобная теоретическая кривая нормального распределения. Можно видеть, что теоретическая кривая отличается от эмпирического распределения

4. Выдвигаем гипотезу о том, что выборка извлечена из нормальной генеральной совокупности, где за неизвестные параметры распределения б и у принимаются соответственно их числовые оценки x? = и S=, и проверим эту гипотезу с помощью критерия Колмогорова-Смирнова (К-С) и критерия Пирсона, с уровнем значимости б=0,1; 0,05.

Проверка гипотезы с помощью критерия Колмогорова-Смирнова.

Функция K(л)=1- б=1-0,1=0,9???л1=1,23;

K(л)=1- б=1-0,05=0,95???л2=1,36;

Dкр= ???Dкр==0,1587

Dкр= ???Dкр==0,1754

Таблица для расчёта Dэм

Середины интервалов

?xi

Кумулятивн-ая частота F*n (x)

Нормирован-ные середины

1

2

3

4

5

6

7

8

Dэм=0,1219

Вывод т.е. Dэм Dкр, следовательно, выдвинутая гипотеза о нормальном распределении с уровнем значимости б=0,1 и с уровнем значимости б=0,05.

Проверка гипотезы с помощью критерия Пирсона

ч2кр=7,8 при б=0,1; ч2кр=9,5 при б=0,05; k=7-2-1=4

Таблица для расчёта ч2эм

Интервалы

xi xi+1

Частота

mi

pi =P(xi<X<xi+1)

npi

1

0,0399

2

0,177

3

0,2186

4

0,2696

5

0,206

6

0,1022

7

0,0328

8

У

p1 = P(49<x <54) = Ф()-Ф()=Ф(-1,65)-Ф(-2,34)=0,0495-0,0096=0,0399

p2 = P(54<x <59) = Ф()-Ф()=Ф(-0,98)-Ф(-1,65)=0,1635-0,0465=0,177

p3 = P(59<x <64) = Ф()-Ф()=Ф(-0,3)-Ф(-0,98)=0,3821-0,1635=0,2186

p4 = P(64<x <69) = Ф()-Ф()=Ф(0,39)-Ф(-0,3)=0,6517-0,3821=0,2696

p5 = P(69<x <74) = Ф()-Ф()=Ф(1,07)-Ф(0,39)=0,8577-0,6517=0,206

p6 = P(74<x <79) = Ф()-Ф()=Ф(1,75)-Ф(1,07)=0,9599-0,8577=0,1022

p7 = P(79<x <84) = Ф()-Ф()=Ф(2,43)-Ф(1,75)=0,9927-0,9599=0,0328

ч2эм=1,1367

Вывод. т.е. ч2эм ч2кр, и при б=0,1 , и при б=0,05 выдвигаемая гипотеза с уровнем значимости б=0,1 и с уровнем значимости б=0,05.

5. Считая, что выборка извлечена из нормальной генеральной совокупности, построим доверительные интервалы, накрывающее неизвестное математическое ожидание с доверительными вероятностями 0,9; 0,95; 0,99. Строим доверительные интервалы

,

для =66,17; S=7,3479;=7,746

в

б

t

Левая граница

Правая граница

Длина интервала

1

0,9

0,1

1,67

64,5859

66,75

2,1641

2

0,95

0,05

2,00

64,2728

68,0672

3,7944

3

0,99

0,01

2,66

63,6467

68,6933

5,0466

0,9;

0,95;

0,99

С увеличением доверительно вероятности последовательно 0,9; 0,95; 0,99 ширина доверительного интервала увеличивается соответственно

Задача 2. Обработка одномерной выборки признака Y методами статистического анализа

1. n =; yнм =; yнб =; hy=.

Вариационный ряд

2. Число интервалов ly=lx-1= ,увеличим размах варьирования, отодвинув yнб до. статистический пирсон регрессия корреляция

Тогда длина интервала

Статистический ряд

Интервалы

yj yj+1

Середины

?yj

Частота

mj

Относительная частота pj*=

?yj pj*

?yj -?? y

(?yj -??y)2pj*

1

71-77

74

7

0,117

8,633

-15,000

26,250

2

77-83

80

8

0,133

10,667

-9,000

10,800

3

83-89

86

12

0,200

17,200

-3,000

1,800

4

89-95

92

19

0,317

29,133

3,000

2,850

5

95-101

98

9

0,150

14,700

9,000

12,150

6

101-107

104

5

0,083

8,667

15,000

18,750

7

У

60

1,000

89,000

72,600

???y= Уi ?yi pi* =89,00

Sy2 = У (?yi - ???yi)2pi* =72,600

Sy==8,5206

Задача 3. Обработка двумерной выборки (X,Y) методами корреляционного и регрессионного анализов

1. Корреляционное поле

По расположению точек на корреляционном поле можно сделать вывод о наличии положительной корреляционной зависимости.

3. Корреляционная таблица

 

xi-xi+1 

49-54

54-59

59-64

64-69

69-74

74-79

79-84

mj

yj-yj+1

 ?xi

?yj

51,5

56,5

61,5

66,5

71,5

76,5

81,5

71-77

74

1

1

1

4

7

77-83

80

1

2

1

1

1

1

1

8

83-89

86

1

1

1

5

3

1

12

89-95

92

1

3

5

4

3

2

1

19

95-101

88

3

3

2

1

9

101-107

104

1

1

1

2

5

 mi 

3

8

12

15

13

7

2

60

По заполненным клеточкам корреляционной таблицы, делаем вывод о наличии положительной зависимости между случайными величинами X и Y.

3. Вычисление выборочного коэффициента корреляции.

x?=66,17 Sx=7,3479

???y= 89,00 Sy= 8,5206

Для вычисления выборочного корреляционного момента Kxy используем формулу У У (?xi- ?x)(?yj -?yj)mij и заполним следующую расчётную таблицу:

?xi- ?x

?yj- ?y

У 

У 

Kxy= =

rxy===

По шкале Чеддока делаем вывод: корреляционная зависимость между случайными величинами X и Y

4. Проверка гипотезы значимости

Выдвигаем гипотезу о независимости случайных величин и проверим эту гипотезу с помощью критерия Пирсона, выбрав уровень значимости б=0,1;

К= (ly-1) (lx-1) = =

ч2кр=

Таблица для расчета ч2эм

 

У

ч2эм=

Так как ч2эм ч2кр, то гипотеза о независимости случайных величин с заданным уровнем значимости б=0,1.

Регрессионный анализ

1. Фиксируем ?xi и найдем соответствующие средние арифметические

?yj=

?xi

???yi

Построим диаграмму рассеивания, нанося на плоскость XY точки с координатами (?xi ; ???yi)

Фиксируем ?yj и найдем соответствующие средние арифметические

?xi=.

?yj

?xj

Построим диаграмму рассеивания, нанося на плоскость XY точки с координатами ( ???xj ; ?yj)

2. Составим линейную эмпирическую регрессию:

y(x)=a0+a1x;

x(y)=b0+b1y.

Коэффициенты регрессии a0; a1 и b0; b1оценим с помощью метода наименьших квадратов.

y(x)=a0+a1x

Нормальная система метода наименьших квадратов

Расчётная таблица

?xi

???yi

?xi 2

?xi???yi

1

2

3

4

5

6

7

8

 У

??a0=; a1=

y(x)= +x

x(y)=b0+b1y

Нормальная система метода наименьших квадратов

Расчётная таблица

?yj

?xj

?yj 2

?yj

1

2

3

4

5

6

7

У

??b0 = ; b1 =

x(y)= +y

По графику линий регрессий x(y) и y(x) делаем вывод о наличии положительной корреляционной зависимости.

3. Проверим адекватность линейной регрессии

y(x)= +x

Для этого составим с помощью метода наименьших квадратов полулогарифмическую модель эмпирической регрессии:

y(x)=a0+a1lg x.

Нормальная система метода наименьших квадратов

Расчётная таблица

?xi

lg ?xi

(lg ?xi)2

???yi

???yi lg ?xi

1

2

3

4

5

6

7

8

У

??a0 =; a1 =

y(x)= +lgx

Составим таблицу

yi

xi

y(x)=

y(xi)

1

2

3

4

5

6

7

8

 У

Делаем выводы

Модель функции

Остаточная дисперсия

Средняя ошибка аппроксимации

y(x)=

y(x)=

Наиболее адекватная модель эмпирической регрессии

y(x)= +lgx

4. Найдем выборочные корреляционные отношения

?x =; ()2; n =

?xj

mj

1

2

3

4

5

6

7

 У

=

???y =; Sy2 = ()2 =; n =

???yi

mi

1

2

3

4

5

6

7

8

 У

==

r2xy=()2 =;

- =

- =

Разность свидетельствует о линейной регрессии.

Разность свидетельствует о линейной регрессии.

Размещено на Allbest.ru


Подобные документы

  • Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.

    курсовая работа [304,0 K], добавлен 02.03.2017

  • Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.

    контрольная работа [380,9 K], добавлен 05.04.2015

  • Механизм и основные этапы нахождения необходимых параметров методом наименьших квадратов. Графическое сравнение линейной и квадратичной зависимостей. Проверка гипотезы о значимости выборочного коэффициента корреляции при заданном уровне значимости.

    курсовая работа [782,6 K], добавлен 19.05.2014

  • Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.

    задача [133,0 K], добавлен 21.12.2008

  • Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.

    контрольная работа [242,1 K], добавлен 05.11.2011

  • Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.

    курсовая работа [593,2 K], добавлен 28.06.2009

  • Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.

    задача [143,4 K], добавлен 31.01.2011

  • Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.

    презентация [113,3 K], добавлен 01.11.2013

  • Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.

    презентация [387,8 K], добавлен 25.05.2015

  • Построение математической модели технологического процесса напыления резисторов методами полного и дробного факторного эксперимента. Составление матрицы планирования. Рандомизация и проверка воспроизводимости. Оценка коэффициентов уравнения регрессии.

    курсовая работа [694,5 K], добавлен 27.12.2021

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.