Планирование экспериментов по выяснению регрессивной зависимости

Планирование характеристик случайной величины; оценка параметров распределения. Расчет объема выборки с заданной погрешностью. Компьютерный эксперимент по выяснению регрессионной зависимости между факторами и выходом продукта в химическом процессе.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 29.04.2012
Размер файла 268,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Содержание

1. Определение характеристик случайной величины

1.1 Определение вида распределения

1.2 Построение графиков

1.3 Определение точечных и интервальных оценок

2. Составление плана эксперимента по выяснению регрессионной зависимости

2.1 Осуществление компьютерного эксперимента

2.2 Проведение статистической обработки результатов компьютерного эксперимента

Заключение

Список используемых источников

Список используемых программных пакетов

Приложение А

1. Определение характеристик случайной величины

1.1 Определение вида распределения

Построим гистограмму по полученной выборке.

Из априорной информации известно, что программа генерирует выборки заданного объема для непрерывной случайной величины. При этом возможны распределения вида: нормальное, равномерное, экспоненциальное, Рэлея.

Полученная выборка приведена в Приложении А.

Построим гистограмму - рисунок 1, рисунок 2.

Рисунок 1 - гистограмма с ожидаемым распределением Рэлея

Рисунок 2 - гистограмма с ожидаемым нормальным распределением

По виду гистограммы можно предположить, что случайные величины в выборке распределены либо нормальному закону, либо по закону Рэлея.

Определим симметрично ли это распределение, с помощью критерия симметричности Кевуя.

В выборке имеются порядковые статистики

Находим

= -29,9

Для б=0,05 квантиль стандартного нормального распределения равен

Так как

,

гипотеза симметрии отклоняется.

Следовательно, данная выборка не может быть распределена по нормальному закону.

Определим распределена ли выборка по закону Рэлея с помощью критерия Пирсона (критерий «хи-квадрат»)

Сформулируем гипотезы:

H: Fn(x) = R(a)

Выборка распределена по закону Рэлея

H: Fn(x) ? R(a)

Выборка не распределена по закону Рэлея

Интервал значений величины рассчитываем по формуле:

Где xmax - верхняя граница интервала;

xmin - нижняя граница интервала.

Определим число интервалов по формуле:

= 1+3,2*log(100) = 7,4

Где ? - количество интервалов;

n - объем выборки.

Рассчитаем шаг по формуле:

Где ? - количество интервалов

В качестве критерия согласия принимают случайную величину (критерий «хи-квадрат»)

(5)

Где ni - фактическая частота попадания в частичный интервал;

ni* - теоретическая частота попадания в частичный интервал.

Теоретические частоты попадания в частичный интервал рассчитываем по формуле:

(6)

где n - объем выборки;

рi*- теоретическая вероятность попадания случайной величины в частичный интервал.

При использовании критерия Пирсона для проверки гипотезы о распределении Рэлея генеральной совокупности с предполагаемой функцией распределения

()

необходимо, вычислив по имеющейся выборке значение , оценить параметр a. Так как

и ,

следовательно можно получить систему для определения а* (а* - оценка параметра а).

Отсюда следует, что

~6

Теоретическая вероятность будет рассчитываться по формуле:

,

Где

()

и - границы интервалов.

Результаты расчетов фактической частоты попадания в частичный интервал и теоретической частоты приведены в таблице 1.

Таблица 1

№ интервала

Границы интервала

ni

рi*

ni*

1

0,8481 - 3,4881

12

0,145

14,5

2

3,4881 - 6,1281

19

0,251

25,1

3

6,1281 - 8,7781

25

0,251

25,1

4

8,7781 - 11,4181

25

0,179

17,9

5

11,4181 - 14,0581

12

0,1

10

6

14,0581 - 16,6981

6

0,043

4,3

7

16,6981 - 19,3381

1

0,015

1,5

Рассчитаем значение

= 5,96

По таблице критических точек распределения чІ найдем критическое значение.

Число степеней свободы k определяется по формуле:

k = m-n-1, где

m - число интервалов разбиения

n - число параметров предполагаемого распределения

Распределение Рэлея характеризуется одним параметром а, следовательно,

k = 7 - 1 - 1 = 5.

при б=0,05 и при числе степеней свободы k=5 чІкр = 11,1

Так как чІ<чІкр , следовательно нулевая гипотеза принимается, выборка распределена по Закону Рэлея.

1.2 Построение графиков

График функции плотности распределения:

График теоретической функции распределения:

График эмпирической функции распределения:

Построим таблицу:

Номер интервала

Границы интервала

Середина интервалов

Эмпирические частоты

i

xi, xi+1

zi

mi

1

0,8481 - 3,4881

2,1681

12

2

3,4881 - 6,1281

4,8081

19

3

6,1281 - 8,7781

7,4531

25

4

8,7781 - 11,4181

10,0981

25

5

11,4181 - 14,0581

12,7381

12

6

14,0581 - 16,6981

15,3781

6

7

16,6981 - 19,3381

18,0181

1

,

при , .

1.3 Определение точечных и интервальных оценок

Определим точечные оценки:

В качестве оценки параметра а будем считать величину а*, определяемую формулой:

= 6,28

В качестве оценки математического ожидания будем считать величину , определяемую формулой:

= 1,26

= 7,56

В качестве оценки дисперсии будем считать величину , определяемую формулой:

= 15,444

В качестве оценки СКО будем считать величину (х), определяемую формулой:

= 0,655

(х) = 3,93

В качестве оценки медианы будем считать величину Ме(х), определяемую формулой:

Ме(х) = = 1,117

Ме(х) = 6,702

В качестве оценки моды будем считать величину Мо(х), определяемую формулой:

Мо(Х) =

Мо(х) = 6

где - параметр распределения

Определим интервальные оценки:

Для определения интервальной оценки параметра воспользуемся программным продуктом MATLAB 6.5.

Для определения доверительного интервала, в котором с вероятностью р = 0,95% находится параметр воспользуемся командой «[p,ci] = raylfit(x)», где x - исследуемая выборка. Параметр находится в границах 4,2202 < < 7,9658.

Выведем формулу для определения объема выборки:

где n - объем выборки;

- квантиль нормального распределения;

б - уровень значимости;

- абсолютная погрешность.

Зададим уровень значимости б = 0,05 и допустимую абсолютную погрешность = 0,115, тогда = 1,96, следовательно, объем выборки n = 290,48.

Анализ данных был проведен с допустимой абсолютной погрешностью = 0,115 и уровнем значимости б = 0,05.

случайный величина регрессионный зависимость

2. Составление плана эксперимента по выяснению регрессионной зависимости

2.1 Осуществление компьютерного эксперимента

При помощи программы получаем данные для предложенного преподавателем варианта и формулируем задачу.

В химическом процессе выход продукта У(%) зависит от трёх факторов: температуры (X1), давления (Х2) и относительной влажности (Х3). С помощью ПФЭ найти математическое описание процесса в окрестности точки факторного пространства с координатами: : Х1min=5 °С, Х1max=40 °С, Х2min=0,9 атм, Х2max=1,1 атм, Х3min=0,1 , Х3max=1,0.

Для упрощения обработки результатов эксперимента, произведем кодирование значений факторов по формулам:

хi* =(xi - x0i)/?xi,

x0i = (xi min + xi max)/2,

?xi = (xi max - xi min)/2.

где - натуральное значение i-го фактора;

- натуральное значение основного уровня (центра плана по фактору );

?xi - интервал варьирования фактора;

- кодированный нормированный безразмерный фактор, который принимает значения .

В результате такого кодирования получим матрицу спектра плана в безразмерных величинах

Построим матрицу планирования, используя третий прием, который основан на правиле чередования знаков: в первом столбце знаки меняются поочередно, во втором столбце чередуются через 2, в третьем - через 4

x0

x1

x2

x3

x1x2

x1x3

x2x3

x1x2x3

Y

1

1

-

-

-

+

+

+

-

y1

2

1

+

-

-

-

-

+

+

y2

3

1

-

+

-

-

+

-

+

y3

4

1

+

+

-

+

-

-

-

y4

5

1

-

-

+

+

-

-

+

y5

6

1

+

-

+

-

+

-

-

y6

7

1

-

+

+

-

-

+

-

y7

8

1

+

+

+

+

+

+

+

y8

Исходя из матрицы планирования, получим следующие результаты эксперимента, представленные в таблицы 5

Таблица 5

Выход продукта в процентах

1

2

3

4

5

6

7

8

Х1

5

40

5

40

5

40

5

40

Х2

0,9

0,9

1,1

1,1

0,9

0,9

1,1

1,1

Х3

0,1

0,1

0,1

0,1

1

1

1

1

Y1

1,19717

-64,66375

4,02398

-65,20953

6,65060

-61,91253

9,85916

-64,96568

Y2

-1,94642

-64,66821

6,35041

-62,78026

2,49339

-60,90291

10,17944

-61,95045

Y3

2,61954

-67,79595

3,00008

-65,34886

7,72118

-68,16323

9,91502

-62,29955

Y4

3,03343

-66,86556

10,06605

-65,74386

10,03929

-67,77375

11,38950

-65,98963

Y5

-0,62294

-67,25476

4,15226

-67,62208

4,13631

-62,64385

9,80460

-61,24400

Определим уравнение регрессии первого порядка.

Формула для определения коэффициентов соответствующего уравнения регрессии первого порядка:

Y = 0f0(x1…xm)+ 1f1(x1…xm)+ …+pfp

O1=0,125(-y1+y2-y3+y4-y5+y6-y7+y8)

O2=0,125(-y1-y2+y3+y4-y5-y6+y7+y8)

O3=0,125(-y1-y2-y3-y4+y5+y6+7+y8)

O12=0,125(y1-y2-y3+y4+y5-y6-y7+y8)

O13=0,125(y1-y2+y3-y4-y5+y6-y7+y8)

O23=0,125(y1+y2-y3-y4-y5-y6+y7+y8)

O123=0,125(-y1+y2+y3-y4+y5-y6-y7+y8)

2.2 Проведение статистической обработки результатов компьютерного эксперимента

Для удобства перепишем таблицу в следующем виде:

1

2

3

4

5

6

7

8

Y1

1,19717

-64,66375

4,02398

-65,20953

6,65060

-61,91253

9,85916

-64,96568

Y2

-1,94642

-64,66821

6,35041

-62,78026

2,49339

-60,90291

10,17944

-61,95045

Y3

2,61954

-67,79595

3,00008

-65,34886

7,72118

-68,16323

9,91502

-62,29955

Y4

3,03343

-66,86556

10,06605

-65,74386

10,03929

-67,77375

11,38950

-65,98963

Y5

-0,62294

-67,25476

4,15226

-67,62208

4,13631

-62,64385

9,80460

-61,24400

Yср

0,856156

-66,2496

5,518556

-65,3409

6,208154

-64,2793

10,22954

-63,2899

Si2

4,502123

2,199167

7,953732

2,985089

8,813655

11,7431

0,441174

4,264352

Ycp - среднее значение выхода продукта по строчкам

SiІ - оценки дисперсий по строкам, по следующей формуле

Где l - количество измерений при данном опыте, l=5

Построим расширенную матрицу планирования, используя третий прием построения

x0

x1

x2

x3

x1x2

x1x3

x2x3

x1x2x3

1

1

-

-

-

+

+

+

-

0,856156

2

1

+

-

-

-

-

+

+

-66,2496

3

1

-

+

-

-

+

-

+

5,518556

4

1

+

+

-

+

-

-

-

-65,3409

5

1

-

-

+

+

-

-

+

6,208154

6

1

+

-

+

-

+

-

-

-64,2793

7

1

-

+

+

-

-

+

-

10,22954

8

1

+

+

+

+

+

+

+

-63,2899

Проверим однородности дисперсий по критерию Кохрена.

Определим оценки дисперсий по строкам, по следующей формуле

(l = 5)

Вычислим сумму дисперсий строк:

= 42,90239

Для проверки равноточности необходимо выбрать самую большую из построчных дисперсий и вычислить G - критерий:

=11,7431 (опыт №6)

G=11,7431/42,90239=0,2737

Если , где - табличное значение критерия при числе степеней свободы н1=l-1 и н2= n (количество опытов), то опыты равноточные.

Для уровня значимости 0,05 табличное значение Кохрена равно G(4,8)= 0.391

G<Gт - следовательно, опыты являются равноточными.

Тогда общая оценка дисперсии воспроизводимости определяется по формуле:

= 42,90239/8 = 5,36279

Рассчитаем коэффициенты в уравнении регрессии по формулам:

,

b0 = 1/8 (0,856156 - 66,2496 + 5,518556 - 65,3409 + 6,208154 - 64,2793 +

10,22954 - 63,2899) = -29,543

b1 = 1/8(- 0,856156 - 66,2496 - 5,518556 - 65,3409 - 6,208154 - 64,2793 -

10,22954 - 63,2899) = -35,247

b2 = 1/8(-0,856156+66,2496+5,518556-65,3409 - 6,208154 + 64,2793 +

10,22954 - 63,2899) = 1,323

b3 = 1/8(- 0,856156 + 66,2496 - 5,518556 + 65,3409 + 6,208154 - 64,2793

+ 10,22954 - 63,2899) = 1,761

b12 = 1/8 (0,856156 + 66,2496 - 5,518556 - 65,3409 + 6,208154 + 64,2793 -

10,22954 - 63,2899) = -0,848

b13 = 1/8 (0,856156 + 66,2496 + 5,518556 + 65,3409 - 6,208154 - 64,2793 -

10,22954 - 63,2899) = -0,755

b23 = 1/8 (0,856156 - 66,2496 - 5,518556 + 65,3409 - 6,208154 + 64,2793 +

10,22954 - 63,2899) = -0,07

b123 = 1/8 (- 0,856156 - 66,2496 + 5,518556 + 65,3409 + 6,208154 +

64,2793 - 10,22954 - 63,2899) = 0,09

Предварительно математическая модель процесса будет выглядеть следующим образом:

Y*= -29,543 - 35,247x1 + 1,323x2 + 1,761x3 - 0,848x1x2 - 0,755x1x3 -

0,07x2x3 + 0,09x1x2x3

Оценим значимость коэффициентов, для этого определим дисперсию коэффициентов:

SІbi=SІe/N=5,36279/8=0,6703

Для оценки погрешности (доверительного интервала) коэффициентов найдем табличное значение критерия Стьюдента для доверительной вероятности 0.95 и числа степеней свобод

н=(l - 1)n=32

Табличное значение критерия Стьюдента: t0.95,32 = 1,69. Тогда доверительный интервал коэффициентов равен:

bi = tp, f = 1,69 = 1,38

Сравним коэффициенты с дисперсией коэффициентов:

|bo| = 29,543 > bi - коэффициент значим

|b1| = 35,247 > bi - коэффициент значим

|b2| = 1,323 > bi - коэффициент значим

|b3| = 1,761 > bi - коэффициент значим

|b12| = 0.848 > bi - коэффициент значим

|b13| = 0,755 > bi - коэффициент значим

|b23| = 0,07 < bi - коэффициент незначим

|b123| = 0,09 < bi - коэффициент незначим

Отбросив (приравняв нулю) незначимые коэффициенты, получим уравнение связи между откликом у и факторами :

Y*= -29,543 - 35,247x1 + 1,323x2 + 1,761x3 - 0,848x1x2 - 0,755x1x3

Проверим модель на адекватность. Для проверки адекватности полученной математической модели производится оценка дисперсии адекватности:

,

d - число значимых коэффициентов в уравнении

Для того, чтобы оценить дисперсию адекватности, заполним таблицу:

Yj*

(-Yj*)

(-Yj*)2

1

0,856156

1,017

-0,16084

0,025871

2

-66,2496

-66,271

0,0214

0,000458

3

5,518556

5,359

0,159556

0,025458

4

-65,3409

-65,321

-0,0199

0,000396

5

6,208154

6,049

0,159154

0,02533

6

-64,2793

-64,259

-0,0203

0,000412

7

10,22954

10,391

-0,16146

0,026069

8

-63,2899

-63,309

0,0191

0,000365

0,104359

Найдем оценку дисперсии адекватности:

S2ад= 1/(8-6)*1,104359 = 0,55218

Для проверки модели на адекватность воспользуемся критерием Фишера:

Найдем значение критерия Фишера

F=SІад/SІe=0,55218/5,36279= 0,103

Найдем табличное значение критерия Фишера для уровня значимости 0.05 и чисел степеней свобод:

н1 = n - d=2, н2 = n( l - 1)=32

Fтабл. = 3,294

Fрасч. < Fтабл., из этого следует, что модель адекватна.

После того как мы убедились в адекватности модели стоит произвести ее раскодировку, для этого вместо x1 подставим выражение (x1 - 22,5)/17,5, вместо x2 - выражение (x2 - 1)/0,1, а вместо x3 подставим выражение (x3 - 0,55)/0,45. Благодаря этому, из первоначальной модели:

Y*= -29,543 - 35,247x1 + 1,323x2 + 1,761x3 - 0,848x1x2 - 0,755x1x3

получим следующую модель:

Y = - 29,543 - 35,247 ((x1 - 22,5)/17,5) + 1,323((x2 - 1)/0,1) + 1,761 ((x3 -

0,55) / 0,45) - 0,848 (((x1 - 22,5) / 17,5)*(( x2 - 1)/0,1))) - 0,755(((x1 -

22,5)/17,5))*(( x3 - 0,55) / 0,45))).

После преобразований получим:

Y=-11,709-1,48x1+24,13x2+6,07x3-0,49x1x2-0,09x1x3

Заключение

В ходе выполнения данной курсовой работы был составлен план по определению характеристик случайной величины. Был определен вид распределения случайной величины - распределение Рэлея, это было подтверждено с помощью критерия Пирсона. Также получены интервальные и точечные оценки параметров распределения. Так как я воспользовалась критерием Пирсона, следовательно, объем выборки я взяла n=100. В дополнении была получена формула для определения объема выборки с заранее заданной абсолютной погрешностью, равно 0,115, и уровнем значимости, равным 0,05. Согласно этой формуле необходимый нам объем выборки для заданной точности составляет n=290.

Во втором задании курсовой работы был проведен компьютерный эксперимент по выяснению регрессионной зависимости между тремя факторами и выходом продукта в химическом процессе. Была построена матрица планирования для определения порядка сбора данных эксперимента. Затем были определены коэффициенты уравнения регрессии первого порядка. Далее была проведена статистическая обработка результатов эксперимента. Была построена расширенная матрица планирования, с помощью которой мы смогли рассчитать коэффициенты в уравнении регрессии. Была получена предварительная модель уравнения связи между откликами и выходом продукта. С помощью критерия Фишера было определено, что полученная модель является адекватной.

Список использованных источников

1. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816 с.

2. Е.И. Короткова. Планирование и организация эксперимента. Учебное пособие. Томск: Изд-во ТПУ, 2003, 92с.

3. http://vm.psati.ru/online-tv/page-20.html

4. http://matlab.exponenta.ru/statist/book2/1/binofit.php

Список используемых программных пакетов

1. STATISTICA

2. MathCAD 2001i Professional

3. Microsoft Excel

4. Matlab 6.5

Приложение А

Выборка

8,8486

8,4035

2,249

6,2965

11,4646

7,124

3,2857

8,1658

5,443

11,21

19,3286

8,969

10,4211

5,0949

6,174

4,3255

6,7049

11,2066

6,1667

4,9934

6,9599

11,0996

9,5827

8,9777

8,1751

4,9165

7,6691

2,699

8,3287

14,4057

4,1515

15,2873

11,8134

10,619

14,3768

12,559

13,8339

5,2017

16,3349

5,2741

8,3461

8,5745

5,1792

9,2563

6,8113

4,2695

4,7989

12,5722

9,6163

13,4161

8,4959

0,8481

10,4013

11,3612

6,988

5,4367

7,3678

8,7944

7,3494

7,062

8,3255

10,8695

12,742

11,5303

2,3088

2,7197

5,3117

2,1851

10,1263

9,6725

7,0325

9,4541

12,9209

9,6842

7,9489

12,8598

14,9383

3,7265

5,8674

4,2481

7,0147

1,9465

10,0871

9,0446

16,3289

4,2476

0,9699

10,1121

12,2835

10,1244

2,8921

8,8596

6,0315

1,21

8,4194

9,4376

12,1161

3,5591

2,3929

8,0316

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.