Обработка экспериментальных данных методами математической статистики
Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
Рубрика | Математика |
Вид | задача |
Язык | русский |
Дата добавления | 17.10.2012 |
Размер файла | 409,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ
Государственное образовательное учреждение
Высшего и профессионального образования
«МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
пищевых производств»
Зачётная работа по теме
«Обработка экспериментальных данных
методами математической статистики»
Вариант №
Работу выполнил:
студент группы 10-ТПМ-14
Работу проверил:
Галушкина Ю.И.
Москва 2012
Обработать эти данные методом математической статистики
X |
Y |
X |
Y |
X |
Y |
X |
Y |
|
75 |
65 |
63 |
65 |
|||||
68 |
78 |
69 |
61 |
|||||
65 |
66 |
59 |
63 |
|||||
80 |
64 |
71 |
76 |
|||||
71 |
70 |
55 |
74 |
|||||
61 |
67 |
64 |
52 |
|||||
77 |
66 |
58 |
61 |
|||||
69 |
67 |
70 |
63 |
|||||
64 |
71 |
83 |
49 |
|||||
68 |
62 |
56 |
71 |
|||||
52 |
70 |
68 |
77 |
|||||
59 |
55 |
71 |
73 |
|||||
63 |
69 |
76 |
74 |
|||||
56 |
59 |
77 |
70 |
|||||
62 |
67 |
73 |
65 |
Задача 1. Обработка одномерной выборки признака Х методами математического статистического анализа
1. n =; xнм =; xнб =; hx =
Вариационный ряд
2. Число интервалов
Тогда длина интервала =
Статистический ряд
№ |
Интервалы xi xi+1 |
Середины x?i |
Частота mi |
Относительная частота pi*= |
Кумулятивная частота F*n (x) |
|
1 |
49-54 |
51,5 |
3 |
0,05 |
0,05 |
|
2 |
54-59 |
56,5 |
8 |
0,133 |
0,183 |
|
3 |
59-64 |
61,5 |
12 |
0,2 |
0,383 |
|
4 |
64-69 |
66,5 |
15 |
0,25 |
0,633 |
|
5 |
69-74 |
71,5 |
13 |
0,217 |
0,85 |
|
6 |
74-79 |
76,5 |
7 |
0,117 |
0,967 |
|
7 |
79-84 |
81,5 |
2 |
0,033 |
1 |
|
8 |
||||||
У |
3. Оценки числовых характеристик.
№ |
Интервалы xi - xi+1 |
Середина ?xi |
pi* |
F*n (x) |
?xi pi* |
?xi - x?i |
(?xi - x?i)2pi* |
(?xi - x?i)3pi* |
(?xi - x?i)4pi* |
|
1 |
49-54 |
51,5 |
0,05 |
0,05 |
2,575 |
-14,67 |
10,7604 |
-157,8557 |
2315,7435 |
|
2 |
54-59 |
56,5 |
0,133 |
0,183 |
7,515 |
-9,67 |
12,4367 |
-120,2627 |
1162,9406 |
|
3 |
59-64 |
61,5 |
0,2 |
0,383 |
12,300 |
-4,67 |
4,3618 |
-20,3695 |
95,1256 |
|
4 |
64-69 |
66,5 |
0,25 |
0,633 |
16,625 |
0,33 |
0,0272 |
0,0090 |
0,0030 |
|
5 |
69-74 |
71,5 |
0,217 |
0,85 |
15,516 |
5,33 |
6,1647 |
32,8580 |
175,1332 |
|
6 |
74-79 |
76,5 |
0,117 |
0,967 |
8,951 |
10,33 |
12,4849 |
128,9694 |
1332,2544 |
|
7 |
79-84 |
81,5 |
0,033 |
1 |
2,690 |
15,33 |
7,7553 |
118,8887 |
1822,5630 |
|
8 |
||||||||||
У |
66,170 |
53,9911 |
-17,7629 |
6903,7634 |
x? = Уi ?xi pi* = 66,170
Mo=64 +5
Me =
S2 = У (?xi - x?i)2pi* = 53,9911
S=== 7,3479
V= 100% =100%=11,1046%
A===-0,0448
E=3=3= -0,6317
x? |
Mo |
Me |
Sx2 |
Sx |
V% |
A |
E |
|
Поправки Шеппарда
S2 = У (?xi - x?i)2pi* - 53,9911-2,0833=51,9078
Sx=7,2047
V=100% = 10,8882%
A==-0,0475
E=3=-0,4727
x? |
Mo |
Me |
Sx2 |
Sx |
V% |
A |
E |
|
Выводы: 1. x? , Mo , Me - принадлежат одному интервалу;
2. Интервал (x? - 3S; x? +3S) ? () содержит выборку;
3. А= длинная часть лежит от центра;
4. Е=, распределение имеет в окрестности центра более вершину.
Для сравнения гистограммы и кривой нормального распределения заполним следующую таблицу:
№ |
Интервалы |
Середины x?i |
pi* |
Нормированные середины |
|||
1 |
|||||||
2 |
|||||||
3 |
|||||||
4 |
|||||||
5 |
|||||||
6 |
|||||||
7 |
|||||||
8 |
|||||||
У |
Здесь нормированные середины:
, =
На графике представлена гистограмма статистического ряда, а также подобная теоретическая кривая нормального распределения. Можно видеть, что теоретическая кривая отличается от эмпирического распределения
4. Выдвигаем гипотезу о том, что выборка извлечена из нормальной генеральной совокупности, где за неизвестные параметры распределения б и у принимаются соответственно их числовые оценки x? = и S=, и проверим эту гипотезу с помощью критерия Колмогорова-Смирнова (К-С) и критерия Пирсона, с уровнем значимости б=0,1; 0,05.
Проверка гипотезы с помощью критерия Колмогорова-Смирнова.
Функция K(л)=1- б=1-0,1=0,9???л1=1,23;
K(л)=1- б=1-0,05=0,95???л2=1,36;
Dкр= ???Dкр==0,1587
Dкр= ???Dкр==0,1754
Таблица для расчёта Dэм
№ |
Середины интервалов ?xi |
Кумулятивн-ая частота F*n (x) |
Нормирован-ные середины |
|||
1 |
||||||
2 |
||||||
3 |
||||||
4 |
||||||
5 |
||||||
6 |
||||||
7 |
||||||
8 |
Dэм=0,1219
Вывод т.е. Dэм Dкр, следовательно, выдвинутая гипотеза о нормальном распределении с уровнем значимости б=0,1 и с уровнем значимости б=0,05.
Проверка гипотезы с помощью критерия Пирсона
ч2кр=7,8 при б=0,1; ч2кр=9,5 при б=0,05; k=7-2-1=4
Таблица для расчёта ч2эм
№ |
Интервалы xi xi+1 |
Частота mi |
pi =P(xi<X<xi+1) |
npi |
||
1 |
0,0399 |
|||||
2 |
0,177 |
|||||
3 |
0,2186 |
|||||
4 |
0,2696 |
|||||
5 |
0,206 |
|||||
6 |
0,1022 |
|||||
7 |
0,0328 |
|||||
8 |
||||||
У |
p1 = P(49<x <54) = Ф()-Ф()=Ф(-1,65)-Ф(-2,34)=0,0495-0,0096=0,0399
p2 = P(54<x <59) = Ф()-Ф()=Ф(-0,98)-Ф(-1,65)=0,1635-0,0465=0,177
p3 = P(59<x <64) = Ф()-Ф()=Ф(-0,3)-Ф(-0,98)=0,3821-0,1635=0,2186
p4 = P(64<x <69) = Ф()-Ф()=Ф(0,39)-Ф(-0,3)=0,6517-0,3821=0,2696
p5 = P(69<x <74) = Ф()-Ф()=Ф(1,07)-Ф(0,39)=0,8577-0,6517=0,206
p6 = P(74<x <79) = Ф()-Ф()=Ф(1,75)-Ф(1,07)=0,9599-0,8577=0,1022
p7 = P(79<x <84) = Ф()-Ф()=Ф(2,43)-Ф(1,75)=0,9927-0,9599=0,0328
ч2эм=1,1367
Вывод. т.е. ч2эм ч2кр, и при б=0,1 , и при б=0,05 выдвигаемая гипотеза с уровнем значимости б=0,1 и с уровнем значимости б=0,05.
5. Считая, что выборка извлечена из нормальной генеральной совокупности, построим доверительные интервалы, накрывающее неизвестное математическое ожидание с доверительными вероятностями 0,9; 0,95; 0,99. Строим доверительные интервалы
,
для =66,17; S=7,3479;=7,746
№ |
в |
б |
t |
Левая граница |
Правая граница |
Длина интервала |
|
1 |
0,9 |
0,1 |
1,67 |
64,5859 |
66,75 |
2,1641 |
|
2 |
0,95 |
0,05 |
2,00 |
64,2728 |
68,0672 |
3,7944 |
|
3 |
0,99 |
0,01 |
2,66 |
63,6467 |
68,6933 |
5,0466 |
0,9;
0,95;
0,99
С увеличением доверительно вероятности последовательно 0,9; 0,95; 0,99 ширина доверительного интервала увеличивается соответственно
Задача 2. Обработка одномерной выборки признака Y методами статистического анализа
1. n =; yнм =; yнб =; hy=.
Вариационный ряд
2. Число интервалов ly=lx-1= ,увеличим размах варьирования, отодвинув yнб до. статистический пирсон регрессия корреляция
Тогда длина интервала
Статистический ряд
№ |
Интервалы yj yj+1 |
Середины ?yj |
Частота mj |
Относительная частота pj*= |
?yj pj* |
?yj -?? y |
(?yj -??y)2pj* |
|
1 |
71-77 |
74 |
7 |
0,117 |
8,633 |
-15,000 |
26,250 |
|
2 |
77-83 |
80 |
8 |
0,133 |
10,667 |
-9,000 |
10,800 |
|
3 |
83-89 |
86 |
12 |
0,200 |
17,200 |
-3,000 |
1,800 |
|
4 |
89-95 |
92 |
19 |
0,317 |
29,133 |
3,000 |
2,850 |
|
5 |
95-101 |
98 |
9 |
0,150 |
14,700 |
9,000 |
12,150 |
|
6 |
101-107 |
104 |
5 |
0,083 |
8,667 |
15,000 |
18,750 |
|
7 |
||||||||
У |
60 |
1,000 |
89,000 |
72,600 |
???y= Уi ?yi pi* =89,00
Sy2 = У (?yi - ???yi)2pi* =72,600
Sy==8,5206
Задача 3. Обработка двумерной выборки (X,Y) методами корреляционного и регрессионного анализов
1. Корреляционное поле
По расположению точек на корреляционном поле можно сделать вывод о наличии положительной корреляционной зависимости.
3. Корреляционная таблица
|
xi-xi+1 |
49-54 |
54-59 |
59-64 |
64-69 |
69-74 |
74-79 |
79-84 |
mj |
||
yj-yj+1 |
?xi ?yj |
51,5 |
56,5 |
61,5 |
66,5 |
71,5 |
76,5 |
81,5 |
|||
71-77 |
74 |
1 |
1 |
1 |
4 |
7 |
|||||
77-83 |
80 |
1 |
2 |
1 |
1 |
1 |
1 |
1 |
8 |
||
83-89 |
86 |
1 |
1 |
1 |
5 |
3 |
1 |
12 |
|||
89-95 |
92 |
1 |
3 |
5 |
4 |
3 |
2 |
1 |
19 |
||
95-101 |
88 |
3 |
3 |
2 |
1 |
9 |
|||||
101-107 |
104 |
1 |
1 |
1 |
2 |
5 |
|||||
mi |
3 |
8 |
12 |
15 |
13 |
7 |
2 |
60 |
По заполненным клеточкам корреляционной таблицы, делаем вывод о наличии положительной зависимости между случайными величинами X и Y.
3. Вычисление выборочного коэффициента корреляции.
x?=66,17 Sx=7,3479
???y= 89,00 Sy= 8,5206
Для вычисления выборочного корреляционного момента Kxy используем формулу У У (?xi- ?x)(?yj -?yj)mij и заполним следующую расчётную таблицу:
?xi- ?x ?yj- ?y |
У |
|||||||||
У |
Kxy= =
rxy===
По шкале Чеддока делаем вывод: корреляционная зависимость между случайными величинами X и Y
4. Проверка гипотезы значимости
Выдвигаем гипотезу о независимости случайных величин и проверим эту гипотезу с помощью критерия Пирсона, выбрав уровень значимости б=0,1;
К= (ly-1) (lx-1) = =
ч2кр=
Таблица для расчета ч2эм
|
||||||||||
У |
ч2эм=
Так как ч2эм ч2кр, то гипотеза о независимости случайных величин с заданным уровнем значимости б=0,1.
Регрессионный анализ
1. Фиксируем ?xi и найдем соответствующие средние арифметические
?yj=
?xi |
|||||||||
???yi |
Построим диаграмму рассеивания, нанося на плоскость XY точки с координатами (?xi ; ???yi)
Фиксируем ?yj и найдем соответствующие средние арифметические
?xi=.
?yj |
||||||||
?xj |
Построим диаграмму рассеивания, нанося на плоскость XY точки с координатами ( ???xj ; ?yj)
2. Составим линейную эмпирическую регрессию:
y(x)=a0+a1x;
x(y)=b0+b1y.
Коэффициенты регрессии a0; a1 и b0; b1оценим с помощью метода наименьших квадратов.
y(x)=a0+a1x
Нормальная система метода наименьших квадратов
Расчётная таблица
№ |
?xi |
???yi |
?xi 2 |
?xi???yi |
|
1 |
|||||
2 |
|||||
3 |
|||||
4 |
|||||
5 |
|||||
6 |
|||||
7 |
|||||
8 |
|||||
У |
??a0=; a1=
y(x)= +x
x(y)=b0+b1y
Нормальная система метода наименьших квадратов
Расчётная таблица
№ |
?yj |
?xj |
?yj 2 |
?yj |
|
1 |
|||||
2 |
|||||
3 |
|||||
4 |
|||||
5 |
|||||
6 |
|||||
7 |
|||||
У |
??b0 = ; b1 =
x(y)= +y
По графику линий регрессий x(y) и y(x) делаем вывод о наличии положительной корреляционной зависимости.
3. Проверим адекватность линейной регрессии
y(x)= +x
Для этого составим с помощью метода наименьших квадратов полулогарифмическую модель эмпирической регрессии:
y(x)=a0+a1lg x.
Нормальная система метода наименьших квадратов
Расчётная таблица
№ |
?xi |
lg ?xi |
(lg ?xi)2 |
???yi |
???yi lg ?xi |
|
1 |
||||||
2 |
||||||
3 |
||||||
4 |
||||||
5 |
||||||
6 |
||||||
7 |
||||||
8 |
||||||
У |
??a0 =; a1 =
y(x)= +lgx
Составим таблицу
№ |
yi |
xi |
y(x)= |
||||
y(xi) |
|||||||
1 |
|||||||
2 |
|||||||
3 |
|||||||
4 |
|||||||
5 |
|||||||
6 |
|||||||
7 |
|||||||
8 |
|||||||
У |
Делаем выводы
Модель функции |
Остаточная дисперсия |
Средняя ошибка аппроксимации |
|
y(x)= |
|||
y(x)= |
Наиболее адекватная модель эмпирической регрессии
y(x)= +lgx
4. Найдем выборочные корреляционные отношения
?x =; ()2; n =
№ |
?xj |
mj |
||
1 |
||||
2 |
||||
3 |
||||
4 |
||||
5 |
||||
6 |
||||
7 |
||||
У |
=
???y =; Sy2 = ()2 =; n =
№ |
???yi |
mi |
||
1 |
||||
2 |
||||
3 |
||||
4 |
||||
5 |
||||
6 |
||||
7 |
||||
8 |
||||
У |
==
r2xy=()2 =;
- =
- =
Разность свидетельствует о линейной регрессии.
Разность свидетельствует о линейной регрессии.
Размещено на Allbest.ru
Подобные документы
Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.
курсовая работа [304,0 K], добавлен 02.03.2017Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015Механизм и основные этапы нахождения необходимых параметров методом наименьших квадратов. Графическое сравнение линейной и квадратичной зависимостей. Проверка гипотезы о значимости выборочного коэффициента корреляции при заданном уровне значимости.
курсовая работа [782,6 K], добавлен 19.05.2014Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
задача [133,0 K], добавлен 21.12.2008Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.
курсовая работа [593,2 K], добавлен 28.06.2009Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.
задача [143,4 K], добавлен 31.01.2011Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Построение математической модели технологического процесса напыления резисторов методами полного и дробного факторного эксперимента. Составление матрицы планирования. Рандомизация и проверка воспроизводимости. Оценка коэффициентов уравнения регрессии.
курсовая работа [694,5 K], добавлен 27.12.2021