Статистический анализ данных
Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 29.11.2014 |
Размер файла | 1,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Министерство образования и науки Российской Федерации
Федеральное агентство по образованию
Южный федеральный университет
Факультет электроники и приборостроения (ФЭП)
Кафедра информационных измерительных технологий и систем (ИИТиС)
Пояснительная записка к курсовой работе
Статистический анализ данных
Выполнил:
Косторниченко В.Г.
Таганрог 2013 г.
Задание
Вариант - №12 |
|
Объем выборки Х1 = 112 |
|
Объем выборки Х2 = 102 |
|
Дисперсия = 3 |
|
Математическое ожидание = 12 |
В ходе курсовой работы необходимо выполнить статистические задачи:
1. Построить гистограммы распределения и эмпирической функции распределения
2. Найти доверительный интервал для оценки математического ожидания:
- С известной дисперсией.
- С неизвестной дисперсией.
3. Проверить статистические гипотезы:
- Гипотеза о численной величине среднего значения.
- Гипотеза о числовом значение дисперсии.
- Гипотеза о равенстве средних значений.
- Гипотеза о равенстве дисперсий.
- Гипотеза о виде распределения выборки.
Оглавление
гистограмма распределение интервал дисперсия
1. Цель работы
2. Построение гистограммы и эмпирической функции распределения
3. Нахождение доверительного интервала
3.1 Нахождение доверительного интервала для оценки математического нормального распределения при известной дисперсии
3.2 Нахождение доверительного интервала при неизвестной дисперсии
4. Проверка статистической гипотезы
4.1 Проверка гипотезы о равенстве средних значений
4.2 Проверка гипотезы о равенстве дисперсий
4.3 Гипотеза о численной величине среднего значения
4.4 Гипотеза о численном значении дисперсии
4.5 Проверка гипотезы о виде закона распределения
1. Цель работы
В данной курсовой работе проводится анализ данных двух выборок, состоящих из 112 и 102 случайных величин. Данные выборок получены в программе "Statistica" с помощью формулы
RndNormal(k/4)+k,
где k - мой порядковый номер в списке журнала, отсюда получаем формулу = RndNormal(3)+12.
Var1 |
||
1 |
13,90844 |
|
2 |
16,26087 |
|
3 |
14,5209 |
|
4 |
12,03951 |
|
5 |
8,733121 |
|
.. |
…………. |
|
112 |
8,851047 |
|
Var1 |
||
1 |
9,76348529 |
|
2 |
9,81413258 |
|
3 |
10,6819403 |
|
4 |
9,42766778 |
|
5 |
9,75843679 |
|
.. |
................ |
|
102 |
9,42001527 |
2. Построение гистограммы и эмпирической функции распределения
Гистограмма- это способ представления статистических данных в графическом виде - в виде столбчатой диаграммы. Она отображает распределение отдельных измерений параметров изделия или процесса. Иногда ее называют частотным распределением, так как гистограмма показывает частоту появления измеренных значений параметров объекта.
Выборка .
1. Сгенерируем выборку ,состоящую из 112 случайных величин.
2. Найдем наименьший и набольший элемент в выборке: Xmin=5,188972; Xmax=20,77344.
3. Для упрощения процедуры обработки и с целью уменьшения ошибок при вычислениях вычтем из каждого элемента ряда постоянное число (например, округленное Xmin) и используем в расчетах не сами размеры, а их отклонениями.
Наименьший элемент ряда Xmin=5,188972, округлим его до 6 и вскоре вычислим из каждого элемента выборки.
4. Для группировки данных необходимо: 1) Разбить весь диапазон R = Xmax -Xmin = 20,77344- 5,188972= 15.584468 (округлим до 16) на r интервалов. Число интервалов r устанавливают в зависимости от числа наблюдений n: для 112 наблюдений удобно взять r=12. 2) Назначить длину интервалов по формуле x = R/r=16/12 =1.3. 3) Подсчитать количество попаданий размера в интервал <
Таблица 1.
Номера интервалов |
Границы интервалов, <размерность> |
Частота, mi |
Частость |
Эмпирическая плотность вероятности pi |
Середина интервала xi |
||
xн |
xв |
||||||
1 |
0 |
0.2 |
2 |
0,018 |
0,018 |
0,1 |
|
2 |
0.2 |
0.4 |
5 |
0,045 |
0,046 |
0.3 |
|
3 |
0.4 |
0.6 |
12 |
0,109 |
0,109 |
0.5 |
|
4 |
0.6 |
0.8 |
19 |
0,173 |
0,174 |
0.7 |
|
5 |
0.8 |
1 |
24 |
0,218 |
0,218 |
0.9 |
|
6 |
1 |
1.2 |
17 |
0,155 |
0,155 |
1.1 |
|
7 |
1.2 |
1.4 |
18 |
0,164 |
0,164 |
1.3 |
|
8 |
1.4 |
1.6 |
2 |
0,018 |
0,018 |
1.5 |
|
9 |
1.6 |
1.8 |
6 |
0,055 |
0,055 |
1.7 |
|
10 |
1.8 |
2 |
5 |
0,045 |
0,046 |
1.9 |
|
112 |
1 |
Сумма всех частот равна количеству случайных величин в выборке и сумма всех частостей равна единице, следовательно, мы не допустили ошибку.
В таблице:
Частота - количество элементов выборки, попадающих в интервал.
Частость - отношение частоты к общему числу наблюдений n:
- представляет собой эмпирическую оценку вероятности попадания результатов наблюдений Хj в i интервал. Сумма всех частостей равна единицы.
Эмпирическая плотность вероятностей равна:
.
Середины интервалов необходимы для дальнейших геометрических построений.
Построение гистограммы распределения
Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам.
Рисунок 1.
Построение эмпирической функции распределения.
Для эмпирической функции распределения на оси абсцисс указывают значения границ интервалов, а на оси ординат вероятности попадания случайных величин левее интервала. (Рисунок 2).
Рисунок 2.
Выборка .
1. Сгенерируем выборку , состоящую из 102 случайных величин.
2. Найдем наименьший и набольший элемент в выборке Xmin=8,97239964; Xmax=19,30817.
3.Наименьший элемент ряда Xmin=3,580073, округляем до 4 и вычислим из каждого элемента выборки.
4. Для группировки данных необходимо: 1).Разбить весь диапазон R = Xmax -Xmin =19,30817-3,580073=15,728097 (округляем до 16) на r интервалов. Число интервалов r устанавливают в зависимости от числа наблюдений n: для 102 наблюдений, возьмем r=12.2). Назначить длину интервалов R/r=16/12=1.3 3).Подсчитать количество попаданий размера в интервал < .Далее заполним таблицу.
Таблица 2.
Номера интервалов |
Границы интервалов, <размерность> |
Частота, mi |
Частость, |
Эмпирическая плотность вероятности pi |
Середина интервала xi |
||
xн |
xв |
||||||
1 |
0 |
0.2 |
3 |
0.03 |
0.04 |
0,1 |
|
2 |
0.2 |
0.4 |
1 |
0.01 |
0.02 |
0.3 |
|
3 |
0.4 |
0.6 |
13 |
0.13 |
0.13 |
0.5 |
|
4 |
0.6 |
0.8 |
13 |
0.13 |
0.13 |
0.7 |
|
5 |
0.8 |
1 |
22 |
0.22 |
0.22 |
0.9 |
|
6 |
1 |
1.2 |
15 |
0.15 |
0.15 |
1.1 |
|
7 |
1.2 |
1.4 |
12 |
0.12 |
0.12 |
1.3 |
|
8 |
1.4 |
1.6 |
13 |
0.13 |
0.13 |
1.5 |
|
9 |
1.6 |
1.8 |
7 |
0.07 |
0.07 |
1.7 |
|
10 |
1.8 |
2 |
1 |
0.01 |
0.02 |
1.9 |
|
110 |
1 |
Сумма всех частот равна количеству случайных величин в выборке и сумма всех частотностей равна единице, следовательно, мы не совершили ошибку.
Построение гистограммы распределения.
Для построения гистограммы по оси абсцисс указывают значения границ интервалов и на их основании строят прямоугольники, высота которых пропорциональна частотам. (Рисунок 3).
Рисунок 3.
Построение эмпирической функции распределения.
Для эмпирической функции распределения на оси абсцисс указывают значения границ интервалов, а на оси ординат вероятности попадания случайных величин левее интервала. (Рисунок 4).
Рисунок 4.
3. Нахождение доверительного интервала
Доверительным называется интервал, который с заданной надежностью покрывает оцениваемый параметр.
Квантиль в математической статистике -- значение, которое заданная случайная величина не превышает с фиксированной вероятностью.
3.1 Нахождение доверительного интервала для оценки математического нормального распределения при известной дисперсии
Пример 1. Пусть среднее квадратическое отклонение нормально распределенного признака X генеральной совокупности равно 0.4, а-математическое ожидание неизвестно; объём выборки n равен 112 и выборочное среднее (mean) =12
Задача: Найдем доверительный интервал, который покроет математическое ожидание а с доверительной вероятностью P=0,9
Решение: Сгенерируем выборку, состоящую из 112 элементов и найдем среднее квадратичное отклонение выборки S=0,4 .
Для оценки математического ожидания служит интервал:
a +,
где -выборочное среднее, n - объём выборки, квантиль нормального распределения N(1;0) и уровнем надежности a=0,05, -дисперсия выборки.
Все величины, квантиля - известны. Найдем с помощью нормального распределения N (0;1) в статистическом калькуляторе. (Рисунок 5).
Рисунок 5.
1,6448541,64 -квантиль нормального распределения.
Подставим все известные значения в формулу и подсчитаем:
*a +.
11,53a или -1,04a0,83
Таким образом, делаем вывод , что доверительный интервал (-1,04; 0,83) с вероятностью P=0,9 покрывает математическое ожидание данной выборки.
Пример 2. Пусть среднее квадратическое отклонение нормально распределенного признака X генеральной совокупности равно 0,4, а-математическое ожидание неизвестно, объём выборки n равен 102 и выборочное среднее (mean) =9.9,
Задачa: Найти доверительный интервал, который покроет математическое ожидание выборки с доверительной вероятностью б=0,95.
Решение: Сгенерируем выборку, состоящую из 102 элементов и найдем среднее квадратическое отклонение S=0,4.
Для оценки математического ожидания служит интервал:
a +,
где -выборочное среднее,
n - объём выборки,
- квантиль нормального распределения с уровнем надежности a, -дисперсия выборки
Известны все величины, кроме квантиля - . Найдем с помощью нормального распределения N (0;1) в вероятностном калькуляторе (Рисунок. 6).
Рисунок 6.
1,6744901,68 -квантиль нормального распределения.
Подставим все известные значения в формулу и подсчитаем:
a +;a 0,095+;
a 1,14;
Таким образом, можно сделать вывод о том, доверительный интервал () с доверительной вероятностью a=0,95, покроет математическое ожидание выборки.
3.2 Нахождение доверительного интервала при неизвестной дисперсии
Пример 1. Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение неизвестно. Требуется оценить математическое ожидание при помощи доверительного интервала. Объём выборки n равен 112, среднее значение (mean) = -0,106; среднеквадратичное отклонение (St. Dev.) = 2,44.
Задача: Найти доверительный интервал, который покроет математическое ожидание выборки при доверительной вероятностьи а=0,9 .
Решение: Для нахождения доверительного интервала мы воспользуемся распределением Стьюдента и формулой:
(n-1)(n-1),
где - среднее выборочное значение;
S - среднеквадратичное отклонение;
A - коэффициент надежности (а=1-0,9=0,1),
(n-1)квантиль распределения Стьюдента с n-1 - степенями свободы.
Квантиль распределения Стьюдента (n-1)- найдем при помощи статистического калькулятора.
Df = 112-1=111- степени свободы; P=1-=1-=0,95- доверительная вероятность, а=0,1 -коэффициент надежности. Подсчитаем в статистическом калькуляторе. (Рисунок 7).
Рисунок 7.
1,65-квантиль распределения Стьюдента.
Подставим все полученные значения в формулу и получим:
(N-1)(N-1);
или -0,366 < m < 0,184.
Вывод: Доверительный интервал (-0,366; 0,184) покроет математическое ожидание выборки с доверительной вероятностью а=0,9.
Пример 2. Пусть количественный признак X генеральной совокупности распределен нормально, причем среднее квадратическое отклонение неизвестно. Требуется оценить математическое ожидание при помощи доверительного интервала. Объём выборки n равен 102, среднее значение (mean) = -0,04; среднеквадратичное отклонение (St. Dev.) = 2,17.
Задача: Найти доверительный интервал, который покроет математическое ожидание с доверительной вероятностью а=0,95.
Решение: Для нахождения доверительного интервала мы воспользуемся распределением Стьюдента и формулой:
(n-1)(n-1),
где -среднее выборочное значение; S-среднеквадратичное отклонение; a- коэффициент надежности (а=1-0,9=0,1), (n-1)квантиль распределения Стьюдента с n-1 - степенями свободы.(n-1)- найдем при помощи распределения Стьюдента.
Df = 102-1=101-степени свободы, P=1-=0,975-доверительная вероятность, а=0,05-коэффициент надежности. Подсчитаем в статистическом калькуляторе (Рисунок 8).
Рисунок 8.
=1,99-квантиль распределения Стьюдента.
Подставим все полученные значения в формулу и получим:
(n-1)(n-1);
или -0,47 < m < 0,04.
Таким образом, можно сделать вывод о том, что доверительный интервал
(-0,47; 0,04) покроет математическое ожидание выборки с доверительной вероятностью а=0,95.
4. Проверка статистической гипотезы
Статистическая гипотеза - это любое предположение о виде неизвестного закона распределения или о параметрах известных распределений.
Проверить статистическую гипотезу - значит проверить, согласуются ли выборочные данные с выдвинутой гипотезой.
Для проверки гипотезы, нужно подсчитать статистический критерий (случайнаую величину, которая используется с целью проверки нулевой гипотезы), который обозначается буквой и посмотреть попадает ли он в область допустимых значений, т.е. область множества возможных значений статистического критерия, в которой гипотеза принимается.
Критические точки [квантили] - это точки, которые разграничивают критическую область и область принятия гипотезы.
Уровень значимости - это вероятность совершить ошибку.
4.1 Проверка гипотезы о равенстве средних значений
1). Дано: Пусть N (12; 3), N (12; 3) и дисперсии и известны.
Имеются выборки x=( …) и y= ( …)из генеральных совокупностей и .
Сгенерируем выборки X и Y, состоящие из 112 и из 102 случайных величин. Найдем среднее значение выборки X = и среднее значение выборки Y =.
Задача: Проверить гипотезу о том, что действительно ли средние распределение двух выборок равны, т.е. равны ли математические ожидания двух выборок.
Решение: Выдвинем нулевую гипотезу := ,против альтернативной : ?,матемаческое ожидание выборки X, -математическое ожидание выборки Y.
Если гипотеза выполняется, то статистика = будет иметь стандартное нормальное распределение N (1;0) и доверительную вероятность, близкую к 1. Гипотеза применяется, если <, т.е. если значение статистики окажется меньше значения критической точки [квантиля].
Проверим гипотезу: Подставим все известные значения в формулу и подсчитаем статистику.
= == =
= = -1.069.
Критическую точку найдем при помощи нормального распределения N (0;1) при доверительной вероятности P=1-=0,975,где 0,05 -уровень значимости. Подсчитаем при помощи статистического калькулятора. (Рисунок 9).
Рисунок 9.
Критическая точка равна =1,96.
Проведя расчёты, мы видим, что 1.812 <1,96, ? - значение случайной величины меньше значения критической точки.
Вывод: Так как значение статистики получилось меньше значения критической точки , то у нас есть все основания полагать, что выдвинутая нами гипотеза окажется верной.
2). Дисперсии и неизвестны, но равны.
Задача: Проверить гипотезу о равенстве дисперсии у выборок.
Решение: Выдвинем гипотезу : = ,, при этом : ?, где -математическое ожидание выборки X, -математическое ожидание выборки Y.
Доказано, что в случае справедливости гипотезы, о том что математические ожидания двух выборок будут равны, статистика -
Будет иметь распределение Стьюдента с k=+-2 степенями свободы,
где и выборочные дисперсии, - средние значения выборок.
В этом случае гипотеза применяется , если < <, т.е. если статистика окажется в области допустимых значений, находящимся между критическими точками.
Проверим гипотезу: найдем выборочные дисперсии для выборок -
Подставим в формулу все известные значения и вычислим статистику
= =
= = = =-0.0140
При помощи распределения Стьюдента с k= по заданной доверительной вероятности P=0,95 найдем критические точки, воспользовавшись статистическим калькулятором.
=1-=0,975-квантиль распределения Стьюдента, где 0,05 - уровень надежности. df=112+102 -2 =212 -степени свободы. (Рисунок10).
Рисунок 10.
- правая критическая точка равна 0,83.
==0,025-квантиль распределения Стьюдента. df=212-степени свободы (см. Рисунок 11).
Рисунок 11.
- левая критическая точка равна -1,97.
Случайная величина (статистика) попадает в область допустимых значений, т.е. в промежуток между критическими точками 0,0140 <0,834643.
Вывод: так как случайная величина попадает в область допустимых значений, то у нас есть все основания принять выдвинутую нами гипотезу.
4.2 Проверка гипотезы о равенстве дисперсий
Гипотезы о дисперсиях возникают довольно часто, поскольку дисперсия характеризует такие важные показатели, как точность приборов, технологических процессов, риск, связанный с отклонением доходности от заданного уровня, и т.д.
Дано: пусть имеются две выборки x=( …) и y= ( …) из генеральных совокупностей N (12; 3) и N (12; 3).
Сгенерируем выборку Х, состоящую из 112 случайных величин и найдем среднее выборочной квадратичное отклонение .
Сгенерируем выборку Y, состоящую из 102 случайных величин и найдем среднее выборочное квадратичное отклонение
Задача: Проверить гипотезу о равенстве дисперсия у выборок.
= против альтернативной - ? .
Решение: для проверки гипотезы о равенстве дисперсий у выборок, используют статистический критерий -
;
которая имеет распределение Фишера со степенями свободы ( и (.
Подставим в формулу все известные значения и подсчитаем
==.
Для проверки гипотезы , нужно найти критические точки (U и V).
Гипотезы применяется при условии U, т.е. если статистика попадёт в область допустимых значений.
Критические точки [квантили] найдем при помощи распределения Фишера со степенями свободы =112-1=111, =102-1=101 и доверительной вероятностью P=0,95.
Подсчитаем с помощью статистического калькулятора.
Для нахождения правой критической точки V, вероятность P=1-=0,975-квантиль распределения Фишера.=112-1=111, =102-1=101 (см. Рисунок.12).
Рисунок 12.
Критическая точка V=1,4.
Для нахождения левой критической точки U. P==0,25-квантиль распределения Фишера, =112-1=111, =102-1=101. (см. Рисунок 13).
Критическая точка U=0,87.
Статистический критерий, статистика - попадает в область допустимых значений, то есть в отрезок, находящийся между критическими точками условии U; 0,871,4.
Вывод: Так как статистика попадает в область допустимых значений, то у нас есть все основания принять выдвинутую нами гипотезу.
4.3 Гипотеза о численной величине среднего значения
Дано: случайная величина N (12; 3) и n-выборка её значений x=( …).
Сгенерируем выборку состоящую из 112 случайных величин и найдем значения, которые понадобятся для дальнейших вычислений =18,05 -среднее выборочное значение, =2,6 - средне квадратичное отклонение.
Задача: Рассмотреть гипотезу о численной величине среднего значения.
1. Дисперсия известна
Решение: Выдвинем гипотезу : =, где a=среднему значению построенной нами выборки 17,7, и её альтернативу : ?. Проверим гипотезу на доверительном уровне =0,05.
Статистический критерий (статистика) - Ш= будет иметь стандартное нормальное распределение, если верна (т.е. =). При заданном уровне доверия =0,05.
Гипотеза применяется, если | Ш |< . Тогда критическими значениями будут =-, =.
Подсчитаем статистику, Ш== =-1,65.
Найдем критическую точку с помощью нормального распределения где P=1- =0,975-квантиль нормального распределения в статистическом калькуляторе (см. Рисунок 14).
Рисунок 14.
=1,96 - критическая точка.
Видно, что | Ш |< , -1,65<1,96 - статистика меньше критической точки.
Вывод: так как критическая точка оказалась меньше , чем статистика Ш, то у нас есть все основания принять выдвинутую нами гипотезу.
2) Дисперсия неизвестна.
Дано: случайная величина N (12; x) и n-выборка её значений
x=( …).
Решение: Выдвинем гипотезу : =, где a=среднему значению построенной нами выборки 17,7, и её альтернативу : ?. Проверим гипотезу на доверительном уровне =0,05.
В этом случае в качестве статистики берут - Ш=,- средне квадратичное отклонение. Установлено, что статистика Ш будет иметь распределение Стьюдента с n-1 степенями свободы. Для заданного уровня доверия =0,05, гипотеза принимается, если |Ш|< .
Подсчитаем статистику Ш===0,2 и критические точки с помощью распределение Стьюдента с n-1 степенями свободы.
P=1-=0,975-квантиль распределения Стьюдента, df=112-1=111-степени свободы в статистическом калькуляторе (см. Рисунке 15).
Рисунок 15.
=1,98 - критическая точка.
Видно, что |Ш|< , 0,2<1,98 - статистика меньше, чем критическая точка.
Вывод: так как оказалось, что статистический критерий меньше критической точки, то у нас есть все основания для того чтобы принять выдвинутую нами гипотезу.
4.4 Гипотеза о численном значении дисперсии
Дано: случайная величина N (12; 3) и n-выборка её значений
x=( …).
Сгенерируем выборку и найдем значения, которые понадобятся для дальнейших вычислений среднее выборочное значение ==7,29 и дисперсия ==9
Задача: Проверить гипотезу о численном значении дисперсии.
Решение: Выдвинем гипотезу : =, где построенной нами выборки 9 и её альтернативу : ?. Проверим гипотезу на доверительном уровне =0,05.
В качестве статистики выбираем величину равную -
Ш=,
Где - выборочное среднее значение выборки, -дисперсия выборки.
Подставим все известные значения в формулу и подсчитаем
Ш==89,91
Статистический критерий будет иметь хи-квадрат распределение с n-1 степенями свободы. Для заданного уровня значимости а=0,95 найдем критические точки U и V.
Гипотезу принимаем при условии, если Ш V.
Найдем критические точки с помощью распределения хи-квадрат распределение с 111 степенями свободы в статистическом калькуляторе.
При квантиле t=1-0,025=0,975 и степенью свободы df=111 (см. рисунок 16).
Рисунок 16.
Правая критическая точка V=142,048.
При квантиле t=0,025 и степенью свободы df=111 (см. Рисунок 17).
Рисунок 17.
Левая критическая точка U=83,73
Видно, что статистический критерий Ш, попал в отрезок , находящийся между критический точками U и V,т.е. в область допустимых значений. 83,73<89,91<142,048.
Вывод: Так как значение статистического критерия Ш лежит в области допустимых значений, то у нас есть все основания, для того чтобы принять выдвинутую нами гипотезу.
4.5 Проверка гипотезы о виде закона распределения
Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.
Дано: случайная величина N (12; 3) и n-выборка её значений
x=( …).
Задача: Проверить гипотезу о том, что закон распределения случайной величины нормальный.
Гипотеза применяется, если значения попадёт в область допустимых значений, т.е. окажется в промежутке между критическими точками V<<U.
Решение: Сгенерируем выборку, состоящую из 112 случайных величин и найдем минимальное и максимально значение ряда: =5,188 и =20,77.
Использую выборку, построим гистограмму распределения (см. Рисунок 18).
Рисунок 18.
На рисунке видно, что математическое ожидание выборки а=18,1, среднее квадратическое отклонение S=2,4.
Далее, нужно по гистограмме, нужно подсчитать сколько элементов выборки попало в каждый интервал.
В интервал от 10 до 12: 1 элемент, от 12 до 14: 6 элементов, от 14 до 16: 14 элементов, от 16 до 18: 37 эл, от 18 до 20: 34 эл, от 20 до 22: 20 эл, от 22 до 24: 5 эл, от 24 до 26: 1 эл.
С помощью нормального распределения N(12; 3) найдем вероятности попадания, элементов выборки во все интервалы, воспользовавшись вероятностным калькулятором.
=0,004- вероятность, попадания элементов выборки левее интервала 10 (см. Рисунок 19).
Рисунок 19.
Подсчитаем так для всех интервалов:
=0,005978;=0,044499;
,187280;,470020;,769598; ,939461; ,990936. ,999253.
Далее найдем - вероятность попадания элементом в каждую выборку.
=-; - и так далее для каждой выборки.
Таблица 3
j |
частота |
||||
1 |
1 |
0,0197 |
2,3 |
-1,9 |
|
2 |
6 |
0,038521 |
4,5 |
1,5 |
|
3 |
14 |
0,144781 |
17 |
-3 |
|
4 |
37 |
0,28274 |
33,3 |
11,04 |
|
5 |
34 |
0,299578 |
35,3 |
-1,3 |
|
6 |
20 |
0,169863 |
20,04 |
-0,04 |
|
7 |
5 |
0,051475 |
6,07 |
1,07 |
|
8 |
1 |
0,008317 |
0,98 |
0,08 |
В таблице: - количество элементов, попадающих в каждый интервал.
Для того чтобы найти значение , необходимо использовать формулу:
и подсчитать для каждого интервала, а потом все полученные значения сложить.
Подсчитаем и получим значение = 5,9167.
Для того чтобы проверить гипотезу найдем критические точки (квантили) с помощью распределения в статистическом калькуляторе.
Степени свободы df=n-3, где n- количество столбцов в гистограмме распределения, df=12-3=9. Доверительная вероятность близка к еденице P=0,975.
Рисунок 20.
Правая критическая точка U=19
Таким же способом найдем вторую левую критическую точку. (см. Рисунок 21).
Рисунок 21
Левая критическая точка V=2,7.
Мы видим, что значение =5,9167 находится в области допустимых значений, т.е. между значениями U и V, 2,7<5,9167<19.
Вывод: у нас имеются все основания принять выдвинутую нами гипотезу.
Размещено на Allbest.ru
Подобные документы
Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.
контрольная работа [2,0 M], добавлен 05.04.2014Статистический анализ курса Центрального банка валютной пары евро/рубль, построение соответствующих гистограмм. Выполнение описательной статистики выборочных данных, проверка гипотезы о нормальном распределении, равенстве средних и равенстве дисперсий.
курсовая работа [2,5 M], добавлен 08.07.2015Разработка алгоритма и программы на одном из алгоритмических языков для построения эмпирической плотности распределения случайных величин. Осуществление проверки гипотезы об идентичности двух плотностей распределения, используя критерий Пирсонга.
лабораторная работа [227,8 K], добавлен 19.02.2014Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.
контрольная работа [172,2 K], добавлен 27.02.2011Описание оборудования предприятия автосервиса. Построение интервального ряда экспериментального распределения. Проверка адекватности математической модели экспериментальным данным. Расчет значений интегральной и дифференциальной функции распределения.
курсовая работа [522,9 K], добавлен 03.12.2013Понятие доверительного интервала и доверительной вероятности. Доверительный интервал для математического ожидания (пример задачи). Распределение Стьюдента. Принятие решения о параметрах генеральной совокупности, проверка статистической гипотезы.
реферат [64,9 K], добавлен 15.02.2011Оценка параметров шестимерного нормального закона распределения с помощью векторов средних арифметических и среднеквадратического отклонений и матрицы парных коэффициентов корреляции (по программе Statistica). Методика определения Z-преобразования Фишера.
контрольная работа [33,6 K], добавлен 13.09.2010Теоретические основы первичной обработки статистической информации. Особенности определения минимального числа объектов наблюдения при оценке показателей надежности. Анализ вероятностной бумаги законов нормального распределения и распределения Вейбулла.
курсовая работа [163,5 K], добавлен 22.03.2010Анализ распределений для выявления закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Характеристика центральной тенденции распределения и оценка вариации признака.
лабораторная работа [606,7 K], добавлен 13.05.2010Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.
лабораторная работа [234,7 K], добавлен 28.02.2010