Проверка гипотезы о биномиальном распределении генеральной совокупности
Статическая проверка статистических гипотез. Ошибки первого и второго рода. Числовые характеристики случайной величины, распределенной по биномиальному закону. Проверка гипотезы о биномиальном распределении генеральной совокупности по критерию Пирсона.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 03.05.2011 |
Размер файла | 674,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Курсовая работа
"Проверка гипотезы о биномиальном распределении генеральной совокупности"
Введение
статистический гипотеза биноминальный пирсон
Система приёмов в математической статистике предназначена для проверки соответствия опытных данных некоторой статистической гипотезе. Процедуры статистических проверок гипотез позволяют принимать или отвергать статистические гипотезы, возникающие при обработке результатов измерений во многих практически важных разделах науки и производства, связанных с экспериментом. Правило, по которому принимается или отклоняется данная гипотеза, называется статистическим критерием. Построение критерия определяется выбором подходящей функции T от результатов наблюдений, которая служит мерой расхождения между опытными и гипотетическими значениями. Эта функция, являющаяся случайной величиной, называется статистикой критерия, при этом предполагается, что распределение вероятностей T может быть вычислено при допущении, что проверяемая гипотеза верна. По распределению статистики T находится значение такое, что если гипотеза верна, то вероятность неравенства равна , где - заранее заданный уровень значимости. Если в конкретном случае обнаружится, что , то гипотеза отвергается, тогда как появление значения не противоречит гипотезе.
Теория статической проверки гипотез позволяет с единой точки зрения трактовать выдвигаемые практикой различные задачи математической статистики.
Идеи последовательного анализа, примененные к статической проверке гипотез, указывают на возможность связать решение о принятии или отклонении гипотезы с результатами последовательно проводимых наблюдений. В этом случае число наблюдений, на основе которых по определённому правилу принимается решение, не фиксируется заранее, а определяется в ходе эксперимента.
1. Статическая проверка статистических гипотез
1.1. Статическая гипотеза. Нулевая и конкурирующая, простая и сложная гипотезы
Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположит, что он имеет определенный вид А, выдвигают гипотезу: генеральная совокупность распределена по закону А. Таким образом, в этой гипотезе речь идёт о виде предполагаемого распределения.
Если закон распределения известен, а его параметры неизвестны, но есть основания предположить, что неизвестный параметр x равен определенному значению , выдвигают гипотезу: . Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Определение 1.1.1: Статистическая гипотеза - гипотеза о виде неизвестного распределения, или о параметрах известных распределений.
Например, статистическими являются гипотезы:
1) генеральная совокупность распределена по закону Пуассона - предположение о виде неизвестного распределения;
2) дисперсии двух нормальных совокупностей равны между собой -
предположение о параметрах двух известных распределений.
Гипотеза «на Марсе есть жизнь» не является статистической, поскольку в ней не идет речь ни о виде, ни о параметрах распределения.
Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречащая гипотеза. По этой причине эти гипотезы целесообразно различать.
Определение 1.1.2: Нулевая (основная) гипотеза - выдвинутая гипотеза .
Определение 1.1.3: Конкурирующая (альтернативная) гипотеза - гипотеза , которая противоречит нулевой.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что . Коротко записывают так: ; .
Различают гипотезы, которые содержат только одно и более одного предположений.
Определение 1.1.4: Простая гипотеза - гипотеза, содержащая только одно предположение.
Например, если - параметр показательного распределения, то гипотеза - простая. Гипотеза математическое ожидание нормального распределения равно 3 () - простая.
Определение 1.5: Сложная гипотеза - гипотеза, которая состоит из конечного или бесконечного числа простых гипотез.
Например, сложная гипотеза состоит из бесчисленного множества простых вида , где - любое число, большее 5. Гипотеза математическое ожидание нормального распределения равно 3 () - сложная.
1.2 Ошибки первого и второго рода
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки.
Определение 1.2.1: Статистической проверкой называют проверку, которую производят статистическими методами.
В итоге статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов.
Определение 1.2.2: Ошибка первого рода - ошибка, состоящая в том, что будет отвергнута правильная гипотеза.
Определение 1.2.3: Ошибка второго рода - ошибка, состоящая в том, что будет принята неправильная гипотеза.
Последствия этих ошибок могут оказаться весьма различными. Например, если отвернуто правильное решение «продолжать строительство жилого дома», то эта ошибка первого рода повлечет материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей.
Замечание 1.2.1: Правильное решение может быть принято также в двух случаях:
1) гипотеза принимается, причем и в действительности она правильная;
2) гипотеза отвергается, причем и в действительности она неверна.
Замечание 1.2.2: Вероятность совершить ошибку первого рода принято обозначать через ; ее называют уровнем значимости. Наиболее часто уровень значимости принимают равным 0,05 или 0,01. Если, например, принят уровень значимости, равный 0,05, то это означает, что в пяти случаях из ста имеется риск допустить ошибку первого рода (отвергнуть правильную гипотезу).
1.3 Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия
Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближенное распределение которой известно. Эту величину обозначают:
а) U или Z, если она распределена нормально;
б) F или - по закону Фишера - Снедекора;
в) T - по закону Стьюдента;
г) - по закону «хи квадрат»; …
Поскольку в этом параграфе вид распределения во внимание приниматься не будет, обозначим эту величину в целях общности через K.
Определение 1.3.1: Статистическим критерием (или просто критерием) называют случайную величину K, которая служит для проверки нулевой гипотезы.
Например, если проверяют гипотезу о равенстве дисперсии двух нормальных генеральных совокупностей, то в качестве критерия K принимают отношение исправленных выборочных дисперсий:
Эта величина случайная, потому что в различных опытах дисперсии принимают различные, наперед неизвестные значения, и распределена по закону Фишера - Снедекора.
Для проверки гипотезы по данным выборки вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
Определение 1.3.2: Наблюдаемым значением называют значение критерия, вычисленное по выборкам.
Например, если по двум выборкам найдены исправленные выборочные дисперсии и , то наблюдаемое значение критерия F
Пример 1.3.1:
Условие:
По двум независимым выборкам, объемы которых и , извлеченным из нормальных генеральных совокупностей X и Y, найдены исправленные выборочные дисперсии и . При уровне значимости , проверить нулевую гипотезу : равенстве генеральных дисперсий при конкурирующей гипотезе .
Решение:
Найдем отношение большей исправленной дисперсии к меньшей:
По условию конкурирующая гипотеза имеет вид , поэтому критическая область - двусторонняя. В соответствие с правилом при отыскании критической точки следует брать уровень значимости вдвое меньше заданного.
По таблице, по уровню значимости
и числам степеней свободы и , находим критическую точку
Так как - нулевую гипотезу о равенстве генеральной дисперсии отвергаем.
1.4 Критическая область. Область принятия гипотезы. Критические точки
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая - при которых она принимается.
Определение 1.4.1: Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Определение 1.4.2: Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области - гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы - гипотезу принимают.
Поскольку критерий K - одномерная случайная величина, все ее возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Определение 1.4.3: Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
а) 0 K
б) 0
в) 0
Рис. 1.4.1
Определение 1.4.4: Правосторонней называют критическую область, определяемую неравенством, где - положительное число (рис. 1.4.1, а)
Определение 1.4.5: Левосторонней называют критическую область, определяемую неравенством, где - отрицательное число (рис. 1.4.1, б)
Определение 1.4.6: Односторонней называют правостороннюю или левостороннюю критическую область.
Определение 1.4.7: Двусторонней называют критическую область, определяемую неравенствами , где .
В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами (в предположении, что): или равносильным неравенством (рис. 1.4.1, в).
1.5 Отыскание правосторонней критической области
Как найти критическую область? Обоснованный ответ на этот вопрос требуется привлечения довольно сложной теории. Ограничимся ее элементами. Для определенности начнем с нахождения правосторонней критической области, которая определяется неравенством, где. Видим, что для отыскания правосторонней критической области достаточно найти критическую точку. Следовательно, возникает новый вопрос: как ее найти?
Для ее нахождения задаются достаточной малой вероятностью - уровнем значимости . Затем ищут критическую точку, исходя из требования, чтобы при условии справедливости нулевой гипотезы вероятность того, что критерий K примет значение, большее
Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую этому требованию.
Замечание 1.5.1: Когда критическая точка уже найдена, вычисляют по данным выборок наблюденное значение критерия и, если окажется, что, то нулевую гипотезу отвергают; если же, то нет оснований, чтобы отвергнуть нулевую гипотезу.
Пояснение: Почему правосторонняя критическая область была определена исходя их требования, чтобы при справедливости нулевой гипотезы выполнялось соотношение
Поскольку вероятность события мала (), такое событие при справедливости нулевой гипотезы, в силу принципа практической невозможности маловероятных событий, в единичном испытании не должно наступить. Если все же оно произошло, т.е. наблюдаемое значение критерия оказалось больше, то это можно объяснить тем, что нулевая гипотеза ложна и, следовательно, должна быть отвергнута. Таким образом, требование (1.5.2) определяет такие значения критерия, при которых нулевая гипотеза отвергается, а они и составляют правостороннюю критическую область.
Замечание 1.5.2: Наблюдаемое значение критерия может оказаться большим не потому, что нулевая гипотеза ложна, а по другим причинам (малый объем выборки, недостатки методики эксперимента и др.). В этом случае, отвергнув правильную нулевую гипотезу, совершают ошибку первого рода. Вероятность этой ошибки равна уровню значимости Итак, пользуясь требованием (1.5.2), мы с вероятностью рискуем совершить ошибку первого рода.
Заметив кстати, что в книгах по контролю качества продукции вероятность признать негодной партию годных изделий называют «риском производителя», а вероятность принять негодную партию - «риском потребителя».
Замечание 1.5.3: Пусть нулевая гипотеза принята; ошибочно думать, что тем самым она доказана. Действительно, известно, что один пример, подтверждающий справедливость некоторого общего утверждения, еще не доказывает его. Поэтому более правильно говорить «данные наблюдений согласуются с нулевой гипотезой и, следовательно, не дают оснований ее отвергнуть».
На практике для большей уверенности принятия гипотезы ее проверяют другими способами или повторяют эксперимент, увеличив объем выборки.
Отвергают гипотезу более категорично, чем принимают. Действительно известно, что достаточно привести один пример, противоречащий некоторому общему утверждению, чтобы это утверждение отвергнуть. Если оказалось, что наблюдаемое значение критерия принадлежит критической области, то этот факт и служит примером, противоречащим нулевой гипотезе, что позволяет ее отклонить.
1.6 Отыскание левосторонней и двусторонней критических областей
Отыскание левосторонней и двусторонней критических областей сводится (так же, как и для правосторонней) к нахождению соответствующих критических точек.
Левосторонняя критическая область определяется неравенством (). Критическую точку находят исходя из требования, чтобы при справедливости нулевой гипотезы вероятность того, что критерий примет значение, меньшее, была равна принятому уровню значимости:
Двусторонняя критическая область определяется неравенствами . Критические точки находят исходя из требования, чтобы при справедливости нулевой гипотезы сумма вероятностей того, что критерий примет значение, меньшее или большее , была рана принятому уровню значимости:
Ясно, что критические точки могут быть выбраны бесчисленным множеством способов. Если же распределение критерия симметрично относительно нуля и имеются основания выбрать симметричные относительно нуля точки и (), то:
Учитывая (1.6.2), получим
Это соотношение и служит для отыскания критических точек двусторонней критической области.
Критические точки находят по соответствующим таблицам.
1.7 Понятие о критериях согласия
Во многих случаях практики на основании тех или иных данных делается предположение о виде закона распределения интересующей нас случайной величины X. Однако для окончательного решения вопроса о виде закона распределения в подобных случаях представляется целесообразным проверить, насколько сделанное предположение согласуется с опытом. При этом ввиду ограниченного числа наблюдений опытный закон распределения обычно будет в какой-то мере отличаться от предполагаемого, даже если предположение о законе распределения сделано правильно. В связи с этим возникает необходимость решать следующую задачу: является ли расхождение между опытным законом распределения и предполагаемым законом распределения следствием ограниченного числа наблюдений, или оно является существенным и связано с тем, что действительное распределение случайной величины отличается от предполагаемого. Для решения поставленной задачи служат так называемые «критерии согласия».
Определение 1.7.1: Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Имеется несколько критериев согласия: («хи квадрат») К. Пирсона, Колмогорова, Смирнова и другие.
2. Биномиальное распределение
Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность наступления события во всех испытаниях постоянна и равна p (следовательно, вероятность не появления q=1 - p). Рассмотрим в качестве дискретной случайной величины X число появлений события A в этих испытаниях.
Поставим задачу: найти закон распределения величины X. Для ее решения требуется определить возможные значения X и их вероятности. Очевидно, событие A в n испытаниях может либо не появиться, либо появиться 1 раз, либо 2 раза, …, либо n раз. Таким образом, возможные значения X таковы: Остается найти вероятности этих возможных значений, для чего достаточно воспользоваться формулой Бернулли:
где k=0, 1, 2, …, n.
Формула (2.1) и является аналитическим выражением закона распределения.
Определение 2.1: Биномиальным называют распределение вероятностей, определяемое формулой Бернулли. Закон назван «биномиальным» потому, что правую часть равенства (2.1) можно рассматривать как общий член разложения бинома Ньютона:
……
Таким образом, первый член разложения определяет вероятность наступления рассматриваемого события n раз в n независимых испытаниях; второй член определяет вероятность наступления события n - 1 раз; …; последний член определяет вероятность того, что событие не появится ни разу.
Напишем биномиальный закон в виде таблицы 2.1:
X |
n |
n-1 |
… |
k |
… |
0 |
|
P |
… |
… |
Пример 2.1:
Условие:
Жарким солнечным летом во время разгара купального сезона студенту необходимо сдать пять экзаменов: по английскому языку, по математическому анализу, по электрической механике, по ТОЭ, по технической механике. Итог каждого экзамена не влияет на сдачу других. Вероятность сдачи студентом каждого экзамена с первого раза равна 0,9. Составить закон распределения числа не сданных экзаменов с первого раза.
Определить наивероятнейшее число сданных экзаменов.
Решение:
Пусть дискретная случайная величина X - число не сданных экзаменов. Тогда X имеет следующие возможные значения: (студент сдал все экзамены), (студент не сдал 1 экзамен), (студент не сдал 2 экзамена), (студент не сдал 3 экзамена), (студент не сдал 4 экзамена), (студент не сдал ни один экзамен из пяти).
Итог каждого экзамена не влияет на сдачу других, т.е. эти события независимы один от другого, вероятности не сдачи каждого экзамена равны между собой, т. к. равны вероятности сдачи каждого экзамена, поэтому применима формула Бернулли. Учитывая, что, по условию n=5, q=0,9, получим:
Проверка:
Напишем искомый биномиальный закон распределения X:
X |
0 |
1 |
2 |
3 |
4 |
5 |
|
P |
0,0729 |
0,00045 |
Заметим, что наивероятнейшее число не сданных экзаменов является 0.
3. Числовые характеристики случайной величины, распределенной по биномиальному закону
Закон распределения полностью характеризует случайную величину с вероятностной точки зрения. Зная закон распределения случайной величины, можно указать, где располагаются возможные значения случайной величины и какова вероятность ее появления в том или ином интервале.
Однако при решении многих практических задач нет необходимости характеризовать случайную величину полностью, а достаточно иметь о ней только некоторое общее представление. Для такой общей характеристики в теории вероятностей используются специальные величины, которые носят название числовых характеристик случайной величины.
3.1 Математическое ожидание случайной величины, распределенной по биномиальному закону
Пусть производится n независимых испытаний, в каждом из которых вероятность появления события А постоянна и равна p.
Теорема 3.1.1: Математическое ожидание M(X) биномиального распределения числа появлений события А в n независимых испытаниях равно произведению числа испытаний на вероятность появления события в каждом испытании:
Доказательство.
Будем рассматривать в качестве случайной величины X число наступления события A в n независимых испытаниях. Очевидно, общее число X появлений события A в этих испытаниях складывается из чисел появлений события в отдельных испытаниях. Поэтому если - число появлений события в первом испытании, - во втором, …, - в n-м, то общее число появлений события … .
Из свойства математического ожидания,
+ … +
Каждое из слагаемых правой части равенства есть математическое ожидание числа появлений события в одном испытании: - в первом, - во втором и т.д. Так как математическое ожидание числа появлений события в одном испытании равно вероятности события, то … = Подставляя в правую часть равенства вместо каждого слагаемого p, получим
M(X)=np.
3.2 Дисперсия случайной величины, распределенной по биномиальному закону
Пусть производится n независимых испытаний, в каждом из которых вероятность появления события A постоянна.
Теорема 3.2.1: Дисперсия биномиального распределения числа появлений события А в n независимых испытаниях, в каждом из которых вероятность p появления события постоянна, равна произведению числа испытаний n на вероятности появления и не появления события в одном испытании:
Доказательство.
Рассмотрим случайную величину X - число появлений события A в n независимых испытаниях. Очевидно, общее число появлений события в этих испытаниях равно сумме появлений события в отдельных испытаниях:
где -число наступлений события в первом испытании, - во втором, …, - в n-м.
Величины ,, …, взаимно независимы, так как исход каждого испытания не зависит от исходов остальных, поэтому мы вправе воспользоваться свойством дисперсии
+ … +
Вычислим дисперсию по формуле
Величина - число появлений события А в первом испытании, поэтому
Найдем математическое ожидание величины которая может принимать только два значения, а именно: с вероятностью p и с вероятностью q:
Подставляя найденные результаты в соотношение (2.1.2.3), имеем
Очевидно, дисперсия каждой из остальных случайных величин равна pq. Заменив каждое слагаемое правой части (2.1.2.2) через pq, окончательно получим
3.3 Среднее квадратическое отклонение случайной величины, распределенной по биномиальному закону
Определение 3.3.1: Средним квадратическим отклонением случайной величины X называют квадратный корень из дисперсии:
Пусть известны средние квадратические отклонения нескольких взаимно независимых случайных величин. Найдем среднее квадратическое отклонение суммы этих величин.
Теорема 3.3.1: Среднее квадратическое отклонение суммы конечного числа взаимно независимых случайных величин равно квадратическому корню из суммы квадратов средних квадратических отклонений этих величин:
…+
Доказательство.
Обозначим через X сумму рассматриваемых взаимно независимых величин:
Дисперсия суммы несколько взаимно независимых случайных величин равна сумме дисперсий слагаемых, поэтому
4. Проверка гипотезы о биномиальном распределении генеральной совокупности по критерию Пирсона
Обычно эмпирические и теоретические частоты различаются. Случайно ли расхождение частот? Критерий Пирсона дает ответ на этот вопрос, правда, как и любой статистический критерий, он не доказывает справедливость гипотезы в строго математическом смысле, а лишь устанавливает на определенном уровне значимости ее согласие или несогласие с данными наблюдений.
Итак, пусть по выборке объема n получено статистическое распределение значений признака X, где - наблюдаемые значения признака, - соответствующие им частоты:
X |
… |
|||||
n |
… |
Понятно, что чем меньше разность , тем ближе эмпирическое распределение к теоретическому, поэтому, чем меньше значение критерия, тем с большей достоверностью можно утверждать, что эмпирическое и теоретическое распределение подчинены одному закону.
4.1 Алгоритм критерия Пирсона
1. Сначала по данным выборки получают статистическое распределение наблюдаемого признака.
2. Затем - вычисляют теоретические частоты признака, какими они должны были бы быть, если бы признак был действительно распределен в соответствии с данным законом.
3. По формуле (4.1) вычисляют эмпирическое значение критерия.
4. По таблице критических значений критерия Пирсона определяют на необходимом уровне значимости и при заданном числе степеней свободы s. Число степеней свободы вычисляется по формуле , где k - число разрядов групп выборки (число различных вариант), r - число параметров предполагаемого распределения, в случае биномиального распределения .
5. В случае, если, основную гипотезу принимают, в этом случае на заданном уровне значимости можно утверждать, что статистическое распределение изучаемого параметра подчинено данному закону распределения. Если же имеет место обратное неравенство, принимают альтернативную гипотезу: статистическое распределение отличается от данного.
Итак, единственным нетривиальным действием в этом алгоритме является определение теоретических частот. Они, разумеется, зависят от закона распределения, поэтому - для различных законов определяются по-разному.
4.2 Эмпирические и теоретические (выравнивающие) частоты биномиального распределения
Рассмотрим дискретную случайную величину X, закон распределения которой неизвестен. Пусть произведено n испытаний, в которых величина X приняла раз значение , раз значение , …, раз значение , причем .
Определение 4.2.1: Эмпирическими частотами называют фактически наблюдаемые частоты .
Пусть имеются основания предположить, что изучаемая величина X распределена по некоторому определенному закону. Чтобы проверить, согласуется ли это предположение с данными наблюдений, вычисляют частоты наблюдаемых значений, т.е. находят теоретически частоту каждого из наблюдаемых значений в предположении, что величина X распределена по предполагаемому закону.
Определение 4.2.2: Выравнивающими (теоретическими) в отличие от фактически наблюдаемых эмпирических частот называют частоты , найденные теоретически (вычислением). Выравнивающие частоты находят с помощью равенства
где n - число испытаний; , вычисленная при допущении, что X имеет предполагаемое распределение.
Пример 4.1:
Условие:
В результате научного эксперимента, состоящего из n=50 испытаний, в каждом из которых регистрировалось число появлений некоторого события, получены следующие данные:
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
Наблюдаемые значения, |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Эмпирическая частота, |
9 |
5 |
3 |
7 |
11 |
4 |
2 |
9 |
При уровне значимости 0,05 проверить гипотезу о биномиальном распределении генеральной совокупности данных эксперимента.
Решение:
Для проверки гипотезы нам необходимо оценивать эмпирические и соответствующие им теоретические частоты, которые нам предстоит найти.
Известно, что математическое ожидание биномиального распределения:
Поскольку в качестве оценки математического ожидания принимают выборочную среднюю , то следовательно, есть возможность найти вероятность появления события в каждом испытании:
Найдем теоретические частоты (результаты умножения округлены до единицы):
(6)
В итоге получим:
i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
|
Эмпирическая частота, |
9 |
5 |
3 |
7 |
11 |
4 |
2 |
9 |
|
Теоретическая частота, |
Найдем число степеней свободы, учитывая, что статистическое распределение наблюдаемого признака является биномиальным, т.е. , а k=8 - число разрядов групп выборки (число различных вариант). Тогда:
По таблице критических точек распределения по уровню значимости и числу степеней свободы находим:
Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о биномиальном распределении генеральной совокупности.
Заключение
Статистическая проверка гипотез нашла широкое применение на практике. Различные методы применяются в большинстве научных работ в области медицины и биологии. Началом современного этапа теории статистических методов - математической статистики - можно считать основание К. Пирсоном в 1900 г. журнала «Biometrika». В настоящее время в медико-биологических исследованиях используются статистические методы, разработанные в основном в первой трети XX века. Однако математическая статистика бурно развивалась и в последующие 50 лет. Кроме решения новых задач, изучаются свойства традиционных статистических методов, предлагались новые методы для применения в классических постановках.
Применение статистических методов в медицине стало в основном ограничиваться делением результатов на значимые и незначимые, при этом мало внимания обращается, или вовсе не обращается, на частоту ошибок типа второго рода.
Список использованной литературы
1. Гмурман В.Е. «Теория вероятностей и математическая статистика» - Москва: Высшая школа, 2001.
2. Гурский Е.И. «Теория вероятностей с элементами математической статистики» - Москва: Высшая школа, 1971.
3. Кремер Н.Ш. «Теория вероятностей и математическая статистика» - Москва: Юнити, 2007.
4. Гмурман В.Е. «Руководство к решению задач по теории вероятностей и математической статистике» - Москва: Высшая школа, 2001.
5. Кендалл М., Стюарт. А. «Статистические выводы и связи» - Москва: Наука, 1973.
6. «Большая Советская Энциклопедия» /Третье издание - Москва: Большая Советская Энциклопедия, 1971.
7. Крамер Г. «Математические методы статистики» - Москва: Мир, 1976.
Размещено на Allbest.ru
Подобные документы
Интервальный вариационный ряд. Построение гистограммы плотности относительных частот. Выдвижение гипотезы о законе распределения генеральной совокупности Х. Функция плотности рассматриваемого закона распределения "Построение ее на гистограмме".
курсовая работа [104,4 K], добавлен 20.03.2011Выборки к генеральной совокупности: оценка параметра и построение доверительных интервалов. Интервальный статистический ряд. Оценивание параметров распределения. Статистическая проверка гипотез. Гипотеза о нормальном распределении случайной величины.
контрольная работа [391,1 K], добавлен 23.06.2012Критерий Пирсона, формулировка альтернативной гипотезы о распределении случайной величины. Нахождение теоретических частот и критического значения. Отбрасывание аномальных результатов измерений при помощи распределения. Односторонний критерий Фишера.
лекция [290,6 K], добавлен 30.07.2013Числовые характеристики случайной функции: математическое ожидание, дисперсия, квадрат разности, корреляционная функция. Расчет среднего выборочного и несмещенной выборочной дисперсии, проверка гипотезы о нормальном распределении по критерию согласия.
контрольная работа [666,1 K], добавлен 02.06.2010Случайная выборка объема как совокупность независимых случайных величин. Математическая модель в одинаковых условиях независимых измерений. Определение длины интервала по формуле Стерджесса. Плотность относительных частот, критерий согласия Пирсона.
контрольная работа [90,4 K], добавлен 17.10.2009Проведение проверки гипотезы о нормальности закона распределения вероятности результатов измерения случайной величины по критерию согласия Пирсона. Определение ошибок в массивах данных: расчет периферийных значений, проверка серии на равнорассеянность.
контрольная работа [1,8 M], добавлен 28.11.2011Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.
курсовая работа [726,2 K], добавлен 26.02.2015Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.
реферат [332,8 K], добавлен 10.12.2010Одномерная выборка, ее представление и числовые характеристики. Проведение исследования нормального, равномерного и экспоненциального распределения. Проверка гипотез по критерию Пирсона и Колмогорова-Смирнова. Особенность изучения двухмерных выборок.
курсовая работа [1,2 M], добавлен 22.11.2021Согласование выборочных распределений. Отбор статистических данных с помощью таблицы случайных чисел. Расчет числовых характеристик распределения выборочных частот. Проверка предположения, что распределение генеральной совокупности является нормальным.
курсовая работа [276,6 K], добавлен 19.01.2016