Теория вероятностей и математическая статистика

Вероятностная модель и аксиоматика А.Н. Колмогорова. Случайные величины и векторы, классическая предельная проблема теории вероятностей. Первичная обработка статистических данных. Точечные оценки числовых характеристик. Статистическая проверка гипотез.

Рубрика Математика
Вид методичка
Язык русский
Дата добавления 02.03.2010
Размер файла 433,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

.

Случайную величину будем называть центрированной и нормированной суммой.

Интегральную теорему Муавра-Лапласа можно теперь сформулировать так:

Если , последовательность независимых, одинаково распределённых бернуллиевских случайных величин, то, при , последовательность функций распределения случайных величин сходится к функции распределения нормального закона N(0,1):

.

Аналогично теорему Бернулли можно, переписать так:

.

Если обозначить: , то теорему Бернулли сформулируем так:

Если , последовательность независимых, одинаково распределённых бернуллиевских случайных величин, то, при , случайная величина с вероятностью близкой к единице принимает значения, мало отличающиеся от нуля:

.

Обращаясь к теореме Пуассона, рассмотрим «двойную» последовательность бернуллиевских случайных величин . Для каждого n случайные величины , , имеют одинаковое распределение . Вероятности уменьшаются с изменением n. Обозначим .

Теорема Пуассона:

Если , но так что , то, при , случайная величина имеет распределение вероятностей мало отличающееся от распределения вероятностей закона Пуассона, то есть:

.

Суммируя всё, можем сказать, что для случайной величины , являющейся суммой независимых бернуллиевских случайных величин , в качестве предельного распределения вероятностей при будет нормальное, вырожденное или пуассоновское распределение вероятностей.

Естественно возникает вопрос: «А если снять ограничение, состоящее в том, что случайные величины - бернуллиевские? Какие ограничения надо наложить на последовательность случайных величин , чтобы их суммы и в качестве предельного при имели, соответственно, нормальное, вырожденное и пуассоновское распределение вероятностей?».

Определяем три новых понятия: «Закон больших чисел», «Центральная предельная теорема» и «Закон малых чисел». Знакомимся с теоремами, в которых на последовательности случайных величин налагаются ограничения, при которых:

1) имеет распределение, мало отличающееся от нормального (N(0,1));

2) имеет распределение, мало отличающееся от вырожденного ();

3) имеет распределение, мало отличающееся от распределения Пуассона (()).

Необходимо уметь объяснить практическую значимость предельных теорем для последовательностей независимых случайных величин.

Математическая статистика

Модуль 6. Первичная обработка статистических данных. Точечные оценки числовых характеристик

Цель модуля: Узнать новую терминологию, понятия и определения математической статистики. Показать приёмы и правила первичной обработки статистических данных, принципы выбора точечных оценок числовых характеристик изучаемых случайных величин.

Математическая статистика - самостоятельная математическая дисциплина, имеющая свой словарь терминов, с которым мы знакомимся, как и при изучении теории вероятностей, путём введения основных понятий и определений. Изучение свойств введённых терминов и формулирование выводов, которые делаются по результатам обработки статистических данных, проводятся путём использования основных положений теории вероятностей.

Надо всё время иметь в виду, что все объекты и построения математической статистики являются экспериментальными моделями объектов и построений, которые вводились и изучались в теории вероятностей.

Первыми основными понятиями являются понятия «генеральная совокупность» и «выборка».

Генеральная совокупность - это все объекты, обладающие интересующим нас количественным признаком. Исследуемый количественный признак - случайная величина. Каждый объект генеральной совокупности имеет определённое значение количественного признака. Это значение количественного признака является одним из возможных значений случайной величины. Наблюдая объекты генеральной совокупности, мы фиксируем возможные значения случайной величины. Частота встречаемости возможных значений случайной величины определяется законом распределения вероятностей этой случайной величины.

Однако не всегда удаётся, а иногда просто невозможно, обследовать все объекты генеральной совокупности для определения значения количественного признака, которым они обладают. Для изучения случайной величины из генеральной совокупности отбирают некоторое количество объектов и определяют значения количественного признака, которым обладают эти объекты.

Полученные значения количественного признака у этих объектов будут называться статистическими данными или выборкой из генеральной совокупности, если они репрезентативны. Под термином репрезентативность (представительность) мы понимаем, что полученные данные вполне отражают в общих чертах особенности количественного признака, которым обладают объекты генеральной совокупности.

Различные методики отбора объектов из генеральной совокупности, стремятся обеспечить репрезентативность получаемых данных. Мы отмечаем, что попадание каждого объекта в выборку должно быть независимым от остальных объектов. Измерения значений количественного признака у выбранных объектов должны проводиться по одной методике, в одинаковых условиях и одним и тем же инструментом.

Если полученная выборка - репрезентативна, то на её элементы мы будем смотреть двояко. С одной стороны мы элементы выборки будем рассматривать как набор n чисел, являющихся значениями эмпирической случайной величины . А с другой стороны - как на n-мерный случайный вектор с независимыми, одинаково распределёнными компонентами.

При первичной обработке статистических данных строится вариационный ряд, являющийся, по существу, рядом распределения эмпирической случайной величины . При этом мы считаем, что все элементы выборки - равновозможные, то есть . Геометрическая иллюстрация вариационного ряда - гистограмма даёт наглядное представление о характере распределения вероятностей исследуемой случайной величины . Теорема Гливенко показывает, что при с вероятностью близкой к единице значения эмпирической функции распределения будут очень мало отличаться от значений теоретической функции распределения исследуемой случайной величины .

Случайная величина имеет числовые характеристики и другие. Значения этих характеристик мы не знаем, это - теоретические числа. По элементам выборки мы должны оценить эти теоретические числа - дать их точечные оценки. Так как эмпирическая случайная величина понимается нами как статистическая модель исследуемой случайной величины , то естественно принять значения числовых характеристик в качестве точечных оценок неизвестных значений числовых характеристик. Так как мы приняли, что , а эмпирическая случайная величина - случайная величина дискретного типа, то , . То есть предлагается эмпирическое математическое ожидание - среднее арифметическое элементов выборки и эмпирическую дисперсию принять в качестве точечных оценок.

Обобщая сказанное, теоретические числовые характеристики исследуемой случайной величины обозначим , а соответствующие эмпирические числовые характеристики, предлагаемые в качестве оценок, обозначим .

Любая точечная оценка является функцией элементов выборки: . Элементы, попавшие в выборку - случайные величины. Следовательно, функция - случайная величина. Всякую функцию элементов выборки будем называть статистикой.

Но функций от элементов выборки можно придумать много. И каждую придуманную функцию можно предложить в качестве статистической оценки теоретической числовой характеристики. Возникает вопрос: «Как выбрать из множества предлагаемых точечных оценок наилучшую оценку?». Чтобы ответить на этот вопрос, мы должны сформулировать требования, исходящие из здравого смысла, и проверять выполнение этих требований к предлагаемым точечным оценкам. Та оценка, которая будет удовлетворять всем требованиям, будет наилучшей оценкой и будет принята в качестве точечной оценки неизвестного значения числовой характеристики.

Формулировки требований состоятельности, несмещённости и эффективности, предъявляемые к точечным оценкам, основаны на знании закона больших чисел и центральной предельной теоремы теории вероятностей. Логичность и справедливость этих требований не вызывает сомнений.

Рассматриваемые методы получения точечных оценок, позволяют обоснованным теорией вероятностей путём получать их и проверять выполнение сформулированных требований к ним.

Модуль 7. Интервальные оценки числовых характеристик

Цель модуля: Продолжить знакомство с приёмами первичной обработки статистических данных. Узнать три типа распределений случайных величин, которые используются при определении закона распределения различных функций статистических данных.

Кроме точечной оценки значения теоретической числовой характеристики изучаемой случайной величины исследователю иногда бывает необходимо знать интервал , в котором с достаточно большой степенью уверенности (0,9; 0,95; 0,999,…) может находиться неизвестное значение числовой характеристики . То есть, при заданном уровне надёжности , по имеющейся выборке надо определить границы интервала и так, чтобы выполнялось неравенство:

.

Вероятность называется доверительной вероятностью, а интервал - доверительным интервалом.

Ясно, что границы интервала, как функции элементов выборки, являются статистиками - случайными величинами: и . Значит для определения при заданной доверительной вероятности их числовых значений, надо знать закон распределения вероятностей этих статистик.

Наиболее часто в математической статистике используются три распределения вероятностей: распределение Пирсона, распределение Стьюдента и распределение Фишера-Снедекора. Случайные величины , и , подчиняющиеся, соответственно, этим распределениям, являются функциями независимых случайных величин, имеющих одинаковое нормальное распределение N(0,1).

Применение этих трёх распределений в математической статистике основано на предположении о нормальном распределении исследуемого количественного признака, определённого на генеральной совокупности, и некоторых статистик, что, в свою очередь, обосновывается центральной предельной теоремой теории вероятностей.

Модуль 8. Статистическая проверка гипотез

Цель модуля: Ознакомить студентов с одним из способов научного мышления по схеме рассуждений, называемой силлогизмом. Научить постановке задачи, практическим действиям при решении её и правилам принятия решений при статистической проверке гипотез.

Статистическая проверка гипотез осуществляется по схеме научного мышления, называемого силлогизмом.

Силлогизм - дедуктивное логическое умозаключение, состоящее из посылок и выводов.

Гипотеза - научное предположение, выдвигаемое для объяснения каких-нибудь явлений.

Исследование, изучение количественного признака - случайной величины мы осуществляем, наблюдая попавшие в выборку возможные значения этой случайной величины. Проведя первичную обработку статистических данных , вычислив по этим данным значения точечных оценок числовых характеристик, мы выдвигаем предположения - гипотезы о виде закона распределения вероятностей, о значениях числовых характеристик случайной величины и т.п.

Гипотеза - научное предположение, выдвигаемое для объяснения каких-нибудь явлений.

Ту гипотезу, которая нам особенно важна, или дорога, будем называть основной гипотезой и обозначать . Остальные гипотезы (по крайней мере, должна быть хотя бы одна гипотеза) будем называть альтернативными гипотезами и обозначать . На самом деле, то есть в реальности, может быть справедлива только основная гипотеза , или одна из альтернативных гипотез .

Для проверки справедливости основной гипотезы подбирается критерий проверки гипотезы , являющийся мерой расхождения между предполагаемыми, гипотетическими и опытными, полученными по выборке, значениями или характеристиками исследуемой случайной величины. Критерий - функция элементов выборки, статистика. Следовательно, существует закон распределения статистики T: .

Для проверки того, какая из выдвинутых гипотез справедлива, проводится опыт, в результате которого получаем выборку . Определив значение критерия , мы наблюдаем одно из двух случайных событий или . Нам известно, что если гипотеза верна, то событие наступить не может, то есть .

Если у нас имеет место событие , то мы говорим, что гипотеза неверна, то есть мы её отклоняем и принимаем альтернативную гипотезу.

Так как реально мы всегда находимся в условиях статистически устойчивой случайности, то мы понимаем, что при верной гипотезе событие может наступить, но его вероятность - мала. Поэтому при принятии решения мы говорим: «Так как событие практически невозможное, его вероятность - очень мала, то гипотеза отклоняется». То есть мы лишь изредка будем ошибаться, и вероятность нашей ошибки будет равна .

Если мы в результате опыта мы будем наблюдать событие , то мы говорим: « Так как произошло событие , то у нас нет оснований отклонять гипотезу ». То есть гипотеза - принимается. Так «осторожно» мы говорим в этом случае потому, что наступление события есть результат однократного проведения опыта. Не исключено, что при повторных проведениях опытов это событие мы больше наблюдать не будем.

Так как результаты эксперимента являются выборкой из возможных значений исследуемой случайной величины, то нельзя считать значения критерия детерминированными. Поэтому при принятии решений и формулировании выводов возможны ошибки двух видов. Поэтому при выборе критерия проверки справедливости гипотез экспериментатор стремится подобрать или построить такой критерий, при котором вероятности этих ошибок будут по возможности минимальными. Такие критерии строятся на основании основных положений теории вероятностей и, прежде всего, классической предельной проблемы. Рассматриваются примеры построения критериев проверки гипотез для некоторых наиболее распространённых задач математической статистики.

Модуль 9. Корреляционный и регрессионный анализы

Цель модуля: Научить студентов узнавать наличие статистических связей между различными случайными количественными характеристиками изучаемых объектов и явлений; оценивать силу этих статистических связей и определять функцию регрессии одной из случайных величин на другую.

В корреляционном анализе рассматриваются статистические зависимости между случайными величинами. При этом решаются две задачи. Первая - оценка силы статистической связи между случайными величинами. Вторая - определение функции, которая описывает тенденцию изменения значений одной из случайных величин при изменении значений другой случайной величины.

Если статистическая зависимость имеет линейный характер, то сила связи оценивается коэффициентом линейной корреляции. Коэффициент линейной корреляции является теоретической числовой характеристикой двумерной случайной величины. Так как при решении практических задач экспериментатор имеет в своём распоряжении только двумерную выборку возможных значений исследуемой случайной величины, то оценка силы связи осуществляется с помощью эмпирического коэффициента линейной корреляции.

Формула эмпирического коэффициента линейной корреляции получается применением метода моментов определения точечных оценок.

Для решения второй задачи сначала вводится понятие условной случайной величины: и . Определяются законы распределения вероятностей этих условных случайных величин и их условные математические ожидания: и .

Условное математическое ожидание позволяет естественно ввести определение функции регрессии - как функции, описывающей изменение значений условного математического ожидания одной из случайных величин при изменении значений другой случайной величины в области её возможных значений: и .

При выбранном виде функции регрессии вторая задача корреляционного анализа сводится к определению коэффициентов этой функции. Сначала, применяя метод наименьших квадратов, определяем статистические оценки коэффициентов функции регрессии. Коэффициенты функции регрессии, являясь статистиками, выражаются через точечные оценки числовых характеристик двумерной случайной величины. Применяя метод моментов «наоборот», записываем теоретическое уравнение функции регрессии одной случайной величины на другую.

В регрессионном анализе определяется функция регрессии случайной величины на изменение детерминированного параметра. В качестве примера рассматривается «Задача Путина В.В.» об удвоении в течение десяти лет внутреннего валового продукта Российской Федерации.

Определение остаточной дисперсии, с одной стороны, «служит» задачам корреляционного анализа, а с другой стороны, «закладывает фундамент» для решения задач методами дисперсионного анализа.

Экзаменационные вопросы

В каждом экзаменационном билете содержатся названия терминов и понятий теории вероятностей, которым надо дать определения, и два теоретических вопроса. Первый вопрос билета призван проверить знания студента из первой части курса, которая излагается в первых четырёх модулях. Во вторых вопросах билета проверяются знания классической предельной проблемы теории вероятностей и математической статистики, которые излагаются в следующих пяти модулях.

1. Вероятностная модель с не более чем счётным числом элементарных исходов. Пример: испытания с равновозможными исходами.

2. Вероятностная модель с не более чем счётным числом элементарных исходов. Пример: повторные независимые испытания.

3. Вероятностная модель с не более чем счётным числом элементарных исходов. Пример: испытания до первого положительного исхода.

4. Условная вероятность. Вероятность произведения событий. Зависимые и независимые события.

5. Формула полной вероятности.

6. Формула Байеса.

7. Аксиоматическое построение вероятностной модели. Аксиомы А.Н. Колмогорова.

8. Свойства вероятностной функции.

9. Теорема о непрерывности вероятностной функции. Импликации и .

10. Теорема о непрерывности вероятностной функции. Импликации и .

11. Измеримое пространство <R,B(R)>. Борелевские множества на множестве вещественных чисел.

12. Измеримое пространство <Rn,B(Rn)>. Борелевские множества на плоскости.

13. Вероятностная функция дискретного типа на измеримых пространствах <R,B(R)> и <Rn,B(Rn)>. Примеры.

14. Вероятностная функция непрерывного типа на измеримых пространствах <R,B(R)> и <Rn,B(Rn)>. Примеры.

15. Случайная величина. Типы случайных величин. Функция распределения случайной величины.

16. Случайный вектор. Компоненты случайного вектора. Частные вероятностные функции и частные функции распределения.

17. Функция распределения. Свойства. Примеры функций распределения дискретного типа.

18. Функция распределения. Свойства. Примеры функций распределения непрерывного типа.

19. Многомерная функция распределения. Свойства. Примеры. Свойства согласованности.

20. Независимость компонент случайного вектора. Критерий независимости.

21. Математическое ожидание случайной величины. Определение. Примеры.

22. Математическое ожидание случайной величины. Определение. Свойства.

23. Дисперсия случайной величины. Определение. Примеры.

24. Дисперсия случайной величины. Определение. Свойства.

25. Функции случайных величин. Определение закона распределения функции случайной величины. Примеры.

26. Функция распределения суммы двух независимых случайных величин. Свёртка функций распределения.

27. Начальные и центральные моменты случайной величины.

28. Числовые характеристики случайного вектора. Ковариационный момент. Ковариационная матрица.

29. Коэффициент линейной корреляции. Определение. Свойства.

30. Характеристические функции. Определение Примеры.

31. Характеристические функции. Свойства .

32. Характеристические функции. Свойства .

33. Закон больших чисел. Теорема Бернулли и теорема А.Я. Хинчина. Правило среднего арифметического.

34. Закон больших чисел. Неравенство и теорема П.Л. Чебышёва.

35. Центральная предельная теорема. Теорема Муавра-Лапласа.

36. Центральная предельная теорема. Теорема Леви. Следствия.

37. Центральная предельная теорема. Понятия о теоремах А.М. Ляпунова и Линдебега-Феллера.

38. Закон малых чисел. Теорема Пуассона.

39. Выборка. Первичная обработка статистических данных. Теорема Гливенко.

40. Точечные оценки числовых характеристик случайных величин. Требования к точечным оценкам.

41. Неравенство Рао-Крамера. Эффективность оценки математического ожидания - среднего арифметического элементов выборки.

42. Метод моментов получения точечных оценок числовых характеристик случайных величин.

43. Метод максимального правдоподобия получения точечных оценок числовых характеристик случайных величин.

44. Некоторые специальные распределения, используемые в математической статистике.

45. Интервальные оценки числовых характеристик случайных величин. Доверительный интервал для математического ожидания.

46. Интервальные оценки числовых характеристик случайных величин. Доверительный интервал для дисперсии.

47. Статистическая проверка гипотез. Ошибки первого и второго рода. Три типа задач статистической проверки гипотез.

48. Статистическая проверка гипотезы о равенстве математического ожидания некоторому фиксированному числу.

49. Статистическая проверка гипотезы о равенстве дисперсии некоторому фиксированному числу.

50. Статистическая проверка гипотезы о равенстве дисперсий двух различных случайных величин.

51. Статистическая проверка гипотезы о равенстве математических ожиданий двух различных случайных величин.

52. Статистическая проверка гипотез. Понятия о критериях Колмогорова и Мизеса.

53. Статистическая проверка гипотезы о виде закона распределения случайной величины. Критерий согласия Пирсона.

54. Элементы корреляционного и дисперсионного анализов. Две задачи корреляционного анализа. Статистическая оценка коэффициента линейной корреляции.

55. Условные распределения и условные математические ожидания. Определение функции регрессии.

56. Статистическая оценка коэффициентов линейной функции регрессии методом наименьших квадратов.

57. Остаточная дисперсия при линейной регрессии.

58. Корреляционное отношение - мера силы статистической связи при нелинейной регрессии.

Образцы вариантов контрольных работ по теории вероятностей

Контрольная работа №1

ВАРИАНТ № образец

1. На девяти карточках написаны цифры 1,2,3,4,5,6,7,8,9. Из них наудачу выбираются две карточки и кладутся на стол в порядке появления. Найти вероятность того, что полученное число делится на семь.

2. Имеются три станка. Каждый из них может работать в данный момент с вероятностью 0,7, 0,8 и 0,9 соответственно. Найти вероятность того, что в данный момент будут работать только два станка.

3. В первой урне имеются три белых и семь чёрных шаров, а во второй - семь белых и три чёрных шара. Из первой урны во вторую наудачу переложен шар, а затем, также наудачу, переложен шар из второй урны в первую. Определить вероятность того, что составы урн после этих перекладываний не изменятся.

4. Станок автомат, выпускающий детали, даёт 5% брака. Существующая система контроля качества 90% процентов бракованных деталей называет бракованными, но, в силу своего несовершенства, 5% доброкачественных деталей объявляет бракованными. Деталь, прошедшая контроль, названа бракованной. Какова вероятность того, что контроль не ошибся?

ВАРИАНТ № образец

1. В урне шесть белых и четыре чёрных шара. Из урны вынимают наудачу пять шаров. Найти вероятность того, что два из них будут белыми, а три - чёрными.

2. В первой партии 45 годных и 5 бракованных деталей, во второй партии 50 годных и 10 бракованных деталей. Наудачу из каждой партии берут по одной детали. Найти вероятность того, что они обе бракованные.

3. Наугад выбираются по одной букве из слов «корова» и «кошка». Найти вероятность того, что эти буквы окажутся одинаковыми.

4. Брошено две монеты. Если выпали два «герба», то из урны №1 извлекается один шар, в противном случае шар извлекается из урны №2. Урна №1 содержит пять чёрных и два белых шара. Урна №2 содержит два чёрных и пять белых шаров. Какова вероятность того, что шар извлекался из урны №1, если он оказался чёрным?

ВАРИАНТ № образец

1. Игральная кость бросается два раза. Найти вероятность того, что во второй раз выпадет большее число очков, чем в первый раз.

2. В первой урне 10 белых и 15 чёрных шаров, во второй урне 12 белых и 20 чёрных шаров и в третьей 15 белых и 10 чёрных шаров. Из каждой урны наудачу извлекают по два шара. Найти вероятность того, что все вынутые шары одного цвета.

3. Пассажир забыл последнюю цифру шифра в автоматической камере хранения и набирает её наудачу. Определить вероятность того, что для открытия ячейки ему понадобится не более четырёх попыток.

4. В левом кармане пять монет по 50 коп. и три монеты по 10 коп., а в правом кармане четыре монеты по 50 коп. и шесть монет по 10 коп. Из правого кармана в левый наудачу перекладывается одна монета, после чего из левого кармана также наудачу извлекается одна монета, оказавшаяся пятидесятикопеечной. Какова вероятность того, что в левый карман была переложена десятикопеечная монета?

Контрольная работа №2

ВАРИАНТ № образец

Из колоды карт (52 шт.) наудачу без возвращения извлекаются восемь карт. Постройте ряд распределения и определите мат. ожидание случайного числа появившихся красных картинок. Чему равна вероятность того, что число этих картинок - чётное?

При каком значении параметра а функция:

будет плотностью вероятности случайной величины . Найти функцию распределения F(x), математическое ожидание М. Чему равна вероятность случайного события ? Сделать чертёж.

ВАРИАНТ № образец

Две игральных кости одновременно подбрасывают шесть раз. Постройте ряд распределения случайного числа появлений хотя бы одной шестёрки на верхних гранях брошенных костей. Чему равно мат. ожидание этого случайного числа?

При каком значении параметра а функция:

будет плотностью вероятности случайной величины . Найти математическое ожидание М. Чему равна вероятность случайного события ? Сделать чертёж.

ВАРИАНТ № образец

Баскетболист бросает мяч в корзину до первого попадания, но ему разрешается сделать не более пяти попыток. Постройте ряд распределения случайного числа сделанных промахов. Чему равна вероятность того, что число сделанных промахов будет нечётным, если вероятность попадания при одном броске у этого баскетболиста равна ?

При каком значении параметра а функция:

будет плотностью вероятности случайной величины . Найти функцию распределения F(x), математическое ожидание М. Чему равна вероятность случайного события ? Сделать чертёж.

Контрольная работа №3

ВАРИАНТ № образец

1. На одной из сторон правильного треугольника, длина стороны которого равна а, наудачу ставится точка. Через эту точку, параллельно двум другим сторонам треугольника, проводятся две прямые. Определите математическое ожидание и дисперсию величины площади получившегося параллелограмма.

2. В урне находятся один белый, два красных и три чёрных шара. Наудачу без возвращения извлекаются три шара. Для случайных чисел появившихся шаров белого и красного цвета постройте таблицу распределения вероятностей. Найти частные распределения компонент получившегося вектора.

3. Случайная величина является средней арифметической 3600 независимых одинаково распределённых случайных величин, у каждой из которых математическое ожидание равно трём, а дисперсия - двум. Каким должно быть , чтобы суверенностью не менее, чем 0,95 можно было утверждать, что значения отклонятся от меньше, чем на ?

ВАРИАНТ № образец

1. На окружности радиуса r наудачу ставится точка. Из этой точки параллельно горизонтальному и вертикальному диаметрам проводятся две хорды, которые берутся в качестве сторон прямоугольника. Две другие стороны прямоугольника, проводятся параллельно этим хордам. Определите математическое ожидание и дисперсию величины площади получающегося прямоугольника.

2. В первой урне находятся два белых и три чёрных шара. Во второй урне - три белых и два чёрных шара. Из первой урны во вторую наудачу перекладывается один шар, а затем из второй урны сразу извлекаются два шара. Для двумерной случайной величины - число переложенных и число извлечённых шаров белого цвета построить таблицу распределения. Найти частные распределения компонент.

3. С какой уверенностью можно ожидать, что при 900 подбрасываниях игральной кости значение относительной частоты выпадений нечётного числа очков отклонится от вероятности менее чем на 0,015?

ВАРИАНТ № образец

1. По сторонам прямого угла образованного координатными осями, концами скользит линейка длиною l. Все значения координаты её правого конца на оси абсцисс - равновозможные. Найдите математическое ожидание величины расстояния от линейки до начала координат.

2. В урне находятся один белый, два красных и три чёрных шара. Наудачу с возвращением каждый раз извлекаются два шара. Для случайных чисел появившихся шаров белого и красного цвета постройте таблицу распределения вероятностей.

3. Вероятность появления события в каждом из независимых испытаний равна 0,8. Сколько нужно произвести испытаний, чтобы с уверенностью не меньшей чем 0,95 можно было утверждать, что число наступлений события будет не менее 80?

Индивидуальные задания по математической статистике

Методические указания

Для лучшего усвоения приёмов и методов математической статистики каждый студент получает индивидуальное задание.

Это задание представляет собой наборы статистических данных, полученных экспериментальным путём, и являются выборками значений двумерных случайных величин. В ходе выполнения работы студент должен выполнить следующие пять заданий, соответствующим пяти модулям теоретического курса.

1. Первичная обработка статистических данных.

Необходимо построить вариационные ряды. Построить гистограммы. Определить значения точечных оценок числовых характеристик случайных величин.

2. Интервальные оценки числовых характеристик случайных величин.

Построение доверительных интервалов для математических ожиданий и дисперсий. Приобретение навыков работы с таблицами специальных распределений математической статистики.

3. Статистическая проверка гипотез.

Решаются три задачи. Проверка гипотез о равенстве значений числовых характеристик некоторому фиксированному числу. Проверка гипотез о совпадении значений одноимённых числовых характеристик двух случайных величин.

4. Проверка гипотезы о виде закона распределения исследуемой случайной величины.

Критерий «согласия» Пирсона. Проверка гипотезы о совпадении законов распределения двух случайных величин.

5. Корреляционный анализ.

Оценка силы статистической связи между случайными величинами. Определение методом наименьших квадратов статистических оценок коэффициентов функции регрессии. Построение соответствующей геометрической иллюстрации.

Все задания выполняются последовательно по мере накопления теоретического материала. Студент представляет для зачёта каждое выполненное задание. Выполнение заданий предполагает использование персонального компьютера. Все задания представляются в распечатанном виде. После получения зачёта выполненные задания остаются у студента и могут в дальнейшем быть использованы как руководства по математической обработке статистических материалов.

Образцы статистических данных для выполнения индивидуальных заданий

Вариант № образец

Двумерная случайная величина дискретного типа

Длина слова (выборки и ) и количество гласных в этом слове (выборки и ) в орфографическом словаре русского языка.

1

6

3

4

2

51

9

3

7

3

2

16

7

7

3

52

8

3

8

3

3

4

2

9

4

53

9

3

6

2

4

8

4

7

3

54

9

3

8

4

5

5

2

6

2

55

11

5

7

2

6

9

3

6

2

56

15

7

8

2

7

12

6

7

3

57

8

2

3

1

8

11

6

8

3

58

10

4

7

3

9

9

5

6

3

59

6

2

9

4

10

7

3

5

3

60

7

2

7

3

11

8

3

7

3

61

8

3

7

3

12

8

4

7

3

62

6

4

11

5

13

6

3

5

2

63

5

2

9

4

14

9

5

8

3

64

7

3

7

3

15

5

2

5

2

65

5

2

7

3

16

7

4

12

4

66

5

2

6

2

17

10

6

5

2

67

7

2

8

3

18

9

4

5

2

68

9

5

8

3

19

10

5

8

3

69

7

3

9

5

20

14

7

9

3

70

5

2

6

3

21

12

5

5

2

71

8

3

7

3

22

7

3

7

3

72

7

3

6

2

23

7

3

5

2

73

10

5

5

2

24

6

3

3

1

74

8

4

8

3

25

7

4

4

2

75

8

3

8

4

26

12

6

7

2

76

8

3

5

2

27

12

6

8

3

77

5

2

12

4

28

8

5

5

2

78

12

5

11

6

29

9

4

7

3

79

15

6

5

2

30

7

3

5

2

80

9

4

6

2

31

12

7

3

1

81

7

3

4

1

32

7

3

6

2

82

8

4

7

3

33

8

4

6

2

83

10

4

7

2

34

5

2

7

3

84

4

2

10

4

35

8

3

8

3

85

9

4

6

2

36

7

4

5

2

86

6

4

14

7

37

11

5

8

3

87

5

2

12

5

38

6

3

6

2

88

5

2

8

3

39

5

2

6

2

89

6

2

8

3

40

7

3

9

3

90

10

4

5

2

41

9

4

7

2

91

5

3

7

3

42

5

2

3

1

92

8

5

5

2

43

6

2

8

3

93

17

8

6

2

44

10

4

10

4

94

18

7

15

7

45

10

4

7

4

95

7

5

10

4

46

7

3

5

2

96

7

4

10

4

47

17

9

7

4

97

5

3

8

4

48

10

4

5

2

98

6

3

6

3

49

10

4

10

4

99

10

5

6

2

50

9

5

7

3

100

7

4

11

3

Вариант № образец

Двумерная случайная величина непрерывного типа

Рост (см) (выборки и ) и Длина окружности грудной клетки (см) (выборки и ) двух групп обследованных юношей-призывников.

1

157,5

84,0

159,5

85,0

51

162,5

87,5

170,0

88,5

2

165,0

89,5

169,5

88,0

52

168,0

86,5

161,5

87,5

3

160,0

82,5

155,5

81,5

53

157,0

80,5

166,5

88,0

4

164,0

85,0

164,5

88,5

54

163,5

90,0

154,0

80,0

5

162,0

84,5

173,0

83,5

55

160,5

87,0

168,5

83,0

6

165,5

85,0

158,5

86,5

56

169,5

86,5

162,5

89,0

7

169,5

87,0

173,5

91,5

57

166,5

84,0

165,0

86,0

8

155,5

78,0

165,5

81,5

58

164,0

87,0

160,0

84,0

9

172,5

83,5

161,5

78,0

59

175,0

83,5

177,0

90,0

10

163,0

83,0

166,5

89,5

60

158,0

84,5

164,0

87,5

11

158,5

83,0

152,0

81,5

61

162,0

88,0

174,5

90,0

12

166,0

90,0

166,0

87,0

62

158,5

89,5

158,5

81,5

13

168,5

91,5

163,0

84,5

63

174,5

88,5

166,0

90,0

14

161,0

80,0

167,0

86,5

64

166,5

88,0

167,0

88,5

15

167,0

84,5

157,5

79,5

65

163,0

86,0

160,0

81,5

16

153,0

79,5

167,5

81,0

66

165,5

83,5

168,5

85,5

17

164,5

79,0

162,0

79,5

67

170,5

86,0

162,5

83,5

18

165,5

88,5

164,5

79,0

68

160,0

86,0

163,5

91,5

19

160,0

88,0

169,0

87,0

69

163,5

80,5

167,5

85,0

20

167,5

79,5

160,5

81,0

70

176,5

87,5

157,0

85,5

21

162,5

79,0

170,5

81,5

71

154,5

85,0

172,5

92,0

22

171,0

85,5

162,5

85,0

72

172,0

91,5

164,5

88,0

23

158,0

77,5

164,0

93,0

73

162,5

83,5

160,0

90,0

24

168,0

89,0

171,5

85,0

74

169,0

85,5

175,0

89,5

25

163,5

84,5

153,5

79,5

75

156,5

82,0

166,0

86,0

26

170,0

91,0

170,5

91,0

76

164,0

86,0

161,0

86,0

27

161,0

80,5

165,5

83,5

77

168,0

85,0

170,5

83,5

28

172,5

89,5

163,0

83,5

78

159,5

84,5

162,5

82,5

29

162,0

85,0

163,0

84,0

79

165,0

81,5

174,5

87,5

30

164,0

91,5

166,5

91,5

80

171,0

83,5

161,0

86,5

31

156,0

78,5

158,0

83,0

81

161,0

79,5

167,5

84,5

32

165,0

86,5

165,0

86,5

82

174,0

87,0

165,0

81,0

33

169,0

93,5

168,0

90,0

83

158,5

87,5

153,0

83,5

34

160,0

83,0

169,5

84,5

84

166,0

81,5

169,0

93,5

35

164,5

77,5

164,5

89,0

85

169,5

87,0

163,5

89,5

36

173,0

85,5

169,0

81,5

86

162,5

89,5

162,0

80,0

37

154,0

79,5

156,0

82,0

87

172,5

86,5

161,0

82,0

38

167,0

87,5

167,0

84,0

88

152,0

84,0

167,0

85,0

39

161,5

80,5

163,5

87

89

168,5

83,0

171,0

85,5

40

168,5

81,5

169,5

90,5

90

160,5

83,5

156,5

83,5

41

165,5

79,5

157,5

86,5

91

157,5

80,0

164,5

81,5

42

169,0

80,5

171,0

89,0

92

170,5

87,5

169,0

86,5

43

166,0

85,5

161,5

80,5

93

162,0

84,0

159,5

82,5

44

170,0

79,5

173,0

85,5

94

165,0

91,0

168,0

83,5

45

163,0

82,5

165,5

87,5

95

157,0

84,5

166,0

89,0

46

166,5

81,5

156,5

87,0

96

163,5

83,0

156,0

85,0

47

150,0

83,0

172,0

87,0

97

167,5

90,0

166,5

93,5

48

167,5

84,5

162,5

86,5

98

160,0

81,0

168,0

87,5

49

159,5

89,5

174,0

85,5

99

167,0

86,5

160,5

88,0

50

171,5

89,5

159,0

83,5

100

164,0

87,5

168,5

87,0

ГЛОССАРИЙ

А

Аддитивная функция - функция множеств- элементов алгебры A, для которой из условия ш следует, что .

Алгебра множеств - система подмножеств A множества , элементы которой удовлетворяют следующим требованиям:

а) A; б) для любых A и B, принадлежащих A, следует, что A и A; в) если A, то A.

Б

Борелевская алгебра множеств B() - система подмножеств множества действительных чисел R, получающаяся путём применения операций объединения, пересечения и дополнения к элементам системы , где a и b - произвольные действительные числа.

В

Вероятностное пространство <,A, P> - тройка объектов, где

- множество элементарных исходов;

A - -алгебра случайных событий;

P - вероятностная функция.

Д

Дискретная случайная величина - случайная величина, областью возможных значений которой является не более чем счётное множество D действительных чисел . Закон распределения вероятностей дискретной случайной величины задаётся путём определения набора положительных чисел , таких, что . Здесь: .

Дисперсия случайной величины - мера разброса значений случайной величины около её математического ожидания.

Доверительный интервал - интервал, в котором с вероятностью, не меньшей чем , находится значение неизвестной числовой характеристики , то есть интервал, для которого справедливо: .

З

Закон больших чисел (ЗБЧ) - совокупность теорем, в которых на последовательность случайных величин , налагаются условия, при которых их среднее арифметическое сходится по вероятности к постоянной величине - среднему арифметическому их математических ожиданий: .

И

Измеримое пространство <,A> - пара объектов, где - множество элементарных исходов, A - алгебра случайных событий, на которой вводится числовая функция множеств , которая при выполнении условий нормированности и аддитивности, называется вероятностной мерой множества A.

К

Классическое определение вероятности - определение вероятности наступления случайного события, основанное на равновозможности реализации элементарных исходов конечного множества элементарных исходов . Если мощность множества равна , а мощность подмножества A, являющегося случайным событием, равна , то по классическому определению вероятности вероятность наступления случайного события A будет равна .

Ковариационный момент - смешанный центральный момент второго порядка двумерной случайной величины:

.

Компонента случайного вектора - скалярная случайная величина , являющаяся проекцией случайного вектора на k-тую координатную ось . То есть, если и - проектор, отображающий в , то является композицией отображений:

.

Коэффициент линейной корреляции - мера статистической силы связи между случайными величинами. Вычисляется по формуле . Применяется в тех случаях, когда статистическая связь имеет линейный характер.

Критерий проверки основной гипотезы - случайная величина, статистика элементов выборки, закон распределения вероятностей которой зависит от предполагаемой гипотезы.

М

Математическое ожидание - числовая характеристика случайной величины, . Математическое ожидание есть среднее значение случайной величины . Интерпретируется как координата центра тяжести единичной массы распределённой на числовой оси.

Множество элементарных исходов - множество, элементами, которого является все возможные элементарные исходы. В результате проведения испытания всегда реализуется один, и только один элементарный исход.

Н

Начальный момент k-того порядка - числовая характеристика случайной величины, являющаяся значением абсолютно сходящегося несобственного интеграла от функции по функции распределения случайной величины, то есть: .

Независимость случайных величин. Случайные величины и называются независимыми, если закон распределения вероятностей одной из них не зависит от другой случайной величины.

Точнее: пусть случайные величины и являются компонентами двумерной случайной величины , принимающей значения в . Эти компоненты называются независимыми, если для любого множества B, B(2), представимого как декартово произведение , и , будет справедливо:

,

Где и - частные вероятностные функции компонент.

Независимость случайных величин непрерывного типа - Случайные величины непрерывного типа и (компоненты двумерного случайного вектора) будут независимыми тогда, только тогда, когда для любой пары выполняется равенство , где - плотность вероятности двумерного случайного вектора , а и - плотности вероятностей его компонент и .

Независимость случайных величин дискретного типа - Случайные величины дискретного типа и (компоненты двумерного случайного вектора) будут независимыми тогда, только тогда, когда для любой пары выполняется равенство , где , а и .

Независимость случайных событий. Случайные события называются независимыми, если условная вероятность наступления любого из них равна его безусловной вероятности: или .

Непрерывная случайная величина - случайная величина, областью возможных значений которой является множество D мощности континуум и положительной меры Лебега. Закон распределения вероятностей непрерывной случайной величины задаётся путём определения на этом множестве плотности вероятности - кусочно-непрерывной, неотрицательной функции, такой что .

Несмещённость точечной оценки. Точечная оценка числовой характеристики называется несмещённой, если .

О

Остаточная дисперсия - мера разброса значений одной из компонент (например ) двумерной случайной величины около её математического ожидания, вызванного внутренними свойствами этой компоненты. При линейном виде статистической связи между компонентами величина остаточной дисперсии компоненты равна , где - коэффициент линейной корреляции между компонентами и .

Ошибка I рода - отклонение верной гипотезы . Возникает в том случае, когда при справедливости в реальности гипотезы наблюдаемое значение критерия попадает в критическую область . Вероятность ошибки I рода равна .

Ошибка II рода - принятие неверной гипотезы . Возникает в том случае, когда при справедливости в реальности гипотезы наблюдаемое значение критерия попадает в область допустимых значений . Вероятность ошибки II рода равна .

П

Повторные независимые испытания - серия одинаковых испытаний, в каждом из которых с постоянными вероятностями p и q может произойти только одно из взаимно противоположных событий A или .

Плотность вероятности - неотрицательная, кусочно-непрерывная функция, удовлетворяющая условию: . Плотность вероятности описывает распределение вероятностей случайной величины непрерывного типа.

Р

Распределение - (распределение Пирсона) распределение вероятностей случайной величины , где все независимые случайные величины, имеющие нормальное распределение вероятностей N(0;1).

Распределение Стьюдента - (t-распределение) распределение вероятностей случайной величины , где все независимые случайные величины, имеющие нормальное распределение вероятностей N(0;1).

Распределение Фишера-Снедекора - (F-распределение) распределение вероятностей случайной величины .

Ряд распределения - таблица, состоящая из двух строк, с помощью которой задаётся закон распределения дискретной случайной величины:

.

Где или ; . Всегда .

С

Свёртка функций распределения - несобственный интеграл, определяющий функцию распределения случайной величины, являющейся суммой независимых случайных величин. Если , то функция распределения будет равна: , где и - функции распределения случайных величин-слагаемых.

Состоятельность точечной оценки. Точечная оценка числовой характеристики называется состоятельной, если она сходится по вероятности к этой точечной оценке, то есть: .

Статистика - любая функция элементов выборки : .

Сходимость по вероятности. Последовательность случайных величин сходится по вероятности к случайной величине (обозначение: ), если выполняется условие .

Сходимость по распределению. Последовательность случайных величин сходится по распределению к случайной величине (обозначение: ), если соответствующая последовательность функций распределения слабо сходится к функции распределения случайной величины ().

У

Условная вероятность - вероятность наступления случайного события A, вычисленная при предположении, что случайное событие B произошло. Определяется по формуле: .

Условная плотность вероятности - плотность вероятности условной случайной величины , является законом распределения вероятностей второй компоненты при любом фиксированном значении первой компоненты. Определяется по формуле: , где - плотность вероятности двумерной случайной величины , - частная плотность вероятности первой компоненты .

Ф

Функция распределения - функция , описывающая изменение вероятности случайного события при изменении x, то есть . Определяя функцию распределения , мы задаём закон распределения вероятностей случайной величины .

Функция распределения вектора - функция , описывающая изменение вероятности случайного события , где , при изменении , то есть . Определяя функцию распределения , мы задаём закон распределения вероятностей случайного вектора .

Функция регрессии - функция, описывающая зависимость значений условных математических ожиданий одной из компонент двумерной случайной величины от другой компоненты. Функция- функция регрессии компоненты на изменение компоненты . Функция - функция регрессии компоненты на изменение компоненты .

Х

Характеристическая функция - комплексно-значная функция действительного аргумента, являющаяся математическим ожиданием функции случайной величины , где , то есть: .

Ч

Частная функция распределения - функция распределения любой k-той компоненты вектора . Определение частной функции распределения основано на свойстве согласованности функции распределения многомерной случайной величины, например, если n=2, то и .

Частные распределения компонент случайного вектора - распределения вероятностей компонент вектора, являющихся скалярными случайными величинами. Частное распределение каждой компоненты получается как проекция вероятностной функции вектора на соответствующую координатную ось. Если и P вероятностная функция вектора, то частное распределение компоненты определяется равенством: , где B(). Аналогично, частное распределение компоненты определяется равенством: , где B().

Ц

Центральная предельная теорема (ЦПТ) - совокупность теорем, в которых на последовательность случайных величин , налагаются условия, при которых их центрированная и нормированная сумма сходится по распределению к нормальному закону N(0;1).

Э

Эффективная оценка - точечная оценка числовой характеристики, имеющая наименьшую дисперсию.

Вопросы для тестирования по курсу

«Теория вероятностей и математическая статистика»

1. Противоположным событием случайному событию будет событие: а) событие ; б) событие ; в) событие .

2.Вероятности наступления случайных событий и равны и . Эти случайные события: а) совместные; б) несовместные; в) взаимно противоположные.

3.Гипотезы, формулируемые при применении формулы полной вероятности, должны быть: а) попарно независимыми; б) попарно несовместными; в) взаимно противоположными.

4.Аддитивная функция множеств и удовлетворяет условию: а) всегда , если ;

б) всегда , если ;

в) всегда , если .

5. Требование счётной аддитивности числовой функции множеств это: а) аксиоматическое требование, объявляемое при определении вероятностной функции;

б) необходимое требование, объявляемое при определении независимости случайных величин;

в) достаточное требование, выполнение которого проверяется при определении алгебры борелевских множеств.

6. Случайная величина это: а) случайный результат любого опыта;

б) измеримое отображение множества элементарных исходов во множество чисел;

в) вероятность наступления случайного события при однократном проведении опыта.

7. Плотность вероятности это:

а) функция, для которой при любых неотрицательных a и b интеграл принимает конечные значения;

б) любая функция, для которой справедливо ;

в) любая функция, которая удовлетворяет двум условиям: для любого x, , и .

8. Математическое ожидание случайной величины это:

а) наиболее вероятное значение случайной величины;

б) среднее значение случайной величины;

в) ожидаемое значение случайной величины.

9. Дисперсия случайной величины это:

а) разброс возможных значений случайной величины около её математического ожидания;

б) мера разброса возможных значений случайной величины около её математического ожидания;

в) мера связи возможных значений случайной величины и её математического ожидания.

10. Дисперсия разности случайных величин и равна:

а) , если случайные величины - независимые;

б) , если случайные величины - несовместные;

в), если случайные величины - произвольные;

11. Независимость случайных величин определяется исходя из:

а) невозможности определения закона совместного распределения компонент случайного вектора;

б) равенства закона распределения случайного вектора произведению законов распределения его компонент;

в) невыполнения всех условий теоремы Чебышева.

12. Функция Лапласа используется при:

а) определении величины разброса значений случайной величины при проведении большого числа наблюдений;

б) определении вероятностей событий, которые могут наступить при проведении больших серий повторных независимых испытаний;

в) при вычислении значений статистических оценок коэффициентов функции регрессии.

13. Функция Лапласа применяется при:

а) определении математического ожидания нормально распределённой случайной величины;

б) проверке статистической гипотезы о виде закона распределения случайной величины;

в) вычислении вероятностей наступления случайных событий, определяемых нормально распределённой случайной величиной.

14. Коэффициент линейной корреляции используется для определения:


Подобные документы

  • Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Проверка статистических гипотез и выполнение центральной предельной теоремы для заданных последовательностей независимых случайных величин.

    курсовая работа [364,8 K], добавлен 13.11.2012

  • Основные понятия, действия над случайными событиями. Классическое определение, свойства вероятностей. Правила вычисления вероятностей случайных событий. Построение законов распределения вероятностей случайных величин, вычисление числовых характеристик.

    задача [82,0 K], добавлен 12.02.2011

  • Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.

    реферат [146,5 K], добавлен 19.08.2015

  • Сущность закона распределения и его практическое применение для решения статистических задач. Определение дисперсии случайной величины, математического ожидания и среднеквадратического отклонения. Особенности однофакторного дисперсионного анализа.

    контрольная работа [328,2 K], добавлен 07.12.2013

  • Статистическое, аксиоматическое и классическое определение вероятности. Дискретные случайные величины. Предельные теоремы Лапласа и Пуассона. Функция распределения вероятностей для многомерных случайных величин. Формула Байеса. Точечная оценка дисперсии.

    шпаргалка [328,7 K], добавлен 04.05.2015

  • Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.

    курс лекций [759,3 K], добавлен 13.06.2015

  • Первичный анализ и основные характеристики статистических данных. Точечные оценки параметров распределения. Доверительные интервалы для неизвестного математического ожидания и для среднего квадратического отклонения. Проверка статистических гипотез.

    дипломная работа [850,9 K], добавлен 18.01.2016

  • Пространство элементарных событий. Понятие совместных и несовместных событий и их вероятностей. Плотность распределения вероятностей системы двух случайных величин. Числовые характеристики системы. Закон генеральной совокупности и его параметры.

    контрольная работа [98,1 K], добавлен 15.06.2012

  • Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).

    курсовая работа [1,0 M], добавлен 27.01.2012

  • Возникновение теории вероятностей как науки. Ранние годы Андрея Николаевича Колмогорова. Первые публикации Колмогорова. Круг жизненных интересов Андрея Николаевича. Присуждение академику Андрею Николаевичу Колмогорову, в марте 1963 года, премии Бальцана.

    реферат [17,3 K], добавлен 15.06.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.