Теория вероятности и случайные величины
Непрерывная случайная величина и функция распределения. Математическое ожидание непрерывной случайной величины. Среднее квадратичное отклонение. Кривая распределения для непрерывной случайной величины. Понятие однофакторного дисперсионного анализа.
Рубрика | Математика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 03.01.2012 |
Размер файла | 165,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
СОДЕРЖАНИЕ
1 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
2 ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
ЗАДАЧА№1
ЗАДАЧА №2
ЗАДАЧА №3
ЗАДАЧА №4
СПИСОК ЛИТЕРАТУРЫ
1 ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ НЕПРЕРЫВНЫХ СЛУЧАЙНЫХ ВЕЛИЧИН
Пусть непрерывная случайная величина Х задана функцией распределения f(x). Допустим, что все возможные значения случайной величины принадлежат отрезку [a,b].
Определение. Математическим ожиданием непрерывной случайной величины Х, возможные значения которой принадлежат отрезку [a,b], называется определенный интеграл
Если возможные значения случайной величины рассматриваются на всей числовой оси, то математическое ожидание находится по формуле:
При этом, конечно, предполагается, что несобственный интеграл сходится.
Определение. Дисперсией непрерывной случайной величины называется математическое ожидание квадрата ее отклонения.
По аналогии с дисперсией дискретной случайной величины, для практического вычисления дисперсии используется формула:
Определение. Средним квадратичным отклонением называется квадратный корень из дисперсии.
Определение. Модой М0 дискретной случайной величины называется ее наиболее вероятное значение. Для непрерывной случайной величины мода - такое значение случайной величины, при которой плотность распределения имеет максимум.
Если многоугольник распределения для дискретной случайной величины или кривая распределения для непрерывной случайной величины имеет два или несколько максимумов, то такое распределение называется двухмодальным или многомодальным.
Если распределение имеет минимум, но не имеет максимума, то оно называется антимодальным.
Определение. Медианой MD случайной величины Х называется такое ее значение, относительно которого равновероятно получение большего или меньшего значения случайной величины.
Геометрически медиана - абсцисса точки, в которой площадь, ограниченная кривой распределения делится пополам.
Отметим, что если распределение одномодальное, то мода и медиана совпадают с математическим ожиданием.
Определение. Начальным моментом порядка k случайной величины Х называется математическое ожидание величины Хk.
Для дискретной случайной величины:
.
Для непрерывной случайной величины:
.
Начальный момент первого порядка равен математическому ожиданию.
Определение. Центральным моментом порядка k случайной величины Х называется математическое ожидание величины
Для дискретной случайной величины:
.
Для непрерывной случайной величины:
.
Центральный момент первого порядка всегда равен нулю, а центральный момент второго порядка равен дисперсии. Центральный момент третьего порядка характеризует асимметрию распределения.
Определение. Отношение центрального момента третьего порядка к среднему квадратическому отклонению в третьей степени называется коэффициентом асимметрии.
Определение. Для характеристики островершинности и плосковершинности распределения используется величина, называемая эксцессом.
Кроме рассмотренных величин используются также так называемые абсолютные моменты:
Абсолютный начальный момент:
непрерывный случайный величина распределение
.
Абсолютный центральный момент:
.
Абсолютный центральный момент первого порядка называется средним арифметическим отклонением.
2 ОДНОФАКТОРНЫЙ ДИСПЕРСИОННЫЙ АНАЛИЗ
Дисперсионный анализ - это статистический метод анализа результатов наблюдений, зависящих от различных, одновременно действующих факторов, выбор наиболее важных факторов и оценка их влияния. Идея дисперсионного анализа, как и сам термин «дисперсия» принадлежат Р.Фишеру. Суть анализа заключается в разложении обей вариации случайной величины на независимые слагаемые, каждое из которых характеризует влияние того или иного фактора или их взаимодействия.
Факторами обычно называют внешние условия, влияющие на эксперимент. В условиях эксперимента факторы могут варьировать, благодаря чему можно исследовать влияние контролируемого фактора на эксперимент. В этом случае говорят, что фактор варьирует на разных уровнях или имеет несколько уровней. В зависимости от количества факторов, включенных в анализ, различают классификацию по одному признаку - однофакторный анализ, по двум признакам - двухфакторный анализ и многостороннюю классификацию, изучением которой занимается многофакторный анализ.
На практике возможен случай, когда на автоматической линии несколько станков параллельно выполняют некоторую операцию. Для правильного планирования последующей обработки важно знать, насколько однотипны средние размеры деталей, получаемые на параллельно работающих станках. Здесь имеет место лишь один фактор, влияющий на размер деталей, - станки, на которых они изготавливаются. Исследователя интересует, насколько существенно влияние этого фактора на размеры деталей? Предположим, что совокупности размеров деталей, изготовленных на каждом станке, имеют нормальное распределение и равные дисперсии. Имеем m совокупностей или уровней, на которых произведено n1, n2, …nm наблюдений. Для простоты рассуждений положим, что n1=n2=…=nm. Размеры деталей, составляющие ni наблюдений на i-м уровне, обозначим xi1, xi2, …, xin. Тогда все наблюдения можно представить в виде таблицы, которую назовем матрицей наблюдений:
Уровни |
Наблюдения |
||||
1 |
2 |
J |
n |
||
1 |
x11 |
x12 |
x1j |
x1n |
|
2 |
x21 |
x22 |
x2j |
x2n |
|
… |
… |
||||
I |
Xi1 |
Xi2 |
xij |
Xin |
|
… |
… |
… |
… |
… |
|
m |
xm1 |
xm2 |
xmj |
xmn |
Для i-того уровня n наблюдений имеют среднюю ?i равную сумме общей средней ? и вариации ее , обусловленной i-м уровенем фактора, то есть ?i = ?+?i. Тогда одно наблюдение можно представить в следующем виде:
где - общая средняя;
- эффект, обусловленный i-м уровнем фактора;
- вариация результатов внутри отдельного уровня.
Член характеризует влияние всех неучтенных моделью факторов. Согласно общей задаче дисперсионного анализа, нужно оценить существенность влияния фактора на размеры деталей. Общую вариацию переменной можно разложить на части, одна из которых характеризует влияние фактора , другая - влияние неучтенных факторов. Для этого необходимо найти оценку общей средней и оценки средних по уровням . Очевидно, что оценкой является средняя арифметическая n наблюдений i- того уровня, то есть . Звездочка в индексе при x означает, что наблюдения фиксированы на i-м уровне. Средняя арифметическая всей совокупности наблюдений является оценкой общей средней , то есть
или
Найдем сумму квадратов отклонений от , то есть . Представим ее в виде:
причем
.
Но , так как это есть сумма отклонений переменных одной совокупности от средней арифметической этой же совокупности, то есть S=0. Второй член суммы запишем в виде:
Тогда основное тождество можно представить в виде
Слагаемое является суммой квадратов разностей между средними уровней и средней всей совокупности наблюдений. Эта сумма называется суммой квадратов отклонений меду группами и характеризует расхождения между уровнями. Величину называют также рассеиванием по факторам, то есть рассеиванием за счет исследуемого фактора. Слагаемое является суммой квадратов разностей между отдельными наблюдениями и средней i-того уровня. Эта сумма называется суммой квадратов отклонений внутри группы и характеризует расхождения между наблюдениями i-того уровня. Величину называют также остаточным рассеиванием, то есть рассеиванием за счет неучтенных факторов. Наконец, называется общей или полной суммой квадратов отклонений отдельных наблюдений от общей средней .
Зная суммы квадратов ,, можно оценить соответствующие дисперсии: общую, межгрупповую и внутригрупповую. Оценим дисперсии
:
,
Если влияние всех уровней фактора одинаково, то и - оценки общей дисперсии. Тогда для оценки существенности влияния фактора достаточно проверить гипотезу H0: = ; для этого вычисляют статистику с и степенями свободы. По специальным таблицам находят критическое значение . Если , то нулевая гипотеза отвергается и делается заключение о существенном влиянии фактора . При нет оснований отвергать нулевую гипотезу и считают, что влияние фактора несущественно.
Сравнивая межгрупповую и остаточную дисперсии, по величине их отношения судят, насколько сильно проявляется влияние факторов.
ЗАДАЧА№1
В группе из 100 случайно выбранных лиц осуществили измерение по двум признакам: X (уровень оптимизма) и Y (уровень целенаправленности). Оба признака измерялись по 5-бальной шкале. Данные исследований приведены в таблице.
Уровень величины |
Количество человек по величине X |
Количество человек по величине Y |
|
1 |
10 |
3 |
|
2 |
28 |
27 |
|
3 |
41 |
47 |
|
4 |
18 |
21 |
|
5 |
3 |
2 |
Вычислить:
1) Эмпирические вероятности: а) ; б) ; в) , если ; г) ; д) ;
2) Для двух величин их эмпирические: а) математическое ожидание; б) дисперсию; в) среднеквадратическое отклонение.
Решение:
а) ; б) ;
в) По теореме сложения вероятностей совместных событий имеем:
;
г) по теореме сложения вероятностей несовместных событий имеем:
д) по теореме сложения вероятностей cовместных событий имеем:
По теореме умноження вероятности имеем:
2) Для величины составим расчетную таблицу
1 |
10 |
10 |
-1,76 |
30,976 |
|
2 |
28 |
56 |
-0,76 |
16,173 |
|
3 |
41 |
123 |
0,24 |
2,362 |
|
4 |
18 |
72 |
1,24 |
27,677 |
|
5 |
3 |
15 |
2,24 |
15,053 |
|
Всего |
100 |
276 |
92,241 |
За оценку математического ожидания можно принять выборочную среднюю:
,
Дисперсию вычислим по формуле:
Среднеквадратическое отклонение составляет:
Составим расчетную таблицу для вычисления величины
1 |
3 |
3 |
-1,92 |
11,06 |
|
2 |
27 |
54 |
-0,92 |
22,85 |
|
3 |
47 |
141 |
0,08 |
0,30 |
|
4 |
21 |
84 |
1,08 |
24,49 |
|
5 |
2 |
10 |
2,08 |
8,65 |
|
Всего |
100 |
292 |
67,35 |
За оценку математического ожидания можно принять выборочную среднюю:
,
Дисперсия
Среднеквадратическое отклонение:
ЗАДАЧА №2
В группе из 120 случайно выбранных лиц проводилось тестирование уровня интеллекта. Одним из вопросом теста было такое: «Правда ли, что 34 больше 43?» Статистические данные свидетельствуют, что 80% людей ответили да на этот вопрос. Найти:
а) вероятность того, что в исследуемой группе лиц дадут ответ «нет»;
б) математическое ожидание и дисперсию распределения количества лиц в группе, которые могут дать ответ «да».
Решение:
а) Из 120 человек ответили «да» 80%, то есть 96 человек. Следовательно, оставшиеся члены группы составляют 24 человека (120-96 = 24 человека). Вероятность того, что 24 человека ответят «нет» составляет: , то есть 100%.
б) так как ответить на задаваемый вопрос можно двумя способами: «да» или «нет», то вероятность того, что человек ответить «да» равна . Тогда математическое ожидание равно , дисперсия
ЗАДАЧА №3
В группе из 175 случайно выбранных лиц измеряли признак А (уровень агрессивности) по 7 бальной шкале. . Данные исследования приведены в таблице.
Уровень агрессивности (признак А), баллы |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Количество человек |
5 |
20 |
40 |
50 |
25 |
20 |
15 |
Найти:
а) Эмпирическую функцию распределения величины А;
б) Эмпирическую плотность распределения величины А;
в) Математическое ожидание и дисперсию величины А;
г) Моду и медиану величины А;
Построить полигон и кумуляты частот распределения величины А.
Решение:
Составим расчетную таблицу:
1 |
5 |
5 |
-3,086 |
-15,43 |
47,617 |
|
2 |
20 |
40 |
-2,086 |
-41,72 |
87,028 |
|
3 |
40 |
120 |
-1,086 |
-43,44 |
47,176 |
|
4 |
50 |
200 |
-0,086 |
-4,3 |
0,3698 |
|
5 |
25 |
125 |
0,914 |
22,85 |
20,185 |
|
6 |
20 |
120 |
1,914 |
38,28 |
72,268 |
|
7 |
15 |
105 |
2,914 |
43,71 |
127,371 |
|
Всего |
175 |
715 |
403,71 |
За математическое ожидание можно принять выборочную среднюю:
Дисперсия величины А составляет:
,
Среднеквадратическое отклонение:
Зная и , можно записать функцию плотности распределения:
, .
Функция распределения - это интеграл от плотности распределения:
Мода - это наиболее часто встречающееся значение признака в совокупности: ,
Медианой дискретного вариационного ряда называется вариант, делящий ряд на две равные части: .
Отложим на оси абцисс варианты , а на оси ординат - соответствующие им частоты , соединив точки (;) отрезками прямых, получим искомый полигон частоты:
Кумулятивная частота представляет собой результат последовательного сложения групп и соответствующих им частот:
Кумулятивная частота |
||
1 |
5 |
|
2 |
5+20=25 |
|
3 |
5+20+40=65 |
|
4 |
5+20+40+50=115 |
|
5 |
5+20+40+50+25=140 |
|
6 |
5+20+40+50+25+20=160 |
|
7 |
5+20+40+50+25+20+15=175 |
Построим кумуляту частот:
ЗАДАЧА №4
По группе из 80 случайно выбранных врачей измеряли уровень консервативности (признак А) по 5 бальной шкале. Данные исследования приведены в таблице.
Уровень консерватизма (А) |
Количество врачей по годам |
||||
17-25 лет |
26-35 лет |
36-45 лет |
Старше 45 лет |
||
1 |
|||||
2 |
|||||
3 |
|||||
4 |
|||||
5 |
|||||
Всего |
1. Найти средние значения величины А в каждой возрастной группе;
2. Построить интервальный вариационный ряд со средними значениями величины А для возрастных интервалов;
3. Построить гистограмму этого вариационного ряда;
4. Вычислить коэффициент корреляции между средним значением величины А и возрастом врачей
Решение:
В возрастной группе 17-25 лет среднее значение величины ;
В возрастной группе 26-35 лет среднее значение величины ;
В возрастной группе 36-45 лет среднее значение величины ;
В возрастной группе старше 45 лет
В результате получаем новый интервальный вариационный ряд
Возрастной интервал |
Количество человек |
|
17-25 |
2 |
|
26-35 |
4 |
|
36-45 |
6 |
|
45 и старше |
4 |
Построим гистограмму данного вариационного ряда, которая будет состоять из прямоугольников, основаниями которых служат частичные интервалы, а высоты равны частотам вариант интервала.
Количество человек
Возрастной интервал
Для определения коэффициента корреляции составим расчетную таблицу:
2 |
21 |
42 |
-5,2 |
228,9 |
34,5 |
||
4 |
31 |
124 |
0,08 |
26,3 |
1,44 |
||
6 |
40 |
240 |
2,96 |
14,98 |
6,66 |
||
4 |
49 |
172 |
0,08 |
165,6 |
-3,6 |
||
Всего |
16 |
135 |
578 |
8,32 |
435,78 |
39 |
Коэффициент корреляции между средним значением величины А и возрастом врачей вычисляется по формуле:
Для определения среднего значения и величина А для всей группы составим расчетную таблицу:
1 |
14 |
14 |
-2,225 |
31,15 |
||
2 |
13 |
26 |
-1,225 |
15,925 |
||
3 |
15 |
45 |
-0,225 |
3,375 |
||
4 |
17 |
68 |
0,775 |
13,175 |
||
5 |
21 |
105 |
1,775 |
37,275 |
||
Всего |
15 |
80 |
258 |
100,9 |
Среднее значение величины А:
,
Среднее линейное отклонение величины А:
СПИСОК ЛИТЕРАТУРЫ
1.Горбань С.Ф., Снижко Н.В. Теория вероятностей и математическая статистика: Учебн. Пособие.- К.: МАУП, 1999.- 168с.
2. Громыко Г.Л. Статистика.- М.: Издательство МГУ, 1981.-166с.
3. Артемьева Е.Ю. Сборник зада по теории вероятностей и математической статистике для психологов. -М.: МГУ, 1969.-92с.
4. Карасев А.И. Теория вероятности и математическая статистика. -М.: Статистика, 1977.- 273с.
5. Чистяков В.П. Курс теории вероятностей. - М., 1978.- 125с.
Размещено на Allbest.ru
Подобные документы
Случайные величины. Функция и плотность распределения вероятностей дискретной случайной величины. Сингулярные случайные величины. Математическое ожидание случайной величины. Неравенство Чебышева. Моменты, кумулянты и характеристическая функция.
реферат [244,6 K], добавлен 03.12.2007Понятие непрерывной случайной величины, её значения на числовых промежутках. Определение закона распределения, его функции. Плотность распределения числовых характеристик вероятности. Математическое ожидание, дисперсия и среднеквадратичное отклонение.
лекция [575,9 K], добавлен 17.08.2015Использование формулы Бернулли для нахождения вероятности происхождения события. Построение графика дискретной случайной величины. Математическое ожидание и свойства интегральной функции распределения. Функция распределения непрерывной случайной величины.
контрольная работа [87,2 K], добавлен 29.01.2014Функция распределения непрерывной случайной величины. Математическое ожидание непрерывной случайной величины, плотность распределения вероятностей системы. Ковариация. Коэффициент корреляции.
лабораторная работа [52,3 K], добавлен 19.08.2002Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.
реферат [174,7 K], добавлен 25.10.2015Плотность распределения непрерывной случайной величины. Характеристика особенностей равномерного и нормального распределения. Вероятность попадания случайной величины в интервал. Свойства функции распределения. Общее понятие о регрессионном анализе.
контрольная работа [318,9 K], добавлен 26.04.2013Определение вероятности попадания в мишень по формуле Бернулли. Закон и многоугольник распределения случайной величины. Построение функции распределения, графика. Математическое ожидание, дисперсия, среднее квадратическое отклонение случайной величины.
контрольная работа [86,4 K], добавлен 26.02.2012Дискретные случайные величины и их распределения. Формула полной вероятности и формула Байеса. Общие свойства математического ожидания. Дисперсия случайной величины. Функция распределения случайной величины. Классическое определение вероятностей.
контрольная работа [33,8 K], добавлен 13.12.2010Математическое ожидание случайной величины. Свойства математического ожидания, дисперсия случайной величины, их суммы. Функция от случайных величин, ее математическое ожидание. Коэффициент корреляции, виды сходимости последовательности случайных величин.
лекция [285,3 K], добавлен 17.12.2010Вероятность попадания случайной величины Х в заданный интервал. Построение графика функции распределения случайной величины. Определение вероятности того, что наудачу взятое изделие отвечает стандарту. Закон распределения дискретной случайной величины.
контрольная работа [104,7 K], добавлен 24.01.2013