Выравнивание статистических рядов
Закон и свойства нормального распределения случайной величины. На основе критерия согласия Пирсона построение гистограммы, статистической функции и теоретической кривой и определение согласованности теоретического и статистического распределения.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 30.10.2013 |
Размер файла | 894,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Введение
Целью курсовой работы является углубление знаний по математическому методу обработке данных, развитию и закреплению навыков в выравнивание статистических рядов.
Во всяком статистическом распределении неизбежно присутствуют элементы случайности, связанные с тем, что число наблюдений ограничено, что произведены именно те, а не другие опыты, давшие именно те, а не другие результаты. Только при очень большом числе наблюдений эти элементы случайности сглаживаются, и случайное явление обнаруживает в полной мере присущую ему закономерность.
На практике мы почти никогда не имеем дела с таким большим числом наблюдений и вынуждены считаться с тем, что любому статистическому распределению свойственны в большей или меньшей мере черты случайности. Поэтому при обработке статистического материала часто приходится решать вопрос о том, как подобрать для данного статистического ряда теоретическую кривую распределения, выражающую лишь существенные черты статистического материала, но не случайности, связанные с недостаточным объемом экспериментальных данных.
Такая задача называется задачей выравнивания (сглаживания) статистических рядов.
1. Теоретические данные
Законом распределения случайной величины - называется любое правило, позволяющее находить вероятность всевозможных событий, связанных с этой случайной величиной. Например, вероятность того, что случайная величина примет какое-либо значение или попадет в определенный интервал. В этом случае пользуются плотностью распределения непрерывной случайной величины f(x). При этом вероятность попадания случайной величины в интервал будет равна:
(1)
Интеграл плотности распределения от равен 1.
Задача выравнивания заключается в том, чтобы подобрать теоретическую плавную кривую распределения, с той или иной точки зрения наилучшим образом описывающую данное статистическое распределение (рис. 1)
Рис 1. Гистограмма распределения
Гистограмма - ступенчатая диаграмма, показывающая как часто при измерениях появляются результаты, попадающие в тот или иной интервал Dx между наименьшим и наибольшим из измеренных значений величины .
Имея гистограмму распределения можно построить статистическую функцию распределения F*(xi). Для этого необходимо выбрать несколько точек, удобно брать границы интервалов (x0, х1 - хк), тогда:
(2)
При ?хi>0 гистограмма стремиться к графику плотности распределения f(x). Различают статистическую плотность и теоретическую. Статистическая плотность распределения строиться путем соединения точек серединных интервалов. Теоретическая кривая плотности распределения случайной величины находится в соответствии с нормальным законом распределения случайной величины х. Эта задача называется выравниванием статистических распределений.
Во многих случаях при обработке экспериментальных данных случайная величина подчиняется нормальному закону (закону ошибок или закону Гаусса). Плотность распределения случайной величины распределенной по нормальному закону описывается:
(3)
где - среднеквадратическое отклонение и математическое ожидание. Как видно из выражения (3) нормальное распределение имеет 2 параметра:.
Нормализованным нормальным законом называется такое нормальное распределение, у которого , a . График плотности нормального распределения имеет вид колокола (рис 2.)
Рис.2
В областисосредоточено 68% площади распределения,95,4%, - 99,7%, таким образом в интервале лежат практически все значения нормального распределения случайной величины (это правило 3х сигм). Другими словами: если отклонение случайной величины превосходит , то это свидетельствует либо о грубой ошибке в опыте (промах), либо о том, что случайная величина распределена не в соответствии с нормальным законом распределения.
Свойства нормального распределения:
1. изменение приводит к сдвигу графика по оси х:
(рис.3)
Рис. 3.
2. изменение приводит к масштабированию формы графика: (рис.4)
Рис.4
В случае нормального распределения:
(4)
Интеграл выражения (4) не берется в общем виде, поэтому созданы специальные таблицы для функции Лапласа при. Функция Лапласа является симметричной относительно точки (0;0.5), поэтому . В связи с этим в таблице содержится только одно из ее симметричных частей. Если задается интервал [a;b], то вероятность попадания случайной величины в этот интервал:
(5)
где Ф- значение функции Лапласа из таблицы.
Если случайная величина описывается нормальным законом распределения (4), то задача выравнивания сводится к рациональному выбору параметров . Одним из методов выравнивания является метод моментов. Согласно этому методу параметры выбираются с таким расчетом, чтобы важнейшие числовые характеристики соответствовали статистическим характеристикам, т.е. теоретического распределения совпадали со статистическими характеристиками :
2. Критерий Пирсона
Гистограмма описана аналитической функцией f(x), однако как бы хорошо не была подобрана аналитическая кривая, между ней и статистическим распределением неизбежны некоторые расхождения.
При этом возникает вопрос - объясняются ли эти расхождения только случайными обстоятельствами, связанными с ограниченным числом наблюдений, или они являются существенными и связаны тем, что подобранная кривая плохо выравнивает статистическое распределение. Для ответа на этот вопрос используется критерий согласия - критерий согласия Пирсона. В результате эксперимента проведено n опытов, в каждом из которых случайная величина принимает определенное значение, результаты опытов сводятся в статистический ряд. Требуется проверить, согласуются ли экспериментальные данные с гипотезой о том, что случайная величина x имеет определенный закон (либо функцию распределения f(x), либо плотность распределения f(x)). Этот закон распределения назовем теоретический. Зная закон распределения, можно найти теоретические вероятности попадания случайной величины в каждый из интервалов: .
Проверяя согласованность теоретических и статистических распределений, будем исходить из расхождений между теоретическими вероятностями и частотами . В качестве меры расхождения между теоретическими и статистическими распределениями выбрана сумма квадратов отклонений, между вероятностями взятых с некоторыми весами ci:
где теоретическая вероятность попадания случайной величины
в i-ый интервал;
статистическая вероятность попадания случайной величины в i-ый интервал (частота попадания);
ci - вес интервала:
Вес интервала вводится потому, что в общем случае отклонение, относящееся к различным разрядам, нельзя считать равноправными, поэтому вес необходимо взять обратно пропорционально вероятности попадания случайной величины в каждый из интервалов. При большом числе опытов n закон распределения величины обладает следующими свойствами:
· практически не зависит от функции распределения и от числа опытов, а именно при увеличении числа опытов этот закон приближается к распределению , таким образом, с учетом выражения (10) и (9) примет следующий вид:
(12)
Учитывая, что находится по формуле
(13)
где - количество попадания в интервал, получим:
(14)
Распределение зависит от числа степени свободы (r). Степень свободы равна числу интервалов за вычетом числа независимых связей или условий, наложенных на . Обычно на накладываются следующие условия:
· Сумма всех вероятностей равна 1
· Сумма произведений статистических вероятностей равна математическому ожиданию
·
где дисперсия случайной величины.
Таким образом, обычно на распределение накладывается 3 условия (s=3).
Число степеней свободы
где количество интервалов.
Для распределения составлены таблицы, пользуюсь которыми можно для каждого значения и числа степени свободы (r) найти вероятность () того, что величина распределения по этому закону превзойдет это значение. Если найденное значение вероятности () велико, то гипотезу о том, что функция f(x) пригодна для аппроксимации полученной гистограммы, можно признать не противоречащей опытным данным. Если вероятность () мала (меньше 0.1), то гипотеза отбрасывается как неправдоподобная. В этом случае следует либо выбрать другое распределение, либо провести дополнительные опыты.
3. Задание
Приведенные ниже данные показывают процентное содержание влаги в кирпичах, используемых для футеровки печи.
распределение случайный величина пирсон
На основании полученных данных:
- Построить гистограмму распределения.
- Построить статистическую функцию распределения.
- Подобрать теоретическую кривую распределения.
- Проверить согласованность теоретического и статистического распределения.
3. Ход выполнения работы
Определим вариационный ряд и соответствующие частоты :
6,5 |
6,6 |
6,7 |
6,8 |
6,9 |
7,0 |
7,1 |
7,2 |
7,3 |
7,4 |
7,5 |
||
1 |
0 |
6 |
10 |
13 |
13 |
17 |
11 |
5 |
1 |
3 |
Выводим группировки интервалов с шагом h=0,1 :
[6,45-6,55] |
[6,55-6,65] |
[6,65-6,75] |
[6,75-6,85] |
[6,85-6,95] |
[6,95-7,0] |
[7,0-7,1] |
[7,1-7,2] |
[7,2-7,3] |
[7,3-7,4] |
[7,4-7,5] |
||
1 |
0 |
6 |
10 |
13 |
13 |
17 |
11 |
5 |
1 |
3 |
Эмпирические вероятности равны:
где число выборки N=80
На основе данных наблюдений составляем статистический ряд, в котором приводим в порядке их расположения по оси ОХ, а так же соответствующей им частоты
0,0125 |
0 |
0,075 |
0,125 |
0,1625 |
0,1625 |
0,2125 |
0,1375 |
0,0625 |
0,0125 |
0,0375 |
Для построения гистограммы по оси абсцисс откладываются интервалы , на каждом из интервалов строят прямоугольник, площадью .
Гистограмма распределения имеет вид:
Рис. 6
Имея гистограмму распределения можно построить статистическую функцию распределения:
.
Рис.7
Сделаем предположение о нормальном распределении ряда.
Проверим согласованность теоретического и статистического распределения с помощью критерия Пирсона.
[6,45-6,55] |
[6,55-6,65] |
[6,65-6,75] |
[6,75-6,85] |
[6,85-6,95] |
[6,95-7,0] |
[7,0-7,1] |
[7,1-7,2] |
[7,2-7,3] |
[7,3-7,4] |
[7,4-7,5] |
||
1 |
0 |
6 |
10 |
13 |
13 |
17 |
11 |
5 |
1 |
3 |
Пользуясь методом произведений, найдем среднюю и среднее квадратичное , выбрав ложный нуль C = 7,1 , так как 7,1 находится близко к середине ряда и имеет большую частоту.
Таблица 1
Интервал |
xi |
mi |
Ui=xi-C\h |
Ui*mi |
Ui^2 |
Ui^2*mi |
|
1 |
6,5 |
1 |
-6 |
-6 |
36 |
36 |
|
2 |
6,6 |
0 |
-5 |
0 |
25 |
0 |
|
3 |
6,7 |
6 |
-4 |
-24 |
16 |
96 |
|
4 |
6,8 |
10 |
-3 |
-30 |
9 |
90 |
|
5 |
6,9 |
13 |
-2 |
-26 |
4 |
52 |
|
6 |
7 |
13 |
-1 |
-13 |
1 |
13 |
|
7 |
7,1 |
17 |
0 |
0 |
0 |
0 |
|
8 |
7,2 |
11 |
1 |
11 |
1 |
11 |
|
9 |
7,3 |
5 |
2 |
10 |
4 |
20 |
|
10 |
7,4 |
1 |
3 |
3 |
9 |
9 |
|
11 |
7,5 |
3 |
4 |
12 |
16 |
48 |
|
Сумма = |
-63 |
Сумма = |
375 |
Где C - ложный нуль.
Найдем выборочные характеристики
;
где условная варианта.
где выборочные характеристики дисперсии и отклонения для условной варианты,
Найдем теоретические частоты для интервалов ?i=(?i, ?i), используя формулу вероятности попадания значений в этот интервал.
Для нормального распределения
где - функция Лапласа.
Таблица 2
ai |
bi |
t1 |
t2 |
Ф(t1) |
Ф(t2) |
pi=Ф2-Ф1 |
n*pi |
|
6,45 |
6,55 |
-2,83302 |
-2,3370859 |
-0,49765 |
-0,4901 |
0,00755 |
0,604 |
|
6,55 |
6,65 |
-2,33709 |
-1,8411525 |
-0,4901 |
-0,4671 |
0,023 |
1,84 |
|
6,65 |
6,75 |
-1,84115 |
-1,3452192 |
-0,4671 |
-0,4099 |
0,0572 |
4,576 |
|
6,75 |
6,85 |
-1,34522 |
-0,8492859 |
-0,4099 |
-0,2955 |
0,1144 |
9,152 |
|
6,85 |
6,95 |
-0,84929 |
-0,3533525 |
-0,2955 |
-0,1368 |
0,1587 |
12,696 |
|
6,95 |
7,05 |
-0,35335 |
0,1425808 |
-0,1368 |
0,0557 |
0,1925 |
15,4 |
|
7,05 |
7,15 |
0,142581 |
0,6385142 |
0,0557 |
0,2357 |
0,18 |
14,4 |
|
7,15 |
7,25 |
0,638514 |
1,1344475 |
0,2357 |
0,3708 |
0,1351 |
10,808 |
|
7,25 |
7,35 |
1,134448 |
1,6303809 |
0,3708 |
0,4484 |
0,0776 |
6,208 |
|
7,35 |
7,45 |
1,630381 |
2,1263142 |
0,4484 |
0,483 |
0,0346 |
2,768 |
|
7,45 |
7,55 |
2,126314 |
2,6222476 |
0,483 |
0,4956 |
0,0126 |
1,008 |
Построим теоретическую кривую распределения по формуле
Рис. 8
Найдем выборочное значение ?2
Таблица 3
Номер интервала |
Границы ?i |
mi |
npi |
mi - npi |
(mi - npi)2 |
||
1 |
6,45-6,55 |
1 |
0,604 |
0,396 |
0,156816 |
0,259629139 |
|
2 |
6,55-6,65 |
0 |
1,84 |
-1,84 |
3,3856 |
1,84 |
|
3 |
6,65-6,75 |
6 |
4,576 |
1,424 |
2,027776 |
0,443132867 |
|
4 |
6,75-6,85 |
10 |
9,152 |
0,848 |
0,719104 |
0,078573427 |
|
5 |
6,85-6,95 |
13 |
12,696 |
0,304 |
0,092416 |
0,007279143 |
|
6 |
6,95-7,05 |
13 |
15,4 |
-2,4 |
5,76 |
0,374025974 |
|
7 |
7,05-7,15 |
17 |
14,4 |
2,6 |
6,76 |
0,469444444 |
|
8 |
7,15-7,25 |
11 |
10,808 |
0,192 |
0,036864 |
0,003410807 |
|
9 |
7,25-7,35 |
5 |
6,208 |
-1,208 |
1,459264 |
0,235061856 |
|
10 |
7,35-7,45 |
1 |
2,768 |
-1,768 |
3,125824 |
1,129271676 |
|
11 |
7,45-7,55 |
3 |
1,008 |
1,992 |
3,968064 |
3,936571429 |
|
?2(статист) |
8,776400762 |
Таким образом, число интервалов k = 11, а число наложенных связей , то число степеней свободы . Поэтому по таблице критических значений ,
при имеем .
Мы выдвинули гипотезу, что данная совокупность распределена по нормальному закону и мы не отвергаем её так как
, то .
Заключение
В ходе курсового проекта на основе экспериментальных данных была построена гистограмма распределения, и с помощью критерия Пирсона мы выяснили, что кривая нормального распределения вполне описывает нашу диаграмму.
Из данной курсовой работы можно сделать следующие выводы: статистические ряды распределения являются базисным методом для любого статистического анализа - это результаты расчетов данных статистической информации, которые раскрывают причинные связи изучаемых явлений, влияние и взаимодействие различных факторов, из которых вытекают последствия принимаемых решений, а также осуществляется прогноз на будущие периоды.
Размещено на Allbest.ru
Подобные документы
Среднее арифметическое (математическое ожидание). Дисперсия и среднеквадратическое отклонение случайной величины. Третий центральный момент и коэффициент асимметрии. Законы распределения. Построение гистограммы. Критерий Пирсона. Доверительный интервал.
курсовая работа [327,1 K], добавлен 29.03.2013Вероятность попадания случайной величины Х в заданный интервал. Построение графика функции распределения случайной величины. Определение вероятности того, что наудачу взятое изделие отвечает стандарту. Закон распределения дискретной случайной величины.
контрольная работа [104,7 K], добавлен 24.01.2013Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.
курсовая работа [549,1 K], добавлен 07.08.2013Плотность распределения непрерывной случайной величины. Характеристика особенностей равномерного и нормального распределения. Вероятность попадания случайной величины в интервал. Свойства функции распределения. Общее понятие о регрессионном анализе.
контрольная работа [318,9 K], добавлен 26.04.2013Вычисление математического ожидания, дисперсии, функции распределения и среднеквадратического отклонения случайной величины. Закон распределения случайной величины. Классическое определение вероятности события. Нахождение плотности распределения.
контрольная работа [38,5 K], добавлен 25.03.2015Определение вероятности для двух несовместных и достоверного событий. Закон распределения случайной величины; построение графика функции распределения. Нахождение математического ожидания, дисперсии, среднего квадратичного отклонения случайной величины.
контрольная работа [97,1 K], добавлен 26.02.2012Генеральная совокупность подлежащих изучению объектов или возможных результатов наблюдений, производимых в одинаковых условиях над одним объектом. Описание наблюдаемых значений случайной величины Х. Характеристика статистической функции распределения.
курсовая работа [216,5 K], добавлен 03.05.2011Определение вероятности попадания в мишень по формуле Бернулли. Закон и многоугольник распределения случайной величины. Построение функции распределения, графика. Математическое ожидание, дисперсия, среднее квадратическое отклонение случайной величины.
контрольная работа [86,4 K], добавлен 26.02.2012Определение, доказательство свойств и построение графика функции распределения. Вероятность попадания непрерывной случайной величины в заданный интервал. Понятие о теореме Ляпунова. Плотность распределения "хи квадрат", Стьюдента, F Фишера—Снедекора.
курсовая работа [994,4 K], добавлен 02.10.2011Понятия теории вероятностей и математической статистики, применение их на практике. Определение случайной величины. Виды и примеры случайных величин. Закон распределения дискретной случайной величины. Законы распределения непрерывной случайной величины.
реферат [174,7 K], добавлен 25.10.2015