Статистическая обработка данных
Результаты вычисления интервальных оценок для математического ожидания и дисперсии. Вычисление выборочных характеристик по заданной выборке. Результаты ранжирования выборочных данных и вычисление моды и медианы. Оценка функции плотности распределения.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 07.02.2016 |
Размер файла | 215,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
Курсовой проект
по дисциплине «Статистика»
на тему: Статистическая обработка данных
Содержание
Введение
1. Постановка задачи. Цель работы. Исходные данные
2. Вычисление основных выборочных характеристик по заданной выборке
3. Результаты вычисления интервальных оценок для математического ожидания и дисперсии
4. Результаты ранжирования выборочных данных и вычисление моды и медианы
5. Параметрическая оценка функции плотности распределения
6. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона
Заключение
Список использованной литературы
интервальный дисперсия выборочный данные
Введение
Целью данной курсовой работы является изучение и, как в следствии, расширение знаний о математической статистике, ознакомление с методами обработки экспериментального материала, с целью получения надежных выводов, ознакомление с методикой применения статистических критериев для проверки гипотез.
1. Постановка задачи. Цель работы. Исходные данные
1) Задача:
По выборке объёма N провести статистическую обработку результатов эксперимента.
2) Цель работы:
Изучить и усвоить основные понятия математической статистики. Овладеть методикой статистического оценивания числовых характеристик случайной величины и нормального закона распределения. Ознакомиться с методикой применения статистических критериев для проверки гипотез.
3) Исходные данные.
Проведен эксперимент, в результате которого была получена выборка N = 60, которая соответствует случайной величине, распределённой по нормальному закону. Данная выборка представлена в таблице 1.1
Таблица 1.1
10.2836 |
10.7148 |
9.4963 |
12.8971 |
10.9190 |
12.8067 |
|
14.0510 |
7.3201 |
7.9052 |
15.2359 |
10.6512 |
9.6341 |
|
11.0156 |
12.4240 |
8.9727 |
12.1429 |
13.1025 |
11.9252 |
|
11.8667 |
8.3636 |
10.2223 |
9.1232 |
12.2658 |
11.1741 |
|
10.8028 |
10.4434 |
11.2314 |
9.6948 |
11.0725 |
8.3374 |
|
12.4564 |
9.5759 |
8.7116 |
14.2939 |
9.5319 |
13.1150 |
|
11.8891 |
17.3345 |
6.9275 |
13.3734 |
13.4795 |
13.8429 |
|
12.1071 |
11.7579 |
14.8285 |
9.5450 |
10.1539 |
12.1039 |
|
12.9304 |
7.3669 |
12.4592 |
12.3466 |
11.8461 |
11.5607 |
|
10.7288 |
15.9654 |
16.1488 |
9.8759 |
12.9522 |
12.5015 |
2. Вычисление основных выборочных характеристик по заданной выборке среднее арифметическое случайной величины Х (N = 60)
2) среднее линейное отклонение
3) дисперсия случайной величины Х
4) несмещенная оценка дисперсии
5) среднеквадратическое отклонение
=
6) несмещенная выборочная оценка для среднеквадратического отклонения
7) коэффициент вариации
8) коэффициент асимметрии случайной величины Х
9) коэффициент эксцесса случайной величины Х
10) вариационный размах
R = Xmax - Xmin = 17,3345- 6,9275= 10,407
На основании полученных вычислений можно сделать следующие выводы:
Выполняется необходимое условие для того, чтобы выборка имела нормальный закон распределения, т.к. для коэффициента вариации V выполняется неравенство:
V = < 33%
Отсюда следует, что не все выборочные значения случайной величины Х положительны, что мы и видим в исходных данных.
Для нормального распределения коэффициенты асимметрии и эксцесса должны быть равны нулю, т.е. As = E = 0.
По результатам вычисления асимметрия близка к нулю и составляет As = 0,22481644
В нашем случае асимметрия положительна, это значит, что «длинная часть» кривой расположена справа от математического ожидания.
Коэффициент эксцесса так же как и коэффициент асимметрии близок к нулю, так как Е = . Он отрицательный, значит, кривая имеет более низкую и «плоскую» вершину, чем нормальная кривая.
В связи с этим необходимы дополнительные исследования для выяснения степени близости распределения выборки к нормальному распределению.
3.Результаты вычисления интервальных оценок для математического ожидания и дисперсии
Для вычисления интервальной оценки математического ожидания воспользуемся формулой:
Где а = М[X] - математическое ожидание
N - 1 = V = 59 - число степеней свободы
tv;p - величина, численно равная половине интервала, в который может попасть случайная величина , имеющая определенный закон распределения при заданной доверительной вероятности Р и заданном числе степеней свободы V.
Подставляем в формулу вычисленные ранее значения , и N.
Задаемся доверительной вероятностью:
Р1 = 0,95 Р2 = 0,99
Для каждого значения Рi (i=1,2) находим по таблице значения t59;p и вычисляем два варианта интервальных оценок для математического ожидания.
При Р1 = 0,95 t59;0,95 = 2
При Р2 = 0,99 t59;0,95 = 2,66
Для интервальной оценки дисперсии существуют неравенства:
Поставляем в неравенство известные значения и N, получим неравенство, в котором неизвестны и .
Задаваясь доверительной вероятностью Рi (или уровнем значимости а) вычисляем значения и . Используем эти два значения и степень свободы V = N - 1 = 59, по таблице находим и .
= = = =
и - это границы интервала, в который попадает случайная величина Х, имеющая (хи-квадрат) распределение вероятности Рi и заданной степени свободы V (V=59).
Для Р1 = 0,95 и
находим по таблице: = = 40,4817
= = 83,2976
Подставляя в неравенства и и, вычисляя, получим интервальную оценку.
При Р2 = 0,99 и
находим по таблице: = = 35,5346
= = 91,9517
Поставляя в неравенства и , и вычисляя, получим интервальную оценку.
Для интервальной оценки среднеквадратического отклонения имеем:
При Р1 = 0,95
При Р2 = 0,99
4. Результаты ранжирования выборочных данных и вычисление моды и медианы
Используя исходные данные, записываем все заданные значения выборки в виде неубывающей последовательности значений случайной величины Х, которые представлены в таблице 4.1.
Таблица 4.1
Ранжированный ряд
6,9275 |
9,5319 |
10,6512 |
11,7579 |
12,4240 |
13,3734 |
|
7,3201 |
9,5450 |
10,7148 |
11,8461 |
12,4564 |
13,4795 |
|
7,3669 |
9,5759 |
10,7288 |
11,8667 |
12,4592 |
13,8429 |
|
7,9052 |
9,6341 |
10,8028 |
11,8891 |
12,5015 |
14,0510 |
|
8,3374 |
9,6948 |
10,9190 |
11,9252 |
12,8067 |
14,2939 |
|
8,3636 |
9,8759 |
11,0156 |
12,1039 |
12,8971 |
14,8285 |
|
8,7116 |
10,1539 |
11,0725 |
12,1071 |
12,9304 |
15,2359 |
|
8,9727 |
10,2223 |
11,1741 |
12,1429 |
12,9522 |
15,9654 |
|
9,1232 |
10,2836 |
11,2314 |
12,2658 |
13,1025 |
16,1488 |
|
9,4963 |
10,4434 |
11,5607 |
12,3466 |
13,1150 |
17,3345 |
Интервал [6,9275; 17,3345], содержащий все элементы выборки, разбиваем на частичные интервалы, используя при этом формулу Стерджеса для определения оптимальной длины и границ этих частичных интервалов.
По формуле Стерджеса длина частичного интервала равна:
Для удобства и простоты расчетов выбираем h = 1,5 и вычисляем последовательно границы интервалов.
За начало первого интервала принимаем значение:
Далее вычисляем границы интервалов.
= 6,1775 + 1,5 = 7,6775
= 7,6775 + 1,5 = 9,1775
= 9,1775+ 1,5 = 10,6775
= 10,1775+ 1,5 = 12,1775
= 12,1775+ 1,5 = 13,6775
= 13,6775+ 1,5 = 15,1775
= 15,1775+ 1,5 = 16,6775
= 16,6775+ 1,5 = 18,1775
Вычисление границ заканчивается, как только выполняется неравенство Xn > Xmax, то есть X8 = 18,1775> Xmax = 17,3345.
По результатам вычислений составляем таблицу. В первой графе таблицы помещаем частичные интервалы, во второй графе - середины интервалов, в третьей графе записано количество элементов выборки, попавших в каждый интервал - частоты, в четвертой графе записаны относительные частоты и в пятой графе записаны значения плотности относительных частот или значения выборочной, экспериментальной функции плотности. Данная информация представлена в таблице 4.2.
Таблица 4.2
Значение выборочной функции и плотности
h |
ni |
3 |
||||
[6,1775; 7,6775) |
6,9275 |
3 |
0,05 |
0,033 |
33 |
|
[7,6775; 9,1775) |
8,4275 |
6 |
0,1 |
0,067 |
67 |
|
[9,1775; 10,6775) |
9,9275 |
12 |
0,2 |
0,133 |
133 |
|
[10,6775; 12,1775) |
11,4275 |
17 |
0,283 |
0,189 |
189 |
|
[12,1775; 13,6775) |
12,9275 |
14 |
0,233 |
0,156 |
156 |
|
[13,6775; 15,1775) |
14,4275 |
4 |
0,067 |
0,044 |
44 |
|
[15,1775; 16,6775) |
15,9275 |
3 |
0,05 |
0,033 |
33 |
|
[16,6775; 18,1775) |
17,4275 |
1 |
0,016 |
0,011 |
11 |
По результатам вычислений функции плотности, представленной в таблице 4.2., можно сделать вывод, что мода имеет один локальный максимум в окрестности точки х = 11,4275 и с частотой по n = 17.
Оценку медианы находим, используя вариационный ряд:
Так как N = 2k, k = N / 2 = 60 / 2 = 30
Сравнение оценок медианы и оценки математического ожидания показывает, что они отличаются на 1,34 %.
5. Параметрическая оценка функции плотности распределения
Исходя из гипотезы, что заданная выборка имеет нормальный закон распределения, найдем параметрическую оценку функции плотности, используя формулу для плотности распределения вероятности нормального закона:
Где и известны - они вычисляются по выборке.
= 2,1976676 = 11,4634
Значения этой функции вычисляются для середины частичных интервалов вариационного ряда, т.е. при х = . На практике для упрощения вычислений функции , где i = 1,2,…, k, пользуются таблицами значений функции плотности стандартной нормальной величины.
Для этого вычисляем значения для i = 1,2,…, k, затем по таблице значений функций плотности стандартной нормальной величины находим значение .
=0,0478
=0,1539
=0,3123
=0,3989
=0,3187
=0,1604
=0,0508
=0,0101
Переходим к вычислению функции:
0,022
Функция , вычисленная при заданных параметрах и в середине частичного интервала, фактически является теоретической относительной частотой, отнесенной к середине частичного интервала.
Поэтому для определения теоретической частоты , распределенной по всей ширине интервала, эту функцию необходимо умножить на .
где h = 1,5
где N = 60
Результаты вычислений вероятностей и соответствующих частот приведены в таблице 5.2.
Из полученных результатов проведенных вычислений следует, что сумма вероятностей в интервале [6,1775; 18,1775) почти равна единице, а сумма всех частот равна 59,61. Данные результаты объясняются тем, что мы вычисляем вероятности в интервале, где заданы экспериментальные данные.
Сравнение экспериментальных и теоретических частот по критерию Пирсона с целью проверки гипотезы о нормальном распределении возможно только в том случае, если для каждого частичного интервала выполняется условие . Представленные в таблице 5.2 результаты вычислений показывают, что это условие выполняется не всегда. Поэтому все те частичные интервалы, для которых частоты , объединяем с соседними. Соответственно объединяем и экспериментальные частоты .
Таблица 5.1
0,033 |
0,067 |
0,133 |
0,189 |
0,156 |
0,044 |
0,033 |
0,011 |
||
0,022 |
0,07 |
0,142 |
0,182 |
0,145 |
0,073 |
0,023 |
0,005 |
Рис. 1. График. Теоретическая и экспериментальная плотности вероятности.
Таблица 5.2
Результаты вычисления экспериментальных и теоретических вероятностей и частот
[xi-1; xi) |
||||||||||
[6,1775; 7,6775) |
3 |
6,9275 |
0,05 |
0,033 |
-2,064 |
0,022 |
0,033 |
1,98 |
2 |
|
[7,6775; 9,1775) |
6 |
8,4275 |
0,1 |
0,067 |
-1,38 |
0,07 |
0,105 |
6,3 |
6 |
|
[9,1775; 10,6775) |
12 |
9,9275 |
0,2 |
0,133 |
-0,7 |
0,142 |
0,213 |
12,78 |
13 |
|
[10,6775; 12,1775) |
17 |
11,4275 |
0,283 |
0,189 |
-0,016 |
0,182 |
0,273 |
16,38 |
16 |
|
[12,1775; 13,6775) |
14 |
12,9275 |
0,233 |
0,156 |
0,67 |
0,145 |
0,2175 |
13,05 |
13 |
|
[13,6775; 15,1775) |
4 |
14,4275 |
0,067 |
0,044 |
1,35 |
0,073 |
0,1095 |
6,57 |
7 |
|
[15,1775; 16,6775) |
3 |
15,9275 |
0,05 |
0,033 |
2,03 |
0,023 |
0,035 |
2,1 |
2 |
|
[16,6775; 18,1775) |
1 |
17,4275 |
0,016 |
0,011 |
2,71 |
0,005 |
0,0075 |
0,45 |
1 |
|
У |
0,999 |
0,9935 |
59,61 |
6. Проверка гипотезы о нормальном распределении случайной величины по критерию Пирсона
Для проверки гипотезы о нормальном распределении случайной величины Х сравнивают между собой экспериментальные и теоретические частоты по критерию Пирсона:
Статистика имеет распределение с V = k - r - 1 степенями свободы, где k - число интервалов эмпирического распределения, r - число параметров теоретического распределения, вычисленных по экспериментальным данным. Для нормального распределения число степеней свободы равно:
V=k -3
В теории математической статистики доказывается, что проверку гипотезы о модели закона распределения по критерию Пирсона можно делать только в том случае, если выполняются следующие неравенства:
N ? 50 ? 5 где i = 1,2,3…
Из результатов вычислений, приведенных в таблице 1.5.1, следует, что необходимое условие для применения критерия согласия Пирсона не выполнены, т.к. в некоторых группах < 5. Поэтому те группы вариационного ряда, для которых необходимое условие не выполняется, объединяют с соседними и, соответственно, уменьшают число групп, при этом частоты объединенных групп суммируются. Так объединяют все группы с частотами < 5 до тех пор, пока для каждой новой группы будет выполняться условие ? 5.
При уменьшении числа групп для теоретических частот соответственно уменьшают и число групп для эмпирических частот. После объединения групп в формуле для числа степеней свободы V=k-3 в качестве k принимают новое число групп, полученное после объединения частот.
Результаты объединения интервалов и теоретических частот для таблицы 5.2 приведены соответственно в таблице 6.1.
Результаты вычислений из таблицы 6.1 можно использовать для проверки гипотезы о нормальном распределении с помощью критерия Пирсона.
Процедура проверки гипотезы о нормальном распределении случайной величины Х выполняется в следующей последовательности:
Задаются уровнем значимости а =0,05 или одним из следующих значений: а1 = 0,01; а2 = 0,1; а3 = 0,005.
Вычисляют наблюдаемые значения критерия, используя экспериментальные и теоретические частоты из таблицы 6.1.
Для выборочного уровня значимости а = 0,05 по таблице распределения находят критические значения при числе степеней свободы V= k-3, где k - число групп эмпирического распределения.
Сравниваем фактически наблюдаемое с критическим , найденным по таблице, и принимаем решение:
если > , то выдвинутая гипотезы о теоретическом законе распределения отвергается при заданном уровне значимости.
Если < , то выдвинутая гипотеза о теоретическом законе распределения не противоречит выборке наблюдений при заданном уровне значимости, т.е. нет оснований отвергать гипотезу о нормальном распределении, т.к. эмпирические и теоретические частоты различаются незначительно (случайно).
Таблица 6.1
Результаты объединения интервалов и теоретических частот
[6,1775; 9,1775) |
0,138 |
8,28 |
9 |
0,5184 |
0,0626 |
|
[9,1775; 10,6775) |
0,213 |
12,78 |
12 |
0,6084 |
0,0476 |
|
[10,6775; 12,1775) |
0,273 |
16,38 |
17 |
0,3844 |
0,0235 |
|
[12,1775; 13,6775) |
0,2175 |
13,05 |
14 |
0,9025 |
0,0692 |
|
[13,6775; 18,1775) |
0,152 |
9,12 |
8 |
1,2544 |
0,1375 |
|
У |
0,9935 |
59,61 |
60 |
0,3404 |
При выбранном уровне значимости а = 0,05 и числе групп k = 5, число степеней свободы V = 2.
По таблице для а = 0,05 и V = 2 находим = 5,99147.
В результате получаем:
Для = 0,3404, найденного по результатам вычислений приведенных в таблице 6.1, имеем:
= 0,3404< = 5,99147
Из этого следует, что нет оснований отвергать гипотезу о нормальном распределении случайной величины Х.
Заключение
Статистические методы (методы, основанные на использовании математической статистики), являются эффективным инструментом сбора и анализа информации о качестве. Применение этих методов, не требует больших затрат и позволяет с заданной степенью точности и достоверностью судить о состоянии исследуемых явлений (объектов, процессов) в системе качества, прогнозировать и регулировать проблемы на всех этапах жизненного цикла продукции и на основе этого вырабатывать оптимальные управленческие решения.
Статистические методы контроля производства и качества продукции имеют ряд преимуществ перед другими методами:
- являются профилактическими;
- позволяют во многих случаях обоснованно перейти к выборочному контролю и тем самым снизить трудоемкость контрольных операций;
- создают условия для наглядного изображения динамики изменения качества продукции и настроенности процесса производства, что позволяет своевременно принимать меры к предупреждению брака не только контролерам, но и работникам цеха - рабочим, бригадирам, технологам, наладчикам, мастерам.
Список использованной литературы
1) Статистическая обработка результатов выборочного контроля: Метод.рек./Сост.: Ю. Г. Сильвестров: СибГИУ.- Новокузнецк, 2010 -41 с.
2) Статистическое управление процессами при помощи контрольных карт: Метод.рек. /Сост.: Ю. Г. Сильвестров: ГОУ ВПО «СибГИУ». - Новокузнецк, 2014 - 17 с.
3) ГОСТ Р 50779.42-99. Статистические методы. Контрольные карты Шухарта [Текст]. - : Издательство стандартов, 2007. - 36 с.
Размещено на Allbest.ru
Подобные документы
Проведение статистической обработки данных по заданной выборке. Вычисление основных выборочных характеристик. Результаты вычисления интервальных оценок для математического ожидания и дисперсии. Статистический анализ оборачиваемости денежной массы.
курсовая работа [2,4 M], добавлен 22.12.2010Статистическая обработка результатов и вычисление числовых характеристик выборочных наблюдений. Параметрическая оценка функции плотности распределения. Расчет аналитических показателей ряда динамики. Статистический анализ оборачиваемости денежной массы.
курсовая работа [479,7 K], добавлен 16.01.2013Расчет числовых характеристик и обработка результатов выборочных наблюдений. Исчисление и анализ статистических показателей в экономике. Национальное богатство: элементы, оценка; баланс активов и пассивов; основные фонды, показатели оборотных средств.
курсовая работа [1,8 M], добавлен 25.12.2012Первичный анализ экспериментальных данных. Построение эмпирической плотности распределения случайной анализируемой величины и расчет ее характеристик. Определение вида закона распределения величины и расчёт его параметров при помощи метода моментов.
курсовая работа [1,2 M], добавлен 23.05.2009Краткая характеристика Республики Калмыкия. Расчет основных характеристик вариационного ряда, моды, медианы, квартилей, децилей, перцентилей и статистических совокупностей. Распределение выборочных моментов и корреляционно-регрессионный анализ данных.
курсовая работа [580,4 K], добавлен 15.03.2011Применение математического планирования эксперимента в научных исследованиях. Начальные навыки работы с совокупностью случайных величин. Расчёт математического ожидания, дисперсии и среднеквадратического отклонения. Результаты дисперсионного анализа.
курсовая работа [1,7 M], добавлен 26.11.2013Ранжирование исходных данных по размеру основных фондов и их группировка с равновеликими интервалами, расчет равновеликого интервала. Вычисление среднего процента, дисперсии и среднего квадратического отклонения выборочной доли, коэффициента вариации.
контрольная работа [241,8 K], добавлен 15.11.2010Интервальный ряд распределения банков по объему прибыли. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик интервального ряда распределения. Вычисление средней арифметической.
контрольная работа [150,6 K], добавлен 15.12.2010Понятие о выборочном наблюдении, его преимущества. Ошибки выборки и основные способы отбора. Распространение выборочных данных на генеральную совокупность. Определение необходимой численности выборки. Оценка существенности расхождения выборочных средних.
контрольная работа [95,1 K], добавлен 22.12.2010Прибыль и рентабельность как показатели, характеризующие результаты деятельности кредитных организаций. Построение статистического ряда распределения организаций, расчёт моды, медианы, дисперсии, коэффициента вариации, тесноты корреляционной связи.
курсовая работа [599,0 K], добавлен 06.12.2013