Статистический анализ числовых величин (непараметрическая статистика)
Распределение результатов наблюдений. Неустойчивость параметрических методов отбраковки резко выделяющихся результатов наблюдений. Однородность двух независимых выборок. Критерий Крамера-Уэлча равенства математических ожиданий. Критерий Вилкоксона.
Рубрика | Экономика и экономическая теория |
Вид | реферат |
Язык | русский |
Дата добавления | 19.01.2009 |
Размер файла | 192,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Статистика S двухвыборочного критерия Вилкоксона определяется следующим образом. Все элементы объединенной выборки X1, X2, ..., Xm, Y1, Y2, ..., Yn упорядочиваются в порядке возрастания. Элементы первой выборки X1, X2, ..., Xm занимают в общем вариационном ряду места с номерами R1, R2, ..., Rm, другими словами, имеют ранги R1, R2, ..., Rm . Тогда статистика Вилкоксона - это сумма рангов элементов первой выборки
S = R1 + R2 + ... + Rm .
Статистика U Манна-Уитни определяется как число пар (Xi, Yj) таких, что Xi < Yj , среди всех mn пар, в которых первый элемент - из первой выборки, а второй - из второй. Как известно [13, с.160],
U = mn + m(m+1)/2 - S .
Поскольку S и U линейно связаны, то часто говорят не о двух критериях - Вилкоксона и Манна-Уитни, а об одном - критерии Вилкоксона (Манна-Уитни).
Критерий Вилкоксона - один из самых известных инструментов непараметрической статистики (наряду со статистиками типа Колмогорова-Смирнова и коэффициентами ранговой корреляции). Свойствам этого критерия и таблицам его критических значений уделяется место во многих монографиях по математической и прикладной статистике (см., например, [8, 9, 13]).
Однако в литературе имеются и неточные утверждения относительно возможностей критерия Вилкоксона. Так, одни полагают, что с его помощью можно обнаружить любое различие между функциями распределения F(x) и G(x). По мнению других, этот критерий нацелен на проверку равенства медиан распределений, соответствующих выборкам. И то, и другое, строго говоря, неверно. Это будет ясно из дальнейшего изложения.
Введем некоторые обозначения. Пусть F-1(t) - функция, обратная к функции распределения F(x). Она определена на отрезке [0;1]. Положим L(t) = G(F-1(t)). Поскольку F(x) непрерывна и строго возрастает, то F-1(t) и L(t) обладают теми же свойствами. Важную роль в дальнейшем изложении будет играть величина a = P(X< Y) . Как нетрудно показать,
Введем также параметры
Тогда математические ожидания и дисперсии статистик Вилкоксона и Манна-Уитни согласно [13, с.160] выражаются через введенные величины:
М(U) = mna , М(S) = mn + m(m+1)/2 - М(U) = mn(1- a) + m(m+1)/2,
D(S) = D(U) = mn [ (n - 1) b2 + (m - 1) g2 + a(1 -a) ] . (1)
Когда объемы обеих выборок безгранично растут, распределения статистик Вилкоксона и Манна-Уитни являются асимптотически нормальными (см., например, [13, гл.5 и 6]) с параметрами, задаваемыми формулами (1) .
Если выборки полностью однородны, т.е. их функции распределения совпадают, справедлива гипотеза
H0: F(x) = G(x) при всех x, (2)
то L(t) = t и a= 1/2. Подставляя в формулы (1), получаем, что
М(S) = m(m+n+1)/2, D(S) = mn(m+n+1)/ 12 (3) .
Следовательно, распределение нормированной и центрированной статистики Вилкоксона
T = ( S - m(m+n+1)/2) (mn(m+n+1)/ 12 ) - 1/2 (4)
при росте объемов выборок приближается к стандартному нормальному распределению (с математическим ожиданием 0 и дисперсией 1).
Из асимптотической нормальности статистики Т следует, что правило принятия решения для критерия Вилкоксона выглядит так:
если |T|<то гипотеза (2) однородности (тождества) функций распределений принимается на уровне значимости
если же |T|>то гипотеза (2) однородности (тождества) функций распределений отклоняется на уровне значимости .
В эконометрике наиболее часто применяется уровень значимости Тогда значение модуля статистики Т Вилкоксона надо сравнивать с граничным значением
Пример 1. Пусть даны две выборки. Первая содержит m= 12 элементов 17; 22; 3; 5; 15; 2; 0; 7; 13; 97; 66; 14. Вторая содержит n=14 элементов 47; 30; 2; 15; 1; 21; 25; 7; 44; 29; 33; 11; 6; 15. Проведем проверку однородности функций распределения двух выборок с помощью только что сформулированного правила принятия решений на основе критерия Вилкоксона.
Первым шагом является построение общего вариационного ряда для элементов двух выборок (табл.1).
Табл.1. Общий вариационный ряд для элементов двух выборок
Ранги |
1 |
2 |
3,5 |
3,5 |
5 |
6 |
7 |
8,5 |
8,5 |
10 |
11 |
12 |
14 |
|
Элементы выборок |
0 |
1 |
2 |
2 |
3 |
5 |
6 |
7 |
7 |
11 |
13 |
14 |
15 |
|
Номера выборок |
1 |
2 |
1 |
2 |
1 |
1 |
2 |
1 |
2 |
2 |
1 |
1 |
1 |
|
Ранги |
14 |
14 |
16 |
17 |
18 |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
|
Элементы выборок |
15 |
15 |
17 |
21 |
22 |
25 |
29 |
30 |
33 |
44 |
47 |
66 |
97 |
|
Номера выборок |
2 |
2 |
1 |
2 |
1 |
2 |
2 |
2 |
2 |
2 |
2 |
1 |
1 |
Хотя с точки зрения теории математической статистики вероятность совпадения двух элементов выборок равна 0, в реальных выборках экономических данных совпадения встречаются. Так, в рассматриваемых выборках, как видно из табл.1, два раза повторяется величина 2, два раза - величина 7 и три раза - величина 15. В таких случаях говорят о наличии "связанных рангов", а соответствующим совпадающим величинам приписывают среднее арифметическое тех рангов которые они занимают. Так, величины 2 и 2 занимают в объединенной выборке места 3 и 4, поэтому им приписывается ранг (3+4)/2=3,5. Величины 7 и 7 занимают в объединенной выборке места 8 и 9, поэтому им приписывается ранг (8+9)/2=8,5. Величины 15, 15 и 15 занимают в объединенной выборке места 13, 14 и 15, поэтому им приписывается ранг (13+14+15)/3=14.
Следующий шаг - подсчет значения статистики Вилкоксона, т.е. суммы рангов элементов первой выборки
S = R1 + R2 + ... + Rm = 1+3,5+5+6+8,5+11+12+14+16+18+25+26=146.
Подсчитаем также сумму рангов элементов второй выборки
S1 = 2+3,5+7+8,5+10+14+14+17+19+20+21+22+23+24= 205.
Величина S1 может быть использована для контроля вычислений. Дело в том, что суммы рангов элементов первой выборки S и второй выборки S1 вместе составляют сумму рангов объединенной выборки, т.е. сумму всех натуральных чисел от 1 до m+n. Следовательно,
S+ S1 = (m+n)(m+n+1)/2= (12+14)(12+14+1)/2= 351.
В соответствии с ранее проведенными расчетами S+S1 = 146+205=351. Необходимое условие правильности расчетов выполнено. Ясно, что справедливость этого условия не гарантирует правильности расчетов.
Перейдем к расчету статистики Т. Согласно формуле (3)
М(S) = 12(12+14+1)/ 2 = 162, D(S) = 12.14(12+14+1)/ 12= 378 .
Следовательно,
T = ( S - 162) (378 ) - 1/2 = (146-162) / 19,44 = - 0.82.
Поскольку |T|<1,96, то гипотеза однородности принимается на уровне значимости0,05.
Что будет, если поменять выборки местами, вторую назвать первой? Тогда вместо S надо рассматривать S1 . Имеем
М(S1 ) = 14(12+14+1)/ 2 = 189, D(S) = D(S1 ) = 378 ,
T1 = ( S1 - 189) (378 ) - 1/2 = (205-162) / 19,44 = 0.82.
Таким образом, значения статистики критерия отличаются только знаком (можно показать, что это утверждение верно всегда). Поскольку в правиле принятия решения используется только абсолютная величина статистики, то принимаемое решение не зависит от того, какую выборку считаем первой, а какую второй. Для уменьшения объема таблиц принято считать первой выборку меньшего объема.
Продолжим обсуждение критерия Вилкоксона. Правила принятия решений и таблица критических значений для критерия Вилкоксона строятся в предположении справедливости гипотезы полной однородности, описываемой формулой (2). А что будет, если эта гипотеза неверна? Другими словами, какова мощность критерия Вилкоксона?
Пусть объемы выборок достаточно велики, так что можно пользоваться асимптотической нормальностью статистики Вилкоксона. Тогда в соответствии с формулами (1) статистика T будет асимптотически нормальна с параметрами
М(T) = ( 12mn ) 1/2 (1/2 - a) (m+n+1) - 1/2 ,
D(T) = 12 [(n - 1) b2 + (m - 1) g2 + a(1 -a) ] (m+n+1) - 1 . (5)
Из формул (5) видно большое значение гипотезы
H01: a = P(X < Y) = 1/2 . (6)
Если эта гипотеза неверна, то, поскольку m < n, справедлива оценка
|M(T)| > (12m n (2n+1) - 1) 1/2 |1/2 - a| ,
а потому |E(T)| безгранично растет при росте объемов выборок. В то же время, поскольку
то
D(T) < 12 [(n - 1) + (m - 1) + 1/4] (m+n+1) - 1 <12. (7)
Следовательно, вероятность отклонения гипотезы H01 , когда она неверна, т.е. мощность критерия Вилкоксона как критерия проверки гипотезы (6), стремится к 1 при возрастании объемов выборок, т.е. критерий Вилкоксона является состоятельным для этой гипотезы при альтернативе
АH01: a = P(X < Y) 1/2 . (8) .
Если же гипотеза (6) верна, то статистика T асимптотически нормальна с математическим ожиданием 0 и дисперсией, определяемой формулой
D(T) = 12 [(n - 1) b2 + (m - 1) g2 + 1/4 ] (m+n+1) -1 . (9)
Гипотеза (6) является сложной, дисперсия (9), как показывают приводимые ниже примеры, в зависимости от значений b2 и g2 может быть как больше 1, так и меньше 1, но согласно неравенству (7) никогда не превосходит 12.
Приведем пример двух функций распределения F(x) и G(x) таких, что гипотеза (6) выполнена, а гипотеза (2) - нет. Поскольку
a = P(X < Y) = , 1 - a = P(Y < X) = (10)
и a = 1/2 в случае справедливости гипотезы (2), то для выполнения условия (6) необходимо и достаточно, чтобы
(11) ,
а потому естественно в качестве F(x) рассмотреть функцию равномерного распределения на интервале (-1 ; 1). Тогда формула (11) переходит в условие
(11) .
Это условие выполняется, если функция (G(x) - (x + 1)/2 ) является нечетной.
Пример 2. Пусть функции распределения F(x) и G(x) сосредоточены на интервале (-1 ; 1), на котором
F(x) = (x + 1)/2 , G(x) = ( x + 1 + 1/ sin x ) / 2 .
Тогда
x=F-1(t)=2 -1, L(t)=G(F-1(t))=(2t+1/sin(2t-1))/2=t+1/2sin(2t-1) .
Условие (11) выполнено, поскольку функция (G(x) - (x + 1)/2) является нечетной. Следовательно, a = 1/2 . Начнем с вычисления
g2 = - 1/4 =
Поскольку
то
С помощью замены переменных t = (x +1) / 2 получаем, что
В правой части последнего равенства стоят табличные интегралы (см., например, справочник [14, с.71]. Проведя соответствующие вычисления, получаем, что в правой части стоит 1/8 ( - 4/ 2) = - 1/(2 2). Следовательно,
g2 = 1/12 - 1/(2 2) = 0,032672733...
Перейдем к вычислению b2. Поскольку
то
С помощью замены переменных t = (x+1)/2 переходим к табличным интегралам (см., например, справочник [14, с.65]):
Проведя необходимые вычисления, получим, что
Следовательно, для рассматриваемых функций распределения нормированная и центрированная статистика Вилкоксона (см. формулу (4)) асимптотически нормальна с математическим ожиданием 0 и дисперсией (см. формулу (9))
D(T) = ( 0,544 n + 0,392 m + 2,064 ) (m+n+1) - 1 .
Как легко видеть, дисперсия всегда меньше 1. Это значит, что в рассматриваемом случае гипотеза полной однородности (2) при проверке с помощью критерия Вилкоксона будет приниматься чаще, чем если она на самом деле верна.
На наш взгляд, это означает, что критерий Вилкоксона нельзя считать критерием для проверки гипотезы (2) при альтернативе общего вида. Он не всегда позволяет проверить однородность - не при всех альтернативах. Точно так же критерии типа хи-квадрат нельзя считать критериями проверки гипотез согласия и однородности - они позволяют обнаружить не все различия, поскольку некоторые из них "скрадывает" группировка.
Обсудим теперь, действительно ли критерий Вилкоксона нацелен на проверку равенства медиан распределений, соответствующих выборкам.
Пример 3. Построим семейство пар функций распределения F(x) и G(x) таких, что их медианы различны, но для F(x) и G(x) выполнена гипотеза (6). Пусть распределения сосредоточены на интервале (0 ; 1), и на нем G(x) = x , а F(x) имеет кусочно-линейный график с вершинами в точках (0 ; 0), (, 1/2 ), (, 3/4), (1 ; 1). Следовательно,
F(x) = 0 при x < 0 ;
F(x) = x / (2 ) на [0 ; ) ;
F(x) = 1/2 + (x - ) / (4 - 4 ) на [ ; ) ;
F(x) = 3/4 + (x - ) / (4 - 4 ) на [; 1] ;
F(x) = 1 при x > 1.
Очевидно, что медиана F(x) равна , а медиана G(x) равна 1/2 .
Согласно соотношению (9) для выполнения гипотезы (6) достаточно определить как функцию , = () , из условия
Вычисления дают
= () = 3 (1 - )/2 .
Учитывая, что лежит между и 1, не совпадая ни с тем, ни с другим, получаем ограничения на , а именно, 1/3 < < 3/5 . Итак, построено искомое семейство пар функций распределения.
Пример 4. Пусть, как и в примере 3, распределения сосредоточены на интервале (0; 1), и на нем F(x)=x, а G(x) - функция распределения, сосредоточенного в двух точках - и 1, т.е. G(x) = 0 при x, не превосходящем ; G(x) = h на ( ; 1] ; G(x) = 1 при x > 1. С такой функцией G(x) легко проводить расчеты. Однако она не удовлетворяет принятым выше условиям непрерывности и строгого возрастания. Вместе с тем легко видеть, что она является предельной (сходимость в каждой точке отрезка [0 ; 1] ) для последовательности функций распределения, удовлетворяющих этим условиям, а распределение статистики Вилкоксона для пары функций распределения примера 4 является предельным для последовательности соответствующих распределений статистики Вилкоксона, полученных в рассматриваемых условиях непрерывности и строгого возрастания.
Условие P(X < Y) = 1/2 выполнено, если h = (1 -)-1 / 2 (при из отрезка [0 ; 1/2] ). Поскольку h > 1/2 при положительном , то очевидно, что медиана G(x) равна , в то время как медиана F(x) равна 1/2 . Значит, при = 1/2 медианы совпадают, при всех иных положительных - различны. При = 0 медианой G(x) является любая точка из отрезка [0 ; 1].
Легко подсчитать, что в условиях примера 4 параметры предельного распределения имеют вид
b2 = (1- )-1 / 4 , g2 = (1- 2) / 4 .
Следовательно, распределение нормированной и центрированной статистики Вилкоксона будет асимптотически нормальным с математическим ожиданием 0 и дисперсией
D(T) = 3 [(n-1) (1- )-1 + (m-1) (1-2) + 1] (m+n+1) - 1 .
Проанализируем величину D(T) в зависимости от параметра и объемов выборок m и n. При достаточно больших m и n
D(T) = 3 w (1 - )-1 + 3 (1 - w) (1 - 2 ) ,
с точностью до величин порядка (m+n)-1 , где w= n/(m+n). Значит, D(T) - линейная функция от w, а потому достигает экстремальных значений на границах интервала изменения w, т.е. при w = 0 и w = 1. Легко видеть, что при (1-)-1 <1-2 минимум равен 3(1-)-1 (при w = 1), а максимум равен 3(1 - 2) (при w = 0). В случае (1-)-1 >1-2 максимум равен 3(1-)-1 (при w = 1), а минимум равен 3(1 - 2) (при w = 0). Если же (1-)-1 =1-2 (это равенство справедливо при =0 = 1 - 2-1/2 = 0,293), то D(T)=3 (21/2-1)=1,2426... при всех w из отрезка [0; 1].
Первый из описанных выше случаев имеет быть при < 0 , при этом минимум D(T) возрастает от 0 (при =0, w=1 - предельный случай) до 3(21/2 - 1) (при =0 , w - любом), а максимум уменьшается от 3 (при =0, w=0 - предельный случай) до 3 (21/2 - 1) (при =0 , w - любом). Второй случай относится к из интервала (0 ; 1/2]. При этом минимум убывает от приведенного выше значения для =0 до 0 (при =1/2 , w=0 - предельный случай) , а максимум возрастает от того же значения при =0 до 3 (при =1/2 , w=0).
Таким образом, D(T) может принимать все значения из интервала (0 ; 3) в зависимости от значений и w. Если D(T) < 1, то при применении критерия Вилкоксона к выборкам с рассматриваемыми функциями распределения гипотеза однородности (2) будет приниматься чаще (при соответствующих значениях и w - с вероятностью, сколь угодно близкой к 1), чем если бы она самом деле была верна. Если 1<D(T)<3, то гипотеза (2) также принимается достаточно часто. Так, если уровень значимости критерия Вилкоксона равен 0,05, то (асимптотическая) критическая область этого критерия, как показано выше, имеет вид {T: |T| > 1,96}. Если - самый плохой случай - D(T)=3, то гипотеза (2) принимается с вероятностью 0,7422.
Гипотеза сдвига. При проверке гипотезы однородности мы рассмотрели различные виды нулевых и альтернативных гипотез - гипотезу (2) и ее отрицание в качестве альтернативы, гипотезу (6) и ее отрицание, гипотезы о равенстве или различии медиан. В теоретических работах по математической статистике часто рассматривают гипотезу сдвига, в которой альтернативой гипотезе (2) является гипотеза
H1: F(x) = G(x + r) (12)
при всех x и некотором сдвиге r, отличным от 0. Если верна альтернативная гипотеза H1, то вероятность P(X < Y) отлична от 1/2, а потому при альтернативе (12) критерий Вилкоксона является состоятельным.
В некоторых прикладных постановках гипотеза (12) представляется естественной. Например, если одним и тем же прибором проводятся две серии измерений двух значений некоторой величины (физической, химической и т.п.). При этом функция распределения G(x) описывает погрешности измерения одного значения, а G(x+r) - другого. Вопреки распространенному заблуждению, хорошо известно, что распределение погрешностей измерений, как правило, не является нормальным - см. об этом начало главы. Однако при анализе конкретных экономических данных как правило, нет никаких оснований считать, что отсутствие однородности всегда выражается столь однозначным образом, как следует из формулы (12). Поэтому эконометрику для проверки однородности необходимо использовать статистические критерии, состоятельные против любого отклонения от гипотезы однородности (2).
Почему же математики так любят гипотезу сдвига (12)? Да потому, что она дает возможность доказывать глубокие математические результаты, например, об асимптотической оптимальности критериев. К сожалению, с точки зрения эконометрики это напоминает поиск ключей под фонарем, где светло, а не там, где они потеряны.
Отметим еще одно обстоятельство. Часто говорят (в соответствии с классическим подходом математической статистики), что нельзя проверять нулевые гипотезы без рассмотрения альтернативных. Однако при эконометрическом анализе данных зачастую полностью ясна формулировка той гипотезы, которую желательно проверить (например, гипотезы полной однородности - см. формулу (2)), в то время как формулировка альтернативной гипотезы не очевидна (то ли это гипотеза о неверности равенства (2) хотя бы для одного значения x, то ли это альтернатива (8), то ли - альтернатива сдвига (12), и т.д.). В таких случаях целесообразно "обернуть" задачу - исходя из статистического критерия найти альтернативы, относительно которых он состоятелен. Именно это и проделано в настоящей пункте для критерия Вилкоксона.
Подведем итоги рассмотрения критерия Вилкоксона.
1. Критерий Вилкоксона (Манна-Уитни) является одним из самых распространенных непараметрических ранговых критериев, используемых для проверки однородности двух выборок. Его значение не меняется при любом монотонном преобразовании шкалы измерения (т.е. он пригоден для эконометрического анализа данных, измеренных в порядковой шкале).
2. Распределение статистики критерия Вилкоксона определяется функциями распределения F(x) и G(x) и объемами m и n двух выборок. При больших объемах выборок распределение статистики Вилкоксона является асимптотически нормальным с параметрами, выписанными выше ( см. формулы (1), (3) и (5)).
3. При альтернативной гипотезе, когда функции распределения выборок F(x) и G(x) не совпадают, распределение статистики Вилкоксона зависит от величины a = P(X < Y). Если a отличается от 1/2, то мощность критерия Вилкоксона стремится к 1, и отличает нулевую гипотезу F = G от альтернативной. Если же a = 1/2, то это не всегда имеет место. В примере 2 приведены две различные функции распределения выборок F(x) и G(x) такие, что гипотеза однородности F = G при проверке с помощью критерия Вилкоксона будет приниматься чаще, чем если она на самом деле верна.
4. Следовательно, в случае общей альтернативы критерий Вилкоксона не является состоятельным, т.е. не всегда позволяет обнаружить различие функций распределения. Однако это не лишает его практической ценности, точно так же, как несостоятельность критериев типа хи-квадрат при проверке согласия, независимости или однородности не мешает отклонять нулевую гипотезу во многих практически важных случаях. Однако принятие нулевой гипотезы с помощью критерия Вилкоксона может означать не совпадение F и G, а лишь выполнение равенства a = 1/2.
5. Иногда утверждают, что с помощью критерия Вилкоксона можно проверять равенство медиан функций распределения F и G. Это не так. В примерах 3 и 4 указаны F и G с a = 1/2, но с различными медианами. Во многих случаях это различие нельзя обнаружить с помощью критерия Вилкоксона, как это показано при численном анализе асимптотической дисперсии в примере 4.
6. Указанные выше недостатки критерия Вилкоксона исчезают для специального вида альтернативы - т.н. "альтернативы сдвига" H1: F(x) = G(x + r). В этом частном случае при справедливости альтернативной гипотезы мощность стремится к 1, различие медиан также всегда обнаруживается. Однако альтернатива сдвига не всегда естественна. Ее целесообразно принять, если одним и тем же прибором проводятся две серии измерений двух значений некоторой величины (физической, химической и т.п.). При этом функция распределения G(x) описывает результаты измерений с погрешностями одного значения, а F(x) = G(x+r) - другого. Другими словами, меняется лишь измеряемое значение, а собственно распределение погрешностей - одно и то же, присущее используемому средству измерения (и обычно описанное в его техническом паспорте). Однако в большинстве эконометрических исследований нет никаких оснований считать, что при альтернативе функция распределения второй выборки лишь сдвигается, но не меняется каким-либо иным образом.
7. При всех своих недостатках критерий Вилкоксона прост в применении и часто позволяет обнаруживать различие групп (поскольку оно часто сводится к отличию a = P(X < Y) от 1/2 ). Приведенные здесь критические замечания не следует понимать как призыв к полному отказу от использования критерия Вилкоксона. Однако для проверки гипотезы однородности в случае альтернативы общего вида можно порекомендовать состоятельные критерии, в частности, рассматриваемые в следующем пункте критерии Смирнова и типа омега-квадрат (Лемана-Розенблатта).
8. В литературе по прикладным статистическим методам соседствуют два стиля изложения. Один из них исходит из формулировок нулевой и альтернативных гипотез (или описания набора гипотез, из которого надо выбрать наиболее адекватную), для проверки которых строятся те или иные критерии. При другом стиле изложения упор делается на алгоритмическое описание критериев для проверки тех или иных гипотез, а об альтернативах даже не упоминается.
Например, в литературе по математической статистике часто говорится, что для проверки нормальности используются критерии асимметрии и эксцесса (они описаны, например, в лучшем справочнике 1960-1980-х годов [8, табл. 4.7]). Однако эти критерии позволяют проверять некоторые соотношения между моментами распределения, но отнюдь не являются состоятельными критериями нормальности (не все отклонения от нормальности обнаруживают). Впрочем, для эконометрики эти критерии практического значения не имеют, поскольку заранее известно, что распределения конкретных экономических данных отличны от нормальных.
Так что недостатки критерия Вилкоксона не является исключением, мощность ряда иных популярных в математической статистике критериев заслуживает тщательного изучения, при этом заранее можно сказать, что зачастую они не позволяют проверять те гипотезы, с которыми традиционно связаны. При применении подобных критериев к анализу реальных данных необходимо тщательно взвешивать их достоинства и недостатки.
Состоятельные критерии проверки однородности для независимых выборок
В соответствии с эконометрической теорией естественно потребовать, чтобы рекомендуемый для массового использования в экономических и технико-экономических исследованиях критерий однородности был состоятельным. Напомним: это значит, что для любых отличных друг от друга функций распределения F(x) и G(x) (другими словами, при справедливости альтернативной гипотезы H1) вероятность отклонения гипотезы H0 должна стремиться к 1 при увеличении объемов выборок т и п. Из перечисленных выше в конце п.4 критериев состоятельными являются только критерии Смирнова и типа омега-квадрат.
Проведенное исследование мощности (методом статистических испытаний) первых четырех из перечисленных выше критериев (при различных вариантах функций распределения F(x) и G(x)) подтвердило преимущество критериев Смирнова и омега-квадрат и при объемах выборок 6-12.
Критерий Смирнова однородности двух выборок. Он предложен членом-корреспондентом АН СССР Н.В. Смирновым в 1939 г. (см. справочник [8]). Единственное ограничение - функции распределения F(x) и G(x) должны быть непрерывными. Напомним, что согласно Л.Н. Большеву и Н.В. Смирнову [8] значение эмпирической функции распределения в точке х равно доле результатов наблюдений в выборке, меньших х. Критерий Смирнова основан на использовании эмпирических функций распределения Fm(x) и Gn(x), построенных по первой и второй выборкам соответственно. Значение статистики Смирнова
сравнивают с соответствующим критическим значением (см., например, [8]) и по результатам сравнения принимают или отклоняют гипотезу Н0 о совпадении (однородности) функций распределения. Практически значение статистики Dm,п рекомендуется согласно монографии [8] вычислять по формулам
,
,
,
где x'1<x'2<…<x'm - элементы первой выборки x1,x2,…,xm , переставленные в порядке возрастания, а y'1<y'2<…<y'n - элементы второй выборки y1,y2,…,yn , также переставленные в порядке возрастания.
Разработаны алгоритмы и программы для ЭВМ, позволяющие рассчитывать точные распределения, процентные точки и достигаемый уровень значимости для двухвыборочной статистики Смирнова , разработаны подробные таблицы (см., например, методику [15], содержащую тексты программ и подробные таблицы).
Однако у критерия Смирнова есть и недостатки. Его распределение сосредоточено в сравнительно небольшом числе точек, поэтому функция распределения растет большими скачками. В результате не удается выдержать заданный уровень значимости, реальный уровень значимости может в несколько раз отличаться от номинального (подробному обсуждению неклассического феномена существенного отличия реального уровня значимости от номинального посвящена работа [16]).
Критерий типа омега-квадрат (Лемана-Розенблатта). Статистика критерия типа омега-квадрат для проверки однородности двух независимых выборок имеет вид:
A = Fm(x) - Gn(x))2 dHm+n(x) ,
где Hm+n(x) - эмпирическая функция распределения, построенная по объединенной выборке,
Hm+n(x) = Fm(x) + Gn(x) .
Статистика A типа омега-квадрат была предложена Э. Леманом в 1951 г., изучена М. Розенблаттом в 1952 г., а затем и другими исследователями. Она зависит лишь от рангов элементов двух выборок в объединенной выборке. Пусть - первая выборка, - соответствующий вариационный ряд, -вторая выборка, - вариационный ряд, соответствующий второй выборке. Поскольку функции распределения независимых выборок непрерывны, то с вероятностью 1 все выборочные значения различны, совпадения отсутствуют. Статистика А представляется в виде (см., например, [8]):
где ri - ранг x'i и sj - ранг y'j в общем вариационном ряду, построенном по объединенной выборке.
Правила принятия решений при проверке однородности двух выборок на основе статистик Смирнова и типа омега-квадрат, т.е. таблицы критических значений в зависимости от уровней значимости и объемов значимости приведены, например, в таблицах [8].
Рекомендации по выбору критерия однородности. Для критерия типа омега-квадрат нет выраженного эффекта различия между номинальными и реальными уровнями значимости. Поэтому мы рекомендуем для проверки однородности функций распределения (гипотеза H0) применять статистику А типа омега-квадрат. Если методическое, табличное или программное обеспечение для статистики Лемана-Розенблатта отсутствует, рекомендуем использовать критерий Смирнова. Для проверки однородности математических ожиданий (гипотеза H'0) целесообразно применять критерий Крамера-Уэлча. По нашему мнению, статистики Стьюдента, Вилкоксона и др. допустимо использовать лишь в отдельных частных случаях, рассмотренных выше.
Некоторые соображения о внедрении современных методов прикладной статистики в практику технических и технико-экономических исследований. Даже из проведенного выше разбора лишь одной из типичных статистических задач - задачи проверки однородности двух выборок - можно сделать вывод о целесообразности широкого развертывания в организациях различных форм собственности работ по критическому анализу сложившейся в технических и технико-экономических исследованиях практики статистической обработки данных и по внедрению накопленного арсенала современных методов прикладной статистики. По нашему мнению, широкого внедрения заслуживают, в частности, методы многомерного статистического анализа, планирования эксперимента, статистики объектов нечисловой природы. Очевидно, рассматриваемые работы должны быть плановыми, организационно оформленными, проводиться мощными самостоятельными организациями и подразделениями. Целесообразно создание службы статистических консультаций в системе научно-исследовательских учреждений и вузов технического и технико-экономического профиля.
Методы проверки однородности для связанных выборок
Начнем с практического примера. Приведем письмо главного инженера подмосковного химического комбината (некоторые названия изменены).
"Директору Института высоких статистических технологий и эконометрики (Фамилия, имя, отчество)
Наш комбинат выпускает мастику по ГОСТ (следует номер) и является разработчиком указанного стандарта.
В результате исследовательских работ по подбору стандартного метода определения вязкости мастики на комбинате накоплен большой опыт сравнительных данных определения вязкости по двум методам:
- неразбавленной мастики - на нестандартном приборе фабрики им. Петрова;
- раствора мастики - на стандартном вискозиметре ВЗ-4.
Учитывая высокую компетентность сотрудников Вашего института, прошу Вас, в порядке оказания технической помощи нашему предприятию, поручить соответствующей лаборатории провести обработку представленной статистики современными эконометрическими методами и выдать заключение о наличии (или отсутствии) зависимости между указанными выше методами определения вязкости мастики. Ваш5е заключение необходимо для решения спорного вопроса о целесообразности вновь ввести в ГОСТ (следует номер) метода определения вязкости мастики по вискозиметру ВЗ-4, который, по мнению некоторых потребителей, был необоснованно исключен из этого ГОСТ по изменению № 1.
Заранее благодарю Вас за оказанную помощь.
Приложение: статистика на 3 листах.
Главный инженер (Подпись) (Фамилия, имя, отчество)"
Комментарий. Вязкость мастики - один из показателей качества мастики. Измерять этот показатель можно по-разному. И, как оказалось, разные способы измерения дают разные результаты. Ничего необычного в этом нет. Однако поставщику и потребителю следует согласовать способы измерения показателей качества. Иначе достаточно часто поставщик (производитель) будет утверждать, что он выполнил условия контракта, а потребитель заявлять, что нет. Такая конфликтная ситуация иногда называется арбитражной, поскольку для ее решения стороны могут обращаться в арбитражный суд. Простейший метод согласования способов измерения показателей состоит в том, чтобы выбрать один из них и внести в государственный стандарт, который тем самым будет содержать не только описание продукции, перечень ее показателей качества и требований к ним, но и способы измерения этих показателей.
Заключение по статистическим данным, представленным химическим комбинатом. Для каждой из 213 партий мастики представлены два числа - результат измерения вязкости на нестандартном приборе фабрики им. Петрова и результат измерения вязкости на стандартном вискозиметре ВЗ-4. Требуется установить, дают ли два указанных метода сходные результаты. Если они дают сходные результаты, то нет необходимости вводить в соответствующий ГОСТ указание о методе определения вязкости. Если же методы дают существенно различные результаты, то подобное указание ввести необходимо.
Для применения эконометрических методов в рассматриваемой задаче необходимо описать вероятностную модель. Считаем, что статистические данные имеют вид где xi -результат измерения на нестандартном приборе фабрики им. Петрова в i-ой партии, а yi - результат измерения вязкости на стандартном вискозиметре ВЗ-4 в той же i-ой партии. Пусть ai - истинное значение показателя качества в i-ой партии. Естественно считать, что указанные выше случайные вектора независимы в совокупности. При этом они не являются одинаково распределенными, поскольку отличаются истинными значениями показателей качества ai. Принимаем, что при каждом i случайные величины xi - ai и yi - ai независимы и одинаково распределены. Это условие и означает однородность в связанных выборках. Параметры связи - величины ai . Их наличие не позволяет объединить первые координаты в одну выборку, вторую - во вторую, как делалось в случае проверки однородности двух независимых выборок.
В предположении непрерывности функций распределения из условия однородности в связанных выборках вытекает, что
Рассмотрим случайные величины Из последнего соотношения вытекает, что при справедливости гипотезы однородности для связанных выборок эти случайные величины имеют нулевые медианы. Другими словами, проверка того, что метода измерения вязкости дают схожие результаты, эквивалентна проверке равенства 0 медиан величин Zi.
Для проверки гипотезы о том, что медианы величин Zi нулевые, применим широко известный критерий знаков (см., например, справочник [8, с.89-91]). Согласно этому критерию необходимо подсчитать, в скольких партиях и в скольких . Для представленных химическим комбинатом данных в 187 случаях из 213 и в 26 случаях из 213.
Если рассматриваемая гипотеза верна, то число W осуществлений события имеет биномиальное распределение с параметрами p = 1/2 и n = 213. Математическое ожидание М(W)=106,5, а среднее квадратическое отклонение Следовательно, интервал - это интервал 84<W<129. Найденное по данным химического комбината значение W=187 лежит далеко вне этого интервала. Поэтому рассматриваемую гипотезу необходимо отвергнуть (на любом используемом в прикладных работах уровне значимости, в частности, на уровне значимости 1%).
Таким образом, статистический анализ показывает, что два метода дают существенно различные результаты - по прибору фабрики им. Петрова результаты измерений, как правило, меньше, чем по вискозиметру ВЗ-4. Это означает, что в соответствующий ГОСТ целесообразно ввести указание на метод определения вязкости.
Система вероятностных моделей при проверке гипотезы однородности для связанных выборок. Как и в случае проверки однородности для независимых выборок, система вероятностных моделей состоит из трех уровней. Наиболее простая модель - на уровне однородности альтернативного признака - уже рассмотрена. Она сводится к проверке гипотезы для биномиального распределения:
Речь идет о "критерии знаков". При справедливости гипотезы однородности число W осуществлений события имеет биномиальное распределение с вероятностью успеха p = 1/2 и числом испытаний n. Альтернативная гипотеза состоит в том, что вероятность успеха отличается от 1/2:
Гипотезу p = 1/2 можно проверять как непосредственно с помощью биномиального распределения (используя таблицы или программное обеспечение), так и опираясь на теорему Муавра-Лапласа. Согласно этой теореме
при всех х, где Ф(х) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Из теоремы Муавра-Лапласа вытекает правило принятия решений на уровне значимости 5%: если
то гипотезу однородности связанных выборок принимают, в противном случае отклоняют. Как обычно, при желании использовать другой уровень значимости применяют в качестве критического значения иной квантиль нормального распределения. Использование предельных теорем допустимо при достаточно больших объемах выборки. По поводу придания точного смысла термину "достаточно большой" продолжаются дискуссии. Обычно считается, что несколько десятков (два-три десятка) - это уже "достаточно много". Более правильно сказать, что ответ зависит от задачи, от ее сложности и практической значимости.
Второй уровень моделей проверки однородности связанных выборок - это уровень проверки однородности характеристик, прежде всего однородности математических ожиданий. Исходные данные - количественные результаты измерений (наблюдений, испытаний, анализов, опытов) двух признаков хj и уj , j = 1,2,…,n, а непосредственно анализируются их разности Zj = хj - уj , j = 1,2,…,n. Предполагается, что эти разности независимы в совокупности и одинаково распределены, однако функция распределения неизвестна эконометрику. Необходимо проверить непараметрическую гипотезу
Альтернативная гипотеза также является непараметрической и имеет вид:
Как и в случае проверки гипотезы согласованности для независимых выборок с помощью критерия Крамера-Уэлча, в рассматриваемой ситуации естественно использовать статистику
где
среднее арифметическое разностей, а
выборочное среднее квадратическое отклонение. Из центральной Предельной Теоремы теории вероятностей и теорем о наследовании сходимости, полученных в монографии [11], вытекает, что
при всех х, где Ф(х) - функция стандартного нормального распределения с математическим ожиданием 0 и дисперсией 1. Отсюда вытекает правило принятия решений на уровне значимости 5%: если
то гипотезу однородности математических ожиданий связанных выборок принимают, в противном случае отклоняют. Как обычно, при желании использовать другой уровень значимости применяют в качестве критического значения иной квантиль нормального распределения. Повторим, что использование предельных теорем допустимо при достаточно больших объемах выборки.
Третий уровень моделей проверки однородности связанных выборок - это уровень проверки однородности (совпадения) функций распределения. Необходимо проверить непараметрическую гипотезу наиболее всеохватного вида:
где
При этом предполагается, что все участвующие в вероятностной модели случайные величины независимы (в совокупности) между собой.
Отметим одно важное свойство функции распределения случайной величины Z. Если случайные величины х и у независимы и одинаково распределены, то для H(x)=P(Z<x) выполнено, как нетрудно видеть, соотношение
H(-x)=1-H(x).
Это соотношение означает симметрию функции распределения относительно 0. Плотность такой функции распределения является четной функцией, ее значения в точках х и (-х) совпадают.
Какого типа отклонения от гипотезы симметрии можно ожидать при альтернативных гипотезах?
Как и в случае проверки однородности независимых выборок, в зависимости от вида альтернативной гипотезы выделяют два подуровня моделей. Рассмотрим сначала альтернативу сдвига
В этом случае распределение Z при альтернативе отличается сдвигом от симметричного относительно 0. Для проверки гипотезы однородности может быть использован критерий знаковых рангов, разработанный Вилкоксоном (см., например, справочник [9, с.46-53]).
Он строится следующим образом. Пусть R(Zj) является рангом |Zj| в ранжировке от меньшего к большему абсолютных значений разностей |Z1|, |Z2|,…,|Zn|, j=1,2,…,n. Положим для j=1,2,…,n
Статистика критерия знаковых рангов имеет вид
Таким образом, нужно просуммировать ранги положительных разностей в вариационном ряду, построенном стандартным образом по абсолютным величинам всех разностей.
Для практического использования статистики критерия знаковых рангов Вилкоксона либо обращаются к соответствующим таблицам и программному обеспечению, либо применяют асимптотические соотношения. При выполнении нулевой гипотезы статистика
имеет асимптотическое (при ) стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1. Следовательно, правило принятия решений на уровне значимости 5%: имеет обычный вид если
то гипотезу однородности связанных выборок по критерию знаковых рангов Вилкоксона принимают, в противном случае отклоняют. Как обычно, при желании использовать другой уровень значимости применяют в качестве критического значения иной квантиль нормального распределения. Повторим еще раз, что использование предельных теорем допустимо при достаточно больших объемах выборки.
Альтернативная гипотеза общего вида записывается как
при некотором х0 . Таким образом, проверке подлежит гипотеза симметрии относительно 0, которую можно переписать в виде
H(x) + H(-x) -1 = 0 .
Для построенной по выборке Zj = хj - уj , j = 1,2,…,n, эмпирической функции распределения Hn(x) последнее соотношение выполнено лишь приближенно:
Как измерять отличие от 0? По тем же соображениям, что и в предыдущем пункте, целесообразно использовать статистику типа омега-квадрат. Соответствующий критерий был предложен в работе [17]. Он имеет вид
В работе [17] найдено предельное распределение этой статистики:
В табл.1 приведены критические значения статистики типа омега-квадрат для проверки симметрии распределения (и тем самым для проверки однородности связанных выборок), соответствующие наиболее распространенным значениям уровней значимости (расчеты проведены Г.В. Мартыновым).
Табл.1. Критические значения статистики для проверки симметрии распределения
Значение функции распределения |
Уровень значимости |
Критическое значение х статистики |
|
0,90 |
0,10 |
1,20 |
|
0,95 |
0,05 |
1,66 |
|
0,99 |
0,01 |
2,80 |
Как следует из табл.1, правило принятия решений при проверке однородности связанных выборок в наиболее общей постановке и при уровне значимости 5% формулируется так. Вычислить статистику . Если <1,66, то принять гипотезу однородности. В противном случае - отвергнуть.
Пример. Пусть величины Zj , j=1,2,…,20, таковы:
20, 18, (-2), 34, 25, (-17), 24, 42, 16, 26, 13, (-23), 35, 21, 19, 8, 27, 11, (-5), 7.
Соответствующий вариационный ряд имеет вид:
(-23)<(-17)<(-5)<(-2)<7<8<11<13<16<18<19<20<21<24<25<26<27<34<35<42.
Для расчета значения статистики построим табл.2 из 7 столбцов и 20 строк, не считая заголовков столбцов (сказуемого таблицы). В первом столбце указаны номера (ранги) членов вариационного ряда, во втором - сами эти члены, в третьем - значения эмпирической функции распределения при значениях аргумента, совпадающих с членами вариационного ряда. В следующем столбце приведены члены вариационного ряда с обратным знаком, а затем указываются соответствующие значения эмпирической функции распределения. Например, поскольку минимальное наблюдаемое значение равно (-23), то Hn(x)=0 при x<-23, а потому для членов вариационного ряда с 14-го по 20-й в пятом столбце стоит 0. В качестве другого примера рассмотрим минимальный член вариационного ряда, т.е. (-23). Меняя знак, получаем 23. Это число стоит между 13-м и 14-м членами вариационного ряда, 21<23<24. На этом интервале эмпирическая функция распределения совпадает со своим значением в левом конце, поэтому следует записать в пятом столбце значение 0,65. Остальные ячейки пятого столбца заполняются аналогично. На основе третьего и пятого столбцов элементарно заполняется шестой столбец, а затем и седьмой. Остается найти сумму значенийб стоящих в седьмом столбце. Подобная таблица удобна как для ручного счета, так и при использовании электронных таблиц типа Excel.
Табл.2. Расчет значения статистики для проверки симметрии распределения
j |
Z(j) |
Hn(Z(j)) |
-Z(j) |
Hn(-Z(j)) |
Hn(Z(j))+ Hn(-Z(j))-1 |
(Hn(Z(j))+ Hn(-Z(j))-1)2 |
|
1 |
-23 |
0,05 |
23 |
0,65 |
-0,30 |
0,09 |
|
2 |
-17 |
0,10 |
17 |
0,45 |
-0,45 |
0,2025 |
|
3 |
-5 |
0,15 |
5 |
0,20 |
-0,65 |
0,4225 |
|
4 |
-2 |
0,20 |
2 |
0,20 |
-0,60 |
0,36 |
|
5 |
7 |
0,25 |
-7 |
0,10 |
-0,65 |
0,4225 |
|
6 |
8 |
0,30 |
-8 |
0,10 |
-0,60 |
0,36 |
|
7 |
11 |
0.35 |
-11 |
0,10 |
-0,55 |
0,3025 |
|
8 |
13 |
0,40 |
-13 |
0,10 |
-0,50 |
0,25 |
|
9 |
16 |
0,45 |
-16 |
0,10 |
-0,45 |
0,2025 |
|
10 |
18 |
0,50 |
-18 |
0,05 |
-0,45 |
0,2025 |
|
11 |
19 |
0,55 |
-19 |
0,05 |
-0,40 |
0,16 |
|
12 |
20 |
0,60 |
-20 |
0,05 |
-0,35 |
0,1225 |
|
13 |
21 |
0,65 |
-21 |
0,05 |
-0,30 |
0,09 |
|
14 |
24 |
0,70 |
-24 |
0 |
-0,30 |
0,09 |
|
15 |
25 |
0,75 |
-25 |
0 |
-0,25 |
0,0625 |
|
16 |
26 |
0,80 |
-26 |
0 |
-0,20 |
0,04 |
|
17 |
27 |
0,85 |
-27 |
0 |
-0,15 |
0,0225 |
|
18 |
34 |
0,90 |
-34 |
0 |
-0,10 |
0,01 |
|
19 |
35 |
0,95 |
-35 |
0 |
-0,05 |
0,0025 |
|
20 |
42 |
1,00 |
-42 |
0 |
0 |
0 |
Результаты расчетов (суммирование значений по седьмому столбцу табл.2) показывают, что значение статистики =3,055. В соответствии с табл.1 это означает, что на любом используемом в прикладных эконометрических исследованиях уровнях значимости отклоняется гипотеза симметрии распределения относительно 0 (а потому и гипотеза однородности в связанных выборках).
В настоящей главе затронута лишь небольшая часть непараметрических методов анализа числовых эконометрических данных. Обратим вн6имание на непараметрические оценки плотности, которые используются для описания данных, проверки однородности, в задачах восстановления зависимостей и других областях эконометрики. Эконометрические оценки плотности в общем виде рассмотрены в главе 8.
Цитированная литература
1. Новицкий П.В., Зограф И.А. Оценка погрешностей результатов измерений. - Л.: Энергоатомиздат, 1985. - 248 с.
2. Новицкий П.В. Основы информационной теории измерительных устройств. -Л.: энергия, 1968. - 248 с.
3. Боровков А.А. Теория вероятностей. - М.: Наука, 1976. - 352 с.
4. Петров В.В. Суммы независимых случайных величин. - М.: Наука, 1972. - 416 с.
5. Золотарев В.М. Современная теория суммирования независимых случайных величин. - М.: Наука, 1986. - 416 с.
6. Егорова Л.А., Харитонов Ю.С., Соколовская Л.В.//Заводская лаборатория. - 1976. Т.42, №10. С. 1237.
7. Артемьев Б.Г., Голубов С.М. Справочное пособие для работников метрологических служб.- М.: Изд-во стандартов, 1982. - 280 с.
8. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. - М.: Наука, 1983. - 416 с.
9. Холлендер М., Вульф Д. Непараметрические методы статистики. - М.: Финансы и статистика, 1983. - 518 с.
10. Боровков А.А. Математическая статистика. - М.: Наука, 1984. - 472 с.
11. Орлов А.И. Устойчивость в социально-экономических моделях. - М.:Наука,1979. - 296 с.
12. Крамер Г. Математические методы статистики / Пер. с англ. / 2-е изд. - М.: Мир, 1975. - 648 с.
13. Гаек Я., Шидак 3. Теория ранговых критериев / Пер. с англ. - М.: Наука, 1971. - 376 с.
14. Смолянский М.Л. Таблицы неопределенных интегралов. - М.: ГИФМЛ, 1961. - 108 с.
15. Методика. Проверка однородности двух выборок параметров продукции при оценке ее технического уровня и качества. - М.: ВНИИ стандартизации, 1987. - 116 с.
16. Камень Ю.Э., Камень Я.Э., Орлов А.И. Реальные и номинальные уровни значимости в задачах проверки статистических гипотез / Заводская лаборатория. 1986. Т.52. № 12. С.55-57.
17. Орлов А.И. О проверке симметрии распределения. - Журнал «Теория вероятностей и ее применения». 1972. Т.17. No.2. С.372-377.
Подобные документы
Статистика в медицине как один из инструментов анализа экспериментальных данных и клинических наблюдений. Понятие количественных (числовых) данных. Выборки численных переменных. Виды критериев для независимых выборок, особенности их использования.
презентация [750,1 K], добавлен 16.10.2016Статистическая обработка результатов и вычисление числовых характеристик выборочных наблюдений. Параметрическая оценка функции плотности распределения. Расчет аналитических показателей ряда динамики. Статистический анализ оборачиваемости денежной массы.
курсовая работа [479,7 K], добавлен 16.01.2013Расчет числовых характеристик и обработка результатов выборочных наблюдений. Исчисление и анализ статистических показателей в экономике. Национальное богатство: элементы, оценка; баланс активов и пассивов; основные фонды, показатели оборотных средств.
курсовая работа [1,8 M], добавлен 25.12.2012Сущность и назначение U-критерия Манна-Уитни, история его открытия. Особенности применения этого показателя при статистической обработке результатов экспериментальных исследований. Ряд понятий математической статистики. Ограничения применимости критерия.
реферат [27,1 K], добавлен 01.02.2012Задачи и показатели статистики финансовых результатов. Экономико-статистический анализ финансовых результатов деятельности ООО "Завод ДВП". Динамика прибыли и рентабельности. Корреляционно-регрессионный анализ чистой прибыли и производительности труда.
курсовая работа [114,1 K], добавлен 14.11.2010Технические условия на дефектацию сопряжений тракторных деталей. Определение минимального объема наблюдений при проведении эксперементально-исследовательских значений случайных величин. Доверительные границы остаточного ресурса шестерни трактора.
курсовая работа [27,5 K], добавлен 16.12.2011Критерий Колмогорова-Смирнова как наиболее эффективный критерий проверки нормальности распределения. Построение диаграммы рассеяния. Значение коэффициента корреляции. Особенности связи последовательности в принятии решений и открытости, искренности.
контрольная работа [92,1 K], добавлен 01.03.2017Оценка некоторого набора условий и характеристик жизни человека. Критерии качества жизни. Уровень материальной обеспеченности, жилищные условия, экологическая ситуация. Статистическая информация по Кемеровской области. Образование и здравоохранение.
курсовая работа [909,1 K], добавлен 04.02.2014Понятие риска, его основные элементы и черты. Правила построения классификации рисков. Принятие решений в условиях неопределенности. Максимин (критерий Вальда). Минимакс (критерий Севиджа). Обобщенный максимин (критерий Гурвица).
курсовая работа [52,9 K], добавлен 03.03.2007Статистика выпуска продукции, объемов выполненных работ, реализации товаров и оказанных услуг предприятия. Экономико-статистический анализ основных и оборотных фондов объекта обследования. Оценка финансовых результатов и кадрового состава предприятия.
курсовая работа [907,0 K], добавлен 13.06.2013