Теоретические распределения данных

Зависимость функций плотности вероятности, кумулятивного и обратного кумулятивного распределений от их параметров. Представление примеров вычисления вероятностей и доверительных интервалов. Рассмотрено нормального, логнормального, бинарного распределения.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 28.07.2012
Размер файла 377,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

КУРСОВАЯ РАБОТА

по дисциплине:

«Эконометрическое моделирование»

Теоретические распределения данных

Введение

В данной курсовой работе раскрывается тема «Теоретическое распределение данных»: демонстрируется зависимость функций плотности вероятности, кумулятивного и обратного кумулятивного распределений от их параметров. Представлены примеры вычисления вероятностей и доверительных интервалов. Рассмотрены нормальное и логнормальное распределения, распределения Пуассона и бинарное распределение.

Целью работы является изучить различные распределения данных, а также ознакомиться с программой MATLAB.

вероятность распределение доверительный интервал

1. Теоретические распределения данных

Для численного и графического представления теоретических распределений данных в MATLAB имеются 3 типа файл-функций, включающих в свое имя аббревиатуры pdf, cdf или inv, расшифровка и перевод которых даны в следующей таблице:

Полное название >

Использованные в книге термины

pdf

probability density function

функция плотности вероятности

cdf

cumulative distribution function

функция кумулятивного распределения

inv

inverse cumulative distribution function

функция обратного кумулятивного распределения

Файл-функции с указанными аббревиатурами оперируют числовыми переменными среды MATLAB и потому эквивалентны в представлении как непрерывных, так и дискретных распределений. Для дискретных распределений файл-функции pdfs (Probability density functions) вычисляют вероятности значений случайной переменной, для непрерывных - плотность вероятности значений случайной переменной. Еще заметим, в Help MATLAB при повторных или безальтернативных ссылках на файл-функции pdf, cdf и inv чаще используется одно слово distribution, т.е. «распределение».

1.1 Непрерывные распределения

1.1.1 Общие положения

Если задана функция плотности вероятности f (x| а, b,…), где х - случайная переменная, принимающая непрерывный ряд значений, а, b,… - параметры распределения, то функция кумулятивного распределения

F (x|a, b,…)=

определяет вероятность того, что случайная переменная принимает значение, меньшее х.

Аналогично определяются вероятности того, что случайная переменная принимает значение, большее x, и значение, находящееся в интервале [x1, x2]. В краткой форме все три вероятности записывают так:

P (y<x) = F(x), P (y>x) = l-F(x), P(x1?y<x2) = F(x2) - F(x1).

Дифференцирование функции кумулятивного распределения приводит к функции плотности вероятности

f (x|a, b,…)=F (x|a, b,…).

Вероятность попадания случайной переменной в интервал [x1, x2] определяется интегралом от функции плотности вероятности:

Р(x1?у<x2) = x|a, b.) dx.

Нормировка плотности вероятности:

В Help MATLAB принята символическая форма записи функции обратного кумулятивного распределения

x = F-1(p|a, b,…), где p = F (x|a, b,…).

Обратное кумулятивное распределение используется для оценок такого значения xq случайной переменной, при котором функция кумулятивного распределения принимает значение, равное q, т.е.

F(xq,|a, b.)=(x|a, b,…) dx=q.

Из этого уравнения следует, что величина уровня q = P (x?xq) определяет вероятность того, что случайная переменная примет значение, меньшее или равное xq. Величина xq имеет называние «quantile». По-русски слово «квантиль» женского рода с ударением на втором слоге.

Для вычисления квантилей решают интегральное уравнение

xq=F-1(q|a, b,…).

Квантиль x0,5 называется медианой (median), квантили x0,25 и x0,75 - соответственно нижняя квартиль и верхняя квартиль (quartile). Например, медиана вычисляется решением интегрального уравнения

.

Наряду с квантилями используют процентили (percentiles)

xp=xq*100%.

Процентиль х50% также называется медианой, процентили х25% и х75% -соответственно нижняя и верхняя квартиль.

Модой хm случайной величины называют ее значение, при котором функция распределения достигает максимума. Вычисляют моду решением уравнения

.

Еще раз обратим внимание, слова «квантиль», «квартиль», «процентиль», «медиана», «мода» женского рода.

Среднее значение (центр) распределения случайной переменной:

µ=.

Дисперсия (мера рассеяния) случайной переменной определяется как среднее значение квадрата отклонения значений случайной переменной от ее среднего значения,

Dу.

Величину у = = называют стандартным отклонением. При интерпретации статистических результатов предпочтительнее обращаться именно к у, а не к у2, в связи с тем, что величина стандартного отклонения у имеет размерность исследуемой случайной переменной и потому легче воспринимается в качестве количественной характеристики.

Третий центральный момент

M3=

определяет величину

A=

коэффициента асимметрии распределения относительно его среднего. Для значений А<0 данные распределены в большей мере слева от среднего, для А>0 - справа. Для распределений, симметричных относительно среднего, например, нормального, А = 0.

Четвертый центральный момент

M4=

определяет величину

E=-3

коэффициента эксцесса (меру островершинности) распределения.

1.1.2 Нормальное (гауссово) распределение

Функция плотности вероятности

Базовая роль нормального распределения N (µ, у) в анализе статистических данных связана с тем, что если результаты наблюдений определяются большим числом факторов, влияние каждого из которых пренебрежимо мало, то такой массив данных хорошо аппроксимируется нормальным распределением с соответствующим образом подобранными величинами среднего и стандартного отклонения.

Нормальное распределение находит применение в анализе

результатов большинства физических измерений,

финансово-экономических данных и маркетинговых исследованиях,

данных, полученных в результате исследования технологических, социальных, экологических и других процессов.

Функция плотности вероятности нормального распределения

f (x|µ, у)=

со средним значением µ случайной переменной х и стандартным отклонением у представлена в MATLAB файл-функциями normpdf (x, mu, sigma) или pdf ('Normal', x, mu, sigma).

Построить графики плотностей нормальных распределений со средним значением

µ= 0 и стандартными отклонениями у= 1,2,3 (рис. 1.1).

x=-4:0.1:4;

mu=0; sigma=1;

while sigma<=3

f=normpdf (x, mu, sigma);

%f = pdf ('Normal', x, mu, sigma);

plot (x, f, 'k', 'LineWidth', 1.5)

hold on

sigma=sigma+1;

end

title ('Плотность нормального распределения,\mu=0, \sigma=var')

xlabel (' x ')

ylabel (' f ')

text (-0.25, 0.38, '\sigma_1=1');

text (-0.25, 0.18, '\sigma_2=2');

text (-0.25, 0.12, '\sigma_3=3');

Из рис. 1.1 следует, что увеличение стандартного отклонения приводит к расплыванию плотности распределения случайной переменной.

Построить графики плотностей нормальных распределений со средними значениями µ= 0,1,2 и стандартным отклонением у= 1 (рис. 1.2).

x=-4:0.1:4;

mu=0; sigma=1;

while mu<=2

f=normpdf (x, mu, sigma);

plot (x, f, 'k', 'LineWidth', 1.5)

hold on

mu=mu+1;

end

%

title ('Плотность нормального распределения,\mu=var, \sigma=1 ')

xlabel (' x ')

ylabel (' f ')

text (-0.25, 0.38, '\mu_1=0');

text (0.7, 0.38, '\mu_2=1');

text (1.7, 0.38, '\mu_3=2');

Из рис. 1.2 следует, что увеличение среднего значения сдвигает плотность распределения случайной переменной в положительном направлении оси абсцисс.

Вычислить среднее значение, дисперсию, 3-й и 4-й моменты, коэффициенты асимметрии и эксцесса нормального распределения случайной величины.

clear, clc

syms pi

syms x mu sigma positive

f=1/2*exp (-1/2*(x-mu)^2/sigma^2)/sigma*2^(1/2)/pi^(1/2);

mu=int (x*f, x, - inf, inf)

D=int((x-mu)^2*f, x, - inf, inf)

M3=int((x-mu)^3*f, x, - inf, inf)

A=M3/sigma^3

M4=int((x-mu)^4*f, x, - inf, inf)

E=M4/sigma^4-3

mu=mu

D=sigma^2

M3=0

A=3*sigma^4

E=0

Перепишем полученные результаты в аналитической форме

µ=µ, D=у2, M3=0, A=0, M4=3у4, E=0.

Найти вероятности P1(-?, 0), P2(-?;+?), P3(1,2) попадания значений случайной переменной с распределением N (µ, у) в интервалы значений (-?, 0), (-?,+?) и [1,2].

clear

syms x pi

mu=0; sigma=1;

f=1/2*exp (-1/2*(x-mu)^2/sigma^2)/sigma*2^(1/2)/pi^(1/2);

Pl=int (f, x, - inf, 0),

P2=int (f, x, - inf, inf),

P3=int (f, x, 1,2), P3=vpa (P3,5)

Pl =1/2

P2 =1

P3 =erf (2^(1/2))/2 - erf (2^(1/2)/2)/2

P3 =0.13591

Вероятность P3(1,2)=erf() - erf() выражена через функцию ошибок erf(x)=dt.

Построить график функции ошибок erf(x)=dt.

x=-3:0.1:3;

plot (x, erf(x), 'k', 'LineWidth', 1.5)

xlabel (' x ')

ylabel (' erf(x) ')

title (' Функция ошибок')

Результат показан на 1.3

Рис. 1.3

В аналитической форме интегралы, определяющие искомые вероятности, имеют следующий вид:

=1-2

clear, clc

syms x pi

mu=5; sigma=1; epsilon=1;

f=1/2*exp (-1/2*(x-mu)^2/sigma^2)/sigma*2^(1/2)/pi^(1/2);

P1=int (f, x, - inf, mu-epsilon);

P1=simplify(P1), P1=vpa (P1,5)

P2=int (f, x, mu-epsilon, mu+epsilon);

P2=simplify(P2), P2=vpa (P2,5)

P3=int (f, x, mu+epsilon, inf);

P3=simplify(P3), P3=vpa (P3,5)

P=int (f, x, - inf, inf);

P=P1+P2+P3, P=vpa (P, 5)

P2=P-P1-P3; P2=vpa (P2,5)

P2=P-2*P1; P2=vpa (P2,5)

P2=P-2*P3; P2=vpa (P2,5)

% График плотности вероятности

xLim=3*sigma;

hh=ezplot (f, [mu-xLim, mu+xLim]);

hold on

set (hh, 'LineWidth', 2)

xlabel (' x ')

ylabel (' f(x) ')

title (' Симметричный интервал')

% Закраска площади трапеции PI

x=mu-xLim:2*epsilon*10^-3:mu-epsilon;

C=[.1.1.1]; F=normpdf (x, mu, sigma);

xp=[x, mu-epsilon, mu-xLim]; fp=[F, 0,0]; patch (xp, fp, C);

% Закраска площади трапеции Р2

x=mu-epsilon:2*epsilon*10^-3:mu+epsilon;

C=[.7.7.7]; F=normpdf (x, mu, sigma);

xp=[x, mu+epsilon, mu-epsilon];

fp=[F, 0,0]; patch (xp, fp, C);

% Закраска площади трапеции РЗ

x=mu+epsilon:2*epsilon*10^-3:mu+xLim;

C=[.1.1.1]; F=normpdf (x, mu, sigma);

xp=[x, mu+xLim, mu+epsilon]; fp=[F, 0,0]; patch (xp, fp, C);

set (gcf, 'Position', [35 35 750 650])

P1 =1/2 - erf (2^(1/2)/2)/2

P1 =0.15866

P2 =erf (2^(1/2)/2)

P2 =0.68269

P3 =1/2 - erf (2^(1/2)/2)/2

P3 =0.15866

P =1

P =1.00000

P2 =0.68268

P2 =0.68268

P2 =0.68268

Создать файл-функцию для графической иллюстрации и оценок вероятностей попадания значений случайной переменной, подчиняющейся нормальному распределению с параметрами µ и у, в интервал значений от x1 до x2. Используя файл-функцию, найти: 1) вероятность попадания нормально распределенной случайной величины с параметрами µ=0 и у=1 в интервал значений от x1= -1 до x2= 2; 2) вероятность попадания случайно переменной с распределением N (µ= 2,у= l) в интервал значений от x1=µ-3у= -1 до х2= µ+3у=5.

function NormFig (mu, sigma, x1, x2)

% Построение графика плотности вероятности

tsigma=3*sigma;

x=mu-tsigma: (x2-x1)*10^-2:mu+tsigma;

f=normpdf (x, mu, sigma);

plot (x, f, 'k', 'Linewidth', 1.5)

hold on

xlabel (' x ')

ylabel (' f ')

title (' P')

% Закраска площади трапеции

x=x1: (x2-x1)*10^-2:x2;

C=[.7.7.7]; f=normpdf (x, mu, sigma);

xp=[x, x2, x1]; fp=[f, 0,0];

patch (xp, fp, C); alpha(.5)

% Оценка вероятности'

syms x

f=normpdf (x, mu, sigma);

fm=subs (f, x, mu); P=int (f, x, x1, x2); P=vpa (P, 5)

Вероятность попадания нормально распределенной случайной величины c параметрами µ= 0 и у= 1 в интервал значений от х1= -1 до x2= 2 (рис. 1.5):

clear, clc, close

NormFig (0,1, - 1,2)

P=0.81859

Далее используем файл-функцию NormFig для иллюстрации правила трех сигм, которое говорит о том, что если случайная переменная имеет нормальное распределение N (µ, у), то практически достоверно попадание ее значений в интервал от µ-3у до µ+3у.

Вероятность попадания случайной переменной с распределением N (µ=2, у=1) в интервал значений от х1= µ-3у= -1 до х2 =µ+3у= 5 (рис. 1.6):

clear, clc, close

NormFig (2,1, - 1,5)

P=0.9973

Вычислить моду нормального распределения с параметрами µ= 2 и у= 1.

clear, clc

syms pi

syms x mu sigma positive

f = 1/2*exp (-1/2*…

(x-mu)^2/sigma^2)/sigma*2^(1/2)/pi^(1/2);

diff_f=diff (f, x)

mode=solve (diff_f)

subplot (2,1,1)

f=subs (f, {'mu', 'sigma'}, {2,1})

hh=ezplot(f); hold on,

xlabel (' x ')

ylabel (' f(x) ')

subplot (2,1,2)

diff_f=subs (diff_f, {'mu', 'sigma'}, {2,1})

hh=ezplot (diff_f);

xlabel (' x ')

ylabel (' f(x) ')

set (gcf, 'position', [300 35 550 680])

diff_f =(2^(1/2)*(2*mu - 2*x))/(4*pi^(1/2)*sigma^3*exp((mu - x)^2/(2*sigma^2)))

mode =mu

f =2^(1/2)/(2*pi^(1/2)*exp((x - 2)^2/2))

diff_f = - (2^(1/2)*(2*x - 4))/(4*pi^(1/2)*exp((x - 2)^2/2))

Мода нормального распределения совпадает со средним значением случайной переменной: x=0.

На рис. 1.7 помимо функции плотности нормального распределения, показанного в первом подокне, во втором подокне показана производная функции распределения, которая обращается в ноль при значении х=2.

Численное решение этой задачи связано с использованием М-функции [fmax, k]=max(f) обработки числовых массивов, где fmax - имя наибольшего элемента массива f, k - номер наибольшего элемента в массиве f.

clear, clc

mu=2; sigma=1;

x=-3*sigma:0.1:3*sigma;

% Вычисление вектора значений функции плотности вероятности

f=normpdf (x, mu, sigma);

% Определение максимального элемента массива х и номера этого элемента

[fmax, k]=max(f)

% Определение моды по номеру элемента массива х

mode=x(k)

fmax =0.3989

k = 51

mode =2.

Нормальное кумулятивное распределение

Функция кумулятивного нормального распределения

F (x|µ, у)=

определяющая вероятность того, что случайная переменная примет значение, меньшее x, представлена в MATLAB файл-функциями normcdf (x, mu, sigma) и cdf (`Normal', x, mu, sigma).

Дифференцирование функции кумулятивного распределения приводит к функции плотности вероятности

f (x|µ, у)=F (x|µ, у).

clear, clc

syms t x mu sigma pi

F=int (exp(- (t-mu)^2/2/sigma^2), t, - inf, x)/sigma/(2*pi)^(1/2);

f=diff (F, x)

f =1/(sigma*exp((mu - x)^2/(2*sigma^2))*(2*pi)^(1/2))

Построить график кумулятивных функций нормального распределения со средним значением µ=0 и стандартными отклонениями у=1,2,3 (рис. 1.8)

x=-4:0.1:4;

mu=0; sigma=1;

while sigma<=3

F=normcdf (x, mu, sigma);

plot (x, F, 'k', 'LineWidth', 1.5), hold on

sigma=sigma+1;

end

%

title (' Нормальное распределение \mu=0,\sigma=var')

xlabel (' x ')

ylabel (' F ')

text (0.8, 0.95, '\sigma_1=1');

text (1.5, 0.88, '\sigma_2=2');

text (2.8, 0.78, '\sigma_3=3');

Установить связь функции ошибок erf(x)= с нормальным распределением F(x)=, имеющим параметры µ=0 и у=.

Так как F()=+,

то, вычисляя первый интеграл

clear, clc

syms t

int (exp(-t^2), t, - inf, 0)

ans =pi^(1/2)/2

и подставляя найденное значение в формулу для F, получим

erf(x)=2F() - 1.

Проверим эту связь:

clear, clc

syms t x mu sigma pi

F=int (exp(- (t-mu)^2/2/sigma^2), t, - inf, x)/sigma/(2*pi)^(1/2);

erf=2*subs (F, {mu, sigma}, {0,1/2^(1/2)}) - 1;

erf=simplify(erf)

plot (F, 'k', 'LineWidth', 1.5), hold on

erf =erf(x).

Сначала решим задачу аналитически. Для этого используем определение величины P через интеграл

P=

Так как

то разбивая диапазон изменения переменной интегрирования на 3 области (-?, µ-?),

Учитывая, что

и следовательно

1-

находим

Решим задачу численно, полагая, например, µ=5, у=1, ?=1.

clear, clc

syms x pi

mu=5; sigma=1; epsilon=1;

f=1/2*exp (-1/2*(x-mu)^2/sigma^2)/sigma*2^(1/2)/pi^(1/2);

disp ('Прямое вычисление исходного интеграла')

P=int (f, x, mu-epsilon, mu+epsilon), P=vpa (P, 5)

disp ('Вычисление интегралов, определяющих кумулятивную функцию')

P=int (f, x, - inf, mu+epsilon) - int (f, x, - inf, mu-epsilon);

P=simplify(P), P=vpa (P, 5)

disp ('Вычисление разности значений кумулятивной функции')

P=normcdf (mu+epsilon, mu, sigma) - normcdf (mu-epsilon, mu, sigma)

Прямое вычисление исходного интеграла

P =erf (2^(1/2)/2)

P =0.68269

Вычисление интегралов, определяющих кумулятивную функцию

P =erf (2^(1/2)/2)

P =0.68269

Вычисление разности значений кумулятивной функции

P =0.6827

Используя кумулятивную функцию распределения, найти вероятность того, что значения случайной переменной X=N (µ, у) лежат в интервале [µ-?, µ+?]. Дать численное решение для случаев: а) X=N (0,1), [-0. 5,0.5]; b) X=N (3,1), [-0. 5,0.5]; c) X=N (0,2), [-0. 5,0.5]; d) X=N (0,2), [-3,3].

Для решения задачи напишем файл-функцию, основанную на обращении к высокоуровневой функции normcdf. В качестве выходной величины сформируем вектор с компонентами значений кумулятивной функции на краях заданных интервалов и их разности, определяющей искомую вероятность.

function epsilonM (mu, sigma, epsilon)

%

x1=mu-epsilon; x2=mu+epsilon;

p1=normcdf (x1, mu, sigma); p2=normcdf (x2, mu, sigma);

p=p2-p1;

P=[p1, p2, p]

x=x1-3*sigma:10^-1:x2+3*sigma; F=normcdf (x, mu, sigma);

plot (x, F, 'k', 'LineWidth', 1.5), hold on

title ('\mu=0, \sigma=1, \epsilon=0.5')

xlabel (' x ')

ylabel (' F ')

% Закраска площади трапеции

x=mu-epsilon:2*epsilon*10^-2:mu+epsilon;

C=[.7.7.7]; F=normcdf (x, mu, sigma);

xp=[x, mu+epsilon, mu-epsilon];

fp=[F, 0,0]; patch (xp, fp, C); alpha(.5)

F1=normcdf (mu-epsilon, mu, sigma);

text (mu-epsilon, F1, num2str(F1));

F2=normcdf (mu+epsilon, mu, sigma);

text (mu+epsilon, F2, num2str(F2));

В случае а) обращение к файл-функции

epsilonM (0,1,0.5)

P =0.3085 0.6915 0.3829

дает величину 0.3829 вероятности попадания значений случайной переменной X=N (0,1) в интервале [-0. 5,0.5]. Рис. 1.9 иллюстрирует эти вычисления.

Вычисления для случая b) показывают, что изменение среднего значения случайной величины не изменяет значений вычисляемых вероятностей (рис. 1.10).

clear, clc, close

epsilonM (3,1,0.5)

P = 0.3085 0.6915 0.3829

В случае с) увеличение стандартного отклонения приводит к увеличению вероятности получить значение случайной переменной X=N (0,2) меньшее, чем нижняя граница заданного интервала [-0. 5,0.5], и к уменьшению вероятности получить значение случайной величины меньшее, чем верхняя граница интервала. Связано это с уменьшением крутизны кумулятивной функции. В результате этих изменений вероятность получить значение случайной переменной X=N (0,2) в заданном интервале уменьшается (рис. 1.11).

clear, clc, close

epsilonM (0,2,0.5)

P =0.4013 0.5987 0.1974

В случае d) увеличение интервала от [-0. 5,0.5] до [-3,3] приводит к увеличению вероятности обнаружить значения случайной переменной в пределах интервала.

clear, clc, close

epsilonM (0,2,3)

P =0.0668 0.9332 0.8664

Проверим последний результат обращением к файл-функции NormFig, которая вычисляет вероятности на основании использования высокоуровневой функции normpdf

clear, clc, close

NormFig (0,2, - 3,3)

P =0.86639

2. Обратная кумулятивная функция нормального распределения

Обратная кумулятивная функция нормального распределения, являющаяся решением интегрального уравнения

х=F-1 (p|µ, у), где р=F (x|µ, у),

определена файл-функцией norminv (F, mu, sigma):

Квантиль xq уровня q, вычисляют решением уравнения

F(xq|µ, у)=.

Построить графики функций обратных кумулятивных нормальных распределений с параметрами µ=0 и у=1,2,3 (рис. 1.14).

F=0:0.001:1;

mu=0; sigma=1;

while sigma<=3

x=norminv (F, mu, sigma);

plot (F, x, 'k', 'LineWidth', 1.5), hold on

sigma=sigma+1;

end

%

title (' Обратное нормальное распределение, \mu=0, \sigma=var')

xlabel (' F ')

ylabel (' x(F) ')

text (0.88, 0.35, '\sigma_1=1');

text (0.85, 1.8, '\sigma_2=2');

text (0.8, 3.5, '\sigma_3=3');

Связь функций кумулятивного и обратного кумулятивного распределений иллюстрируется следующими двумя алгоритмами.

x=-4:0.1:4;

mu=0; sigma=1;

while sigma<=3

xnew=norminv (normcdf(x, mu, sigma), mu, sigma);

plot (x, xnew, 'k', 'LineWidth', 1.5), hold on

sigma=sigma+1;

end

%

xlabel (' x ')

ylabel (' x ')

title ('x=norminv (normcdf(x, mu, sigma), mu, sigma)')

F=0:0.1:1;

mu=0; sigma=1;

while sigma<=3

Fnew=normcdf (norminv(F, mu, sigma), mu, sigma);

plot (F, Fnew, 'k', 'LineWidth', 1.5), hold on

sigma=sigma+1;

end

%

xlabel (' F ')

ylabel (' F ')

title (' F=normcdf (norminv(F, mu, sigma), mu, sigma)')

Построить файл-функцию для вычисления и графической иллюстрации квантилей нормального распределения с параметрами µ и у. Уровни квантилей задать вектором q= [q, q2, q3…].

function quantileMy (mu, sigma, q)

%

disp ('Уровни квантилей'), q

disp ('Квантили, вычисленные функцией norminv')

xq=norminv (q, mu, sigma)

%

F=0:10^-5:1; x=norminv (F, mu, sigma);

disp ('Квантили, вычисленные функцией quantile')

xq=quantile (x, q)

disp ('Уровни процентилей')

p100=q*100

disp ('Процентили, вычисленные функцией prctile')

xp=prctile (x, p100)

plot (F, x, 'k', 'LineWidth', 1.5);

set (gca, 'XTick', q)

set (gca, 'YTick', xq)

axis([0 1 mu-4 mu+4])

xlabel (' x(F) ')

ylabel (' F ')

title ('Квантили распределения N (\mu=5, \sigma=1)')

Например:

mu=5; sigma=1; q=[.05 0.25 0.5 0.75 0.95]

quantileMy (mu, sigma, q)

Уровни квантилей

q =0.0500 0.2500 0.5000 0.7500 0.9500

Квантили, вычисленные функцией norminv

xq =3.3551 4.3255 5.0000 5.6745 6.6449

Квантили, вычисленные функцией quantile

xq =3.3551 4.3255 5.0000 5.6745 6.6449

Уровни процентилей

p100 =5 25 50 75 95

Процентили, вычисленные функцией prctile

xp =3.3551 4.3255 5.0000 5.6745 6.6449

Например, квантиль x0.25 распределения N (5,1) говорит о том, что значению F=0.25 кумулятивной функции распределения соответствует значение случайной величины, равное х0.25=4.3255.

Для нормального распределения с параметрами µ=0 и у=1, используя высокоуровневую функцию disttool, предоставляющую графический интерфейс для интерактивной работы с функциями pdf и cdf, вычислить: 1) значение функции распределения (плотности вероятности, pdf) для значения случайной величины х=0.75; 2) значение кумулятивной функции (cdf) распределения для значения случайной величины х=0.75;

3) значение случайной величины x0.75 для значения F=0.75 обратной кумулятивной функции

(т.е. квантили уровня q=0.75).

Вводя в командное окно MATLAB оператор

disttool

Сравнивая значение квантили х0.75=0.67449=0.6745 распределения N (µ=0,у=1), полученное в окне на рис. 1.20, со значением квантили =5.6745, найденной в предыдущей задаче, нетрудно заметить, что они связаны простым соотношением:

=5.6745-5 = 0.6745,

где символом у обозначено, что взята квантиль распределения другой переменной.

Примечание. Графический интерфейс disttool позволяет работать только с функциями pdf и cdf. Но в графическом окне для функции, cdf предоставлена возможность изменения значений как аргумента, так и функции, что делает избыточным построение графика обратного кумулятивного распределения (inv).

Инструмент disttool является чрезвычайно эффективным средством в освоении характерных черт различного рода статистических распределений.

Подойдем к вопросу связи квантилей разных распределений более подробно и одновременно для разнообразия воспользуемся идеей файл-функции disttool вычислять квантили с их графической иллюстрацией на основании функции cdf.

Построить файл-функцию для вычисления и графической иллюстрации с помощью функции cdf квантилей двух нормальных распределений N(µ1, у1) и N(µ1, у1). Уровни квантилей задать векторами q1=[q11,q12,q13…] и q2=[q21,q22,q23…].

function quantileMy2 (mu1, sigma1, q1, mu2, sigma2, q2)

%

subplot (2,1,1)

xq1=norminv (q1, mu1, sigma1)

x1=mu1-3*sigma1:10^-5:mu1+3*sigma1;

F1=normcdf (x1, mu1, sigma1);

plot (x1, F1,'k', 'LineWidth', 1.5);

set (gca, 'XTick', xq1), set (gca, 'YTick', q1)

axis ([mu1-3*sigma1 mu1+3*sigma1 0 1])

xlabel (' x ')

ylabel (' F(x) ')

title ('Квантили распределения N (\mu_1, \sigma_1)')

subplot (2,1,2)

xq2=norminv (q2, mu2, sigma2)

x2=mu2-3*sigma2:10^-5:mu2+3*sigma2;

F2=normcdf (x2, mu2, sigma2);

plot (x2, F2,'k', 'LineWidth', 1.5);

set (gca, 'XTick', xq2), set (gca, 'YTick', q2)

axis([mu2-3*sigma2 mu2+3*sigma2 0 1])

xlabel (' x ')

ylabel (' F(x) ')

title ('Квантили распределения N (\mu_2, \sigma_2)').

Заключение

В заключение главы отметим, что представленные алгоритмы решений задач по темам непрерывных и дискретных распределений, в которых мы ограничились нормальным, логнормальным распределениями, распределением Пуассона и биномиальным распределением, задают основу для анализа произвольного статистического распределения.

Размещено на Allbest.ru


Подобные документы

  • Логнормальное распределение. Применение моделирования логнормального распределения. Постановка и реализация поставленной задачи. Математическое ожидание. Инструкция пользователю. Описание программного модуля. Общие данные логнормального распределения.

    курсовая работа [364,6 K], добавлен 08.01.2009

  • Создание программного продукта, представляющего моделирование на компьютере логнормального распределения, определение вероятностной оценки стоимости актива. Описание работы программного продукта. Работа с графиками, таблицами, математическими функциями.

    курсовая работа [742,7 K], добавлен 08.01.2009

  • Статистическая аппроксимация законов распределения. Основные теоретические сведения теории классификации. Алгоритмы параметрической аппроксимации функции плотности распределения вероятностей. Апробация и применение средств автоматизации в виде макросов.

    дипломная работа [5,0 M], добавлен 23.08.2009

  • Методы вычисления точных вероятностей в покере. Проектирование алгоритма нахождения вероятности выигрыша для нескольких игроков. Теоретический расчет вероятности выигрыша в игре. Программная оптимизация и упрощение алгоритмов вычисления вероятностей.

    курсовая работа [96,1 K], добавлен 17.06.2013

  • Оценка неизвестной функции распределения величины или ее плотности распределения вероятности. Алгоритм основной программы, функции для построения графика исходного массива, гистограммы и графика функции Лапласа. Результат обработки сейсмического сигнала.

    курсовая работа [194,4 K], добавлен 16.12.2012

  • Разработка программной реализации для решения задач бесприоритетного и приоритетного распределений. Контрольный пример решения задачи бесприоритетного распределения со структурой иерархии 5-4-2. Алгоритм расчета задачи одноресурсного распределения.

    курсовая работа [2,3 M], добавлен 05.01.2013

  • Моделирование работы генератора случайных двоичных чисел с ограниченной последовательностью 0 и 1, подчиняющегося равномерному закону распределения, заданному с помощью модели Гильберта. Представление программного решения задачи средствами языка С++.

    лабораторная работа [857,7 K], добавлен 05.06.2011

  • Определение, свойства и характеристики распределенных систем баз данных. Основная задача систем управления ими. Архитектура распределения СУБД. Сравнение технологий файлового сервера и "клиент-сервера". Стратегия распределения данных по узлам сети ЭВМ.

    курсовая работа [601,3 K], добавлен 24.05.2015

  • График функции плотности распределения Парето. Алгоритм обработки выборки. Построение гистограммы относительных частот. Программа для автоматизации обработки, в которую заложены алгоритмы обработки выборки и возможность быстрого получения результата.

    курсовая работа [1,3 M], добавлен 19.03.2012

  • Изучение теории вероятностей и математической статистики, биноминального закона распределения дискретных величин, особенностей числовых функций. Исследование системного и прикладного обеспечения персонального компьютера, алгоритмизации, программирования.

    контрольная работа [277,8 K], добавлен 11.07.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.