Исследование точности оценки параметра экспоненциального распределения методом максимального правдоподобия

Метод оценки максимального правдоподобия. Основные методы вычисления 95% доверительного интервала. Сознание программы-функции на Matlab для исследования точности оценки параметра экспоненциального распределения методом максимального правдоподобия.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 18.05.2014
Размер файла 175,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. Введение

Цели работы:

1) Изучить метод максимального правдоподобия;

2) Рассмотреть методы вычисления 95% доверительного интервала;

3) Создать программу-функцию на Matlab для исследования точности оценки параметра экспоненциального распределения методом максимального правдоподобия.

2. Теоретическая часть

2.1 Экспоненциальное распределение

Экспоненциальное распределение определяется следующим образом:

f(x) = л * e- л x

0 ? x <? , л > 0

Где л (лямбда) - параметр экспоненциальной функции (альтернативной параметризацией является параметр масштаба b=1/ л)

e - основание натуральных логарифмов

Для экспоненциального распределения:

Функция дожития: s(t)=e- лt ;

Плотность: f(x) = л * e- л x

Интенсивность: µ=л (нет старения);

Кумулятивный риск: H=лt

В данной работе задача в оценке параметра л методом максимального правдоподобия и вычислении 95% доверительного интервала.

2.2 Метод максимального правдоподобия

Оценкой максимального правдоподобия ? неизвестного параметра л называют значение л, при котором функция f(T, л) достигает максимума (как функция от л при фиксированных t1, t2, … tn).

L л(t1, t2, … tn) - плотность вероятности наблюдать выборку t1, t2, … tn

при значении параметра л.

L л - правдоподобие

L л(t1, t2, … tn) л max

?=arg max L л(t1, t2, … tn) - оценка максимального правдоподобия.

Независимая выборка.

L л(t1, t2, … tn)

?=arg max ln L л

л

ln L л(t1, t2, … tn) ln L л (ti)

Оценка параметра л:

P{T>ti}=e-лt

f(ti)=л*e-лti

L л(t)=л*e-лti

ln L л(t)= ln L л(t1, t2, … tn) ln л-л * ti л max

ln L л(ti)= ln л - л*ti

?= - оценка максимального правдоподобия параметра л

проверка того, что ? - максимум:

<0 => максимум функции

2.3 Доверительный интервал

Доверительный интервал -- термин, используемый в математической статистике при интервальной (в отличие от точечной) оценке статистических параметров, что предпочтительнее при небольшом объёме выборки. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.

0.95 - доверительная вероятность б

Доверительный интервал - интервал, на который попадает случайная величина с доверительной вероятностью б. На рисунках 1 и 2 представлена функция нормального распределения.

рис. 1. Функция нормального распределения

рис. 2. Нормальное распределение, связь между вероятностью и дисперсией.

При вероятности б=0.95 случайная величина X будет лежать в интервале xср-1,96?x? xср+1,96

2.4 Методы вычисления доверительного интервала

А. Через асимптотическую нормальность производной логарифма правдоподобия.

Асимптотически нормальная оценка -- в математической статистике оценка, распределение которой стремится к нормальному, при увеличении размера выборки.

;

;

-1.96* ? ? 1.96*

- решаем неравенство относительно

B. Через асимптотическую нормальность оценки максимального правдоподобия.

;

;

C. Через профиль функции правдоподобия.

максимальный правдоподобие программа экспотенциальный

;

c вероятностью 0.95

;

;

;

[2].

Очень часто все три метода (A-C) дают практически совпадающие результаты. Преимущество метода В) - через асимптотическую нормальность оценки максимального правдоподобия - состоит в простом представлении выводов. К недостаткам можно отнести неинвариантность процедуры B) относительно перепараметризации. Метод А) более удобен с вычислительной точки зрения. Метод C) - через профиль функции правдоподобия рекомендуется использовать в сомнительных случаях. Он инвариантен относительно перепараметризации, и форма полученной доверительной области определяется самими данными [1].

3. Практическая часть

В качестве практического задания, требуется написать программу-функцию на Matlab, предусмотрев ввод параметров л и n через список формальных параметров функции, генерирование независимой случайной выборки объёма n длительностей, имеющих экспоненциальное распределение с параметром л, расчёт и вывод на экран оценки максимального правдоподобия и её 95% доверительного интервала, рассчитанного методом:

1) через асимптотическую нормальность производной логарифма правдоподобия;

2) через профиль функции правдоподобия.

Провести результаты и составить таблицу результатов (Таблица 1, стр. 13) для значений параметров.

На странице 10 представлен алгоритм программы (рис. 3).

Алгоритм программы.

Код программы.

function Lab3 (lambda, n);

T=exprnd (ones (1, n)/lambda);

lambdah=n/sum(T);

a=(1-1.96/sqrt(n))*lambdah;

b=(1+1.96/sqrt(n))*lambdah;

x=a/2:0.01:2*b;

L=n*log(x)-x*sum(T);

Lmax=n*log(lambdah)-lambdah*sum(T);

plot (x, L, [a/2, 2*b], [Lmax-1.92]);

disp ([a, b, Lmax]);

x=lambdah;

while (n*log(x)-x*sum(T)>Lmax-1.92);

x=x+0.01;

end;

b2=x;

x=lambdah;

while (n*log(x)-x*sum(T)>Lmax-1.92);

x=x-0.01;

end;

a2=x;

disp ([a2, b2]);

xlabel ('lambda');

ylabel ('L');

Код программы.

function pravdopodobie (lambda, n);

%Крупеня Дарья, КББ-1-11

%Задаём функцию, lambda - параметр экспоненциального распределения;

%n - число данных

T=exprnd (ones (1, n)/lambda); % генерирование выборки

lambdah=n/sum(T); % оценка максимального правдоподобия

disp ([lambdah]);

a=(1-1.96/sqrt(n))*lambdah; % левый предел доверительного интервала

b=(1+1.96/sqrt(n))*lambdah; % правый предел доверительного интервала

x=a/2:0.01:2*b;

L=n*log(x)-x*sum(T); % логарифм правдоподобия

Lmax=n*log(lambdah)-lambdah*sum(T); % максимальное значение логарифма правдоподобия

plot (x, L, [a/2, 2*b], [Lmax-1.92]); % рисует график

disp ([a, b, Lmax]);

% выводит на экран значения концов доверительного интервала и Lmax

x=lambdah;

while (n*log(x)-x*sum(T)>Lmax-1.92); % ищет правый предел доверительного интервала

% через профиль функции правдоподобия

x=x+0.01; end;

b2=x;

x=lambdah;

while (n*log(x)-x*sum(T)>Lmax-1.92); % левый предел

x=x-0.01; end;

a2=x;

disp ([ a2, b2]); % выводит на экран пределы доверительного интервала

xlabel ('lambda');

ylabel ('L');

Таблица результатов:

Таблица 1. Подсчёт оценки максимального правдоподобия и 95 % доверительного интервала 1 способ - через асимптотическую нормальность производной логарифма правдоподобия, 2 способом - через профиль функции правдоподобия.

л

0.1

0.1

0.1

0.01

0.01

0.01

n

10

50

150

10

50

150

OМП л

0.102

0.0842

0.0969

0.0204

0.0118

0.0114

95% доверительный интервал, 1 способ

[0.0388;

0.1654]

[0.0609;

0.1076]

[0.0814;

0.1124]

[0.0078;

0.0331]

[0.0085;

0.0150]

[0.0096;

0.0133]

95% доверительный интервал, 2 способ

[0.0421;

0.1821]

[0.0542;

0.1142]

[0.0769;

0.1169]

[0.0004;

0.0404]

[0.0018;

0.0218]

[0.0014;

0.0214]

л

0.5

0.5

0.5

1

0.5

1

n

10

50

150

10

1000

500

OМП л

0.5733

0.4155

0.4843

1.2866

0.0005

0.9701

95% доверительный интервал, 1 способ

[0.2179;

0.9286]

[0.3003;

0.5307]

[0.4068;

0.5618]

[0.4892;

2.0841]

[0.0005;

0.0005]

[0.8850;

1.0551]

95% доверительный интервал, 2 способ

[0.2833;

1.0133]

[0.3055;

0.5455]

[0.4043;

0.5743]

[0.6366;

2.2566]

[0.4597;

0.5397]

[0.8801;

1.0601]

Заключение

В данной работе теоретически описаны: экспоненциальное распределение, метод максимального правдоподобия и методы вычисления 95% доверительного интервала. На основе изученных методов написана программа на Matlab.

Составлена таблица результатов. По которой можно судить о том, что

при конкретных значениях л и достаточно небольшом разбиении (n) - лучше использовать 1 метод - через асимптотическую нормальность производной логарифма правдоподобия. Так как интервал получается более точный.

При большем значении n пределы интервала 2 методами становятся более точными и их значения между собой приближаются, но всё равно в конкретной ситуации лучше использовать 1 метод.

В приложении, на рис. 5 и рис. 6, представлены изображения работающей программы.

Использованные источники

1. Д. Р. Кокс, Д. Оукс. Анализ данных типа времени жизни. Москва, Финансы и Статистика, 1988

2. Михальский А.И. Лекционные материалы по курсу КТ в МБС,2013

3. Половко А.М., Бутусов П.Н. MATLAB для студента. - СПб.: БЧВ-Петербург, 2005. - 320 с.;

4. http://ru.wikipedia.org/wiki/Экспоненциальное_распределение

5. http://ru.wikipedia.org/wiki/Доверительный_интервал

6. http://dic.academic.ru/dic.nsf/ruwiki/151500

Приложение

1) Параметры ввода: л=0.1; n=10

Вывод: a=0.0439; b= 0.1870 Lmax = -31.5892

a2=0.0555; b2=0.2055

2) Параметры ввода: л=0.5; n=100

Вывод: a=0.3350; b=0.4984; Lmax=-187.5405; a2=0.3367; b2=0.5067

Размещено на Allbest.ru


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.