Исследование точности оценки параметра экспоненциального распределения методом максимального правдоподобия
Метод оценки максимального правдоподобия. Основные методы вычисления 95% доверительного интервала. Сознание программы-функции на Matlab для исследования точности оценки параметра экспоненциального распределения методом максимального правдоподобия.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 18.05.2014 |
Размер файла | 175,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
1. Введение
Цели работы:
1) Изучить метод максимального правдоподобия;
2) Рассмотреть методы вычисления 95% доверительного интервала;
3) Создать программу-функцию на Matlab для исследования точности оценки параметра экспоненциального распределения методом максимального правдоподобия.
2. Теоретическая часть
2.1 Экспоненциальное распределение
Экспоненциальное распределение определяется следующим образом:
f(x) = л * e- л x
0 ? x <? , л > 0
Где л (лямбда) - параметр экспоненциальной функции (альтернативной параметризацией является параметр масштаба b=1/ л)
e - основание натуральных логарифмов
Для экспоненциального распределения:
Функция дожития: s(t)=e- лt ;
Плотность: f(x) = л * e- л x
Интенсивность: µ=л (нет старения);
Кумулятивный риск: H=лt
В данной работе задача в оценке параметра л методом максимального правдоподобия и вычислении 95% доверительного интервала.
2.2 Метод максимального правдоподобия
Оценкой максимального правдоподобия ? неизвестного параметра л называют значение л, при котором функция f(T, л) достигает максимума (как функция от л при фиксированных t1, t2, … tn).
L л(t1, t2, … tn) - плотность вероятности наблюдать выборку t1, t2, … tn
при значении параметра л.
L л - правдоподобие
L л(t1, t2, … tn) л max
?=arg max L л(t1, t2, … tn) - оценка максимального правдоподобия.
Независимая выборка.
L л(t1, t2, … tn)
?=arg max ln L л
л
ln L л(t1, t2, … tn) ln L л (ti)
Оценка параметра л:
P{T>ti}=e-лt
f(ti)=л*e-лti
L л(t)=л*e-лti
ln L л(t)= ln L л(t1, t2, … tn) ln л-л * ti л max
ln L л(ti)= ln л - л*ti
?= - оценка максимального правдоподобия параметра л
проверка того, что ? - максимум:
<0 => максимум функции
2.3 Доверительный интервал
Доверительный интервал -- термин, используемый в математической статистике при интервальной (в отличие от точечной) оценке статистических параметров, что предпочтительнее при небольшом объёме выборки. Доверительным называют интервал, который покрывает неизвестный параметр с заданной надёжностью.
0.95 - доверительная вероятность б
Доверительный интервал - интервал, на который попадает случайная величина с доверительной вероятностью б. На рисунках 1 и 2 представлена функция нормального распределения.
рис. 1. Функция нормального распределения
рис. 2. Нормальное распределение, связь между вероятностью и дисперсией.
При вероятности б=0.95 случайная величина X будет лежать в интервале xср-1,96?x? xср+1,96
2.4 Методы вычисления доверительного интервала
А. Через асимптотическую нормальность производной логарифма правдоподобия.
Асимптотически нормальная оценка -- в математической статистике оценка, распределение которой стремится к нормальному, при увеличении размера выборки.
;
;
-1.96* ? ? 1.96*
- решаем неравенство относительно
B. Через асимптотическую нормальность оценки максимального правдоподобия.
;
;
C. Через профиль функции правдоподобия.
максимальный правдоподобие программа экспотенциальный
;
c вероятностью 0.95
;
;
;
[2].
Очень часто все три метода (A-C) дают практически совпадающие результаты. Преимущество метода В) - через асимптотическую нормальность оценки максимального правдоподобия - состоит в простом представлении выводов. К недостаткам можно отнести неинвариантность процедуры B) относительно перепараметризации. Метод А) более удобен с вычислительной точки зрения. Метод C) - через профиль функции правдоподобия рекомендуется использовать в сомнительных случаях. Он инвариантен относительно перепараметризации, и форма полученной доверительной области определяется самими данными [1].
3. Практическая часть
В качестве практического задания, требуется написать программу-функцию на Matlab, предусмотрев ввод параметров л и n через список формальных параметров функции, генерирование независимой случайной выборки объёма n длительностей, имеющих экспоненциальное распределение с параметром л, расчёт и вывод на экран оценки максимального правдоподобия и её 95% доверительного интервала, рассчитанного методом:
1) через асимптотическую нормальность производной логарифма правдоподобия;
2) через профиль функции правдоподобия.
Провести результаты и составить таблицу результатов (Таблица 1, стр. 13) для значений параметров.
На странице 10 представлен алгоритм программы (рис. 3).
Алгоритм программы.
Код программы.
function Lab3 (lambda, n);
T=exprnd (ones (1, n)/lambda);
lambdah=n/sum(T);
a=(1-1.96/sqrt(n))*lambdah;
b=(1+1.96/sqrt(n))*lambdah;
x=a/2:0.01:2*b;
L=n*log(x)-x*sum(T);
Lmax=n*log(lambdah)-lambdah*sum(T);
plot (x, L, [a/2, 2*b], [Lmax-1.92]);
disp ([a, b, Lmax]);
x=lambdah;
while (n*log(x)-x*sum(T)>Lmax-1.92);
x=x+0.01;
end;
b2=x;
x=lambdah;
while (n*log(x)-x*sum(T)>Lmax-1.92);
x=x-0.01;
end;
a2=x;
disp ([a2, b2]);
xlabel ('lambda');
ylabel ('L');
Код программы.
function pravdopodobie (lambda, n);
%Крупеня Дарья, КББ-1-11
%Задаём функцию, lambda - параметр экспоненциального распределения;
%n - число данных
T=exprnd (ones (1, n)/lambda); % генерирование выборки
lambdah=n/sum(T); % оценка максимального правдоподобия
disp ([lambdah]);
a=(1-1.96/sqrt(n))*lambdah; % левый предел доверительного интервала
b=(1+1.96/sqrt(n))*lambdah; % правый предел доверительного интервала
x=a/2:0.01:2*b;
L=n*log(x)-x*sum(T); % логарифм правдоподобия
Lmax=n*log(lambdah)-lambdah*sum(T); % максимальное значение логарифма правдоподобия
plot (x, L, [a/2, 2*b], [Lmax-1.92]); % рисует график
disp ([a, b, Lmax]);
% выводит на экран значения концов доверительного интервала и Lmax
x=lambdah;
while (n*log(x)-x*sum(T)>Lmax-1.92); % ищет правый предел доверительного интервала
% через профиль функции правдоподобия
x=x+0.01; end;
b2=x;
x=lambdah;
while (n*log(x)-x*sum(T)>Lmax-1.92); % левый предел
x=x-0.01; end;
a2=x;
disp ([ a2, b2]); % выводит на экран пределы доверительного интервала
xlabel ('lambda');
ylabel ('L');
Таблица результатов:
Таблица 1. Подсчёт оценки максимального правдоподобия и 95 % доверительного интервала 1 способ - через асимптотическую нормальность производной логарифма правдоподобия, 2 способом - через профиль функции правдоподобия.
л |
0.1 |
0.1 |
0.1 |
0.01 |
0.01 |
0.01 |
|
n |
10 |
50 |
150 |
10 |
50 |
150 |
|
OМП л |
0.102 |
0.0842 |
0.0969 |
0.0204 |
0.0118 |
0.0114 |
|
95% доверительный интервал, 1 способ |
[0.0388; 0.1654] |
[0.0609; 0.1076] |
[0.0814; 0.1124] |
[0.0078; 0.0331] |
[0.0085; 0.0150] |
[0.0096; 0.0133] |
|
95% доверительный интервал, 2 способ |
[0.0421; 0.1821] |
[0.0542; 0.1142] |
[0.0769; 0.1169] |
[0.0004; 0.0404] |
[0.0018; 0.0218] |
[0.0014; 0.0214] |
|
л |
0.5 |
0.5 |
0.5 |
1 |
0.5 |
1 |
|
n |
10 |
50 |
150 |
10 |
1000 |
500 |
|
OМП л |
0.5733 |
0.4155 |
0.4843 |
1.2866 |
0.0005 |
0.9701 |
|
95% доверительный интервал, 1 способ |
[0.2179; 0.9286] |
[0.3003; 0.5307] |
[0.4068; 0.5618] |
[0.4892; 2.0841] |
[0.0005; 0.0005] |
[0.8850; 1.0551] |
|
95% доверительный интервал, 2 способ |
[0.2833; 1.0133] |
[0.3055; 0.5455] |
[0.4043; 0.5743] |
[0.6366; 2.2566] |
[0.4597; 0.5397] |
[0.8801; 1.0601] |
Заключение
В данной работе теоретически описаны: экспоненциальное распределение, метод максимального правдоподобия и методы вычисления 95% доверительного интервала. На основе изученных методов написана программа на Matlab.
Составлена таблица результатов. По которой можно судить о том, что
при конкретных значениях л и достаточно небольшом разбиении (n) - лучше использовать 1 метод - через асимптотическую нормальность производной логарифма правдоподобия. Так как интервал получается более точный.
При большем значении n пределы интервала 2 методами становятся более точными и их значения между собой приближаются, но всё равно в конкретной ситуации лучше использовать 1 метод.
В приложении, на рис. 5 и рис. 6, представлены изображения работающей программы.
Использованные источники
1. Д. Р. Кокс, Д. Оукс. Анализ данных типа времени жизни. Москва, Финансы и Статистика, 1988
2. Михальский А.И. Лекционные материалы по курсу КТ в МБС,2013
3. Половко А.М., Бутусов П.Н. MATLAB для студента. - СПб.: БЧВ-Петербург, 2005. - 320 с.;
4. http://ru.wikipedia.org/wiki/Экспоненциальное_распределение
5. http://ru.wikipedia.org/wiki/Доверительный_интервал
6. http://dic.academic.ru/dic.nsf/ruwiki/151500
Приложение
1) Параметры ввода: л=0.1; n=10
Вывод: a=0.0439; b= 0.1870 Lmax = -31.5892
a2=0.0555; b2=0.2055
2) Параметры ввода: л=0.5; n=100
Вывод: a=0.3350; b=0.4984; Lmax=-187.5405; a2=0.3367; b2=0.5067
Размещено на Allbest.ru
Подобные документы
Теоретические основы построения непараметрической оценки функции дожития (оценка Каплана-Мейера) и вычисления доверительного интервала с использованием формулы Гринвуда. Разработка программы-функции на MATLAB и создание графиков по результатам расчетов.
контрольная работа [442,9 K], добавлен 17.06.2012Определение характеристик точности выходного параметра вероятностным расчетно-аналитическим методом. Моделирование на электронно-вычислительной машине точности выходного параметра каскада. Сравнение его точности. Обоснование числа реализаций каскада.
курсовая работа [870,4 K], добавлен 23.06.2014Знакомство с возможностями среды статистических вычислений R для классификации многомерных неоднородных ассиметричных данных. EM алгоритм как общий метод для нахождения оценок максимального правдоподобия параметров моделей по данным с пропусками.
реферат [449,2 K], добавлен 14.12.2014Исследование двух методов численного дифференцирования. Определение относительно максимального значения функции на интервале, абсолютной погрешности относительно значений аналитически вычисленной производной. Структура и этапы вычислительной программы.
курсовая работа [1,8 M], добавлен 14.04.2011Идея численного интегрирования. Создание программы, вычисляющей определенный интеграл методом трапеций. Листинг программы, результаты работы. Проверка в среде Mathcad. Зависимость точности вычисления от количества отрезков разбиения, расчет погрешности.
отчет по практике [106,8 K], добавлен 28.04.2013Расчетно-аналитический метод определения точности выходного параметра. Характеристики первичных параметров, используемые для моделирования на электронно-вычислительной машине производственного рассеяния. Программа для ЭВМ. Применение метода Монте-Карло.
курсовая работа [397,6 K], добавлен 06.04.2014Графическое решение задач. Составление математической модели. Определение максимального значения целевой функции. Решение симплексным методом с искусственным базисом канонической задачи линейного программирования. Проверка оптимальности решения.
контрольная работа [191,1 K], добавлен 05.04.2016Допустимый план методом северо-западного угла. Два алгоритмических шага: предварительный и общеповторяющийся. Нахождение допустимого ациклического плана. Анализ системы на потенциальность. Изменение значения целевой функции. Перемещение по циклу.
контрольная работа [27,1 K], добавлен 16.02.2009Исследование точности оценки координат и параметров движения источника излучения по результатам угломерных измерений в различных режимах и конфигурации измерительной системы. Разработка соответствующей программы, ее листинг, алгоритм и этапы реализации.
курсовая работа [311,5 K], добавлен 13.05.2014Анализ методов определения минимального и максимального значения функции многих переменных без ограничений. Нахождение экстремума функции при наличии ограничений. Синтез оптимальной по быстродействию системы с помощью принципа максимума Понтрягина.
курсовая работа [2,1 M], добавлен 10.04.2011