Порушення основних припущень лінійного регресійного аналізу

Вивчення наслідків порушення основних припущень лінійного регресійного аналізу: припущення про незміщеність похибок, про однакову дисперсію і некорельованість похибок, про нормальний розподіл похибок та припущення про незалежність спостережень.

Рубрика Математика
Вид магистерская работа
Язык украинский
Дата добавления 12.08.2010
Размер файла 4,7 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

(1)

де - регресійна матриця розміру , ,

- вектор невідомих параметрів,

- вектор похибок спостережень.

Припущення відносно вектора спостережень позначатимемо :

. (2)

Або, що те ж саме, припущення відносно вектора похибок мають вигляд:

(3)

Вихідні припущення (2) або (3) регресійного аналізу виконуються далеко не завжди. Виникає низка питань: як виявити порушення цих припущень? В яких випадках і які порушення можна вважати припустимими? Що робити, якщо порушення виявляються неприпустимими?

Метою роботи є вивчення наслідків порушення основних припущень (3) лінійного регресійного аналізу, а саме:

1) припущення про незміщеність похибок ; (4)

2) припущення про однакову дисперсію і некорельованість похибок (5)

3) припущення про нормальний розподіл похибок ; (6)

4) припущення про незалежність спостережень . (7)

Наслідки порушення припущень (4)-(7) розглянемо на прикладі лінійної регресії з двома незалежними змінними.

«Ідеальною» моделлю лінійної регресії з двома незалежними змінними називатимемо модель виду

(8)

«Ідеальна» модель - це модель (1) з коефіцієнтами .

Опишемо вибір невипадкових змінних .

Квадрат розіб'ємо на 16 однакових квадратів розміром . В кожному з них оберемо 4 точки, які виступають вершинами квадратів розміром . Ці 64 вершини квадратів і обрані за значення, які набувають невипадкові змінні .

Рис. 1. Вибір значень , які набувають невипадкові змінні

Проведемо стохастичний експеримент, який полягає в моделюванні спостережень згідно з моделлю (8).

Результати експерименту наведено на рисунку 2.

Рис. 2

За допомогою критеріїв математичної статистики ми будемо перевіряти не тільки, чи виконуються припущення регресійного аналізу, але й гіпотези про адекватність лінійної моделі, про значущість регресії, про значущість коефіцієнтів регресії. Отже, модель (8) узгоджується з результатами експерименту, жодне з вихідних припущень не порушено.

1) „ідеальна” модель адекватна (модель лінійна);

2) „ідеальна” регресія значуща;

3) гіпотези , не відхиляються;

4) дисперсія залишків постійна;

5) залишки некорельовані;

6) залишки нормально розподілені .

Розглянемо модель лінійної регресії, в якій дисперсія спостережень величина змінна, тобто припущення (5) місця не має.

Проведемо стохастичний експеримент, який полягає в моделюванні спостережень згідно з моделлю

(9)

Результати експерименту наведено на рисунку 3.

Рис. 3

В порівнянні з ідеальною моделлю залишки не мають .

Отже, разом з порушенням припущення про постійну дисперсію залишків порушується й припущення про нормальний розподіл залишків.

Якщо залишки не мають нормального розподілу, то використовувати МНК-метод для оцінки параметрів регресії неприпустимо (МНК-оцінки не збігаються з ММП-оцінками).

Розглянемо модель лінійної регресії, в якій спостереження величини залежні, тобто припущення (7) місця не має.

Проведемо стохастичний експеримент, який полягає в моделюванні спостережень згідно з моделлю

(10)

Результати експерименту наведено на рисунку 4.

Рис. 4

В порівнянні з ідеальною моделлю

1) регресія незначуща;

2) гіпотези , відхиляються;

3) дисперсія залишків змінна величина;

4) залишки не мають .

Отже, разом з порушенням припущення про незалежність спостережень , порушуються й припущення про постійність дисперсії залишків і припущення про нормальний розподіл залишків. Такі порушення неприпустимі.

Розглянемо модель лінійної регресії, в якій спостереження рівномірно розподілені, тобто припущення (6) місця не має.

Проведемо стохастичний експеримент, який полягає в моделюванні спостережень згідно з моделлю

(11)

Результати експерименту наведено на рисунку 5.

Рис. 5

В порівнянні з ідеальною моделлю

1) гіпотези , відхиляються;

2) дисперсія залишків змінна величина.

Отже, разом з порушенням припущення про нормальний розподіл залишків, порушується й припущення про постійність дисперсії залишків.

Розглянемо модель лінійної регресії, в якій спостереження показниково розподілені, тобто припущення (6) місця не має.

Проведемо стохастичний експеримент, який полягає в моделюванні спостережень згідно з моделлю

(12)

Результати експерименту наведено на рисунку 6.

Рис. 6

В порівнянні з ідеальною моделлю,

1) лінійна регресія незначуща;

2) гіпотези відхиляються;

3) дисперсія залишків змінна величина.

Отже, разом з порушенням припущення про нормальний розподіл залишків, порушується й припущення про постійність дисперсії залишків.

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

1. Дрейпер Н., Смит Г. Прикладной регрессионный анализ. - М.: Статистика, 1973.

2. Линник Ю.В. Метод наименьших квадратов и основы математико-статистической теории обработки наблюдений, 2-е изд. - М.: Физматгиз, 1962.

3. Рао С.Р. Линейные статистические методы и их применение. - М.: Наука, 1968.

4. Себер Дж. Линейный регрессионный анализ. - М: Мир, 1980.


Подобные документы

  • Дослідження тенденцій захворюваності на туберкульоз (усі форми), рак, СНІД, гепатити А та Б в двадцяти чотирьох областях України, Криму, містах Києві та Севастополі в період з 1990 по 2005 роки шляхом застосування методів лінійного регресійного аналізу.

    дипломная работа [5,7 M], добавлен 12.08.2010

  • Перевірка гіпотези про нормальний розподіл параметрів загального аналізу крові для компенсованого, субкомпенсованого та декомпенсованого станів за кишкової непрохідності. Перевірки гіпотез про рівність середніх значень та про незалежність параметрів.

    курсовая работа [3,8 M], добавлен 13.08.2010

  • Обчислення оцінок основних статистичних характеристик: середнього значення, середнього квадратичного відхилення результатів, дисперсії розсіювання результатів вимірювань, коефіцієнта асиметрії. Перевірка наявніості похибок за коефіцієнтом Стьюдента.

    контрольная работа [245,5 K], добавлен 25.02.2011

  • Поняття лінійного оператора, алгебраїчні операції над ним та базові властивості. Лінійні перетворення (оператори) із простору V в W. Матриця лінійного оператора. Перетворення матриці оператора при заміні базису. власні значення і власні вектори.

    курсовая работа [452,3 K], добавлен 25.03.2011

  • Послідовність графічного розв'язання задачі лінійного програмування. Сумісна система лінійних нерівностей, умови невід'ємності, визначення півплощини з граничними прямими. Графічний метод для визначення оптимального плану задачі лінійного програмування.

    задача [320,6 K], добавлен 31.05.2010

  • Метод відношення правдоподібності для великих вибірок як один із способів перевірки параметричних статистичних гіпотез. Теоретичне обґрунтування даної методики, визначення її основних недоліків та програмне тестування припущення розглянутого критерію.

    курсовая работа [1,2 M], добавлен 23.12.2010

  • Сутність інтерполяційних поліномів. Оцінка похибок інтерполяційних формул, їх застосування. Програма обчислення наближених значень функції у випадку, коли функція задана таблично, використовуючи інтерполяційні формули для рівновіддалених вузлів.

    курсовая работа [956,4 K], добавлен 29.04.2011

  • Розв'язок задач лінійного програмування симплексним методом, графічне вирішення системи нерівностей, запис двоїстої задачі: визначення прибутку, отриманого підприємством від реалізації виробів; загальних витрат, пов’язаних з транспортуванням продукції.

    контрольная работа [296,0 K], добавлен 28.03.2011

  • Побудова сіткової функції при чисельному інтегруванні по заданій підінтегральній функції. Визначення формул прямокутників та трапецій; оцінка їх похибок. Використання методики інтегрування за методом трапецій для обчислення визначеного інтеграла.

    презентация [617,4 K], добавлен 06.02.2014

  • Визначення основних понять і вивчення методів аналізу безкінечно малих величин. Техніка диференціального і інтегрального числення і вирішення прикладних завдань. Визначення меж числової послідовності і функції аргументу. Обчислення інтегралів.

    курс лекций [570,1 K], добавлен 14.03.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.