Регрессионный и корреляционный анализ
Определение задачи регрессионного анализа как установления формы корреляционной связи (линейной, квадратичной, показательной). Графическая интерпретация коэффициента детерминации. Виды регрессий: линейная, нелинейная, гипербола, экспонента и парабола.
Рубрика | Экономико-математическое моделирование |
Вид | доклад |
Язык | русский |
Дата добавления | 13.12.2011 |
Размер файла | 131,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
АО "Финансовая академия"
ДОКЛАД
Тема: Регрессионный и корреляционный анализ
Выполнила: Садуова Э.Е.,
Фмп-12
Проверила: Искакова З.Д.,
д.э.н., профессор
Астана 2011
План
1. Теоретическое введение
2. Методические рекомендации
3. Основные виды регрессий
1. Теоретическое введение
Регрессионный и корреляционный анализ позволяет установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин X, и делать прогнозы значений Y. Параметр Y, значение которого нужно предсказывать, является зависимой переменной. Параметр X, значения которого нам известны заранее и который влияет на значения Y, называется независимой переменной. Например, X - количество внесенных удобрений, Y - снимаемый урожай; X - величина затрат компании на рекламу своего товара, Y - объем продаж этого товара и т.д.
Корреляционная зависимость Y от X - это функциональная зависимость
, |
(1.1) |
где - среднее арифметическое (условное среднее) всех возможных значений параметра Y, которые соответствуют значению . Уравнение (1.1) называется уравнением регрессии Y на X, функция - регрессией Y на X, а ее график - линией регрессии Y на X.
Основная задача регрессионного анализа - установление формы корреляционной связи, т.е. вида функции регрессии (линейная, квадратичная, показательная и т.д.).
Метод наименьших квадратов позволяет определить коэффициенты уравнения регрессии таким образом, чтобы точки, построенные по исходным данным , лежали как можно ближе к точкам линии регрессии (1.1). Формально это записывается как минимизация суммы квадратов отклонений (ошибок) функции регрессии и исходных точек
,
регрессионный корреляционный детерминация экспонента
где - значение, вычисленное по уравнению регрессии; - отклонение (ошибка, остаток) (рис.9.1); n - количество пар исходных данных.
Рис.1.1. Понятие отклонения для случая линейной регрессии
В регрессионном анализе предполагается, что математическое ожидание случайной величины равно нулю и ее дисперсия одинакова для всех наблюдаемых значений Y. Отсюда следует, что рассеяние данных возле линии регрессии должно быть одинаково при всех значениях параметра X. В случае, показанном на рис.1.2 данные распределяются вдоль линии регрессии неравномерно, поэтому метод наименьших квадратов в этом случае неприменим.
Рис.1.2. Неравномерное распределение исходных точек вдоль линии регрессии
Основная задача корреляционного анализа - оценка тесноты (силы) корреляционной связи. Теснота корреляционной зависимости Y от X оценивается по величине рассеяния значений параметра Y вокруг условного среднего . Большое рассеяние говорит о слабой зависимости Y от X, либо об ее отсутствии и, наоборот, малое рассеяние указывает на наличие достаточно сильной зависимости.
Коэффициент детерминации показывает, на сколько процентов () найденная функция регрессии описывает связь между исходными значениями параметров X и Y
, |
(1.2) |
где - объясненная вариация; - общая вариация (рис.1.3).
Рис.1.3. Графическая интерпретация коэффициента детерминации для случая линейной регрессии
Соответственно, величина показывает, сколько процентов вариации параметра Y обусловлены факторами, не включенными в регрессионную модель. При высоком () значении коэффициента детерминации можно делать прогноз для конкретного значения .
2. Методические рекомендации
Для проведения регрессионного анализа и прогнозирования необходимо:
1) построить график исходных данных и попытаться зрительно, приближенно определить характер зависимости;
2) выбрать вид функции регрессии, которая может описывать связь исходных данных;
3) определить численные коэффициенты функции регрессии;
4) оценить силу найденной регрессионной зависимости на основе коэффициента детерминации ;
5) сделать прогноз (при ) или сделать вывод о невозможности прогнозирования с помощью найденной регрессионной зависимости. При этом не рекомендуется использовать модель регрессии для тех значений независимого параметра X, которые не принадлежат интервалу, заданному в исходных данных.
3. Основные виды регрессий
Линейная регрессия
Коэффициенты линейной регрессии вычисляются по следующим формулам (все суммы берутся по n парам исходных данных)
(1.3) |
||
. |
Для удобства вычислений используют вспомогательную таблицу (табл.1.1), в которой рассчитываются необходимые суммы.
Таблица 1.1 Вспомогательная таблица для линейной функции
Заголовки данных |
||||||||
Промежуточные значения |
||||||||
... |
... |
... |
... |
... |
... |
... |
||
Сумма () по столбцу |
- |
Нелинейная регрессия
Рассмотрим наиболее простые случаи нелинейной регрессии: гиперболу, экспоненту и параболу. При нахождении коэффициентов гиперболы и экспоненты используют прием приведения нелинейной регрессионной зависимости к линейному виду. Это позволяет использовать для вычисления коэффициентов функций регрессии формулы (9.3).
Гипербола
При нахождении гиперболы вводят новую переменную , тогда уравнение гиперболы принимает линейный вид . После этого используют формулы (1.3) для нахождений линейной функции, но вместо значений используются значения
; .
При проведении вычислений во вспомогательную таблицу вносятся соответствующие колонки.
Экспонента
Для приведения к линейному виду экспоненты проведем логарифмирование
;
;
.
Введем переменные и , тогда , откуда следует, что можно применять формулы (9.3), в которых вместо значений надо использовать
; .
При этом мы получим численные значения коэффициентов и , от которых надо перейти к и , используемых в модели экспоненты. Исходя из введенных обозначений и определения логарифма, получаем
, .
Парабола
Для нахождения коэффициентов параболы необходимо решить линейную систему из трех уравнений
Оценка силы нелинейной регрессионной связи
Сила регрессионной связи для гиперболы и параболы определяется непосредственно по формуле (1.2). При вычислении коэффициента детерминации экспоненты все значения параметра Y (исходные, регрессионные, среднее) необходимо заменить на их логарифмы, например, - на и т.д.
Список используемой литературы
1. Мхитарян В.С., Архипова М.Ю., Сиротин В.П., Эконометрика. Учебно-методический комплекс, Москва, 2008.
2. Михайлина Т.М., Федоров М.Е., Корреляционно-регрессинный анализ. Учебное-методическое пособие, Краснодар, 2002.
Размещено на Allbest.ru
Подобные документы
Оценка тесноты связи с помощью показателей корреляции и детерминации. Построение поля корреляции и расчёт параметров линейной регрессии. Результаты вычисления функций и нахождение коэффициента детерминации. Регрессионный анализ и прогнозирование.
курсовая работа [1,1 M], добавлен 07.08.2011Связь между случайными переменными и оценка её тесноты как основная задача корреляционного анализа. Регрессионный анализ, расчет параметров уравнения линейной парной регрессии. Оценка статистической надежности результатов регрессионного моделирования.
контрольная работа [50,4 K], добавлен 07.06.2011Виды проявления количественных связей между признаками. Определения функциональной и корреляционной связи. Практическое значение установления, направление и сила корреляционной связи. Метод квадратов (метод Пирсона), ранговый метод (метод Спирмена).
презентация [173,6 K], добавлен 19.04.2015Поиск несмещенных оценок математического ожидания и для дисперсии X и Y. Расчет выборочного коэффициента корреляции, анализ степени тесноты связи между X и Y. Проверка гипотезы о силе линейной связи между X и Y, о значении параметров линейной регрессии.
контрольная работа [19,2 K], добавлен 25.12.2010Группировка предприятий по среднегодовой стоимости производственных фондов. Сглаживание скользящей средней и ее центрирование. Определение коэффициента линейной регрессионной модели и показателей детерминации. Коэффициенты эластичности и их интерпретация.
контрольная работа [493,4 K], добавлен 06.05.2015Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.
контрольная работа [4,2 M], добавлен 14.06.2014Построение классической нормальной линейной регрессионной модели. Проведение корреляционно-регрессионного анализа уровня безработицы - социально-экономической ситуации, при которой часть активного, трудоспособного населения не может найти работу.
реферат [902,8 K], добавлен 15.03.2015Понятие регрессии. Оценка параметров модели. Показатели качества регрессии. Проверка статистической значимости в парной линейной регрессии. Реализация регрессионного анализа в программе MS Excel. Условия Гаусса-Маркова. Свойства коэффициента детерминации.
курсовая работа [233,1 K], добавлен 21.03.2015Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Понятие корреляционной связи. Связь между качественными признаками на основе таблиц сопряженности. Показатели тесноты связи между двумя количественными признаками. Определение коэффициентов уравнения линейной регрессии методом наименьших квадратов.
контрольная работа [418,7 K], добавлен 22.09.2010