Регрессионный анализ
Функциональные и стохастические связи. Статистические методы моделирования связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Проверка адекватности регрессионной модели.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 04.09.2007 |
Размер файла | 214,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
34
Содержание
Введение ………………………………………………………………………..…2
1. Основные понятия …………………………………………………………......3
1.1. Функциональные и стохастические связи ……………………………….....8
1.2. Статистические методы моделирования связи …………………………...12
1.3. Статистическое моделирование связи методом корреляционного и регрессионного анализа ………………………………………………………...13
2. Проверка адекватности регрессионной модели ……………………………18
3. Практическая часть …………………………………………………………..25
3.1. Оценка значимости коэффициентов регрессии …………………………..27
3.2. Проверка адекватности модели по критерию Фишера …………………..29
3.3. Проверка адекватности модели по коэффициенту детерминации или множественной корреляции ……………………………………………………30
Заключение ………………………………………………………………………34
Использованная литература ……………………………………………………35
Введение
В экономических исследованиях часто решают задачу выявления факторов, определяющих уровень и динамику экономического процесса. Такая задача чаще всего решается методами корреляционного, регрессионного, факторного и компонентного анализа. ?????? ?????????????? ??????? ??????? ? ?????????? ??????, ??????????? ?? ????????? ??????????? ??????????? ???????? ?????? ???????? ????????? ??????????. ????????????? ?????? ???????? ???????? ????????? ???????????? ???????????? ????? ?????????-?????????????? ???????????. ??? ?????? ?? ?????????? ? ?????? ????? ???????????????? ? ?????????????? ??????? ???????????? ?????? ???????? ?????????. ????????? ??????????????? ???????????? ??????? ? ???, ??? ????? ????? ?????????? ??????? ? ????????????? ?????????? ???????. ?????? ????? ?????? ????? ????? ????????? ?????????, ????? ??????? ???????? ?????????? ???????, ??????????????? ??????????? ???????. ???????? ?????????? ??????? ?????????. ?????? ?????????????? ??????????, ????????? ? ????????????? ????????, ??????? ? ?????????????, ??? ????????????? ?????? ???????????? ????????? ? ???????????, ?????? ??? ????????? ???????? ????????? ????????????. ????? ????, ? ?????? ?????? ?? ????????????? ?????????? ??? ??????????? ????????. ?????, ?? ????????, ??????????, ????? ???? ???????? ???????????, ? ??????? ?????? ???????? (????????, ????????? ???????? ?????????), ? ????? ???????? (???????, ????? ????? ?????????????????? ?????).
Все многообразие факторов, которые воздействуют на изучаемый процесс, можно разделить на две группы: главные (определяющие уровень изучаемого процесса) и второстепенные. Последние часто имеют случайный характер, определяя специфические и индивидуальные особенности каждого объекта исследования. ?????? ??? ????????? ??????????? ????? ???????????, ???? ??????????????? ?????????? ? ?????????? ????????? ????????? ??? ????????????????? ??????????, ?? ?????? ????????????? ????????? ???????? ?? ?? ?????????? ???????? ?????? ? ???, ????? ???????? ? ??????? ??????? ?????? ?? ???????. ?????????????? ??????????. ???? ????????????. ???????????? ? ????????? ????????? ???????? ??? ?????????? ????????? ????????? ???? ?????????? ? ????????. ? ?????? ??????????? ????? ??????????? ? ?????? ????? ????????? ????? ??????????? ???????? ????. ?????????? ? ?????????? ???????????? ?????????. ????? ????????? ??????????? ????????????, ?????????? ??? ?????????? ????????? ?????????, ? ??????? ? ???????? ????????? ?????????? ????? ?????? ??????????. ?? ????????? ?????, ??? ???????? ???????????? ??? ????????????, ??? ??????? ?????????? ??????? ? ?????????? ???????????. ??? ?????????? ????? ????????????? ?????????. ? ?????? ?????? ?????????? ??????????? ?? ???????????? ?????????? - ??????????? ???????? ??? ??????? ????????????? ???????????? ???????? ???????? ??????????, ??????? ?? ?????????? ????????, ??? ??????????. ?????????? ????????? ?????????? ? ?????????. ??? ???????????????? ??????? ?????????? ????????????? ?????????????, ?????????? ?? ?????????? ????????? ? ?????????? ??????????.
Взаимодействие главных и второстепенных факторов и определяет колеблемость исследуемого процесса. В этом взаимодействии синтезируется как необходимое, типическое, определяющее закономерность изучаемого явления, так и случайное, характеризующее отклонение от этой закономерности. Случайные отклонения неизбежно сопутствуют любому закономерному явлению. ?? ??? ?????? ????????? ?????????? ???????? ????????. ?????? ????????????? ????????? ?? ?????????? ???????????? ??????????? ???????, ?? ????????, ???, ??? ??????? ????? ??????????, ????????????? ?????? ?????????????? ?????????. ??? ????????? ?????? ????????????? ????????? ?????????????? ????? ????????? ?????? ?????????. ? ?????? ??????????? ??????????, ??????????? ?????? ??? ??????. ?????????? ?? ???????? ????????????? ???????????? ??? ???????? ?????????????? ??????? ???? ????????????? ????????? ?? ???? ???????? ?????? ????????????? ???????? ???????? ????????? ?????????? ???????????? ????????. ??? ????? ????????? ?? ??? ????? ????????? ???????. ?????????? ? ???????? ???????? ????????? ???? ????????????? ????????????? ????? ????????????? ?????? ?, ???????????, ?? ???? ?????????? ?????????, ???????? ?? ???????????? ???????????? ????????. ???????????? ???????????? ? ????????????? ??????????. ??? ????????? ???????? ?????????, ????????? ?? ????????? ????????? ??????????, ??????? ??????????? ???? ??????????? ? ????????????? ?????????. ?????? ?? ???????????? ???????????? ?????????? ????????????? ??????????. ??????? ????? ? ????, ??? ???????? ????????? ???????. ?????????? ???????? ????????????? ?? ????????? ??????? ????? ?????.
Для достоверного отображения объективно существующих в экономике процессов необходимо выявить существенные взаимосвязи и не только выявить, но и дать им количественную оценку. Этот подход требует вскрытия причинных зависимостей. Под причинной зависимостью понимается такая связь между процессами, когда изменение одного из них является следствием изменения другого.[4]
Не все факторы, влияющие на экономические процессы, являются случайными величинами. Поэтому при анализе экономических явлений обычно рассматриваются связи между случайными и неслучайными величинами. Такие связи называются регрессионными, а метод математической статистики, их изучающий, называется регрессионным анализом. ??????????, ??? ???????????? ????? ??? ??????????. ????????? ??????????? ????????????, ?????????? ??? ?????????? ?? ?????? ????? ????????? ??????????. ??? ???? ?? ??????? ?????????? ??????????? ?????????, ?? ????????. ??? ?????? ?????????? ????????? ?????????? ???????????? ??????????, ??????? ????????????? ?????? ??? ??????? ????????????? ????????. ??????, ???? ?? ????????? ????????? ??????????? ??????????, ??????????? ?????????? ?????????? ?????. ????????? ????????? ?????????? ??????. ???????? ????????? ?????? ?????????? ?????? ???? ???????????? ????????????? ? ????????, ???????? ?? ????????? ??????????, ??????? ?? ???????? ?????????????. ????? ?????? ?????????? ??????? ?????????? ????????????? ??????: ?? ?????? ?????????? ???????????? ???? ?????????? ? ??????? ???? ??????. ???????? ?????????? ???????????????? ?????????? ?????? ??????????? ? ????????? ?????? ??????????. ?? ?? ?????????? ?????? ?????? ? ?????????? ???????????. ?? ????????? ????????? ???????? ??? ???????? ??????????.
1. Основные понятия.
С целью математического описания конкретного вида зависимостей с использованием регрессионного анализа подбирают класс функций, связывающих результативный показатель y и аргументы x1, x2,…,хk , отбирают наиболее информативные аргу-менты, вычисляют оценки неизвестных значений параметров уравнения связи и анализируют точность полученного уравнения.[8]
Функция f(x1, x2,…,хk ), описывающая зависимость условного среднего значения результативного признака у от заданных значений аргументов, называется функцией (уравнением) регрессии.
Термин "регрессия" (лат. - "regression" - отступление, возврат к чему-либо) введен английским психологом и антропологом Ф.Гальтпном и связан только со спецификой одного из первых конкретных примеров, в котором это понятие было использовано.
Обрабатывая статистические данные в связи с вопросом о наследственности роста, Ф.Гальтон нашел, что если отцы отклоняются от среднего роста всех отцов на x дюймов, то их сыновья отклоняются от среднего роста всех сыновей меньше, чем на x дюймов. Выявленная тенденция была названа «регрессией к среднему состоянию». ?????? ?????????????? ??????? ??????? ? ?????????? ??????, ??????????? ?? ????????? ??????????? ??????????? ???????? ?????? ???????? ????????? ??????????. ????????????? ?????? ???????? ???????? ????????? ???????????? ???????????? ????? ?????????-?????????????? ???????????. ??? ?????? ?? ?????????? ? ?????? ????? ???????????????? ? ?????????????? ??????? ???????????? ?????? ???????? ?????????. ????????? ??????????????? ???????????? ??????? ? ???, ??? ????? ????? ?????????? ??????? ? ????????????? ?????????? ???????. ?????? ????? ?????? ????? ????? ????????? ?????????, ????? ??????? ???????? ?????????? ???????, ??????????????? ??????????? ???????. ???????? ?????????? ??????? ?????????. ?????? ?????????????? ??????????, ????????? ? ????????????? ????????, ??????? ? ?????????????, ??? ????????????? ?????? ???????????? ????????? ? ???????????, ?????? ??? ????????? ???????? ????????? ????????????. ????? ????, ? ?????? ?????? ?? ????????????? ?????????? ??? ??????????? ????????. ?????, ?? ????????, ??????????, ????? ???? ???????? ???????????, ? ??????? ?????? ???????? (????????, ????????? ???????? ?????????), ? ????? ???????? (???????, ????? ????? ?????????????????? ?????).
Для точного описания уравнения регрессии необходимо знать услов-ный закон распределения результативного показателя у. В статистической практике такую информацию получить обычно не удается, поэтому ограничиваются поиском подходящих аппроксимаций для функции f( x1, x2,…,хk ), основанных на исходных статистических данных.
В рамках отдельных модельных допущений о типе распределения век-тора показателей (у, x1, x2,…,хk ) может быть получен общий вид уравнения регрессии f(x)=M(y/x) x=( x1, x2,…,хk ). Например, в предложении, что исследуемая совокупность показателей подчиняется (k + 1) - мерному нормальному закону распределения с вектором математических ожиданий
M =,
где Mx = , y = MY
и ковариационной матрицей = ,
где yy = 2у = M (y-My);
yx = ; xx = ;
ij = M (xi - Mxi);(xj - Mxj); jj = j = M (xj - Mxj).[12]
Из этого следует, что уравнение регрессии (условное математическое ожидание) имеет вид:
M(y/x) = y + (x - Mx).
Таким образом, если многомерная случайная величина (у, x1, x2,…,хk ) подчиняется (k +1)-мерному нормальному закону распределения, то уравнение регрессии результативного показателя у по объясняющим переменным x1, x2,…,хk имеет линейный по х вид. ????? ????????? ? ?????????? ?????????? ??????? ? ?????????. ?? ????????? ????????, ??????????????? ?????????????? ??? ????????? ????????? ?????????????? ?????????, ?????????? ????, ??????? ????? ????? ?????? ?????????????? ????????????. ????? ?????????? ?? ?? ????????? ??? ???? ????????? ??????????, ??? ???? ? ?.?. ????????? ??????????? ?? ??? ???, ???? ? ????????? ?? ????? ???????? ??? ????????? ?????????? ??????????????, ??????????????? ????????? ?????????? ?????????. ?????????: ?? ????????? ???????????? ???????? ????????? ?????????? ?????????? ????????? ??????????????? ?????? ?????????? ??????????. ??????????, ??????????? ????????????? ??????????. ?????????? ??????????, ??????????? ??????????, ???????????? ???????????. ????????? ?????????? ??????? ????????????? ????????? ????????? ????? ???? ??????? ?????????? ???????? ????????? ??????????, ?????? ??? ????? ???? ????????? ? ???, ??? ???????? ??????????, ? ??? ??? ??? ?? ??????????.
Однако в статистической практике обычно приходится ограничиваться поиском подходящих аппроксимаций для неизвестной истинной функции регрессии f(x), так как исследователь не располагает точным знанием условного закона распределения вероятностей анализируемого результатирующего показателя у при заданных эначениях аргументов х=х.
Рассмотрим взаимоотношение между истиной f(х)= M(y/x), модельной у и оценкой у регрессии. ?????? ??? ????????? ??????????? ????? ???????????, ???? ??????????????? ?????????? ? ?????????? ????????? ????????? ??? ????????????????? ??????????, ?? ?????? ????????????? ????????? ???????? ?? ?? ?????????? ???????? ?????? ? ???, ????? ???????? ? ??????? ??????? ?????? ?? ???????. ?????????????? ??????????. ???? ????????????. ???????????? ? ????????? ????????? ???????? ??? ?????????? ????????? ????????? ???? ?????????? ? ????????. ? ?????? ??????????? ????? ??????????? ? ?????? ????? ????????? ????? ??????????? ???????? ????. ?????????? ? ?????????? ???????????? ?????????. ????? ????????? ??????????? ????????????, ?????????? ??? ?????????? ????????? ?????????, ? ??????? ? ???????? ????????? ?????????? ????? ?????? ??????????. ?? ????????? ?????, ??? ???????? ???????????? ??? ????????????, ??? ??????? ?????????? ??????? ? ?????????? ???????????. ??? ?????????? ????? ????????????? ?????????. ? ?????? ?????? ?????????? ??????????? ?? ???????????? ?????????? - ??????????? ???????? ??? ??????? ????????????? ???????????? ???????? ???????? ??????????, ??????? ?? ?????????? ????????, ??? ??????????. ?????????? ????????? ?????????? ? ?????????. ??? ???????????????? ??????? ?????????? ????????????? ?????????????, ?????????? ?? ?????????? ????????? ? ?????????? ??????????.
Пусть результативный показатель у связан с аргументом х соотноше-нием::
y = + ,
где - случайная величина, имеющая нормальный закон распределения, при-чем М = 0 и
D = .
Истинная функция регрессии в этом случае имеет вид:
F(x) = M(y/x) = 2x.
Предположим, что точный вид истинного уравнения регрессии нам не известен, но мы располагаем девятъю наблюдениями над двумерной случайной величиной, связанной соотношением уi = 2x+ i, и предcтавленной на рисунке:
у
70
60
50
40
30
20
10
0
0 2 4 6 8 10
Взаимное расположение истинной f(x) и теоритической у модели регрессии.
Расположение точек на рисунке позволяет ограничиться классом линейных зависимостей вида: у = 0 + 1 x.[2]
С помощью метода наименьших квадратов найдем оценку уравнения регрессии
у = b0 +b1 x.
Дли сравнения на рисунке приводятся графики истинной функции регрессии f{х) =2x, теоретической аппроксимирующей функции рег-рессии = 0 + 1 x. К последней сходится по вероятности оценка уравнения регрессии при неограниченном увеличении объема выборки (n ).
Поскольку мы ошиблись в выборе класса функции регрессии, что, к сожалению, достаточно часто встречается в практике статистических исследований, то наши статистические выводы и оценки не будут обла-дать свойством состоятельности, т.е., как бы
мы не увеличивали объем наблюдений, наша выборочная оценка не будет сходиться к истинной функции регрессии f(х). ?????? ?????????????? ??????? ??????? ? ?????????? ??????, ??????????? ?? ????????? ??????????? ??????????? ???????? ?????? ???????? ????????? ??????????. ????????????? ?????? ???????? ???????? ????????? ???????????? ???????????? ????? ?????????-?????????????? ???????????. ??? ?????? ?? ?????????? ? ?????? ????? ???????????????? ? ?????????????? ??????? ???????????? ?????? ???????? ?????????. ????????? ??????????????? ???????????? ??????? ? ???, ??? ????? ????? ?????????? ??????? ? ????????????? ?????????? ???????. ?????? ????? ?????? ????? ????? ????????? ?????????, ????? ??????? ???????? ?????????? ???????, ??????????????? ??????????? ???????. ???????? ?????????? ??????? ?????????. ?????? ?????????????? ??????????, ????????? ? ????????????? ????????, ??????? ? ?????????????, ??? ????????????? ?????? ???????????? ????????? ? ???????????, ?????? ??? ????????? ???????? ????????? ????????????. ????? ????, ? ?????? ?????? ?? ????????????? ?????????? ??? ??????????? ????????. ?????, ?? ????????, ??????????, ????? ???? ???????? ???????????, ? ??????? ?????? ???????? (????????, ????????? ???????? ?????????), ? ????? ???????? (???????, ????? ????? ?????????????????? ?????).
Если бы мы правильно выбрали класс функций регрессии, то неточность в описании f(x) с помощью объяснялась бы только ограниченностью выборки и, следовательно, она могла бы быть сделана сколько угодно малой при n .
С целью наилучшего восстановления по исходным статистическим данным условного значения результатирующего показателя у(х) и неизвестной функции регрессии f(x) = M(y/x) наиболее часто используют следующие критерии адекватности (функции потерь).[7]
1. Метод наименьших квадратов, согласно которому минимизируется квадрат отклонения наблюдаемых значений результативного показателя yi(i=1,2,…,n) от модельных значений i = f(xi, ), где = (0, 1,…,k)- коэффициенты уравнения регрессии, xi - значение вектора аргументов в i-м наблюдении:
.
Решается задача отыскания оценки вектора . Получаемая регрессия называется среднеквадратической. ?? ??? ?????? ????????? ?????????? ???????? ????????. ?????? ????????????? ????????? ?? ?????????? ???????????? ??????????? ???????, ?? ????????, ???, ??? ??????? ????? ??????????, ????????????? ?????? ?????????????? ?????????. ??? ????????? ?????? ????????????? ????????? ?????????????? ????? ????????? ?????? ?????????. ? ?????? ??????????? ??????????, ??????????? ?????? ??? ??????. ?????????? ?? ???????? ????????????? ???????????? ??? ???????? ?????????????? ??????? ???? ????????????? ????????? ?? ???? ???????? ?????? ????????????? ???????? ???????? ????????? ?????????? ???????????? ????????. ??? ????? ????????? ?? ??? ????? ????????? ???????. ?????????? ? ???????? ???????? ????????? ???? ????????????? ????????????? ????? ????????????? ?????? ?, ???????????, ?? ???? ?????????? ?????????, ???????? ?? ???????????? ???????????? ????????. ???????????? ???????????? ? ????????????? ??????????. ??? ????????? ???????? ?????????, ????????? ?? ????????? ????????? ??????????, ??????? ??????????? ???? ??????????? ? ????????????? ?????????. ?????? ?? ???????????? ???????????? ?????????? ????????????? ??????????. ??????? ????? ? ????, ??? ???????? ????????? ???????. ?????????? ???????? ????????????? ?? ????????? ??????? ????? ?????.
Подобные документы
Прямолинейные, обратные и криволинейные связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Метод наименьших квадратов. Оценка значимости коэффициентов регрессии. Проверка адекватности модели по критерию Фишера.
курсовая работа [232,7 K], добавлен 21.05.2015Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Первичная обработка статистических данных по количеству зарегистрированных абонентских терминалов сотовой связи за 2008 год на 1000 населения в регионах России. Интервальное оценивание параметров. Гипотеза о виде распределения. Регрессионный анализ.
курсовая работа [439,3 K], добавлен 06.10.2013Анализ влияния радиуса кривошипа на величину максимальной температуры рабочего тела в цилиндре двигателя. Получение функциональной зависимости между данными величинами методом наименьших квадратов. Проверка работоспособности регрессионной модели.
контрольная работа [57,1 K], добавлен 23.09.2010Моделирование входного заданного сигнала, построение графика, амплитудного и фазового спектра. Моделирование шума с законом распределения вероятностей Рэлея, оценка дисперсии отсчетов шума и проверка адекватности модели шума по критерию Пирсона.
курсовая работа [2,3 M], добавлен 25.11.2011Предпосылки корреляционного анализа - математико-статистического метода выявления взаимозависимости компонентов многомерной случайной величины и оценки их связи. Точечные оценки параметров двумерного распределения. Аппроксимация уравнений регрессии.
контрольная работа [648,3 K], добавлен 03.04.2011Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.
курс лекций [759,3 K], добавлен 13.06.2015Алгоритм проведения регрессионного анализа для создания адекватной модели, прогнозирующей цены на бензин на будущий период. Основы разработки программного обеспечения, позволяющего автоматизировать исследования операций в заданной предметной области.
контрольная работа [182,0 K], добавлен 06.02.2013Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.
дипломная работа [5,1 M], добавлен 28.06.2011Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011