Регрессионный анализ
Функциональные и стохастические связи. Статистические методы моделирования связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Проверка адекватности регрессионной модели.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 04.09.2007 |
Размер файла | 214,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Здесь представлены показатели 32 банков: размер капитала и работающих активов. Передо мной стоит задача определить, есть ли зависимость между этими двумя признаками и, если она существует, определить форму этой зависимости, то есть уравнение регрессии.
За факторный признак я взяла размер капитала банка, а за результативный признак - работающие активы. [11]
Сопоставление данных параллельных рядов признаков х и у показывает, что с убыванием признака х (капитал), в большинстве случаев убывает и признак у (работающие активы). ?????? ?????????????? ??????? ??????? ? ?????????? ??????, ??????????? ?? ????????? ??????????? ??????????? ???????? ?????? ???????? ????????? ??????????. ????????????? ?????? ???????? ???????? ????????? ???????????? ???????????? ????? ?????????-?????????????? ???????????. ??? ?????? ?? ?????????? ? ?????? ????? ???????????????? ? ?????????????? ??????? ???????????? ?????? ???????? ?????????. ????????? ??????????????? ???????????? ??????? ? ???, ??? ????? ????? ?????????? ??????? ? ????????????? ?????????? ???????. ?????? ????? ?????? ????? ????? ????????? ?????????, ????? ??????? ???????? ?????????? ???????, ??????????????? ??????????? ???????. ???????? ?????????? ??????? ?????????. ?????? ?????????????? ??????????, ????????? ? ????????????? ????????, ??????? ? ?????????????, ??? ????????????? ?????? ???????????? ????????? ? ???????????, ?????? ??? ????????? ???????? ????????? ????????????. ????? ????, ? ?????? ?????? ?? ????????????? ?????????? ??? ??????????? ????????. ?????, ?? ????????, ??????????, ????? ???? ???????? ???????????, ? ??????? ?????? ???????? (????????, ????????? ???????? ?????????), ? ????? ???????? (???????, ????? ????? ?????????????????? ?????).
Следовательно, можно предположить, что между х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.
Для уточнения формы связи между рассматриваемыми признаками я использовала графический метод. Я нанес на график точки, соответствующие значениям х и у, и получила корреляционное поле (см. график 1). ????? ????????? ? ?????????? ?????????? ??????? ? ?????????. ?? ????????? ????????, ??????????????? ?????????????? ??? ????????? ????????? ?????????????? ?????????, ?????????? ????, ??????? ????? ????? ?????? ?????????????? ????????????. ????? ?????????? ?? ?? ????????? ??? ???? ????????? ??????????, ??? ???? ? ?.?. ????????? ??????????? ?? ??? ???, ???? ? ????????? ?? ????? ???????? ??? ?????????, ?????????? ??????????????, ??????????????? ????????? ?????????? ?????????. ?????????: ?? ????????? ???????????? ???????? ????????? ?????????? ?????????? ????????? ??????????????? ?????? ?????????? ??????????. ??????????, ??????????? ????????????? ??????????. ?????????? ??????????, ??????????? ??????????, ???????????? ???????????. ????????? ?????????? ??????? ????????????? ????????? ????????? ????? ???? ??????? ?????????? ???????? ????????? ??????????, ?????? ??? ????? ???? ????????? ? ???, ??? ???????? ??????????, ? ??? ??? ??? ?? ??????????.
Анализируя поле корреляции, можно предположить, что возрастание признака у идет пропорционально признаку х. В основе этой зависимости лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:
y = a0 + a1x,
где y - теоретические расчётные значения результативного признака (работающие активы), полученные по уравнению регрессии;
a0 , a1 - коэффициенты (параметры) уравнения регрессии;
х - капитал исследуемых банков.
Пользуясь вышеуказанными формулами для вычисления параметров линейного уравнения регрессии и расчётными значениями из таблицы 1, получаем:
Следовательно, регрессионная модель зависимости работающих активов от капитала банков может быть записана в виде конкретного простого уравнения регрессии:
.[4]
Это уравнение характеризует зависимость работающих активов от капитала банка. Расчётные значения y , найденные по этому уравнению, приведены в таблице 1. Правильность расчёта параметров уравнения регрессии может быть проверена сравниванием сумм ?у = ?y . В моем случае эти суммы равны. ?????? ??? ????????? ??????????? ????? ???????????, ???? ??????????????? ?????????? ? ?????????? ????????? ????????? ??? ????????????????? ??????????, ?? ?????? ????????????? ????????? ???????? ?? ?? ?????????? ???????? ?????? ? ???, ????? ???????? ? ??????? ??????? ?????? ?? ???????. ?????????????? ??????????. ???? ????????????. ???????????? ? ????????? ????????? ???????? ??? ?????????? ????????? ????????? ???? ?????????? ? ????????. ? ?????? ??????????? ????? ??????????? ? ?????? ????? ????????? ????? ??????????? ???????? ????. ?????????? ? ?????????? ???????????? ?????????. ????? ????????? ??????????? ????????????, ?????????? ??? ?????????? ????????? ?????????, ? ??????? ? ???????? ????????? ?????????? ????? ?????? ??????????. ?? ????????? ?????, ??? ???????? ???????????? ??? ????????????, ??? ??????? ?????????? ??????? ? ?????????? ???????????. ??? ?????????? ????? ????????????? ?????????. ? ?????? ?????? ?????????? ??????????? ?? ???????????? ?????????? - ??????????? ???????? ??? ??????? ????????????? ???????????? ???????? ???????? ??????????, ??????? ?? ?????????? ????????, ??? ??????????. ?????????? ????????? ?????????? ? ?????????. ??? ???????????????? ??????? ?????????? ????????????? ?????????????, ?????????? ?? ?????????? ????????? ? ?????????? ??????????.
Но для того, чтобы применить мою формулу, надо рассчитать, насколько она приближенна к реальности, то есть проверить ее адекватность.
2. Проверка адекватности регрессионной модели.
Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.
Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции - параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин. ?????? ?????????????? ??????? ??????? ? ?????????? ??????, ??????????? ?? ????????? ??????????? ??????????? ???????? ?????? ???????? ????????? ??????????. ????????????? ?????? ???????? ???????? ????????? ???????????? ???????????? ????? ?????????-?????????????? ???????????. ??? ?????? ?? ?????????? ? ?????? ????? ???????????????? ? ?????????????? ??????? ???????????? ?????? ???????? ?????????. ????????? ??????????????? ???????????? ??????? ? ???, ??? ????? ????? ?????????? ??????? ? ????????????? ?????????? ???????. ?????? ????? ?????? ????? ????? ????????? ?????????, ????? ??????? ???????? ?????????? ???????, ??????????????? ??????????? ???????. ???????? ?????????? ??????? ?????????. ?????? ?????????????? ??????????, ????????? ? ????????????? ????????, ??????? ? ?????????????, ??? ????????????? ?????? ???????????? ????????? ? ???????????, ?????? ??? ????????? ???????? ????????? ????????????. ????? ????, ? ?????? ?????? ?? ????????????? ?????????? ??? ??????????? ????????. ?????, ?? ????????, ??????????, ????? ???? ???????? ???????????, ? ??????? ?????? ???????? (????????, ????????? ???????? ?????????), ? ????? ???????? (???????, ????? ????? ?????????????????? ?????).
Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия
для параметра a0 :
для параметра a1 :
где n - объём выборки;
- среднее квадратическое отклонение результативного признака от выравненных значений y ;
или
- среднее квадратическое отклонение факторного признака x от общей средней . [8]
Вычисленные по вышеприведенным формулам значения сравнивают с критическими t , которые определяют по таблице Стьюдента с учетом принятого уровня значимости б и числом степеней свободы вариации . В социально-экономических исследованиях уровень значимости б обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч> tтабл . В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями. ?? ??? ?????? ????????? ?????????? ???????? ????????. ?????? ????????????? ????????? ?? ?????????? ???????????? ??????????? ???????, ?? ????????, ???, ??? ??????? ????? ??????????, ????????????? ?????? ?????????????? ?????????. ??? ????????? ?????? ????????????? ????????? ?????????????? ????? ????????? ?????? ?????????. ? ?????? ??????????? ??????????, ??????????? ?????? ??? ??????. ?????????? ?? ???????? ????????????? ???????????? ??? ???????? ?????????????? ??????? ???? ????????????? ????????? ?? ???? ???????? ?????? ????????????? ???????? ???????? ????????? ?????????? ???????????? ????????. ??? ????? ????????? ?? ??? ????? ????????? ???????. ?????????? ? ???????? ???????? ????????? ???? ????????????? ????????????? ????? ????????????? ?????? ?, ???????????, ?? ???? ?????????? ?????????, ???????? ?? ???????????? ???????????? ????????. ???????????? ???????????? ? ????????????? ??????????. ??? ????????? ???????? ?????????, ????????? ?? ????????? ????????? ??????????, ??????? ??????????? ???? ??????????? ? ????????????? ?????????. ?????? ?? ???????????? ???????????? ?????????? ????????????? ??????????. ??????? ????? ? ????, ??? ???????? ????????? ???????. ?????????? ???????? ????????????? ?? ????????? ??????? ????? ?????.
Теперь я рассчитаю t-критерий Стьюдента для моей модели регрессии.
- это средние квадратические отклонения.
Расчетные значения t-критерия Стьюдента:
По таблице распределения Стьюдента я нахожу критическое значение t-критерия для н= 32-2 = 30 . Вероятность б я принимаю 0,05. tтабл равно 2,042. Так как, оба значения ta0 и ta1 больше tтабл , то оба параметра а0 и а1 признаются значимыми и отклоняется гипотеза о том, что каждый из этих параметров в действительности равен 0 , и лишь в силу случайных обстоятельств оказался равным проверяемой величине.
Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением зэ , когда д2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней:.
Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения - теоретическое. ??????????, ??? ???????????? ????? ??? ??????????. ????????? ??????????? ????????????, ?????????? ??? ?????????? ?? ?????? ????? ????????? ??????????. ??? ???? ?? ??????? ?????????? ??????????? ?????????, ?? ????????. ??? ?????? ?????????? ????????? ?????????? ???????????? ??????????, ??????? ????????????? ?????? ??? ??????? ????????????? ????????. ??????, ???? ?? ????????? ????????? ??????????? ??????????, ??????????? ?????????? ?????????? ?????. ????????? ????????? ?????????? ??????. ???????? ????????? ?????? ?????????? ?????? ???? ???????????? ????????????? ? ????????, ???????? ?? ????????? ??????????, ??????? ?? ???????? ?????????????. ????? ?????? ?????????? ??????? ?????????? ????????????? ??????: ?? ?????? ?????????? ???????????? ???? ?????????? ? ??????? ???? ??????. ???????? ?????????? ???????????????? ?????????? ?????? ??????????? ? ????????? ?????? ??????????. ?? ?? ?????????? ?????? ?????? ? ?????????? ???????????. ?? ????????? ????????? ???????? ??? ???????? ??????????.
Теоретическое корреляционное отношение з представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных значений результативного признака д, то есть рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативности признака у:
,
где ; .
Тогда . [2]
Изменение значения з объясняется влиянием факторного признака. ????? ????????? ? ?????????? ?????????? ??????? ? ?????????. ?? ????????? ????????, ??????????????? ?????????????? ??? ????????? ????????? ?????????????? ?????????, ?????????? ????, ??????? ????? ????? ?????? ?????????????? ????????????. ????? ?????????? ?? ?? ????????? ??? ???? ????????? ??????????, ??? ???? ? ?.?. ????????? ??????????? ?? ??? ???, ???? ? ????????? ?? ????? ???????? ??? ?????????, ?????????? ??????????????, ??????????????? ????????? ?????????? ?????????. ?????????: ?? ????????? ???????????? ???????? ????????? ?????????? ?????????? ????????? ??????????????? ?????? ?????????? ??????????. ??????????, ??????????? ????????????? ??????????. ?????????? ??????????, ??????????? ??????????, ???????????? ???????????. ????????? ?????????? ??????? ????????????? ????????? ????????? ????? ???? ??????? ?????????? ???????? ????????? ??????????, ?????? ??? ????? ???? ????????? ? ???, ??? ???????? ??????????, ? ??? ??? ??? ?? ??????????.
В основе расчёта корреляционного отношения лежит правило сложения дисперсий, то есть , где - отражает вариацию у за счёт всех остальных факторов, кроме х , то есть являются остаточной дисперсией:
.
Тогда формула теоретического корреляционного отношения примет вид:
,
или .
Подкоренное выражение корреляционного выражения представляет собой коэффициент детерминации (мера определенности, причинности).
Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора. ?????? ?????????????? ??????? ??????? ? ?????????? ??????, ??????????? ?? ????????? ??????????? ??????????? ???????? ?????? ???????? ????????? ??????????. ????????????? ?????? ???????? ???????? ????????? ???????????? ???????????? ????? ?????????-?????????????? ???????????. ??? ?????? ?? ?????????? ? ?????? ????? ???????????????? ? ?????????????? ??????? ???????????? ?????? ???????? ?????????. ????????? ??????????????? ???????????? ??????? ? ???, ??? ????? ????? ?????????? ??????? ? ????????????? ?????????? ???????. ?????? ????? ?????? ????? ????? ????????? ?????????, ????? ??????? ???????? ?????????? ???????, ??????????????? ??????????? ???????. ???????? ?????????? ??????? ?????????. ?????? ?????????????? ??????????, ????????? ? ????????????? ????????, ??????? ? ?????????????, ??? ????????????? ?????? ???????????? ????????? ? ???????????, ?????? ??? ????????? ???????? ????????? ????????????. ????? ????, ? ?????? ?????? ?? ????????????? ?????????? ??? ??????????? ????????. ?????, ?? ????????, ??????????, ????? ???? ???????? ???????????, ? ??????? ?????? ???????? (????????, ????????? ???????? ?????????), ? ????? ???????? (???????, ????? ????? ?????????????????? ?????).
Теоретическое корреляционное выражение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком.
Как видно из вышеприведенных формул корреляционное отношение может находиться от 0 до 1. Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.
Теоретическое корреляционное отношение применительно к моему анализу я рассчитаю двумя способами:
[5]
Полученное значение теоретического корреляционного отношения свидетельствует о возможном наличии среднестатистической связи между рассматриваемыми признаками. Коэффициент детерминации равен 0,62. Отсюда я заключаю, что 62% общей вариации работающих активов изучаемых банков обусловлено вариацией фактора - капитала банков (а 38% общей вариации нельзя объяснить изменением размера капитала).
Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи - линейный коэффициент корреляции:
,
где n - число наблюдений.
Для практических вычислений при малом числе наблюдений (n?20ч30) линейный коэффициент корреляции удобнее исчислять по следующей формуле:
.
Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1? r ? 1.
Отрицательные значения указывают на обратную связь, положительные - на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, при r = ±1 - связь функциональная. ?????? ?????????????? ??????? ??????? ? ?????????? ??????, ??????????? ?? ????????? ??????????? ??????????? ???????? ?????? ???????? ????????? ??????????. ????????????? ?????? ???????? ???????? ????????? ???????????? ???????????? ????? ?????????-?????????????? ???????????. ??? ?????? ?? ?????????? ? ?????? ????? ???????????????? ? ?????????????? ??????? ???????????? ?????? ???????? ?????????. ????????? ??????????????? ???????????? ??????? ? ???, ??? ????? ????? ?????????? ??????? ? ????????????? ?????????? ???????. ?????? ????? ?????? ????? ????? ????????? ?????????, ????? ??????? ???????? ?????????? ???????, ??????????????? ??????????? ???????. ???????? ?????????? ??????? ?????????. ?????? ?????????????? ??????????, ????????? ? ????????????? ????????, ??????? ? ?????????????, ??? ????????????? ?????? ???????????? ????????? ? ???????????, ?????? ??? ????????? ???????? ????????? ????????????. ????? ????, ? ?????? ?????? ?? ????????????? ?????????? ??? ??????????? ????????. ?????, ?? ????????, ??????????, ????? ???? ???????? ???????????, ? ??????? ?????? ???????? (????????, ????????? ???????? ?????????), ? ????? ???????? (???????, ????? ????? ?????????????????? ?????).
Подобные документы
Прямолинейные, обратные и криволинейные связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Метод наименьших квадратов. Оценка значимости коэффициентов регрессии. Проверка адекватности модели по критерию Фишера.
курсовая работа [232,7 K], добавлен 21.05.2015Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Первичная обработка статистических данных по количеству зарегистрированных абонентских терминалов сотовой связи за 2008 год на 1000 населения в регионах России. Интервальное оценивание параметров. Гипотеза о виде распределения. Регрессионный анализ.
курсовая работа [439,3 K], добавлен 06.10.2013Анализ влияния радиуса кривошипа на величину максимальной температуры рабочего тела в цилиндре двигателя. Получение функциональной зависимости между данными величинами методом наименьших квадратов. Проверка работоспособности регрессионной модели.
контрольная работа [57,1 K], добавлен 23.09.2010Моделирование входного заданного сигнала, построение графика, амплитудного и фазового спектра. Моделирование шума с законом распределения вероятностей Рэлея, оценка дисперсии отсчетов шума и проверка адекватности модели шума по критерию Пирсона.
курсовая работа [2,3 M], добавлен 25.11.2011Предпосылки корреляционного анализа - математико-статистического метода выявления взаимозависимости компонентов многомерной случайной величины и оценки их связи. Точечные оценки параметров двумерного распределения. Аппроксимация уравнений регрессии.
контрольная работа [648,3 K], добавлен 03.04.2011Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.
курс лекций [759,3 K], добавлен 13.06.2015Алгоритм проведения регрессионного анализа для создания адекватной модели, прогнозирующей цены на бензин на будущий период. Основы разработки программного обеспечения, позволяющего автоматизировать исследования операций в заданной предметной области.
контрольная работа [182,0 K], добавлен 06.02.2013Построение многофакторной корреляционно-регрессионной модели доходности предприятия: оценка параметров функции регрессии, анализ факторов на управляемость, экономическая интерпретация модели. Прогнозирование доходности на основе временных рядов.
дипломная работа [5,1 M], добавлен 28.06.2011Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011