Статистические методы моделирования связи
Прямолинейные, обратные и криволинейные связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Метод наименьших квадратов. Оценка значимости коэффициентов регрессии. Проверка адекватности модели по критерию Фишера.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 21.05.2015 |
Размер файла | 232,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
(yi - y)2 = (yi - a0 - a1xi)2 min [9]
Для нахождения минимума данной функции приравняем к нулю ее частные производные и получим систему двух линейных уравнений, которая называется системой нормальных уравнений:
Решим эту систему в общем виде:
Параметры уравнения парной линейной регрессии иногда удобно исчислять по следующим формулам, дающим тот же результат:
Определив значения a0 , a1 и подставив их в уравнение связи y = a0 + a1x , находим значения y , зависящие только от заданного значения х.
Рассмотрим построение однофакторного уравнения регрессии зависимости работающих активов у от капитала х (см. таблица 1). Рассмотрим, что представляет собой эта значимость. Обозначим коэффициент детерминации, полученный при исключении из правой части уравнения переменной. При этом мы получим уменьшение объясненной дисперсии, на величину. Для оценки значимости включения переменной используется статистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще, если из уравнения регрессии исключаются переменных, статистикой значимости исключения будет.
Пошаговая процедура построения модели. Основным критерием отбора аргументов должно быть качественное представление о факторах, влияющих на зависимую переменную, которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионной модели: на машину переложена значительная доля трудностей в решении этой задачи. Возможно построение последовательное построение модели добавлением и удалением блоков переменных. Но мы рассмотрим только работу с отдельными переменными. По умолчанию программа включает все заданные переменные.
Здесь представлены показатели 32 банков: размер капитала и работающих активов. Передо мной стоит задача определить, есть ли зависимость между этими двумя признаками и, если она существует, определить форму этой зависимости, то есть уравнение регрессии.
За факторный признак я взяла размер капитала банка, а за результативный признак - работающие активы. [11]
Сопоставление данных параллельных рядов признаков х и у показывает, что с убыванием признака х (капитал), в большинстве случаев убывает и признак у (работающие активы). Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).
Следовательно, можно предположить, что между х и у существует прямая зависимость, пусть неполная, но выраженная достаточно ясно.
Для уточнения формы связи между рассматриваемыми признаками я использовала графический метод. Я нанес на график точки, соответствующие значениям х и у, и получила корреляционное поле (см. график 1). Метод включения и исключения переменных состоит в следующем. Из множества факторов, рассматриваемых исследователем как возможные аргументы регрессионного уравнения, отбирается один, который более всего связан корреляционной зависимостью. Далее проводится та же процедура при двух выбранных переменных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнение не будут включены все аргументы, выделенные исследователем, удовлетворяющие критериям значимости включения. Замечание: во избежание зацикливания процесса включения исключения значимость включения устанавливается меньше значимости исключения. Переменные, порождаемые регрессионным уравнением. Сохранение переменных, порождаемых регрессией, производится подкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могут быть оценены прогнозные значения зависимой переменной, причем они могут быть вычислены и там, где значения определены, и там где они не определены.
Анализируя поле корреляции, можно предположить, что возрастание признака у идет пропорционально признаку х. В основе этой зависимости лежит прямолинейная связь, которая может быть выражена простым линейным уравнением регрессии:
y = a0 + a1x
где y - теоретические расчётные значения результативного признака (работающие активы), полученные по уравнению регрессии;
a0 , a1 - коэффициенты (параметры) уравнения регрессии;
х - капитал исследуемых банков.
Пользуясь вышеуказанными формулами для вычисления параметров линейного уравнения регрессии и расчётными значениями из таблицы 1, получаем:
Следовательно, регрессионная модель зависимости работающих активов от капитала банков может быть записана в виде конкретного простого уравнения регрессии:
Это уравнение характеризует зависимость работающих активов от капитала банка. Расчётные значения y , найденные по этому уравнению, приведены в таблице 1. Правильность расчёта параметров уравнения регрессии может быть проверена сравниванием сумм ?у = ?y . В моем случае эти суммы равны. Однако при небольшой взаимосвязи между переменными, если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованных переменных, то оценки коэффициентов регрессии позволят по их абсолютной величине судить о том, какой аргумент в большей степени влияет на функцию. Стандартизация переменных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковых масштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументами в правой части уравнения могут происходить странные вещи. Надежность и значимость коэффициента регрессии. Здесь обозначен коэффициент детерминации, получаемый при построении уравнения регрессии, в котором в качестве зависимой переменной взята другая переменная. Из выражения видно, что величина коэффициента тем неустойчивее, чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределение Стьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость - вероятность случайно при нулевом регрессионном коэффициенте получить значение статистики, большее по абсолютной величине, чем выборочное. Значимость включения переменной в регрессию. При последовательном подборе переменных предусмотрена автоматизация, основанная на значимости включения и исключения переменных.
Но для того, чтобы применить мою формулу, надо рассчитать, насколько она приближенна к реальности, то есть проверить ее адекватность.
2. Проверка адекватности регрессионной модели
Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным.
Корреляционный и регрессионный анализ обычно (особенно в условиях так называемого малого и среднего бизнеса) проводится для ограниченной по объёму совокупности. Поэтому показатели регрессии и корреляции - параметры уравнения регрессии, коэффициенты корреляции и детерминации могут быть искажены действием случайных факторов. Чтобы проверить, насколько эти показатели характерны для всей генеральной совокупности, не являются ли они результатом стечения случайных обстоятельств, необходимо проверить адекватность построенных статистических моделей.
При численности объектов анализа до 30 единиц возникает необходимость проверки значимости (существенности) каждого коэффициента регрессии. При этом выясняют насколько вычисленные параметры характерны для отображения комплекса условий: не являются ли полученные значения параметров результатами действия случайных причин. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).
Значимость коэффициентов простой линейной регрессии (применительно к совокупностям, у которых n<30) осуществляют с помощью t-критерия Стьюдента. При этом вычисляют расчетные (фактические) значения t-критерия
для параметра a0
для параметра a1 :
где n - объём выборки;
- среднее квадратическое отклонение результативного признака от выровненных значений y
или
- среднее квадратическое отклонение факторного признака x от общей средней . [8]
Вычисленные по вышеприведенным формулам значения сравнивают с критическими t , которые определяют по таблице Стьюдента с учетом принятого уровня значимости б и числом степеней свободы вариации . В социально-экономических исследованиях уровень значимости б обычно принимают равным 0,05. Параметр признаётся значимым (существенным) при условии, если tрасч> tтабл . В таком случае практически невероятно, что найденные значения параметров обусловлены только случайными совпадениями. За это иногда зависимую переменную называют откликом. Теория регрессионных уравнений со случайными независимыми переменными сложнее, но известно, что, при большом числе наблюдений, использование метода разработанного корректно. Для получения оценок коэффициентов регрессии минимизируется сумма квадратов ошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи. Существует ли линейная регрессионная зависимость? Для проверки одновременного отличия всех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значений зависимой переменной относительно среднего. Его можно разложить на две суммы следующим образом. Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределение Фишера и, естественно, по этой статистике проверяют, являются ли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным, полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициента детерминации называется коэффициентом корреляции. Следует иметь в виду, что является смещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такой вывод.
Теперь я рассчитаю t-критерий Стьюдента для моей модели регрессии.
- это средние квадратические отклонения.
Расчетные значения t-критерия Стьюдента:
По таблице распределения Стьюдента я нахожу критическое значение t-критерия для н= 32-2 = 30 . Вероятность б я принимаю 0,05. tтабл равно 2,042. Так как, оба значения ta0 и ta1 больше tтабл , то оба параметра а0 и а1 признаются значимыми и отклоняется гипотеза о том, что каждый из этих параметров в действительности равен 0 , и лишь в силу случайных обстоятельств оказался равным проверяемой величине.
Проверка адекватности регрессионной модели может быть дополнена корреляционным анализом. Для этого необходимо определить тесноту корреляционной связи между переменными х и у. Теснота корреляционной связи, как и любой другой, может быть измерена эмпирическим корреляционным отношением зэ , когда д2 (межгрупповая дисперсия) характеризует отклонения групповых средних результативного признака от общей средней
Говоря о корреляционном отношении как о показателе измерения тесноты зависимости, следует отличать от эмпирического корреляционного отношения - теоретическое. Рассмотрим, что представляет собой эта значимость. Обозначим коэффициент детерминации, полученный при исключении из правой части уравнения переменной. При этом мы получим уменьшение объясненной дисперсии, на величину. Для оценки значимости включения переменной используется статистика, имеющая распределение Фишера при нулевом теоретическом приросте. Вообще, если из уравнения регрессии исключаются переменных, статистикой значимости исключения будет. Пошаговая процедура построения модели. Основным критерием отбора аргументов должно быть качественное представление о факторах, влияющих на зависимую переменную, которую мы пытаемся смоделировать. Очень хорошо реализован процесс построения регрессионной модели: на машину переложена значительная доля трудностей в решении этой задачи. Возможно построение последовательное построение модели добавлением и удалением блоков переменных. Но мы рассмотрим только работу с отдельными переменными. По умолчанию программа включает все заданные переменные.
Теоретическое корреляционное отношение з представляет собой относительную величину, получающуюся в результате сравнения среднего квадратического отклонения выравненных значений результативного признака д, то есть рассчитанных по уравнению регрессии, со средним квадратическим отношением эмпирических (фактических) значений результативности признака у:
,
где ; .
Тогда .
Изменение значения з объясняется влиянием факторного признака. Метод включения и исключения переменных состоит в следующем. Из множества факторов, рассматриваемых исследователем как возможные аргументы регрессионного уравнения, отбирается один, который более всего связан корреляционной зависимостью. Далее проводится та же процедура при двух выбранных переменных, при трех и т.д. Процедура повторяется до тех пор, пока в уравнение не будут включены все аргументы, выделенные исследователем, удовлетворяющие критериям значимости включения. Замечание: во избежание зацикливания процесса включения исключения значимость включения устанавливается меньше значимости исключения. Переменные, порождаемые регрессионным уравнением. Сохранение переменных, порождаемых регрессией, производится подкомандой. Благодаря полученным оценкам коэффициентов уравнения регрессии могут быть оценены прогнозные значения зависимой переменной, причем они могут быть вычислены и там, где значения определены, и там где они не определены.
В основе расчёта корреляционного отношения лежит правило сложения дисперсий, то есть
где - отражает вариацию у за счёт всех остальных факторов, кроме х , то есть являются остаточной дисперсией:
.
Тогда формула теоретического корреляционного отношения примет вид
,
или .
Подкоренное выражение корреляционного выражения представляет собой коэффициент детерминации (мера определенности, причинности).
Коэффициент детерминации показывает долю вариации результативного признака под влиянием вариации признака-фактора. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).
Теоретическое корреляционное выражение применяется для измерения тесноты связи при линейной и криволинейной зависимостях между результативным и факторным признаком.
Как видно из вышеприведенных формул корреляционное отношение может находиться от 0 до 1. Чем ближе корреляционное отношение к 1, тем связь между признаками теснее.
Теоретическое корреляционное отношение применительно к моему анализу я рассчитаю двумя способами:
[5]
Полученное значение теоретического корреляционного отношения свидетельствует о возможном наличии среднестатистической связи между рассматриваемыми признаками. Коэффициент детерминации равен 0,62. Отсюда я заключаю, что 62% общей вариации работающих активов изучаемых банков обусловлено вариацией фактора - капитала банков (а 38% общей вариации нельзя объяснить изменением размера капитала).
Кроме того, при линейной форме уравнения применяется другой показатель тесноты связи - линейный коэффициент корреляции:
,
где n - число наблюдений.
Для практических вычислений при малом числе наблюдений (n?20ч30) линейный коэффициент корреляции удобнее исчислять по следующей формуле:
.
Значение линейного коэффициента корреляции важно для исследования социально-экономических явлений и процессов, распределение которых близко к нормальному. Он принимает значения в интервале: -1? r ? 1.
Отрицательные значения указывают на обратную связь, положительные - на прямую. При r = 0 линейная связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к единице, тем теснее связь между признаками. И, наконец, при r = ±1 - связь функциональная. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии.
Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).
Используя данные таблицы 1 я рассчитала линейный коэффициент корреляции r. Но чтобы использовать формулу для линейного коэффициента корреляции рассчитаем дисперсию результативного признака уy:
Квадрат линейного коэффициента корреляции r2 называется линейным коэффициентом детерминации. Из определения коэффициента детерминации очевидно, что его числовое значение всегда заключено в пределах от 0 до 1, то есть 0 ? r2 ? 1. Степень тесноты связи полностью соответствует теоретическому корреляционному отношению, которое является более универсальным показателем тесноты связи по сравнению с линейным коэффициентом корреляции. Однако при небольшой взаимосвязи между переменными, если стандартизовать переменные и рассчитать уравнение регрессии для стандартизованных переменных, то оценки коэффициентов регрессии позволят по их абсолютной величине судить о том, какой аргумент в большей степени влияет на функцию. Стандартизация переменных. Бета коэффициенты. Коэффициенты в последнем уравнении получены при одинаковых масштабах изменения всех переменных и сравнимы. В случае взаимосвязи между аргументами в правой части уравнения могут происходить странные вещи. Надежность и значимость коэффициента регрессии. Здесь обозначен коэффициент детерминации, получаемый при построении уравнения регрессии, в котором в качестве зависимой переменной взята другая переменная. Из выражения видно, что величина коэффициента тем неустойчивее, чем сильнее переменная связана с остальными переменными. Эта статистика имеет распределение Стьюдента. В выдаче пакета печатается наблюдаемая ее двусторонняя значимость - вероятность случайно при нулевом регрессионном коэффициенте получить значение статистики, большее по абсолютной величине, чем выборочное. Значимость включения переменной в регрессию. При последовательном подборе переменных предусмотрена автоматизация, основанная на значимости включения и исключения переменных.
Факт совпадений и несовпадений значений теоретического корреляционного отношения з и линейного коэффициента корреляции r используется для оценки формы связи. [4]
Выше отмечалось, что посредством теоретического корреляционного отношения измеряется теснота связи любой формы, а с помощью линейного коэффициента корреляции - только прямолинейной. Следовательно, значения з и r совпадают только при наличии прямолинейной связи. Несовпадение этих величин свидетельствует, что связь между изучаемыми признаками не прямолинейная, а криволинейная. Установлено, что если разность квадратов з и r не превышает 0,1 , то гипотезу о прямолинейной форме связи можно считать подтвержденной. В моем случае наблюдается примерное совпадение линейного коэффициента детерминации и теоретического корреляционного отношения, что дает мне основание считать связь между капиталом банков и их работающими активами прямолинейной.
При линейной однофакторной связи t-критерий можно рассчитать по формуле:
где (n - 2) - число степеней свободы при заданном уровне значимости б и объеме выборки n. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).
Так, для коэффициента корреляции между капиталом и работающими активами получается
Если сравнить полученное tрасч с критическим значением из таблицы Стьюдента, где н=30, а б=0,01 (tтабл=2,750), то полученное значение t-критерия будет больше табличного, что свидетельствует о значимости коэффициента корреляции и существенной связи между капиталом и работающими активами.
Таким образом, построенная регрессионная модель y=245,75+1,42x в целом адекватна, и выводы полученные по результатам малой выборки можно с достаточной вероятностью распространить на всю гипотетическую генеральную совокупность. За это иногда зависимую переменную называют откликом. Теория регрессионных уравнений со случайными независимыми переменными сложнее, но известно, что, при большом числе наблюдений, использование метода разработанного корректно. Для получения оценок коэффициентов регрессии минимизируется сумма квадратов ошибок регрессии. В пакете вычисляются статистики, позволяющие решить эти задачи. Существует ли линейная регрессионная зависимость? Для проверки одновременного отличия всех коэффициентов регрессии от нуля проведем анализ квадратичного разброса значений зависимой переменной относительно среднего. Его можно разложить на две суммы следующим образом. Статистика в условиях гипотезы равенства нулю регрессионных коэффициентов имеет распределение Фишера и, естественно, по этой статистике проверяют, являются ли коэффициенты одновременно нулевыми. Коэффициенты детерминации и множественной корреляции. При сравнении качества регрессии, оцененной по различным зависимым переменным, полезно исследовать доли объясненной и необъясненной дисперсии. Корень из коэффициента детерминации называется коэффициентом корреляции. Следует иметь в виду, что является смещенной оценкой. Абсолютные значения коэффициентов не позволяют сделать такой вывод.
3. Практическая часть
- уравнение регрессии.
x |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
y |
1.35 |
1.09 |
6.46 |
3.15 |
5.80 |
7.2 |
8.07 |
8.12 |
8.97 |
10.66 |
Приведем квадратное уравнение к линейной форме:
;
Запишем матрицу X.
Составим матрицу Фишера.
Система нормальных уравнений.
Решим ее методом Гаусса.
Уравнение регрессии имеет вид:
[7]
3.1 Оценка значимости коэффициентов регрессии
Для проверки нулевой гипотезы используем критерий Стьюдента.
Коэффициенты значимые коэффициенты.[6]
3.2 Проверка адекватности модели по критерию Фишера
гипотеза о равенстве математического ожидания отвергается. [4]
3.3 Проверка адекватности модели по коэффициенту детерминации или множественной корреляции
Коэффициент детерминации
- регрессионная модель адекватна.
Коэффициент множественной корреляции
Рассчитать и построить график уравнения прямолинейной регрессии для относительных значений PWC170 и времени челночного бега 3х10 м у 13 исследуемых и сделать вывод о точности расчета уравнений, если данные выборок таковы:
xi, кГ м/мин/кг ~ 15,6; 13,4; 17,9; 12,8; 10,7; 15,7; 11,7; 12,3; 12,3; 11,1; 14,3; 12,7; 14,4 yi, с ~ 6,9; 7,2; 7,1; 6,7; 7,6; 7,0; 6,4; 6,9; 7,7; 7,6; 7,9; 8,2; 6,8
Решение
1. Занести данные тестирования в рабочую таблицу и сделать соответствующие расчеты.
xi |
xi - |
(xi - )2 |
yi |
yi - |
(yi - )2 |
(xi - )(yi - ) |
|
15.6 |
2.1 |
4.41 |
6.9 |
-0.3 |
0.09 |
-0.63 |
|
13.4 |
-0.1 |
0.01 |
7.2 |
0 |
0 |
0 |
|
17.9 |
4.4 |
19.36 |
7.1 |
-0.1 |
0.01 |
-0.44 |
|
12.8 |
-0.7 |
0.49 |
6.7 |
-0.5 |
0.25 |
0.35 |
|
10.7 |
-2.8 |
7.84 |
7.6 |
0.4 |
0.16 |
-1.12 |
|
15.7 |
2.2 |
4.84 |
7.0 |
-0.2 |
0.04 |
-0.44 |
|
11.7 |
-1.8 |
3.24 |
6.4 |
-0.8 |
0.64 |
1.44 |
|
12.3 |
-1.2 |
1.44 |
6.9 |
-0.3 |
0.09 |
0.36 |
|
12.3 |
-1.2 |
1.44 |
7.7 |
0.5 |
0.25 |
-0.60 |
|
11.1 |
-2.4 |
5.76 |
7.6 |
0.4 |
0.16 |
-0.96 |
|
14.3 |
0.8 |
0.64 |
7.9 |
0.7 |
0.49 |
0.56 |
|
12.7 |
-0.8 |
0.64 |
8.2 |
1 |
1 |
-0.80 |
|
14.4 |
0.9 |
0.81 |
6.8 |
-0.4 |
0.16 |
-0.36 |
|
= 13.5 |
=50,92 |
= 7,2 |
=3,34 |
= -2,64 |
1. Рассчитать значение нормированного коэффициента корреляции по формуле
2. Рассчитать конечный вид уравнений прямолинейной регрессии по формулам (2) и (3)
(2)
(3)
Т.е.
4. Рассчитать абсолютные погрешности уравнений регрессии по формулам (4) и (5):
5. Рассчитать относительные погрешности уравнений регрессии по формулам (6) и (7):
6. Для графического представления корреляционной зависимости между признаками рассчитать координаты линий регрессии, подставив в конечный вид уравнений (1) и (2) данные любого исследуемого (например, четвертого из списка).
Тогда:
при х = 12,8 кГм/мин/кг у =7,235 с » 7,2 с;
при у = 6,7 с х = 13,895 с » 13,9 кГм/мин/кг.
7. Представить графически данное уравнение регрессии.
8. На основании произведенных расчетов и графического изображения уравнения регрессии сделать вывод.
Вывод
1) в исследуемой группе наблюдается недостоверная обратная взаимосвязь между данными относительных значений PWC170 и времени челночного бега 3х10 м, т.к. rху = -0,20 < rst = 0,55 для К= 11 при = 95%; 2) относительная погрешность функции ух = 7,875 - 0,05х меньше (7,22%), а, следовательно, прогноз результата в челночном беге по данным относительных значений пробы PWC170 более точен; 3) на графике линии уравнения регрессии расположены почти под прямым углом, так как значения коэффициента корреляции близки к нулю.[3]
Заключение
В исследуемой группе наблюдается недостоверная обратная взаимосвязь между данными относительных значений PWC170 и времени челночного бега 3х10 м, т.к. rху = -0,20 < rst = 0,55 для К= 11 при = 95%; - относительная погрешность функции ух = 7,875 - 0,05х меньше (7,22%), а, следовательно, прогноз результата в челночном беге по данным относительных значений пробы PWC170 более точен; - на графике линии уравнения регрессии расположены почти под прямым углом, так как значения коэффициента корреляции близки к нулю.
Также в работе показана корреляционная зависимость показателей 32 российских банков, проведен регрессионный анализ и нашли регрессионную модель данной взаимосвязи показателей. Задача регрессионного анализа состоит в построении модели, позволяющей по значениям независимых показателей получать оценки значений зависимой переменной. Регрессионный анализ является основным средством исследования зависимостей между социально-экономическими переменными. Эту задачу мы рассмотрим в рамках самой распространенной в статистических пакетах классической модели линейной регрессии. Специфика социологических исследований состоит в том, что очень часто необходимо изучать и предсказывать социальные события. Вторая часть данной главы будет посвящена регрессии, целью которой является построение моделей, предсказывающих вероятности событий. Величина называется ошибкой регрессии. Первые математические результаты, связанные с регрессионным анализом, сделаны в предположении, что регрессионная ошибка распределена нормально с параметрами, ошибка для различных объектов считаются независимыми. Кроме того, в данной модели мы рассматриваем переменные как неслучайные значения. Такое, на практике, получается, когда идет активный эксперимент, в котором задают значения (например, назначили зарплату работнику), а затем измеряют (оценили, какой стала производительность труда).
Полученное уравнение y=245,75+1,42х позволяет проиллюстрировать зависимость размера работающих активов банков от размера их капитала.
И так, с помощью корреляционно-регрессионного анализа, можно исследовать показатели банков.[8]
Использованная литература
1. Аверкин А.Н., Батыршин И.З., Блишун А.Ф. и др. Нечеткие множества в моделях управления и искусственного интеллекта // Под ред. Д.А. Поспелова. М.: Наука, 1986. - 312 с.
2. Аветисян Д.О. Проблемы информационного поиска: (Эффективность, автоматическое кодирование, поисковые стратегии) - М.: Финансы и статистика, 1981. - 207 с.
3. Айвазян С.А., Бежаева З.И., Староверов О.В. Классификация многомерных наблюдений. - М.: Статистика, 1974. - 240 с.
4. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. Справочное издание. М.: Финансы и статистика, 1983. - 472 с.
5. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Исследование зависимостей: Справочник. - М.: Финансы и статистика, 1985. 182с.
6. Айвазян С.А. , Мхитарян В.С. Прикладная статистика и основы эконометрики. - М. Юнити, 1998. - 1024 с.
7. Ван дер Варден Б.Л. Математическая статистика. - М.: Изд-во иностр. лит., 1960. - 302 с.
8. Гайдышев И.П. Анализ и обработка данных: специальный справочник. - СПб.: Питер, 2001. - 752 с.
9. Гмурман В.С. Теория вероятностей и математическая статистика. - М.: Высш. шк., 1972. - 368 с.
10. Калинина В.Н., Панкин В.Ф. Математическая статистика. - М.: Высш. шк., 2001. - 336 с.
11. Кендалл М., Стьюарт А. Теория распределений М.: Наука, 1966. - 566 с.
12. Кендалл М., Стьюарт А. Статистические выводы и связи. - М .: Наука, 1973. - 899 с.
Размещено на Allbest.ur
Подобные документы
Функциональные и стохастические связи. Статистические методы моделирования связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Проверка адекватности регрессионной модели.
курсовая работа [214,6 K], добавлен 04.09.2007Основные задачи регрессионного анализа в математической статистике. Вычисление дисперсии параметров уравнения регрессии и дисперсии прогнозирования эндогенной переменной. Установление зависимости между переменными. Применение метода наименьших квадратов.
презентация [100,3 K], добавлен 16.12.2014Вероятностное обоснование метода наименьших квадратов как наилучшей оценки. Прямая и обратная регрессии. Общая линейная модель. Многофакторные модели. Доверительные интервалы для оценок метода наименьших квадратов. Определение минимума невязки.
реферат [383,7 K], добавлен 19.08.2015Статистическое описание и выборочные характеристики двумерного случайного вектора. Оценка параметров линейной регрессии, полученных по методу наименьших квадратов. Проверка гипотезы о равенстве средних нормальных совокупностей при неизвестных дисперсиях.
контрольная работа [242,1 K], добавлен 05.11.2011Изучение аппроксимации таблично заданной функции методом наименьших квадратов при помощи вычислительной системы Mathcad. Исходные данные и функция, вычисляющая матрицу коэффициентов систему уравнений. Выполнение вычислений для разных порядков полинома.
лабораторная работа [166,4 K], добавлен 13.04.2016Моделирование входного заданного сигнала, построение графика, амплитудного и фазового спектра. Моделирование шума с законом распределения вероятностей Рэлея, оценка дисперсии отсчетов шума и проверка адекватности модели шума по критерию Пирсона.
курсовая работа [2,3 M], добавлен 25.11.2011Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.
курсовая работа [304,0 K], добавлен 02.03.2017Определения оптимизации схемы планирования эксперимента при работе со швейной машиной. Расчёт коэффициентов уравнения регрессии и выделение значимых коэффициентов прочности ткани и растяжения между лапкой и иглой. Проверка гипотезы адекватности модели.
курсовая работа [1,2 M], добавлен 30.12.2014Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.
контрольная работа [1,2 M], добавлен 05.08.2010