Решение задач в системе MathCad
Значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а). Определение стандартной ошибки предсказания являющейся мерой качества зависимости величин Y и х с помощью уравнения линейной регрессии. Значимость коэффициента регрессии.
Рубрика | Математика |
Вид | задача |
Язык | русский |
Дата добавления | 21.12.2008 |
Размер файла | 133,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
ЗАДАЧА № 1
1.1 Найти значения коэффициента регрессии (b) и сводного члена уравнения регрессии (а)
1.2 Определить стандартную ошибку предсказания являющейся мерой качества реальной зависимости величинами Y и х с помощью уравнения линейной регрессии.
1.3 Проверить значимость коэффициента регрессии при р=0,05
1.4 Определить выборочный коэффициент Браве-Пирсона. Проверить гипотезу о значимости выборочного коэффициента корреляции при уровне значимости р=0,05.
X |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Y |
8.013 |
12.933 |
19.85 |
20.503 |
28.228 |
24.741 |
33.105 |
32.04 |
32.914 |
36.473 |
Линейная регрессия
Простая линейная регрессия позволяет найти линейную зависимость между одной входной и одной выходной переменными. Для этого определяется уравнение регрессии - это модель, отражающая зависимость значений Y, зависимой величины Y от значений х, независимой переменной х и генеральной совокупности, описывается уровнением:
где А0 - свободный член уравнения регрессии;
А1 - коэффициент уравнения регрессии
Затем строится соответствующая прямая, называемая линией регрессии. Коэффициенты А0 и А1, называемые также параметрами модели, выбираются таким образом, чтобы сумма квадратов отклонений точек, соответствующих реальным наблюдениям данных, от линии регрессии, была бы минимальной. Подбор коэффициентов производится по методу наименьших квадратов. Иными словами, простая линейная регрессия описывает линейную модель, которая наилучшим образом аппроксимирует зависимость между одной входной и одной выходной переменными.
Цели регрессионного анализа
· Определение наличия и характера (математического уравнения, описывающего зависимость) связи между переменными
· Определение степени детерминированности вариации критеральной переменной предикторами
· Предсказать значение зависимой переменной с помощью независимой
· Определить вклад независимых переменных в вариацию зависимой
1.1 Найдем значения коэффициента регрессии (А?) и сводного члена уравнения регрессии (А?)
a) Представление исходной информации в виде векторов
b) Определение суммы элементов векторов и произведений векторов:
c) Определение параметров уравнения регрессии
d) Свободный член уравнения регрессии А?
e) Коэффициент уравнения регрессии А?
f) Графическое изображение линии уравнения регрессии и точек кор-реляции
Определим параметры уравнения регрессии А? и А? с помощью встроенных функций системы MathCad
· intercept (X,Y) - коэффициент А? линейной регрессии;
· slope (X,Y) - коэффициент А? линейной регрессии;
· corr(X,Y) - коэффициент корреляции
1) Определение свободного члена уравнения регрессии А? с помощью встроенной функции intercept(X.Y)
2) Определение коэффициента уравнения регрессии А? с помощью встроенной функции slope(X.Y)
3) Определим коэффициент корреляции R с помощью встроенной функции corr(X,Y)
1.2 Определим стандартную ошибку предсказания являющейся мерой качества реальной зависимости величинами Y и х с помощью уравнения линейной регрессии.
Мерой качества приближенного описания реальной зависимости между величинами Y и х с помощью уравнения линейной регрессии является стандартное отклонение значений у от регрессионной прямой, вычисляемое по формуле:
SYX является мерой точности предсказания значений случайной величины Y по заданным значениям величины х, поэтому SYX называют также стандартной ошибкой предсказания.
Найдем стандартную ошибку предсказания для нашего примера:
1.3 Проверим значимость коэффициента регрессии при р=0,05
Если в результате проведенной проверки нет оснований сомневаться в адекватности линейной модели, то необходимо проверить гипотезу о том, что в действительности в генеральной совокупности отсутствует линейная регрессия, а то, что полученный коэффициент регрессии отличен от нуля объясняется только случайностью выборки.
Гипотеза Н0 проверяется с помощью стандартного t-критерия Стьюдента. Значение t-критерия определяется по формуле:
где А1 - абсолютная величина коэффициента регрессии,
SYX - стандартная ошибка предсказаний.
Если значения t>tp, то нулевая гипотеза отклоняется, и можно сделать вывод, что линейная регрессия значима на уровне значимости р. Зададимся уровнем значимости р=0,05. В противном случае гипотеза Н0 принимается
Оценим значимость коэффициента регрессии при уровне значимости р=0,05.
Подставим найденные ранее значения в формулу и определим значение t-критерия.
t0.05=2.306
Поскольку t>t0.05, то на уровне значимости 0,05 отклонением гипотезу Н0, т.е. коэффициент регрессии является статистически значимым.
1.4 Определим выборочный коэффициент Браве-Пирсона. Проверим гипотезу о значимости выборочного коэффициента корреляции при уровне значимости р=0,05.
Коэффициент корреляции Браве-Пирсона (RXY) -- это параметри-ческий показатель, для вычисления которого сравнивают средние и стандартные отклонения результатов двух измерений.
где Xi, Yi - значения первой и второй выборок данных;
Xsr, Ysr - средние значения первой и второй выборок.
Проверим гипотезу о значимости выборочного коэффициента корреляции при уровне значимости р=0,05
Поскольку t>t0.05, то на уровне значимости 0,05 отклонением гипотезу Н0, т.е. коэффициент регрессии является статистически значимым.
ЗАДАЧА №2
При уровне значимости р=0,05 методом дисперсионного анализа проверить эффективность воздействия рентгеновского облучения на темп размножения определенного вида бактерий по данным, приведенным по таблице, где представлен относительный уровень (в процентах) размножения облученных бактерий к необлученным.
Номер испытания |
Дозы облучения F, 10? P |
||||
F1=1 |
F2=2 |
F3=3 |
F4=4 |
||
1 |
87 |
83 |
77 |
||
2 |
91 |
85 |
76 |
||
3 |
97 |
86 |
82 |
77 |
|
4 |
92 |
88 |
84 |
79 |
|
5 |
95 |
80 |
81 |
В процессе медико-биологических исследований часто возникает потребность оценить влияние на какой-нибудь результативный признак одного или нескольких факторов.
Одним из современных статических методов, которые дают возможность проводить специальный анализ эффективности влияния многих факторов, является дисперсионный анализ. С помощью этого метода оценивают также вероятность влияния каждого из рассматриваемых факторов, их комбинации и общей совокупности. Важным преимуществом дисперсионного анализа является возможность определения вероятных расхождений в небольших группах экспериментальных данных, когда какой-нибудь другой метод может дать не определенный ответ. Это связано с тем, что в других методах проводится сравнение изолированных групп. Объединение отдельных групп в дисперсионный комплекс дает возможность четче выявить наличие расхождений, потому что при таком объединении выявлению расхождений каждой группы содействуют все другие группы комплекса.
Смысл дисперсионного анализа заключается в сопоставлении между собой показателей варьирования результативных признаков, которое служит причиной действия постоянных и случайных факторов. В зависимости от числа факторов, которые учитываются при дисперсионном анализе, статистические комплексы делятся на:
· однофакторный дисперсионный анализ с одинаковым числом испытаний на уровнях;
· однофакторный дисперсионный анализ с неодинаковым числом испытаний на уровнях;
· двухфакторный дисперсионный анализ
Ниже будет рассмотрен пример однофакторного дисперсионного анализа с неодинаковым числом испытаний на уровнях.
Неодинаковое число испытаний на уровнях.
Если число испытаний проведенных на различных уровнях действия фактора, различно, а именно: на уровне А1 проведено q1 испытаний, на уровне А2- q2 испытаний и т. д. на уровне Аi - qi испытаний, то факторную и остаточную дисперсии находят по следующим формулам:
Здесь
- общее количество результатов испытаний
- сумма значений величины Х на уровне Аj;
- сумма квадратов значений величины Х на уровне Аj
Определим величины:
Предполагая, что распределения значений, характеризующих эффективность рентгеновского облучения, при каждом испытании является нормальными, а соответствующие генеральные дисперсии равны, применим метод однофакторного дисперсионного анализа.
1) Найдем общее количество результатов испытаний:
2) Определим сумму значений величины х на уровне Аj:
3) Определим сумму квадратов значений величины х на уровне Аj
4) Теперь можно определить факторную и остаточную дисперсии по следующим формулам:
Поскольку следует проверить значимость различий между этими дисперсиями. Для этого вычисляем экспериментальное значение критерия
Так как это различие между факторной и остаточной дисперсиями является значимым (при уровне значимости р=0,05). В соответствии с методом дисперсионного анализа нулевую гипотезу о равенстве групповых средних следует отвергнуть, т. е. различия между групповыми средними значимы, что соответствует наличию существенного различий между эффективностью воздействия рентгеновского облучения на темп размножения бактерий.
Вывод: Можно утверждать, что рассматриваемый физический фактор оказывает существенное влияние на размножение бактерий.
ЗАДАЧА №3
Для заданной таблицы данных:
X |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Y |
7.628 |
6.153 |
5.519 |
5.602 |
5.47 |
5.012 |
5.075 |
4.964 |
4.902 |
5.128 |
С помощью функции genfit - системы MathCad провести нелинейную ре-гресссию общего вида для
f(x)=ax+b/x;
f1(x)=ax?+bx+c;
f3(x)=a+ab
Под нелинейной регрессией общего вида подразумевается нахождение вектора Р параметров произвольной функции F (x, u1, u2, ..., un), при котором обеспечивается минимальная среднеквадратичная погрешность приближения “облака” исходных точек. Для проведения нелинейной регрессии общего вида используется функция genfit (X, Y, S, F1). Она возвращает вектор Р параметров функции F, дающий минимальную среднеквадратичную погрешность приближения функцией F(x, u1, u2, ..., un) исходных данных. F должен быть вектором с символьными элементами, причем они должны содержать аналитические выражения для исходной функции и ее производных по всем параметрам. Вектор S должен содержать начальные значения элементов вектора P, необходимые для решения системы нелинейных уравнений регрессии итерационным методом.
При решении этой задачи возникают две проблемы. Прежде всего, надо вычислить значения производных по переменным а и b. Это может быть cделано с помощью символьных операций, что наглядно показывает пользу от таких операций. Вторая проблема связана с необходимостью применения функции genfit в ее стандартном виде. Поэтому пришлось заменить параметр а на u1, а параметр b на u2 и т. д..
Пример использования метода в среде MathCad:
І СПОСОБ (Для функции f1(x)=ax?+bx+c )
1) Вводим результаты измерений величин X и Y:
2) Выбрав функцию приближения
где a, b - искомые коэффициенты регрессии,
3) найдем частные производные этой функции по коэффициентам регрессии:
по а:
по b:
по с:
1
4) Введем вектор, элементами которого являются функция приближения и её производные, переобозначив коэффициенты регрессии
u1=a,
u2=b,
u3=c:
вектор F1 должен быть вектором с символьными элементами, причем они должны содержать аналитические выражения для исходной функции и ее производных по всем параметрам.
4) Вводим вектор с начальными приближениями коэффициентов регрессии (вектор S должен содержать начальные значения элементов вектора u):
5) С помощью функции genfit(Х,Y,S,F1), найдем значения коэффициентов регрессии a, b,
где X и Y - векторы экспериментальных данных,
S - вектор с начальными приближениями коэффициентов регрессии,
F1 - вектор F1(x,u)
6) Подставляя найденные значения коэффициентов регрессии в первый элемент вектора F1(x,u), определите искомую функцию приближения экспериментальных данных (уравнение регрессии):
7) Построим линию регрессии и график экспериментальных данных:
ІІ СПОСОБ (Для этой же функции f2(x)=ax?+bx+c )
1) Найдем параметров a, b по следующей системе нормальных уравнений:
2) Чтобы решить эту систему относительно параметров a, b и с, нужно предварительно рассчитать суммы:
3) Составим систему нормальных уравнений:
4) Решая эту систему относительно коэффициентов a, b и с, найдем их значение:
5) Отсюда эмпирическое уравнение параболы второго порядка таково:
6) Подставляя в это уравнение вместо х значения независимой переменной Х, можно рассчитать ожидаемые величины:
7) Эти величины хорошо согласуются с фактическими данными, это можно увидеть на (более плавно идущей) линии регрессии:
8) Найдем среднеквадратическое уравнение. СКО характеризует разброс любого результата из ряда наблюдений относительно среднего результата анализа:
Для функции f2(x)=ax+b/x;
1) Для функции приближения (с теми же результатами измерений величин X и Y)
где a, b - искомые коэффициенты регрессии,
2) Найдем частные производные этой функции по коэффициентам регрессии:
по а:
по b:
3) Найдем значения коэффициентов регрессии a, b:
4) Уравнение регрессии:
Для функции f3(x)=a+ab
1) Для функции приближения (с теми же результатами измерений величин X и Y)
где a, b - искомые коэффициенты регрессии,
2) Найдем частные производные этой функции по коэффициентам регрессии:
по а:
по b:
3) Найдем значения коэффициентов регрессии a, b:
4) Уравнение регрессии:
ЛИТЕРАТУРА
1. Основы математической статистики: Учебное пособие для by-тов физ. культ./ Под. ред В. С. Иванова. - М.: Физкультура и спорт, 1990. - 176., ил.
2. Лакин Г. Ф. Биометрия: Учеб. пособие для биол спец. вузов - 4-е изд., перераб. и доп. - М.: Высш. шк., 1990. - 352 с., ил.
3. Кирьянов Д. В.Самоучитель Mathcad И. - СПб.: БХВ-Петербург, 2003. - 560 с: ил.
4. Гурский Д. А., Турбина Е. С. Вычисления в Mathcad 12. -- СПб.: Питер, 2006. -- 544 с: ил.
5. Алексеев Е. Р., Чеснокова О. В. Решение задач вычислительной математики в пакетах Mathcad 12, МАТLАВ 7, Мар1е 9/Алексеев Е. Р., Чеснокова О. В. - М. : НТ Пресс, 2006. - 496 с. : ил. - (Самоучитель).
6. Макаров Е. Г. Инженерные расчеты в Mathcad . Учебный курс. - Спб.; Питер, 2005. - 448 с.: ил.
7. http://www.exponenta.ru/educat/systemat/kazah/matecon/2_5.asp Лабораторные работы по курсам "Математика для экономистов" и "Экономико-математические методы и моделирование" в системе MathCAD Р.М. Оспанов
8. http://www.statsoft.ru/HOME/TEXTBOOK/modules/stmulreg.html
9. http://iskunstvo.narod.ru/edu/inf/regr.htm
10. http://edu.nstu.ru/courses/enc/control_quality/full/XX42.htm
Подобные документы
Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Знакомство с уравнениями линейной регрессии, рассмотрение распространенных способов решения. Общая характеристика метода наименьших квадратов. Особенности оценки статистической значимости парной линейной регрессии. Анализ транспонированной матрицы.
контрольная работа [380,9 K], добавлен 05.04.2015Построение уравнения регрессии. Оценка параметров линейной парной регрессии. F-критерий Фишера и t-критерий Стьюдента. Точечный и интервальный прогноз по уравнению линейной регрессии. Расчет и оценка ошибки прогноза и его доверительного интервала.
презентация [387,8 K], добавлен 25.05.2015Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.
задача [409,0 K], добавлен 17.10.2012Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.
курсовая работа [593,2 K], добавлен 28.06.2009Построение модели множественной регрессии теоретических значений динамики ВВП, определение средней ошибки аппроксимации. Выбор фактора, оказывающего большее влияние. Построение парных моделей регрессии. Определение лучшей модели. Проверка предпосылок МНК.
курсовая работа [352,9 K], добавлен 26.01.2010Методы составления закона распределения случайной величины. Вычисление средней арифметической и дисперсии распределения. Расчет средней квадратической ошибки бесповторной выборки. Построение эмпирических линий регрессии, поиск уравнения прямых регрессий.
контрольная работа [77,6 K], добавлен 20.07.2010Цели линейной модели множественной регрессии (прогноз, имитация, сценарий развития, управление). Анализ эконометрической сущности изучаемого явления на априорном этапе. Параметризация и сбор необходимой статистической информации, значимость коэффициентов.
контрольная работа [68,7 K], добавлен 21.09.2009Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.
контрольная работа [547,6 K], добавлен 02.02.2012Исследование сходимости рядов. Степенной ряд интеграла дифференциального уравнения. Определение вероятности событий, закона распределения случайной величины, математического ожидания, эмпирической функции распределения, выборочного уравнения регрессии.
контрольная работа [420,3 K], добавлен 04.10.2010