Множественный регрессионный анализ качества учебно-познавательной деятельности

Построение модели зависимости семестровой успеваемости одного студента от его посещения лекционных занятий, внимательности и стремления к приобретению знаний в виде полинома. Построение корреляционного поля и диаграмм рассеяния средствами Statistica.

Рубрика Программирование, компьютеры и кибернетика
Вид контрольная работа
Язык русский
Дата добавления 07.06.2014
Размер файла 2,8 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Размещено на http://www.allbest.ru

УКРАИНСКАЯ ИНЖЕНЕРНО-ПЕДАГОГИЧЕСКАЯ АКАДЕМИЯ

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ

Кафедра информатики и компьютерных технологий

Модульное задание № 2.5

по дисциплине: Основы научных исследований

на тему: «Множественный регрессионный анализ качества учебно-познавательной деятельности»

Харьков 2007 г

Задание 1. На основании данных табл. 1 требуется построить модель зависимости семестровой успеваемости одного студента y от его посещения лекционных занятий x1 (%), внимательности x2 (%) и стремления к приобретению знаний x3 (%) в виде полинома

Вариант №.2: Значение из таблицы уменьшается на (2/50), т.е. на 0,04.

Таблица 1.

Данные по 15 студентам ВУЗа

№ студента

Значение

Значение

Значение

Значение

1

3,36

49,96

49,96

2,96

2

4,56

91,96

82,96

5,96

3

3,36

49,96

49,96

2,96

4

3,76

66,96

66,96

3,96

5

3,76

66,96

66,96

3,96

6

2,76

32,96

16,96

1,96

7

4,76

99,96

99,96

5,96

8

2,96

41,96

32,96

1,96

9

3,76

66,96

66,96

3,96

10

2,86

41,96

32,96

1,96

11

3,96

74,96

82,96

4,96

12

2,66

32,96

16,96

0,96

13

4,16

74,96

82,96

4,96

14

4,36

82,96

82,96

4,96

15

4,36

82,96

82,96

4,96

Ход работы:

Задача решается в два этапа:

1. Построение корреляционного поля (диаграмм рассеяния пар переменных (,), (,) и (,)).

2. Вывод результатов множественного регрессионного анализа и их интерпретация.

- Построение корреляционного поля средствами пакета Statistica включает, в свою очередь, два основных этапа:

Создание таблицы исходных данных;

Построение двумерных диаграмм рассеяния.

Для построения таблицы исходных данных необходимо:

1. Выбрать в меню File команду New. Откроется окно Create new document

(Рис.1). С помощью счетчика выбрать нужное количество столбцов (Number of variables) и строк (Number of cases), в нашем случае соответственно 4 и 15. Нажать OK.

2. На экране появится окно для ввода исходных данных (Рис. 2).

3. Для обозначения столбцов, необходимо два раза щелкнуть левой кнопкой мыши в поле названия столбца. Появится окно (Рис. 3).

В этом окне в строке Name вводится имя первого столбца Успеваемость. В списке Display format выбрается формат данных General. Нажать ОК. Аналогично даются имена второму, третьему и четвертому столбцам, соответственно Посещение, Внимательность и Стремление.

4. Ввод числовых данных в столбцы полученной таблицы (Рис 4).

5. Для построения диаграмм рассеяния выбрать в меню Graphs команду Scatter plots. Откроется окно (Рис. 5).

Нажать кнопку . Откроется окно, в котором нужно выбрать необходимые и . В качестве выбирается Посещение, в качестве - Успеваемость. Получаем раскрытое окно (Рис. 6).

Нажать ОК. Окно Рис. 6 закроется. В окне Рис. 5 выбрать вкладку Advanced. В открывшемся окне (Рис. 7) из списка Fit выбрать режим Off.

Нажать ОК. Получим первую диаграмму рассеяния (Рис. 8).

Закрыть окно Рис. 8 без сохранения.

Затем необходимо построить диаграмму с линией регрессии. Для этого в меню Graphs выбираем команду Scatterplots. Откроется окно (Рис. 9).

Нажать кнопку . Откроется окно (Рис. 5). Нажать кнопку . В качестве нужно выбрать Посещение, в качестве - Успеваемость. Получим раскрытое окно (Рис. 6). Нажать ОК. Окно Рис. 6 закроется. В окне Рис. 5 выбрать вкладку Advanced. В открывшемся окне (Рис. 10) из списка Fit выбрать режим Linear.

Нажать ОК. Получим вторую диаграмму рассеяния с линией регрессии (Рис. 11).

Убедившись в присутствии линии регрессии, закрыть окно Рис. 11 без сохранения.

Аналогично строятся остальные диаграммы рассеяния. Для них в качестве нужно выбрать Успеваемость, в качестве для третьей и четвертой - Внимательность (для пятой и шестой - Стремление). Третья диаграмма рассеяния представлена на Рис. 12, четвертая - на Рис. 13, пятая - на Рис. 14, шестая - на Рис. 15.

- Вывод результатов множественного регрессионного анализа и их интерпретация

Выбрать в меню Statistics команду Multiple Regression. Откроется окно множественного регрессионного анализа (Рис. 16). Нажать кнопку . В открывшемся окне выбрать показатель и факторы соответственно из первого и второго списков (Рис. 17).

Нажать ОК в окнах Рис. 17 и Рис. 16. Окно примет такой вид (Рис. 18).

Объяснения полученных результатов:

Dependent - имя показателя. В нашем случае - Успеваемость.

No. of cases - число случаев, по которым построена регрессия. В примере число равно 15.

Multiple R - коэффициент множественной корреляции (эта статистика полезна в множественной регрессии, когда нужно описать зависимости между переменными).

R? - квадрат коэффициента множественной корреляции, обычно называемый коэффициентом детерминации. Он показывает долю общего разброса (относительно выборочного среднего зависимых переменных), которая объясняется построенной регрессией.

Adjusted R? - скорректированный коэффициент детерминации.

Standard error of estimate - стандартная ошибка оценки. Является мерой рассеяния наблюдаемых значений относительно регрессионной прямой.

Intercept - оценка свободного члена регрессии. Значение коэффициента b0 в уравнении регрессии.

Std. Error - стандартная ошибка оценки свободного члена. Стандартная ошибка коэффициента b0 в уравнении регрессии.

t (df) and p-value - значение t-критерия и уровня p. t-критерий используется для проверки гипотезы о равенстве нулю свободного члена регрессии.

F - значение F-критерия (критерия Фишера).

df - число степеней свободы F-критерия.

p - уровень значимости.

В информационной части прежде всего смотрим на значение коэффициента детерминации. В нашем задании R? = 0,9897. Это значит, что построенная регрессия объясняет 98,97 % разброса значений Успеваемости относительно среднего. Это хороший результат.

Далее смотрим на значение F-критерия и уровень его значимости p.

F-критерий используется для проверки значимости регрессии. В данном задании большое значение F-критерия = 354,0407 и даваемый в окне уровень значимости p=0,000000 показывают, что построенная регрессия высоко значима.

Нажимаем на кнопку - краткие результаты регрессии. Появляется следующая электронная таблица с результатами анализа (Рис. 19).

В третьем столбце таблицы видно оценки неизвестных параметров модели:

a = 1,788408;

b1 = 0,021789;

b2 = 0,002052;

b3 = 0,103059.

Итак, искомая модель зависимости показателя от факторов имеет вид:

Успеваемость = 1, 788408 + 0,021789 * Посещение +

+ 0,002052* Внимательность + 0,103059 * Стремление

Эта модель интерпретируется следующим образом: если при прочих равных условиях (= `ceteris paribus') переменная (посещение) увеличивается (уменьшается) на единицу, то согласно этой оценке переменная (успеваемость) увеличивается (уменьшается) на 0,021789 единиц. В нашем случае это значит, что увеличение (уменьшение) посещения на 1 % приведет, при прочих равных условиях, к увеличению (уменьшению) успеваемости на 0,021789 балла.

Задание 2. На основании данных табл. 2 требуется построить модель зависимости выполнения домашних работ студентом (%) от проведенного в библиотеке количества часов (часы), качества дидактических материалов (0 - 50 баллов) и стремления достичь высоких результатов в учебе (%) в виде полинома

Таблица 2.

Данные по 15 студентам ВУЗа

№ студента

Значение

Значение

Значение

Значение

1

75

12

15

80

2

80

19

23

56

3

79

17

40

85

4

73

14

29

69

5

87

18

34

78

6

86

18

35

72

7

90

12

12

89

8

97

16

49

85

9

61

11

35

61

10

97

17

18

89

11

59

15

21

50

12

96

17

50

89

13

80

12

43

85

14

55

11

27

40

15

86

13

33

74

множественный регрессионный диаграмма рассеяние

Ход работы:

Строим корреляционное поле средствами пакета Statistica.

Аналогично заданию 1 выполняем последовательно те же действия, что и на Рис. 1-3.

Заполняем заголовки столбцов и числовые данные в соответствии с заданием (Рис. 20).

- После строим диаграмму рассеяния. В качестве выбирается Кол-во часов, проведённое в библиотеке, в качестве - Выполнение ДЗ студентом. Получаем раскрытое окно (Рис. 21).

В окне 2D Scatterplots выбираем вкладку Advanced. В открывшемся окне (Рис. 7) из списка Fit выбрать режим Off. Нажать ОК. Получим первую диаграмму рассеяния (Рис. 22).

Закрываем окно Рис. 22 без сохранения и затем переходим к построению диаграммы с линией регрессии (Рис. 23).

Аналогично строятся остальные диаграммы рассеяния. Для них в качестве нужно выбрать Выполнение ДЗ студентом, в качестве для третьей и четвертой - Качество дидактических материалов (для пятой и шестой - Стремление достичь высоких результатов). Третья диаграмма рассеяния представлена на Рис. 24, четвертая - на Рис. 25, пятая - на Рис. 26, шестая - на Рис. 27.

- Вывод результатов множественного регрессионного анализа и их интерпретация

Выбрать в меню Statistics команду Multiple Regression. Откроется окно множественного регрессионного анализа (Рис. 28). Нажать кнопку . В открывшемся окне выбрать показатель и факторы соответственно из первого и второго списков (Рис. 29).

Нажать ОК в окнах Рис. 29 и Рис. 28. Окно примет такой вид (Рис. 30).

Объяснения полученных результатов:

Рис. 30

Dependent - имя показателя. В нашем случае - Выполнение ДЗ ст.

No. of cases - число случаев, по которым построена регрессия. В примере число равно 15.

Multiple R - коэффициент множественной корреляции (эта статистика полезна в множественной регрессии, когда нужно описать зависимости между переменными).

R? - квадрат коэффициента множественной корреляции, обычно называемый коэффициентом детерминации. Он показывает долю общего разброса (относительно выборочного среднего зависимых переменных), которая объясняется построенной регрессией.

Adjusted R? - скорректированный коэффициент детерминации.

Standard error of estimate - стандартная ошибка оценки. Является мерой рассеяния наблюдаемых значений относительно регрессионной прямой.

Intercept - оценка свободного члена регрессии. Значение коэффициента b0 в уравнении регрессии.

Std. Error - стандартная ошибка оценки свободного члена. Стандартная ошибка коэффициента b0 в уравнении регрессии.

t (df) and p-value - значение t-критерия и уровня p. t-критерий используется для проверки гипотезы о равенстве нулю свободного члена регрессии.

F - значение F-критерия (критерия Фишера).

df - число степеней свободы F-критерия.

p - уровень значимости.

В информационной части, прежде всего, смотрим на значение коэффициента детерминации. В нашем задании R? = 0,8279. Это значит, что построенная регрессия объясняет 82,79 % разброса значений Выполнения ДЗ студентом относительно среднего. Это хороший результат.

Далее смотрим на значение F-критерия и уровень его значимости p.

F-критерий используется для проверки значимости регрессии. В данном задании небольшое значение F-критерия = 17,6439 и даваемый в окне уровень значимости p=0,000163 показывают, что построенная регрессия средне значима.

Нажимаем на кнопку - краткие результаты регрессии. Появляется следующая электронная таблица с результатами анализа (Рис. 31).

(Рис. 31).

В третьем столбце таблицы видно оценки неизвестных параметров модели:

a = 5,075112;

b1 = 1,771468;

b2 = - 0,012060;

b3 = 0,668969.

Итак, искомая модель зависимости показателя от факторов имеет вид:

Выполнение ДЗ студентом = 5,075112 + 1,771468 * Количество часов проведённых в библиотеке - 0,012060 * Качество дидактических материалов + 0,668969 * Стремление достичь высоких результатов

Эта модель интерпретируется следующим образом: если при прочих равных условиях (= `ceteris paribus') переменная (количество часов проведённых в библиотеке) увеличивается (уменьшается) на единицу, то согласно этой оценке переменная (выполнение ДЗ студентом) увеличивается (уменьшается) на 1,771468 единиц. В нашем случае это значит, что увеличение (уменьшение) количество часов проведённых в библиотеке на 1 % приведет, при прочих равных условиях, к увеличению (уменьшению) выполнению ДЗ студентом на 1,771468 балла.

Размещено на Allbest.ru


Подобные документы

  • Рассмотрение основ проведения корреляционного анализа по исходным данным группы студентов. Построение теоретической и эмпирической линий регрессии; проведение анализа с помощью программы "regres.exe". Представление копий экрана зависимости показателей.

    контрольная работа [2,8 M], добавлен 07.06.2014

  • Общее описание программы Statistica. Архитектура и интерфейс системы. Регрессионный анализ в Statistica. Решение задачи регрессионного анализа с помощью пакета анализа данных табличного процессора MS Excel. Многомерный дисперсионный анализ в SPSS.

    курсовая работа [2,4 M], добавлен 22.01.2013

  • Описание основных использованных функций. Выравнивание по ширине. Разбор алгоритмов расчета. Алгоритм пересчета оценок из текстовой формы в числовую форму. Построение диаграмм и гистограмм Excel. Внедрение и связывание диаграмм в документ Word.

    курсовая работа [152,2 K], добавлен 24.11.2011

  • Проверка наличия линейной связи между соответствующими показателями деятельности коммерческих банков Украины в модуле Multiple Regression ППП Statistica. Расчет теоретических значений зависимой переменной и ошибки модели, вид графика линейной функции.

    лабораторная работа [1,5 M], добавлен 19.05.2011

  • Построение рабочей зоны. Исследование зависимости момента инерции от изменения конфигурации манипулятора. Расчет и построение нагрузочных диаграмм звеньев. Выбор комплектных электроприводов. Расчет кинетической энергии груза, плеча и двигателя локтя.

    дипломная работа [2,9 M], добавлен 24.08.2014

  • Построение функциональной модели IDEF0 средствами программного обеспечения BPWin. Произведение двухуровневой декомпозиции построенной диаграммы. Создание функциональной схемы программного продукта для учёта услуг, оказываемых "Интернет-центром".

    лабораторная работа [339,7 K], добавлен 13.06.2014

  • Регрессионный анализ, его цели. Алгоритм вычисления статистических характеристик по заданным формулам. Запись алгоритма в виде блок-схемы и программы на языке Си. Отладка программы средствами табличного процессора. Функционирование программного комплекса.

    курсовая работа [1,2 M], добавлен 13.01.2016

  • Анализ и формализация задачи моделирования: построение концептуальной модели, ее формализация в виде Q-схемы. Построение имитационной модели: создание блок-схемы, представление базовой исходной имитационной модели. Исследование экономических процессов.

    контрольная работа [156,0 K], добавлен 21.11.2010

  • Вычисление значений регрессионно-авторегрессионной зависимости заданного выражения линейного программирования. Графическое представление математической модели в виде уравнения регрессии. Принципи оптимизации производственных и коммерческих операций.

    контрольная работа [2,2 M], добавлен 01.03.2011

  • Характеристика предприятия ООО "РН-Информ" и организации сети в виде топологии звезды. Подключение к интернет с помощью широкополосного маршрутизатора. Описание используемых программных комплексов. Построение модели в Borland Together Architect.

    отчет по практике [1,8 M], добавлен 09.04.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.