Кластерный анализ
Выполнение кластерного анализа предприятий с помощью программы Statgraphics Plus. Построение линейного уравнения регрессии. Расчет коэффициентов эластичности по регрессионным моделям. Оценка статистической значимости уравнения и коэффициента детерминации.
Рубрика | Экономико-математическое моделирование |
Вид | задача |
Язык | русский |
Дата добавления | 16.03.2014 |
Размер файла | 1,7 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Задание
1. По нижеприведенным данным выполнить кластерный анализ предприятий, объединив их в два кластера.
2. Для каждого кластера построить линейное уравнение регрессии, устанавливающее зависимость объема реализации от указанных факторов.
3. Рассчитать коэффициенты эластичности по разработанным регрессионным моделям и определить влияние факторов на объем реализации по двум группам предприятий.
где: Y - объем реализации (млн. руб.);
X1 - время (годы);
X2 - расходы на рекламу (тыс. руб.);
X3 - цена товара (руб.);
X4 - средняя цена товара у конкурентов (руб.);
X5 - индекс потребительских расходов (%).
Решение
1. Проводим кластерный анализ строк 1-16 заданной таблицы с помощью пакета программ Statgraphics Plus согласно методике.
По табличным данным строится дендрограмма, объединяющая предприятия в два кластера, где по оси абсцисс отмечены цифрами номера объектов (компаний): 1-16, а по оси ординат расстояние между факторами в Евклидовом пространстве.
Таким образом, получены два кластера, которые скомпонованы по критерию "ближайшего соседа":
кластер №1: 1-4 предприятия;
кластер №2: 5-16 предприятия.
Матрица расстояний между классифицируемыми объектами:
2. Строим линейные уравнения регрессии, описывающие зависимость Y- объем реализации от факторов: Х1, Х2, Х3, Х4, Х5 для каждого кластера в отдельности.
а). В 1-ом кластере исходные данные и матрица корреляций по 4 входящим в него предприятиям:
Так как между факторами Х1, Х3 и Х5 присутствует мультиколлинеарность, то для построения регрессионной модели выбираем фактор Х5, наиболее тесно связанный с результативным признаком Y.
Так как между факторами Х2, Х3, X4 и Х5 присутствует мультиколлинеарность, то для построения регрессионной модели выбираем фактор Х5, наиболее тесно связанный с результативным признаком Y.
Уравнение регрессии для 1-го кластера: .
Значения случайных ошибок параметров уравнения регрессии записаны в колонке Standard Error: mb0=458,14; mb1=4,54539.
Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения использованы при расчетном определении t-критерия Стьюдента, приведенные в колонке T Statistic: tb0=-2,21864; tb1=2,54757.
Табличное значение t-критерия Стьюдента для уровня значимости б=0,05 и числа степеней свободы f=4-1-1=2 равно tт=4,3027.
Так как в рассматриваемом примере расчетные значения t-критерия Стьюдента (по модулю) меньше табличного значения tт=4,3027, то полученные коэффициенты не являются статистически значимыми.
Оценку надежности уравнения регрессии в целом и коэффициента детерминации дает расчетное значение F - критерия Фишера, равное Fр=6,49. Сравнение расчетного значения критерия с табличным позволяет проверить гипотезу об адекватности модели и значимости коэффициента детерминации. Табличное значение F - критерия Фишера для уровня значимости б=0,05 и числа степеней свободы f1=1, f2=2 равно Fт=18,51. Расчетное значение F - критерия Фишера меньше табличного значения Fр=6,49<Fт=18,51. Это указывает на то, что уравнение и коэффициент детерминации R-squared не являются статистически значимыми.
Направление связи между фактором и результатом прямое (по знаку коэффициента). Коэффициент детерминации показывает, что изменение результата на 76,44% зависит от рассматриваемого фактора, на другие причины приходится 23,56%.
3. а) Найдем коэффициент эластичности для уравнения регрессии 1-го кластера.
.
При увеличении фактора Х5 на 1% результат Y увеличивается на 7,754%.
2б). Во 2-ом кластере исходные данные и матрица корреляций по 12 входящим в него предприятиям:
Так как между факторами Х1 и Х5 присутствует мультиколлинеарность, то для построения регрессионной модели выбираем фактор: Х1, наиболее тесно связанный с результативным признаком Y.
Так как между факторами Х2 и Х3 присутствует мультиколлинеарность, то для построения регрессионной модели выбираем фактор: Х3, наиболее тесно связанный с результативным признаком Y.
Последовательно исключая незначимые фактор Х1 и Х3 с помощью пакета программ Statgraphics Plus, строим линейную регрессионную модель Y=f(X4) с единственным фактором Х4.
Уравнение регрессии для 2-го кластера: .
Значения случайных ошибок параметров уравнения регрессии записаны в колонке Standard Error: mb0=190,661; mb1=11,0352.
Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения использованы при расчетном определении t-критерия Стьюдента, приведенные в колонке T Statistic: tb0=0,926896; tb1=0,953664.
Табличное значение t-критерия Стьюдента для уровня значимости б=0,05 и числа степеней свободы f=12-1-1=10 равно tт=3,1825.
Так как в рассматриваемом примере расчетные значения t-критерия Стьюдента (по модулю) меньше табличного значения tт=2,2281, то полученные коэффициенты не являются статистически значимыми.
Оценку надежности уравнения регрессии в целом и коэффициента детерминации дает расчетное значение F - критерия Фишера, равное Fр=0,91. Сравнение расчетного значения критерия с табличным позволяет проверить гипотезу об адекватности модели и значимости коэффициента детерминации. Табличное значение F - критерия Фишера для уровня значимости б=0,05 и числа степеней свободы f1=1, f2=10 равно Fт=4,96. Расчетное значение F - критерия Фишера меньше табличного значения Fр=0,91<Fт=4,96. Это указывает на то, что уравнение и коэффициент детерминации R-squared не являются статистически значимыми.
Направление связи между фактором и результатом прямое (по знаку коэффициента). Коэффициент детерминации показывает, что изменение результата на 8,34% зависит от рассматриваемого фактора, на другие причины приходится 91,66%.
3б) Найдем частные коэффициенты эластичности для уравнения регрессии 2-го кластера.
кластерный регрессия эластичность детерминация
.
При увеличении фактора Х4 на 1% результат Y увеличивается на 0,506%.
Размещено на Allbest.ru
Подобные документы
Параметры уравнения линейной регрессии. Вычисление остаточной суммы квадратов, оценка дисперсии остатков. Осуществление проверки значимости параметров уравнения регрессии с помощью критерия Стьюдента. Расчет коэффициентов детерминации и эластичности.
контрольная работа [248,4 K], добавлен 26.12.2010Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Экономическая интерпретация коэффициента регрессии. Нахождение статочной суммы квадратов и оценка дисперсии остатков. Проверка значимости параметров уравнения регрессии с помощью t-критерия Стьюдента. Расчет средней относительной ошибки аппроксимации.
контрольная работа [261,1 K], добавлен 23.03.2010Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Расчет параметров линейной регрессии. Сравнительная оценка тесноты связи с помощью показателей корреляции, детерминации, коэффициента эластичности. Построение поля корреляции. Определение статистической надежности результатов регрессионного моделирования.
контрольная работа [71,7 K], добавлен 17.09.2016Построение регрессионных моделей. Смысл регрессионного анализа. Выборочная дисперсия. Характеристики генеральной совокупности. Проверка статистической значимости уравнения регрессии. Оценка коэффициентов уравнения регрессии. Дисперсии случайных остатков.
реферат [57,4 K], добавлен 25.01.2009Проведение анализа экономической деятельности предприятий отрасли: расчет параметров линейного уравнения множественной регрессии с полным перечнем факторов, оценка статистической значимости параметров регрессионной модели, расчет прогнозных значений.
лабораторная работа [81,3 K], добавлен 01.07.2010Основные параметры уравнения регрессии, оценка их параметров и значимость. Интервальная оценка для коэффициента корреляции. Анализ точности определения оценок коэффициентов регрессии. Показатели качества уравнения регрессии, прогнозирование данных.
контрольная работа [222,5 K], добавлен 08.05.2014Параметры уравнения и экономическое толкование коэффициента линейной регрессии. Расчет коэффициентов детерминации и средних относительных ошибок аппроксимации. Построение структурной формы модели с использованием косвенного метода наименьших квадратов.
контрольная работа [99,2 K], добавлен 27.04.2011Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.
лабораторная работа [217,9 K], добавлен 17.10.2009