Прогнозирование объема кредита
Общее понятие о прогнозировании, методы. Абсолютные, сравнительные и качественные показатели оценки качества прогноза. Метод наименьших квадратов. Модели линейного роста. Новшества программы Excel 5.0. Пример решения задачи по прогнозу объема кредита.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 07.08.2013 |
Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
[Введите текст]
Реферат
В данной работе проведен обзор методов социально-экономического прогнозирования, наиболее часто применяемых в экономической практике. Выбраны четыре модели для прогнозирования кредитов: Метод наименьших квадратов, модель Хольта, экспоненциальное сглаживание. Данные представлены в виде временного ряда. Выбранные модели дают различный результат прогноза. Лучшие результаты были получены при использовании Метода наименьших квадратов и модели Хольта. Результаты вычислений представлены в таблицах. По каждой модели была проведена оценка качества прогнозирования: рассчитана абсолютная ошибка прогноза, средняя относительная ошибка прогноза, проверена адекватность модели по критерию Дарбина-Уотсона. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т.е. кредитов.
Все расчеты проводились с использованием программ Statistica и Excel, что дало возможность визуально представить результаты работы.
Введение
В экономике основой практически любой деятельности является прогноз. Уже на основе прогноза составляется план действий и мероприятий. Таким образом, можно сказать, что прогноз макроэкономических переменных является основополагающей составляющей планов всех субъектов экономической деятельности.
Прогнозирование - это способ научного предвидения, в котором используется как накопленный в прошлом опыт, так и текущие допущения насчет будущего с целью его определения. Основная функция прогноза - обоснование возможного состояния объекта в будущем или определение альтернативных путей.
В настоящее время ни одна сфера жизни общества не может обойтись без прогнозов как средства познания будущего. Особо важное значение имеют прогнозы социально-экономического развития общества, обоснование
основных направлений экономической политики, предвидение последствий
принимаемых решений.
Актуальность данной темы как в условиях развитой рыночной экономики, так и переходной экономики определяется тем, что уровень прогнозирования процессов общественного развития обуславливает эффективность планирования и управления экономикой и другими сферами.
Целью данной курсовой работы является рассмотрение наиболее эффективных методов социально экономических прогнозов и осуществление прогнозирования кредитов в РФ в 2007 году.
Организация финансово-кредитного обслуживания предприятий, организаций и населения, функционирование кредитной системы играют исключительно важную роль в развитии хозяйственных структур. От эффективности и бесперебойности функционирования кредитно-финансового механизма зависят не только своевременное получение средств отдельными хозяйственными единицами, но и темпы экономического развития страны в целом.
Кредитные операции - это отношения между кредитором и заемщиком (дебитором) по представлению первым последнему определенной суммы денежных средств на условиях платности, срочности, возвратности. Банковские кредитные операции подразделяются на две большие группы:
активные, когда банк выступает в лице кредитора, выдавая ссуды;
пассивные, когда банк выступает в роли заемщика (дебитора), привлекая деньги от клиентов и других банков в банк на условиях платности срочности, возвратности
1. Описание предметной области и постановка задачи исследования
Задачей данного исследования является осуществление точечного краткосрочного прогноза по выдачи кредита.
Прогнозирование - разработка прогноза, т.е. специальное научное исследование перспектив (прошлых тенденций) развития каких-либо явлений (технических, социально-экономических).
При прогнозировании используются три группы методов:
Экстраполяция (интерполяция);
Моделирование;
Опрос экспертов.
Экстраполяция изучает явление и переносит тенденции этого изученного явления на другую часть этого явления или переносит прошлые тенденции явления на будущие периоды. В научном плане примером экстраполяции является математическая статистика.
Интерполяция имеет сходную с экстраполяцией методологию - ищет промежуточные значения величины (параметра) по некоторым известным её значениям.
В данной работе будут использованы следующие аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы.
Качество прогнозирования, прежде всего, характеризуется ошибкой прогноза, (математическое определение качества прогноза): предполагается, что чем меньше ошибка прогноза, тем выше его качество.
Все существующие методики оценки качества прогнозирования можно условно разделить на три группы показателей:
Абсолютные;
Сравнительные;
Качественные.
Абсолютные показатели оценки качества прогноза позволяют количественно определить величину ошибки прогноза в единицах измерения прогнозируемого объекта или в процентах. Это среднеквадратическая ошибка (), абсолютная ошибка (), средняя абсолютная ошибка (), относительная ошибка () и средняя относительная ошибка ().
Абсолютная ошибка прогноза может быть определена как разность между фактическим значением () и прогнозом (), значит,
;
среднее абсолютное значение ошибки
.
Среднее абсолютное значение всегда неотрицательно. Среднеквадратическая ошибка прогноза рассчитывается по формуле:
, где n - период упреждения.
Недостатком рассматриваемых показателей является то, что значение этих характеристик существенно зависит от масштаба измерения уровней исследуемых явлений.
Поэтому абсолютная ошибка прогноза может быть выражена в процентах относительно фактических изменений показателя следующим образом:
,
а средняя относительная ошибка рассчитывается как
.
Данный показатель используется, как правило, при сравнении точности прогнозов разнородных объектов прогнозирования.
Сравнительные показатели оценки качества прогноза основаны на сравнении ошибки рассматриваемого прогноза с эталонными прогнозами определенного вида.
Один из типов таких показателей может быть представлен следующим образом:
,
где - прогнозируемое значение величины эталонного прогноза. В качестве эталонного прогноза может быть выбрана простая экстраполяция, постоянный темп прироста и т.д.
Качественные показатели позволяют повести некоторый анализ видов ошибок прогнозов, разложить их на какие-либо составляющие. Особенно такой анализ важен для циклически меняющихся переменных, когда необходимо прогнозировать не только общее направление развития, но и поворотные точки цикла, в которых меняются коэффициенты адаптации прогнозной модели.
Все рассмотренные выше показатели точности прогноза используются при проверке точности прогноза, полученного в виде точечных оценок.
Выбор показателей точности зависит от задач, которые ставит перед собой исследователь при анализе точности прогноза.
Важным критерием правильности применения прогнозной модели является проверка на адекватность. Адекватными моделями считаются такие, для которых остаточная компонента имеет свойства независимости, случайности и нормальности распределения.
В данной работе использовались абсолютные показатели оценки качества прогноза.
2. Описание используемого математического аппарата при проведении расчетов
Как уже отмечалось выше, в данной курсовой работе использовались аналитические методы прогнозной экстраполяции: метод наименьших квадратов, адаптивные методы. Расчеты проводились на их основе. Остановимся поподробнее на каждом из них.
Метод наименьших квадратов (МНК)
Метод наименьших квадратов позволяет относительно просто определить аналитическую зависимость одного показателя от другого:
y=ц(x).
Имея такую функциональную зависимость, легко определить значение Y при любом значении x, т.е. получить прогнозное значение Y при заданном значении х. Вывод формул метода наименьших квадратов. Пусть имеем статистические данные о параметре y в зависимости от х. Эти данные представим в виде табл.1.
х |
х1 |
х2 |
….. |
хi |
….. |
хn |
|
y* |
y1* |
y2* |
...... |
yi* |
….. |
yn* |
Метод наименьших квадратов позволяет при заданном типе зависимости y=ц(x) так выбрать ее числовые параметры, чтобы кривая y=ц(x) наилучшим образом отображала экспериментальные данные по заданному критерию. Рассмотрим обоснование с точки зрения теории вероятностей для математического определения параметров, входящих в ц(x).
Предположим, что истинная зависимость y от х в точности выражается формулой y=ц(x). Экспериментальные точки, представленные в табл.2, отклоняются от этой зависимости следствие ошибок измерения. Ошибки измерения подчиняются по теореме Ляпунова нормальному закону. Рассмотрим какое-нибудь значение аргумента хi. Результат опыта есть случайная величина yi,распределенная по нормальному закону с математическим ожиданием ц(xi) и со средним квадратическим отклонением уi, характеризующим ошибку измерения. Пусть точность измерения во всех точках х=(х1, х2, …, хn) одинакова, т.е. у1=у2=…=уn=у. Тогда нормальный закон распределения Yi имеет вид:
(1)
В результате ряда измерений произошло следующее событие: случайные величины (y1*, y2*, …, yn*). Поставим следующую задачу.
Задача МНК. Подобрать математические ожидания ц(x1), ц(x2), …, ц(xn) так, чтобы вероятность этого события была максимальной. Так как величины Yi непрерывны, то говорят не о вероятностях событий Yi=yi*, а о вероятностях того, что Yi примут значения из интервала (yi*,yi*+dyi*), т.е.
Вероятность P того, что система случайных величин (y1, y2, …, yn) примет совокупность значений, лежащих в пределах (yi*,yi*+dyi*), i=1, 2, …, n, с учетом того, что измерения проводятся независимо друг от друга, равна произведению вероятностей Fi(yi)*dyi* для всех значений i:
(2)
Где k - коэффициент, не зависящий от ц(xi).
Требуется выбрать математические ожидания
ц(x1), ц(x2), …, ц(xn) так, чтобы выражение (2) достигало максимума. Это возможно, когда выполнено условие
. (3)
Отсюда получаем требование метода наименьших квадратов: для того чтобы данная совокупность наблюдаемых значений (y1*, y2*, …, yn*) была наивероятнейшей, нужно выбрать функцию ц(x) так, чтобы сумма квадратов отклонений наблюдаемых значений yi* от ц(xi) была наименьшей.
При решении практических задач зависимость y=ц(x) задается в виде y=ц(x,a1, a2, …, am), где a1, a2, …, am - числовые параметры, которые необходимо определить. Учитывая соотношение (3), получим
(4)
Продифференцируем выражение (4) по a1, a2, …, am и прировняем полученные производные нулю. Получим следующую систему уравнений:
,
,
… … … … … … … … … … ; (5)
,
где - значения частной производной функции ц по аk в точке хi.
Отметим, что в общем случае систему (5) решить нельзя, так как неизвестен вид функции ц(x,a1, a2, …, am). При решении практических задач зависимость y от x ищут в виде линейной комбинации известных функций с коэффициентами a1, a2, …, am, а именно: . Подставив значение цk(х) в (5), решаем эту систему и находим a1, a2, …, am.
Рассмотрим один из частных случаев МНК: пусть зависимость y от х выражается линейной функцией y=a1+a2x. Тогда значения коэффициентов a1 и a2 находятся по следующим формулам:
; (6)
Адаптивные методы прогнозирования
Временным рядом называется множество наблюдений, получаемых последовательно во времени.
Прогнозирование с помощью временных рядов относится к классу адаптивных методов прогнозирования, которые имеют следующие особенности:
1) в основе всех адаптивных моделей лежит идея экспоненциального сглаживания;
2) адаптивные модели отражают только текущие свойства исследуемого временного ряда;
3) на каждой итерации адаптивные модели непрерывно учитывают текущие изменения характеристик ряда;
4) некоторые адаптивные модели обладают свойством самонастраивания, т.е. свойством учитывать прошлые изменения характеристик ряда;
5) критерием качества использования адаптивной прогнозной модели, как правило, является средний квадрат ошибки прогнозирования. В редких случаях за качество модели принимается отсутствие автокорреляции между членами временного ряда.
Согласно классическому подходу, в общем случае временной ряд рассматривается как состоящий из четырёх компонент: тренда, сезонных колебаний, нерегулярных колебаний и случайной компоненты.
Для описания временных рядов используется следующая модель:
хt=оt + зt, (7)
где хt - текущий член временного ряда в момент времени t;
оt - случайная величина, которая генерируется детерминированной функцией или стохастическим процессом;
зt - случайная величина, которая генерируется случайным неавтокоррелированным процессом с математическим ожиданием М=0 и постоянной дисперсией.
Значение прогнозируемого показателя определяется по формуле (7) только случайной величиной оt, так как в силу концепции модели (7) только через нее может быть реализовано взаимодействие членов ряда. Величина оt называется уровнем ряда хt и может быть представлена различными законами, т.е. трендами.
Случайная величина зt влияет на один или несколько соответствующих членов временного ряда, причем долевое влияние зt на прогноз значительно меньше, чем влияние оt.
Простейшие адаптивные модели используют идею экспоненциального сглаживания, т.е. вычисление экспоненциальной средней. Рассмотрим экспоненциальное сглаживание.
Экспоненциальное сглаживание
При исследовании временного ряда xt экспоненциальное сглаживание проводится по формуле:
(8)
Где хt - текущий член временного ряда в момент времени t;
St - значение экспоненциальной средней в момент времени t;
б - параметр адаптации (параметр сглаживания),
0< б<1, в=1-б.
В качестве начальных условий для применения экспоненциального сглаживания рекомендуется выбирать следующие значения:
среднее арифметическое всех имеющихся значений (или части значений) временного ряда;
среднее геометрическое всех имеющихся значений временного ряда;
значения, выбранные из статистики, полученной при наблюдении за аналогами изучаемого явления.
Модели линейного роста
Если временной ряд имеет тенденцию линейного роста, то применение экспоненциальной средней ведет к смещенным прогнозам. Поэтому были сконструированы специальные адаптивные модели, учитывающие тенденции роста и опирающиеся на идею экспоненциального сглаживания.
Эти модели позволяют статистически данным, близким к периоду прогнозирования, придать в некотором смысле больший вес, а наблюдениям, относящимся к далекому прошлому, - меньший, тогда как при использовании критерия наименьших квадратов все наблюдения имеют равный вес.
При исследовании численности населения была использована двухпараметричная модель Хольта.
Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:
где:
- временной ряд;
- прогнозное значение временного ряда в точке t на шагов вперед;
- шаг прогноза;
- коэффициенты;
- параметры адаптации, и ;
- ошибка прогноза.
3. Описание выбранных программных продуктов
Для расчетов будет использоваться СПП STATISTICA и MS Excel.
Программа MS Excel, являясь лидером на рынке программ обработки электронных таблиц, определяет тенденции развития в этой области. Вплоть до версии 4.0 программа Excel представляла собой фактический стандарт с точки зрения функциональных возможностей и удобства работы. Теперь на рынке появилась версия 5.0, которая содержит много улучшений и приятных неожиданностей.
К значительным достижениям в новой версии программы Excel можно отнести появление трехмерных документов (блокнотов). Установление связей между файлами и таблицами значительно упростилось по сравнению с прежними версиями. Контекстные меню значительно расширены, а дополнительные программные инструменты облегчают решение сложных прикладных задач.
Следует также упомянуть о различных помощниках (Ассистентах), которые помогают пользователю задавать функции и выдают рекомендации, если существует более простой метод решения текущей задачи. В программу Excel встроена удобная подсистема помощи, которая в любой момент готова выдать необходимую справку.
Описанные до сих пор новшества касаются в основном комфорта в работе и быстрого освоения программы. Одним из важнейших функциональных расширений программы, предназначенным для профессионалов, является встроенная в Excel Среда программирования Visual Basic (VBA) для решения прикладных задач. Благодаря VBA фирме Microsoft удалось не только расширить возможности языка макрокоманд Excel 4.0, но и ввести новый уровень прикладного программирования, поскольку VBA позволяет создавать полноценные прикладные пакеты, которые по своим функциям выходят далеко за рамки обработки электронных таблиц. Кроме этого, следует назвать следующие важные новшества программы Excel 5.0:
- менеджер файлов, который выдает подробную информацию о всех файлах;
- диалоговые окна-регистры;
- отдельная пиктограмма для форматирования;
- появление механизма Drag & Plot, предназначенного для быстрой активизации диаграмм.
MS Excel - средство для работы с электронными таблицами, намного превышающее по своим возможностям существующие редакторы таблиц. MS Excel - это простое и удобное средство, позволяющее проанализировать данные и, при необходимости, проинформировать о результате заинтересованную аудиторию, используя Internet.
Ключевые преимущества:
эффективный анализ данных;
богатые средства форматирования и отображения данных;
совместное использование данных и работа над документами;
обмен данными и информацией через Internet и внутренние Intranet-сети.
Достоинства Microsoft Excel
Эффективность анализа данных
Быстрый и эффективный анализ, удобные средства для работы с данными (мастер сводных таблиц позволяет быстро обрабатывать большие массивы данных и получать итоговые результаты в удобном виде);
Механизм автокоррекции формул автоматически распознает и исправляет ошибки при введении формул;
Использование естественного языка при написании формул.
Богатство средств форматирования и отображения данных
Новые средства форматирования делают оформление таблиц более ярким и понятным (возможности слияния ячеек в электронной таблице, поворот текста в ячейке на любой угол);
Новый и дополненный Мастер создания диаграмм позволяет сделать представление данных в таблицах более наглядным (более удобный и мощный мастер создания диаграмм, новые типы диаграмм - диаграммы в виде круглых столбиков, тетраэдров, в виде «бубликов» и др.).
Совместное использование данных и работа над документами
Microsoft Excel обеспечивает возможность одновременной работы нескольких пользователей над одним документом.
Обмен данными и работа в Internet
Теперь возможно использовать самые свежие данные путем получения их в виде электронных таблиц прямо с Web-серверов в Internet;
Возможность использовать встроенный Internet Assistant для преобразования таблицы в формат HTML и публикации на Web-сервере.
Пакет STATISTICA был создан в начале 1990-х годов сразу для среды Windows. В пакете нашли отражение многие последние достижения теоретической и прикладной статистики.
У пакета есть специальная версия для обучения основам статистических методов - Studеnt Еditiоn оf STATISTICA. Эта версия позволяет анализировать файлы данных, включающих не более 400 наблюдений, и представляет собой урезанный вариант пакета.
Основная версия пакета может дополнительно комплектоваться специализированными модулями: Роwеr Analysis (планирование статистических исследовании), Nеural Nеtwоrks (нейросетевой анализ) и др.
С помощью реализованных в системе STATISTICA мощных языков программирования, снабженных специальными средствами поддержки, легко создаются законченные пользовательские решения и встраиваются в различные другие приложения или вычислительные среды. Очень трудно представить себе, что кому-то могут понадобиться абсолютно все статистические процедуры и методы визуализации, имеющиеся в системе STATISTICA, однако опыт многих людей, успешно работающих с пакетом, свидетельствует о том, что возможность доступа к новым, нетрадиционным методам анализа данных помогает находить новые способы проверки рабочих гипотез и исследования данных.
STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения. СПП STATISTICA является универсальной системой, предназначенной для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащей широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе.
Она состоит из следующих основных компонент, объединенных в рамках одной системы:
электронных таблиц для ввода и задания исходных данных;
специальных таблиц для вывода численных результатов анализа;
графической системы для визуализации данных и результатов статистического анализа;
набора специализированных статистических модулей, в которых собраны группы логически связанных между собой статистических процедур;
специального инструментария для подготовки отчетов.
Статистический анализ данных в системе STATISTICA может быть разбит на следующие основные этапы:
ввод данных в электронную таблицу с исходными данными и их предварительное преобразование перед анализом;
визуализация данных при помощи того или иного типа графиков;
применение конкретной процедуры статистической обработки;
вывод результатов анализа в виде графиков и электронных таблиц с численной и текстовой информацией;
Пакет содержит следующие модули:
Basic Statistic/Tables - Основные статистики и таблицы: позволяет провести предварительную обработку данных, осуществить разведочный анализ, определить зависимости между переменными, разбить их различными способами на группы;
Nonparametrics/Distrib. - Модуль Непараметрическая статистика/Распределеня: дает возможность проверить гипотезы о характере распределения ваших данных;
ANOVA/MANOVA - Модуль дисперсионного анализа: представляет собой набор процедур общего одномерного и многомерного дисперсионного и ковариационного анализа;
Multiple Regression - Модуль Множественная регрессия: помогает построить зависимости между многомерными переменными, подобрать простую линейную модель и оценить ее адекватность;
Nonlinear Estimation - Модуль Нелинейное оценивание: предоставляет возможность определения нелинейной зависимости в данных и подгонки к ним функциональных кривых;
Time Series/Forecasting - Анализ временных рядов и прогнозирование: общее назначение модуля - построить простую модель, описывающую ряд, сгладить его, спрогнозировать будущие значения временного ряда на основе наблюдаемых до данного момента, построить регрессионные зависимости одного ряда от другого, провести спектральный или Фурье - анализ ряда;
Claster Analysis - Модуль Кластерный анализ: позволяет произвести сложную иерархическую классификацию данных или выделить в них кластеры;
Data Management/MFM - Управление данными: специализированный модуль, который содержит большое количество вспомогательных процедур по работе с данными (иерархическая сортировка, проверка, категоризация и ранжирование и др.);
Factor Analysis - Модуль Факторный анализ: дает возможность сжать данные или выделить основные общие факторы, влияющие на наблюдаемые характеристики сложного объекта и объясняющие связи между ними;
Canonical Analysis - Модуль Канонический анализ: включает в себя широкий набор процедур для выполнения канонического корреляционного анализа, исследования связи между двумя множествами переменных;
Multidimensional Scaling - Модуль Многомерное шкалирование: помогает представить данные о близости объектов какой-либо простой пространственной моделью, в которой объекты интерпретируются, например, как города на обычной карте, а различия между ними есть просто расстояния, в частности данные о странах, политических партиях и т.д., и всесторонне диагностировать модель;
SEPATH - Модуль Моделирование структурными уравнениями: позволяет строить и тестировать различные модели, объясняющие структуру связей между наблюдаемыми переменными;
Reliability/Item Analysis - Модуль Анализ надежности: включает широкий набор процедур для разработки и вычислений надежности сложных объектов на основе результатов обследований и диагностики отдельных узлов;
Discriminant Analysis - Модуль Дискриминантный анализ: позволяет построить на основе ряда предположений классификационное правило отнесения объекта к одному из нескольких классов, минимизируя некоторый разумный критерий;
Log-linear Analysis - Модуль Лог-линейный анализ: проводит анализ сложных многоуровневых таблиц;
Survival Analysis - Модуль Анализ длительностей жизни: предлагает обширный набор методов анализа данных из социологии, биологии, медицины, так же, как процедуры, используемые в инженерии и маркетинге;
Commmand Language (SCL) - Командный язык STATISTICA: позволяет автоматизировать рутинные процессы обработки данных в системе;
STATISTICA File Server - позволяет быстро открыть для просмотра/редактирования как графики и таблицы, так и отчеты.
Выбор системы STATISTICA в качестве инструмента для обработки данных может быть обусловлен возможностью проведения наиболее полного анализа, т.к. система содержит все необходимые нам статистические процедуры.
Основные преимущества системы STATISTICA:
содержит полный набор классических методов анализа данных: от основных классических методов статистики, до самых современных, что позволяет гибко организовывать анализ;
является средством построения приложений в конкретных областях;
отвечает всем стандартам Windows, что позволяет сделать анализ высокоинтерактивным;
система может быть интегрирована в Интернет;
поддерживает web-форматы:HTML, JPEG, PNG;
данные системы STATISTICA легко конвертировать в различные базы данных и электронные таблицы;
поддерживает высококачественную графику, позволяющую эффективно визуализировать данные и проводить графический анализ;
является открытой системой: содержит языки программирования, которые позволяют расширить систему, запускать ее из других Windows-приложений, например из Excel;
используются разнообразные методы, позволяющие провести всесторонне исследование ретроспективных данных (в виде временных рядов);
доступны различные возможности преобразования временных рядов;
позволяют построить объективный прогноз данных, который включает в себя вычисление верхних и нижних границ, в которых, можно утверждать, что с определенной вероятностью лежат значения прогнозируемых показателей.
4. Практическая часть
прогнозирование кредит объем
Полное исследование проблем, связанных с прогнозированием конкретного показателя, сводится к выполнению следующих этапов:
1. постановка задачи исследования и сбор исходной информации;
2. предпрогнозный анализ данных;
3. выбор моделей прогнозирования;
4. численное оценивание параметров моделей;
5. проверка моделей на точность и адекватность;
6. выбор лучшей модели или построение обобщенной модели;
7. получение точечного интервального прогнозов;
8. анализ и интерпретация полученных прогнозных значений.
Задача исследования
Задачей данного исследование является прогнозирование объема кредита. Исходная информация представляет из себя временной ряд размерностью 27 - с января 2005 г. по май 2007 г.
Таблица 1
t |
y |
|
1 |
137,4 |
|
2 |
142,8 |
|
3 |
142,6 |
|
4 |
142,9 |
|
5 |
143,7 |
|
6 |
145,2 |
|
7 |
144,6 |
|
8 |
144,0 |
|
9 |
145,9 |
|
10 |
146,3 |
|
11 |
147,0 |
|
12 |
147,7 |
|
13 |
146,9 |
|
14 |
146,6 |
|
15 |
147,8 |
|
16 |
147,2 |
|
17 |
147,5 |
|
18 |
147,3 |
|
19 |
147,0 |
|
20 |
147,8 |
|
21 |
147,5 |
|
22 |
146,9 |
|
23 |
146,3 |
|
24 |
145,6 |
|
25 |
145,0 |
|
26 |
144,2 |
|
27 |
145,5 |
Исходные данные
Примем январь 2005 года за единицу. Обозначим за X (независимую переменную) определенный момент времени, а за Y - выдачу кредита в каждый из рассматриваемых моментов. Рассмотрим диаграмму рассеяния зависимой переменной (рисунок 1.).
Рис. 1 - Диаграмма рассеивания выдачи кредита (Y)
Глядя на этот график можно предположить, что, близкими к такому виду зависимости являются линейная, степенная функции и полином второго порядка. Их параметры возможно определить, используя метод наименьших квадратов. Кроме того, исходные данные представляют из себя временной ряд с тенденцией линейного роста, значит, к нему возможно применить адаптивные модели, а именно экспоненциальное сглаживание и модели линейного роста.
Таким образом, конечный выбор моделей для построения следующий:
1) Линейная зависимость вида (МНК);
2) Полином второго порядка (МНК);
3) Степенная функция (МНК);
4) Экспоненциальное сглаживание;
5) Модель Хольта;
Оценка параметров моделей.
Параметры линейной зависимости определяются в пакете MSExcel. Получили следующую зависимость Y=201507+153,94*t. Коэффициент детерминации () = 0,5199. Это значит, что предложенное уравнение на 51% объясняет дисперсию результативного признака.
Рис. 2 - Линейный тренд
Рассчитаем абсолютные показатели качества прогноза по рассматриваемой модели. Это будут средняя абсолютная и среднеквадратическая ошибки.
а1=153,94;
а2=201507.
Таблица 2 - Расчет средней абсолютной и среднеквадратической ошибок в линейной модели
t |
y |
t2 |
t*y |
МНК |
?пр |
?пр2 |
||||
1 |
202486 |
1 |
202486 |
201741,1 |
744,9 |
554950,1 |
||||
2 |
205654 |
4 |
411308 |
201895 |
3759,0 |
14130139 |
||||
3 |
200899 |
9 |
602697 |
202048,9 |
-1149,9 |
1322349 |
||||
4 |
201785 |
16 |
807140 |
202202,9 |
-417,9 |
174620,6 |
||||
5 |
202321 |
25 |
1011605 |
202356,8 |
-35,8 |
1282,949 |
||||
6 |
202698 |
36 |
1216188 |
202510,8 |
187,2 |
35058,71 |
||||
7 |
201999 |
49 |
1413993 |
202664,7 |
-665,7 |
443159,5 |
||||
8 |
202856 |
64 |
1622848 |
202818,6 |
37,4 |
1395,45 |
||||
9 |
201897 |
81 |
1817073 |
202972,6 |
-1075,6 |
1156886 |
||||
10 |
202655 |
100 |
2026550 |
203126,5 |
-471,5 |
222338,9 |
||||
11 |
203968 |
121 |
2243648 |
203280,5 |
687,5 |
472697,1 |
||||
12 |
202789 |
144 |
2433468 |
203434,4 |
-645,4 |
416557 |
||||
13 |
202899 |
169 |
2637687 |
203588,4 |
-689,4 |
475209,3 |
||||
14 |
203122 |
196 |
2843708 |
203742,3 |
-620,3 |
384767,5 |
||||
15 |
203320 |
225 |
3049800 |
203896,2 |
-576,2 |
332050,6 |
||||
16 |
205166 |
256 |
3282656 |
204050,2 |
1115,8 |
1245054 |
||||
17 |
203100 |
289 |
3452700 |
204204,1 |
-1104,1 |
1219086 |
||||
18 |
202963 |
324 |
3653334 |
204358,1 |
-1395,1 |
1946204 |
||||
19 |
203689 |
361 |
3870091 |
204512 |
-823,0 |
677339,4 |
||||
20 |
203954 |
400 |
4079080 |
204665,9 |
-711,9 |
506870,4 |
||||
21 |
206211 |
441 |
4330431 |
204819,9 |
1391,1 |
1935186 |
||||
22 |
204569 |
484 |
4500518 |
204973,8 |
-404,8 |
163889,2 |
||||
23 |
204998 |
529 |
4714954 |
205127,8 |
-129,8 |
16841,37 |
||||
24 |
204568 |
576 |
4909632 |
205281,7 |
-713,7 |
509391 |
||||
25 |
207123 |
625 |
5178075 |
205435,7 |
1687,3 |
2847122 |
||||
26 |
205456 |
676 |
5341856 |
205589,6 |
-133,6 |
17849,05 |
||||
27 |
207897 |
729 |
5613219 |
205743,5 |
2153,5 |
4637380 |
||||
сумма |
378 |
5501042,0 |
6930 |
7,7E+07 |
|
|
35845674 |
средняя |
1327617,56 |
|
а1= |
201587,1 |
|||||||||
а2= |
153,942 |
|||||||||
прогноз |
28 |
207998 |
|
|
205897,5 |
= 132761736; =1152,2;
Степенная функция
Рис. 3 - Степенная зависимость Y от X
Получили, что . Коэффициент детерминации невысок и равен 28%. Расчет оценок качества прогноза приведен ниже в Таблице 4.
Таблица 3 - Расчет средней абсолютной и среднеквадратической ошибок в линейной модели
t |
y |
t2 |
t*y |
МНК |
?пр |
?пр2 |
||||
1 |
202486 |
1 |
202486 |
201167 |
1319,0 |
1739761 |
||||
2 |
205654 |
4 |
411308 |
203297,7 |
2356,3 |
5552304,16 |
||||
3 |
200899 |
9 |
602697 |
204554,5 |
-3655,5 |
13362488,8 |
||||
4 |
201785 |
16 |
807140 |
205450,9 |
-3665,9 |
13438833,7 |
||||
5 |
202321 |
25 |
1011605 |
206148,9 |
-3827,9 |
14653042,4 |
||||
6 |
202698 |
36 |
1216188 |
206721 |
-4023,0 |
16184686,6 |
||||
7 |
201999 |
49 |
1413993 |
207206 |
-5207,0 |
27112364,9 |
||||
8 |
202856 |
64 |
1622848 |
207626,9 |
-4770,9 |
22761885,6 |
||||
9 |
201897 |
81 |
1817073 |
207999 |
-6102,0 |
37234278,2 |
||||
10 |
202655 |
100 |
2026550 |
208332,4 |
-5677,4 |
32232447,9 |
||||
11 |
203968 |
121 |
2243648 |
208634,4 |
-4666,4 |
21775248,3 |
||||
12 |
202789 |
144 |
2433468 |
208910,5 |
-6121,5 |
37472914,1 |
||||
13 |
202899 |
169 |
2637687 |
209164,8 |
-6265,8 |
39260724,4 |
||||
14 |
203122 |
196 |
2843708 |
209400,6 |
-6278,6 |
39420598,4 |
||||
15 |
203320 |
225 |
3049800 |
209620,3 |
-6300,3 |
39693708,8 |
||||
16 |
205166 |
256 |
3282656 |
209826 |
-4660,0 |
21715876,9 |
||||
17 |
203100 |
289 |
3452700 |
210019,5 |
-6919,5 |
47879097 |
||||
18 |
202963 |
324 |
3653334 |
210202 |
-7239,0 |
52403384,1 |
||||
19 |
203689 |
361 |
3870091 |
210374,8 |
-6685,8 |
44700426,7 |
||||
20 |
203954 |
400 |
4079080 |
210538,9 |
-6584,9 |
43361199,9 |
||||
21 |
206211 |
441 |
4330431 |
210695,1 |
-4484,1 |
20107313,8 |
||||
22 |
204569 |
484 |
4500518 |
210844,2 |
-6275,2 |
39377558,3 |
||||
23 |
204998 |
529 |
4714954 |
210986,7 |
-5988,7 |
35864079,5 |
||||
24 |
204568 |
576 |
4909632 |
211123,2 |
-6555,2 |
42970585,5 |
||||
25 |
207123 |
625 |
5178075 |
211254,2 |
-4131,2 |
17067116,6 |
||||
26 |
205456 |
676 |
5341856 |
211380,2 |
-5924,2 |
35096317,2 |
||||
27 |
207897 |
729 |
5613219 |
211501,5 |
-3604,5 |
12992479,1 |
||||
сумма |
378 |
5501042,0 |
6930 |
77266745 |
|
|
775430722 |
средняя |
28719656 |
|
прогноз |
28 |
207998 |
|
|
211618,5 |
а1= 201167;
= 28719656; =5359,07;
Произошло снижение средней абсолютной ошибки с 132761736 до 28719656 единиц и среднеквадратической ошибки с 1152,2 до 5359,07.
Полином второго порядка
Воспользовавшись средствами MSExcel, получили уравнение Y=10,954x2+152,76x+203070.
Рис. 4 - Зависимость Y от X в виде полинома второго прядка
Коэффициент детерминации достаточно высокий 64,7%. Рассчитаем оценки качества прогноза (Таблица 5.).
Таблица 4 - Расчет средней абсолютной и среднеквадратической ошибок в модели полинома
t |
y |
t2 |
t*y |
МНК |
?пр |
?пр2 |
||||
1 |
202486 |
1 |
202486 |
202928,2 |
-442,2 |
195535,5336 |
||||
2 |
205654 |
4 |
411308 |
202808,3 |
2845,7 |
8098031,256 |
||||
3 |
200899 |
9 |
602697 |
202710,3 |
-1811,3 |
3280829,426 |
||||
4 |
201785 |
16 |
807140 |
202634,2 |
-849,2 |
721181,4022 |
||||
5 |
202321 |
25 |
1011605 |
202580,1 |
-259,0 |
67106,9025 |
||||
6 |
202698 |
36 |
1216188 |
202547,8 |
150,2 |
22564,84666 |
||||
7 |
201999 |
49 |
1413993 |
202537,4 |
-538,4 |
289902,5575 |
||||
8 |
202856 |
64 |
1622848 |
202549 |
307,0 |
94263,73658 |
||||
9 |
201897 |
81 |
1817073 |
202582,4 |
-685,4 |
469819,7684 |
||||
10 |
202655 |
100 |
2026550 |
202637,8 |
17,2 |
295,84 |
||||
11 |
203968 |
121 |
2243648 |
202715,1 |
1252,9 |
1569823,561 |
||||
12 |
202789 |
144 |
2433468 |
202814,3 |
-25,3 |
637,865536 |
||||
13 |
202899 |
169 |
2637687 |
202935,3 |
-36,3 |
1321,031716 |
||||
14 |
203122 |
196 |
2843708 |
203078,3 |
43,7 |
1905,846336 |
||||
15 |
203320 |
225 |
3049800 |
203243,3 |
76,8 |
5890,5625 |
||||
16 |
205166 |
256 |
3282656 |
203430,1 |
1735,9 |
3013473,796 |
||||
17 |
203100 |
289 |
3452700 |
203638,8 |
-538,8 |
290290,3538 |
||||
18 |
202963 |
324 |
3653334 |
203869,4 |
-906,4 |
821589,9651 |
||||
19 |
203689 |
361 |
3870091 |
204122 |
-433,0 |
187449,1661 |
||||
20 |
203954 |
400 |
4079080 |
204396,4 |
-442,4 |
195717,76 |
||||
21 |
206211 |
441 |
4330431 |
204692,8 |
1518,2 |
2305070,917 |
||||
22 |
204569 |
484 |
4500518 |
205011 |
-442,0 |
195378,1443 |
||||
23 |
204998 |
529 |
4714954 |
205351,2 |
-353,2 |
124740,3506 |
||||
24 |
204568 |
576 |
4909632 |
205713,3 |
-1145,3 |
1311629,63 |
||||
25 |
207123 |
625 |
5178075 |
206097,3 |
1025,8 |
1052163,063 |
||||
26 |
205456 |
676 |
5341856 |
206503,1 |
-1047,1 |
1096510,557 |
||||
27 |
207897 |
729 |
5613219 |
206930,9 |
966,1 |
933260,3309 |
||||
сумма |
378 |
5501042,0 |
6930 |
77266745 |
|
|
26346384,17 |
средняя |
975792,0062 |
|
а1= |
203070 |
|||||||||
а2= |
-152,76 |
|||||||||
а3= |
10,954 |
|||||||||
прогноз |
28 |
207998 |
|
|
207380,7 |
= 975792,006; =987,8;
Средняя абсолютная ошибка равна 975792,006, а среднеквадратическая = 987,8.
Экспоненциальное сглаживание
Применим к рассматриваемому временному ряду экспоненциальное сглаживание, используя формулу:
.
Для этого сначала определим начальное значение S0 как первый член прогнозного ряда, полученного методом наименьших квадратов для полиномиальной модели третьего порядка. Т.е. S0=203742,3 штук. Шаг прогноза в нашем случае равен 1. Следующее значение прогноза равно . Повторяем проделанные шаги несколько раз и формируем таким образом прогнозный ряд на основе экспоненциального сглаживания для адаптивной полиномиальной модели 0-го порядка. Большое влияние на точность прогноза влияет параметр адаптации.
Таблица 5
t |
y |
у сгл а=0,1 |
прогноз |
?пр |
|?пр| |
|
1 |
202486,0 |
81371,3 |
140,074 |
81231,22 |
81231,22 |
|
2 |
205654,0 |
20565,4 |
141,006 |
20424,42 |
20424,42 |
|
3 |
200899,0 |
20090 |
141,876 |
19948,11 |
19948,11 |
|
4 |
201785,0 |
20178,5 |
142,685 |
20035,81 |
20035,81 |
|
5 |
202321,0 |
20232,1 |
143,433 |
20088,67 |
20088,67 |
|
6 |
202698,0 |
20269,8 |
144,118 |
20125,68 |
20125,68 |
|
7 |
201999,0 |
20199,9 |
144,742 |
20055,16 |
20055,16 |
|
8 |
202856,0 |
20285,6 |
145,305 |
20140,30 |
20140,30 |
|
9 |
201897,0 |
20189,7 |
145,806 |
20043,89 |
20043,89 |
|
10 |
202655,0 |
20265,5 |
146,245 |
20119,26 |
20119,26 |
|
11 |
203968,0 |
20396,8 |
146,623 |
20250,18 |
20250,18 |
|
12 |
202789,0 |
20278,9 |
146,939 |
20131,96 |
20131,96 |
|
13 |
202899,0 |
20289,9 |
147,193 |
20142,71 |
20142,71 |
|
14 |
203122,0 |
20312,2 |
147,386 |
20164,81 |
20164,81 |
|
15 |
203320,0 |
20332 |
147,518 |
20184,48 |
20184,48 |
|
16 |
205166,0 |
20516,6 |
147,587 |
20369,01 |
20369,01 |
|
17 |
203100,0 |
20310 |
147,595 |
20162,40 |
20162,40 |
|
18 |
202963,0 |
20296,3 |
147,542 |
20148,76 |
20148,76 |
|
19 |
203689,0 |
20368,9 |
147,427 |
20221,47 |
20221,47 |
|
20 |
203954,0 |
20395,4 |
147,25 |
20248,15 |
20248,15 |
|
21 |
206211,0 |
20621,1 |
147,012 |
20474,09 |
20474,09 |
|
22 |
204569,0 |
20456,9 |
146,712 |
20310,19 |
20310,19 |
|
23 |
204998,0 |
20499,8 |
146,35 |
20353,45 |
20353,45 |
|
24 |
204568,0 |
20456,8 |
145,927 |
20310,87 |
20310,87 |
|
25 |
207123,0 |
20712,3 |
145,443 |
20566,86 |
20566,86 |
|
26 |
205456,0 |
20545,6 |
144,896 |
20400,70 |
20400,70 |
|
27 |
207897,0 |
20789,7 |
144,288 |
20645,41 |
20645,41 |
|
сумма |
|
|
|
|
607298,03 |
= 31724,58; =33319,08;
Таблица 6
t |
y |
у сгл а=0,5 |
прогноз |
?пр |
|?пр| |
|
1 |
202486,0 |
162366 |
140,074 |
162225,62 |
162225,62 |
|
2 |
205654,0 |
102827 |
141,006 |
102686,14 |
102686,14 |
|
3 |
200899,0 |
100450 |
141,876 |
100307,71 |
100307,71 |
|
4 |
201785,0 |
100893 |
142,685 |
100749,81 |
100749,81 |
|
5 |
202321,0 |
101161 |
143,433 |
101017,07 |
101017,07 |
|
6 |
202698,0 |
101349 |
144,118 |
101204,88 |
101204,88 |
|
7 |
201999,0 |
101000 |
144,742 |
100854,76 |
100854,76 |
|
8 |
202856,0 |
101428 |
145,305 |
101282,70 |
101282,70 |
|
9 |
201897,0 |
100949 |
145,806 |
100802,69 |
100802,69 |
|
10 |
202655,0 |
101328 |
146,245 |
101181,26 |
101181,26 |
|
11 |
203968,0 |
101984 |
146,623 |
101837,38 |
101837,38 |
|
12 |
202789,0 |
101395 |
146,939 |
101247,56 |
101247,56 |
|
13 |
202899,0 |
101450 |
147,193 |
101302,31 |
101302,31 |
|
14 |
203122,0 |
101561 |
147,386 |
101413,61 |
101413,61 |
|
15 |
203320,0 |
101660 |
147,518 |
101512,48 |
101512,48 |
|
16 |
205166,0 |
102583 |
147,587 |
102435,41 |
102435,41 |
|
17 |
203100,0 |
101550 |
147,595 |
101402,40 |
101402,40 |
|
18 |
202963,0 |
101482 |
147,542 |
101333,96 |
101333,96 |
|
19 |
203689,0 |
101845 |
147,427 |
101697,07 |
101697,07 |
|
20 |
203954,0 |
101977 |
147,25 |
101829,75 |
101829,75 |
|
21 |
206211,0 |
103106 |
147,012 |
102958,49 |
102958,49 |
|
22 |
204569,0 |
102285 |
146,712 |
102137,79 |
102137,79 |
|
23 |
204998,0 |
102499 |
146,35 |
102352,65 |
102352,65 |
|
24 |
204568,0 |
102284 |
145,927 |
102138,07 |
102138,07 |
|
25 |
207123,0 |
103562 |
145,443 |
103416,06 |
103416,06 |
|
26 |
205456,0 |
102728 |
144,896 |
102583,10 |
102583,10 |
|
27 |
207897,0 |
103949 |
144,288 |
103804,21 |
103804,21 |
|
сумма |
|
|
|
|
2807714,95 |
= 146268,9; =146309,7;
Таблица 7
t |
y |
у сгл а=0,7 |
прогноз |
?пр |
|?пр| |
|
1 |
202486,0 |
202863 |
140,074 |
202722,82 |
202722,82 |
|
2 |
205654,0 |
204817 |
141,006 |
204675,66 |
204675,66 |
|
3 |
200899,0 |
202074 |
141,876 |
201932,42 |
201932,42 |
|
4 |
201785,0 |
201872 |
142,685 |
201729,10 |
201729,10 |
|
5 |
202321,0 |
202186 |
143,433 |
202042,80 |
202042,80 |
|
6 |
202698,0 |
202544 |
144,118 |
202400,35 |
202400,35 |
|
7 |
201999,0 |
202163 |
144,742 |
202017,90 |
202017,90 |
|
8 |
202856,0 |
202648 |
145,305 |
202502,69 |
202502,69 |
|
9 |
201897,0 |
202122 |
145,806 |
201976,49 |
201976,49 |
|
10 |
202655,0 |
202495 |
146,245 |
202348,94 |
202348,94 |
|
11 |
203968,0 |
203526 |
146,623 |
203379,53 |
203379,53 |
|
12 |
202789,0 |
203010 |
146,939 |
202863,21 |
202863,21 |
|
13 |
202899,0 |
202932 |
147,193 |
202785,15 |
202785,15 |
|
14 |
203122,0 |
203065 |
147,386 |
202917,72 |
202917,72 |
|
15 |
203320,0 |
203244 |
147,518 |
203096,01 |
203096,01 |
|
16 |
205166,0 |
204589 |
147,587 |
204441,67 |
204441,67 |
|
17 |
203100,0 |
203547 |
147,595 |
203399,18 |
203399,18 |
|
18 |
202963,0 |
203138 |
147,542 |
202990,59 |
202990,59 |
|
19 |
203689,0 |
203524 |
147,427 |
203376,31 |
203376,31 |
|
20 |
203954,0 |
203825 |
147,25 |
203677,67 |
203677,67 |
|
21 |
206211,0 |
205495 |
147,012 |
205348,16 |
205348,16 |
|
22 |
204569,0 |
204847 |
146,712 |
204700,14 |
204700,14 |
|
23 |
204998,0 |
204953 |
146,35 |
204806,31 |
204806,31 |
|
24 |
204568,0 |
204683 |
145,927 |
204537,47 |
204537,47 |
|
25 |
207123,0 |
206391 |
145,443 |
206245,68 |
206245,68 |
|
26 |
205456,0 |
205737 |
144,896 |
205591,64 |
205591,64 |
|
27 |
207897,0 |
207249 |
144,288 |
207104,57 |
207104,57 |
|
сумма |
|
|
|
|
5495610,21 |
= 203541,1; =2003545,9;
Очевидно, что с ростом параметра адаптации увеличиваются ошибки прогноза.
Двухпараметрическая модель Хольта
Простейшая модификация двухпараметрической модели Хольта выглядит следующим образом:
где:
- временной ряд;
- прогнозное значение временного ряда в точке t на шагов вперед;
- шаг прогноза;
- коэффициенты;
- параметры адаптации, и ;
- ошибка прогноза.
В нашем случае воспользуемся моделями Хольта с шагом прогноза =1, начальные значения и определим с помощью линейной модели, полученной методом наименьших квадратов.
Модель Хольта с шагом прогноза = 1.
а1= |
201587,0 |
|
а2= |
153,94 |
|
альфа1= |
0,5 |
|
альфа2= |
0,5 |
На их основе можно определить прогнозные значения независимой переменной по формуле . Рассмотрим случай, когда параметры адаптации равны 0,5. Были получены следующие значения коэффициентов (Таблица 8.):
Таблица 8
|
|
мод хольт |
а1 |
а2 |
|||
t |
y |
|
201587,0 |
153,9 |
?пр |
|?пр| |
|
1 |
202486,0 |
201740,9 |
202113,47 |
340,2065 |
745,06 |
745,06 |
|
2 |
205654,0 |
202453,7 |
204053,84 |
1140,287 |
3200,32 |
3200,32 |
|
3 |
200899,0 |
205194,1 |
203046,56 |
66,50566 |
-4295,13 |
4295,13 |
|
4 |
201785,0 |
203113,1 |
202449,03 |
-265,511 |
-1328,07 |
1328,07 |
|
5 |
202321,0 |
202183,5 |
202252,26 |
-231,142 |
137,48 |
137,48 |
|
6 |
202698,0 |
202021,1 |
202359,56 |
-61,922 |
676,88 |
676,88 |
|
7 |
201999,0 |
202297,6 |
202148,32 |
-136,581 |
-298,64 |
298,64 |
|
8 |
202856,0 |
202011,7 |
202433,87 |
74,48425 |
844,26 |
844,26 |
|
9 |
201897,0 |
202508,4 |
202202,68 |
-78,354 |
-611,35 |
611,35 |
|
10 |
202655,0 |
202124,3 |
202389,66 |
54,31539 |
530,68 |
530,68 |
|
11 |
203968,0 |
202444,0 |
203205,99 |
435,3212 |
1524,02 |
1524,02 |
|
12 |
202789,0 |
203641,3 |
203215,15 |
222,2438 |
-852,31 |
852,31 |
|
13 |
202899,0 |
203437,4 |
203168,2 |
87,64419 |
-538,40 |
538,40 |
|
14 |
203122,0 |
203255,8 |
203188,92 |
54,18331 |
-133,84 |
133,84 |
|
15 |
203320,0 |
203243,1 |
203281,55 |
73,40705 |
76,89 |
76,89 |
|
16 |
205166,0 |
203355,0 |
204260,48 |
526,1672 |
1811,04 |
1811,04 |
|
17 |
203100,0 |
204786,6 |
203943,32 |
104,5054 |
-1686,65 |
1686,65 |
|
18 |
202963,0 |
204047,8 |
203505,41 |
-166,702 |
-1084,83 |
1084,83 |
|
19 |
203689,0 |
203338,7 |
203513,86 |
-79,13 |
350,29 |
350,29 |
|
20 |
203954,0 |
203434,7 |
203694,36 |
50,68845 |
519,27 |
519,27 |
|
21 |
206211,0 |
203745,1 |
204978,03 |
667,1755 |
2465,95 |
2465,95 |
|
22 |
204569,0 |
205645,2 |
205107,1 |
398,1252 |
-1076,20 |
1076,20 |
|
23 |
204998,0 |
205505,2 |
205251,61 |
271,3187 |
-507,23 |
507,23 |
|
24 |
204568,0 |
205522,9 |
205045,47 |
32,58581 |
-954,93 |
954,93 |
|
25 |
207123,0 |
205078,1 |
206100,53 |
543,8229 |
2044,95 |
2044,95 |
|
26 |
205456,0 |
206644,3 |
206050,17 |
246,7357 |
-1188,35 |
1188,35 |
|
27 |
207897,0 |
206296,9 |
207096,96 |
646,7582 |
1600,09 |
1600,09 |
|
|
прогноз28 |
207743,7 |
|
|
сраб ош |
1151,23 |
|
сигма |
1497,685 |
Просчитаем оценки качества модели Хольта для различных комбинаций значений коэффициентов адаптации.
Таблица 9
а1= |
201587,0 |
||||||
а2= |
153,94 |
||||||
альфа1= |
0,3 |
||||||
альфа2= |
0,7 |
||||||
|
|
мод хольт |
а1 |
а2 |
|||
t |
y |
|
201587,0 |
153,9 |
?пр |
|?пр| |
|
1 |
202486,0 |
201740,9 |
201964,46 |
220,9972 |
745,06 |
745,06 |
|
2 |
205654,0 |
202185,5 |
203226,02 |
533,1661 |
3468,54 |
3468,54 |
|
3 |
200899,0 |
203759,2 |
202901,13 |
275,7494 |
-2860,19 |
2860,19 |
|
4 |
201785,0 |
203176,9 |
202759,32 |
150,4803 |
-1391,88 |
1391,88 |
|
5 |
202321,0 |
202909,8 |
202733,16 |
97,48863 |
-588,80 |
588,80 |
|
6 |
202698,0 |
202830,6 |
202790,85 |
85,55051 |
-132,65 |
132,65 |
|
7 |
201999,0 |
202876,4 |
202613,18 |
6,584286 |
-877,40 |
877,40 |
|
8 |
202856,0 |
202619,8 |
202690,64 |
27,84534 |
236,23 |
236,23 |
|
9 |
201897,0 |
202718,5 |
202472,04 |
-46,088 |
-821,48 |
821,48 |
|
10 |
202655,0 |
202425,9 |
202494,66 |
-25,4734 |
229,05 |
229,05 |
|
11 |
203968,0 |
202469,2 |
202918,83 |
109,4194 |
1498,81 |
1498,81 |
|
12 |
202789,0 |
203028,3 |
202956,48 |
87,88662 |
-239,25 |
239,25 |
|
13 |
202899,0 |
203044,4 |
203000,75 |
74,80388 |
-145,36 |
145,36 |
|
14 |
203122,0 |
203075,6 |
203089,49 |
78,98361 |
46,44 |
46,44 |
|
15 |
203320,0 |
203168,5 |
203213,93 |
92,6209 |
151,53 |
151,53 |
|
16 |
205166,0 |
203306,6 |
203864,39 |
259,9711 |
1859,45 |
1859,45 |
|
17 |
203100,0 |
204124,4 |
203817,05 |
167,7789 |
-1024,36 |
1024,36 |
|
18 |
202963,0 |
203984,8 |
203678,28 |
75,8142 |
-1021,83 |
1021,83 |
|
19 |
203689,0 |
203754,1 |
203734,57 |
69,95566 |
-65,09 |
65,09 |
|
20 |
203954,0 |
203804,5 |
203849,37 |
83,40866 |
149,48 |
149,48 |
|
21 |
206211,0 |
203932,8 |
204616,24 |
288,449 |
2278,23 |
2278,23 |
|
22 |
204569,0 |
204904,7 |
204803,98 |
258,2368 |
-335,69 |
335,69 |
|
23 |
204998,0 |
205062,2 |
205042,95 |
252,457 |
-64,22 |
64,22 |
|
24 |
204568,0 |
205295,4 |
205077,19 |
186,99 |
-727,41 |
727,41 |
|
25 |
207123,0 |
205264,2 |
205821,82 |
354,2839 |
1858,82 |
1858,82 |
|
26 |
205456,0 |
206176,1 |
205960,08 |
289,4742 |
-720,11 |
720,11 |
|
27 |
207897,0 |
206249,6 |
206743,79 |
437,7447 |
1647,45 |
1647,45 |
|
|
прогноз28 |
207181,5 |
|
|
сраб ош |
932,77 |
|
сигма |
1292,037 |
Лучшей оказалась модель с параметрами 0,3 и 0,7.
Выбор лучшей модели
Сведем все интересующие нас результаты в единую таблицу (Таблица 10).
Таблица 10
Y=201507+153,94*t |
Y=10,954x2+152,76x+203070 |
Экспон сглаж-е Альфа= 0,7 |
Модель Хольта шаг=1 |
|||
132761736 |
28719656 |
975792,006 |
203541 |
932,77 |
||
1152,2 |
5359,07 |
987,8 |
2003545 |
1292,03 |
Глядя на таблицу, можно сделать вывод, что лучшей является модель полинома второго порядка, полученная методом наименьших квадратов. Она обладает самыми меньшими значениями абсолютных ошибок, высоким значением коэффициента детерминации (0.64).
Проверка на адекватность выбранной модели
Воспользуемся модулем Множественная регрессия в пакете STATISTICA.
Statistics=> Multiple Regression.
Исходные данные в системе STATISTICA организованы в виде таблицы.
Рис. 5
После нажатия кнопку ОК система произведет вычисления.
Рис. 6
В информационной части мы прежде всего смотрим на значение коэффициента множественной корреляции: R = 0,721, что говорит о тесной связи переменных. После этого нужно обратить внимание на скорректированный коэффициент детерминации: в нашем примере R2 = 0,519, это означает, что доля влияния независимой переменной на зависимую значительна (51%). Гипотезу о том, что коэффициенты при независимых переменных равны нулю, мы отвергаем, т.к. р = 0,000022 < = 0,05. Т.е. множественная регрессия высоко значима. Здесь же оценивается значимость свободного члена: р = 0,000022 < = 0,05, это означает, что нулевая гипотеза о незначимости свободного члена отвергается.
При нажатии на кнопку Краткие результаты регрессии вы увидите следующую электронную таблицу с результатами анализа:
Рис. 7
Составим уравнение множественной регрессии в стандартизованной и естественной форме.
Бета - стандартизованные коэффициенты регрессии:
X' =0,721042*t,
где X' и t' - стандартизованные значения,
В - нестандартизованные коэффициенты регрессии.
X =201587,1+153,9*t.
P - level позволяет оценить значимость каждого коэффициента. Т.к. значения P для VAR1 меньше 0,05 - нулевую гипотезу о незначимости коэффициента a2 отвергаем.
Остатки - это разность между исходными (наблюдаемыми) значениями зависимой переменной и предсказанными значениями. Исследуя остатки, можно оценить степень адекватности модели.
В модуле Множественная регрессия в STATISTICA остатки можно исследовать в специальном окне Анализ остатков:
Рис. 8
С помощью функциональных кнопок в данном окне можно всесторонне просмотреть остатки модели, как в графическом виде, так и в электронных таблицах.
Рис. 9
В первом столбце этой таблице отображаются наблюдаемые значения переменной X, во втором - рассчитанные с помощью составленного уравнения множественной регрессии, а в третьем столбце - вычисленные остатки (Residual).
Для оценки адекватности нашей модели рассмотрим значение d=1.965644 (относительно близко к 2), что говорит об адекватности нашей модели.
Рис. 10
Сделаем прогноз объема кредитов на момент времени t=28, получим x=207998.
Заключение
В данной курсовой работе рассматривались данные с января 2005 года по май 2007 года и осуществлялся прогноз на июнь 2007 года. Были построены четыре модели прогнозирования объема кредитов:
- с использованием Метода наименьших квадратов (расчеты производились в таких программных продуктах, как Statistica и Excel),
- линейная модель (Excel)
- полином 2-го порядка (Excel)
- экспонециальное сглаживание (Excel)
- модель Хольта (Excel)
Выбранные модели дают довольно различные результаты, и лучшие результаты были получены при использовании Метода наименьших квадратов. Результаты вычислений представлены в таблицах. Рассчитана абсолютная ошибка прогноза и средняя относительная ошибка прогноза, статистика Дарбина-Уотсона. Именно эти показатели рассматривались в качестве критерия для выбора модели, дающей наилучшее прогнозное значение интересующей нас переменной, т.е. объема кредита. Итак, прогнозное значение объема кредитов на июнь 2007 года составляет 207998 млн. рублей.
Список литературы
1. Бабкова Е.В. Статистическое моделирование и прогнозирование показателей развития социально-экономических систем. Учеб. пособие / Уфимск. гос. авиац. техн. ун-т. Уфа, 2005.- 128 с.
2. Боровиков В. 8ТАТ18Т1СА: искусство анализа данных на компьютере: для профессионалов.- СПб.: Питер, 2001.- 656 с.
3. Бююль А., Цёфель П. ЗР55: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей.- СПб.: ООО "ДиаСофтЮП", 2001.- 608 с.
4. Пвахненко А.Г. Непрерывность и дискретность. Переборные методы прогнозирования и кластеризации.- Киев: Наук.Думка, 1990.-123 с.
5. Конюховский П.В. Математические методы исследования операций в экономике. - СПб.: Питер, 2000.- 208 с.
6. Лукашин Ю.П. Адаптивные методы краткосрочного прогнозирования. - М.: Статистика, 1975.-254 с.
7. Мухачева А.С. Развитие генетических алгоритмов для решения задач прямоугольной упаковки // Принятие решений в условиях неопределенности: Межвуз. науч. сб.-Уфа: УГАТУ, 2001.- С.87-94.
8. Народное хозяйство Российской Федерации. Статистический сборник. - М.: Финансы и статистика, 2000.- 500 с.
9. Нейлор Т. Машинные имитационные эксперименты с моделями экономических систем,- М.: Мир, 1975.- 496 с.
10. Николаева М.А., Муфтахова Е.Е., Биглова А.Ф. Принятие решений в сигнальной системе стоимостных и объемных индикаторов // Принятие решений в условиях неопределенности: Межвуз. науч. сб.-Уфа: УГАТУ, 2001,-С. 149-157.
Размещено на Allbest.ru
Подобные документы
Применение моделей кривых роста в бизнес-прогнозировании. Методы выбора кривых роста. Доверительные интервалы прогноза для линейного тренда, и полученные с использованием уравнения экспоненты. Дисперсия отклонений фактических наблюдений от расчетных.
курсовая работа [958,1 K], добавлен 13.09.2015Синтез интуитивных и формализованных методов при прогнозировании внутренних экономических связей. Экспертные оценки в основе методов неформализованного анализа и прогноза. Методы экспертных оценок: аналитический, "Комиссий", "Дельфи", "Конференций".
статья [258,7 K], добавлен 07.08.2017Сущность социально-экономического прогнозирования. Роль сахара в жизни человека. Математический аппарат, используемый при прогнозировании потребления. Регрессионный анализ. Методы наименьших квадратов и моментов. Оценка качества моделей прогнозирования.
курсовая работа [1,5 M], добавлен 26.11.2012Эффективность линейной несмещенной оценки вектора для обобщенной регрессионной модели, теорема Айткена. Обобщенный метод наименьших квадратов. Преобразования Фурье, их применение; разложение временного ряда. Ряды Фурье, многомерные преобразования.
реферат [345,4 K], добавлен 09.05.2012Сущность метода наименьших квадратов. Экономический смысл параметров кривой роста (линейная модель). Оценка погрешности и проверка адекватности модели. Построение точечного и интервального прогноза. Суть графического построения области допустимых решений.
контрольная работа [32,3 K], добавлен 23.04.2013Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.
контрольная работа [37,6 K], добавлен 03.06.2009Метод наименьших квадратов; регрессионный анализ для оценки неизвестных величин по результатам измерений. Приближённое представление заданной функции другими; обработка количественных результатов естественнонаучных опытов, технических данных, наблюдений.
контрольная работа [382,4 K], добавлен 16.03.2011Эконометрика как наука, позволяющая анализировать связи между различными экономическими показателями на основании реальных статистических данных. Структурная форма эконометрической модели. Метод наименьших квадратов: общее понятие, главные функции.
курсовая работа [135,1 K], добавлен 05.12.2014Сущность просроченной задолженности. Задачи, принятие необходимых мер работы с проблемной задолженностью. Аналитическое выравнивание по модулям кривых роста. Проверка адекватности и точности моделей. Прогнозирование объема просроченной задолженности.
курсовая работа [412,0 K], добавлен 05.05.2016Применение линейного программирования для решения транспортной задачи. Свойство системы ограничений, опорное решение задачи. Методы построения начального опорного решения. Распределительный метод, алгоритм решения транспортной задачи методом потенциалов.
реферат [4,1 M], добавлен 09.03.2011