Сезонные временные ряды
Количество туристов, которые посещают Италию ежемесячно: предварительные прогнозы на 3-6 месяцев. Создание модели для будущих прогнозов. Доверительные интервалы для среднего, медианы, стандартного отклонения с заданным уровнем доверия (формулы, значения).
Рубрика | Экономико-математическое моделирование |
Вид | практическая работа |
Язык | русский |
Дата добавления | 23.02.2012 |
Размер файла | 683,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
- Постановка задачи. Данные. Цель задачи
- Описательные статистики. (Определения, формулы, значения)
- Доверительные интервалы для среднего, медианы, стандартного отклонения с заданным уровнем доверия (формулы, значения). Выводы (в терминах задачи)
- Вывод по модели
Постановка задачи. Данные. Цель задачи
В таблице представлены ежемесячные данные по количеству туристов, приехавшие в Италию. Данные представлены ежемесячно за период с 1 января 2003 года по 1 января 2007 года.
Месяцы |
Туристы |
Месяцы |
Туристы |
Месяцы |
Туристы |
|
31.01.2003 |
90,4 |
30.09.2004 |
80,9 |
31.05.2006 |
92,2 |
|
28.02.2003 |
95,5 |
31.10.2004 |
83,8 |
30.06.2006 |
78,9 |
|
31.03.2003 |
87,3 |
30.11.2004 |
94,2 |
31.07.2006 |
93,6 |
|
30.04.2003 |
80,3 |
31.12.2004 |
97,5 |
31.08.2006 |
107,6 |
|
31.05.2003 |
55,8 |
31.01.2005 |
110,6 |
30.09.2006 |
98,5 |
|
30.06.2003 |
46,6 |
28.02.2005 |
106,1 |
31.10.2006 |
98,8 |
|
31.07.2003 |
63,4 |
31.03.2005 |
108,5 |
30.11.2006 |
108,1 |
|
31.08.2003 |
84,6 |
30.04.2005 |
102,8 |
31.12.2006 |
118,5 |
|
30.09.2003 |
72,1 |
31.05.2005 |
80,1 |
31.01.2007 |
128,2 |
|
31.10.2003 |
76,4 |
30.06.2005 |
68,2 |
28.02.2007 |
118,9 |
|
30.11.2003 |
87,3 |
31.07.2005 |
83,6 |
31.03.2007 |
126,5 |
|
31.12.2003 |
87 |
31.08.2005 |
99,9 |
30.04.2007 |
121,6 |
|
31.01.2004 |
100,5 |
30.09.2005 |
89,7 |
31.05.2007 |
99,7 |
|
29.02.2004 |
100,8 |
31.10.2005 |
91,3 |
30.06.2007 |
86,4 |
|
31.03.2004 |
97,9 |
30.11.2005 |
101,2 |
31.07.2007 |
101,1 |
|
30.04.2004 |
91,5 |
31.12.2005 |
108 |
31.08.2007 |
115,1 |
|
31.05.2004 |
68 |
31.01.2006 |
120,7 |
30.09.2007 |
106 |
|
30.06.2004 |
57,4 |
28.02.2006 |
111,4 |
31.10.2007 |
106,2 |
|
31.07.2004 |
73,5 |
31.03.2006 |
119,1 |
30.11.2007 |
115,6 |
|
31.08.2004 |
92,3 |
30.04.2006 |
114,1 |
31.12.2007 |
125,9 |
Цель задачи.
Проанализировать количество туристов, которые посещают Италию ежемесячно. Также, сделать предварительные прогнозы на 3-6 месяцев и создать модель для будущих прогнозов.
Описательные статистики. (Определения, формулы, значения)
Среднее арифметическое выборки (mean) - это сумма всех данных, деленная на количество данных.
Стандартная ошибка среднего (SE mean) характеризует колебания среднего значения. Величина - оценка теоретической дисперсии х:
Для выборки из n наблюдений выборочная дисперсия определяется как среднеквадратичное отклонение в выборке:
Среднее квадратичное отклонение (StDev) характеризует степень разброса данных вокруг центра.
Медиана - это точка, вокруг которой располагается одинаковое количество элементов выборки.
За указанный период среднее значение туристов было равно 95,46 тысяч человек в месяц; стандартная ошибка среднего равна 2,37; среднее квадратичное отклонение равно 18,34; дисперсия равна 336,17; медиана равна 97,70; разница между минимальным и максимальным значением равна 81,60.
Доверительные интервалы для среднего, медианы, стандартного отклонения с заданным уровнем доверия (формулы, значения). Выводы (в терминах задачи)
Доверительным интервалом называют интервал который показывает неизвестный параметр с заданной надежностью г.
Доверительный интервал медианы, среднего, стандартного отклонения с 95% уровнем доверия приводится для количества туристов, и, опираясь на график, мы можем сделать следующие выводы: среднее число посещающих страну с 95% уверенностью колеблется в пределах от 90,725 до 100, 198; медиана с 95% уверенностью будет находиться в пределах от 91,238 до 101,107; стандартное отклонение с 95% гарантией будет лежать в пределах от 15,541 до 22,363.
1. График. Предварительные выводы по ОС и графику.
По данному графику видно, что для количества туристов в Италии имеется тренд, наблюдается общая тенденция к возрастанию посещающих достопримечательности, находящиеся в стране. Также по данному графику можно говорить о сезонности с периодом в 1 год: максимум достигается в феврале месяце, а минимум в июле месяце каждого года, что конечно странно для туризма. Но по собранным данным, понятно, что в феврале в Италии проходит более 5 карнавалов ежегодно. Возможно, этим и объясняется рост туристов на данный период.
2. Автокорреляционная функция. (Определение, формула, график, заключение).
Автокорреляция - корреляционная связь между значениями одного и того же случайного процесса X (t) в моменты времени t1 и t2. Функция, характеризующая эту связь, называется автокорреляционной функцией.
По анализу автокорреляционной функции можно сказать, что есть сезонность. Временной ряд не стационарен.
После анализа данной автокорреляционной функции, заметно, что значения автокорреляции в начале значительно отличны от нуля, а потом постепенно приближаются к нулю. Каждые 12 лагов достигается максимальные показатели корреляции, что доказывает наличие сезонности, так как начиная сначала АКФ, заметно падение и рост. Так как первый и второй, а также двенадцатые лаги выходят из доверительного интервала, и значительно отличны от нуля, значит для этой модели необходимо построить модель авторегрессии и модель ARIMA.
3. Анализ линейной модели:
· Название модели. Уравнение тренда. Значение R2.
· Сезонная компонента (значение и график). (Если есть сезонность во ВР)
· Значение MAD,MSE, MAPE, MPE
· График тренда
· Выбор типа тренда по R2 после работы с параболической моделью.
Additive Model
Уравнение тренда: Yt = 72,7958 + 0,743143*t
R^2= 0,979136
сезонный временной ряд
Decomposition - Component Analysis for Туриcты
Линейно мультипликативная модель
Multiplicative Model
Data Туриcты
Уравнение тренда: Yt = 72,2651 + 0,760331*t
R^2= 0,961811
Time Series Decomposition Plot for Туриcты
4. Анализ параболической модели:
· Название модели. Значение R2.
· Сезонная компонента (значение и график). (Если есть сезонность во ВР)
· Значение MAD,MSE, MAPE, MPE
· График тренда
· Выбор типа тренда по R2
Аддитивная параболическая модель.
Trend Analysis for Туриcты
Уравнение тренда:
Yt = 73,9564 + 0,734098*t - 0,000719185*t**2
Time Series Decomposition for RESI2
R^2=0,977121
Time Series Decomposition Plot for RESI2
Decomposition - Component Analysis for RESI2
Мультипликативная параболическая модель
Data Туриcты. Уравнение тренда:
Yt = 73,9564 + 0,734098*t - 0,000719185*t**2
От полученных FITS5, рассчитываем S*E используя наши FITS5 и показатели Туристы.
X (t) =T (t) *S (t) *E (t) => X (t) /T (t) =S (t) *E (t)
Time Series Decomposition for S*E
Multiplicative Model
Использую полученные FITS6 (S*E) и само S*E, подсчитаем конечные остатки-E (r).
По этим остаткам находим коэффициент детерминации.
S*E |
FITS6_se |
RESI6_se |
E (r) |
|
1,21034 |
1, 19186 |
0,018476 |
1,0155 |
|
1,26621 |
1,11283 |
0,153388 |
1,13784 |
|
1,14639 |
1,15489 |
-0,0085 |
0,99264 |
|
1,04447 |
1,0878 |
-0,04333 |
0,96016 |
|
. |
… |
… |
… |
R^2= 0,996968
Вывод. После построения нескольких моделей, выявлено то, что модель ПМ является наиболее лучшей с коэффициентом детерминации - 0,996968.
Модель:
Yt = (73,9564 + 0,734098*t - 0,000719185*t^2) *S*E (r)
где Сезонность:
………
5. Анализ остатков. АКФ остатков.
У нас в Автокорреляционной функции столбцы выходит за пределы красной линии, что означает остатки не являются Белым Шумом. Поэтому проводим Авторег. остатков через ARIMA.
Autocorrelation Function: E (r)
Авторегрессия для E (r)
Первого порядка.
ARIMA Model: E (r)
Относительное изменение в каждой из лагов не превышает 0,0010.
В графике видно, в 12 лаге есть некое отклонение и возможно существуют факторы, которые повлияли на исходные изменения.
E (t) =0,489377+0,5109*E (t-1) +W (t)
6. Общее уравнение модели тренда. Прогноз на 3 шага вперед.
Финальная модель:
X (t) = (73,9564 + 0,734098*t - 0,000719185*t^2) *S (t) * (0,489377+0,5109*E (t-1) +W (t))
Прогноз на 3 месяца:
По модели
Вывод по модели
Как уже говорилось, модель имеет тенденцию к снижению и сезонность, которая характеризуется перепадами и прыжками, каждые полгода. После анализа графика также стало ясно о наличии цикличности в рассматриваемый период. AKФ показала, что зависимость следующих показателей сильно зависит от предыдущих.
При проведенных анализах в 6 и 7 пунктах, выявлена наилучшая модель в виде ПМ. При выборе учитывался Коэффициент детерминации ПМ с 0,9969 в отличии от других. В дальнейшем мы выбрали ПМ в качестве основы финальной модели.
После проведения авторегрессии 1 порядка достигнут результат с наилучшим прогнозом. Составлена финальная модель.
Размещено на Allbest.ru
Подобные документы
Доверительные интервалы для среднего значения цены автомобиля в зависимости от его возраста для уравнения регрессии в расчетах парной и множественной зависимостей. График ежемесячных объемов продаж магазина. Коэффициенты регрессионного уравнения тренда.
контрольная работа [499,1 K], добавлен 16.09.2011Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.
контрольная работа [1,6 M], добавлен 18.06.2012Структурная, аналитическая и комбинационная группировка по признаку-фактору. Расчет среднего количества балансовой прибыли, среднего арифметического значения признака, медианы, моды, дисперсии, среднего квадратического отклонения и коэффициента вариаций.
контрольная работа [194,5 K], добавлен 06.04.2014Выборка и генеральная совокупность. Модель множественной регрессии. Нестационарные временные ряды. Параметры линейного уравнения парной регрессии. Нахождение медианы, ранжирование временного ряда. Гипотеза о неизменности среднего значения временного ряда.
задача [62,0 K], добавлен 08.08.2010Обзор корреляционного поля. Доверительные интервалы регрессии. Оценка качества линейной модели прогнозирования. Проверка ее на соответствие условиям теоремы Гаусса-Маркова. Точечный и интервальный прогнозы. Нахождение средней ошибки аппроксимации.
контрольная работа [47,9 K], добавлен 09.08.2009Методы и модели анализа динамики экономических процессов. Эластичность в экономическом анализе. Коэффициент корреляции, его свойства. Динамические ряды и временные ряды, тренд, их компоненты. Решение задачи потребительского выбора и его свойства.
курс лекций [399,8 K], добавлен 15.06.2015Значения показателей и коэффициент вариации. Пределы возможных ошибок, исключение ошибочных результатов. Величина доверительных интервалов для заданных значений доверительных вероятностей. Средние квадратичные отклонения. Значения коэффициента доверия.
лабораторная работа [38,4 K], добавлен 01.03.2011Проверка графика на анормальности и наличие тренда. Определение параметров линейной регрессии. Сглаживание уровней ряда методом простой скользящей средней. Расчет среднеквадратического отклонения. Адекватность и точность параметров нелинейных регрессий.
контрольная работа [912,4 K], добавлен 26.05.2016Определение временных и пространственных данных в эконометрике. Коэффициент детерминации и средняя ошибка аппроксимации как показатели качества однофакторной модели в эконометрике. Особенности построения множественной регрессивной модели. Временные ряды.
контрольная работа [804,3 K], добавлен 15.11.2012Построение временной ряда величины по данным об уровне безработицы в России за 10 месяцев 2010 г., вычисление ее числовых характеристик. Регрессионная модель временного тренда. Краткосрочный и долгосрочный прогнозы изменения рассматриваемой величины.
контрольная работа [118,1 K], добавлен 26.02.2012