Прогнозирование цен акций компаний нефтегазового сектора

Цена на нефть как основной фактор изменения цен акций компании. Влияние новостного фона о компании на цену акций. Механизм работы фондового рынка. Рекуррентная нейронная сеть с долгой краткосрочной памятью. Выбор временного интервала для прогнозирования.

Рубрика Экономика и экономическая теория
Вид дипломная работа
Язык русский
Дата добавления 04.09.2016
Размер файла 3,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

2.4 Рекуррентная нейронная сеть с долгой краткосрочной памятью

Long Short-Term Memory Recurrent Neural Network (далее LSTM RNN) - рекурентная нейронная сеть с долгой краткосрочной памятью была изобретена в 1977 году Зеппом Хохрайтером и Юргеном Шмидхубером. Как и все другие модификации нейронных сетей, LSTM является универсальной моделью, которая способна решать большой круг различных проблем. В отличие от традиционных рекурентных нейронных сетей, LSTM отлично походит для задач, когда необходимо с течением времени накапливать знания об успешности прошлых предсказаний, а также, когда исследователь понимает, что существует сильная зависимость текущих значений временного ряда от предыдущих, но величина лага, который имеет наибольшее влияние на показатель, динамична, то есть коэффициенты, стоящие перед лаговыми переменными постоянного изменяются.

LSTM сеть представляет собой искусственную нейронную сеть, которая содержит вместо обычных нейронов на скрытых слоях целые вычислительные блоки. Блок сети может быть описан как «принимающий решение» узел сети, которые может запоминать свои значения за произвольный период времени в прошлом. Блок содержит критические значения границ (далее ворота), которые определяют:

· Когда входные данные являются необходимыми для запоминания

· В какой момент времени алгоритм должен «вспомнить» о прошлых наблюдениях

· Какие значения следует забыть, как неудачно предсказанные

Для минимизации ошибки прогноза сеть итерационно обучается, как и ANN, на множестве последовательностей. В качестве алгоритма для минимизации ошибки используется наиболее известный алгоритм обратного распространения ошибки.

LSTM RNN содержит так называемые блоки памяти в рекуррентном скрытом слое. Блоки содержат в себе информацию о временном хранении состоянии сети вместе с воротами, которые контролируют поток хранимой информации. Каждый блок LSTM сети содержит входные ворота и ворота исходящей информации. Входные ворота контролируют какая часть информации будет взята из объясняющей переменной, в то время как выходные ворота контролируют насколько сильно полученная информация будет влиять на прогнозирование ряда.

Архитектура LSTM рекуррентной сети выглядит следующим образом (на рисунке 5 пунктирной линией обведен только единичный блок сети, все остальные блоки архитектуры выглядят аналогично и рассчитываются по точно аналогичным формулам):

Рисунок 5, модель рекуррентной нейронной сети с долгой краткосрочной памятью

где input - входной слой, на который поступают значения ,

recurrent - значение после первичной блоковой обработки входных данных, принимает значения

output - исходящее значение после рекуррентной обработки, принимает значения используя следующие равенства:

(24)

(25)

(26)

(27)

(28)

(29)

где:

,

,

(Весовая матрица коэффициентов для значений, которые сеть должна забыть из-за неудачного прогноза),

(Выходные ворота),

,

,

(30)

- логистическая функция активации входных на уровне сети данных (используется также при расчете значений, о которых сеть должна забыть).

Стандартная архитектура рекуррентной нейронной сети с долгой краткосрочной памятью имеет входной слой, рекуррентный слой и выходной слой. Рекуррентный слой замкнут в цикл таким образом, что выход из рекуррентного слоя соединен со входом в этот же слой, а также с ячейкой памяти, ответственной за «забывание» части информации.

Дополнительные вычисления внутри каждого блока позволяют решить проблему памяти, свойственной для обычной рекуррентной нейронной сети. В обычной конфигурации информация в памяти смешивается с информацией в новом сигнале и спустя 5-10 итераций уже полностью перезаписывается. Таким образом, в LSTM RNN дополнительные вычисления вектора позволяют сети учитывать как текущие значений входного временного ряда, так и выделять полезную информацию из прошлых предсказаний.

2.5 Критерии сравнения моделей

Помимо построения самих моделей, одной из задач данной работы является выявление лучшей модели, которая способна показать меньшую ошибку на ретроспективном прогнозе. Одними из наиболее частых показателей, которые используются для сравнения моделей различных типов - средняя процентная ошибка модели (MAPE) и средняя квадратичная ошибка модели (RMSE).

MAPE (Mean Absolute Percentage Error) - средняя ошибка, выраженная в процентах, является наиболее часто используемым показателем ошибки при прогнозировании временного ряда.

Пусть:

- фактическое значение временного ряда,

- прогнозное значение временного ряда,

N - количество элементов временного ряда.

Тогда

(31)

Данная величина применяется когда фактическое значение временного ряда всегда больше 1. В противном случае в знаменателе функции окажется число близкое к 0, что может привести к некорректной интерпретации результатов.

Другой, не менее популярной характеристикой для сравнения качества модели является RMSE (Root Mean Square Error) - среднеквадратическая ошибка, мера, которая используется, чтобы оценить величину стандартного отклонения предсказанных значений временного ряда от фактических значений.

Пусть:

- фактическое значение временного ряда,

- прогнозное значение временного ряда,

- количество элементов временного ряда.

Тогда

(32)

Иногда, для сравнения моделей используется нормализованная величина RMSE:

(33)

где: - среднеквадратическая ошибка,

- среднее значение переменной y

Однако, в данной работе использование нормализованного RMSE не требуется, так как сравниваться будут модели с одинаковыми временными рядами соответственно, а значит для них будет одинаковым.

Для сравнения эконометрических моделей зачастую также используется критерий Акаике (AIC) - критерий для выбора из класса параметризованных регрессионных моделей с разным числом параметров.

Данный критерий рассчитывается по формуле

, (34)

где: - дисперсия остатков;

- число параметров в модели;

- число наблюдений.

Лучшая модель соответствует минимальному значению AIC. Абсолютное значение критерия не несет в себе полезной информации.

Данный критерий имеет следующие особенности:

· Штрафование числа параметров ограничивает значительный рост сложности модели;

· Проверка критерия является трудоемкой операцией;

· Может сравнивать модели только с выборками равного размера;

· Порядок выбора моделей неважен.

2.6 ExxonMobil и Роснефть. Выбор временного интервала для прогнозирования

Несмотря на то, что механизм формирования цены акции компании на фондовом рынке для всех компаний одинаков, в данной работе предполагается, что существует разница между факторами, которые влияют на изменение акции той или иной компании в зависимости от её регионального положения и состава главных акционеров. С точки зрения исследования было бы не интересно построить лучшую модель для одной случайно выбранной из тысячи компании. Для получения наиболее интересных и значимых результатов, были выбраны две диаметрально противоположных с точки зрения географического положения и типа владения компании - ExxonMobil и Роснефть.

Корпорация ExxonMobil - американская крупнейшая частная нефтяная компания в мире и одна из крупнейших корпораций в мире по размеру рыночной капитализации. Основные владельцы компании - инвестиционные фонды, институциональные и частные инвесторы. При этом, в свободном обращении находятся 99,85% акций.

Финансовые показатели Отчетность компании ExxonMobil. Источник - сайт компании http://ir.exxonmobil.com/phoenix.zhtml?c=115024&p=irol-reportsAnnual :

· Капитализация компании составляет 369 миллиардов долларов

· В обращении находятся около 10 миллионов акций различных видов

· Валовая прибыль 93 миллиарда долларов США (далее - долларов)

· Годовой доход 236 миллиарда долларов

Несмотря на резкое падение цен на нефть, от которых, казалось бы, должна зависеть капитализация компании, за последний год акции ExxonMobil за 2016 год показали довольно устойчивый рост.

В свою очередь, Роснефть - российская нефтегазовая компания, 69,5% акций которой принадлежат государству. Компания является крупнейшей в мире публичной компанией по объему добычи нефти «Нефтегазовая отрасль России в цифрах и фактах» Информационное агенство России ТАСС, 18.05.2016 Источник: http://tass.ru/ekonomika/3215065. В 2014 году компания заняла 46 место в списке Fortune Global 500 списке самых дорогих компаний мира. На январь 2013 года капитализация Роснефти составляла 96 миллиарда долларов, однако, к концу 2014 капитализация снизилась до 50 миллиардов.

Основные финансовые показатели Отчетность компании Роснефть. Источник - сайт компании http://www.rosneft.ru/Investors/:

· Капитализация - 50 миллиардов долларов

· В обращении находятся около 9 миллионов акций различных видов

· Валовая прибыль - 1,8 триллиона рублей

· Чистая прибыль 500 миллиард рублей

Несмотря на большую масштабность ExxonMobil по сравнению с компанией Роснефть, все показатели компании соизмеримы, а значит, можно предполагать, что цена их акций складывается из одних и тех же факторов. В данной работе все модели строились для обеих компаний, в конце работы рассмотрено фундаментальное различие в формировании фондовой цены акции.

Для исследования был использован период с 2 июня 2010 года по 30 марта 2016 года. Необходимо было выбрать такой промежуток времени, чтобы ARIMA и ADL модели были способны определить коэффициенты значимых переменных, а с другой стороны, чтобы модели машинного обучения успели обучиться по предоставленным данным, ведь предметная область машинного обучения относится к парадигме Больших данных, а значит алгоритмы работают тем лучше, чем больше данных уйдет на обучение. Исходя из вышеизложенных предпосылок был выбран 6-летний интервал для анализа, который является не слишком широким для ADL и ARIMA моделей, и в то же самое время достаточным для применения алгоритмов машинного обучения, созданных для анализа больших данных.

В следующем главе описывается практическое применение моделей для прогноизрования цен акций выбранных компаний, выбирается лучший класс моделей для каждой компании и анализируется почему та или иная модель наиболее подходит для решения задачи прогнозирования для конкретной компании.

Глава 3. Практическая часть. Построение прогнозных моделей

В первой половине практической части строятся модели, использующие в качестве предиктора лишь значения самого временного ряда, в данном случае цены акции компании, за прошлые периоды времени. В работе используются следующие обозначения:

· XOM_Close - цена акции компании ExxonMobil

· ROSN_Close - цена акции компании Роснефть

Таким образом: переменные XOM_Close и ROSN_Close - зависимые переменные, значения которых необходимо предсказывать с помощью модели.

Данные о цене акции компании на фондовом рынке за определенный период времени относятся к классу временных рядов. Для данного класса определены специальные методы исследования и прогнозирования, которые и применяются в данной работе, например, например анализ стационарности ряда.

3.1 Исследование стационарности рядов

Для анализа стационарности следует построен график цен акций рассматриваемых компаний ExxonMobil и Роснефть (Рисунок 6, Рисунок 7 соответственно).

Рисунок 6, цена акции компании ExxonMobil с течением времени

Рисунок 7, цена акции компании Роснефть с течением времени

По графику компании ExxonMobil (Рисунок 6) явно виден возрастающий тренд до середины 2014 года, далее начинается снижающийся тренд, который длится до конца рассматриваемого периода.

Временной ряд цены акции компании Роснефть на первый взгляд кажется стационарным, так как нет явно выделяющегося тренда и иных зависимостей, которые сразу видны по графику (Рисунок 7), однако, данный временной ряд тоже необходимо проверить на стационарность.

Для проверки временных рядов на стационарность проведен тест Дики-Фуллера (Рисунок 8):

Рисунок 8, тест Дики-Фуллера для проверки стационарности ряда цены акции ExxonMobil

Временной ряд цены акций компарии ExxonMobil не стационарен, следовательно необходимо проверить стационарность первых разностей. В случае стационарности дифференцированного ряда, дальнейший анализ необходимо будет проводить для первых разностей.

Рисунок 9, тест Дики-Фуллера для проверки стационарности ряда первых разностей цены акции ExxonMobil

Как и предполагалось, дифференцированный ряд первого порядка цены акции компании ExxonMobil является стационарным (Рисунок 9). Следовательно, дальнейшее исследование данного временного ряда будет проводиться с использованием первых разностей временного ряда.

Временной ряд стоимости акции компании «Роснефть» также был проверен на стационарность (Рисунок 10).

Рисунок 10, тест Дики-Фуллера для проверки стационарности ряда цены акции Роснефть

Временной ряд стоимости акции компании «Роснефть» является стационарным в случае теста с константой и трендом, следовательно далее будут использоваться сами значения временного ряда.

3.2 Построение ARIMA моделей

Для построения ARIMA (p,d,q) моделей необходимо определить подкласс, к которому будет относиться модель. В данном случае выбор подкасса значит выбор параметров p, d, q модели. Выбор подкласса осуществляется с помощью автокорреляционной функции наблюдаемого ряда. На практике редко исплользуются модели, для которых хотя бы один из параметров p,d,q был больше 2 так как это приводит к усложнению интерпретации модели, однако, в данной работе рассматривались модели с порядками p и q до 4.

Раннее сделанное исследование стационарность временных рядов позволяет сразу определить, что для ARIMA(p,d,q) акции ExxonMobil порядок d=1. Коэффициенты p и q подбирались так, чтобы MAPE и RMSE были минимальны. В таблице 1 перечислены все построенные модели:

Таблица 1, сравнительные характеристики ARIMA моделей для прогнозирования цены акции компании ExxonMobil

Тип модели

RMSE

MAPE

AIC

(0;1;1)

0,03

3,01

4105,8

(1;1;1)

0,03

3,03

4102,7

(1;1;2)

0,03

3,05

4104,3

(2;1;2)

0,03

3,02

4103,3

(0;1;2)

0,03

3,06

4107,3

(2;1;0)

0,03

3,05

4107,2

(2;1;3)

0,03

2,85

4102,2

(3;1;2)

0,03

2,84

4101,9

(3;1;3)

0,03

2,86

4102,5

(3;1;1)

0,03

2,85

4102,1

(1;1;3)

0,03

2,85

4102,4

(4;1;4)

0,04

3,11

4109,7

(4;1;2)

0,03

2,84

4102,1

В итоге, наилучшей моделью для прогнозирования цены акции ExxonMobil стала ARIMA(3;1;2) с MAPE = 0,03 , RMSE = 2,84 и AIC=4101,9. Ниже представлены характеристики модели (рисунок 11) и прогноз на тестовых данных (рисунок 12).

Рисунок 11, коэффициенты и их значимостm выбранной ARIMA модели (прогнозирование цены акции компании ExxonMobil)

Рисунок 12, прогноз посроенной ARIMA модели на тестовых данных (прогнозирование цены акции компании ExxonMobil)

Итоговое уравнение ARIMA(3;1;2) для компании ExxonMobil имеет вид (учитывались только значимые на уровне 5% переменные):

(35)

Для ARIMA(p,d,q) прогнозирования цены акции Роснефть порядок d=0, т.к ряд ROSN_Close стационарен. Коэффициенты p и q подбирались аналогично: чтобы MAPE и RMSE были минимальны. В таблице 2 перечислены все построенные модели:

Таблица 2, сравнительные характеристики ARIMA моделей для прогнозирования цены акции компании Роснефть

Тип модели

MAPE

RMSE

AIC

(0;0;1)

0,22

69,11

10724,7

(1;0;0)

0,08

26,46

7863,2

(1;0;1)

0,08

26,41

7865,1

(0;0;2)

0,22

68,62

9797,9

(2;0;0)

0,08

26,41

7865,1

(2;0;1)

0,08

26,13

7866,9

(1;0;2)

0,07

22,69

7852,5

(2;0;2)

0,08

26,2

7868,3

(3;0;0)

0,08

26,14

7866,5

(3;0;1)

0,08

26,21

7868,3

(3;0;2)

0,08

26,1

7870,3

(3;0;3)

0,08

26,1

7872,3

(0;0;3)

0,21

67,6

9239,1

(1;0;3)

0,08

26,17

7868,5

(2;0;3)

0,08

26,19

7870,3

В итоге, наилучшей моделью для прогнозирования цены акции Роснефть стала ARIMA(1;0;2) с MAPE = 0,07 , RMSE = 22,69 и AIC=7852,5. На рисунке 13 представлены коэффициенты модели:

Рисунок 13 коэффициенты и их значимостm выбранной ARIMA модели (прогнозирование цены акции компании Роснефть)

Итоговое уравнение ARIMA(1;0;2) для компании Роснефть имеет вид (учитывались только значимые на уровне 5% переменные):

(36)

График прогнозируемых значечний представлен на рисунке 14

Рисунок 14 прогноз посроенной ARIMA модели на тестовых данных (прогнозирование цены акции компании Роснефть)

Описательные характеристики прогнозирования цены акции для компаний ExxonMobil и Роснефть представлены в таблице 3:

Таблица 3, сравнительные характеристики ARIMA моделей для обеих компаний

Показатель

ExxonMobil

Роснефть

MAPE

0,03

0,07

RMSE

2,84

22,69

AIC

4101,9

7852,5

Несмотря на наличие только одной объясняющей переменной ARIMA модель достаточно хорошо прогнозирует цену акции для компании ExxonMobil, MAPE модели равен 3%. Однако, средний процент ошибки модели для компании Роснефть превышает два раза и составляет 7% , что указывает на недостаточную точность построенной модели.

3.3 Построение модели LSTM RNN

В отличие от ARIMA моделей рекурентные нейронные с долгой краткосрочной памятью способны изменять вес лаговых переменных в зависимости от времени, тем самым приспосабливаясь к изменениям весов тех или иных лагов с течением времени. В данной работе проверяется насколько такие модели способны улучшить среднесрочный прогноз на месяц относительно ARIMA моделей.

Для построения данных моделей использовалась библиотека keras, написанная для создания нейронных сетей произвольной структуры на языке программирования Python.

Все модели парадигмы машинного обучения имеют особенность переобучаться на данных. Однако, существует несколько способов борьбы с данной проблемой и один из них - выделять из обучающей выборки набор данных для валидации. Данный метод позволяет оценивать качество модели на данных, которые модель раньше не видела. Таким образом снижается риск построения модели, которая окажется не способна справиться с задачей. Результаты разбивки исследуемого ряда представлены на рисунке 15:

Рисунок 15, разделение выборки на обучающий набор, валидационный набор и данные для прогноза

Аналогичное разделение было сделано и для временного ряда компании Роснефть. Временной интервал для сравнения прогноза был отнесен к тестовым данным. В данной работе прогнозирование цены акции компании с помощью рекуррентной нейронной сети с долгой краткосрочной памятью, в отличие от искусственной нейронной сети, которая будет рассмотрена далее, проводилось с использованием только самого прогнозируемого ряда, то есть никакие иные факторы не были использованы. Данное ограничение было сделано для проверки:

· насколько предсказуема цены акции нефтегазовых компаний сами по себе, без использования иных переменных

· каково качество прогноза LSTM RNN относительно модели ARIMA, где использовался также только один временной ряд для прогнозирования

В процессе моделирования были рассмотрены различные архитектуры сети, в итоге была выбрана следующая:

· 1 скрытый слой;

· 49 нейронов на скрытом слое;

· функция активации - линейная ;

· сеть держит в памяти 25 последних значений;

· для построения модели использовалось 400 эпох;

· минимизировалась средняя квадратичная ошибка модели.

Веса нейронов на скрытом слое постоянно меняются в зависимости от номера наблюдения, поэтому сравнительный анализ весов сделать не представляется возможным, так как не будет иметь практического применения в будущем. Также, учитывая небольшой временной интервал для построения модели, необходимо было использовать большое количество эпох, то есть циклов обучения.

Ниже представлен график итерационного обучения модели. На графике (рисунок 16) видно, что средний процент ошибки на валидационных данных перестает уменьшаться уже после двухсотой эпохи. Соответственно, далее начинается процесс переобучения модели, которого нельзя допустить.

Рисунок 16, сравнение MAPE на валидационном и обучающем наборе

Переобучения модели наиболее часто возникает при недостатке данных. Из-за этого приходится использовать одни и те же данные несколько раз. В итоге, алгоритм «затачивается» на одних и тех же данных, показывая постоянное улучшение качества, однако, при поступлении новых данных вероятность ошибки алгоритма значительно выше, нежели на обучающем наборе данных. На графике переобучение можно заметить, если построить одну из доступных статистик ошибок (в данном случае MAPE) в зависимости от количества циклов обучения (в нейронной сети - эпох). В тот момент, когда MAPE на обучающей выборке продолжает уменьшаться, а MAPE на валидационной выборке остается прежним, то есть когда график MAPE Validation начинает отставать от MAPE Training, начинается переобучение модели.

В данном случае, как для модели прогнозирования цены ExxonMobil, так и для модели прогнозирования цены акций Роснефть, переобучение модели начинается после 200-ой эпохи. Совпадение, что обе модели начинают переобучаться примерно на одном и том же количестве эпох, можно объяснить тем, что используется одна и та же архитектура нейронной сети, описанная ранее. Для проверки моделей был построен прогноз для компаний Роснефть (рисунок 17) и ExxonMobil (рисунок 18) на тестовых данных:

Рисунок 17, график предсказанных и реальных значений цены акции ExxonMobil на тестовой выборке

Рисунок 18, график предсказанных и реальных значений цены акции Роснефть на тестовой выборке

По графикам (рисунок 17, рисунок 18) фактических и предсказанных значений можно заметить, что сеть довольно точно прогнозирует движение цены акции компаний в следующие периоды времени. Однако, необходимо заметить, что линия прогнозных значений практически никогда не пересекает линию фактических значений, при этом линия прогнозных значений выше линии фактических значений для обеих компаний. Данное наблюдение можно объяснить двумя факторами:

· недостаточностью количества информации;

· недооцененностью акций компаний на рынке.

В данном случае логично предположить, что цена акции зависит от экзогенных переменных, влияние которых будет рассмотрено в работе далее. Построенные модели имеют следующие обобщенные результаты (таблица 4):

Таблица 4, сравнительные характеристики LSTM RNN модели для обеих компаний

Показатель

ExxonMobil

Роснефть

MAPE

0,026

0,037

RMSE

2,39

12,9

Модели ARIMA и LSTM RNN в качестве предикторов имели один и тот же единственный временной ряд в качестве предиктора - цену акции компании за прошедший период времени. В обоих случаях рекуррентная нейронная сеть с долгой краткосрочной памятью оказалась лучше конкурента, при этом, если в случае модели для ExxonMobil различие в MAPE около 0,004 , то в случае модели для компании Роснефть различие в MAPE в 2 раза - на 0,033, что является ощутимым улучшением в области прогнозирования. В Приложении 6 представлен код для построения модели рекуррентной нейронной сети.

3.4 Ввод экзогенных переменных

В предыдущих моделях, рассмотренных в данной работе, учитывались только значения временного ряда в прошлом и они же использовались для построения прогнозных значений. В современной мире всё взаимосвязано, а фондовый рынок с его возможностями покупать/продавать акции из любой точки мира тем более является явным примером того, как значения одного показателя могут повлиять на значение фактора. Далее, в данной работе, для улучшения качества модели будут использованы следующие экзогенные факторы:

· группа характеристических переменных торговли акциями данной компании

· группа характеристических переменных индекса фондового рынка;

· группа характеристических переменных цены на нефть марки Brent;

· новостной индекс компании

Подробное описание каждой группы переменных представлено в таблице 5.

Таблица 5, описание переменных, использующихся при построении ADL и ANN моделей

Наименование компании, для которой использовался предиктор

Название предиктора

Описание предиктора

характеристические переменные торговли акциями данной компании

ExxonMobil

XOM_Volume

Объем торговли акциями данной компании (Volume)

Роснефть

ROSN_Volume

ExxonMobil

XOM_diff

В момент закрытия торгов на бирже формируется цена закрытия (Close), однако, после закрытия торгов составом акционеров могут быть приняты различные решения, например:

· выплата дивидендов;

· выпуск новых акций;

· объединение/поглощение

· прочее

Несомненно, такие решения сразу повлияют на рост или падение цены в момент открытия торгов на следующий день. Для минимизации таких резких скачков цену в момент открытия торгов на следующий день перевзвешивают в зависимости от принятого решения (при выгрузке цен название - Adj_Close). Такая политика позволяет минимизировать резкие скачки цены в момент открытия торгов. Данный предиктор отображает разницу между ценой закрытия акций (Close) и скорректированной ценой закрытия акций (Adj_Close).

Роснефть

ROSN_diff

ExxonMobil

XOM_Range

Разница между максимальным значением цены акции (High) и минимальным значением цены акции (Low).

Роснефть

ROSN_Range

группа характеристических переменных индекса фондового рынка

ExxonMobil

SP_Close

Итоговое значение индекса фондового рынка (S&P500 для акций ExxonMobil, РТС для акций Роснефть).

Роснефть

RTSI_Close

ExxonMobil

SP_range

Разница между максимальным значением индекса (High) и минимальным (Low).

Роснефть

RTSI_range

группа характеристических переменных цены на нефть марки Brent

ExxonMobil, Роснефть

Brent_Close

Итоговое значение стоимости 1 барреля нефти марки Brent.

ExxonMobil, Роснефть

Brent_Volume

Объем торговли котировками 1 барреля нефти марки Brent.

ExxonMobil, Роснефть

Brent_range

Разница между максимальным значением цены 1 барреля нефти (High) и минимальным (Low).

новостной индекс компании

ExxonMobil

XOM_news

Новостной рейтинг компании (источник - Google Trends)

Роснефть

ROSN_news

В работе используются не только текущие значения переменных, но и их лаговые производные, которые обозначаются следующим образом - НазваниеПеременной_X, где X - номер лага (например Brent_Close_5 значит, что используется пятый лаг переменной Brent_Close).

Все экзогенные переменные были проверены на стационарность. Для прогнозирования цены акции компании ExxonMobil:

o Временные ряды XOM_Volume, XOM_range, XOM_news, SP_range, Brent_Volume являются стационарными

o Времененые ряды XOM_diff, SP_Close, Brent_Close, Brent_range являются не стационарными.

В случае прогнозирования цены акции компании Роснефть:

o Временные ряды ROSN_Volume, ROSN_range, ROSN_news, RTSI_range, Brent_Volume являются стационарными

o Времененые ряды ROSN_diff, RTSI_Close, Brent_Close, Brent_range являются не стационарными.

3.5 Построение ADL моделей

При прогнозировании временных рядов наряду с различными факторами огромное влияние имеет не только значение ряда в предыдущие периоды времени, но и остальные, взаимосвязанные с ним экзогенные переменные. Даже если прошлые значения временного ряда объясняют 99% дисперсии, отсутствие влияния других факторов на экзогенную переменную может наводить на различные вопросы о целесообразности построения модели или экономической составляющей данного показателя. Например, если цена акции нефтегазовой компании не зависит от цены нефти на фондовом рынке, следует задаться вопросом, насколько компания фактически зависит от своей основной операционной деятельности по продаже и обработке сырья на рынке.

После ввода экзоненных переменных необходимо выявить эффективную глубину лага. Для выявления глубины лага использована соответствующая процедура в программном обеспечении Gretl. Результаты для компаний ExxonMobil и Роснефть представлены на рисунке 19 и рисунке 20 соответственно.

Рисунок 19, выбор порядка лагов для ADL модели цены акции компании ExxonMobil

Рисунок 20, выбор порядка лагов для ADL модели цены акции компании Роснефть

Выбор глубины лага проводился по критерию Акаике - AIC. По результатам теста для акции компании ExxonMobil было выбрано значение лага, равное 4, а для компании Роснефть значение лага, равное 1.

Далее, на основании сделаннах ранее выводов, была построена ADL модель для компаний ExxonMobil и Роснефть.

ADL модель для ExxonMobile (рисунок 21):

Рисунок 21, коэффициенты ADL модели для первой разности цены акции компании ExxonMobil

Часть переменных, включая некоторые их лаги оказались не значимы на уровне 5%. Все незначимые переменные и их лаги были удалены из модели и по оставшимся факторам была построена модель уже не для первых разностей, а для самой цены акции (рисунок 22).

Рисунок 22, коэффициенты ADL модели для цены акции компании ExxonMobil

Несмотря на то, что некоторые параметры ожидаемо оказались значимыми для модели, необходимо отметить также переменные, лаговые значения которых оказались более полезными для модели нежели текущие значения. К таким переменным относится, например, Brent_Volume.

В итоге, для цены акции компании ExxonMobil значимыми оказались следующие факторы:

· Первый лаг прогнозируемой переменной XOM_Close;

· Текущее значение переменной XOM_diff;

· Третий лаг переменной XOM_diff;

· Текущее значение XOM_Range;

· Текущее значение SP_Close;

· Первый лаг переменной SP_Close;

· Текущее значение переменной Brent_Close;

· Первый лаг переменной Brent_Volume;

· Третий лаг переменной Brent_Volume;

Итоговое уравнение ADL(1;3;5) для компании ExxonMobil имеет вид (учитывались только значимые на уровне 5% переменные):

(37)

Аналогично была построена ADL модель для компании Роснефть (рисунок 23):

Рисунок 23, коэффициенты ADL модели для первой разности цены акции компании Роснефть

После удаления незначимых факторов получилась следующая модель (рисунок 24):

Рисунок 24, коэффициенты ADL модели для цены акции компании ExxonMobil

В итоге, значимыми факторами стали следующие:

· Первый лаг переменной ROSN_Close;

· Текущее значение ROSN_Volume;

· Текущее значение ROSN_diff;

· Текущее значение переменной RTSI_Close;

· Текущее значение переменной Brent_Close.

· Также, значимыми оказались константа и слабый возрастающий тренд.

Итоговое уравнение ADL(1;1;4) для компании ExxonMobil имеет вид (учитывались только значимые на уровне 5% переменные):

(38)

По построенным моделям были построены прогнозы (рисунок 25, рисунок 26)

Рисунок 25, график предсказанных и реальных значений цены акции ExxonMobil на тестовой выборке

Рисунок 26, график предсказанных и реальных значений цены акции Роснефть на тестовой выборке

Обобщенные результаты были сведены и представлены в таблице 6:

Таблица 6, сравнительные характеристики ADL моделей для обеих компаний

Показатель

ExxonMobil

Роснефть

MAPE

0,01

0,1

RMSE

0,98

34

Несмотря на практичечски одинаковый и одновременно высокий у двух моделей на периоде обучения модели, качество модели на прогнозных данных для компании Роснефть значительно значительно хуже, нежели результат проверки модели для компании ExxonMobil.

3.6 Построение модели ANN

Для построения данных моделей использовалось программное обеспечение SAS Enterprise Miner. Исходная выборка была поделена на части (train - для тренировки модели, valid - для сравнения результатов модели на каждой эпохе, чтобы избавиться от проблемы переобучения модели). Оставшийся временной ряд был разделен на обучающую выборку и проверочную, как и в случае рекурентных нейронных сетей.

Далее необходимо было определить какие переменные следует использовать для построения модели. Предположение в том, что классические модели анализа временных рядов могут не увидеть скрытых зависимостей между переменными, либо их обнаружение занимает чрезвычайно много времени. Для данной задачи было экспертно определено рассматривать по 4 лага каждой переменной. То есть если есть связь между значениями временных рядов в начале недели и в конце, то эта связь обнаужится.

В течение построения модели было перепробовано более 30 различных модификаций архитектуры нейронной сети. В итоге, лучшая модель имеет следующую архитектуру:

· 2 скрытых слоя ( на первом слое 10 нейронов, на втором 9);

· Функция активации Tanh, то есть

(39)

Нейронные сети - итерационный алгоритм. То есть за каждую итерацию изменяются веса, уменьшая итоговую ошибку модели. Веса изначально создаются генератором случайных чисел, соответственно нет гарантий, что за несколько запусков нейронная сеть выдаст один и тот же результат, поэтому принято несколько раз запускать алгоритм и сверять получившиеся веса. В случае данной работе все перезапуски алгоритма выдавали одни и те же веса с отклонением не более 0,001, что позволяет сделать вывод об устойчивости данной модели.

Для удобства представлена архитектура нейронной сети на рисунке 27:

Рисунок 27, архитектура модели искусственной нейронной сети, используемой при прогнозировании цены акции компании ExxonMobil

В результате работы нейронной сети всегда интересно посмотреть на веса, которые получила итоговая модель. Из-за довольно сложной архитектуры нейронной сети довольно сложно анализировать сырые данные весов, поэтому была придумана специальная матрица весов, в которой на одной оси отображаются нейроны, откуда выходит связь, на другой оси - нейроны, для которых связь является входящей. Данное представление не является достаточно компанктым для представления в тексте работы, поэтому вынесено за основную часть данное работы в Приложение 1. В данной матрице весов наиболее интересными являются связи, где веса по модулю гораздо больше среднего веса по модели (красная ячейка - положительные, голубая - отрицательные). Чем ярче ячейка с весом, тем больше он по модулю. Далее вынесены в таблицу 7 и рассмотрены наибольшие по модулю веса

Таблица 7, наибольшие 20 весов связей модели ANN для ExxonMobil

Связь идет в

Вес связи

Номер слоя

Связь исходит из

Модуль веса

H6

-0,75842

0.0

XOM_diff

0,758416

H6

-0,65091

0.0

SP_Close

0,650911

H10

0,625639

0.0

SP_Close

0,625639

XOM_Close

0,616401

2.0

H17

0,616401

XOM_Close

0,578255

2.0

H13

0,578255

XOM_Close

-0,5696

2.0

H19

0,569602

XOM_Close

-0,56442

2.0

H16

0,564422

H10

0,525859

0.0

Brent_Close

0,525859

H5

-0,49811

0.0

SP_Close

0,498107

XOM_Close

-0,49048

2.0

H18

0,49048

XOM_Close

-0,47128

2.0

H11

0,471283

H4

0,460083

0.0

SP_Close

0,460083

H8

-0,45353

0.0

SP_Close3

0,453531

H10

0,446853

0.0

Brent_Close1

0,446853

H9

-0,4426

0.0

SP_Close

0,4426

H8

-0,43433

0.0

SP_Close2

0,434332

H8

-0,43206

0.0

SP_Close4

0,432062

H6

-0,42764

0.0

XOM_diff1

0,427636

H10

0,425262

0.0

Brent_Close2

0,425262

XOM_Close

0,424609

2.0

H14

0,424609

При анализе весовых коэффициентов из топ-20 списка заметно, что наиболее часто встречающимися в таблице являются нейроны H6 и H8. При этом видно, что нейрон H6 содержит в себе в большинстве своем показатели на текущий момент времени, в то время как нейрон H8 содержит все переменные - лаговые. Таким образом можно предположить, что нейронная сеть обучилась таким образом, что раскладывает влияние лаговых показателей и текущих показателей в разные нейроны.

Аналогичная работа была проделана для построения ANN модели для цены акции Роснефть. В итоге, была выбрана следующая модификация модели:

· Два скрытых слоя ( на первом слое 11 нейронов, на втором 10);

· Функция активации Identity, то есть

(40)

Для наглядности ниже представлена архитектура нейронной сети (рисунок 28):

Рисунок 28, архитектура модели искусственной нейронной сети, используемой при прогнозировании цены акции компании Роснефть

Аналогично, как и для модели прогнозирования цены акции ExxonMobil, была выведена матрица весов в графическом представлении и отнесена в Приложение 2.

Рассмотрим двадцать первых весов, которые по модулю больше, чем остальные (таблица 8):

Таблица 8, наибольшие 20 весов связей модели ANN для Роснефть

Связь идет в

Вес связи

Номер слоя

Связь исходит из

Модуль веса

H10

-3,6838

0.0

ROSN_diff

3,683844

H8

-2,9576

0.0

RTSI_Close

2,957621

H3

-2,9157

0.0

ROSN_diff1

2,915688

H3

-2,9000

0.0

ROSN_diff2

2,899986

H3

-2,6781

0.0

ROSN_diff

2,678065

H4

-2,5789

0.0

RTSI_Close

2,578931

H3

-2,5431

0.0

ROSN_diff4

2,543097

H3

-2,4816

0.0

ROSN_diff3

2,48156

H4

2,1506

0.0

Brent_Close4

2,150602

H8

-2,0102

0.0

ROSN_diff

2,010189

H8

1,9552

0.0

Brent_Close4

1,955198

H6

-1,9392

0.0

Brent_Close

1,939164

H5

1,9116

0.0

ROSN_diff

1,911645

H6

-1,8760

0.0

Brent_Close1

1,876035

H2

-1,8098

0.0

ROSN_diff

1,809839

H10

-1,6612

0.0

ROSN_diff1

1,661224

H11

-1,6347

0.0

Brent_Close3

1,634725

H10

1,6055

0.0

RTSI_Close2

1,605476

H11

-1,5534

0.0

Brent_Close4

1,553446

H11

-1,5498

0.0

Brent_Close2

1,549828

Наиболее часто встречающимся нейронов является H3, который 5 раз попал в топ-20 списка. При этом, стоит отметить похожесть весов связей от ROSN_diff1, ROSN_diff2 и ROSN_diff. Таким образом участок работы нейрона с данными показателями схож с техникой moving average, использующейся при классическом подходе к анализу временных рядов. Также, стоит выделить, что довольно сильные связи исходят из переменной лаговых значений переменной Brent_Close, всего шесть весов представлено в списке топ-20,при этом три связи принадлежат четвертому лагу переменной.

Из-за сложной архитектуры нейронных сетей модели сложно и даже некорректно сравнивать между собой. На сегодняшний день существует даже отдельная область deep learning, которая отвечает за исследование процесса обучения нейронных сетей и объяснение, почему та или иная построенная модель не работает или же наоборот работает.

В данной работе проведен сравнительный анализ исходящих из доступных данных связей. Необходимо заметить, что несмотря на одинаковый бизнес смысл используемых предикторов, сами переменные, используемые для предсказания цены акции Роснефть, отличаются от переменных, используемых для прогнозирования цены акции ExxonMobil. Например, для акции Роснефть используется индекс РТС, в том время как для акции ExxonMobil используется индекс S&P. Соответственно, интересно сравнить насколько различается влияние факторов для компаний, диаметрально различающихся по геополитическому положению, а также по характеру влияния (больше 50% акций Роснефти принадлежат государству, в том время как ExxonMobil - крупнейшая в мире частная нефтяная компания). Данное отличие может заключаться, например, в необоснованном новостном всплеске вокруг одной компании, или же странным поведением цены акции компании несмотря на отсутствие внешнего и внутреннего давления на цену.

Так или иначе, абсолютное значение весов не дает никакой информации о качестве связи объясняемого параметра с независимым фактором. Однако, интересно посмотреть насколько веса объясняющего фактора для одной компании отличаются от соответствующего бизнес-фактора другой компании. Учитывая, что нейронные сети для разных моделей строятся независимо, необходимо нормализовать веса, чтобы иметь возможность сравнивать их между моделями.

Учитывая, что ранее в работе использовались различные названия переменных при прогнозировании цены акции компаний ExxonMobil и Роснефть (например, значение индекса S&P500 обозначалось SP_Close, а значение индекса РТС обозначалось RTSI_Close), далее построена таблица 9, в которой объединены экзогенные переменные двух компаний в группы по сходству бизнес-смысла (например, SP_Close и RTSI_Close обозначается теперь Ind_Close, как значение индекса).

Таблица 9, соответствие названий показателей

Значение показателя для каждой компании

Общее для двух компаний название показателя

SP_range

Ind_range

RTSI_range

SP_Close

Ind_Close

RTSI_Close

XOM_Volume

Comp_Volume

ROSN_Volume

XOM_range

Comp_range

ROSN_range

XON_news

Comp_news

ROSN_news

XOM_diff

Comp_diff

ROSN_diff

Brent_Volume

Brent_Volume (осталось прежним, т.к использовался один и тот же ряд для обеих компаний)

Brent_range

Brent_range (осталось прежним, т.к использовался один и тот же ряд для обеих компаний)

Brent_Close

Brent_Close (осталось прежним, т.к использовался один и тот же ряд для обеих компаний)

Было выделено по 5 связей (весов) для каждой объясняющей переменной, имеющих максимальный по модулю вес.

На первый взгляд не видно никакого неожиданного результата. Веса одних и тех же переменных располагаются по одну и ту же сторону от центральной нулевой оси. Однако, при внимательном рассмотрении можно заметить, например, что фондовый индекс на цену акций компании Роснефть практически не оказывает никакого влияния, в то время как на цену акций компании ExxonMobil фондовый индекс является одним из главных компонент.

Все веса были нормализованы и построена сводная таблица по разностям весов для каждого показателя и его лага между акциями ExxonMobil и Роснефть, часть которой (не все переменные) представлена в таблице 10.

Таблица 10, наибольшие 20 весов связей модели ANN для Роснефть

Названия строк

Сумма весов ExxonMobil

Сумма весов Роснефть

Разность между весами

Brent_Close(сумма)

5.318

22.919

-17.601

0

3.723

3.566

0.157

1

1.390

4.500

-3.110

2

0.149

3.704

-3.555

3

0.277

4.396

-4.119

4

-0.222

6.752

-6.974

Comp_diff(сумма)

22.408

35.627

-13.219

0

10.423

14.395

-3.972

1

2.569

7.246

-4.676

2

1.785

5.201

-3.415

3

2.807

4.579

-1.772

4

4.824

4.208

0.616

Comp_news(сумма)

-10.889

-0.843

-10.045

0

-2.027

0.696

-2.723

1

-2.262

-0.103

-2.158

2

-3.039

-0.727

-2.312

3

-1.573

-0.512

-1.062

4

-1.988

-0.198

-1.790

Ind_Close(сумма)

34.519

10.368

24.150

0

15.707

7.536

8.171

1

5.489

1.270

4.219

2

4.193

0.098

4.094

3

4.304

0.213

4.091

4

4.826

1.250

3.576

Общий итог

51.356

68.070

-16.715

Как говорилось ранее, сами веса не представляют никакого интереса, в то время как интересно посмотреть на разность переменных и их лагов для двух компаний. Соответственно, была построена переменная diff, которая вычисляется по формуле:

(41)

: g - независимая переменная;

l - номер лага независимой переменной;

- сумма модулей весов пяти самых сильных исходящих связей из независимой переменной, используемой для прогнозирования цены акции компании ExxonMobil;

- сумма модулей весов пяти самых сильных исходящих связей из независимой переменной, используемой для прогнозирования цены акции компании Роснефть;

- разность весов пяти самых сильных исходящих из независимых переменных связей;

Для удобства представления была построена сводная таблица 11, где зеленым обозначена положительная разность (), красным -отрицательная разность (). Яркость зависит от того, насколько значение отличается от нуля.

Как и раньше, нет необходимости обращать внимание на саму величину разности, важно обратить внимание на относительные характеристики построенной диаграммы и графика.

· Переменные, которые влияют в большей степени на цену акции Роснефть

o Brent_Close

o Comp_diff

o Comp_news

· Переменные, которые влияют в большей степени на цену акции ExxonMobil

o Comp_range

o Comp_Volume

o Ind_Close

· Переменные, часть лагов которых в большей степени влияет на акции Роснефть, а другая часть на акции ExxonMobil

o Brent_range

o Brent_Volume

o Ind_range.

Данное разделение можно объяснить следующими предположениями:

· Исторически сложилось, что основная доля ВВП России приходится на экспорт нефтегазовой продукции. В связи с этим, даже при незначительном снижении цены нефти на рынке, все нефтегазовые компании Российской Федерации испытывают внешнее давление рынка. Соответственно, на цену акции компании Роснефть цена нефти марки Brent влияет гораздо сильнее, нежели на американского конкурента - ExxonMobil.

· С другой стороны, по графику видно относительно слабое влияние фондового индекса на цену акции Роснефть относительно влияния фондового индекса на цену акций конкурентной компании. Такое различие можно объяснить следующим образом: как было замечено выше, ВВП России сильно зависит от цены нефти, в то время как ВВП США зависит от экспорта нефти гораздо ниже. Соответственно, существует сильная корреляция между индексом РТС и ценой нефти марки Брент, в то время как корреляция между индексом S&P500 и ценой нефти значительно ниже. В таком случае, все изменение индекса РТС может быть скрыто уже в изменении цены нефти, соответственно нейронная сеть интеллектуально выбирает лучший предиктор, уменьшая вес менее значимого. Для компании ExxonMobil цена нефти имеет относительно слабое воздействие, зато на цену акции значительно влияет положение фондового рынка региона в целом.

· Также можно заметить более сильное влияние новостного индекса о компании на цену акции Роснефть, нежели на цену акции ExxonMobil. Данная зависимость объясняется следующим образом: текстовая аналитика и прогнозирование цен на основе новостного потока появились в России совсем недавно, в то время как в США уже более 90% всех операций совершают так называемые торговые роботы, которые анализируют новостной поток в режиме реального времени и учитывают его в своих операциях. Таким образом, изменение новостного фона о компании ExxonMobil практически сразу отображается на текущей цене компании, в то время как в России торговые роботы, анализирующие новостной поток, только начинают появляться, соответственно существует определенный разрыв между текущей стоимостью акций компании и потенциальной стоимостью. За минимизацию данного разрыва и отвечает новостной поток о компании.

Несмотря на множество полезной информации, которую удалось извлечь из сравнения весов связей, необходимо не забывать об оценке качества построенных моделей. Для модели прогнозирования цен акций компаний ExxonMobil и Роснефть был построен прогноз на период, соответствующий периоду прогнозирования в моделях ADL и ARIMA.

Сильные выбросы моделей относительно фактического значения отсутствуют, обе модели достаточно точно предсказывают данные на тестовой выборе, что позволяет сделать вывод об отсутствии переобучения и адекватности поведения. Как и для ADL и ARIMA моделей, были измерены сравнительные характеристики прогноза (таблица 12).

Таблица 12, сравнительные характеристики ANN модели для обеих компаний

Показатель

ExxonMobil

Роснефть

MAPE

0,04

0,03

RMSE

3,68

10

В итоге, исходя из результатов, можно сделать вывод, что модели искусственной нейронной сети способны достаточно точно предсказывать цену акции компании. Однако, несмотря на сложную архитектуру модели, для компании ExxonMobil нейронная сеть не показала улучшений относительно ADL модели ( относительно ). С другой стороны, модель для акции компании Роснефть показала значительное улучшение качества прогноза - более чем в три раза относительно ADL модели ( относительно ).

3.7 Сравнение качества прогнозирования моделей

Для сравнительного анализа характеристики ретроспективных прогнозов всех моделей были сведены в единую таблицу 13:

Таблица 13, сравнительные характеристики лучших моделей каждого класса для обеих компаний

Тип модели

MAPE

RMSE

ExxonMobil

ARIMA

0,032

2,841

LSTM RNN

0,026

2,386

ADL

0,009

0,977

ANN

0,037

3,682

Роснефть

ARIMA

0,076

26,193

LSTM RNN

0,037

12,908

ADL

0,102

34,789

ANN

0,032

10,966

Как видно по таблице, для разных акций наилучшими оказались различные модели - для цены акции компании ExxonMobil наилучшей оказалась ADL модель, а для цены акции компании Роснефть наилучшие результаты были получены в ANN модели.

Интересно, что MAPE всех остальных моделей для компании ExxonMobil около 0,03, то есть ADL модель выигрывает в среднем 0,02 MAPE от всех остальных моделей, несмотря на то, что в одних из них использовались экзогенные переменные (ANN), а в некоторых использовались только лаговые значения самого ряда (ARIMA, LSTM RNN). Модель ANN, несмотря на явное преимущество перед ARIMA и LSTM RNN в использовании экзогенных переменных, имеет наихудшее качество из всех построенных для цены акции компании ExxonMobil, это можно объяснить недостаточностью длины временного ряда для прогнозирования, так как модели нейронных сетей требуют зачастую от 50 000 примеров обучающей выборки. Данное предположение подтверждается относительно слабым качеством прогноза модели LSTM RNN, MAPE которой лишь на 0,01 хуже .

Отдельное сравнение моделей ADL и ARIMA позволяет сделать вывод, что ввод экзогенных переменных позволяет значительно улучшить качество прогноза ( против . С другой стороны, качество модели рекуррентной нейронной сети с долгой краткосрочной памятью, использующей в качестве предиктора только значения самого предсказываемого временного ряда в прошлые периоды времени, лучше, нежели прогноз модели искусственной нейронной сети ( против ). С одной стороны, ввод дополнительных факторов только ухудшает прогноз модели, однако, необходимо помнить о сложной архитектуре нейронных сетей, имеющих множество весов, которые настраиваются с течением обучения. В данном случае сыграл роль относительно небольшой набор данных, доступных для обучения модели. Несомненно, при увеличении длины выборки для обучения, модель, использующая множество факторов должна показывать лучшие результаты, нежели модель, использующая только значения самого прогнозируемого временного ряда в прошлые промежутки времени.

Лучшей для прогнозирования цены акции компании Роснефть стала модель искусственной нейронной сети с MAPE = 0,032. Всего на 0,5% MAPE хуже оказалась модель LSTM RNN, используя в качестве предиктора только сам ряд цены акции. Модели ARIMA и ADL оказались значительно хуже конкурентов с и , что в два и три раза хуже значений лучшей модели соответственно.

Исходя из результатов прогнозирования, можно сделать вывод, что модели ARIMA и ADL в принципе хуже прогнозируют цену акции компании Роснефть, при этом, в случае компании ExxonMobil, модели показали лучший результат. Данное различие в применимости той или иной модели к прогнозированию цены акции компании можно объяснить динамичностью фондового рынка и развития макроэкономической ситуации в мире. Для компании ExxonMobil ситуация на 2016 год ничем кардинально не отличается от 2010. В случае компании Роснефть ситуация иная: за последние годы компания провела крупные поглощения (например, ТНК-BP), на компанию давят наложенные санкции в связи с внешнеполитическим климатом, цена на нефть резко упала. Все эти факторы оказывали огромное влияние на изменение структуры формирования цены акции компании. В связи с этим, статичные коэффициенты, которые используют модели ARIMA и ADL неспособны показывать динамику развития влияния различных факторов на фондовом рынке, в отличие от различных модификаций нейронных сетей, веса факторов и нейронов на внутреннем слое перестраиваются с течением времени.

Заключение

В данной работе для прогнозирования цены акции компании нефтегазовой отрасли были рассмотрены как классические модели прогнозирования временных рядов (модели ARIMA, ADL), так и новейшие подходы, основанные на применении методов машинного обучения - искусственные нейронные сети, рекуррентные нейронные сети с долгой краткосрочной памятью.

Для оценки моделей строился ретроспективный прогноз на месяц вперед. Далее, была измерена средняя квадратичная ошибка модели (Root Mean Squared Error) и средний процент ошибки модели (Mean Average Percentage Error). Для каждой из двух рассматриваемых компаний была выбрана лучшая модель.

Учитывая всё многообразие фондового рынка, модели строились для двух компаний нефтегазовой отрасли, которые различаются как по геополитической принадлежности, так и по составу основных акционеров компании. Выбор двух компаний для прогнозирования был обусловлен предположением, что формирование цен акций разных нефтегазовых компаний различается. Предположение подтвердилось, с помощью анализа весов нейронов построенной искусственной нейронной сети было выявлено, что для цены акции частной публичной американской компании более значимыми оказались факторы фондового индекса и данные об интенсивности торгов акциями компании на фондовом рынке.

При прогнозирования цены акции российской компании более значимыми факторами оказалась цена на нефть, новостной фон о компании и данные о выплаченных дивидендах. Данное наблюдение объясняется особенностью геополитического положения компаний и составом основных акционеров. Также, необходимо учитывать и внешние экономические факторы, которые сильно давят на экономику Российской Федерации, в отличие от экономик других стран.


Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.