Корреляция финансовых временных рядов
Теоретические выкладки в области теории хаоса. Методы, которые используются в математике, для прогнозирования стохастических рядов. Анализ финансовых рядов и рядов Twitter, связь между сентиметными графиками и поведением временного финансового ряда.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 01.07.2017 |
Размер файла | 388,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Оглавление
- 1. История исследований
- 2. Методология
- 3. Исследование по хэштегам
- 3.1 Mozdeh
- 3.2 Watson Analytics
- 3.3 Дональд Трамп
- 3.4 Брексит
- 3.5 Тойота
- 4. Результаты
- 4.1 Фрактальность
- 4.2 Анализ рядов
- Заключение
- Литература
- Приложения
- Введение
- Деньги играют большую роль в жизни каждого человека. Благодаря деньгам человек может позволить себе развлечения, разнообразие блюд на столе во время обеда и многое другое. В связи с этим появилась необходимость следить за изменениями на финансовом рынке, так как это напрямую влияет на жизнь любого человека. В доказательство можно привести простой пример: многие продукты привозят из-за рубежа, а значит, цена на них формируется из соображений курса рубля. Следовательно, изменения курса рубля влияет на цену продуктов, а, значит, и на уровень жизни человека. Для того, чтобы уберечь себя от неожиданных случаев появились специалисты, которые прогнозируют поведение финансовых графиков. Этим объясняется актуальность данной работы.
- Агентами, которым будет полезна работа являются биржи. Впервые финансовая биржа появилась еще в 16 веке. Тогда она сильно отличалась от существующей сейчас. Там не встречалось большого количества фирм, которые бы предлагали их ценные бумаги. Первая биржа появилась для торговли перцем. В основном именно цена на перец и была показателем, на которые все смотрели. Затем, в Англии появилась биржа ценных бумаг, которые существовали для работы с бумагами государства. В последствии это направление развивалось, и первая биржа в России появился в 1703 году.
- На бирже наблюдают за изменением котировок и других различных величин, но их так же можно и просчитать. Цель данной работы выяснить, являются ли финансовые временные ряды стохастическими рядами или же они имеют хаотическую природу и определить, как активность в социальных сетях влияет на финансовые временные ряды. Под временными рядами в работе понимается набор наблюдаемых данных изменения некой величины во времени. Объектами исследования являются финансовые ряды отношения евро-доллар, евро-йена и другие ряды, включая график изменения цены на золото.
- Предсказывание финансовых временных рядов является очень сложной задачей и на сегодняшний день нет способа предсказать точно хотя бы поведение графика. Работа направлена на решение данной проблемы. Новизна работы заключается в использовании социальных сетей, а именно микроблога twitter. Данные из социальных сетей использовались как источник данных для других методов, но активность по тематике и математическую интерпретацию данных социальных сетей не рассматривали как отдельный вид данных.
- В работе используется только качественный сравнительный анализ данных. Математическая интерпретация сложный процесс, который требует времени и большого количества актуальных данных. В рамках работы нет возможности использовать такие данные, поэтому для решения проблемы используется качественный анализ на поиск зависимости.
- Для исследования используется система Twitter. В рамках работы с системой используются следующие термины: хэштег и твит. Твит - это сообщение, которое создается пользователем для распространения информации всем остальным пользователям, которые его читают. Хэштег - это название знака «#». В Twitter отождествляется со словом после знака «#».
- Данную работу можно использовать как для проведения собственного анализа поведения временных рядов, так и для профессиональной деятельности в игре на бирже. Работа позволит угадывать поведение графика с высокой точностью.
- 1. История исследований
- Временными рядами занимались многие ученные. Все началось еще со временем Пуанкаре. Он первый заметил, что при анализе сложного поведения обычные методы не подходят, они попросту не работают. И тогда перед ученными встала задача на исследование устойчивости, геометрической структуры и других показателей различных систем. Такой подход не позволяет представить решение в явном виде, зато позволяет качественно оценить представленную систему.
- Помимо Пуанкаре, свой вклад в развитие теории хаотических моделей ввели советские математики А.Н.Колмогоров, В.И.Арнольд и немецкий математик Ю.К.Мозер. Пуанкаре доказал теорию о возвращении. В википедии это теория звучит следующим образом:
Рисунок 1. Формулировка теоремы о возвращении
А.Н.Колмогоров, В.И.Арнольд и Ю.К.Мозер сформулировали теорию КАМ (теорию Колмогорова-Арнольда-Мозера). Эта теория относится к теории хаоса, так как гласит о почти периодических системах с малыми возмущениями. Теория помогла решить вопрос об устойчивости солнечной системы. Формулировку этой теоремы можно считать началом развития теории хаоса.
Важной фигурой в развитии теории хаоса можно считать Э.Н.Лоренца. Он и Пуанкаре первые сформулировали известный на сегодняшний день «эффекта бабочки». Естественно, они сформулировали это правило по-разному, но смысл, которые они вложили в свои формулировки один и тот же.
Также, следует отметить еще одну персону в теории хаоса. А.М.Ляпунов, который сформулировал центральную предельную теорему и ввел критерии устойчивости в теории хаоса. Исключительно важная фигура в теории хаоса, работы которого сложно переоценить.
Первое печатное издание по использованию теории хаоса в финансовой сфере можно отнести книгу Эдгара Петерса «Хаос и порядок на рынке капитала». Это был новый подход к изучению финансовых рынков. Позднее, появилось новое понятие в математическом исследовании временных рядов - фрактальная природа ряда. Применение фракталов стало следующим шагом и начало развитие сравнительно недавно.
На сегодняшний день существует множество способов прогнозирования временных рядов. В основном эти способы предназначены для рядов, которые можно представить в виде математической системы с множеством переменных. Для прогнозирования таких систем применяют стохастические методы прогнозирования. Методы, применяемые для финансовых временных рядов, описал в своей книге «Финансовая математика» Альберт Николаевич Ширяев. Он описал в своей книге регрессионный и авторегрессионный анализ стохастических рядов. Использование нейросетей для стохастического анализа и многие другие методы, которые, если верить его словам, на самом деле не работают. Это показали его последние исследования в этой области. Оказалось, что нельзя выразить финансовые ряды только с помощью математических переменных. Точнее не все переменные можно определить через график, а поэтому и нельзя интерпретировать. Зависимость найти можно, а от чего зависит понять невозможно.
Дмитрий Возный, автор книги «Код Эллиотта: волновой анализ рынка Forex» 2006 года, рассказывает в своей книге про анализ финансового рынка. Автор подходит к анализу графиков с точки зрения экономики. Сама наука экономика - это смесь социологии, психологии и математики. Поэтому именно экономисты помогли определить такие закономерности, как повторение истории. В своей книге Дмитрий приводит множество примеров того, как фрагменты графиков схожи между собой, хотя они совершенно из разных периодов. Эти все примеры и доказывают принцип повторения.
Второй принцип, который в книге указывает и который был применен в работе, это влияние факторов. По мнению экономистов, на финансовые графики влияет буквально все. Чтобы не произошло, это точно найдет отражение в поведении графика. Поэтому слежение за новостями является одной из главнейших задач каждого трейдера.
Далее в книге рассказываются методы, при помощи которых экономисты исследуют графики. Одним из таких методов являются Закон волн Эллиотта. Это математический метод анализа графика на экстремумы. Этот метод является также качественным, так как позволяет лишь определить поведение графика. Тем не менее, несмотря на эффективность способа, его достаточно сложно применить на практике даже специалистам. Поэтому экономисты пользуются методом рыночных плеч, который, как показывает практика, не отличается точностью предсказаний. Используя этот метод сложно определить, где начинается плечо, а где просто случайный скачок.
Фишер Блэк в публикации «Шумовая торговля» обозначил новый термин, который использовал в названии статьи. Он считает, что есть тип трейдеров, которые используют не фактическую информацию, а лишь шум. Шум - это помехи или излишек информации, который искажает ее. «Шумовая торговля - это торговля на шуме, воспринимаемом так, как если бы шум был бы информацией. Люди, торгующие на шуме, будут торговать даже тогда, когда объективно они должны были бы воздерживаться от этого. Возможно, они считают, что шум, на основе которого они торгуют, является информацией. Или, возможно, им просто нравится торговать». Хотя Ф. Блэк не указывает, каких операторов следует относить к категории «шумовых трейдеров», в работе Де Лонга, Шляйфера, Саммерса и Вальдмана можно найти описание таких участников рынка. Шумовые трейдеры ошибочно полагают, что у них есть уникальная информация о будущих ценах на активы. Источниками такой информации могут быть ложные сигналы о несуществующих трендах, подаваемые индикаторами тех. анализа, слухи, рекомендации финансовых «гуру». Шумовые трейдеры сильно переоценивают значение имеющейся информации и готовы принимать на себя необоснованно большой риск. Проведённые эмпирические исследования также указывают на то, что к шумовым трейдерам в первую очередь следует отнести индивидуальных инвесторов, т.е. физических лиц. Более того, именно эта группа трейдеров несёт систематические убытки от торговли из-за иррациональности своих действий. Для западных фондовых рынков эмпирическое подтверждение этого явления можно найти в исследованиях Барбера и Одина, а для операторов российского фондового рынка - в работе И.С. Нилова. Теория шумовой торговли позволяет объяснить и феномен Р. Шиллера. Именно иррациональные действия трейдеров вызывают чрезмерную изменчивость цен.»
Это открытие продвинуло изучение и прогнозирование финансовых рядов. Использование другими игроками разного рода шума означает, что его влияние недооценивали и влияние шума на результат гораздо выше, чем предполагалось ранее. Работа с социальными сетями как раз и предполагает, что шум, который используют трейдеры, усиливается в микроблогах и его легче отследить.
2. Методология
финансовый ряд прогнозирование
В ходе исследования использовался метод Такенса. Временные ряды представляют собой набор зафиксированных данных. Поэтому достаточно затруднительно ответить на вопрос, какое количество переменных содержит данная функция и какая взаимосвязь между ними. Метод Такенса или, как его еще называют, метод погружения позволяет решить данную проблему.
Для использования метода Такенса требуется временной ряд, длина которого заведомо превышает размер пространства. Далее, будем использовать вектора, предполагаемой размерности пространства, каждая координата которого будет зафиксированное значение временного ряда, взятое через промежуток t. Заметим, что данный промежуток един для всех значений ряда. Тогда, каждое значение координаты вектора будет представлять себе значение отдельной переменной и эти значение можно будет использовать для воспроизведения системы, порождающей временной ряд.
Далее, для просчета корреляционной размерности, которая относится к разряду фрактальной размерности, был использован алгоритм Грассбергера-Прокаччиа. Проблема алгоритма в том, что он требует достаточно большое количество данных, а значит и оценка времени работы алгоритма относительно большая. Суть заключается в том, чтобы с помощью алгоритма Такенса искусственно создать векторы из данных и найти количество векторов, расстояние между которыми меньше заданной величины. Для отбора количество векторов использовалась функция Хевисайда.
Для вычисления расстояния было выбрано Манхеттенское расстояние. Выбор был сделан по двум причинам: алгоритм позволяет использовать это тип вычисления расстояния для оценки ряда без потерь для вычислений, а второе, реализация с использованием этого принципа вычисления расстояния работает быстрее. При реализации алгоритма приходится большое количество раз вычислять расстояние. При использовании этого расстояния, количество новых вычислений можно сократить, используя принцип динамического программирования.
После получения результата, был проведен анализ на местность, на которой график ведет себя как линейная функция. Размерность, при которой не перестает меняться угол наклона линейной функции, и будет являться размерностью пространства.
Изучив ряды на фрактальность, можно говорить о построении системы, согласно теории хаоса. Изучение природы ряда крайне важно в дальнейшем развитии работы. Природа ряда повлияет на модель, которая будет выбрана для проведение количественного анализа. Количественный анализ - это следующий шаг в развитии данной работы.
3. Исследование по хэштегам
Для нахождения закономерность в поведении финансовых временных рядов и активность в микроблоге Twitter, необходимо использовать дополнительное ПО, чтобы извлечь информацию из Twitter. Получение необходимой информации является самой по себе не простой задачей, так как в открытом доступе данных по всей системе Twitter нет. Большинство программ, которые представлены в просторах интернета, являются программами индивидуального пользования. Эти программы чрезвычайно полезны для SMM маркетологов, индивидуальных предпринимателей, блогеров - для тех, кому важно знать статистику по своему аккаунту и по активности подписчиков.
Другие сервисы, которые вполне могли подойти для решения задачи, имели некоторые ограничения. Стоит рассмотреть эти ограничения в отдельности. Так как программ по сбору статистики по всему Twitter не особо много, то сервисы, которые могли собрать такого рода информацию вполне обоснованно просят за доступ к их данным денежную плату. В основном это платная подписка сроком на 1 месяц или год. Безусловно, данные, которые там имеются, стоят того, чтобы за них заплатили, если бы не следующее ограничение.
Сервисы предоставления информации по активности в представленном микроблоге могут предложить информацию по количеству твитов по определенному хэштегу, что и требуется в данном исследовании, но только за ограниченный период времени. Это не было столь существенной проблемой, если бы этот промежуток времени можно было бы выбрать, но ограничение по времени берет свой отсчет от сегодняшнего дня. Другими словами, информацию можно получить лишь за последний период, что не является удобным в рамках исследования рядов.
Последнее ограничение, которое помогло принять окончательное решение по поводу выбора системы - это наличие сентиментного анализа. Сентиментный анализ является подходом к сегментации твитов. Все твиты можно разделить по эмоциональному окрасу. На начальном этапе не предполагалось его использования, так как сравнительное небольшое количество сервисов может его предоставить, и наличие подобного анализа для Twitter не было известно. Далее, использование такого подхода стало ключевым.
В итоге, кандидатами для использования оказалось две системы. Первая система - это Watson Analytics от компании IBM. Вторая система - это приложение для ПК под названием Mozdeh.
3.1 Mozdeh
Разработчики этой программы позиционируют свой продукт как программу способную анализировать временные ряды Twitter. На первый взгляд прекрасно подходит для решения поставленной задачи. К программе есть понятная инструкция с приведенными примерами. Имеются различные варианты поиска твитов. В настройках поиска можно найти такие вариации настроек как поиск по ключевым словам, поиск у конкретных пользователей.
После поиска с полученными данными можно построить большое количество графиков. Это, естественно, временной график и сентиментные графики. Помимо основных в рамках исследования графиков, существует еще огромное множество показателей, которые выводятся по данному временному ряду из Twitter. Например, это часто встречающиеся слова, словарь используемый по дням и другие. Отличный инструмент для проведения анализа рядов и поиска информации, если бы не один нюанс. При поиске данных нельзя выбрать период поиска данных. Чаще всего он ограничен последними двумя неделями или, как утверждают разработчики, ограничением в 11 000 твитов. Для подобного рода исследований это чрезвычайно мало, поэтому было решено выбрать вторую систему.
3.2 Watson Analytics
Это система от всеми известной компании IBM. Аналитическая система для различных данных. В эту систему необходимо загрузить базу данных, которую необходимо проанализировать и система предложит выбрать тип анализа, который необходимо провести для базы данных. В системе имеется возможность ввести вопрос, ответ на который должны дать данные, и система сама подберет представление информации в удобном виде и свои прогнозы. Системой можно пользоваться как на платной основе в виде подписки, так и бесплатно с введенными ограничениями.
В арсенале этой системы имеется огромное количество инструментов. Она способна строить многофакторные модели, делать сентиментный и семантический анализ рядов, но, что самое главное в рамках исследования, систем умеет импортировать данные из системы Twitter. Поиск нужных твитов система проводит в соответствии с введенными хэштегами, и имеется возможность выбрать период времени, за который необходимо узнать активность пользователей. Единственное ограничение - это 25 000 твитов. Можно выбрать период, в который будет больше 25 000 твитов, но тогда система сама выберет 25 000 твитов из всех возможных, что не очень хорошо для проведения исследования. После выбора системы пришло время провести анализ временного ряда и активности в Twitter.
3.3 Дональд Трамп
Дональд Трамп - это президент США, который осенью 2016 года баллотировался на пост президента и провел превосходную PR-компанию в социальных сетях. Миллиардер и очень яркая личность, новости о которой влияли на поведение американского доллара.
Для проведения анализа был выбран хэштег #trump. Был выбран лишь один тег, так как практически везде он был использован при упоминании президента вместе с другими тегами, такими как #donaldtrump, #presidenttrump и другими. В качестве временного финансового ряда использовался курс евро-доллар за октябрь-ноябрь 2016 года.
Для того, чтобы анализ был точным, при получении статистики данные соответствовали ограничениям Watson Analytics, и количество твитов в одной базе не превышало 25 000. Поэтому было создано несколько баз на каждый день, в целях уместить все твиты по выбранному хештегу. После сбора были получены следующие графики (рис.2, рис.3, рис.4). Также, были построены сентиментные графики.
Рисунок 2. График твитов по хэштегу #trump
Рисунок 3. График положительного сентимента по хэштегу #trump
Рисунок 4.График отрицательного сентимента по хэштегу #trump
3.4 Брексит
Кроме ряда по хэштегу «trump», также был проведен анализ по хештегу «brexit». Этот хэштег был выбран, так как это событие является одно из самых ярких событий для евросоюза за прошедший год. Как и в прошлой выборке, для анализа создавались базы данных из твитов так, чтобы в каждой базе количество твитов не превышало 25 000. Для исследования были выбраны месяца май и июнь 2016 года.
Решение о том, что Великобритания выйдет из состава Евросоюза, было объявлено на референдуме, который прошел 23 июня. В связи с этим, для анализа реакции рынка на новость необходимо посмотреть состояние системы до появления новости, а затем во время объявления.
До объявления новости в общественности обычно появляются различные слухи, которые порождают реакцию. Если обратиться к рынку акций, то там эта ситуация наиболее ярко видна. На стоимость акций влияют результаты финансового года. Поэтому объявление результатов является важным событием для компании. Как объявить новость это задача, которая стоит отдельного рассмотрения. Первое, на что обычно смотрят при объявлении результатов, так это на состав акционеров. Если в составе акционеров достаточно много крупных инвесторов, чаще всего не частных, то менеджеры компаний рассказывают плохие новости им раньше объявлений результатов. В таком случае, реакция рынка во время непосредственного объявлений гораздо слабее, так как все уже было решено заранее.
В обратном же случае, когда в составе акционеров преобладают частные акционеры, которые полагаются на мнение аналитиков, то новости сначала раскрываются им, чтобы те сделали прогноз, подготовивший акционеров. Реакция рынка снижается, но из-за задержки понимания, реакция рынка может быть продолжительно и сами результаты могут вызвать вторую волну активности.
В нашем случае, мы имеем дело с новостью, которая наверняка обсуждалась ранее, до референдума. Но в силу того, что это политика, официальное объявление о выходе из Евросоюза дало резонанс и в момент объявления, что и требуется проверить.
Для поиска закономерностей, были построены три графика. Первый график отражает общее количество твитов по дням с 1 мая до 23 июня. Второй график показывает количество твитов положительного сентимента. Третий график отражает количество твитов отрицательного сентимента.
Рисунок 5.График твитов по хэштегу #brexit
Рисунок 6. График положительного сентимента по хэштегу #brexit
Рисунок 7. График отрицательного сентимента по хэштегу #brexit
3.5 Тойота
В качестве еще одной выборки для анализа корреляции между активностью в микроблогинговой сетью Twitter и финансовым рядом, был взят график котировок акций Toyota Motor. В отличие от временных финансовых рядов, которые отражают поведение курса различных валют, стоимость акций сильно подвержены влиянию общественного мнения. С этой точки зрения было бы интересно посмотреть, насколько сильно это выражено в микроблоге.
В данном исследовании нет упора на то, какие новости были раскрыты рынку. Разные исследователи ставят проблему определения стоимости акции в зависимости от новости, которая была выдана на рынок. Тогда, при определении влияния, встает вопрос определения окраса новости. Другими словами, как определить, является ли новость хорошей или является ли она плохой.
Одним из методов определения типа новости является метод, предложенный Чаном. Он определяет тип новости в зависимости от изменения доходности акций. Если доходность компании является меньшей, то новость объявляется плохой. Иначе, новость вполне можно считать хорошей. Притамани и Сингал представили другую метрику определения окраса новости. Они определяют тип новости в зависимости от знака скорректированной сверхдоходности. Если знак положительный, то и новость можно считать хорошей. Если же знак отрицательный, то новость плохая.
Другая группа исследователей сосредоточила свое внимание на дивидендах. Котари, Шу и Высоцки в своем исследовании говорят, что новость является хорошей тогда, когда виден рост дивидендов. Если же дивидендные выплаты падают, то новость, которая была объявлена, является плохой.
Третья группа исследователей, например Скиннер и Слоун, строят свою теорию о том, какая новость является хорошей, а какая плохой, в зависимости от ожиданий инвесторов. Высчитывается показатель ES, который равен разности между реальной стоимостью акций и прогнозируемой.
В представленном исследовании не будет выдвигаться теории насчет того, какая из групп исследователей является правой, а какая нет. Напротив, данное исследование можно использовать для дополнения уже существующих теорий. В работе, для определения знака новости используются статистические данные, взятые из сети Twitter. Как известно, резонанс от новости происходит не сразу, в виду скорости распространения информации. Тем не менее, в зависимости от того, какое пропорциональное соотношение между положительными и отрицательными твитами, можно судить об окрасе новости.
Еще один вопрос, который остается открытым и не раскрывается в работе - это вопрос о другой классификации новостей. Новости бывают разных типов - это могут быть объявления о результатах финансового года. Это могут быть новости о внутренних изменениях в компании, новости о слияниях и так далее. Каждая новость будет влиять по-разному на стоимость акций. При исследовании корреляции финансовых рядов и рядов Twitter, не ставился акцент на то, какая новость была опубликована. Рассматривалась лишь реакция пользователей на публикацию. В связи с этим, появляется еще один нюанс.
Как было сказано ранее, имеет значение, для кого публикуются новости. Состав акционеров для разных компаний может быть разным. У одних преобладают большие инвесторы, у других в основном частные инвесторы. Реакция на новости, касающихся компаний в которые инвестируют большие компании, не такая яркая, как у частных инвесторов. Частные инвесторы больше подвержены влиянию в виду своей ограниченности информации и, возможно, опыта и знаний.
В предложенном случае, рассматривается реакция частных инвесторов, так как именно они наиболее активны в микроблоггинговой сети. Поэтому, корреляция стоимости акций будет большей для тех компаний, у которых в составе акционеров преобладают частные инвесторы.
Для анализа были взяты графики положительного сентимента, отрицательного сентимента, а также график котировки акций.
Рисунок 8.График отрицательного сентимента по хэшетгу #toyota
Рисунок 9. График положительного сентимента по хэштегу #toyota
4. Результаты
4.1 Фрактальность
В ходе проведения исследования были получены результаты:
Финансовый ряд |
Размерность вложения |
Размерность D2 |
|
Евро-Британский фунт |
7 |
0.0754332 |
|
Евро-Японская йена |
8 |
0.166714 |
|
Золото |
8 |
0.0965661 |
|
Серебро |
9 |
1.38747 |
|
Доллар-Японская йена |
8 |
0.671846 |
Мы получили, что эти ряды имеют конечномерное представление, так как начиная с размерности вложения размерность D2 перестала меняться. По результатам, представленным в таблице, мы можем судить о фрактальной природе рядов. На это указывается то, что размерность D2 не является целочисленной. Этот факт дает нам основание для продолжения исследования. Во-первых, это означает, что данные финансовые временные ряды, да и остальные финансовые ряды, можно каким-либо способ предсказывать и описывать, так как они не являются случайными процессами. Во-вторых, используя то, что финансовые ряды можно предсказывать с помощью математических инструментов, можно использовать методике поиска корреляции с активностью в микроблоггинговых системах.
4.2 Анализ рядов
В ходе качественного анализа графиков получились следующие выводы. Количество сделанных твитов на конкретную дату и построенный график по этим твитам не дает полной картины по поведению временного финансового ряда. При просмотре сентиментных графиков наблюдается интересная зависимость. Был построен график разниц сентиментов (рис. 5) . При изменении знака разницы между положительным и отрицательным сентиментом меняется выпуклость финансового графика. Посмотрим на графики подробнее. На первом графике видно, что 22 октября меняется знак сентимента. А 23 октября график евро-доллар меняет свое направление. В этой точке он достигает своего дня. После этого график не опускался ниже этой точки, а постепенно рос вверх. Мы видим, что изменение сентимента также особо сильно не менялось и не уходило в отрицательную часть графика. Далее рассмотрим другой пример с событием Брексит.
Рисунок 10.График разницы сентиментов по хэштегу #trump
Посмотрим на такой же график разницы сентиментов, построенный на основе запросов по хэштегу #brexit. Тут более сложная ситуация. Так как тут два ряда, на которые все это могло повлиять, то и оценка сложнее. Но, тем не менее, можно рассмотреть несколько ситуаций. Видно, что в целом новость была нейтральна, до 22 числа, когда резко сентимент изменился. Тогда, 23 мая, произошло изменение направления графика. Второе изменение графика сложно объяснить с помощью только одного события. Видимо, там было что-то другое, что повлияло на доллар. Но в день объявления новости, был резкий рост положительных твитов. Это видно и на графике. Начался рост графика. Это продолжилось недолго в итоге. Но резкие перепады настроения на Twitter можно считать сигналом к тому, как поведет себя график. На данном графике сложно сказать, что связь однозначна, но отрицать отсутствие сигналов тоже невозможно.
Рисунок 11. График евро-доллар
Рисунок 12. График разницы сентиментов по хэштегу #brexit
Рисунок 13. График евро-доллар
Обратимся к графику котировок акций Toyota Motor. Обратим внимания на графики сентиментов. Можно заметить два всплеска: 19 июня и 30 июня. Для начала посмотрим на 19 июня. Это очень интересный всплеск, так как он отражен на обоих графиках. Но более ярко он отражен в отрицательном сентименте. После этого всплеска был достигнут максимум на графике за летний период через 4 дня. Опять же, активность в Twitter была сигналом для инвесторов. Скорее всего, произошел какой-то слух о новости, которая произошла 23 июня. Следующий всплеск тоже привел к изменению направления графика, но незначительно. Вполне возможно, что однозначно отрицательная новость не так сильно влияет на стоимость акций. Или же сама новость была не очень важной.
В рассуждениях на эту тему поднимается важный вопрос о новостях. Для акций важно знать, какие новости были опубликованы. Кроме того, не раскрыта информация, каким образом новость была опубликована, как быстро она может повлиять. К этому можно добавить еще и то, что не проведен анализ акций.
Рисунок 14. График котировок акций Toyota Motor
Тем не менее, в результатах есть подтверждение гипотезе, которая была доказана не в одном исследовании рынка акций. Отрицательные новости имеют более сильное воздействие на рынок, нежели положительные. Это можно связать с поведенческой моделью поведения инвесторов. Инвесторы часто очень оптимистично смотрят на события, нежели они на самом деле.
Заключение
В исследовании были использованы временные финансовые ряды. Были даны теоретические выкладки в области теории хаоса. Описаны методы, которые используются в математике, для прогнозирования стохастических рядов. Рассмотрены подходы экономистов к этому вопросу. Также, была описана методология, с помощью которой были получены следующие результаты.
Было доказано, что финансовые ряды, которые были взяты для исследования, имеют фрактальную природу, а не являются случайными процессами. Это был важный момент в исследовании, так как без него продолжение не имело бы смысла. Доказано это было с помощью подсчет корреляционного интеграла. Подсчеты были приведены в разделе результаты и были сделаны при помощи методов программирования. Для подсчета размерности был использован алгоритм Грассбергера-Прокаччиа. Но для исследования, он был немного преобразован, чтобы ускорить вычисления.
В ходе анализа финансовых рядов и рядов Twitter была выявлена связь между сентиметными графиками и поведением временного финансового ряда. Основным выводом в исследовании стало то, что активность в Twitter является сигналом к изменениям в финансовых рядах, отражающих отношения валют. Причем не любая активность, а резкое изменение сентиментоной пропорции. Для более точных результатов, необходимо продолжить исследование в этой сфере и использовать графики для разного рода новостей и разного рода графиков, чтобы исключить перекрестного влияния одной и той же новости.
Также, был проведен первичный анализ корреляции котировок акций компании Toyota Motor и рядов Twitter. Были найдены закономерности в поведении, который также можно свести к тому, что ряды Twitter дают только сигналы к тому, что может произойти. Для расшифровки этих сигналов проведено недостаточно исследований и учтены не все аспекты, которые описаны в работе. Тем не менее, в данной работе содержится новый подход к классификации новостей. Классификация производится на основе сентиментного анализа в системе Twitter. Такой подход интересен тем, что легче поддается подсчету.
Исследование еще нуждается в дальнейшем продолжении, но уже можно представить алгоритм, как действовать, чтобы предсказать поведение графика. Для этого необходимо проанализировать новости, которые связаны с данным рядом. Выделить наиболее важные, а далее построить на основе Twitter сентиментные ряды. Посмотреть, где происходят резкие перемены сентимента. Если они есть, а изменение направления графика не было, то нужно быть начеку, так как в скором времени это должно произойти.
Литература
1) http://chaos.phys.msu.ru/loskutov/PDF/Lectures_time_series_analysis.pdf
2) Fisher, B. (1986) “Noise trade”. British talks
3) Vozniy, D. (2006) “Elliott's code: wave analyze of Forex market”. Forex magazine
4) Ширяев, А.Н. (2006) “Финансовая математика”. MSU
5) Chan, W. (2003), Stock price reaction to news and no-news: drift and reversal after headlines, Journal of Financial Economics 70 (2003), 223-260.
6) Pritamani, M., and Singal, V. (2001), Return predictability following large price changes and information releases, Journal of Banking and Finance 25 (2001), 631-656
7) Kothari, S., Shu, S., and Wysocki, P. (2008), Do Managers Withhold Bad News? MIT Sloan Research Paper No. 4556--05, 2008
8) Skinner, D., and Sloan, R. (2002), Earnings surprises, growth expectations and stock returns or Don't let an earnings torpedo sink your portfolio, Review of Accounting Studies 7 (2002), 289--312
9) Рюэль Д. «Случайность и хаос». - Ижевск: НИЦ, 2001
10) Кроновер Р.М. «Фракталы и хаос в динамических системах. Основы теории».
11) В. И. Кувшинов, А. В. Кузьмин «Калибровочные поля и теория детерминированного хаоса»
12) Пайтген Х. О., Рихтер П. Х. «Красота фракталов».
13) Шустер Г. «Детерминированный хаос: введение».
14) Петерс Э. «Фрактальный анализ финансовых рынков: Применение теории Хаоса в инвестициях и экономике»
15) Skinner, D. (1997), Earnings disclosures and stockholder lawsuits, Journal of Accounting &Economics 23 (1997), 249-282.
16) Edwards, W. (1968), Conservatism in human information processing, in: Kleinmutz, B. (Ed.). Formal Representation of Human Judgment. John Wiley and Sons, New York, p. 17--52
17) Conrad, J., Cornell, B., and Landsman, W. (2002), When is bad news really bad news? The Journal of Finance, Vol. LVII, No.6, (2002), 2507-2532.
18) Bernard, V., Thomas, J., and Wahlen, J. (1997), Accounting based stock price anomalies: Separating market inefficiencies from risk, Contemporary Accounting Rensearch, 14 (1997) 89--136
19) Baker, M., and Wurgler, J. (2004a), A catering theory of dividends, Journal of Finance, 59 (2004a) 271--288.
20) Amir, E., Lev, B., and Sougiannis, T. What value analysts? // Working paper, 1999
Приложение 1. Программный код просчета корреляционного показателя
#include<iostream>
#include <iomanip>
using namespace std;
#include<vector>
double absd(double x)
{
if(x<0) return -x;
}
int one(double first)
{
if(first>=0) return 1;
return 0;
}
int main()
{
freopen("13.txt","r",stdin);
freopen("231.txt","w",stdout);
vector<double> a;
double max=0,min=1000000;
while(cin)
{
double k;
cin>>k;
a.push_back(k);
if(max<k) max=k;
if(min>k) min=k;
}
double sumi=0, sumj=0,pro=1;
double r=(max-min)*10;
int n=10000, n1=n-1;
vector<vector<double>> ans(110);
vector<vector<double>> ai(10100);
int q=0;
for(int i=0;i<30;i++)
{
ans[i]=vector<double> (110);
for(int j=0;j<105;j++)
ans[i][j]=0;
}
for(int i=0;i<n1;i++)
{
vector<double> aj(n1-i);
ai[i]=aj;
for(int j=0;j<n1-i;j++)
{
q=0;
ai[i][j]=abs(a[j+i+1]-a[j]);
for(double ii=r; q<100;ii-=r/1000)
{
if(ai[i][j]<ii) ans[1][q]++;
q++;
}
}
}
n1--;
for(int m=2;m<15;m++)
{
for(int i=0; i<n1;i++)
{
for(int j=0;j<n1-i;j++)
{
q=0;
ai[i][j]+=abs(a[j+i+m]-a[j+m-1]);
for(double ii=r; ii>=0;ii-=r/100)
{
if(ai[i][j]<ii) ans[m][q]++;
q++;
}
}
n1--;
}
}
cout<<"r="<<r<<endl;
cout.setf(ios::fixed);
for(int i=1;i<15;i++)
{
cout<<"Значения для m равного "<<i<<' ';
for(int j=0;j<ans[i].size();j++)
{
double t=ans[i][j];
cout<<setprecision(8)<<t<<' ';
}
cout<<endl;
}
return 0;
}
Приложение 2. Программный код просчета точек для определения линейной области.
datat=Import["Файл данных",{"Data"}]
data1=Table[0,{i,14},{j,0}]
data=Table[0,{i,14},{j,0}]
For[i=2,i<=Length[datat],i++,data[[i-1]]=StringSplit[datat[[i]]]]
For[i=1,i<=Length[data],i++,
For[j=6,j<=106,j++,data1[[i]]=Append[data1[[i]],ToExpression[data[[i,j]]]]]]
k=1000000
r=datat[[1]]
data2={}
r=ToExpression[StringDrop[r,2]]
For[m=1,m<Length[data1],m++
For[i=1,i<=99,i++,
prev=0;
For[j=i+1,j<=100,j++,
r1=r-(i)*r/100;
r2=r-(j)*r/100;
a1=(Log[(data1[[m,i]])/100000000]-Log[data1[[m,j]]/100000000])/(Log[r1]-Log[r2]);
If[(Abs[a1-prev]<0.0001&& a1!=0&&prev!=0),k=a1,Reals];
prev=a1;
]
]
data2=Append[data2,k];
]
data2
Размещено на Allbest.ru
Подобные документы
Классические подходы к анализу финансовых рынков, алгоритмы машинного обучения. Модель ансамблей классификационных деревьев для прогнозирования динамики финансовых временных рядов. Выбор алгоритма для анализа данных. Практическая реализация модели.
дипломная работа [1,5 M], добавлен 21.09.2016Основные элементы эконометрического анализа временных рядов. Задачи анализа и их первоначальная обработка. Решение задач кратко- и среднесрочного прогноза значений временного ряда. Методы нахождения параметров уравнения тренда. Метод наименьших квадратов.
контрольная работа [37,6 K], добавлен 03.06.2009Статистические методы анализа одномерных временных рядов, решение задач по анализу и прогнозированию, построение графика исследуемого показателя. Критерии выявления компонент рядов, проверка гипотезы о случайности ряда и значения стандартных ошибок.
контрольная работа [325,2 K], добавлен 13.08.2010Анализ временных рядов с помощью статистического пакета "Minitab". Механизм изменения уровней ряда. Trend Analysis – анализ линии тренда с аппроксимирующими кривыми (линейная, квадратическая, экспоненциальная, логистическая). Декомпозиция временного ряда.
методичка [1,2 M], добавлен 21.01.2011Временные ряды и их характеристики. Факторы, влияющие на значения временного ряда. Тренд и сезонные составляющие. Декомпозиция временных рядов. Метод экспоненциального сглаживания. Построение регрессионной модели. Числовые характеристики переменных.
контрольная работа [1,6 M], добавлен 18.06.2012Влияние девальвации национальной валюты на цены активов и процентных ставок на фондовый рынок. Анализ отраслевых взаимосвязей и закономерностей в динамике биржевых индикаторов и множества других временных рядов. Оценка моделей методом "rolling window".
дипломная работа [1,7 M], добавлен 06.11.2015Предпрогнозное исследование рядов урожайности с применением фрактального и R/S-анализа, бинарной кодировки. Расчет коэффициента Херста природных и экономических рядов. Оценка соотношения "детерминированность-стохастичность" для разных областей Украины.
курсовая работа [2,2 M], добавлен 18.09.2010Теория и анализ временных рядов. Построение линии тренда и прогнозирование развития случайного процесса на основе временного ряда. Сглаживание временного ряда, задача выделения тренда, определение вида тенденции. Выделение тригонометрической составляющей.
курсовая работа [722,6 K], добавлен 09.07.2019Структурные компоненты детерминированной составляющей. Основная цель статистического анализа временных рядов. Экстраполяционное прогнозирование экономических процессов. Выявление аномальных наблюдений, а также построение моделей временных рядов.
курсовая работа [126,0 K], добавлен 11.03.2014Расчет суммы издержек для плана выпуска продукции. Коэффициенты линейного уравнения парной регрессии. Характеристика графической интерпретации результатов. Развитие экономических процессов. Особенности эконометрического моделирования временных рядов.
контрольная работа [723,3 K], добавлен 22.02.2011