Проверка гипотезы о нормальном распределении логарифмической доходности по критерию Фроцини
Проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций. Принятие в расчет достаточного объема выборок данных. Расчет характеристик временных рядов. Оценка статистического критерия Фроцини.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 29.08.2015 |
Размер файла | 307,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Оглавление
- 1. Введение
- 2. Предварительный анализ данных
- 3. Теоретическая часть
- 3.1 Статистическая проверка гипотез
- 3.2 Статистический критерий Фроцини
- 4. Проверка гипотезы для модельных данных
- 5. Выбор альтернативной гипотезы и оценка мощности критерия
- 6. Проверка гипотез для реальных данных
- Заключение
- Список используемой литературы
- Приложения
1. Введение
Целью моей курсовой работы является проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций, входящих в индекс NASDAQ COMРUTER (IXCO) акций компаний, расположенных в Silicon Valley. Основным критерием стал критерий нормальности Фроцини. NASDAQ COMРUTER - это общий индекс NASDAQ. Он включает себя более пяти тысячи компаний. В работе присутствует 12 тикеров. В качестве временного отрезка был выбран период с 2010 по 2014 включительно.
Курсовая работа состоит из двух основных частей. Первая часть представляет собой теоретическую справку, содержащую краткое описание применяемых в работе статистических критериев и методов. Вторая часть - практическая, состоит из проверки гипотезы на модельных данных, выбора альтернативной гипотезы и проверки мощности критерия, предварительного анализа реальных данных.
Необходимо сказать, что подобное исследование является крайне актуальным в наше время. Именно критерий Фроцини дает нам возможность понять, насколько близким к нормальному является исследуемое распределение.
Основными источниками литературы, используемыми при написании работы стали "Лекции по математической статистике" А.В. Браилова [1], "Прикладная математическая статистика. Для инженеров и научных работников" А.И. Кобзаря [2]. Были изучены курсовые работы прошлых лет.
2. Предварительный анализ данных
Для того, чтобы провести проверку гипотезы о нормальности распределения дневной логарифмической доходности акций, необходим достаточный объем выборок. Данные о ценах акций взяты с сайта httр: // www.finance. yahoo.com/.
Таблица 1.
Список и наименование компаний
Тикер |
Наименование компании |
|
ADAT |
Authentidate Holding Corp. |
|
BSQR |
BSQUARE Corp. |
|
CEVA |
CEVA Inc. |
|
DRAM |
Dataram Corporation |
|
EVOL |
Evolving Systems Inc. |
|
FORTY |
Formula Systems (1985) Ltd. |
|
ISSI |
Integrated Silicon Solution Inc. |
|
MOBI |
Sky-mobi Limited |
|
ROVI |
Rovi Corporation |
|
SNDK |
SanDisk Corp. |
|
ULTI |
The Ultimate Software Group, Inc. |
|
ZIXI |
Zix Corporation |
В таблице 2 (программа 1) отражено количество дней, в которые акции торговались на бирже в период с 01.01.2010 г по 31.12.2014 г., а так же для индекса в целом.
В то же время при выборе исследуемого периода необходимо принять во внимание наличие резких скачков в ценах акций, вызванных сплитами - дроблениями или консолидациями акций, когда число находящихся в обращении акций увеличивается или уменьшается. В этих случаях номинальная стоимость акций соответственно резко уменьшается или резко увеличивается
Таблица 2.
Количество наблюдений. (Программа 1)
Тиккер/Год |
2010 |
2011 |
2012 |
2013 |
2014 |
|
ADAT |
252 |
252 |
250 |
252 |
252 |
|
BSQR |
252 |
252 |
250 |
252 |
252 |
|
CEVA |
252 |
252 |
250 |
252 |
252 |
|
DRAM |
252 |
252 |
250 |
252 |
252 |
|
EVOL |
252 |
252 |
250 |
252 |
252 |
|
FORTY |
252 |
252 |
250 |
252 |
252 |
|
ISSI |
252 |
252 |
250 |
252 |
252 |
|
MOBI |
15 |
252 |
250 |
252 |
252 |
|
ROVI |
252 |
252 |
250 |
252 |
252 |
|
SNDK |
252 |
252 |
250 |
252 |
252 |
|
ULTI |
252 |
252 |
250 |
252 |
252 |
|
ZIXI |
252 |
252 |
250 |
252 |
252 |
Также составим таблицу объёма торгов (количество проданных акций или сделок) по акциям тиккеров.
Таблица 3.
Объем торгов. (Программа 2)
Тиккер/Год |
2010 |
2011 |
2012 |
2013 |
2014 |
|
ADAT |
11768200 |
22378100 |
7458400 |
23446400 |
26247000 |
|
BSQR |
14155000 |
26566600 |
5000200 |
4244900 |
8467400 |
|
CEVA |
47396900 |
59066300 |
67559700 |
41080000 |
27279300 |
|
DRAM |
2328000 |
979700 |
525500 |
8551800 |
11316500 |
|
EVOL |
7146900 |
5566400 |
7111100 |
12393600 |
8618300 |
|
FORTY |
3096100 |
1777200 |
707200 |
560400 |
265400 |
|
ISSI |
157474800 |
62963400 |
26496600 |
29931200 |
37011300 |
|
MOBI |
13511900 |
170166000 |
37864200 |
37977400 |
163798500 |
|
ROVI |
324764500 |
457678500 |
366015900 |
252606600 |
194754200 |
|
SNDK |
2762606200 |
1858360100 |
1374798300 |
1063738300 |
916492100 |
|
ULTI |
42847600 |
54252800 |
43538000 |
42880100 |
74157700 |
|
ZIXI |
135691800 |
201009900 |
55478300 |
95933600 |
86783900 |
Как видно из таблиц 2 и 3, все исследуемые акции торговались практически непрерывно на протяжении всего рассматриваемого периода времени, кроме выходных, число торговых дней по каждому тиккеру в целом совпадает с числом торговых дней фондового индекса, и объём торгов по ним был весьма высок.
Для того, чтобы убедиться в достоверности исследуемых данных, сопоставим графики курса акций каждого тиккера и курса фондового индекса IXCO за весь рассматриваемый промежуток времени. (Программа 3)
ADAT и IXCO BSQR и IXCO
CEVA и IXCO DRAM и IXCO
EVOL и IXCO FORTY и IXCO
ISSI и IXCO MOBI и IXCO
нормальное распределение логарифмическая доходность
ROVI и IXCO SNDK и IXCO
ULTI И IXCO ZIXI и IXCO
Эта несложная проверка подтверждает достоверность исследуемых данных
Далее вычислим некоторые характеристики временных рядов.
Рассчитаем волатильность, характеризующую тенденцию рыночной цены, изменяющуюся во времени.
Тиккер/Год |
2010 |
2011 |
2012 |
2013 |
2014 |
|
ADAT |
0,05559604 |
0,06134953 |
0,04030305 |
0,05857285 |
0,04656003 |
|
BSQR |
0,04221376 |
0,04040263 |
0,03002475 |
0,02124533 |
0,02428204 |
|
CEVA |
0,02598864 |
0,03560492 |
0,02814794 |
0,02242047 |
0,02327887 |
|
DRAM |
0,04308012 |
0,0491515 |
0,06418204 |
0,07704555 |
0,04866179 |
|
EVOL |
0,01631823 |
0,01862077 |
0,02441319 |
0,02077245 |
0,02039206 |
|
FORTY |
0,02612778 |
0,02524868 |
0,01835673 |
0,01544136 |
0,02241532 |
|
ISSI |
0,04418258 |
0,03033078 |
0,02032408 |
0,01918842 |
0,01981772 |
|
MOBI |
0,03577488 |
0,07116203 |
0,04121585 |
0,05589251 |
0,0544092 |
|
ROVI |
0,01966481 |
0,03653664 |
0,03738315 |
0,02012456 |
0,02003183 |
|
SNDK |
0,03123554 |
0,02706996 |
0,02381354 |
0,0168905 |
0,01883137 |
|
ULTI |
0,01925677 |
0,02641864 |
0,01728635 |
0,0160066 |
0,02034313 |
|
ZIXI |
0,0375915 |
0,03941248 |
0,02348289 |
0,02393751 |
0,02424878 |
|
Таблица 4. Волатильность. (Программа 3) |
Рассчитаем максимальные относительные скачки цен в каждом году.
Тиккер\Год |
2010 |
2011 |
2012 |
2013 |
2014 |
|
ADAT |
0,30666667 |
0,27058824 |
0,13571429 |
0,37 |
0, 19354839 |
|
BSQR |
0,28909953 |
0,22610922 |
0,13105413 |
0,07848837 |
0,15047022 |
|
CEVA |
0,1005386 |
0,12335116 |
0,22276351 |
0,1625731 |
0,14950635 |
|
DRAM |
0,16560494 |
0,38679241 |
0,24999777 |
0,41254125 |
0,28205128 |
|
EVOL |
0,0748904 |
0,08580559 |
0,18827793 |
0,08333218 |
0,08220714 |
|
FORTY |
0,08265186 |
0,11044815 |
0,07395697 |
0,06222197 |
0,14974807 |
|
ISSI |
0,22854504 |
0,12606316 |
0,0712667 |
0,10652923 |
0,07557691 |
|
MOBI |
0,10666667 |
0,35714286 |
0,16915423 |
0,43317972 |
0,26229508 |
|
ROVI |
0,09611307 |
0,38657106 |
0,43286119 |
0,13759432 |
0,11865864 |
|
SNDK |
0,12317096 |
0,09622324 |
0,11367974 |
0,08833804 |
0,13558386 |
|
ULTI |
0,06293303 |
0,16402628 |
0,0799487 |
0,12444352 |
0,07411828 |
|
ZIXI |
0,30588235 |
0,17602996 |
0,09235669 |
0,08959538 |
0,1462585 |
|
Таблица 5. Максимальные относительные скачки. (Программа 4) |
Рассчитаем бета-коэффициент для каждого тиккера за весь промежуток времени. для того чтобы отразить изменчивость доходности ценной бумаги по отношению к доходности рынка в среднем
Тиккер |
Бета |
|
ADAT |
-0,00069004 |
|
BSQR |
-0,00058 |
|
CEVA |
-0,00275042 |
|
DRAM |
-0,00906711 |
|
EVOL |
0,00583096 |
|
FORTY |
0,01314192 |
|
ISSI |
0,00547081 |
|
MOBI |
0,00122931 |
|
ROVI |
-0,02133994 |
|
SNDK |
0,04961244 |
|
ULTI |
0,1044744 |
|
ZIXI |
0,0009905 |
3. Теоретическая часть
3.1 Статистическая проверка гипотез
Одна из основных задач математической статистики состоит в том, чтобы по реализации случайной выборки из некоторого генерального распределения проверить определенную гипотезу о виде или параметрах генерального распределения.
Таким образом, статистической гипотезой называется любое утверждение о виде или параметрах генерального распределения.
Проверка статистической гипотезы - это процесс принятия решения о том, противоречит ли рассматриваемая статистическая гипотеза наблюдаемой выборке данных.
Пусть и - две взаимоисключающие статистические гипотезы. Гипотезу назовем основной, а гипотезу - альтернативной. Как правило, в качестве базисного предположения принимается утверждение о справедливости одной из гипотез.
Статистическим критерием с критической областью называется правило, в соответствии с которым отвергается, если выборка , и принимается, если . Другими словами, статистический критерий представляет собой специально подобранную случайную величину, точное или приближенное которой известно. В свою очередь, критическая область - это совокупность значений статистического критерия, при которых нулевая гипотеза отвергается. Областью принятия гипотезы, называется совокупность значений статистического критерия, при которых нулевая гипотеза принимается.
Применение статистического критерия может привести к ошибкам двух различных типов:
· ошибка первого рода состоит в том, что отвергается верная гипотеза
· ошибка второго рода состоит в том, что отвергается верная гипотеза
Вероятность ошибки первого рода называется уровнем значимости критерия и обозначается . Вероятность ошибки второго рода обозначается , а величина называется мощностью критерия.
Необходимо отметить, что с распространением статистических программ возникает понятие, которое позволяет решить вопрос о принятии или отклонении основной гипотезы одновременно для всех уровней значимости без вычисления критических значений. Так для фиксировано реализации случайной выборки
Р-значением (Р-value) называется такое число , что для любого уровня значимости , при котором гипотеза принимается, и для любого уровня значимости , при котором гипотеза отвергается.
3.2 Статистический критерий Фроцини
Фроцини предложил простой, но достаточно мощный критерий нормальности с параметрами, оцениваемыми по выборке, основанный на статистике
Рассмотрим математическую составляющую критерия Фроцини.
Критерий Фроцини - основной статистический критерий
Критерий Фроцини является мощным критерием нормальности с параметрами, оцениваемыми по выборке, основанном на статистике
, Где, ,
,
- порядковые статистики, а - функция распределения стандартного нормального закона N (0,1).
Критерий Колмогорова - вспомогательный критерий
В качестве вспомогательного критерия по проверке равномерности распределения Р-значения основного критерия в данной работе используем критерий Колмогорова.
Критерий Колмогорова рассматривает максимальное значение модуля разности между статистической функцией распределения и соответствующей теоретической функцией распределения F (x, т.е. D = .
Следующим шагом определяется величина . По статистическим таблицам (в среде matcalc функцией рvKolm (u)) находится вероятность того, что за счет чисто случайных причин максимальное расхождение между и F (x) будет не меньше, чем фактически наблюденное. Если вероятность Р () сравнительно велика, то гипотезу следует принять, если весьма мала, то отвергнуть как неправдоподобную.
4. Проверка гипотезы для модельных данных
В качестве модельных данных используется выборка случайных величин, распределенных по нормальному закону. Это позволит нам понять, верно ли записана статистика основного критерия. Необходимо заметить, что теоретическое распределение статистики Фроцини нам неизвестно.
Для того чтобы проверить гипотезу о нормальном распределении:
1. С помощью программы "Квантали. mtc" методом Монте-Карло вычисляются квантили распределения статистики Фроцини. Результаты представлены в следующей таблице:
Таблица 7. Квантили распределения основной статистики.
Уровень |
Квантиль |
|
1 |
0,0864471 |
|
2 |
0,0901981 |
|
3 |
0,0929272 |
|
4 |
0,0943624 |
|
5 |
0,0960783 |
|
6 |
0,0977139 |
|
7 |
0,0990134 |
|
8 |
0,0997616 |
|
9 |
0,1003475 |
|
10 |
0,1011004 |
|
11 |
0,1017168 |
|
12 |
0,1021952 |
|
…………. |
(всего 999 квантилей, представлены в файле "Квантили. csv")
2. С помощью программы "Р-значения. mtc" вычисляются Р-значения и приводится их гистограмма.
Рисунок 1. Р-значения на модельных данных. (Программа 7)
Как мы можем видеть из рисунка, Р-значения распределены довольно равномерно, что позволяет говорить о том, что гипотеза о нормальности распределения модельных данных по исследуемому критерию Фроцини принимается.
3. В программе "Р-значения. mtc" производится проверка равномерности распределения Р-значения на отрезке [0; 1] по критерию Колмогорова.
В результате выполнения программы мы получаем значение 0,990255. С одной стороны, можно говорить о том, что полученное значение не в полной мере подтверждает равномерность распределения. Однако было замечено, что это напрямую связано с частотой вычисления статистики (в нашем случае - 10000 раз, при снижении - критерий Колмогорова все более стремится к единице). Поэтому равномерность, на мой взгляд, можно считать доказанной.
5. Выбор альтернативной гипотезы и оценка мощности критерия
В качестве альтернативной гипотезы выберем гипотезу о том, логарифмическая доходность имеет распределение Стьюдента. Выбор именно этого распределения мотивирован тем, что распределение Стьюдента сходится к стандартному нормальному распределению и по своей сути не должно сильно отличаться от нулевой гипотезы.
Оценим на основе 1000-кратной проверки нулевой гипотезы при верной альтернативной мощность критерия Фроцини для выбранного распределения с помощью программы "Прог8. мощность критерия. mtc". В результате работы программы мы получаем, что, например, при 5% уровне значимости мощность составит 0,766, а при 1% уровне значимости - 0,621
Таким образом, мощность критерия достаточно велика, а значит, при использовании критерия Фроцини, вероятность совершить ошибку второго рода, то есть принять неправильную гипотезу, мала.
6. Проверка гипотез для реальных данных
С помощью программы "Прог9. реальные Р-значения. mtc":
1. Вычисляются Р-значения и приводится их гистограмма.
Рисунок 2. Р-значения на реальных данных.
Очевидно Р-значения распределены неравномерно, а значит мы можем говорить о том, что гипотеза о нормальности отвергается.
2. Вычисляется доля проверок, в которых гипотеза принималась при 5% и 1% уровнях значимости. Было получено, что
· при 5% уровне значимости гипотеза принимается в 14,5% случаев
· при 1% уровне значимости гипотеза принимается в 25,5% случаев
Таким образом, нет необходимости переходить к исследованию данных за второе полугодие.
3. Вычисляются медианные Р-значения по годам и компаниям.
Таблица 8. Средние Р-значения по годам.
2010 |
2011 |
2012 |
2013 |
2014 |
|
0,090671673 |
0,092869212 |
0,094339537 |
0,095782411 |
0,097185476 |
Заключение
В данной работе была проверена гипотеза о нормальности распределения дневных логарифмических доходностей по критерию Фроцини. Полученные результаты говорят о том, что в большинстве случаев гипотеза о нормальности отвергается, несмотря на то, что для небольшого числа компаний значения статистики таковы, что можно судить о некоторой приближенности к нормальному распределению.
Вторым содержательным результатом курсовой работы является изучение критерия Фроцини, в частности, определение его мощности. Мощность критерия оказалась достаточно велика. Тем не менее, критерий, на мой взгляд, носит оценочный характер, указывая нам, насколько близко распределение к нормальному.
Стоит отметить, что в ходе написания курсовой были осуществлены все цели и задачи, которые ставились изначально. Наибольших затрат времени потребовало выполнение программы "Р-значения. mtc". Однако мы не имеем возможность сравнивать эффективность, так как в курсовых прошлых лет отсутствует любая информация о времени выполнения программ.
Что касается новизны курсовой работы, то можно выделить ряд особенностей:
· во-первых, в предварительном анализе данных моей работы были наглядно представлены сплиты акций, возникшие в графиках цены Adj Close у ряда компаний (которые, как правило, были затем исключены из исследования);
· во-вторых, модельные данные создавались по иному принципу, нежели в курсовых прошлых лет, что вероятно позволило повысить эффективность;
· в-третьих, качественно иным способом рассчитывались Р-значения;
· в-четвертых, курсовые прошлых лет не содержали оценки мощности критерия Фроцини.
В целом, проверка гипотезы о нормальности распределения дневных логарифмических доходностей с помощью критерия Фроцини дает прежние результаты. Гипотеза отвергается, а значит реальные данные, представленные котировками акций, входящих в известный индекс, не могут быть в полной мере соотнесены с нормальным распределением.
Список используемой литературы
1. Браилов А.В. Лекции по математической статистике. М.: Финакадемия, 2007.172 с.
2. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. М.: ФИЗМАТЛИТ, 2006. - 816 с.
5. Ригин А. Курсовая работа "Проверка гипотезы о нормальном распределении
логарифмической доходности по критерию Фроцини", 2009
6. Казарян А. Курсовая работа "Проверка гипотезы о нормальном распределении логарифмической доходности по критерию Фроцини", 2009
7. httр: // finance. yahoo.com/
Приложения
Приложение 1. Характеристика компьютера
Тип ЦП: DualCore Intel Pentium E5200, 2500Mhz (12.5 x 200)
Тактовая частота: 2500 МГц
Частота системой шины: 800 МГц
Объемы КЭша 2ого уровня (Кэш L2): 2Мб (On-Die, ECC,ASC,Full-Speed)
Приложение 2. Время выполнения программ
Название программы |
Время выполнения |
|
"Количество наблюдений" |
1,1 с |
|
"Объем торгов" |
1,1 с |
|
"График акций и индекса" |
9,1 с |
|
"Волатильность" |
1,2 с |
|
"Максимальные относительные скачки" |
1,3 с |
|
"Бета-коэффициент" |
0,234 с |
|
"Квантили" |
5,6 с |
|
" P-значения для модельных данных" |
0,456 с |
|
"Мощность критерия" |
0,875 с |
|
"Реальные Р-значения" |
1,8 с |
|
"Средние значения по годам" |
0,78 с |
Приложение 3. Коды программ
1." Количество наблюдений. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 1,1 секунда
Tikkery= ["ADAT"; "BSQR"; "CEVA"; "DRAM"; "EVOL"; "FORTY"; "ISSI"; "MOBI"; "ROVI"; "SNDK"; "ULTI"; "ZIXI"];
Years= [2010: 2014];
ND=super (12,5);
for (i in 1: 12)
{
for (j in 1: 5)
{
d1=date (Years (j),01,01);
d2=date (Years (j),12,31);
I0=loaddaily (d1,d2,Tikkery (i) +". csv","CLOSE");
I=select (I0, I0>0);
ND (i,j) =#I;
}
}
T1= ["Тиккер/Год",'Years; Tikkery,ND];
savetable (T1,"Таб2. Количество_наблюдений. csv");
2. "Объёмы торгов. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 1,1 секунда
Tikkery= ["ADAT"; "BSQR"; "CEVA"; "DRAM"; "EVOL"; "FORTY"; "ISSI"; "MOBI"; "ROVI"; "SNDK"; "ULTI"; "ZIXI"];
Years= [2010: 2014];
Volume=super (12,5);
for (i in 1: 12)
{
for (j in 1: 5)
{
d1=date (Years (j),01,01);
d2=date (Years (j),12,31);
V0=loaddaily (d1,d2,Tikkery (i) +". csv","VOLUME");
V=select (V0,V0>0);
Volume (i,j) =sum (V);
}
}
T1= ["Тиккер/Год",'Years; Tikkery,Volume];
savetable (T1,"Таб3. Объёмы_торгов. csv");
3. "Графики акций и индекса. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 9,1 секунда
Tikkery= ["ADAT"; "BSQR"; "CEVA"; "DRAM"; "EVOL"; "FORTY"; "ISSI"; "MOBI"; "ROVI"; "SNDK"; "ULTI"; "ZIXI"];
d1 = date (2010,1,1);
d2 = date (2014,12,31);
IXCO=loaddaily (d1,d2,"IXCO. csv","CLOSE");
for (i in 1: 12)
{
I0=loaddaily (d1,d2,Tikkery (i) +". csv","ADJ CLOSE");
IXCOs=select (IXCO, IXCO>0 & I0>0);
I=select (I0, I0>0 & IXCO>0);
wintitle (Tikkery (i) +" и IXCO");
axes ();
line (1: #IXCOs, IXCOs,green);
line (1: #I, I,red);
show ();
erase ();
}
4. "Волатильность. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 1,2 секунда
Tikkery= ["ADAT"; "BSQR"; "CEVA"; "DRAM"; "EVOL"; "FORTY"; "ISSI"; "MOBI"; "ROVI"; "SNDK"; "ULTI"; "ZIXI"];
Years= [2010: 2014];
V=super (12,5);
for (i in 1: 12)
{
for (j in 1: 5)
{
d1=date (Years (j),01,01);
d2=date (Years (j),12,31);
I0=loaddaily (d1,d2,Tikkery (i) +". csv","ADJ CLOSE");
I=select (I0, I0>0);
V (i,j) =stdev (ret (I));
}
}
T1= ["Тиккер/Год",'Years; Tikkery,V];
savetable (T1,"Таб5. Волатильность. csv");
5. "Макс. относительные скачки цен. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 1,3 секунда
Tikkery= ["ADAT"; "BSQR"; "CEVA"; "DRAM"; "EVOL"; "FORTY"; "ISSI"; "MOBI"; "ROVI"; "SNDK"; "ULTI"; "ZIXI"];
Years= [2010: 2014];
S=super (12,5);
for (i in 1: 12)
{
for (j in 1: 5)
{
d1=date (Years (j),01,01);
d2=date (Years (j),12,31);
I0=loaddaily (d1,d2,Tikkery (i) +". csv","ADJ CLOSE");
I=select (I0, I0>0);
S (i,j) =max (abs (ret (I)));
}
}
T1= ["Тиккер\Год",'Years; Tikkery,S];
savetable (T1,"Таб4. Макс_относительные_скачки_цен. csv");
6. "Квантили. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 5,6 секунда
nl=nlaw (0,1);
n=247;
N=10000;
setmaxdim (2*N);
B=0 (N);
for (i in 1: N)
{
Ob=nlaw (0,0.01) (n);
M=mean (Ob); S=stdev (Ob);
x=sort (Ob);
z= (x-M) /S;
B (i) =1/ (n^ (1/2)) *sum (abs (nl. pl (z) - ( (1: n) - 0.5) /n));
}
m=1000;
EL=elaw (B);
Q=EL. invpl (1/m: (m-1) /m: 1/m);
savetable (Q, "Таблица7. Квантили Фроцини. csv");
7. "P-значения для модельных данных. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 0,456 секунд
n1=nlaw (0,1);
N=1000;
n=247;
PV=0 (N);
Q=loadvector ("Таб7. Квантили Фроцини. csv");
for (i in 1: N)
{
Ob=nlaw (0,0.01) (n);
M=mean (Ob); S=stdev (Ob);
x=sort (Ob);
z= (x-M) /S;
b=1/ (n^ (1/2)) *sum (abs (n1. pl (z) - ( (1: n) - 0.5) /n));
PV (i) =elaw (Q). pg (b);
}
hist (PV. intfr (0: 1: 0.1),green); // гистограмма Р-значений
axes ();
// проверка равномерности Колмогорова
Pt=0: 1: 0.001;
d=maxabs (elaw (PV). pl (Pt) - ulaw (0,1). pl (Pt));
pvk=pvKolm (d*n^ (1/2));
wintitle ("pvKolm= " + pvk);
savetable (PV,"P-значения для модельных данных. csv");
8. "Мощность критерия. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 0,875 секунда
alpha1=0.01;
alpha5=0.05;
alpha20=0.2;
nl=nlaw (0,1);
n=247;
pow1=0; pow5=0; pow20=0;
N=1000;
Q=loadvector ("Таблица7. Квантили Фроцини. csv ");
for (i in 1: N)
{
Ob=tlaw (5) (n);
M=mean (Ob); S=stdev (Ob);
x=sort (Ob);
z= (x-M) /S;
b=1/ (n^ (1/2)) *sum (abs (nl. pl (z) - ( (1: n) - 0.5) /n));
PV=elaw (Q). pg (b);
if (PV<alpha1) pow1=pow1+1;
if (PV<alpha5) pow5=pow5+1;
if (PV<alpha20) pow20=pow20+1;
}
Power = ["0.01", "0.05", "0.2"; pow1/N, pow5/N, pow20/N];
savetable (Power, "Мощность критерия Фроцини. csv");
9. "Проверка на реальных данных. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 1,1 секунда
Tikkery= ["ADAT"; "BSQR"; "CEVA"; "DRAM"; "EVOL"; "FORTY"; "ISSI"; "MOBI"; "ROVI"; "SNDK"; "ULTI"; "ZIXI"];
d=' [date (2010,01,01);
date (2010,05,27);
date (2010,10,21);
date (2011,03,17);
date (2011,08,10);
date (2012,01,04);
date (2012,05,31);
date (2012,10,21);
date (2013,03,21);
date (2013,08,14);
date (2014,01,08);
date (2014,06,03);
date (2014,10, 20)];
rez=super (12,12);
Cr1=0.987; Cr2=0.998;
Norm=nlaw (0,1);
for (j in Tiсker) {
for (i in 1: 12) {
I0 = loaddaily (d (i),d (i+1) - 1,j+". csv","Adj Close");
I = select (I0, I0>0);
if (#I >99) {
R = dif (ln (I));
P = sort (R);
nu = 1: 100;
m = (nu-0.375) /100.365;
M = Norm. invpl (m);
r = sum (M*P) / (sum (M^2) *sum ( (P-mean (P)) ^2)) ^0.5;
if (r>Cr1 & r<Cr2) rez (j. num, i) = "YES";
else rez (j. num, i) = "NO";
}
}
}
T= [Tiker,rez];
savetable (T,"Рис2. Проверка_реальные_данные. csv");
10. "Средние P-значения по годам. mtc"
// Баркинхоев С-Ахмед 2015
// время выполнения: 2,1 секунда
Tikkery= ["ADAT"; "BSQR"; "CEVA"; "DRAM"; "EVOL"; "FORTY"; "ISSI"; "MOBI"; "ROVI"; "SNDK"; "ULTI"; "ZIXI"];
Year=2010: 2014;
q=0 (#Tickers,#Year); // матрица п-значений
sr=0 (#Year); // столбец средних значений
for (Name in Tickers)
{
y=loadvector ("Таблица7. Квантили Фроцини. csv"); // загрузка данных из файла
for (i in 1: 5)
{
q (Name. num, i) =y (i); // данные из вектора записываем в матрицу
}
}
q='q; // транспонируем матрицу
for (i in 1: 5)
{
for (Name in Tickers)
{
sr (i) =sr (i) +q (i,Name. num); // суммы п-значений по годам
}
}
for (i in 1: 5)
{
sr (i) =sr (i) /10;
}
e= ['Year; 'sr];
savetable (e,"Таб8. Средние p-значения по годам. csv");
Размещено на Allbest.ru
Подобные документы
Статистические методы анализа одномерных временных рядов, решение задач по анализу и прогнозированию, построение графика исследуемого показателя. Критерии выявления компонент рядов, проверка гипотезы о случайности ряда и значения стандартных ошибок.
контрольная работа [325,2 K], добавлен 13.08.2010Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Общие понятия статистической проверки гипотез. Проверка гипотез на основе выборочной информации, понятие нулевая и альтернативная гипотезы. Формулировка общего алгоритма проверки. Проведение проверки статистической гипотезы в системе "Minitab" и MS Excel.
методичка [741,9 K], добавлен 28.12.2008Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.
лабораторная работа [234,7 K], добавлен 28.02.2010Статистический анализ курса Центрального банка валютной пары евро/рубль, построение соответствующих гистограмм. Выполнение описательной статистики выборочных данных, проверка гипотезы о нормальном распределении, равенстве средних и равенстве дисперсий.
курсовая работа [2,5 M], добавлен 08.07.2015Проверка гипотезы на наличие тенденции. Обоснование периода упреждения прогноза. Выбор оптимальной прогнозной модели по коэффициенту детерминации. Получение точечного и интервального прогноза. Расчет параметров линейной и экспоненциальной моделей.
реферат [567,8 K], добавлен 30.09.2014Понятие доверительного интервала и доверительной вероятности. Доверительный интервал для математического ожидания (пример задачи). Распределение Стьюдента. Принятие решения о параметрах генеральной совокупности, проверка статистической гипотезы.
реферат [64,9 K], добавлен 15.02.2011Понятие нулевой и альтернативной гипотез. Обычная процедура принятия решений. Область принятия гипотезы. Гипотетическое распределение, область принятия и распределения в действительности. Области и вероятность совершения ошибки при принятии решения.
презентация [61,3 K], добавлен 20.01.2015Построение схемы сети. Расчет интенсивностей входных потоков для каждой СМО. Проверка стационарности сети. Модель сети на языке моделирования GPSS. Сравнение расчетных и экспериментальных данных по критерию Стьюдента. Проверка адекватности модели.
контрольная работа [94,6 K], добавлен 28.07.2013Структурные компоненты детерминированной составляющей. Основная цель статистического анализа временных рядов. Экстраполяционное прогнозирование экономических процессов. Выявление аномальных наблюдений, а также построение моделей временных рядов.
курсовая работа [126,0 K], добавлен 11.03.2014