Анализ моделей оценки вероятности банкротства кредитных организаций
Выбор публичных показателей для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков. Обзор моделей прогнозирования банкротства кредитных организаций.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 30.06.2017 |
Размер файла | 1,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
126
Размещено на http://www.allbest.ru/
Оглавление
- Введение
- Глава 1. Исследование предметной области
- 1.1 Обзор моделей прогнозирования банкротства
- 1.1.1 Z-модель Альтмана
- 1.1.2 Logit-модель
- 1.1.3 Data Envelopment Analysis
- 1.1.4 Метод распознавания признаков
- 1.2 Типы нейронных сетей и способы уменьшения ошибки
- 1.2.1 Персептроны
- 1.2.2 Ассоциативная память
- 1.2.3 Свёрточные нейронные сети
- 1.3 Выбор факторов, влияющих на банкротство российских банков
- 1.3.1 Показатели, указанные в банковской отчётности
- 1.3.2 Макроэкономические показатели
- 1.3.3 Формирование и оптимизация вводных показателей
- Глава 2. Проектирование информационной системы
- 2.1 Разработка бизнес-модели приложения
- 2.1.1 Требования к системе
- 2.1.2 Диаграммы прецедентов
- 2.1.3Диаграммы деятельности
- 2.1.4 Модель базы данных
- 2.2 Разработка пользовательского интерфейса
- Глава 3. Проектирование нейронной сети
- 3.1 Первая модель со смешанными параметрами
- 3.2 Проектирование и обучение модели
- 3.3 Оценка значимости показателей
- 3.4 Эксперимент с исключением показателей
- 3.5 Эксперимент с расширением выборки
- 3.6 Вторая модель с макроэкономическими показателями
- 3.7 Влияние изменения показателей на прогнозируемый результат
- 3.8 Эксперимент с исключением показателей
- 3.9 Третья модель с показателями ликвидности
- 3.10 Проектирование и обучение модели
- 3.11 Оценка значимости показателей
- 3.12 Объединение результатов действия моделей
- 3.13 Обоснование использования результатов моделей
- 3.14 Применение результатов прогнозирования моделей
- Заключение
- Библиографический список
- Приложение А. Макроэкономические параметры
- Приложение Б. Пример собранной отчётности
- Приложение В. Техническое задание
- Приложение Г. Формула второй модели
- Приложение Д. Формула третьей модели
- Приложение Е. Листинг программы
Введение
Очень важное место в российской экономике занимает банковский сектор, общая деятельность которого строго регулируется, а частные нарушения отдельных кредитных организаций подлежат наказанию и отзыву их лицензий. Однако, на данный момент, практически каждую неделю какая-нибудь кредитная организация теряет возможность продолжать свою деятельность из-за банкротства. Во многих случаях это происходит из-за недостаточного капитала, рискованных вложений или необдуманных решений, но, иногда, проблемы, с которыми сталкиваются банки, менее очевидны.
"Кредитная организация считается неспособной удовлетворить требования кредиторов по денежным обязательствам, о выплате выходных пособий и (или) об оплате труда лиц, работающих или работавших по трудовому договору, и (или) исполнить обязанность по уплате обязательных платежей, если соответствующие обязанности не исполнены ею в течение четырнадцати дней после наступления даты их исполнения и (или) стоимость имущества (активов) кредитной организации недостаточна для исполнения ее обязательств перед кредиторами и (или) обязанности по уплате обязательных платежей." - Статья 189.8 в редакции от 29.06.2015 №186-ФЗ [1].
Однако, помимо организаций, лишённых лицензии вследствие собственно банкротства, в данной работе также рассматриваются ликвидированные банки и банки, в данный момент функционирующие, но подверженные риску.
За последние полвека, по запросу различных кредитных организаций или в рамках собственного исследования, было разработано множество систем, которые могут указать на конкретные недостатки того или иного банка, однако это не спасает современные кредитные организации. Прямо сейчас потенциальной инновацией в оценке вероятности банкротства может оказаться машинное обучение, которое может, оперируя большим количеством изменяющихся данных, предсказать будущее поведение банка и его риск ликвидации или потери лицензии.
Только за последний год эта участь постигла более сотни кредитных организаций по всей России, девять из которых были в списке ста крупнейших российских банков. Эти девять банков были многообещающими, и их состояние казалось полностью здоровым, но подобные случаи не должны оставаться неожиданными - наверняка существовали какие-то показатели, которые можно было учесть и по ним предсказать риск банкротства.
Вопрос оценки вероятности банкротства широко освещён в литературе, наиболее ранние модели освещены ещё в конце шестидесятых годов прошлого века У. Бивером и Э. Альтманом. Крайне широко эта тема раскрыта в работах зарубежных авторов: А. Клэра и Р. Пристли, Ж. Колари, М. Капуто и Д. Вагнера, П. Майера и Х. Пайфера.
Также, исследованием причин нарушения финансовой устойчивости кредитных организаций занимались и в России, и в работе Ланина и Веннета можно обнаружить различные причины банкротства. Помимо этих исследователей среди российских авторов, банкротство изучали Головань С.А., Карминский А.М., Копылов А.В., Пересецкий А.А., Евдокимов А.М. и прочие.
Данная работа рассматривает различные модели оценки вероятности банкротства на примере как обанкротившихся, так и всё ещё функционирующих российских кредитных организаций, и применяет их с использованием технологий машинного обучения для нахождения новых факторов, влияющих на отзыв лицензии и предупреждения новых случаев банкротства.
Целью данной работы является проектирование нейросети, способной оценивать вероятность банкротства кредитной организации на основе публичных сведений, а также разработка WEB-приложения, через которое будет реализован функционал конечной информационной системы. Для достижения этих целей необходимо решить несколько задач:
· изучить ранее использованные модели прогнозирования банкротства банков, собрать данные о текущем состоянии банковского сектора России в целом и банков в частности и выбрать ряд параметров, с использованием которых будет производиться машинное обучение;
· исследовать возможности машинного обучения, применимые в данной области, подготовить данные для обучения и тестирования модели, обучить модель, протестировать её, оценить качество и найти оптимальный горизонт прогнозирования;
· провести эксперименты по выявлению значимости показателей и влиянию отдельных показателей на результат, разработать модель информационной системы;
· выбрать необходимые для реализации функционала инструменты;
· разработать базу данных для хранения сведений и результатов работы нейронной сети;
· разработать сборщик данных для получения новых сведений;
· разработать и применить пользовательский интерфейс в форме WEB-приложения;
· включить в приложение возможности сборщика данных, их хранения и обработки.
В первой главе данной работы выполняются задачи анализа предметной области прогнозирования банкротства кредитных организаций, поиска и обзора существующих математических моделей прогнозирования и проведённых ранее исследований. Помимо этого, совершается выбор публичных показателей, которые впоследствии можно использовать для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков.
Рассматриваются как внутренние показатели - нормативы ликвидности - так и внешние, относящиеся к экономике страны в целом и банковскому сектору в частности. После сбора информации проводится предварительная подготовка данных для выявления неполных и ненадёжных сведений.
Во второй главе данной работы описан процесс проектирования информационной системы в форме WEB-приложения, синтаксического анализатора для сбора данных, базы данных и прогнозирующей системы. Также рассмотрены требования, выдвигаемые к системе, и описаны действия системы в различных ситуациях в форме диаграмм прецедентов (UseCase) и деятельности (activity). Для администратора выдвинуты рекомендации по использованию системы.
Помимо этого, описан пользовательский интерфейс системы и различные страницы, которые пользователь может посетить в зависимости от его действий.
В третьей главе рассказывается об экспериментах, проведённых со статистическими данными, приводятся доводы и выводы, которые можно сделать из этих экспериментов. Также в ней приводится логика прогнозирования, которую можно вывести из действия сетей и демонстрируется результат их работы. В конце главы находятся рекомендации о том, как следует интерпретировать этот результат.
Глава 1. Исследование предметной области
1.1 Обзор моделей прогнозирования банкротства
Первый взгляд на проблему прогнозирования банкротства бросил в своём исследовании Уильям Бивер в 1966 году. [2] Он применил t-критерий Стьюдента для сравнения фирм как держателей активов, а наборы данных при сравнении являлись собственно наборами активов. Сравнение показывало, могут ли активы этих фирм быть исчерпанными в краткосрочном периоде, а также, в какую из сравнимых организаций следует вкладывать собственные средства.
1.1.1 Z-модель Альтмана
В скором времени, в 1968 году, была предложена идея гораздо более широкого анализа. Эдвард Альтман применил ранее уже существовавший множественный дискриминационный анализ, ранее использовавшийся в биологии и бихевеоризме. "МДА - это метод, используемый для классификации наблюдений по двум или нескольким априорным группам в зависимости от индивидуальных характеристик наблюдения, удобный в том случае, когда необходимо качественное, а не количественное объяснение" [3].
Вместо того, чтобы проверять по-отдельности каждую независимую переменную, МДА позволяет одновременно анализировать ряд переменных. Альтман в качестве этого ряда выбрал финансовые показатели: оборотный капитал, нераспределённая прибыль, EBIT, продажи - делёные на активы - и собственный капитал, делёный на обязательства. Эти параметры образовали модель, известную как (1) пятифакторная Z-модель Альтмана.
Платежеспособные и стабильные предприятия набирают более трёх баллов, менее стабильные - от двух до трёх, и результат ниже 1.81 предполагает восьмидесятипроцентный шанс банкротства в течение двух лет.
Точность прогноза в этой модели на горизонте одного года составляет 95%, на два года - 83%, что является ее достоинством.
Тем не менее, в процессе создания, применения и тестирования моделей прогнозирования финансовой устойчивости предприятий и кредитных организаций по всему миру, построенных с использованием МДА, были обнаружены недостатки этого метода, к сожалению, не позволяющие использовать его с полной точностью и эффективностью. Такие модели неспособны, в том числе, дать вероятностную оценку в виде некоего числа, а только определяют качественную степень - как низкую, высокую и очень высокую.
Эти и другие недочёты используемых моделей привели в результате к скорому отказу от использования моделей оценки степени неустойчивости финансового положения и вероятности банкротства предприятий, основанных на МДА. Всё больше внимания, в свою очередь, получали более современные инструменты финансового менеджмента, в том числе, модели, построенные на логистической регрессии, позднее ставшие известными как logit-модели.
1.1.2 Logit-модель
Logit-модель подвергалась дальнейшему исследованию и применялась в разработках С.А. Головань, А.М. Карминского, А.В. Копылова и А.А. Пересецкого [4]. Данная работа интересна тем, что авторы в первую очередь разделили российские банки на кластеры и для каждого из них строили свою модель оценки финансовой устойчивости. Разбиение позволило проверить структурную неоднородность рассматриваемых кредитных организаций и отличить воздействие одних и тех же факторов на результат - вероятность банкротства различных кластеров. Однако, однозначно лучшего способа разделить предприятия на кластеры нет. В рассматриваемой работе предлагается два варианта разбиения: на основе экспертного подхода и с использованием формального алгоритма построения функции максимального правдоподобия.
В качестве критериев разбиения были выбраны следующие показатели:
· валюта баланса, характеризующая размер банка;
· отношение суммы вложений в государственные долговые обязательства к валюте баланса;
· отношение общей суммы кредитов нефинансовым организациям к валюте баланса, что отражает вовлеченность банка в кредитование реального сектора;
· отношение собственного капитала к валюте баланса, показывающее способность банка покрыть возможные убытки.
Каждая из выделенных категорий является основой для формирования двух кластеров - с высоким и низким значением соответствующего показателя.
Выделение кластеров в исходной выборке позволило более детально и более глубоко изучить взаимосвязи в кластерах, характерные для отдельных видов кредитных организаций, однако также показало, что существуют и параметры, присущие различным кластерам и даже всем кластерам одновременно. К таким параметрам можно отнести:
· долю ликвидных активах в активах кредитной организации;
· размер собственного капитала;
· размер резервов, установленных с учётом возможных потерь.
Несмотря на различия, обе этих модели - logit и z-модель - являются параметрическими. Из немногих же непараметрических методов следует выделить Data Envelopment Analysis и Trait Recognition. Первый был описан Абрахамом Чарнсом в 1978 году, а второй привнесён в экономику из геологии Джеймсом Колари в 2002.
нейронная сеть банкротство банк
1.1.3 Data Envelopment Analysis
DEA - анализ среды функционирования или оболочечный анализ данных - это статистическая модель, основанная на методах линейного программирования и позволяющая сравнивать объекты по уровню их технической эффективности. Анализ среды функционирования применяется для сравнения сложных социальных, финансовых и технических систем.
Для того, чтобы не сравнивать каждую систему в группе попарно, строится граница эффективности путем оптимизации выпуска на основе входящих и исходящих показателей. В исследованиях, направленных на прогнозирование банкротства, используется понятие обратной эффективности или неустойчивости, и строится граница банкротства. Банки-банкроты лежат на границе или выше неё, а не банкроты - под ней.
Особенным в процессе применения этой модели является возможность предоставления конкретных рекомендаций по изменению входящих и исходящих параметров для снижения вероятности банкротства. Тем не менее, присутствует и существенный изъян, который делает эту модель крайне специфичной и сложной к абстрагированию. Дело в том, что при сборе сведений для модели зачастую требуется доступ к весьма детальной внутренней информации относительно финансовой деятельности кредитных организаций и бизнес-процессах на производстве.
Так, например, Э. Грифел-Татье и К. Ловелл при исследовании испанских банков рассмотрели такие показатели, как число выписанных чеков, число операций по кредитам, число открытых депозитов и прочее [5]. Во многих других исследованиях упоминаются сложности, связанные с использованием этого метода, требующего часто недоступную информацию, поэтому он зачастую не может быть применим.
В исследовании Кошелюка Ю.М. [6] также применялось собственное решение о разделении показателей. Выбор о том, в какую группу - входную или выходну - отнести какие показатели, был сделан на основании того, к пассивной или к активной стороне баланса они принадлежат. В итоге, в качестве входных параметров были использованы источники средств банка, такие как:
· средства юр. лиц;
· средства физ. лиц;
· полученные межбанковские кредиты;
· объем собственных средств банка.
В качестве выходов были использованы такие показатели, как объем работающих активов и фактически полученная прибыль.
Несмотря на то, что в упомянутом исследовании DEA позволил получить удобные для интерпретирования выводы и для современного исследования кредитных организаций давал верные рекомендации, прогнозы, сделанные в этом исследовании в 2005 году, на 2017 год оказались верными на 73% для банков, признанными используемым методом "успешными", и лишь на 36% для признанных "неэффективными".
1.1.4 Метод распознавания признаков
Trait recognition или метод распознавания признаков был изменён и абстрагирован для того, чтобы его можно было применять для любой отрасли. Идея в основании этого метода заключается в выделении двух групп среди исследуемых сущностей, количественном описании многочисленных сочетаний переменных, определяющих эти сущности и выделении тех, которые наиболее часто и эксклюзивно встречаются в каждой группе [7].
Если какая-то переменная встречается только в одной группе, она считается характерной чертой этой группы, если встречается в обеих, но в одной чаще, а в другой - реже, то она считается характерной чертой той группы, в которой встречается чаще, а если же переменная равномерно соответствует обеим группам, то она считается преобладающей характерной чертой выборки.
Однако, необходимо всё же определить для начала, каким образом распределять переменные. Их отбор происходит с помощью выделения критических значений так, чтобы в нижний сегмент попадали только успешные банки, а в верхний - только банки-банкроты. После этого составляется ряд двоичных значений для каждой переменной каждого - в данном случае - банка, а дальше рассматривается, какие значения характерны для каких банков.
Для повышения точности этого метода рекомендуется придавать веса значениям в соответствии с количеством банков-банкротов, соответствующие переменные которых приняли подобные значения. Таким образом, двоичная ячейка значения для переменной, которая характерна только для обанкротившихся банков, примет вес 1, а для переменной, которая характерна для 40% банков-банкротов и 60% успешных банков - значение 0.4.
Подобное решение, с расстановкой весов и выбором двоичных значений для переменных, идеально подходит для использования в технологиях машинного обучения, так как позволяет выделить массив переменных и заранее подсказать машине, какие из них будут наиболее важными для неё.
Хорошим примером использования подобной методики также будет распознавание полноты и неполноты данных. Вследствие небрежного отношения ряда банков к отчётности, рассмотренной далее, многие списки нормативов не были заполнены, а на месте данных, которые следовало подать в отчёт, стояли нули.
1.2 Типы нейронных сетей и способы уменьшения ошибки
Для того, чтобы понять возможности организмов к распознаванию чувств, обобщению, запоминанию и мышлению, необходимо в первую очередь ответить на три фундаментальных вопроса.
1. Каким образом информация об окружении выявляется системой?
2. В какой форме информация сохраняется?
3. Каким образом сохранённая информация влияет на поведение?
В попытке ответить на три этих вопроса, исследуя действия нервной системы с использованием формальной логики, ещё в середине двадцатого века [8] были описаны первые нейронные сети. В самой простой форме, в первой модели обучения с учителем, они были представлены персептронами.
1.2.1 Персептроны
Основной задачей персептронов является обработка сигналов. Получая на входе множество внешних стимулов , персептрон пытается отнести их корректно к одному из двух классов, адаптируя свои синаптические веса итеративно. В общем случае, все сигналы выделяются, как точки на плоскости, разделённой на два участка прямой b. Все точки выше этой прямой относятся к первому классу, а все точки, лежащие ниже её - ко второму, таким образом, что . Для корректного функционирования персептрону необходимо, чтобы эти классы были линейно-разделимыми [9].
Персептроны относятся к нейронным сетям прямого распространения, и обычно обучаются по методу обратного распространения ошибки, в котором сеть получает множества входных и выходных данных. Вышеупомянутая ошибка является разницей между вводом и выводом. Если у сети есть достаточное количество скрытых нейронов, она теоретически способна смоделировать взаимодействие между входным и выходными данными.
1.2.2 Ассоциативная память
Дальнейшим развитием нейронных сетей стали сети с ассоциативной памятью. В основе функционирования таких сетей также лежит итеративный принцип работы. Циркуляция информации в нейронной сети происходит до тех пор, пока не установится состояние равновесия, т.е. значения её выходов перестанут изменяться.
Хопфилд [10] ввел понятие энергии сети. Главное свойство функции энергии состоит в том, что в процессе эволюции состояний сети она уменьшается и достигает локального минимума - аттрактора, в котором сохраняет постоянное значение. Подобная сеть имеет уже как несколько вводов, так и несколько выводов. Все возможные состояния этой сети можно описать как поверхность с изрезанным холмами и лощинами рельефом, где каждая точка соответствует сочетанию нейронов, а высота этой точки - энергии сети для этого сочетания. Для массива входных нейронов x, массива выводов y и массива весов w, принцип действия этой сети можно описать как (2)
причём хранимые в сети данные являются аттракторами или локальными минимумами энергии в этой сети. Таким образом, сеть должна восстанавливать образ по его части, или очищать образы от шума. Структуру этой сети (рис.1) можно представить в виде бутылочного горлышка или песочных часов.
Рисунок 1.1 Структура сети с ассоциативной памятью.
1.2.3 Свёрточные нейронные сети
Используя возможности распознавания и запоминания, дальнейшие разработки двинулись в сторону многослойных сетей. В абстрактном примере, архитектура подобной сети включает в себя матрицу весов, предопределённую для поиска каких-либо последовательностей и паттернов, либо определяемую во время работы сети, в случае, если та ищет паттерны самостоятельно.
Эта матрица называется ядром свёртки. Сама же свёртка - это процесс продвижения ядра по всему входному массиву с последующим формированием следующего слоя - первой карты признаков. Это возможно потому, что ядро, имя заданные веса, отмечает, в какие места входного массива наиболее им соответствовали.
Над картой признаков проводится операция субдискретизации или предвыборки. Считается, что наличие или отсутствие признака во входном массиве важнее его точных координат, а потому из нескольких соседних результатов действия нейронов ядра свёртки на первой карте признаков выбираются максимальные и переносятся на следующий слой.
Постепенно, после нескольких повторяющихся операций свёртки и предвыборки, входной массив данных превращается в массив карт признаков с минимальным набором данных на каждой карте, максимально абстрагированным от оригинального массива параметров, либо даже в набор абстрактных параметров между нулём и единицей, соответствующим разным участкам исходного массива. Эти данные в последующем сами формируют массив последнего слоя - полносвязной нейронной сети прямого распространения, которая в свою очередь, по ним определяет характеристики исходного массива.
Обучение таких сетей проводится с использованием ассоциативной памяти - для свёрточного слоя - и методом обратного распространения ошибки для финального, полносвязного слоя.
1.3 Выбор факторов, влияющих на банкротство российских банков
Необходимо уточнить, что в данной работе под банкротством понимается факт отзыва лицензии по любому основанию, будь то недостаточный капитал, размер собственных средств ниже значения уставного капитала, невозможность удовлетворить требования кредиторов или неисполнение законов и нормативных актов, однако используемые методики призваны выделить именно те кредитные организации, лицензия которых была отозвана вследствие финансовых ошибок.
1.3.1 Показатели, указанные в банковской отчётности
Способность банка обеспечить свои обязательства можно оценить по нормативам ликвидности [11], указываемым банками в форме ежемесячной отчётности 0409135, предоставляемой Центральному Банку РФ, а способность банка получать средства - по рентабельности активов, которую можно рассчитать из ежеквартальной формы 0409102 и ежемесячной 0409101.
Помимо этого, с возможностями машинного обучения разумно использовать метод распознавания признаков, с помощью которого можно по-отдельности оценить влияние каждого признака и их изменений на протяжении времени существования банка, на состояние банка на данный момент.
В форме 102 указывается ежемесячная прибыль банка (в позиции "Входящие остатки "итого", тыс. руб. "), а в форме 101 ежеквартальная прибыль (в позиции "Исходящие остатки "итого", тыс. руб. "). Используя также информацию о собственных средствах, полученных из формы 0409123, можно рассчитать показатель рентабельности банковских активов.
Всю необходимую информацию о ликвидности можно получить из формы 135, в которой банки предоставляют Центральному Банку данные о соответствии установленным нормативам.
1. Н1.0 - достаточность собственных средств (капитала) банка. Н1.0 определяется как отношение размера собственных средств (капитала) банка к сумме его активов (за вычетом сформированных резервов на возможные потери и резервов на возможные потери по ссудам, ссудной и приравненной к ней задолженности, взвешенных по уровню риска.
Его минимальное значение 8%.
2. Н1.1 - достаточность базового капитала банка.
Его минимальное значение 4,5%.
3. Н1.2 - достаточность основного капитала банка.
Его минимальное значение 6%.
4. Н2 - мгновенная ликвидность. Регулирует (ограничивает) риск потери банком ликвидности в течение одного операционного дня и определяет минимальное отношение суммы высоколиквидных активов банка к сумме обязательств (пассивов) банка по счетам до востребования, скорректированных на величину минимального совокупного остатка средств по счетам физических и юридических лиц до востребования.
Его минимальное значение 15%.
5. Н3 - текущая ликвидность - соотношение между активами и обязательствами сроком до 30 дней. Регулирует (ограничивает) риск потери банком ликвидности в течение ближайших к дате расчета норматива 30 календарных дней и определяет минимальное отношение суммы ликвидных активов банка к сумме обязательств (пассивов) банка по счетам до востребования и со сроком исполнения обязательств в ближайшие 30 календарных дней, скорректированных на величину минимального совокупного остатка средств по счетам физических и юридических лиц до востребования и со сроком исполнения обязательств в ближайшие 30 календарных дней.
Его минимальное значение 50%.
Нарушение Н2 и Н3 говорит о недостаточном запасе ликвидности банка.
6. Н4 - долгосрочная ликвидность. Регулирует (ограничивает) риск потери банком ликвидности в результате размещения средств в долгосрочные активы и определяет максимально допустимое отношение кредитных требований банка к собственным средствам (капиталу) банка и обязательствам (пассивам) с оставшимся сроком до даты погашения свыше 365 или 366 календарных дней, скорректированным на величину минимального совокупного остатка средств по счетам со сроком исполнения обязательств до 365 календарных дней и счетам до востребования физических и юридических.
Его максимальное значение 120%.
Несоблюдение Н4 говорит о том, что банк злоупотребляет размещением в долгосрочные активы краткосрочных пассивов.
7. Н7 - максимальный размер крупных кредитных рисков. Регулирует (ограничивает) совокупную величину крупных кредитных рисков банка и определяет максимальное отношение совокупной величины крупных кредитных рисков и размера собственных средств (капитала) банка.
Его максимальное значение 800%.
8. Н9.1 - максимальный размер кредитов, банковских гарантий и поручительств, предоставленных банком своим участникам (акционерам). Регулирует (ограничивает) кредитный риск банка в отношении участников (акционеров) банка и определяет максимальное отношение размера кредитов, банковских гарантий и поручительств, предоставленных банком своим участникам (акционерам) к собственным средствам (капиталу) банка.
Его максимальное значение 50%.
9. Н10.1 - совокупная величина риска по инсайдерам банка. Регулирует (ограничивает) совокупный кредитный риск банка в отношении всех физических лиц, способных воздействовать на принятие решения о выдаче кредита банком.
Его максимальное значение 3%.
10. Н12 - использование собственных средств (капитала) банка для приобретения акций (долей) других юридических лиц.
Его максимальное значение 25%.
11. Н18 - минимальное соотношение размера ипотечного покрытия и объема эмиссии облигаций с ипотечным покрытием.
Его минимальное значение 100%.
Пропущенные нормативы либо отменены на данный момент, либо относятся к небанковским кредитным организациям, не имеющим лицензии на банковскую деятельность. Также, на тот случай, если банк предоставляет не всю информацию (обязательны только нормативы 1.1-1.3, 2 и 3) Центральный Банк дополняет отчётность сведениями о том, какие нормативы указаны.
Как правило, наиболее важными для прогнозирования являются нормативы Н1.1, Н1.2, Н1.3, Н2, Н3 - которые также являются обязательными нормативами для предоставления в отчётности по форме 0409135 - и Н12: норматив использования собственных средств (капитала) банка для приобретения акций (долей) других юридических лиц.
Однако, для оценки поведения и рисков кредитных организаций за другие периоды, и, особенно, в будущем, необходимо было также учитывать общую ситуацию в стране с экономической точки зрения, а также поведение тех же банков в другие периоды, с другой экономической ситуацией.
В виде качественных подобных общих факторов следует рассмотреть показатели, связанные с внешними условиями банковского сектора. Например, банк может находиться в благополучном регионе с высокой доходностью или в менее благополучной части страны с повышенными рисками, его отчётность могла быть сдана в более или менее благополучный период.
После проверки банковской отчётности Центральному Банку, выяснилось, что надёжная информация хранится о периоде с 2011 года и далее, и именно об этом периоде было решено найти макроэкономические параметры.
1.3.2 Макроэкономические показатели
Для того, чтобы оценить экономическое положение страны в разное время, следовало подобрать параметры, которые отражали бы ежемесячно различные состояния как разных экономических секторов, так и общее состояние экономики. Из всех переменных, так или иначе влиявших на положение банковского сектора, ежемесячно можно было узнать об двенадцати величинах [12].
1. Дефицит федерального бюджета.
2. Профицит федерального бюджета.
3. Международные резервы Центрального Банка.
4. Валютные резервы Центрального Банка.
5. Курс доллара относительно московской межбанковской валютной биржи.
6. Индекс РТС или RTSI - Russia Trading System Index [13], представляющий собой относительную суммарную рыночную капитализацию списка эмитентов, действующих на фондовом рынке России, его основной индикатор.
7. Инфляция.
8. ВВП.
9. Средняя зарплата граждан страны.
10. Среднемесячная кредиторская задолженность предприятия.
11. Среднемесячная дебиторская задолженность предприятий.
12. Денежный агрегат М2 как количественная характеристика денежной массы, находящейся в стране.
Полученные макроэкономические параметры за период с января 2011 года по февраль 2017 года включительно приведены в приложении А.
1.3.3 Формирование и оптимизация вводных показателей
В России кредитные организации обязаны отчитываться по ряду нормативов Центральному Банку, который, в свою очередь, публикует её [14] в виде файлов DBF. Необходимая в данном контексте информация находится в форме 135, публикуемой ежемесячно и содержащей те нормативы ликвидности, которые банк прислал. На рисунке 1.2 приведён типичный фрагмент подобного файла.
Рисунок 1.2 Фрагмент файла отчётности
После обработки найденной информации, мною была выделены и разбиты по регистрационным номерам списки нормативов каждого банка, сдававшего отчёты в рассматриваемый период, пример которых можно увидеть в приложении Б. Однако, после проверки всего массива информации, состоявшего из 61 278 записей о 1016 банках, из которых банкротами были 314, мною были обнаружены пропуски в отчётности.
В частности, многие банки игнорировали ряд нормативов, а зачастую вообще сдавали пустой отчёт, как можно увидеть на рисунке 1.3.
Рисунок 1.3 Пример ненадёжных записей
Случаи скомпрометированной отчётности встречались чаще у банков-банкротов, чем у банков, лицензия которых не была отозвана, однако скорее такое поведение характеризует банки в целом. Так, например, после избавления от всех пропусков, осталось 51 047 записей о 908 банках, из которых банкротами были 233 или 25,7%, а среди 10 231 записи с пропущенной информацией оказались 412 банков, из которых банкротами был 81 или 19,7%. Несоответствие в общем числе банков объясняется тем, что некоторые банки в некоторые периоды сдавали полную отчётность, в другие же - неполную.
Помимо избавления от ненадёжных записей, также пришлось избавиться от ненадёжных параметров, о которых информацию сообщало крайне малое число банков. Ими оказались нормативы Н9.1, Н12 и Н18.
После объединения всей полученной информации конечный набор данных представлял 51 047 записей, содержавших регистрационный номер банка, 8 нормативов ликвидности, 11 макроэкономических показателей, а также информацию о месяце и годе, в которых была сделана запись.
Глава 2. Проектирование информационной системы
2.1 Разработка бизнес-модели приложения
2.1.1 Требования к системе
Прежде чем решать, каким образом будет спроектирована финальная версия системы, следует определиться с её функциями. Помимо очевидной: ввода данных об интересующем пользователя банке - необходимо, чтобы система сама собирала и обновляла сведения о банках, поддерживая информацию касательно текущего периода свежей, чтобы избежать неточностей при оценке рисков.
Кроме того, система должна оценивать риски на всей протяжённости существования банка, выводя некий рейтинг, так или иначе оценивая банки относительно друг друга. В данной ситуации, когда различные банки существуют в одинаковых условиях продолжительное время, но демонстрируют разные показатели риска, может быть применена рейтинговая система Арпада Эло [15].
При этом появляется возможность, используя информацию из справочников Центрального Банка, находить по запросу пользователя сведения о том или ином банке по его данным - названию или ряду идентифицирующих кодов - и демонстрировать, насколько рискованно его положение. Пользователь может получать доступ к информации, уже обработанной периодической сетью, бесплатно, или платить за более глубокое исследование рисков с использованием сети, охватывающей промежуток с 2011 года по 2017. Помимо этого, система также должна содержать справочную информацию, который пользователь сможет руководствоваться для подведения собственных выводов о том или ином банке.
В результате, система должна представлять собой:
· веб-приложение, через которое пользователи смогут подавать запросы;
· сервер, обрабатывающий эти запросы и подготавливающий прогноз общих рисков;
· базу данных, хранящую уже известную информацию;
· сборщик данных, получающий свежие сведения от Центрального Банка и публичных статистических агентств.
Полное техническое задание можно увидеть в Приложении В.
2.1.2 Диаграммы прецедентов
Для проектирования WEB-приложения был использован язык моделирования UML. В ходе анализа предметной области были выявлены следующие функциональные требования к программному продукту:
· поиск по названию банка;
· поиск по номеру банка;
· сбор сведений о банках;
· сбор макроэкономических сведений;
· составление прогнозов;
· представление исторических данных;
· представление справочной информации.
После составления функциональных требований были выделены прецеденты, которые представлены на диаграмме UseСase diagram (рис 2.1).
Рисунок 2.1 Диаграмма UseCase
Таблица 2.1 Спецификация прецедента "Открытие веб-сайта"
Краткое описание |
Прецедент дает возможность пользователю открыть сайт в каком-либо браузере |
|
Актеры |
Пользователь |
|
Предусловия |
На компьютере пользователя должен присутствовать браузер |
|
Основной поток |
Открытие сайта |
|
Альтернативные потоки |
- |
|
Постусловия |
Сайт открыт |
Таблица 2.2 Спецификация прецедента "Навигация по сайту"
Краткое описание |
Прецедент дает возможность пользователю переходить между различными секциями сайта |
|
Актеры |
Пользователь |
|
Предусловия |
Выполнен прецедент "Открытие веб-сайта" |
|
Основной поток |
Открытие сайта, сообщение об отсутствии страницы |
|
Альтернативные потоки |
- |
|
Постусловия |
Открыта новая страница |
Таблица 2.3 Спецификация прецедента "Ввод названия банка"
Краткое описание |
Прецедент дает возможность пользователю ввести название банка в поисковую строку |
|
Актеры |
Пользователь |
|
Предусловия |
Выполнен прецедент "Открытие веб-сайта" |
|
Основной поток |
Начало прецедента совпадает с решением пользователя ввести данные на титульной странице. |
|
Альтернативные потоки |
Ввод данных в заголовке сайта |
|
Постусловия |
Данные введены |
Таблица 2.4 Спецификация прецедента "Ввод регистрационного номера банка"
Краткое описание |
Прецедент дает возможность пользователю ввести регистрационный номер банка в поисковую строку |
|
Актеры |
Пользователь |
|
Предусловия |
Выполнен прецедент "Открытие веб-сайта" |
|
Основной поток |
Начало прецедента совпадает с решением пользователя ввести данные на титульной странице. |
|
Альтернативные потоки |
Ввод данных в заголовке сайта |
|
Постусловия |
Данные введены |
Таблица 2.5 Спецификация прецедента "Контроль введённых данных"
Краткое описание |
Прецедент производит контроль введённых данных |
|
Актеры |
Пользователь |
|
Предусловия |
Выполнен прецедент "Открытие веб-сайта", выполнен один из прецедентов: "Ввод названия банка" "Ввод регистрационного номера банка" |
|
Основной поток |
Контроль данных, сообщение о некорректном вводе |
|
Альтернативные потоки |
- |
|
Постусловия |
Корректность введённых данных проверена |
Таблица 2.6 Спецификация прецедента "Поиск банка в БД"
Краткое описание |
Прецедент производит поиск банка по введённым пользователем данных в базе данных |
|
Актеры |
Пользователь |
|
Предусловия |
Выполнен прецедент "Открытие веб-сайта", выполнен один из прецедентов: "Ввод названия банка" "Ввод регистрационного номера банка" После выполнен прецедент "Контроль введённых данных" |
|
Основной поток |
На основе введённых данных производится поиск |
|
Альтернативные потоки |
Выполняется переход на страницу с сообщением об ошибке |
|
Постусловия |
Выполняется переход на страницу с результатом прогнозирования |
Таблица 2.7 Спецификация прецедента "Запуск сборщика"
Краткое описание |
Прецедент производит запуск синтаксического анализатора, собирающего сведения о банках и экономической ситуации из публичных источников |
|
Актеры |
Администратор |
|
Предусловия |
На компьютере администратора должен присутствовать браузер |
|
Основной поток |
Сбор данных |
|
Альтернативные потоки |
- |
|
Постусловия |
Начинается сбор данных |
Таблица 2.8 Спецификация прецедента "Получение нормативов ликвидности"
Краткое описание |
Прецедент производит запуск синтаксического анализатора, собирающего сведения о банках из публичных источников |
|
Актеры |
Администратор |
|
Предусловия |
Выполнен прецедент "Запуск сборщика" |
|
Основной поток |
Сбор данных |
|
Альтернативные потоки |
- |
|
Постусловия |
Совершается сбор и анализ данных с сайта Центрального Банка |
Таблица 2.9 Спецификация прецедента "Получение макроэкономических показателей"
Краткое описание |
Прецедент производит запуск синтаксического анализатора, собирающего сведения об экономической ситуации из публичных источников |
|
Актеры |
Администратор |
|
Предусловия |
Выполнен прецедент "Запуск сборщика" |
|
Основной поток |
Сбор данных |
|
Альтернативные потоки |
- |
|
Постусловия |
Совершается сбор и анализ данных с сайта Единого архива экономических и социологических данных |
Таблица 2.10. Спецификация прецедента "Заполнение БД"
Краткое описание |
Прецедент производит заполнение базы данных свежими записями |
|
Актеры |
Администратор |
|
Предусловия |
Выполнены прецеденты "Запуск сборщика", "Получение нормативов ликвидности" и "Получение макроэкономических показателей" |
|
Основной поток |
Сбор данных |
|
Альтернативные потоки |
- |
|
Постусловия |
Полученные сведения загружаются в базу данных |
Таблица 2.11. Спецификация прецедента "Запуск системы"
Краткое описание |
Прецедент производит запуск прогнозирующей системы |
|
Актеры |
Администратор |
|
Предусловия |
На компьютере администратора должен присутствовать браузер |
|
Основной поток |
Обработка данных |
|
Альтернативные потоки |
- |
|
Постусловия |
Прогнозирующая система готова к обработке данных |
Таблица 2.12. Спецификация прецедента "Обработка данных, обнаруженных сборщиком"
Краткое описание |
Прецедент производит обработку свежих записей, занесённых в базу данных сборщиком, используя имеющиеся формулы |
|
Актеры |
Администратор |
|
Предусловия |
Выполнен прецедент "Запуск системы" |
|
Основной поток |
Обработка данных |
|
Альтернативные потоки |
- |
|
Постусловия |
Свежие записи базы данных обрабатываются формулами прогнозирования, полученными в результате работы нейронных сетей. |
Таблица 2.13. Спецификация прецедента "Изменение данных в БД"
Краткое описание |
Прецедент производит запуск системы прогнозирования |
|
Актеры |
Администратор |
|
Предусловия |
Выполнен прецедент "Запуск системы" |
|
Основной поток |
Обработка данных |
|
Альтернативные потоки |
- |
|
Постусловия |
База данных пополняется прогнозами |
После спецификации прецедентов необходимо описать поведение системы. Для описания поведения системы необходимо рассмотреть отдельно каждый прецедент. В следующем параграфе они описаны более детально, с использованием activity diagram.
2.1.3Диаграммы деятельности
Первым прецедентом будет "Открытие веб-сайта". Пользователю необходимо открыть сайт в каком-либо интернет браузере. Визуализацию данного прецедента опустим, так как она состояла бы из одного действия "открытие страницы".
Также не имеет смысла визуализировать и прецедент "Навигация по сайту".
В связи с тем, что "Ввод названия банка", "Ввод регистрационного номера банк, "Контроль введённых данных" и "Поиск банка в БД" тесно связаны между собой, эти прецеденты в рамках описания их деятельности (рис 2.2) будут рассмотрены вместе. Ввод данных о банке происходит следующим образом: пользователь вводит название банка или его регистрационный номер в формы, представленные в заголовке каждой страницы, или в основную форму на титульной странице.
Далее осуществляется контроль данных с выводом сообщения об ошибке при введении некорректных данных, либо с совершением запроса в базу данных в том случае, если данные введены корректно. Если банк найден, производится переход на страницу со сведениями о банке и прогнозом рисков отзыва его лицензии. Если же банк не найден, также выводится сообщение об ошибке.
Рисунок 2.2 Диаграмма деятельности "Ввод и контроль данных, поиск банка в БД"
Все дальнейшие прецеденты производятся от имени администратора системы. Напрямую от него зависят два прецедента "Запуск сборщика" и "Запуск системы", и каждый из них приводит к отдельному процессу, связанному с различными подсистемами.
"Запуск сборщика" тесно связан с прецедентами "Получение макроэкономических показателей", "Получение нормативов ликвидности" и "Заполнение БД", поэтому они имеет смысл рассмотреть их вместе. В свою очередь, "Запуск системы" тесно связан с прецедентами "Обработка данных, обнаруженных сборщикомом" и "Изменение данных в БД".
Работа сборщика осуществляется следующим образом: администратор инициирует процесс в начале периода - месяца или квартала в зависимости от необходимости - и передаёт сигнал синтаксическому анализатору о том, что необходимо собрать сведения касательно нормативов ликвидности с сайта Центрального Банка из отчётности, представляемой ему коммерческими банками ежемесячно, и сведения об экономическом положении из Единого архива экономических и социологических данных.
Рисунок 2.3 Диаграмма деятельности "Сбор информации"
После того, как все сведения получены, они формируются в записи и заносятся в базу данных, где хранятся до тех пор, пока не будет произведён поисковый запрос пользователя или не будет запущена прогнозирующая система. Рекомендуется производить это действие вручную, так как отчётность коммерческих банков Центральному Банку имеет свойство менять со временем свой формат и, соответственно, сборщик данных необходимо будет обновить. После того, как все данные собраны, администратор может запустить систему прогнозирования, которая на основании этих данных будет присуждать банкам диапазон риска, в который они попадают. Принцип работы системы достаточно прост, она забирает из базы свежие записи и добавляет в них показатели риска, рассчитанные с помощью формул, полученных после обучения и тестирования нейронных сетей. О том, каким образом производятся эти вычисления, и о том, как именно были спроектированы, обучены и изменены модели нейронных сетей в процессе исследования данных, можно узнать в третьей главе этой работы.
2.1.4 Модель базы данных
В качестве реляционной СУБД я воспользовался Microsoft SQL Server из-за уже имеющегося опыта в его использовании. На рисунке (рис 2.1) приведена диаграмма базы данных, которую я в дальнейшем заполнил собранной информацией и использовал в приложении.
Рисунок 2.4 Диаграмма базы данных bankruptcy. dbo
Таблица list содержит список банков с их регистрационными номерами, использованными в виде первичного ключа, а также их наименованиями и флагом, отмечающим является ли банк банкротом. Всего в таблице 1016 записей.
Таблица liquidity содержит собранную информацию отчётность о нормативах ликвидности. Так как запросы в базу позволяют подсчитать нулевые записи, я не стал выводить скомпрометированные данные в отдельную таблицу. Первичным ключом в данном случае был отдельный столбец, в котором все записи были пронумерованы от 1 до 61 278.
Таблица months содержит список месяцев, данные по которым охвачены, с номером месяца в качестве первичного ключа, и расшифровкой того, к какому году он принадлежит и каким месяцем в году является.
Таблица macro содержит ежемесячные записи макроэкономических параметров, приведённые в приложении А. Первичным ключом можно было бы выбрать номер месяца, однако, посчитав, что возможно дальнейшее тестирование, я также пронумеровал записи от 1 до 74.
Наконец, таблица weights содержит веса нейронов сети.
Для взаимодействия с БД я сначала пользовался строками подключения и запросами, однако, попробовав различные варианты, я остановился на подключении через создание модели базы данных с помощью ADO.net Entity Framework. Это позволило значительно сократить объём кода, улучшить его читаемость и упростило взаимодействие с.net MVC, о котором я расскажу дальше.
Перенос данных из разрозненных таблиц. xlsx был осуществлён путём наименьшего сопротивления - я собрал все данные так, чтобы они соответствовали спроектированным таблицам, а после импортировал их с помощью стандартного инструмента Management Studio.
2.2 Разработка пользовательского интерфейса
Сайт состоит из следующих страниц:
· главная страница с формой поиска,
· список макроэкономических показателей по месяцам,
· список банков по регистрационным номерам,
· страница с общей информацией о банке,
· страница с отчётностью по нормативам ликвидности и справочной информацией,
· контактная страница.
Я решил воспользоваться ASP.net MVC в содействии с bootstrap-CSS, опять же, из-за уже имеющегося опыта работы с ними, а также из-за удобства управлением взаимодействия всех названных компонентов.
Титульная страница сайта
При переходе на главную страницу сайта (рис 2.1), пользователь может воспользоваться формой поиска, в которую он может ввести регистрационный номер или название банка, после чего система перенаправит его на страницу с информацией об этом банке (рис 2.2).
Рисунок 2.5 Титульная страница
Страница общей информации
Рисунок 2.6 Страница общей информации
На странице общей информации о банке приведён его регистрационный номер, его название, по которому также возможен поиск банка, информация о том, является ли банк банкротом в данный момент, информация о том, какому риску он подвержен в текущем месяце, а также график, на котором приведён диапазон риска, в который банк попадал во временном периоде, о котором собрана отчётность.
Подобные документы
Основы прогнозирования банкротства предприятия с помощью индекса Альтмана. Создание программы для расчета коэффициента "Z" с помощью языка программирования Delphi. Расчет показателя эффективности активов по балансовой прибыли и доли оборотных средств.
курсовая работа [881,8 K], добавлен 30.01.2012Математические модели, построенные по принципу организации и функционирования биологических нейронных сетей, их программные или аппаратные реализации. Разработка нейронной сети типа "многослойный персептрон" для прогнозирования выбора токарного станка.
курсовая работа [549,7 K], добавлен 03.03.2015"Наивная" модель прогнозирования. Прогнозирование методом среднего и скользящего среднего. Метод опорных векторов, деревьев решений, ассоциативных правил, системы рассуждений на основе аналогичных случаев, декомпозиции временного ряда и кластеризации.
курсовая работа [2,6 M], добавлен 02.12.2014Понятие компьютерной и информационной модели. Задачи компьютерного моделирования. Дедуктивный и индуктивный принципы построения моделей, технология их построения. Этапы разработки и исследования моделей на компьютере. Метод имитационного моделирования.
реферат [29,6 K], добавлен 23.03.2010Прогнозирование валютных курсов с использованием искусственной нейронной сети. Общая характеристика среды программирования Delphi 7. Существующие методы прогнозирования. Характеристика нечетких нейронных сетей. Инструкция по работе с программой.
курсовая работа [2,2 M], добавлен 12.11.2010Разработка самообучающейся интеллектуальной информационной системы для анализа кредитоспособности заемщика и оценки кредитных рисков на основе подхода иммунокомпьютинга. Применение процедур кластеризации, классификации и формирования оценок рисков.
курсовая работа [822,3 K], добавлен 09.06.2012Проектирование и реализация модели, которая будет имитировать автозаправочную станцию с постоплатой. Подбор оптимальных параметров модели с учетом требований к сети массового обслуживания. Разработка модели в среде имитационного моделирования GPSS World.
контрольная работа [279,5 K], добавлен 16.03.2014Изучение непараметрических моделей коллективного типа в задаче прогнозирования временных зависимостей. Анализ исследования и восстановления показателей преступности от следственных мероприятий. Описания руководства программиста информационной системы.
дипломная работа [3,6 M], добавлен 25.09.2011Прогнозирование на фондовом рынке с помощью нейронных сетей. Описание типа нейронной сети. Определение входных данных и их обработка. Архитектура нейронной сети. Точность результата. Моделирование торговли. Нейронная сеть прямого распространения сигнала.
дипломная работа [2,7 M], добавлен 18.02.2017Изучение и реализация системы, использующей возможности Microsoft Azure для распределенного обучения нейронной сети. Рассмотрение функционирования распределенных вычислений. Выбор задачи для исследования; тестирование данного программного ресурса.
дипломная работа [2,0 M], добавлен 20.07.2015