Система скоринговой оценки клиентов

Общие сведения

Система скоринговой оценки клиентов разработана на платформе GreenData и позволяет полностью автоматизировать скоринг клиентов, принадлежащих различным секторам бизнеса.

1. Платформа

1.1. Характеристики платформы

Платформа GreenData разработана с использованием современных технологий и обеспечивает:

  • функционирование под управлением любых СУБД;
  • минимальное время отклика и высокую скорость расчетов;
  • адаптивный и легкий web-интерфейс;
  • невысокую стоимость сопровождения за счет использования открытых технологий.

1.2. Технологическая основа

Клиентская часть Системы реализована с использованием современного фреймворка React. Данный фреймворк использует виртуальный DOM и производит обновление только изменившихся частей web-страницы, что позволяет реализовать чрезвычайно быстрый пользовательский интерфейс.

Взаимодействие клиентской части Системы с серверной реализовано с помощью архитектуры REST. При таком подходе серверное приложение не сохраняет информации о состоянии клиентских сессий. Вся необходимая информация передается серверу приложений в запросе клиента. Такой подход позволяет выполнять горизонтальное масштабирование программно-аппаратных ресурсов сервера приложений без необходимости внесения каких-либо изменений и доработок в само приложение.

Серверная часть Системы реализована с помощью фреймворка Spring. Взаимодействие с базой данных реализовано с помощью технологии JPA, что позволяет абстрагироваться от конкретной версии СУБД.

2. Архитектура Системы

Компонентная схема Системы представлена на рисунке ниже.

 schema

 

3. Задачи и функции Системы

3.1. Разработка скоринговой карты

Скоринговая карта или скоринговая модель – это математическая модель, предсказывающая финансовое состояние клиента, а как следствие – вероятность того, вернет ли клиент кредит в срок. Подобные модели строятся на основании статистических данных, полученных на основе информации о поведении аналогичных клиентов, или (и) на экспертных знаниях о клиенте.  На выходе модель выдает интегральный показатель, указывающий на степень риска, связанного с данным клиентом.

В Системе скоринговая карта оформляется в виде методики последовательного расчета риск показателей. Каждый показатель может быть посчитан по различным алгоритмам, настройка которых осуществляется риск-менеджером.

score_card0

Для описание алгоритма могут использоваться простые функции, операторы, деревья решений, так и сложные процедуры.

scorecard2

3.2. Исследование данных

Для разработки новой модели или проведения верификации уже действующих моделей необходима статистическая информация о поведении клиентов. Для этого в Системе существует объект “Выборка”, который представляет собой множество клиентов с набором риск факторов, классифицированных по признаку благонадежный/дефолтный.

Система позволяет создать целевую выборку клиентов на основании как внутренней информации, хранящейся в  базе данных Системы, так и данных, полученных из внешних источников.

При загрузке данных происходит идентификация следующих параметров:

  • Объект скоринга (оценки риска, например, клиент);
  • Дата актуальности реквизитов и параметров клиента (отчетная дата);
  • Дата дефолта;
  • Классификационные атрибуты (характеристики клиента, например, принадлежность к сегменту или отрасли);
  • Риск-факторы.

Классификационные атрибуту уже на этапе загрузки позволяют отфильтровать данные, требуемые для целевой выборки.

После формирования выборки Система позволяет оценить распределение целевой выборки по временным периодов в разрезе дефолтных и недефолтных контрагентов.

sample_data

3.3. Разработка и верификация скоринговых моделей

Для реализации полноценного математического аппарата Системы была произведена интеграция с математическим пакетом R, предназначенным для статистической обработки данных

Основная цель верификации скоринговой карты заключается в том,  чтобы убедиться насколько эффективно скоринговая карта разделяет клиентов на классы.  Для этого необходимо провести статистическую оценку значимости выбранных риск факторов.

Одним из эффективных методов реализованных в Системе – является так называемый ROC-анализ. Численный показатель площади под ROC-кривой называется AUC индексом и рассчитывается любым численным методом. Значение AUC более 70% говорит о хорошей предсказательной силе модели.

  roc_curve2

Другие доступные методы, которые могут быть использованы для построения и оценки модели:

  • регрессионные модели;
  • корреляционный анализ;
  • дискретизация переменных;
  • статистические критерии: Колмогорова-Смирнова, Кульбака-Лейблера, Bayes error rate и т.д.
  • и другие.