Новые возможности кредитного конвейера
Илья Тихонов
Илья Тихонов
владелец продукта Polymatica ML
Как работать с математическими моделями и превратить их из «чёрного ящика» в понятный бизнес-пользователю инструмент, рассказывает Илья Тихонов, владелец продукта Polymatica ML компании SL Soft.
Современный банк использует data-driven подход, потому что вся его деятельность буквально пронизана математическими расчётами и оптимизацией. Отличный пример — процесс выдачи кредитов: его эффективность напрямую зависит от качества и точности математических моделей, используемых для обеспечения работы кредитного конвейера. Не случайно важным направлением деятельности ИТ-департамента любого банка является создание наилучших скоринговых моделей: это помогает выявлять наилучших заёмщиков, оптимальные суммы, условия кредитования и дополнительные услуги.
Более того, банки постоянно совершенствуют эти алгоритмы, стремясь сделать их максимально релевантными аудитории заёмщиков, актуальной социально-экономической обстановке и текущим бизнес-задачам финансовой организации.
Давайте посмотрим, какие современные информационные технологии помогают банкам решать математическую задачу получения максимальной прибыли со многими параметрами и наилучшей результативностью.
Вероятность наилучшего выбора
Схема работы основного этапа кредитного конвейера — формирования решения о выдаче/невыдаче кредита — выглядит следующим образом. На вход соответствующей модели поступает обширный список параметров, характеризующих конкретного заёмщика. Он включает как клиентские данные (пол, возраст, образование, семейное положение, уровень дохода и т. д.), так и сведения из внешних источников: перемещение по стране и за её пределами, сеансы пользования услугами связи и мобильными приложениями, факты крупных покупок. Также важно знать, какие внешние экономические или геополитические процессы влияют на жизнь и доходы определённого типа заёмщиков. Выбор параметров модели — это всегда немного искусство: из сотен категорий доступных данных необходимо сформировать список наиболее информативных, которые обеспечат максимальную точность, но при этом не создадут ненужного цифрового «шума» в алгоритме.Модель оценивает, стоит выдавать кредит или нет: уверенность системы транслирует показатель на выходе — он может быть от 0 до 1. Результативность вывода во многом зависит от настройки самого алгоритма (структуры весов в признаках модели): она может подходить к оценке чересчур жёстко, и тогда вместе с «плохими» заёмщиками отказ получит и часть «хороших», что снизит потенциальный доход банка. Или наоборот — будет излишне лояльной к негативным признакам, что может привести к росту объёмов кредитных дефолтов.
Можно ли это «hand-made искусство» датасаентиста заменить работой компьютерной системы? Ответ — да. Модели, находящиеся «под капотом» скоринговой системы, — «чёрный ящик» для бизнес-пользователей. И это свойство является, по сути, платой за то, что модель умеет находить нелинейные закономерности в данных. На результат её работы в той или иной степени влияют множество параметров. Отрегулировать веса этих параметров, провести дообучение модели на новых данных и дать оценку качеству её работы можно с помощью Polymatica ML. Платформа позволяет упростить понимание математических моделей и с помощью графического интерфейса работать над качеством принятия решений.
Как оценить качество принятия решения моделью?
1. Коэффициент Gini для оценки предсказательной силы в расчётах. Он даёт численную оценку отклонения фактического результата от «модельного».2. Кривая ROC (Receiver Operating Characteristic) — или кривая «ошибок» — для измерения эффективности модели. Она учитывает, какой процент среди всех результатов верно предсказан моделью на имеющихся исторических данных.
3. Показатель AUC (Area Under the ROC Curve) — ещё одна метрика эффективности модели, которая использует кривую ROC в качестве исходных данных и измеряет суммарную производительность модели. Метрика находится в интервале от 0 до 1. Чем значение AUC ближе к 1, тем «лучше» модель классификации. Данный показатель часто используется для сравнительного анализа нескольких моделей.
Метрика ROC-AUC напрямую связана с коэффициентом Gini и позволяет оценить качество модели бинарной классификации. Её расчёт реализован в виде готового инструмента аналитика на платформе Polymatica ML.
Учёт динамичных изменений в анализируемой ситуации
У моделей есть архитектурные особенности, которые в реальной жизни могут превращаться в проблемы. Например, сдвиг данных — алгоритм, натренированный на определённых исторических данных, — не способен учесть новые важные признаки текущей ситуации. Решить это можно лишь перетренировкой модели на регулярной основе. Более эффективный подход — поручить эту рутинную работу компьютерной системе. Такая функциональность реализована в Polymatica ML. Она самостоятельно изучает загруженные в модель данные о потребителях банковских услуг, использует различные алгоритмы предобработки, формирует экономические показатели (коэффициент Gini) и находит оптимальное сочетание параметров и весов модели, которые минимизируют финансовые убытки: ложные срабатывания и пропуск цели.Настройка возможностей ML-решения для банковского сектора
На создание кредитного конвейера с нуля и «под ключ», то есть до запуска его в продуктивной среде, на основе платформы Polymatica ML уходит несколько рабочих недель. Фактически ИТ-специалистам нужно время на создание ещё одного сервиса анализа результатов моделей, который взаимодействует с банковской инфраструктурой (например, системой CRM) и проходит тестирование в среде организации.Через внешний API платформа Polymatica ML может подключаться к бюро кредитных историй, которое в свою очередь также осуществляет специфическую валидацию клиента. Также это позволяет поддерживать любой кастомный скрипт на языке Python или SQL, который требует дополнительной предобработки, агрегации пользователей и т. п. Выходные данные в этом случае будут отображены на дашбордах корпоративной системы бизнес-аналитики.
Функциональность платформы даёт возможность легко создавать кастомные коннекторы к различным учётным системам банка. В ближайших планах — обеспечить лёгкую интеграцию входов системы с любым ПО банка, например корпоративным хранилищем данных, ETL-системой, витриной данных или даже привычной таблицей Excel. Таким образом, интеграция аналитической платформы с бизнес-системами в виде готового сервиса становится по-настоящему революционным шагом.
по любому вопросу