Талантливый специалист Антон Багин о том, как анализ данных меняет банковские операции, повышая эффективность и надежность систем
10.12.24, Вт, 10:10, Мск,
Сегодня финансовая отрасль сталкивается с системной проблемой `слепых зон` в рисковых алгоритмах. Поиск решений привёл к появлению целого класса инструментов мониторинга качества моделей. Как меняется подход к управлению рисками и какое место в этом процессе занимает Data Science, рассказывает Антон Багин, старший дата-сайентист с опытом реализации масштабных проектов в ведущих банках.
— Антон, в Береке Банке вы интегрировали ряд альтернативных методов мониторинга моделей машинного обучения, которые, как вы поделились, на сегодня являются уникальными решениями для казахстанской банковской отрасли. Почему этот проект стал настолько важным, и в чём заключалась его инновационность?
— Мы действительно столкнулись с типичной для сектора проблемой: из-за длительного «периода дозревания» данных невозможно было полноценно отслеживать работу моделей. Меток классов попросту не было. Я провёл исследование альтернативных методов, нашёл два подхода, подходящих под наши условия, и интегрировал их в процессы мониторинга моделей. Это позволило отслеживать «здоровье» моделей заранее, ещё до наступления фактических исходов. Проект снизил риск «тихих сбоев» и стал первым шагом к более надёжной аналитической инфраструктуре в банке. Благодаря ему удалось оценивать производительность моделей даже при отсутствии актуальных данных — проблема, характерная для кредитного скоринга. Судя по интересу на конференциях, проблема знакома многим — значит, мы попали в точку.
— Вопрос, который волнует всю отрасль: как проверять устойчивость моделей в реальном времени, если нет «правильных ответов»? Как Вам удалось подойти к этой задаче?
— Мы изучили большое количество публикаций, провели эксперименты и остановились на двух методах: один для регрессионных, другой для классификационных моделей. Их особенность — ориентация на распределение предсказаний и внутренние сигналы, а не на внешние метки. После тестирования мы интегрировали это во внутренние пайплайны мониторинга моделей.Эффективность вместо расходов: на чем реально будет держаться ИБ в 2026 году
— Антон, благодаря вашему проекту по мониторингу моделей Береке Банк впервые получил возможность эффективно оценивать работоспособность рисковых алгоритмов даже при отсутствии актуальных меток, это, как вы рассказали, позволило значительно снизить риски silent failure и повысить надёжность кредитных решений. Как вы пришли к такому решению и какие ключевые этапы были в его реализации?
— Данное решение позволило сформировать более полную и надёжную картину состояния моделей в продакшене, учитывающую не только фактические метрики на новых данных (которые, с учётом дозревания, доступны весьма ограниченно), но и статистическую оценку производительности моделей на недозревших данных. Это стало возможным благодаря сочетанию ряда статистических и математических методов, что позволяет нам в значительной степени снизить зависимость от дозревания данных при оценке моделей.
Кроме того, мы внедрили методы оценки смещений данных (ситуаций, когда новые данные начинают отличаться от тех, на которых обучалась модель). Поскольку изменения в данных происходят постоянно, критически важно уметь отличать безопасные смещения от тех, которые действительно могут негативно повлиять на качество предсказаний.
Мы также начали использовать эти подходы на этапе разработки новых моделей для предварительной оценки их устойчивости. Сейчас идёт внедрение автоматизированной инфраструктуры, которая позволит масштабировать эти методы на всю модельную экосистему банка.
— Помимо работы в Береке Банке, вы реализовали комплексную систему моделирования логистики и производства банковских карт в Сбере, охватив 8 площадок по всей стране. Каковы были результаты этого проекта и Ваш личный вклад в его реализацию?
— Мы провели полный цикл от MVP до масштабируемой производственной модели, детализировали процессы, учли региональные особенности логистики, особенности производственного оборудования и циклов персонализации. Результатом стало снижение затрат, высвобождение трудовых ресурсов, увеличение пропускной способности производственных площадок без расширения парка оборудования и сокращение сроков доставки. Благодаря нашей аналитической работе банк успешно прошел турбулентные периоды. Это позволило банку оптимизировать выпуск более чем 130 продуктов, снизить затраты и выдержать кризисные периоды.
— Выступая на конференциях в Казахстане, вы представляли решения по мониторингу моделей, которые вызвали интерес у коллег. Можно ли сказать, что проект стал точкой влияния на индустрию?
— Да, на конференции приглашались участники из других компаний, в том числе международных. По результатам выступлений я получал множество вопросов, итогами которых становились дискуссии с другими участниками конференций. Некоторые из них упомянули кейс в профессиональных каналах. Это подтверждает, что задача релевантна не только Береке Банку. Тема — живая, и подходы, которые мы применили, действительно могут быть полезны в аналогичных условиях и не только.
— Любая инновационная технология открывает перед нами новые горизонты, но одновременно порождает и серьезные вызовы. Какие риски, в том числе этического характера, возникают у банков при масштабном использовании аналитики данных?
— Конечно, риски есть, и они могут быть весьма существенными. Один из самых опасных заключается в скрытой предвзятости алгоритмов: опираясь на исторические данные, модель может статистически воспроизводить и даже усиливать существующие социальные стереотипы, что чревато дискриминацией отдельных групп клиентов. Борьба с этим явлением требует не только технических усилий, но и выверенного этического подхода.
Ещё одна проблема — так называемая «чёрная коробка»: зачастую непонятно, какие именно факторы привели модель к тому или иному решению. В финансовом секторе это недопустимо, поэтому сегодня всё больше внимания уделяется развитию Explainable AI — систем, способных объяснять логику своих выводов. Мы, в свою очередь, применяем к сложным алгоритмам специальные аналитические методики, позволяющие визуализировать степень влияния тех или иных факторов на решение модели.
Наконец, нельзя не упомянуть о защите и конфиденциальности данных. С каждым новым увеличением объемов хранимой информации растёт и ответственность за защиту информации от компрометации и искажения, поэтому банки и множество других организаций уделяют огромное внимание безопасным протоколам и механизмам шифрования.
— Глядя вперёд на пятилетний-восьмилетний горизонт, каким Вы представляете себе «современный банк в будущем»? Как изменится ежедневное взаимодействие людей с финансовыми сервисами?
— Уверен, что банк будущего станет почти незаметным, но при этом будет всегда под рукой. А с развитием искусственного интеллекта — превратится из простого инструмента управления счетами больше в финансового советника. Общение с ним уже не будет строиться на визитах в офис или даже на работе с приложением: вместо этого система предложит пользователям своевременные контекстные рекомендации и автоматически выполнит нужные действия. Такой ассистент сам упорядочит Ваши расходы, подберёт инвестиции, соответствующие Вашему уровню риска, и заранее предупредит о возможных денежных затруднениях. Понятия отдельных продуктов — счёта, карты, кредиты — сольются в единую умную платформу для управления всеми вашими средствами. Всё это станет возможным благодаря постоянному анализу данных в реальном времени и системам ИИ, бесшовно встроенным в банковский продукт.
Автор: Михаил Артемьев
