Как маркетплейсы развивают финтех-сервисы: Глеб Байматов о создании финтех-инфраструктуры Wildberries
02.12.25, Вт, 18:17, Мск,
MLOps-инженер Wildberries Fintech рассказал, как создавал финтех-инфраструктуру для российского маркетплейса с десятками миллионов пользователей.
Рынок рассрочек меняет структуру: если раньше оставались зоной ответственности банков, то теперь финансовые сервисы предоставляют крупнейшие IT-экосистемы. По данным сервиса «Долями» от Т-банка, объем российского рынка рассрочек в первом полугодии 2025 года вырос почти вдвое по сравнению с аналогичным периодом прошлого года и достиг 300 миллиардов рублей.[1] Конкурентное преимущество получили маркетплейсы, которые обладают огромным массивом данных о клиентах, и теперь сами начинают выполнять функции банков. Так, собственную финансовую инфраструктуру в 2024 году начала формировать торговая площадка Wildberries, рассказал MLOps-инженер Глеб Байматов. Как поделился эксперт, он создал технологическую основу проекта – систему кредитного скоринга для более ста миллионов пользователей. Ранее он возглавлял команду в Сбербанке, где использовал машинное обучение для ускорения оценки держателей кредитных карт. Глеб Байматов поведал о том, как с нуля создавалась инфраструктура для финансовых сервисов одной из крупнейших в России электронных торговых площадок и почему маркетплейсы становятся новым финансовым институтом.
В мае прошлого года Wildberries начала тестировать сервис рассрочки платежей. С чего начали построение системы кредитного скоринга, которой предстояло оценивать десятки миллионов человек? Такая задача обычно под силу только крупным банкам.
Да, мне нужно было создать систему, способную в реальном времени обрабатывать события и принимать модельные решения с минимальной задержкой для огромного количества пользователей маркетплейса. Поэтому первым делом мы определили архитектуру данных – какая информация нам нужна, откуда ее брать и как обрабатывать. Параллельно выстраивали процессы: как модели машинного обучения будут переходить от разработки к внедрению, как мы будем следить за их работой, как быстро сможем реагировать на изменения. Для хранения информации использовали ClickHouse – это специальная база данных, которая может обрабатывать миллиарды записей за секунды. Все данные хранятся в облачном хранилище S3, а вычисления происходят на платформе Kubernetes и Spark, которая автоматически распределяет нагрузку между серверами. Важно было не просто запустить скоринг, а ещё и сделать это быстро, чтобы застолбить рынок и с потенциалом на расширение кредитных продуктов, количества людей и количества моделей.
Ранее вы работали в Сбербанке, руководили командой инженеров данных. Как этот опыт помог во время создания новой системы?
По сути, он стал основной того, что я сделал для маркетплейса – помог понять, как устроены процессы. В банке я работал с кредитными картами. Мы занимались моделями, кредитной стратегией, управлением портфелем. Там была система оценки клиентов, которая каждый день принимала тысяч решений об одобрении транзакций и кредитных лимитов для 55 миллионов держателей карт. И я работал над тем, чтобы ускорить процесс машинного обучения, добавления новых источников, получения ценности из данных. Также разработал инструмент для работы с большими данными, которого раньше в банке не было, что помогло значительно ускорить скорость разведки новых источников.. Помогал внедрять в работу BI-средства, с помощью которых руководство может видеть все ключевые метрики в режиме реального времени на красивых дашбордах вместо таблиц Excel. За время работы нанял и обучил команду инженеров данных и mlops, выиграл внутренний конкурс по найму и написал программу адаптации новых инженеров. Все эти навыки очень пригодились для работы над новым проектом.Вызовы и лучшие практики внедрения российских ИТ обсудили на конференции TAdviser Импортозамещение 2025
С докладами о машинном обучении вы выступили на конференциях SQA DAYS и GO DIGITAL. Какие именно проблемы вы подняли в своих выступлениях?
На конференции SQA DAYS я говорил о тестировании систем машинного обучения. Проблема в том, что обычные методы тестирования программ здесь не работают – модель может давать правильный результат на тестовых данных, но полностью провалиться в реальной жизни. Я показывал, как проверять качество данных и точность предсказаний на каждом этапе. На GO DIGITAL тема была шире – как построить полноценную платформу машинного обучения в финансовой компании. Главная проблема индустрии в том, что дата-специалисты создают отличные модели в своих ноутбуках, но эти модели так и не доходят до реальных пользователей. Нет инфраструктуры, которая бы автоматически забирала модель у аналитика, проверяла ее, запускала в бой и следила за результатами.
Ваш опыт охватывает и крупные корпорации, и небольшие стартапы вроде Ledzilla. В чем разница в подходах к построению инфраструктуры данных для компаний разного масштаба?
В стартапе я тоже с нуля построил хранилище данных и перевел компанию с Excel на нормальную базу данных. У них была система расчета себестоимости товаров, которая работала всю ночь. Я переписал алгоритмы и оптимизировал запросы – теперь тот же расчет занимает пять минут вместо восьми часов и после изменений они смогли значительно расшириться. В стартапе ты можешь за день принять решение и внедрить новую технологию. В корпорации каждое изменение проходит через десятки согласований. Разница в масштабе и процессах принципиальная. В Сбере я был наставником для команды, договаривался с другими подразделениями о доступах и интеграциях. Каждое нововведение может занимать долгое время на внедрение. В стартапе главное – скорость, в корпорации – надежность и масштабируемость.
Какие перспективы вы видите для развития финтех-направления в маркетплейсах и технологиях скоринга в целом?
Финтех в маркетплейсах будет развиваться очень быстро. У этих компаний уже есть колоссальные массивы данных о поведении покупателей и собственные платежные инфраструктуры, а значит есть возможность предлагать пользователям персонализированные финансовые продукты: рассрочки, страхование, микрокредиты и так далее. Следующий шаг, на мой взгляд – развитие скоринга, который позволит точнее оценивать риски и снизить процент отказов при сохранении финансовой устойчивости компаний.
А перспективы личного развития какие видите? Насколько известно, один из крупных технологических вузов предложил вам преподавать.
В МГТУ имени Баумана мне предложили вести курс по архитектуре данных для сотрудников Газпрома, и я согласился, но не планирую эту карьерную линию делать основной. Скорее – это часть развития экспертиз. В перспективе вижу себя техническим директором финтех-компании, где смогу применить весь накопленный опыт для создания инновационных финансовых продуктов, доступных миллионам людей.
Автор: Дмитрий Архипов
