Чем предстоит заниматься:
- Разрабатывать и поддерживать ML-модели для кредитования физических лиц (PD, LGD, EAD, модель дохода и тд)
- Выводить в прод разработанные модели с помощью нашей ML платформы.
- Развивать внутренний фреймворк для разработки моделей
- Генерировать новые фичи и записывать в feature store (кстати их 2, отдельно для разработки моделей, отдельно для использования в онлайн в проде)
- Участвовать в постановке задачи, находить приоритетные направления для моделирования и прозрачно об этом рассказывать
- Анализировать эффективность моделей в проде, организовывать и дорабатывать мониторинг.
Требования:
- Опыт работы в кредитном скоринге от 3 лет
- Понимание, как провалидировать модели и как организовать мониторинг так, чтобы минимизировать модельные риски
- Умение работать с данными. Селектить откуда угодно. Генерировать крутые фичи для моделей. Вычислительно эффективно и с самопроверкой.
- Глубокие знания теорвера, машинного обучения, типовых пайплайнов обучения моделей (да, банально, но нужно)
- Опыт работы c пакетами для анализа данных и построения ML моделей на Python3 (numpy, pandas, scikit-learn, xgboost, lightgbm, catboost, hyperopr, optuna, etc) (да, тоже банально, но как без этого?)
Будет плюсом:
- Опыт работы с HDFS и Pyspark
- Навыки использования deep learning алгоритмов
- Навыки создания дагов Airflow и их последующее сопровождение
- Опыт в разработке, выводе в прод и поддержке сервисов для онлайн расчета моделей машинного обучения