Чем предстоит заниматься
- разработка и поддержание моделей кредитного риска для поточного кредитования малого и среднего бизнеса (PD, EAD, LGD);
- разработка и поддержание различных внутренних моделей кредитного риска (PD, модель выручки и др.) с помощью методов машинного обучения (логистическая регрессия, градиентный бустинг и др.);
- аналитика слабоструктурированных данных в Hadoop, создание новых признаков и их применение в моделях;
- эксперименты с нестандартными для классического скоринга подходами для моделирования (например применение методов NLP для анализа данных о юрлицах, не укладывающихся в реляционную модель данных);
- поведенческая аналитика и сегментация;
- анализ эффективности новых источников данных, тестирование моделей кредитного риска на новых источниках данных.
Требования
- физико-математическое, экономико-математическое образование;
- хорошее знание теории вероятностей и математической статистики, методов машинного обучения;
- развитое логическое мышление;
- опыт аналитической работы от 1 года, в том числе опыт разработки статистических моделей;
- умение работать с данными (анализ, очистка, подготовка, отбор и создание признаков), навыки написания SQL-запросов;
- знание Python (в частности, библиотек, применяемых для анализа данных: scipy, pandas, scikit-learn, xgboost, lightgbm и т.п.);
- опыт с работы с Hadoop (Hive, Impala, Apache Spark);
- опыт работы в Jira/Confluence/Bitbucket
- желателен опыт работы с юридическими лицами, понимание, как устроена отчетность, какие модели можно применять для анализа компаний
- владение английским языком на уровне, как минимум, позволяющем свободно читать специализированную литературу.