Чем предстоит заниматься
- Строить модели идентификации фродового и роботного траффика
- Сопровождать постановки на регламент процессов в Airflow, консультировать Data Engineer
- Сопровождать A/B-тесты моделей Исследовать наборы сырых данных для поиска нужных фичей
- Составлять требования к витринам данных, необходимых для разработки моделей машинного обучения
Требования
- Хороший уровень владения SQL и Python. Будет плюсом опыт работы в распределённых/параллельных вычислениях на Spark
- Понимание статистических подходов и методов (регрессия, свойства распределений, оценка максимального правдоподобия, проверка гипотез и их правильное использование), опыт их применения
- Опыт применения классических алгоритмов машинного обучения (LR, RF, XGBoost/LGBM/CatBoost), их калибровки, понимание преимуществ, недостатков и ограничений