Чем предстоит заниматься
- Участвовать в полном цикле разработки ML-проекта: от сбора требований до внедрения в прод.
- Формировать целевые метки.
- Подготавливать дата-пайплайны для сбора признаков
- Проводить предобработку данных.
- Обучать модели.
- Валидировать и логировать результаты.
- Выкатывать решения в прод в виде DAGа Airflow, изредка в качестве сервиса совместно с бэкенд-разработчиками.
- Заниматься дизайном A/B-тестов.
- Принимать участие в бизнес-груминге проекта и анализе бизнес-результатов.
Требования
- Есть опыт работы с классическим ML от 2 лет.
- Умеешь работать с Git: создавать ветки, делать мердж реквесты, а также понимаешь, почему не стоит коммитить большие файлы или модели.
- Понимаешь принципы ООП.
- Умеешь декомпозировать код и придерживаешься код стайла.
- Есть опыт работы с любой SQL-базой данных: знаешь про индексы и оконные функции.
- Уверенно владеешь pandas.
- Есть опыт работы с фреймворками для визуализации.
- Владеешь методами генерации признаков и очистки данных.
- Умеешь строить пайплайн валидации.
Будет плюсом:
- Опыт работы с MLflow и Airflow.
- Базовые навыки в NLP: стеминг, лематизация, TF-IDF, расстояние Левенштейна, векторизация через Bert и готовность работать с NLP-задачами.
- Понимание, как работают A/B-тесты.