Чем предстоит заниматься:
- выявлять потребности бизнеса, анализировать бизнес-процессы и формулировать требования к ML-системе
- собирать данные из разных источников, оценивать их качество и полноту
- формулировать и проверять ML-гипотезы
- строить пайплайны обработки данных, обучать и оценивать ML-модели, встраивать модели в пайплайны инференса
- презентовать и защищать полученные результаты
Требования:
- опыт работы на позиции Data Scientist или Machine Learning Engineer от 3-х лет
- умение выявлять потребности бизнеса, формулировать требования
- умение оценивать качество и полноту данных, проектировать и реализовывать пайплайны подготовки данных
- умение формулировать ML-задачи исходя из потребностей бизнеса, обучать и оценивать ML-модели, встраивать модели в инференс-пайплайны
- опыт работы с данными временных рядов для решения задач машинного обучения (прогнозирование, классификация, кластеризация, детекция аномалий)
- хорошее знание Python и принципов ООП
- опыт работы с Pyspark, Pandas и SQL
- опыт работы с библиотеками и фреймворками для машинного обучения - LightGBM / CatBoost / XGBoost, TensorFlow / PyTorch, SciKit-Learn, Optuna
- опыт работы с инструментами MLflow, Docker
Будет плюсом:
- навыки работы c Yandex Cloud
- опыт работы с Airflow и Kubernetes