Стек:
k8s, Flux2, Airflow, Redis, Qdrant, ClearML, FastAPI, MongoDB, Spark, Kafka, Prometheus, Grafana.
Чем предстоит заниматься:
- Руководство командой MLOps: управлять, наставлять и развивать инженеров;
- Создание и внедрение MLOps-практик: стенды, DevOps-процессы, среды разработки, тестирования, инференса и мониторинга моделей (Batch, Streaming, CPU/GPU);
- Развитие LLMOps-практик: оптимизировать инференс LLM для ChatGPT-like решений;
- Внедрение и поддержка инструментов версионирования артефактов (ClearML, MLFlow, DVC и др.);
- Помощь команде Data Scientists в выводе моделей в прод;
- Развитие CI/CD и DAG-пайплайнов для разработки, тестирования и инференса моделей.
Требования:
- Работа в качестве DevOps/MLOps/ML Engineer не менее 4 лет;
- Опыт управления командой: планирование задач, код-ревью, развитие сотрудников от 1 года;
- Глубокие знания k8s: умение разрабатывать и поддерживать сервисы в этой среде.
- Опыт работы с MLOps-инструментами (ClearML, DVC, MLflow и др.).
- Навыки отладки Spark-job'ов и понимание ML-алгоритмов (бустинги, сетки, LLM, распределенные вычисления).
- Знание принципов организации распределенных информационных систем и баз данных.
- Работа с векторными базами данных (Qdrant, Milvus или аналогами);
- Знания в области Feature Store и обеспечения потоков данных;
- Опыт оптимизации GPU-инференса для LLM;
- Навыки разработки REST-сервисов.