Чем предстоит заниматься:
- Развитие компонентов ML-платформы в парадигме Model as a Service
- Развитие Observability сервисов ML-платформы
- Реализация и сопровождение сервисов на Python
- Покрытие кода тестами
- Документирование разрабатываемых решений
- Проведение Code Review
Требования:
- DevOps: понимание docker, k8s и gitlab ci-cd
- MLOps: oбщее понимание терминологии, концепций и составляющих архитектуры ML-инфраструктуры; oпыт разворачивания MLFlow и NVIDIA Triton Inference Server
- Python: realtime-сервисы и асинхронное программирование, юнит-тестирование и окружение для разработки (pyproject, poetry, environment, make-файлы, линтеры, форматеры)
- Airflow
- GRPC
Будет плюсом:
- Опыт построения промышленной ML-инфраструктуры (получение фичей, сервинг моделей, настройка Observability)
- Базовое знание Hadoop (Spark, Yarn, Hive, HDFS)
- Умение оптимизировать код для real-time работы.