Чем предстоит заниматься
- разворачивать и поддерживать ML-инфраструктуру в Kubernetes: ML-модели, сервисы, базы данных;
- настраивать и оптимизировать инференс-сервисы и системы мониторинга;
- работать с облачными сервисами и управлять инфраструктурой через Terraform;
- автоматизировать деплоймент ML-сервисов и взаимодействовать с ML командой;
- поддерживать ClearML для управления эксперементами и автоматизации обучения и деплоя;
- оптимизировать CI/CD и развертывание моделей, улучшать инструменты для экспериментов и мониторинга.
Требования
- опыт 3+ лет в DevOps/MLOps или ML-разработке;
- владение Kubernetes и облачными технологиями;
- навыки работы с Helm, ArgoCD и написание Terraform-модулей;
- практика работы с мониторингом, логированием и ML-инференс серверами.