Чем предстоит заниматься
- Настройка и оптимизация инфраструктуры для запуска и масштабирования моделей в рабочих средах;
- Обеспечение стабильной работы моделей, включая автоматическое восстановление при сбоях.
- Разработка CI/CD-пайплайнов для обучения, тестирования и внедрения моделей;
- Внедрение систем мониторинга (Prometheus, Grafana) и управления версиями моделей.
- Снижение затрат на инференс через внедрение методов квантования, дистилляции и аппаратно-ориентированной оптимизации (ONNX, TensorRT);
- Анализ производительности моделей для выбора оптимальных фреймворков и форматов развертывания..
- Настройка отслеживания качества предсказаний, использования ресурсов и отклонений в данных;
- Создание инструментов для быстрого выявления и устранения проблем на основе метрик.
- Совместная работа с Data Science-командами над архитектурой решений, включая LLM-проекты и RAG-системы;
- Участие в планировании и внедрении ИИ-продуктов от идеи до реализации.
- Исследование современных инструментов для автоматизации ML-процессов;
- Адаптация экспериментальных методов (например, оптимизация нейросетей) для промышленного использования.
- Составление инструкций по работе с инфраструктурой и лучшим практикам (опыт с Kubeflow будет преимуществом).
- Проведение внутренних семинаров по MLOps-стандартам и инструментам автоматизации машинного обучения.
Требования
- Релевантный опыт от 3 лет