Чем предстоит заниматься
- Разработка и внедрение решений ML и LLM на всех этапах: исследование, прототипирование, обучение, тестирование, развертывание и поддержка в продакшене
- Разработка и улучшение классификаторов изображений и текстов с использованием современных архитектур и методологий (ViT, BERT, Llama и др.)
- Оптимизация инференса моделей, повышение их производительности, сокращение задержек и расчет пропускной способности
- Развертывание моделей в Triton Inference Server, интеграция моделей в существующую инфраструктуру
Требования
- Опыт работы ML-инженером с end-to-end пайплайнами
- Умение быстро исследовать State-of-the-art подходы и технологии, разбираться в новых моделях и их применении.
- Опыт выкатки ML-моделей в production
- Владение Python, PyTorch, TensorFlow
- Глубокие знания в Computer Vision, NLP и опыт работы с VLM
- Опыт выкатки моделей в Triton Inference Server и их оптимизации
- Знание и применение метрик качества моделей
- Владение SQL
- Опыт работы с инструментами ClearML, MLflow или аналогичными платформами для мониторинга и управления ML-экспериментами.