Чем предстоит заниматься:
- Проведение полного цикла ML-исследований: анализ задачи, подбор методов, прототипирование, эксперименты, подготовка к продуктовому внедрению.
- Оптимизация инференса DL-моделей для высоконагруженной среды (работа с ONNX, квантизацией, распределением на несколько GPU).
- Улучшение архитектуры системы для автоматического обучения и дообучения моделей на данных пользователей.
- Поддержка и эксплуатация ML-моделей в продакшене: мониторинг, анализ проблем, реакция на инциденты, постоянная оптимизация производительности. Участие в командной работе: консультации, код-ревью, разработка автотестов.
Требования:
- Опыт end-to-end разработки и внедрения ML-решений на Python.
- Глубокие знания и практический опыт работы с PyTorch.
- Опыт решения промышленных задач в области NLP.
- Знание современных архитектур и подходов (трансформеры, техники для работы с LLM, RAG).
- Опыт работы с библиотеками и фреймворками для высокопроизводительного инференса: vLLM, ONNX Runtime, TensorRT.
- Понимание принципов построения высоконагруженных сервисов.
Будет плюсом:
- Опыт работы с инструментами MLOps (MLFlow, DVC, ClearML и т.п.).
- Знакомство со стеком агентских систем или диалоговых AI (LangChain, LlamaIndex и аналоги).
- Опыт в смежных областях: Computer Vision (для OCR), аудиообработка (ASR/TTS).
- Публикации, участие в Kaggle или сильные open-source проекты в области NLP/ML.
