Чем предстоит заниматься
- Разрабатывать и внедрять state-of-the-art модели CV - классификация, детекция, сегментация, OCR, генеративные модели (GANs, Diffusion) для улучшения изображений, мультимодальные системы (CLIP, BLIP) для анализа текста + изображений;
- Оптимизировать production-пайплайны - ускорение инференса (ONNX, TensorRT, квантизация), масштабирование на миллиарды изображений;
- Работать с данными - сбор, аугментация, weak/semi-supervised learning, аctive learning для эффективной разметки;
- Тесно взаимодействовать с продуктом, аналитикой и бэкендом - формулировать гипотезы, проводить A/B-тесты, интегрировать модели в высоконагруженные сервисы.
Требования
- Глубокие знания современных методов CV (ViT, Diffusion, Metric Learning);
- Опыт продакшн-внедрения (от обучения до масштабирования);
- Умение работать с большими данными (миллиарды изображений);
- Навыки оптимизации моделей (ускорение инференса, quantization);
- Готовность к исследовательским задачам + прикладному внедрению.