Чем предстоит заниматься:
- Обучение и дообучение (fine-tuning) LoRA-адаптеров для diffusion-based моделей (image / video)
- Работа с open-source моделями (Stable Diffusion, SDXL, video diffusion и аналоги)
- Сборка end-to-end пайплайнов генерации
- Подготовка датасетов (curation, очистка, аугментации, разметка)
- Оптимизация inference (скорость, память, качество)
- Проведение экспериментов: сравнение подходов, гипотезы, улучшение качества генерации
- Взаимодействие с продуктовой и инженерной командой для внедрения решений в production
Требования:
- Коммерческий опыт работы с Computer Vision от 3 лет
- Практический опыт работы с diffusion models от 1 года
- Реальный опыт обучения LoRA (своими руками)
- Понимание архитектуры diffusion моделей (UNet, VAE, conditioning и т.д.)
- Опыт работы с GPU (CUDA, оптимизация обучения / инференса)
- Способность самостоятельно доводить эксперименты до результата
Будет плюсом:
- Свои публичные работы, пет-проекты или контрибьюции в open source
- Опыт с video generation моделями
- Участие в Kaggle / ML соревнованиях
