Чем предстоит заниматься
- анализировать новые подходы, разбирать научные статьи, генерировать и проверять гипотезы для улучшения качества работы генеративных рекомендательных моделей
- имплементировать гипотезы на Python, писать эффективный и масштабируемый код для тренировки и инференса моделей на PyTorch, проводить эксперименты на GPU-кластере
- дизайнить постановки экспериментов, таргеты, reward-функции, метрики качества, готовить данные под эксперимент
- до-обучать LLM (Fine-tuning и Alignment) под специфику рекомендательного домена.
Требования
- математический бэкграунд
- опыт работы в Data Science от 3-х лет
- хорошее знание Deep Learning, прикладной опыт обучения моделей
- уверенное владение Python и PyTorch, опыт работы с ключевыми ML/DL фреймворками (экосистема Hugging Face, Lightning)
- понимание текущего состояния индустрии в области Generative AI.
Будет плюсом:
- опыт работы в области RecSys или NLP
- опыт распределенного обучение больших моделей на GPU-кластере
- опыт до-обучения и валидации качества LLM, опыт с фреймворками TRL/verl
- умение работать с большими данными (таблицы, временные ряды) на PySpark.