Чем предстоит заниматься
- Чтение и разбор статей. Мы находимся в постоянном поиске новых технологий и заглядываем за горизонт. Надо будет читать статьи, искать новые подходы, воспроизводить их и тестировать на наших данных.
- Сбор и подготовка данных для обучения моделей. Надо из сырых данных пользовательского взаимодействия с контентом выгружать и формировать данные в нужном для обучения формате.
- Разработка контентных моделей. У нас есть разные типы контента: длинные видео, короткие клипы, посты. Нужно разрабатывать модели, которые будут генерировать эмбеддинги, а затем их использовать для улучшения качества рекомендаций и не только.
- Разработка и тестирование алгоритмов рекомендаций. Надо будет читать статьи, изучать SOTA подходы к рекомендательным системам, тестировать разные алгоритмы. Все тесты логировать, принимать решение о том, какие алгоритмы будем использовать. Принимать решение не только на основе метрик, но и на основе того, как это будет работать и масштабироваться в продакшене.
Требования
- Практический опыт работы в ML;
- Опыт построения нейросетевых моделей;
- Уверенное знание python;
- Опыт оптимизации и внедрения моделей в продакшн;
- Знание классических алгоритмов и структур данных
Будет плюсом
- Умение писать продакшн код;
- Знание SQL;
- Опыт построения рекомендательных систем;
- Опыт чтения и воспроизведения алгоритмов из научных статей;