Чем предстоит заниматься
- Вам предстоит погрузиться в анализ графов, связывающих миллиарды идентификаторов устройств и пользователей. Ваша цель — выявлять скрытые поведенческие паттерны и закономерности, которые помогут точнее понимать, какие устройства и аккаунты принадлежат одному человеку или связаны между собой.
- Ключевая часть работы — это разработка, обучение и совершенствование ML-моделей (от классических алгоритмов до современных нейросетей). Вы будете улучшать качество склейки, чтобы обеспечить максимально полную и точную картину поведения каждого пользователя Яндекса.
- Вам предстоит внедрять ваши ML-решения в реальные production-сервисы, которые обрабатывают колоссальные объёмы данных — миллионы запросов в секунду, и оптимизировать их. Задача — обеспечить стабильность, скорость и эффективность работы этих систем, чтобы сервис не захлебнулся под нагрузкой.
- Ваша работа будет напрямую связана с повышением качества персонализации, особенно в рекламных сервисах Яндекса. Вы будете постоянно работать над улучшением ключевых метрик сервиса Склейка, что в итоге приведёт к более релевантной рекламе для пользователей и росту доходов компании.
Требования
- Глубоко разбираетесь в ML: уверенно применяете классические методы и нейросети
- Владеете Python (Pandas, NumPy, CatBoost, Scikit-learn, PyTorch), SQL (оптимизация тяжёлых запросов), C++ (для высоконагруженных компонентов)
- Работаете с Big Data: имеете опыт обработки крупных распределённых данных
Будет плюсом
- Работали с графовыми данными
- Понимаете веб-технологии: устройство cookie, user agent, механизмы трекинга