Чем предстоит заниматься
- Прототипировать агенты и проверять продуктовые гипотезы
- Собирать синтетическую и человеческую разметку для supervised-обучения
- Внедрять и платформизировать успешные кейсы
- Контролировать качество работы LLM, разрабатывать механизмы безопасности, работать с дата-дрифтом
- Заниматься RnD в методах алаймента под задачи агентов
- Заниматься дизайном доменной адаптации под задачи поддержки
Требования
- Уже работали с LLM или делали пет-проекты с языковыми моделями
- Умеете писать и поддерживать код в большой команде
- Можете легко имплементировать loss для обучения нового метода онлайн-алаймента и аккуратно поставить серию экспериментов для его проверки
- У вас есть насмотренность в тематике LLM: посматриваете в daily papers и можете объяснить, как учили R1