Чем предстоит заниматься
- Построение, обучение и оптимизация моделей машинного обучения в задачах обработки текста, рекомендательных систем, задач прогнозирования
- Подготовка данных: построение пайплайнов обработки и генерация признаков
- Разработка и автоматизация тестирования моделей, поиск ошибок
- Внедрение моделей в существующие бизнес-процессы и реализация мониторинга для контроля качества работы моделей с использованием существующих библиотек
- Автоматизация переобучения моделей и разработка воспроизводимых ML-решений с использованием существующего конвейера моделей Lakehouse
- Документирование процессов разработки и внедрения ML-сервисов
Требования
- Опыт полного цикла решения ML задач: от аналитики до вывода моделей в прод (от 2 лет)
- Опыт работы с LLM/NLP
- Отличные знания Python, SQL, классического ML-стека и соответствующих ему библиотек
- Опыт работы с hugging face
- Умение обращаться с системой контроля версий git
- Базовая математическая (линейная алгебра, теорвер, матстат) и алгоритмическая (алгоритмы, структуры данных) подготовка
- Опыт с облачными сервисами и контейнеризацией (Docker, Kubernetes) как плюс
- Умение работать с технологиями распределенной обработки данных: Spark, S3, Airflow как плюс