Чем предстоит заниматься:
- Заниматься сопровождением сервисов от разработки до эксплуатации, участвовать в эксплуатации
- Дорабатывать текущие и разрабатывать новые сценарии конфигурирования серверов и приложений
- Планировать и участвовать в рефакторинге процессов, инфраструктуры, приложений
- Участвовать в разработке и управлении процессами развертывания и эксплуатации моделей машинного обучения
- Заниматься администрированием приложений по результатам выполненной работы подготавливать документацию, если это необходимо
- Настраивать инфраструктуру для запуска, мониторинга и автоматизации жизненного цикла моделей ML
- Интегрировать модели машинного обучения в процессы CI/CD и работать с контейнеризацией (Docker, Kubernetes)
- Разрабатывать и оптимизировать пайплайны данных и ML для развертывания на производственной среде
- Периодически проводить аудит используемого стека технологий
- Работать с большими объемами данных, их очищать, преобразовывать и предварительно обрабатывать
- Работать с высоконагруженными вычислениями, а также потоками данных в виде батчей и стримингов
Требования:
- Понимание основных алгоритмов машинного обучения и статистики
- Экспертиза в работе с виртуализацией, (GPU в бекграунде)
- Умение работать с высоконагруженными системами и большими объемами данных
- Навыки работы с OpenSource или облачными ML-платформами будут плюсом (Kubeflow, MLFlow, AWS, GCloud и так далее)
- Положительный и продолжительный опыт работы CI/CD-системами (у нас gitlab и jenkins)
- Уверенно работаете с Kubernetes
- Опыт программирования на скриптовых языках (shell, python)
- Опыт администрирования linux и веб-приложений
- Понимание сетевые технологии TCP/IP
- Опыт работы с системами управления версиями (у нас git)
- Опыт работы с системами управления конфигурациями
- Опыт работы с технологиями машинного обучения и их интеграции
- Знание SQL и опыт в разработке и эксплуатации пайплайнов подготовки данных будут плюсом