Чем предстоит заниматься
- Разработка и внедрение систем на основе Retrieval-Augmented Generation (RAG) для улучшения качества генерации текста.
- Проектирование и реализация агентных систем, способных взаимодействовать с пользователями и выполнять сложные задачи. Исследование и внедрение новых технологий и подходов в агентных системах.
- Работа в тесном сотрудничестве с командами разработчиков, аналитиков и других специалистов для интеграции NLP решений в продукты компании.
- Создание внутренних бенчмарков для систем RAG и агентных систем.
- Проведение тестирования и валидации моделей, а также анализ их производительности.
- Дообучение open-source моделей для RAG и агентных систем.
Требования
- Опыт 2+ лет в NLP/ML;
- Работа с RAG;
- Понимание различных архитектур RAG, этапов retrieval и reranking;
- Знание методов обучения каждого из этапов (langchain, llamaindex);
- Fine-tuning LLM (PyTorch, transformers);
- Построение агентных и мультиагентных систем (langchain/langgraph/langfuse, smol-agents, openai swarm);
- Экспертиза в бэкенде для ML и облачных технологиях.
Будет плюсом:
- Понимание DevOps процессов (выкатка на k8s, мониторинг, алертинг);
- Опыт работы с Docker, виртуальными машинами, k8s;
- Опыт Inference моделей (FastApi/KServe/TorchServe/Nvidia Triton/vLLM/SgLang);
- Навыки инженера-новатора:
- Опыт в ML System Design;
- Умение принимать решения в условиях неопределенности (стартап-среда).