Чем предстоит заниматься:
- Автоматизацией клиентской поддержки: LLM-агенты для клиентов, LLM-копилоты для операторов, классические NLU системы, анализ фото от клиентов (связка текстовых и картиночных моделей);
- Автоматизацией аналитики обратной связи (классификация, NER, кластеризация по данным отзывов от клиентов);
- Выбор, дообучение, анализ, оптимизация NLP моделей (LLM, transformers-based архитектуры) для повышения эффективности бизнеса;
- Сбор, постановка задачи разметки, предобработка, EDA данных, выбор offline/online метрик;
- Составление дизайна ML решения, сбор требований от продуктовой команды;
- Разработка RAG и агентских систем;
- Автоматизация ML процессов (дообучение, разметка, обновление сервисов), встраиванием моделей в FastAPI сервисы.
Требования:
- Знание NLP стека от tf-idf до LLM;
- Понимание отличий современных LLM, практический опыт работы с LLM (дообучение, оценка метрик, оптимизация инференса);
- Опыт работы в задачах классификации текста (BERT-like модели);
- Уверенное владение Python (ООП, PyTorch, Pandas, NumPy, Optuna, SciPy, scikit-learn);
- Хорошие знания классических ML моделей, метрик, лоссов;
- Опыт выкатки в продакшен классических/NLP моделей.
Будет плюсом:
- Опыт оптимизации Transformer/LLM-based сервисов под высокие продакшен нагрузки (ONNX, Triton, и прочее);
- Опыт моделирования и проведения A/B-тестов;
- Опыт реализации демо с помощью Gradio/Streamlit;
- Опыт работы с ASR/TTS моделями обработки аудиоданных.