Чем предстоит заниматься
- Совершенствовать уже существующих и разрабатывать новых AI-агентов для подачи/анализа инициатив
- Участвовать в опромышливании создаваемых AI-агентов
- Решать классические NLP-задачи (занимаемся семантическим поиском, кластеризацией, классификацией, саммаризацией, перефразированием и тд.)
- Взаимодействовать с бизнес-заказчиком для определения требований и постановки задач
- Обучать и адаптировать LLM для решения задач внутри продукта (SFT, prompt-tuninng, RAG)
- Разрабатывать AI-агентов от идеи до вывода в продакшн (сбор и поиск данных, предобработка, разработка архитектуры AI-агента, создание PoC, проведение демо, доработка MVP, создание микросервиса, деплой и вывод в ПРОМ).
Требования
- Опыт работы на позиции Data Scientist от 2-х лет
- Профильное образование (прикладная математика, компьютерные науки, теоретическая и прикладная лингвистика)
- Уверенное владение Python
- Глубокие знания в NLP (статистические методы (n-граммы, tf-idf), нейронные сети (сверхточные, рекуррентные), трансформеры)
- Опыт в применении различных методов адаптации и дообучения языковых моделей (fine-tuning, p-tuninng, prompt-tunig, SFT)
- Владение Python-библиотеками для анализа данных (pandas, numpy, matplotlib, seaborn)
- Опыт работы с ML/NLP-фреймворками и библиотеками (Scikit-learn, Pytorch, transformers, LangChain, LangGraph, pymorphy2, NLTK, Gensim, spacy, regexp)
- Опыт работы с bash/git
- Оставаться up-to-date с новейшими разработками в области NLP и LLM
- Навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом
- Опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов
- Инструментальное владение AI для анализа, генерации и автоматизации.