Чем предстоит заниматься:
- Моделирование при помощи классических алгоритмов, моделирование в области задач NLP, работа с данными:
- Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей.
- Построение решений на базе LLM моделей \ разработка промптов
- Суммаризация, генерация на основе обращений клиентов
- Определение тональности информации по клиенту \ выделение негатива по клиенту с помощью LLM
- Построение RAG сервиса базы знаний по финансовому анализу и работе с залогами.
Требования:
- Высшее образование (IT, техническое, математическое).
- Уверенное владение Python, SQL, PySpark
- Понимание инструментов разработчика (типизация, логирование, тестирование)
- Хорошие знания в области теории вероятностей, математической статистики, алгоритмов машинного обучения ML \ DL (numpy, pandas, sklearn, nltk, spacy, pymorphy, natasha, regex и др.)
- Знания в области NLP алгоритмов, понимание деталей работы трансформеров, LLM.
- Опыт тюнинга моделей на различные задачи NLP.
- Опыт работы с библиотекой transformers, будет плюсом опыт работы с unsloth, peft, trl
- Желателен опыт работы с Langchain
- Желателен опыт вывода ML/NLP моделей в production
- Опыт в system design сервисов с спользованием трансформеров и LLM будет плюсом
- Опыт чтения и разбора научных статьей.