Data Secrets

Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей;
Построение решений на базе LLM моделей \ разработка промптов;
Суммаризация информации для генерации кода и тестов;
Генерация кода и тестов с помощью LLM;
Определение роли пользователя \ выделение навыков с помощью LLM;
Генерация рекомендаций по улучшению кода пользователя с помощью LLM;
Построение RAG сервиса базы знаний по коду и тестам;
Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов

Опыт работы в области NLP/LLM/ML от 2х лет;
Высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей;
Детальное понимание моделей машинного обучения и алгоритмов;
Уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code;
Знания Linux, bash, Docker (более глубокие знания DevOps будут плюсом, но не обязательны);
Знание classic ML/NLP - инструментов (numpy, pandas, sklearn, gradio, nltk, spacy, pymorphy, natasha, regex и др.);
Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch;
Опыт/знание хотя бы 1 фреймворка деплоя/квантизации: vLLM, CTranslate2, OpenLLM, DeepSpeed-MII, Text generation inference;
Вывод ML/NLP моделей через интерфейс (gradio/streamlit, fastapi/flask, FastChat).

Решение задач, направленных на обработку и структурирование текстовой информации для разработки моделей;
Построение решений на базе LLM моделей \ разработка промптов;
Суммаризация информации для генерации кода и тестов;
Генерация кода и тестов с помощью LLM;
Определение роли пользователя \ выделение навыков с помощью LLM;
Генерация рекомендаций по улучшению кода пользователя с помощью LLM;
Построение RAG сервиса базы знаний по коду и тестам;
Формулирование гипотез для улучшения алгоритмов и сервисов, реализация дизайна экспериментов, проведение экспериментов с анализом итоговых результатов

Опыт работы в области NLP/LLM/ML от 2х лет;
Высокий уровень математического аппарата - математический анализ, линейная алгебра, теория вероятностей;
Детальное понимание моделей машинного обучения и алгоритмов;
Уверенное владение языком Python 3.х, будет плюсом: ООП, паттерны, Web, Clean code;
Знания Linux, bash, Docker (более глубокие знания DevOps будут плюсом, но не обязательны);
Знание classic ML/NLP - инструментов (numpy, pandas, sklearn, gradio, nltk, spacy, pymorphy, natasha, regex и др.);
Опыт тюнинга моделей на различные задачи NLP (Question Answering, Code Search, Code Completion, Text Classification, POS Tagging, Machine Translation) и работы с эмбеддингами w2v, fastText, BERT, BM25 на PyTorch;
Опыт/знание хотя бы 1 фреймворка деплоя/квантизации: vLLM, CTranslate2, OpenLLM, DeepSpeed-MII, Text generation inference;
Вывод ML/NLP моделей через интерфейс (gradio/streamlit, fastapi/flask, FastChat).

Middle Data Science