Чем предстоит заниматься:
- NLP задачи как в виде обучения моделей, так и в виде разработки вспомогательных сущностей на python;
- Решение задач машинного обучения и написания кода для нагруженных сервисов на Python;
- Развитие текстовой строки новых AI механик на проекте. Одна из целей команды - под ключ закрыть потребность общаться с человеком;
- Промпт тюнинг LLM с использованием API и внутренних сетей и fine tuning своих LLM.
Требования:
- Data Scientist от 4 лет;
- Python: читаемый и поддерживаемый код;
- SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов;
- Apache стек: HDFS/Kafka/Spark (DF API);
- Разработка NLP моделей: от tfidf до llm ( работа с pytorch, transformers);
- Опыт в DL: обучение/дообучение собственных глубоких нейросетей;
- Классический ML: бустинги, линейные модели;
- Базовые знания CV: классификация, детекция, сегментация;
- Самостоятельное коммуницирование с заказчиками и смежниками.
Будет плюсом:
- Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.