Чем предстоит заниматься:
- NLP задачи как в виде обучения моделей, так и в виде разработки вспомогательных сущностей на python;
- Решение задач машинного обучения и написания кода для нагруженных сервисов на Python;
- Развитие текстовой строки новых AI механик. Одна из целей команды - под ключ закрыть потребность общаться с человеком;
- Промпт тюнинг LLM с использованием API и внутренних сетей и fine tuning своих LLM.
Требования:
- NLP от 5 лет;
- Python: читаемый и поддерживаемый код;
- SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов;
- Apache стек: HDFS/Kafka/Spark (DF API);
- Разработка NLP моделей: от tfidf до llm ( работа с pytorch, transformers);
- Опыт в DL: обучение/дообучение собственных глубоких нейросетей;
- Классический ML: бустинги, линейные модели;
- Базовые знания CV: классификация, детекция, сегментация;
- Самостоятельное коммуницирование с заказчиками и смежниками.
- Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.
Стек: Python (Transformers, PyTorch, Numpy, Pandas, Sklearn, CatBoost); Hadoop (PySpark, Hive, Kafka); Airflow; Grafana; FineBI.
