Чем предстоит заниматься:
- Аналитика текущий проблем матчинга.
- Обучение новых NLP моделей (bi-encoder, late fusion, early fusion).
- Адаптация новых LLM/VLM моделей.
Требования:
- Коммерческий опыт в DS от 4 лет.
- Опыт в NLP от 2 лет.
- Опыт доведения моделей до прода.
- Знание как современных, так и классических подходов в NLP.
- Знание Python и PySpark (bigdata датасеты собираем на hadoop кластере).
- Знание алгоритмов и структур данных.
- Проактивность, большое желание развиваться, пробовать новое и добиваться от экспериментов пользы для production.
Будет плюсом:
- Успешное участие в соревнованиях по ML.
- Опыт в формировании протоколов разметки данных.