Чем предстоит заниматься
- коммуникации с Заказчиком, проработка требований, перевод требования на язык ML, выбор подходов к реализации
- работа со структурированными и неструктурированными данными: поиск внутренних и внешних источников, сбор и анализ данных, проверка гипотез
- проведение RND для выбора лучших алгоритмов
- построение и поддержка аналитических и предиктивных моделей (Python + Spark + Sklearn + LGBM)
- построение и поддержка нейросетевых моделей: GNN (графовые нейронные сети), RNN, Transformers
- конструирование и отбор признаков
- построение аналитических отчетов по результатам проведенной работы
- обеспечение документирования результатов моделирования для передачи на валидацию
- подготовка скриптов для вывода моделей в ПРОМ
- постановка требований для Data Engineer по разработке новых витрин/объектов.
Требования
- опыт работы в области Data Science от 2 лет
- хорошее знание алгоритмов машинного обучения, нейронных сетей
- знание python-библиотек для работы с ML/DL (Sklearn, LGBM, XGBoost, Pytorch)
- знание принципов построения моделей на последовательностях событий, NLP, графах
- опыт промышленного внедрения моделей
- опыт работы распределенным хранилищем данных (Hadoop, Spark)
- понимание процессов ETL, ELT
- знание SQL
- знание банковской предметной области, банковских продуктов, финансовых инструментов
Будет плюсом
- опыт использование UDF для PySpark, особенности написания кода для стека Hadoop
- знание особенностей программирования в распределённых системах
- опыт работы с NoSQL базами данных
- распределенное обучение моделей на ресурсах GPU(А100/V100)/HGX
- знание SOTA алгоритмов в области AI.