Чем предстоит заниматься
- сбор, структурирование, анализ и подготовка данных для машинного обучения
- построение промышленных рекомендательных систем для продажи продуктов экосистемы и продуктов банка, встраивание их в сквозные бизнес-процессы банка
- ранжирование предложений компаниям с учетом контактных политик банка
- прогнозирование оттока по продуктам, объемам и активности пользования продуктами/услугами
- анализ транзакционной активности компаний и связанных с ней временных рядов
- создание и развитие ML-моделей, которые помогут нашим трейдерам принимать быстрые и точные решения на основе больших объемов данных
- защита ML-моделей при внутрибанковской валидации
- мониторинг ML-моделей в эксплуатации, анализ отклонений метрик качества
- fine-tuning ML-моделей
- создание AI-агентов
- оптимизация RAG систем
- prompt-tuning, дообучение, внедрение ML-моделей на основе LLM
- взаимодействие с бизнес-заказчиками и другими специалистами в рамках выполняемых задач.
Требования
- высшее образование (магистратура) в области Data Science, компьютерных наук, статистики, математики, эконометрики или смежных дисциплин
- опыт работы не менее 2-х лет в области Data Science
- программирование: Python (обязательно: pandas, scikit-learn, NumPy, SciPy); SQL (работа с реляционными БД)
- ML/AI: знание современных фреймворков: PyTorch, TensorFlow, Keras; опыт построения и внедрения моделей: классификация, регрессия, кластеризация, ранжирование, прогнозирование, NLP; опыт применения правил (rule-based) и шаблонов (template-based) для извлечения структурированных данных из известных форматов документов
- опыт работы с большими данными (Hadoop, Spark)
Будет плюсом
- опыт работы в кампаниях продаж банка
- знание PySpark, особенностей написания кода для стека Hadoop
- опыт применения LLM;
- сертификаты, призовые места хакатонов, высокие места в соревновательных задачах по АI.