Чем предстоит заниматься:
- Сбор и синтез данных из разнородных источников (ЛК, CVM, транзакции, поведенческие метрики).
- Поиск закономерностей в неструктурированных наборах (логи, тексты, события, python, sql, spark).
- Подготовка функциональных требований к витринам: источники, частота расчёта, логика агрегации.
- Определение нефункциональных требований: SLA для real-time персонализации.
- Создание ТЗ .
- ПромтИнжиниринг.
- Разработка сценариев мультиагентного взаимодействия (ReAct-паттерны).
- Создание и обучение агентов на базе CopilotGPT для персонализации контента ЛК.
- Интеграция семантического поиска и смыслового соединения таблиц (как в проекте «CopilotGPT»).
- Подготовка отчётов для бизнеса по эффекту от внедрения персонализации.
- Обучение и менторинг аналитиков команды.
- Координация с data-engineer'ами, разработчиками фронтенда, ИБ.
- Коммуникация и менеджемента.
Требования:
- Опыт работы с Big Data: обработка и анализ больших объемов данных, знание технологий распределенного хранения и обработки (например, Hadoop, Spark).
- Уверенное владение PostgreSQL: написание сложных SQL-запросов, оптимизация, работа с индексами.
- Python: программирование для анализа данных, автоматизации, работы с ML-библиотеками.
- Знание MLOps: автоматизация развертывания, мониторинга и поддержки моделей машинного обучения.
- Навыки разработки нейросетевых моделей: проектирование, обучение, тестирование нейросетей.
- Опыт работы с LLM (Large Language Models): интеграция и применение крупных языковых моделей.
- Навыки prompt-ингиниринга: создание и оптимизация промптов для взаимодействия с LLM.
- Владение Git и GitLab: контроль версий, взаимодействие в команде.
- Базовые навыки работы в Linux: команды, навигация, работа с файлами.
- Построение отчетов: визуализация данных, создание информативных и понятных отчетов (QlikSense)