Чем предстоит заниматься
- Настройка регулярного мониторинга drift'ов данных и целевых переменных
- Разработка скриптов для сверки витрин по статистическим метрикам
- Внедрение Deepchecks / Evidently в Airflow-пайплайн DQ-инструмент
- Анализ влияния ошибок в данных на бизнес-модели и подготовка рекомендаций
- Применение LLM, для выявления требований к данным, по их бизнес описанию
Требования
- Опыт разработки и эксплуатации ML-пайплайнов
- Навыки анализа качества данных на входе в модель (drift, feature stability, missing data)
- Владение инструментами AI для DQ: Evidently, Deepchecks, scikit-learn, PyTorch (базово)
- Знание подходов версионирования данных и моделей (DVC, MLflow, Git-based workflow)
- Умение работать с метаданными и профайлингом данных
- Навыки построения тестов качества данных / фичей в ML-продуктах
- Опыт интеграции проверок в CI/CD-процессы, ML-инфраструктуру
Будет плюсом: - Опыт в банке или финтехе
- Участие в проектах по Explainable AI или Data Lineage
- Опыт внедрения моделей в риск-функции, скоринг, антифрод