Чем предстоит заниматься:
- Настройка регулярного мониторинга drift'ов данных и целевых переменных;
- Разработка скриптов для сверки витрин по статистическим метрикам;
- Внедрение Deepchecks / Evidently в Airflow-пайплайн DQ-инструмент;
- Анализ влияния ошибок в данных на бизнес-модели и подготовка рекомендаций;
- Применение LLM, для выявления требований к данным, по их бизнес описанию.
Требования:
- Опыт разработки и эксплуатации ML-пайплайнов от 3 лет;
- Навыки анализа качества данных на входе в модель (drift, feature stability, missing data);
- Владение инструментами AI для DQ: Evidently, Deepchecks, scikit-learn, PyTorch (базово);
- Знание подходов версионирования данных и моделей (DVC, MLflow, Git-based workflow).
- Опыт в банке или финтехе;
- Участие в проектах по Explainable AI или Data Lineage;
- Опыт внедрения моделей в риск-функции, скоринг, антифрод.