Чем предстоит заниматься:
- Развитие инструментов Data Governance: каталог данных DataHub и внутренние разработки Data Quality.
- Создание продуктовых и операционных отчетов с использованием SuperSet.
- Разработка кода на Python для интеграции open-source инструментов.
- Выполнение рутинных задач: написание документации и заполнение каталога данных.
Требования:
- Опыт работы в сфере анализа данных, DWH или Data Governance от 2 лет.
- Глубокое понимание типовых моделей хранилищ.
- Отличное знание SQL.
- Знание Python на уровне аналитика данных.
- Опыт работы с Airflow
Будет плюсом:
- Знание принципов DAMA DMBOK.
- Опыт работы с API DataHub.