Чем предстоит заниматься
- разрабатывать новые и поддерживать существующие ETL-процессы
- развивать хранилище данных проекта
- участвовать в подключениях внешних источников данных
- участвовать в сборе требований от бизнес- заказчика
- разрабатывать Модели и витрины данных
- разрабатывать аналитические отчеты для бизнеса.
Требования
- знание технологий СУБД: Greenplum, ClickHouse, Hive, SAP Hana
- знание ETL: Airflow, Spark, NiFi
- опыт с Apache Kafka или RabbitMQ
- знание Visualization: Celonis, Proceset, Apache Superset
- опыт с Python
- свободное владение SQL
- понимание принципов работы MPP СУБД
- опыт проектирования хранилищ данных
- опыт создания различных по сложности ETL-процессов.