Чем предстоит заниматься:
- Разработка хранилищ данных, витрин данных;
- Проектирование, разработка и поддержка ETL-процессов;
- Контроль качества загружаемых данных (ручные и автоматические тесты DQ);
- Интеграция новых источников;
- Работа в команде с системными аналитиками.
Требования:
- Опыт в языках программирования: SQL, Python;
- Опыт работы с одним или несколькими СУБД: PostgreSQL, Clickhouse, Greenplum, MS SQL Server;
- Опыт использования ETL инструментов: Apache NiFi, Apache Airflow;
Будет плюсом:
- Опыт работы с Hadoop, PySpark;
- Опыт работы с Apache Kafka;
- Опыт работы с Arenadata.