Чем предстоит заниматься:
- Проектировать и реализовывать ETL-слои для информационных потоков.
- Проектировать и реализовывать модели данных.
- Реализовывать расчетные показатели.
- Оптимизировать существующие скрипты по обработке данных.
- Создавать витрины для передачи данных в другие системы.
- Писать новый и поддерживать имеющийся код процедур и структуры баз данных.
- Реализовывать оптимальные решения по загрузке, преобразованию и хранению данных.
- Разрабатывать сверки для проверки качества данных
Требования:
- Опыт работы с хранилищами данных, понимание принципов ХД.
- Наличие опыта интеграции источников в хранилище данных.
- Опыт работы с СУБД Greenplum, PostgreSQL или Oracle.
- Знание SQL на продвинутом уровне.
Будет плюсом:
- Знание Python на базовом уровне.
- Опыт работы с Apache Airflow.