Чем предстоит заниматься:
- Разрабатывать и поддерживать ETL процедуры в Airflow
- Проектировать, реализовывать и внедрять распределённые системы обработки и хранения данных
- Учавствовать в развитии архитектуры хранилища
- Работать с реляционными/NoSQL базами данных
- Разрабатывать и поддерживать процедуры автоматизации аналитической инфраструктуры
Требования:
- Ваш навык владения SQL на уровне анализа производительности запросов
- Уверенно владеете Python
- Имеете опыт в разработке хранилищ данных в роли разработчика на протяжении всего жизненного цикла проекта от 3 лет
- Имеете опыт работы с реляционными СУБД
- Есть опыт программирования БД (SQL или PL-SQL или T-SQL), опыт написания сложных запросов и хранимых процедур (Vertica, Oracle, ClickHouse, Postgre)
- Вы участвовали во внедрении и приемке системы
- У вас есть опыт разработки документации: технический (функциональный) дизайн, или техническое задание, или техническая спецификация
Будет плюсом:
- Современными code-driven ETL/ELT инструментами
- Распределенными колоночными СУБД (ClickHouse, Vertica, Greenplum)
- Docker, Kubernetes
- S3 хранилищем
- CI/CD процедурами