Чем предстоит заниматься:
- Вести разработку и оптимизацию ETL процессов поставки данных;
- Проектировать структуру хранилища данных;
- Участвовать в создании и развитии data-продуктов команды;
- Погружаться в данные прикладных бизнес-областей, развивать методологию.
Требования:
- Продвинутый уровень работы с Python для анализа больших объемов данных (pandas, numpy, regexp, SQLAlchemy/psycopg);
- Знание SQL на продвинутом уровне (оконные функции, хранимые процедуры, триггеры, материализованные представления);
- Опыт работы с одной из SMP СУБД (Postgres / MySQL);
- Опыт работы с одной из MPP СУБД (Greenplum / Vertica);
- Опыт разработки ETL/ELT процессов;
- Опыт оптимизации вычислений.