Чем предстоит заниматься:
- участвовать в полном цикле разработки программного обеспечения, включающего модели машинного обучения, в составе проектной кросс-функциональной команды;
- работать над структурой DWH-приложений, заниматься настройкой ETL-пайплайнов и мониторингом качества данных;
- разрабатывать витрины данных для аналитики и построения предиктивных моделей;
- заниматься разработкой архитектуры приложения;
- общаться с экспертами бизнес-заказчика.
Требования:
- понимаете SQL и можете составить нетривиальный запрос (включающий операторы JOIN, подзапросы и т. д.);
- пишете читабельный код на Python 3-й версии и не боитесь 2-й;
- работали с Bash, Git, Linux;
- разбираетесь в базовых концепциях и архитектуре Hadoop (HDFS, MapReduce, YARN), Spark, Hive;
- знаете о работе ОС, базовых алгоритмах и структурах данных.