Чем предстоит заниматься
- построение и проверка бизнес-гипотез: от сбора ТЗ до реализации пилота
- работа с большими массивами данных (Spark, Hadoop, GreenPlum): поиск, объединение и нормализация данных, выявление инсайтов
- разработка ML-моделей (классификация, кластеризация, регрессия – преимущественно классический ML)
- тестирование целесообразности применения SOTA подходов в моделировании
- общение с заказчиками и DE
- работа с командой DS-разработчиков
- подведение итогов пилотов, участие в A/B тестировании.
Требования
- опыт работы Data Scientist от 2 лет
- образование по направлениям "Математика", «Физика», «Мат. методы в экономике», (желательно выпускники - МГУ, МФТИ, ВШЭ и других ведущих вузов страны)
- глубокие знания в области теории вероятностей, статистики
- понимание основных ML-алгоритмов
- владение Python и основными библиотеками для анализа данных (numpy, sklearn, pandas, matplotlib/seaborn/plotly, catboost/lightgbm/xgboost, etc.)
- владение одним из фреймворков DL, pyspark - преимущество.