Чем предстоит заниматься
- обработка сырых данных
- генерация гипотез
- построение пайплайна обработки данны
- подготовка и проведение А/В тестов
- обучение моделей
- валидация работы моделей
- разработка отчетности
- расчет статистических показателей
Требования
- опыт работы с задачами машинного обучения/опыт статистической обработки данных от 1,5 лет
- опыт разработки на Python, опыт code review
- опыт работы с библиотеками для анализа данных: pandas, matplotlib, numpy, sklearn
- уверенные навыки использования Linux, Jupyter notebook, git, SQL
- знание основных моделей машинного обучения: градиентный бустинг на основе деревьев решений, логистическая регрессия с регуляризацией, метод ближайших соседей
- знание способов проверки гипотез
- опыт самостоятельного ведения темы: анализ требований, декомпозиция, реализация, оценка результата, формулировка выводов, презентация/визуализация результатов
- доп. навыки: базовые навыки в airflow, pyspark, dvc