Чем предстоит заниматься:
- улучшать алгоритмы поиска фрода и спама в сервисе, который обрабатывает тысячи событий в минуту;
- искать нетривиальные и эффективные решения реальных бизнес-задач;
- постоянно улучшать средства поиска фрода, чтобы они соответствовали постоянно изменяющейся внешней среде;
- экспериментировать со state-of-the-art методами машинного обучения в тех случаях, когда применение таких методов оправдано решаемой задачей;
- выкатывать модели в прод, следить за стабильностью работы, писать тесты, искать компромиссы между качеством и скоростью. А после внедрения, улучшать модели на основе данных и явного фидбэка от потребителей данных решений (как асессоров, так и от нарушителей наших правил).
Требования:
- имеете глубокое понимание ключевых методов, применяемых при решении задач машинного обучения, и границ применимости этих методов;
- имеете опыт решения различных Data Science-задач с использованием Python;
- имеете опыт в решении практических задач, связанных с NLP и табличными данными;
- умеете оценивать не только качество моделей при запуске нового проекта, но и изменение качества во времени;
- умеете писать SQL-запросы;
- умеете обращаться с системами управления версиями (например, git);
- имеете опыт написания production кода.
Будет плюсом:
- участвовали в различных открытых соревнованиях по анализу данных;
- проектировали и внедряли системы машинного обучения для решения реальных бизнес-задач и получили измеримые результаты этого внедрения;
- склонны документировать свои наработки, а также описывать и всесторонне критически оценивать результаты проведённых экспериментов.