Чем предстоит заниматься:
- Разработка и оптимизация моделей на основе погодных и геоданных: подготовка пространственных моделей, предсказание урожайности и торговые стратегии.
- Проведение экспериментов с фичами, методами агрегации данных и моделями (CatBoost, временные ряды и другие классические ML-подходы).
- Анализ данных о погоде, спутниковых изображениях и почвенных условиях для улучшения точности прогнозов.
- Анализ рыночных сигналов для оптимизации торговой стратегии.
- Улучшения пайплайна обработки данных и моделей совместно с дата-инженерами.
Требования:
- Опыт работы с классическим ML (CatBoost, LGBM, временные ряды, линейные модели).
- Глубокое понимание работы с геоданными, погодными данными, а также предобработки временных рядов.
- Опыт работы с Python (pandas, NumPy, geopandas, xarray, pyspark - будет плюсом).
- Навыки работы с данными в SQL и хранилищах (S3, ClickHouse, PostgreSQL – как плюс) и обработкой данных (Airflow, Luigi, Flyte, Kafka).
- Опыт участия в R&D проектах, умение быстро проверять гипотезы.