Чем предстоит заниматься
- разработка и имплементация новых ML/DL-архитектур для задач химии материалов, drug-дизайна и кристаллохимии (GNN, трансформеры, диффузионные модели);
- построение и ведение исследовательских пайплайнов: подготовка датасетов, воспроизводимое обучение/валидация, оптимизация гипер-параметров, интерпретация моделей;
- алгоритмическая разработка и прототипирование новых математических моделей: простые силовые поля, графовые алгоритмы, методы представления многокомпонентных систем;
- интеграция с вычислительной химией: связки с ORCA/Gaussian/CP2K/Psi4, RDKit/ASE; автоматизация расчётов DFT/MD и извлечение дескрипторов;
- подготовка статей, препринтов и презентаций, участие в заявках на гранты;
- наставничество: код-ревью, помощь студентам в экспериментах и разработке архитектур.
Требования
- оконченное высшее образование;
- владение Python (scikit-learn/PyTorch/JAX): архитектуры, качественный код, тесты, CI, упаковка;
- владение ML/DL: feature engineering, классические ML (XGBoost/GBDT), GNN, трансформеры;
- опыт проведения очистки/валидации датасетов, воспроизводимость;
- быстрая реализация идей в коде (прототип => библиотека), умение читать/встраивать SOTA-подходы;
- опыт настройки ML-инфраструктуры: Docker, slurm/SSH, управление экспериментами;
- инициативность, умение предлагать и тестировать гипотезы, системное мышление;
- готовность к код-ревью и открытой разработке, аккуратность в документации.
Будет плюсом
- степень кандидата наук
- опыт с генеративными моделями
- опыт построения Data Lake/DWH
- знание RDKit, DFT/MD
- опыт управления командой.