Обязанности
1.Задачи по треку AI4Science:
- разработка методов генеративного и предсказательного моделирования для научных задач, их гибридизация с методами оптимизации;
- глубокое обучение для предсказательного моделирования пространственно-временных данных (например - динамики океана и атмосферы);
- участие в разработке прогностической системы ледовых условий в морях российской Арктики;
- диффузионные и трансформерные модели для работы с пространственно- временными данными (обучение, дообучение, развертывание и аналитика);
- применение методов компьютерного зрения для прикладных лабораторных задач микроскопии;
- использование методов физически-обоснованного машинного обучения для построения моделей и предсказания состояния систем с пространственной-временной динамикой;
- разработка гибридных методов на базе Neural SDE для имитации коллективной динамики роев и прогнозирования их состояний в научных приложениях (робототехника, физика);
- прогнозирование эволюции сложных систем (рои роботов) с помощью DL на основе непрерывных SDE-моделей;
- другие задачи с физически-обоснованными методами (подробнее).
Требуемые навыки:
- уверенное владение PyTorch для написания и обучения нейронных сетей, понимание принципов обучения и подготовки данных;
- основы статистики.
2.Задачи по треку AI4Industry:
- разработка методов автоматизированного построения онтологий и графов знаний по нормативным документам предметной области;
- разработка алгоритмов валидации, поиска противоречий и дублей в кросс-доменных знаниях;
- LLM и генетическая эволюция для выращивания алгоритмов решения NP-трудных комбинаторных задач;
- методы автоматизированного решения комбинаторной задачи оптимизации календарного планирования (RCPSP) в условиях реальных проектов.
Требуемые навыки:
- понимание основ работы эволюционных генетических алгоритмов (для проектов по комбинаторной оптимизации).
3.Задачи трека по мультиагентным LLM:
- исследование структур графов внешних знаний для мультиагентных LLM, поиск оптимальных;
- разработка симуляторов на основе мультиагентных LLM для исследования поведения LLM агентов в экономических и социальных играх;
- разработка генератора синтетических графов знаний и графов инструментов для задач с мультиагентными LLM;
- исследование методов автоматического построения графов знаний по данным;
- генерация синтетических данных с помощью LLM;
- исследование методов автоматического создания МАС (мульти-агентные системы), обучение мета-агентов и автоматическая оценка их качества;
- применение МАС для прикладных задач;
- исследование новых методов RAG, в частности применение графов знаний совместно с RAG и ответы на “широкие” вопросы, требующие знаний со всего корпуса документов;
- исследование и практическое применение методов редактирования знаний для улучшения работы отдельных агентов;
- апробация и исследование методов работы с долгой (long-term) памятью агентов;
- имплементация визуальной обработки документов / чертежей / схем с помощью мультимодальных LLM;
- разработка бенчмарков для исследования работ МАС в разных условиях;
- разработка инструментов (в т.ч. с применением MCP (message context protocol)) для агентов: визуализация, exhaustive search, интеграция с kubernetes и yandex.cloud.
Требуемые навыки:
- знание основ теории графов и графовых алгоритмов;
- опыт работы с агентными LLM.
Требования
- базовые знания по методам ML/DL, кругозор в современных методах, уверенные навыки работы с Python и ML/DL библиотеками;
- уверенное чтение и владение английским языком на уровне, достаточном для чтения статей и технической документации (B1+);
- программирование на Python на продвинутом уровне (пакеты PyTorch, Numpy, Pandas, Matplotlib)? также в понимание программной документации;
- опыт работы с системами версионирования кода (GitHub/GitLab);
- знания и практические навыки решения ML/DL задач
- понимание основных принципов работы LLM;
- самостоятельность и ответственность;
- проект предполагает регулярные митинги и общение с командой.
- наличие мотивационного письма по вакансии.