Чем предстоит заниматься:
- Организовывать сбор и интеграцию разнородных данных по планировкам (JSON, IFC, DWG, данные о площадях и конструктивных элементах)
- Проводить EDA: выявлять закономерности, находить аномалии, формировать статистические отчёты
- Разрабатывать конвейеры подготовки данных (очистка, нормализация, фильтрация)
- Настраивать аугментацию (отражения, масштабирование, добавление шумов)
- Определять и разрабатывать кастомные метрики качества для ML-моделей
- Проводить эксперименты по оптимизации гиперпараметров и улучшению генеративных моделей
- Анализировать влияние различных факторов (количество комнат, сложность контура) на результаты моделей
- Работать над алгоритмами пост-обработки (исправление контуров, расстановка дверей)
Стек:
- Python (Pandas, NumPy, SciPy, Plotly/Matplotlib)
- PostgreSQL, NoSQL-хранилища
- Методы факторного анализа, PCA, кластеризация
- PyTorch/TensorFlow (желательно, для экспериментов)
