Чем предстоит заниматься
- подготовка данных для обучения и тестирования моделей
- поиск точек роста, узких мест, нахождение путей улучшения качества моделей за счет данных
- предобработка, фильтрация и сегментация данных
- выстраивание архитектуры и написание пайплайнов разметки/сбора данных
- подбор online и offline метрик, анализ конечного продукта.
Требования
- опыт работы на Python на высоком уровне (алгоритмы, стуктура данных, GIL, async)
- опыт работы над улучшением качества моделей
- базовые знания статистики
Будет плюсом
- обучене в ШАД
- опыт краудсорсингом
- опвт работы с моделями разпознования речи/LLM