Требования:
- Опыт работы с моделями глубокого обучения для автоматического распознавания речи (ASR) и преобразования текста в речь (TTS).
- Опыт использования библиотек, таких как Espnet (будет плюсом), для разработки моделей шумоподавления, ASR и TTS.
- Знание Python, PyTorch или TensorFlow для разработки и тренировки моделей.
- Экспертиза в области обработки аудиосигналов и распознавания речи. инструментах визуализации;
Чем предстоит заниматься:
- Настройки моделей ASR, а также их оптимизации под разные условия использования
- Разработка моделей и fallback-стратегий