История YOLO – самой известной архитектуры компьютерного зрения
Какие технические прорывы стоят за 8-летней историей и одиннадцатью версиями алгоритма?
Читать далее
Сейчас читают
Тематическое моделирование c BigARTM
Разбираемся с теорией и практикой одного из важнейших направлений NLP
Читать далее
Что, если не трансформеры: какие альтернативы главной архитектуре нейросетей у нас есть в 2024 году
Рассказываем про RNN, SSM и модификации внимания
Читать далее
Карьерный рост в Data Science и Machine Learning: взгляд изнутри от Александра Толмачева
Александр – директор по машинному обучению и анализу данных в Ozon Fintech
Читать далее
ML в Авито: как работают рекомендации, LLM и монетизация в крупнейшем сервисе объявлений
Интервью с руководителями ведущих ML-команд компании
Читать далее
Дистилляция и прунинг на примере Llama-3.1-Minitron
Новая опенсорс-SOTA модель на 4В от Nvidia
Читать далее
DeepSeekMath или как научить LLM решать математические задачи
DeepSeek – команда китайских исследователей, которые занимаются большими языковыми моделями и AG...
Читать далее
Погружение в xLSTM – обновленную LSTM, которая может оказаться заменой трансформера
Исследователи, которые в 1997 году изобрели архитектуру LSTM, спустя 27 лет выпустили «обновлени...
Читать далее
Разбор статьи про KAN – принципиально новую архитектуру нейросетей
Исследователи представили альтернативу перцептрону, получившую название Kolmogorov-Arnold Networ...
Читать далее
RecTools – OpenSource библиотека для рекомендательных систем
Это библиотека, где собраны самые часто используемые модели для рекомендательных систем. Также с...
Читать далее