![fgfgf](/_next/image?url=%2Fmedia%2F2024-05-23%2016.31.45.jpg&w=1080&q=75)
DeepSeekMath или как научить LLM решать математические задачи
DeepSeek – команда китайских исследователей, которые занимаются большими языковыми моделями и AGI. Несколько месяцев назад они релизнули DeepSeekMath – модель, созданную для решения задач по м...
Читать далее
Сейчас читают
![дынь](/_next/image?url=%2Fmedia%2F%C3%90%C2%A1%C3%90%C2%BD%C3%90%C2%B8%C3%90%C2%BC%C3%90%C2%BE%C3%90%C2%BA%20%C3%91%C2%8D%C3%90%C2%BA%C3%91%C2%80%C3%90%C2%B0%C3%90%C2%BD%C3%90%C2%B0%202024-05-09%20%C3%90%C2%B2%2013.43.43.png&w=828&q=75)
Погружение в xLSTM – обновленную LSTM, которая может оказаться заменой трансформера
Исследователи, которые в 1997 году изобрели архитектуру LSTM, спустя 27 лет выпустили «обновлени...
Читать далее
![мо](/_next/image?url=%2Fmedia%2FFrame%201321314700.png&w=828&q=75)
Разбор статьи про KAN – принципиально новую архитектуру нейросетей
Исследователи представили альтернативу перцептрону, получившую название Kolmogorov-Arnold Networ...
Читать далее
![обложка-1](/_next/image?url=%2Fmedia%2F%C3%90%C2%BE%C3%90%C2%B1%C3%90%C2%BB%C3%90%C2%BE%C3%90%C2%B6%C3%90%C2%BA%C3%90%C2%B0-1.png&w=828&q=75)
RecTools – OpenSource библиотека для рекомендательных систем
Это библиотека, где собраны самые часто используемые модели для рекомендательных систем. Также с...
Читать далее