В сети появились сообщения об обновлении DeepSeek V3 — одной из самых популярных нейросетей. Модель получила массивный апдейт весом 700 ГБ. Официального анонса от DeepSeek пока нет, но первые тестеры уже делятся впечатлениями: ИИ стал значительно мощнее, особенно в задачах по математике и программированию.
Что известно:
  • Размер обновления: 700 ГБ — это огромный объём, намекающий на серьёзное расширение данных или архитектуры. Для сравнения, полная версия DeepSeek V3 на Hugging Face ранее занимала около 685 ГБ (671 ГБ основная модель + 14 ГБ модуля Multi-Token Prediction). Возможно, добавили новые веса или улучшили структуру Mixture-of-Experts (MoE).
  • Улучшения: Тестеры на X отмечают «взлёт» в математике и коде. Есть слухи, что решена проблема с вызовом функций (function calling), что открывает путь к новым применениям.
  • Доступность: Модель пока не интегрирована в официальный чат DeepSeek, но уже появилась на платформе OpenRouter. Там её можно опробовать бесплатно прямо сейчас. 
DeepSeek V3 и раньше выделялся: 671 миллиард параметров, обучение на 14,8 триллиона токенов и производительность на уровне топовых закрытых моделей вроде GPT-4o. Новый апдейт, судя по отзывам, делает его ещё конкурентоспособнее.
Без официального заявления от DeepSeek остаётся гадать, что именно вошло в 700 ГБ — больше данных, новая архитектура или что-то ещё. Но те, кто уже протестировал модель, в восторге.