DeepSeek выпустила гибридную модель V3.1 с «базовым» и «рассуждающим» режимами

DeepSeek выпустила гибридную модель V3.1 с «базовым» и «рассуждающим» режимами

Фомин Фёдор
ChatGPTAIСтатья

Количество токенов, которые тратят на поиск ответа R1 и V3.1. Источник: DeepSeek

Её также оптимизировали для китайских чипов, пишет Reuters.

  • Это обновлённая версия флагманской модели V3, её добавили в бесплатный чат-бот DeepSeek. По словам компании, V3.1-Think отвечает быстрее «рассуждающей» R1, тратя меньше токенов на поиск решения.

  • По данным внутренних тестов, наиболее заметные улучшения — в навыках ИИ-агента: поиске информации, использовании браузера, выполнении многоэтапных задач.

  • Изображение

Модель научилась использовать инструменты лучше R1. Источник: DeepSeek

  • V3.1 в режиме «рассуждений» обошла Claude 4 Sonnet в тестах независимых исследователей Artificial Analysis на научные знания, математику и написание кода.

Изображение

Источник: Artificial Analysis

  • Веса модели выложили на HuggingFace. Она также доступна в API. С 5 сентября 2025 года работа с моделью там будет стоить $0,56 за 1 млн входных токенов и $1,68 за 1 млн выходных — без разделения на «базовый» и «рассуждающий» режим. Длину контекста в API увеличили до 128 тысяч токенов. DeepSeek также добавила совместимость с API от Anthropic.

  • Financial Times 14 августа 2025 года сообщило, что DeepSeeek столкнулась с трудностями из-за качества китайских чипов. Новая модель R2 не устраивала гендиректора Лян Вэньфэна, и DeepSeek откладывала выпуск, запланированный на май 2025 года. Huawei Central писало, что R2 могут выпустить с 15 по 30 августа 2025 года.

Источник: DeepSeek выпустила гибридную модель V3.1 с «базовым» и «рассуждающим» режимами — AI на vc.ru

29

Комментарии (0)

Для добавления комментариев необходимо