AI News Watcher
Wednesday, May 28, 2025  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · May 28, 2025 · 2 min read · DeepSeek ← Back to feed

DeepSeek-R1-0528: Новые возможности рассуждения и функции daily

На рынке LLM, где каждый новый релиз обещает "лучшую логику", DeepSeek делает конкретный шаг с обновлением своей модели deepseek-reasoner до версии deepseek-r1-0528. Этот релиз не просто заявляет об улучшениях, но и подкрепляет их заметным ростом в ключевых бенчмарках, указывая на сдвиг в сторону более надежных и функциональных моделей.

Hero illustration: DeepSeek-R1-0528: Новые возможности рассуждения и функции.

Редакция · Daily briefing

Стоит читать если: вы используете модели DeepSeek для задач, требующих сложных рассуждений, или заинтересованы в моделях с поддержкой JSON-вывода и вызова функций. Можно пропустить если: вы не работаете с моделями DeepSeek или ваши задачи не связаны с автоматизацией логических операций.

Детали обновления DeepSeek-R1-0528

Модель deepseek-reasoner была обновлена до версии R1-0528, демонстрируя значительные улучшения в задачах, требующих рассуждения.

Улучшение рассуждений по бенчмаркам. DeepSeek сообщает о заметном росте производительности в нескольких бенчмарках (Pass@1):

Эти цифры указывают на то, что модель deepseek-r1 стала более способной обрабатывать сложные логические и математические задачи, а также задачи кодирования и критического мышления.

Оптимизация для фронтенд-разработки. В рамках обновления заявлена оптимизация разработки внешнего интерфейса, что выражается в улучшении эстетики генерируемых веб-страниц и игр. Это может быть полезно для инженеров, использующих модели для прототипирования UI или генерации кода пользовательских интерфейсов.

Снижение галлюцинаций. По сравнению с предыдущей версией R1, количество галлюцинаций в DeepSeek-R1-0528 было уменьшено, что повышает надежность генерируемого контента.

Поддержка вывода JSON и вызова функций. Добавлена поддержка вывода в формате JSON и вызова функций (tool use), что критично для интеграции моделей в автоматизированные пайплайны и построения агентов. Производительность этой функциональности по Tau-bench составляет 53.5 (Airline) и 63.9 (Retail).

Веса модели в открытом доступе. Веса модели DeepSeek-R1-0528 доступны для скачивания на Hugging Face, что позволяет разработчикам использовать и дорабатывать её локально.

Что важно знать

Комплексные задачи рассуждения могут потреблять больше токенов. При планировании рабочих процессов с новой моделью следует учитывать потенциальное увеличение расходов на токены.

Ссылки:

Что это значит

Улучшенные возможности рассуждения и нативная поддержка вызова функций с выводом JSON делают DeepSeek-R1-0528 более привлекательным инструментом для создания автономных агентов и систем, где требуется не только генерация текста, но и взаимодействие со сложными API или внешними инструментами. Это также может снизить накладные расходы на парсинг и валидацию ответов модели, упрощая разработку.

Источники

  1. https://api-docs.deepseek.com/updates docs
  2. https://api-docs.deepseek.com/news/news250528 docs
  3. https://huggingface.co/deepseek-ai/DeepSeek-R1-0528 docs