Новости AI-стека
Daily · свежие материалы
DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API
DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.
DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания
DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
Cohere убирает Embed v2 и Aya 8B: что делать с кодом?
Если вы используете старые модели Cohere для эмбеддингов или чата, возможно, ваши сервисы уже столкнулись с ошибками. С 4 апреля Cohere полностью вывел из эксплуатации пять моделей API, включая версии Embed v2.0 и Aya…
Cohere расширяет горизонты: новая модель ASR Transcribe
Cohere, до сих пор преимущественно известный своими сильными позициями в области обработки естественного языка, сделал неожиданный, но логичный шаг в сторону нового домена — автоматического распознавания речи. Этот…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Cohere Rerank v4.0: ранжирование данных теперь с двумя режимами
Для инженеров, которые разрабатывают поисковые и рекомендательные системы, качество и задержка моделей переранжирования напрямую влияют на пользовательский опыт. Cohere обновила свою основную модель ранжирования…
DeepSeek-V3.2: Две модели и временный чемпион по рассуждению
Необычный шаг от DeepSeek: наряду с регулярным обновлением до версии deepseek-v3-2, компания выпустила крайне производительную, но временную модель deepseek-v3-2-speciale. Это создает интересную дилемму для…
DeepSeek-V3.2-Exp: разреженное внимание ускоряет длинный контекст и снижает цены
Когда провайдеры моделей радикально меняют архитектуру, это обычно означает одно из двух: либо решаются фундаментальные проблемы производительности, либо открываются новые возможности для разработчиков. В случае с…
DeepSeek-V3.1-Terminus: фокус на консистентность и агентов
Гибридные модели, совмещающие разные языки, часто привносят неожиданные артефакты в выводе. DeepSeek выпустил обновление V3.1-Terminus для своих моделей deepseek-chat и deepseek-reasoner, заявленная цель которого — не…
DeepSeek-V3.1: Гибридная архитектура объединяет мысль и скорость
DeepSeek выпустил новую модель deepseek-v3-1, которая стирает границу между режимами «думающий» (thinking) и «недумающий» (non-thinking). Теперь эти два подхода объединены в единую гибридную архитектуру, что должно…
DeepSeek-R1-0528: Новые возможности рассуждения и функции
На рынке LLM, где каждый новый релиз обещает "лучшую логику", DeepSeek делает конкретный шаг с обновлением своей модели deepseek-reasoner до версии deepseek-r1-0528. Этот релиз не просто заявляет об улучшениях, но и…
DeepSeek-R1: Новое поколение моделей рассуждений и открытый исходный код
Когда речь заходит о больших языковых моделях, производительность в задачах рассуждений (reasoning), математики и кодирования часто становится главным камнем преткновения. Как добиться паритета с лидерами рынка…