Новости AI-стека
Daily · свежие материалы
Cerebras: суверенитет в ИИ — как его видит производитель вафельных чипов
Cerebras запускает глобальную инициативу “Cerebras for Nations” для поддержки стран в развитии собственного ИИ, обеспечивая контроль над инфраструктурой, моделями и данными.
Cohere Labs: «Эмоциональные» отчёты меняют координацию ИИ-агентов
Компания продемонстрировала новые подходы к координации ИИ-агентов и активно интегрировалась в технологическое сообщество Торонто.
Grok Build: агент для кода прямо в терминале
xAI представила раннюю бета-версию Grok Build — мощного агента для кодирования в командной строке, доступного подписчикам SuperGrok и X Premium Plus.
DeepSeek-V4-Pro: дисконт, ставший бессрочным
DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…
Cohere: когда CEO и CTO приглашают на вечеринку вместо запуска моделей
Cohere, известный своими языковыми моделями, на этой неделе привлек внимание не анонсами новых моделей или API, а активным участием своих сооснователей в мероприятиях Toronto Tech Week. CEO Айдан Гомес и CTO Иван Чжан…
Grok: не только в браузере — теперь через OpenClaw
xAI запустила интеграцию Grok с OpenClaw, позволяя пользователям с подписками SuperGrok или X Premium запускать модели Grok внутри этого open-source локального агента. Этот шаг переносит возможности Grok из облака на…
Google DeepMind Accelerator: AI против климатических рисков в АТР
Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…
Command A+: модель Cohere «похудела» почти без потерь производительности
Cohere активно развивает как производственные аспекты своих моделей, так и исследовательское направление. На этой неделе модель Command A+ стала доступна на Hugging Face с оптимизированным квантованием W4A4, что…
Command A+: Cohere выпускает открытую модель, работающую на скромном железе
Cohere представила Command A+, свою самую новую большую языковую модель. Интерес здесь не только в её возможностях, но и в том, как Cohere позиционирует модель для развёртывания: она оптимизирована для работы на…
Command A+: агенты стали умнее, модель заговорила на 48 языках
Cohere выпустила Command A+, новую модель, которая меняет подход к созданию умных агентов. Теперь они не только лучше понимают контекст, но и могут работать с изображениями и общаться на десятках языков, предлагая…
Cohere: покупка Reliant AI и фокус на фармацевтике
Компания Cohere сделала ставку на корпоративный ИИ в медицине, приобретя Reliant AI — фирму, специализирующуюся на суверенных решениях для здравоохранения и биофармацевтики. Этот шаг стратегически совпадает с…
Глава Cohere назвал Торонто центром вселенной
В мире, где Кремниевая долина и крупные технологические хабы часто заявляют о своем превосходстве, один из лидеров AI-индустрии высказал неожиданное мнение. Эйдан Гомес, сооснователь и CEO Cohere, предложил взглянуть на…
Сооснователь Cohere: «i am ice man» – о чем это?
Иван Чжан, соучредитель и технический директор компании Cohere, опубликовал на своей странице в X короткое, но крайне лаконичное личное сообщение. Этот пост, состоящий всего из нескольких фраз, вызвал вопросы из-за…
FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов
Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…
Cohere намекает на новую инициативу «Project Pursue» и ищет истину в данных
Загадочное сообщение «The truth is out there…» появилось сегодня в аккаунте Cohere на X, сопровождаемое ссылкой на новую страницу «Project Pursue» на их официальном веб-сайте. Деталей инициативы пока нет, но это…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
Cerebras: инцидент с Qwen-моделью и 5-кратный прирост для coding-агентов Cognition
Cerebras сообщила об устранении инцидента с одной из своих моделей и сделала общедоступной важную функциональность для управления API-ключами. Параллельно компания представила результаты работы с Cognition, где их…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Cerebras: выделенные конечные точки теперь поддерживают GLM 5 и Kimi K2.6
Cerebras добавляет новые модели от Z.AI и Moonshot AI на свои выделенные конечные точки. Этот шаг призван предоставить инженерам больше гибкости и выбора для развертывания специфических языковых моделей…
DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API
DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.
Grok Voice Think Fast 1.0: Не просто слушает, но и думает без пауз
xAI представила свою новую флагманскую голосовую модель Grok Voice Think Fast 1.0, разработанную для сложных и многоэтапных диалогов. Эта модель позиционируется как ключевой инструмент для автоматизации клиентской…
Cerebras: ключ к кэшу промптов ускорит LLM-инференс, но две модели уйдут в отставку
Cerebras обновила свой API, добавив параметр prompt_cache_key, который позволяет управлять кэшированием промптов и сократить задержку до первого токена. Это небольшое, но важное изменение даёт инженерам больше контроля…
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…
DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания
DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос
Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…
Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы
Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…