Новости AI-стека
Daily · свежие материалы
Cohere: «Языковое замешательство» скрывает пробелы в безопасности многоязычных моделей
Новое исследование Cohere Labs выявило, что бинарные системы оценки безопасности не способны адекватно реагировать на «языковое замешательство» в многоязычных ИИ-моделях, делая их ложно безопасными.
OpenRouter: детализация моделей, умный маршрутизатор и строгие IP-списки
OpenRouter представил обновления, включающие улучшенные инструменты выбора моделей, гибкую автоматическую маршрутизацию с контролем стоимости и усиление безопасности IP-адресов.
Cohere: Зачем CEO едет в Хайльбронн, чтобы обсудить «суверенный AI»?
Генеральный директор Cohere Эйдан Гомес примет участие в европейской конференции, подчеркивая глобальные амбиции компании в области суверенного ИИ и безопасной реализации корпоративных решений.
Vertex AI Extensions уходят: Google переводит фокус на Agent Platform
Google консолидирует все ИИ-сервисы Vertex AI в унифицированной Gemini Enterprise Agent Platform, фокусируясь на комплексной разработке и управлении корпоративными агентами.
OpenRouter: логи, ключи API и видеоошибки теперь в одном клике
Обновления от 25 мая 2026 года упрощают навигацию по логам, доступ к деталям API-ключей и диагностику ошибок видеогенерации.
Cohere Labs: «Эмоциональные» отчёты меняют координацию ИИ-агентов
Компания продемонстрировала новые подходы к координации ИИ-агентов и активно интегрировалась в технологическое сообщество Торонто.
DeepSeek-V4-Pro: дисконт, ставший бессрочным
DeepSeek объявила, что скидка на использование модели DeepSeek-V4-Pro теперь действует постоянно. Это не временная акция, а фундаментальное изменение в ценовой политике, позволяющее разработчикам с большей уверенностью…
Cohere: когда CEO и CTO приглашают на вечеринку вместо запуска моделей
Cohere, известный своими языковыми моделями, на этой неделе привлек внимание не анонсами новых моделей или API, а активным участием своих сооснователей в мероприятиях Toronto Tech Week. CEO Айдан Гомес и CTO Иван Чжан…
Qwen3.7 Max: миллион токенов на OpenRouter и новый взгляд на API-ключи
OpenRouter обновил свою платформу, добавив поддержку модели Qwen3.7 Max от Qwen, известной своим большим контекстным окном. Одновременно с этим, пользователи получили расширенные возможности по управлению историей чатов…
Google DeepMind Accelerator: AI против климатических рисков в АТР
Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…
Command A+: модель Cohere «похудела» почти без потерь производительности
Cohere активно развивает как производственные аспекты своих моделей, так и исследовательское направление. На этой неделе модель Command A+ стала доступна на Hugging Face с оптимизированным квантованием W4A4, что…
Command A+: Cohere выпускает открытую модель, работающую на скромном железе
Cohere представила Command A+, свою самую новую большую языковую модель. Интерес здесь не только в её возможностях, но и в том, как Cohere позиционирует модель для развёртывания: она оптимизирована для работы на…
Command A+: агенты стали умнее, модель заговорила на 48 языках
Cohere выпустила Command A+, новую модель, которая меняет подход к созданию умных агентов. Теперь они не только лучше понимают контекст, но и могут работать с изображениями и общаться на десятках языков, предлагая…
Cohere: покупка Reliant AI и фокус на фармацевтике
Компания Cohere сделала ставку на корпоративный ИИ в медицине, приобретя Reliant AI — фирму, специализирующуюся на суверенных решениях для здравоохранения и биофармацевтики. Этот шаг стратегически совпадает с…
Stable Audio 3: открытая модель для музыки и звуков с инпейнтингом
Stability AI выпустила Stable Audio 3 — новую открытую модель для генерации и редактирования аудио. Эта модель представляет собой семейство быстрых латентных диффузионных моделей, способных создавать аудио переменной…
Глава Cohere назвал Торонто центром вселенной
В мире, где Кремниевая долина и крупные технологические хабы часто заявляют о своем превосходстве, один из лидеров AI-индустрии высказал неожиданное мнение. Эйдан Гомес, сооснователь и CEO Cohere, предложил взглянуть на…
Stability AI: Как новый автоэнкодер SAME ускоряет генерацию аудио в Stable Audio 3
Stability AI представила SAME (Semantically-Aligned Music Autoencoder) — открытый автоэнкодер, который призван изменить подходы к работе с музыкальными и общими аудиоданными. Его основная задача — эффективное сжатие…
Сооснователь Cohere: «i am ice man» – о чем это?
Иван Чжан, соучредитель и технический директор компании Cohere, опубликовал на своей странице в X короткое, но крайне лаконичное личное сообщение. Этот пост, состоящий всего из нескольких фраз, вызвал вопросы из-за…
Fal: Безопасность на скорости мысли — подход к доверию в AI
Fal, как поставщик инфраструктуры для искусственного интеллекта, активно выстраивает свою стратегию доверия и безопасности. Шон Бонавиц, руководитель этого направления в компании, делится философией и конкретными шагами…
FLUX Outpainting: ИИ-расширение изображений в один API-вызов, без промтов
Black Forest Labs представила новую возможность для своей линейки FLUX Tools — FLUX Outpainting. Инструмент позволяет расширять любое изображение за его исходные границы, автоматически сохраняя при этом целостность…
Cohere намекает на новую инициативу «Project Pursue» и ищет истину в данных
Загадочное сообщение «The truth is out there…» появилось сегодня в аккаунте Cohere на X, сопровождаемое ссылкой на новую страницу «Project Pursue» на их официальном веб-сайте. Деталей инициативы пока нет, но это…
OpenRouter: Агенты с человеческим участием и модель Ring-2.6-1T
Сложные задачи часто требуют человеческого суждения, но рутина должна автоматизироваться. Как найти этот баланс в работе AI-агентов? OpenRouter представляет новый тип инструментов для своего Agent SDK, который позволяет…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
gpt-5.5: двойное повышение цен, но реальная стоимость не так однозначна
OpenRouter провел собственное исследование влияния новой модели gpt-5.5 на бюджеты разработчиков. Несмотря на заявленное OpenAI двукратное увеличение цен за токены, внутренняя аналитика OpenRouter показала, что итоговый…
Fal: централизованная аналитика для Serverless-приложений
Fal представил новую панель мониторинга для Serverless-приложений, которая агрегирует метрики производительности, трафика и активности. Это позволяет инженерам, работающим с Fal, получить единую картину состояния своих…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
DeepSeek: V4-модели с контекстом 1M токенов и деприкация старых API
DeepSeek обновил свой API, представив новое поколение моделей с увеличенным контекстом и объявив о скором прекращении поддержки старых версий. Разработчикам, использующим DeepSeek, предстоит запланировать миграцию.
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…
DeepSeek-V4: Контекст в 1M токенов и гибридная архитектура внимания
DeepSeek AI представила новую серию моделей DeepSeek-V4, включая DeepSeek-V4-Pro и DeepSeek-V4-Flash. Главная особенность обеих версий — поддержка контекстного окна в один миллион токенов, что переводит их в лигу…