Новости AI-стека
Daily · свежие материалы
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
ChatGPT приходит в Excel и Google Sheets: бесплатный пробник для бизнеса и образовательных учреждений
Интеграция больших языковых моделей с корпоративным софтом продолжает развиваться, но в основном это происходит на уровне кастомных API-интеграций и сторонних плагинов. На этот раз OpenAI самостоятельно внедрила…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности
Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
OpenAI и X: Закулисные сигналы от главного научного сотрудника
Платформа X (ранее Twitter) часто становится площадкой для неформальных анонсов и комментариев от инженеров и руководителей AI-компаний. OpenAI не исключение, и именно здесь главный научный сотрудник Марк Чен поделился…
Codex: инцидент устранен, GPT-5.5 доступен
Codex, среда разработки от OpenAI, теперь предлагает модель GPT-5.5 всем платным пользователям. Эта новость последовала за недавним сбоем, когда в сервисе наблюдался повышенный уровень ошибок, но инженерам удалось…
ChatGPT: командные агенты, приватный фильтр и большая чистка моделей
OpenAI выпустила сразу несколько продуктов, ориентированных на корпоративных пользователей и безопасность данных. Среди них — командные агенты для ChatGPT, призванные автоматизировать рутину в организациях, и новый…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
GPT-5.4-Cyber: модель для киберзащиты, но доступ по строгим правилам
OpenAI расширяет программу Trusted Access for Cyber (TAC), предоставляя тщательно проверенным специалистам по киберзащите доступ к новой модели GPT-5.4-Cyber. Этот шаг нацелен на усиление оборонных возможностей в…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
AI-новости
OpenAI обновила модель доступа к Codex и приобрела медиахолдинг TBPN, в то время как пользователи смогут получить доступ к ChatGPT прямо из Apple CarPlay.
OpenAI запустила Safety Bug Bounty, объединила коннекторы Google Drive и изменила обработку больших вставок
OpenAI расширяет свою программу поиска уязвимостей, но теперь сфокусировавшись не на традиционных багах безопасности, а на рисках, связанных именно со злоупотреблением ИИ. Это сигнал, что компания смещает акцент с…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
Stable Audio: Warner Music Group и Stability AI создадут этичный AI для музыки
Warner Music Group и Stability AI объявили о партнёрстве, цель которого — разработка нового поколения инструментов для создания музыки с использованием ответственного подхода к искусственному интеллекту. Этот союз…
Foley Control: Звук в видео без переобучения тяжелых моделей
Stability AI представила foley-control, новый метод для генерации реалистичных звуковых эффектов (фоли) на основе видео. Подход позволяет добавлять синхронизированные звуки к видео без необходимости переобучать крупные…