Новости AI-стека
Daily · свежие материалы
Codex: теперь код можно контролировать с телефона
OpenAI сделала своего кодового помощника Codex доступным для управления прямо из мобильного приложения ChatGPT на iOS и Android. Это не просто просмотр результатов: пользователи теперь могут запускать новую работу…
Codex под управлением с телефона: кодинг без привязки к рабочему месту
Возможность отойти от стола, продолжая управлять процессом разработки, всегда была желанной, но для реальных инженерных задач часто оставалась в области мечтаний. Теперь OpenAI разворачивает полноценный удаленный доступ…
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
ChatGPT приходит в Excel и Google Sheets: бесплатный пробник для бизнеса и образовательных учреждений
Интеграция больших языковых моделей с корпоративным софтом продолжает развиваться, но в основном это происходит на уровне кастомных API-интеграций и сторонних плагинов. На этот раз OpenAI самостоятельно внедрила…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
OpenAI и X: Закулисные сигналы от главного научного сотрудника
Платформа X (ранее Twitter) часто становится площадкой для неформальных анонсов и комментариев от инженеров и руководителей AI-компаний. OpenAI не исключение, и именно здесь главный научный сотрудник Марк Чен поделился…
Codex: инцидент устранен, GPT-5.5 доступен
Codex, среда разработки от OpenAI, теперь предлагает модель GPT-5.5 всем платным пользователям. Эта новость последовала за недавним сбоем, когда в сервисе наблюдался повышенный уровень ошибок, но инженерам удалось…
ChatGPT: командные агенты, приватный фильтр и большая чистка моделей
OpenAI выпустила сразу несколько продуктов, ориентированных на корпоративных пользователей и безопасность данных. Среди них — командные агенты для ChatGPT, призванные автоматизировать рутину в организациях, и новый…
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос
Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…
GPT-5.4-Cyber: модель для киберзащиты, но доступ по строгим правилам
OpenAI расширяет программу Trusted Access for Cyber (TAC), предоставляя тщательно проверенным специалистам по киберзащите доступ к новой модели GPT-5.4-Cyber. Этот шаг нацелен на усиление оборонных возможностей в…
Vertex AI: Claude Opus 4.7 в Model Garden, Gemini Robotics читает приборы
Google расширяет свою AI-инфраструктуру, предлагая как новые возможности для сторонних моделей, так и улучшения для собственных. На этой неделе стал доступен Claude Opus 4.7 в Vertex AI Model Garden, предоставляя…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
AI-новости
OpenAI обновила модель доступа к Codex и приобрела медиахолдинг TBPN, в то время как пользователи смогут получить доступ к ChatGPT прямо из Apple CarPlay.
Gemma 4 отдают даром — и в тот же день ставят таймер на Gemini 2.5
Google выпустил Gemma 4 — открытые модели под Apache 2.0: 3-е и 6-е места среди всех open-моделей мира, обходят те, что в 20 раз крупнее, запускаются хоть на телефоне, хоть на одной видеокарте. А в том же окне тихо…
OpenAI запустила Safety Bug Bounty, объединила коннекторы Google Drive и изменила обработку больших вставок
OpenAI расширяет свою программу поиска уязвимостей, но теперь сфокусировавшись не на традиционных багах безопасности, а на рисках, связанных именно со злоупотреблением ИИ. Это сигнал, что компания смещает акцент с…
Lyria 3 Pro: песня целиком — но имитировать артиста модель отказывается
Google выпустил Lyria 3 Pro — модель генерации музыки: уже не 30-секундная петля, а трек до трёх минут с заданной структурой (интро/куплет/припев/бридж по запросу). Но Google намеренно сделал так, что имитировать…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…