Новости AI-стека
Daily · свежие материалы
OpenAI: Кратковременное снижение производительности GPT5.5 устранено
Сегодняшний день для пользователей OpenAI прошёл относительно спокойно, за исключением одного кратковременного инцидента. Компания оперативно отреагировала на сообщение о снижении производительности одной из своих…
Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI
Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…
OpenAI: codex и chatgpt как агенты для рутины и разработки
Высшее руководство OpenAI активно делится в X (бывший Twitter) своим видением будущего codex и chatgpt, где модели выступают в роли глубоко интегрированных персональных помощников. От фоновой работы во время…
Автоматизация рутины: [[entity:codex|Codex]] выходит в операционку и финансы
Для команд, занятых бизнес-операциями, создание отчётов, брифов и планов часто начинается с разрозненных данных — трекеров проектов, дашбордов KPI, заметок со встреч, Slack-обсуждений и таблиц. Этот процесс, требующий…
violin: Открытый AI-перевод видео, который уважает голоса
Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…
Codex: теперь код можно контролировать с телефона
OpenAI сделала своего кодового помощника Codex доступным для управления прямо из мобильного приложения ChatGPT на iOS и Android. Это не просто просмотр результатов: пользователи теперь могут запускать новую работу…
Codex под управлением с телефона: кодинг без привязки к рабочему месту
Возможность отойти от стола, продолжая управлять процессом разработки, всегда была желанной, но для реальных инженерных задач часто оставалась в области мечтаний. Теперь OpenAI разворачивает полноценный удаленный доступ…
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
AssemblyAI: когда JSON самоисправляется, а голоса чётко делятся по словам
Работа с моделями в продакшене всегда подразумевает компромиссы: LLM могут «глючить» с JSON-форматом, а аудиомодели — неточно разделять голоса в потоке. На этой неделе AssemblyAI показала два обновления, которые решают…
ChatGPT приходит в Excel и Google Sheets: бесплатный пробник для бизнеса и образовательных учреждений
Интеграция больших языковых моделей с корпоративным софтом продолжает развиваться, но в основном это происходит на уровне кастомных API-интеграций и сторонних плагинов. На этот раз OpenAI самостоятельно внедрила…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Voice Agent API: «позвонилка» с LLM-мозгом в один WebSocket
AssemblyAI Voice Agent API — это единый конвейер для создания голосовых агентов, который умеет понимать речь, рассуждать на базе LLM и генерировать голос. Он упакован в один WebSocket и позволяет обойтись без сложной…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
PII Redaction: два транскрипта в одном запросе — удобно для UI, но не без подвоха
Соблюдение конфиденциальности данных и обеспечение полноты информации часто идут рука об руку с компромиссами. Например, когда PII Redaction скрывает персональные данные в транскриптах, это хорошо для безопасности, но…
OpenAI и X: Закулисные сигналы от главного научного сотрудника
Платформа X (ранее Twitter) часто становится площадкой для неформальных анонсов и комментариев от инженеров и руководителей AI-компаний. OpenAI не исключение, и именно здесь главный научный сотрудник Марк Чен поделился…
Codex: инцидент устранен, GPT-5.5 доступен
Codex, среда разработки от OpenAI, теперь предлагает модель GPT-5.5 всем платным пользователям. Эта новость последовала за недавним сбоем, когда в сервисе наблюдался повышенный уровень ошибок, но инженерам удалось…
ChatGPT: командные агенты, приватный фильтр и большая чистка моделей
OpenAI выпустила сразу несколько продуктов, ориентированных на корпоративных пользователей и безопасность данных. Среди них — командные агенты для ChatGPT, призванные автоматизировать рутину в организациях, и новый…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
Claude Opus 4.7 на LLM Gateway AssemblyAI: доступ к интеллекту Anthropic
AssemblyAI, известный своей платформой для работы с аудио, добавил поддержку новейшей модели Claude Opus 4.7 в свой LLM Gateway. Это значит, что инженеры теперь могут использовать одну из самых интеллектуальных моделей…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
GPT-5.4-Cyber: модель для киберзащиты, но доступ по строгим правилам
OpenAI расширяет программу Trusted Access for Cyber (TAC), предоставляя тщательно проверенным специалистам по киберзащите доступ к новой модели GPT-5.4-Cyber. Этот шаг нацелен на усиление оборонных возможностей в…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
AI-новости
OpenAI обновила модель доступа к Codex и приобрела медиахолдинг TBPN, в то время как пользователи смогут получить доступ к ChatGPT прямо из Apple CarPlay.
OpenAI запустила Safety Bug Bounty, объединила коннекторы Google Drive и изменила обработку больших вставок
OpenAI расширяет свою программу поиска уязвимостей, но теперь сфокусировавшись не на традиционных багах безопасности, а на рисках, связанных именно со злоупотреблением ИИ. Это сигнал, что компания смещает акцент с…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…