Новости AI-стека
Daily · свежие материалы
OpenAI: codex и chatgpt как агенты для рутины и разработки
Высшее руководство OpenAI активно делится в X (бывший Twitter) своим видением будущего codex и chatgpt, где модели выступают в роли глубоко интегрированных персональных помощников. От фоновой работы во время…
Автоматизация рутины: [[entity:codex|Codex]] выходит в операционку и финансы
Для команд, занятых бизнес-операциями, создание отчётов, брифов и планов часто начинается с разрозненных данных — трекеров проектов, дашбордов KPI, заметок со встреч, Slack-обсуждений и таблиц. Этот процесс, требующий…
violin: Открытый AI-перевод видео, который уважает голоса
Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…
Codex: теперь код можно контролировать с телефона
OpenAI сделала своего кодового помощника Codex доступным для управления прямо из мобильного приложения ChatGPT на iOS и Android. Это не просто просмотр результатов: пользователи теперь могут запускать новую работу…
Deepgram: когда ненормативная лексика под контролем, а Азия говорит на родных языках
Deepgram представил обновление, которое меняет подход к цензурированию речи в транскрипциях: теперь функция фильтрации ненормативной лексики доступна для 50+ языков, охватывая широкий спектр мировых языков, а не только…
Recraft V4.1: Фотореализм стал естественнее, промты — короче
Recraft представил V4.1 — обновление своей модели, которое меняет подход к генерации изображений. Теперь фотореализм выглядит более живым и естественным, а для достижения желаемой эстетики требуются заметно более…
Codex под управлением с телефона: кодинг без привязки к рабочему месту
Возможность отойти от стола, продолжая управлять процессом разработки, всегда была желанной, но для реальных инженерных задач часто оставалась в области мечтаний. Теперь OpenAI разворачивает полноценный удаленный доступ…
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Phi-Ground-Any: Модель для точного взаимодействия с UI
Microsoft выпустила новый открытый весовой вариант модели из семейства Phi-Ground — phi-ground-any. Это мультимодальная модель, ориентированная на взаимодействие с пользовательскими интерфейсами на основе визуального…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
ChatGPT приходит в Excel и Google Sheets: бесплатный пробник для бизнеса и образовательных учреждений
Интеграция больших языковых моделей с корпоративным софтом продолжает развиваться, но в основном это происходит на уровне кастомных API-интеграций и сторонних плагинов. На этот раз OpenAI самостоятельно внедрила…
Flux Multilingual: единая модель для глобальных голосовых агентов — без компромиссов в скорости и точности
Deepgram выкатил flux-multilingual — свою модель разговорного распознавания речи в общедоступную версию. Это шаг к унификации: теперь одна модель поддерживает 10 языков, автоматически обнаруживает и переключает языки…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
Microsoft 365 Copilot: глубина анализа и генерация изображений прямо в офисных приложениях
Microsoft интегрирует две новые модели в microsoft-365-copilot: GPT-5.5 Thinking для углубленного анализа и многоэтапной работы, а также ChatGPT Images 2.0 для визуального создания контента. Эти обновления позволяют…
OpenAI и X: Закулисные сигналы от главного научного сотрудника
Платформа X (ранее Twitter) часто становится площадкой для неформальных анонсов и комментариев от инженеров и руководителей AI-компаний. OpenAI не исключение, и именно здесь главный научный сотрудник Марк Чен поделился…
Codex: инцидент устранен, GPT-5.5 доступен
Codex, среда разработки от OpenAI, теперь предлагает модель GPT-5.5 всем платным пользователям. Эта новость последовала за недавним сбоем, когда в сервисе наблюдался повышенный уровень ошибок, но инженерам удалось…
ChatGPT: командные агенты, приватный фильтр и большая чистка моделей
OpenAI выпустила сразу несколько продуктов, ориентированных на корпоративных пользователей и безопасность данных. Среди них — командные агенты для ChatGPT, призванные автоматизировать рутину в организациях, и новый…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
GPT-5.4-Cyber: модель для киберзащиты, но доступ по строгим правилам
OpenAI расширяет программу Trusted Access for Cyber (TAC), предоставляя тщательно проверенным специалистам по киберзащите доступ к новой модели GPT-5.4-Cyber. Этот шаг нацелен на усиление оборонных возможностей в…
Agent API Perplexity: новые модели и прощание со старыми Gemini
Perplexity обновила свой Agent API, добавив поддержку сторонних моделей, таких как GPT-5.4, NVIDIA Nemotron и Claude Sonnet 4.6, одновременно прекратив поддержку нескольких версий Gemini. Это изменение перестраивает…
AI-новости
OpenAI обновила модель доступа к Codex и приобрела медиахолдинг TBPN, в то время как пользователи смогут получить доступ к ChatGPT прямо из Apple CarPlay.
Recraft V4: как перестать «переинжиниривать» промпты и начать исследовать
Обычно работа с генеративными моделями изображений начинается с кропотливого подбора промпта: больше слов, больше уточнений, надежда на идеальный результат. Но креативный процесс редко так работает; обычно это…
OpenAI запустила Safety Bug Bounty, объединила коннекторы Google Drive и изменила обработку больших вставок
OpenAI расширяет свою программу поиска уязвимостей, но теперь сфокусировавшись не на традиционных багах безопасности, а на рисках, связанных именно со злоупотреблением ИИ. Это сигнал, что компания смещает акцент с…
Perplexity: Агенты и вложения — теперь в релизе для продакшена
Perplexity выпустила в общий доступ (GA) свои Agent API и Embeddings API. Это означает, что разработчики теперь могут использовать инструменты для создания автономных агентов и внедрения продвинутого семантического…
Nano Banana Pro: обходит лимиты Google с резервной моделью
Генерация изображений с помощью nano-banana-pro теперь стала надежнее. Replicate представил механизм резервирования, который позволяет продолжить работу, даже если основной API Google достигнет своих лимитов. Это…
Recraft V4: когда дизайн-вкус модели важнее, чем просто генерация
Recraft представил новую итерацию своей модели генерации изображений, recraft-v4. Вместо универсального подхода, который часто приводит к «сток-дизайну», команда сфокусировалась на тонких аспектах визуальной эстетики…
Recraft: чат-режим для дизайнеров и ускорение на NVIDIA Blackwell GPU
Компания Recraft представила Chat mode — разговорный интерфейс, который превращает взаимодействие с ИИ-генератором из разовых промптов в полноценное сотрудничество. Одновременно Recraft перевела свои модели генерации…