Новости AI-стека
Daily · свежие материалы
OpenAI: ChatGPT осваивает PowerPoint, Codex работает на заблокированном Mac, а ИИ доказывает гипотезы Эрдёша
OpenAI демонстрирует активность по нескольким фронтам: от расширения возможностей ChatGPT в повседневных задачах до инструментальных улучшений Codex и фундаментальных достижений в математике. Компания не ограничивается…
ChatGPT: сбои у платных тарифов и новый кейс применения в медицине
Пока часть пользователей платных тарифов ChatGPT столкнулась с временными сложностями, другая история демонстрирует потенциал платформы в здравоохранении: AdventHealth интегрирует ChatGPT для здравоохранения для…
Google DeepMind Accelerator: AI против климатических рисков в АТР
Google DeepMind запускает Google DeepMind Accelerator — трехмесячную программу, сфокусированную на инициативе «AI for the Planet». Этот акселератор ориентирован на поддержку инноваторов в Азиатско-Тихоокеанском регионе…
Transformers 5.9.0: новые модели и меняющийся интерфейс эмбеддингов
HuggingFace выпустил библиотеку Transformers v5.9.0, добавив три новые модели и внеся важные изменения в обработку текстовых эмбеддингов для ряда моделей компьютерного зрения. Это обновление включает как новые…
OpenAI: Модель опровергла математическую гипотезу 1946 года — впервые автономно
Модель OpenAI впервые в истории автономно решила известную открытую математическую проблему. Исследователи опубликовали детали о том, как разработанная ими система опровергла давнюю гипотезу о задаче о планарном…
Ettin Reranker: как пересортировать поиск без лишних затрат
Hugging Face представил семейство моделей Ettin Reranker. Это не просто очередной набор инструментов для ранжирования; они спроектированы, чтобы точно переупорядочивать результаты поиска, при этом удерживая контроль над…
Guaranteed Capacity: OpenAI предлагает зарезервировать вычислительные мощности
На фоне растущего спроса на вычислительные ресурсы для масштабных AI-моделей, OpenAI представила новую услугу, которая призвана решить одну из ключевых проблем разработчиков: гарантированный доступ к мощностям. Это шаг…
OpenAI и SynthID: двойная защита от подделок, но без стопроцентной гарантии
OpenAI усиливает свои шаги по идентификации AI-генерируемого контента, внедряя комплексный подход, который призван повысить доверие к медиа в цифровую эпоху. Компания объединяет открытые стандарты происхождения с…
Codex: Mac не спит ради ваших рассылок и долгих задач
OpenAI продолжает развивать свой инструмент Codex, позволяющий автоматизировать рутинные задачи на Mac. На этот раз фокус сместился на новые возможности для поддержания непрерывной работы и избавления от цифрового шума…
Codex: от облака к локальным данным — но через Dell
OpenAI и Dell Technologies объединяют усилия, чтобы перенести Codex в гибридные и локальные корпоративные среды. Этот шаг призван решить ключевую проблему безопасности и конфиденциальности данных для предприятий…
OpenAI: Кратковременное снижение производительности GPT5.5 устранено
Сегодняшний день для пользователей OpenAI прошёл относительно спокойно, за исключением одного кратковременного инцидента. Компания оперативно отреагировала на сообщение о снижении производительности одной из своих…
Gemma-4-31B-it-pearl: как крипто-майнинг удешевляет инференс AI
Together AI объединяет усилия с Pearl Research Labs, чтобы радикально изменить экономику инференса AI. В основе нового партнёрства лежит технология Proof of Useful Work, которая позволяет одновременно с вычислениями для…
OpenAI: codex и chatgpt как агенты для рутины и разработки
Высшее руководство OpenAI активно делится в X (бывший Twitter) своим видением будущего codex и chatgpt, где модели выступают в роли глубоко интегрированных персональных помощников. От фоновой работы во время…
Автоматизация рутины: [[entity:codex|Codex]] выходит в операционку и финансы
Для команд, занятых бизнес-операциями, создание отчётов, брифов и планов часто начинается с разрозненных данных — трекеров проектов, дашбордов KPI, заметок со встреч, Slack-обсуждений и таблиц. Этот процесс, требующий…
violin: Открытый AI-перевод видео, который уважает голоса
Together AI выпустила Violin — полностью открытый инструмент для перевода видео, который разрушает языковые барьеры. Это комплексное решение объединяет распознавание речи, крупномодельный перевод и синтез речи, а также…
Codex: теперь код можно контролировать с телефона
OpenAI сделала своего кодового помощника Codex доступным для управления прямо из мобильного приложения ChatGPT на iOS и Android. Это не просто просмотр результатов: пользователи теперь могут запускать новую работу…
Codex под управлением с телефона: кодинг без привязки к рабочему месту
Возможность отойти от стола, продолжая управлять процессом разработки, всегда была желанной, но для реальных инженерных задач часто оставалась в области мечтаний. Теперь OpenAI разворачивает полноценный удаленный доступ…
Voice Finder от Together AI: 600 голосов теперь можно искать по запросу
Together AI представила новый инструмент Voice Finder, который должен упростить процесс подбора подходящего голоса для приложений. Разработчики теперь смогут использовать естественный язык или аудиосэмплы для навигации…
Perplexity Agent API: Finance Search теперь выдаёт структурированные финданные
Perplexity интегрировала инструмент Finance Search прямо в свой Agent API. Это значит, что теперь агенты могут напрямую запрашивать и получать структурированные финансовые и рыночные данные по публичным компаниям и…
Gemini Interactions API ломается второй раз за полгода — и снова срочно
Google анонсировал ломающее изменение в Gemini Interactions API: схема outputs→steps и response_format меняются, новая дефолтная 26 мая, старую удаляют 8 июня. И это не первый раз — API ломали ещё в декабре. Рядом …
ChatGPT приходит в Excel и Google Sheets: бесплатный пробник для бизнеса и образовательных учреждений
Интеграция больших языковых моделей с корпоративным софтом продолжает развиваться, но в основном это происходит на уровне кастомных API-интеграций и сторонних плагинов. На этот раз OpenAI самостоятельно внедрила…
Diffusers 0.38.0: Больше изображений, больше звука — и новые «мозги» для генерации
HuggingFace Diffusers, библиотека для работы с диффузионными моделями, получила масштабное обновление 0.38.0. В новой версии появились конвейеры для генерации изображений и аудио, среди которых заметны тяжеловесы с…
Perplexity API: новые модели, безопасные ключи и список доступных через /v1/models
Perplexity обновила свой API, сосредоточившись на расширении возможностей Agent API, улучшении безопасности ключей и упрощении обнаружения доступных моделей. Теперь разработчики могут интегрировать новейшие модели…
OpenAI и X: Закулисные сигналы от главного научного сотрудника
Платформа X (ранее Twitter) часто становится площадкой для неформальных анонсов и комментариев от инженеров и руководителей AI-компаний. OpenAI не исключение, и именно здесь главный научный сотрудник Марк Чен поделился…
Codex: инцидент устранен, GPT-5.5 доступен
Codex, среда разработки от OpenAI, теперь предлагает модель GPT-5.5 всем платным пользователям. Эта новость последовала за недавним сбоем, когда в сервисе наблюдался повышенный уровень ошибок, но инженерам удалось…
ChatGPT: командные агенты, приватный фильтр и большая чистка моделей
OpenAI выпустила сразу несколько продуктов, ориентированных на корпоративных пользователей и безопасность данных. Среди них — командные агенты для ChatGPT, призванные автоматизировать рутину в организациях, и новый…
Gemini-embedding-2: модель внедрения в GA, что это значит для масштабирования LLM
Модель внедрения gemini-embedding-2 достигла статуса общей доступности (GA), что делает её готовой для продакшен-нагрузок и интеграции в полноценные приложения. Это событие совпало с презентацией Google DeepMind новой…
Agent skills для Replicate: учим ассистентов работать с моделями как про
Replicate представил Agent skills — набор инструкций в формате Markdown, который позволяет кодирующим ассистентам лучше понимать, как искать, сравнивать и запускать модели ИИ на платформе. Это шаг к тому, чтобы сделать…
**Разработчики предлагают несколько советов для получения наилучшего результата:**
Детально описывайте сцену. Вместо «автомобильная погоня» пишите «высокоскоростная ночная погоня по залитым дождём улиц Токио, неоновые отражения на мокром асфальте, фары прорезают туман». Описывайте не только…
Gemini 3.1 Flash TTS: озвучку теперь режиссируют, а не выбирают голос
Google выкатил в preview Gemini 3.1 Flash TTS. Раньше синтез речи — «выбери голос из списка». Теперь голосом управляют как режиссёр актёром, указаниями прямо в тексте через аудиометки, а найденную постановку можно…