Новости AI-стека
Daily · свежие материалы
Документация OpenAI теперь сама пишет гайды под ваш проект и отдаёт их в Codex
Агент на developers.openai.com понимает контекст задачи — генерирует кастомное руководство, а не просто ищет по тексту.
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
Meta бесплатно раздаст Ray-Ban AI-очки 130 000 слепым ветеранам США
Аналогичные устройства конкурентов стоят до $5 000 — здесь цена для ветерана равна нулю.
GPT-5.5 в Codex упал в прод — и тем самым подтвердил своё существование
Параллельно лежала половина API OpenAI — от Batch до Sora.
Grok Build получил встроенный магазин плагинов — MongoDB, Sentry и Vercel с одной команды
Каждый плагин закреплён за конкретным коммитом SHA — xAI верифицирует его при установке.
Астрофизик использует Codex, чтобы найти алгоритмы для симуляции чёрных дыр
Модель предлагает математические схемы, учёный проверяет каждую на известных решениях — ошибки допустимы, потому что наука сама фильтрует.
OpenAI и Oracle: модели и Codex доступны через существующий Oracle-контракт
Новый закупочный путь не нужен — Oracle Universal Credits, которые уже есть у компании, засчитываются напрямую.
Инвестиционный агент Tori от eToro теперь читает настроения рынка прямо из X
Тот же поток данных xAI открыл через API — любая команда может подключиться за несколько минут.
Китайские операции влияния атаковали дебаты об AI в США — и распускали фейки о ChatGPT
OpenAI заблокировала два кластера аккаунтов и опубликовала детали кампаний — впервые с прямым указанием на КНР.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
Meta арендует у Reliance дата-центр на 168 МВт — первый ИИ-объект компании в Индии
Плюс почти 1 ГВт новых контрактов на возобновляемую энергию — инфраструктурный и энергетический вопрос закрыты разом.
GPT-5.5 открыл 23 000 китайских научных статей — без OCR-конвейера
Один разработчик убрал целую цепочку инструментов и получил переводы полнее, чем раньше.
Grok теперь собирает корзину в Gopuff до того, как вы открыли приложение
xAI тянет сигналы из X и данные о погоде, чтобы предугадывать заказы — первый публичный кейс Grok-агента в ритейле.
Claude Fable 5 — самая мощная модель Anthropic теперь доступна всем, но с цензурным предохранителем
$10 за млн входящих токенов, контекст 1 млн токенов — и автоматический откат на Opus 4.8 при «опасных» запросах.
Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке
Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.
Meta вложила $115 млн в обучение электриков и сварщиков — с гарантией трудоустройства
Программа покрывает все расходы участников: учёбу, перелёт, жильё и суточные — без студенческих долгов.
Nex-N2-Pro на OpenRouter: бесплатный агентный ИИ с 256k контекстом обходит Claude Opus на Terminal-Bench
Модель полностью открыта (Apache-2.0) и построена поверх Qwen3.5 — можно развернуть самостоятельно или сразу звать через API.
ChatGPT теперь отправляет письма прямо из чата — и строит интерактивные графики
Нужны подключённые Gmail или Outlook; интерактивные диаграммы и полноэкранный редактор — только в веб-версии.
Codex, ChatGPT и Responses API одновременно давали ошибки — всё устранено
Под удар попал и compaction в Codex — механизм сжатия контекста для длинных агентских сессий.
FLUX.2 встроили в ноутбуки ASUS — без интернета и подписки
Модель генерирует изображения прямо на устройстве за 5 секунд — без облака и без платы за каждый запрос.
ИИ для фармацевтики научился сам писать код в экспериментах
Обновлённый GPT-Rosalind от OpenAI теперь не только анализирует данные, но и самостоятельно выполняет шаги в реальных научных исследованиях.
Stability AI нашла способ экономить память при длинных текстах и видео
Новый метод сжимает промежуточные данные модели так, что та работает быстрее и не тормозит при обработке больших объёмов.
Replicate устранил очереди и задержки на кластерах L40S и H200
Конкуренция за модели замедляла запуски — теперь система работает штатно.
Meta Business Agent: AI-агент для бизнеса уже на WhatsApp и Instagram
Старт бесплатный, но в ближайшие месяцы — платная подписка; более 1 млн бизнесов уже используют раннюю версию.
ChatGPT Pro лёг по всем фронтам — и поднялся
Сколько компонентов затронул один инцидент у самого дорогого тарифа.
На OpenRouter появились голос, транскрипция и генерация изображений от Microsoft
Три модели MAI — через тот же API, что и текстовые LLM; платформа выходит за пределы чата.
Codex теперь деплоит сайты и работает как ролевой специалист
GPT-5.5 и Codex вышли в general availability на AWS Bedrock — без наценки поверх OpenAI-тарифов.
Cog v0.21.0-rc.2 закрывает тихий баг: `cog serve` наконец монтирует веса как `cog run`
В релиз-кандидате Cog v0.21.0-rc.2 исправлена ошибка, из-за которой cog serve не монтировал managed-веса в контейнер, хотя cog run делал это корректно — модели с весами падали при setup без очевидной причины.