Новости AI-стека
Daily · свежие материалы
Grok 4.3 появился на Amazon Bedrock — теперь на всех крупных облаках
$1.25 за миллион входных токенов и настраиваемая глубина рассуждений — через стандартный Bedrock API.
ChatGPT теперь сам следит за интернетом по расписанию — и присылает только важное
Появилась отдельная страница управления задачами, но запуск — не чаще раза в час, а при бездействии задача уходит на паузу автоматически.
Deepgram открыл австралийский эндпоинт — данные не покидают страну
Один URL вместо self-hosted: те же ключи, те же цены — и аудио остаётся в Австралии.
Envato сгенерировала 51 млн изображений через FLUX — и запустила FLUX.2 в первый день релиза
FLUX.2 загружают на 16% чаще среднего по платформе — и он обгоняет конкурентов на 10% в фотореалистичных сценах.
AWS Strands Robots: один код — и симуляция, и реальный робот
LeRobot хранит демонстрации из симулятора и с железа в одном формате — агент не замечает разницы.
Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации
Управление темпом, акцентом и тоном через промпт остаётся — задержка до первого байта падает.
Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство
Прототип на Gemini берёт на себя сбор данных и черновик решения — чиновник остаётся финальным арбитром.
GLM 5.2 появилась на OpenRouter с контекстом в 1 млн токенов
Модель от Zhipu AI доступна через единый API OpenRouter — без отдельного аккаунта у китайского вендора.
OpenAI научилась проверять безопасность модели до релиза — на реальных разговорах
Метод поймал «calculator hacking» в GPT-5.1 до выхода и предсказывает частоту нарушений с медианной ошибкой 1.5×.
Grok теперь работает внутри PowerPoint, Word и Excel
Аддин бесплатно ставится из маркетплейса Microsoft — но полный доступ только на платных планах SuperGrok и выше.
13 бесплатных LLM API сравнили в одной таблице — у каждого своя скрытая цена
Mistral даёт 1 млрд токенов в месяц, но требует согласия на обучение; Google сливает промпты за пределами ЕС.
Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели
Imagen 4 уходит в августе, а единственная замена для Veo — модели в статусе preview, не GA.
Grok Build теперь запускает несколько агентов-кодировщиков параллельно — из одного экрана
Дашборд сам поднимает наверх сессии, которые ждут ответа, — остальные работают без участия человека.
OpenAI вложила $150 млн в партнёрскую сеть для корпоративного внедрения
Accenture, McKinsey, BCG, PwC и десятки других — плюс цель в 300 000 сертифицированных консультантов к концу 2026 года.
OpenRouter Fusion запускает несколько моделей сразу и сравнивает их ответы
Внутри — панель из нескольких LLM и модель-судья, которая ищет противоречия и пробелы в их ответах.
Документация OpenAI теперь сама пишет гайды под ваш проект и отдаёт их в Codex
Агент на developers.openai.com понимает контекст задачи — генерирует кастомное руководство, а не просто ищет по тексту.
Kimi K2.7 Code вышел на OpenRouter — 1T параметров, 30% меньше токенов на размышление
На агентных задачах модель обгоняет Claude Opus 4.8 по одному из ключевых бенчмарков — при цене вчетверо дешевле выхода.
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
GPT-5.5 в Codex упал в прод — и тем самым подтвердил своё существование
Параллельно лежала половина API OpenAI — от Batch до Sora.
Grok Build получил встроенный магазин плагинов — MongoDB, Sentry и Vercel с одной команды
Каждый плагин закреплён за конкретным коммитом SHA — xAI верифицирует его при установке.
nn.Linear под профилировщиком: transpose не трогает GPU
Hugging Face разобрал путь от одного слоя до MLP — с трассами и конкретными скриптами на A100.
Астрофизик использует Codex, чтобы найти алгоритмы для симуляции чёрных дыр
Модель предлагает математические схемы, учёный проверяет каждую на известных решениях — ошибки допустимы, потому что наука сама фильтрует.
OpenAI и Oracle: модели и Codex доступны через существующий Oracle-контракт
Новый закупочный путь не нужен — Oracle Universal Credits, которые уже есть у компании, засчитываются напрямую.
Инвестиционный агент Tori от eToro теперь читает настроения рынка прямо из X
Тот же поток данных xAI открыл через API — любая команда может подключиться за несколько минут.
Китайские операции влияния атаковали дебаты об AI в США — и распускали фейки о ChatGPT
OpenAI заблокировала два кластера аккаунтов и опубликовала детали кампаний — впервые с прямым указанием на КНР.
Deepgram Batch Diarization V2 — в 3,3 раза чаще побеждает старую версию в слепом тесте
Новый параметр diarize_model даёт явный контроль над версией — старые интеграции не ломаются, цена не меняется.
OpenRouter Advisor: дешёвая модель советуется с умной только когда застряла
Разрыв в цене — 67x; в типичной сессии из 50 вызовов к дорогой модели обращаются 2–3 раза.
DiffusionGemma 26B: 1000 токенов в секунду на H100 без авторегрессии
18 ГБ VRAM и Apache 2.0 — но качество ниже Gemma 4, и на Apple Silicon ускорения нет.
GPT-5.5 открыл 23 000 китайских научных статей — без OCR-конвейера
Один разработчик убрал целую цепочку инструментов и получил переводы полнее, чем раньше.
Grok теперь собирает корзину в Gopuff до того, как вы открыли приложение
xAI тянет сигналы из X и данные о погоде, чтобы предугадывать заказы — первый публичный кейс Grok-агента в ритейле.