Новости AI-стека
Daily · свежие материалы
DeepSeek-V4: миллион токенов контекста — в 10 раз экономнее для памяти
Новая гибридная архитектура и оптимизатор Muon позволяют моделям работать с агентами на миллион токенов без перегрузки памяти.
GPT-5.6 Sol вышел, но его придержало правительство США
Ограниченный запуск по запросу правительства США задаёт новый прецедент для регулирования ИИ.
Runway Seedance 2.0 Mini: управляемое видео вдвое дешевле по API
функции контроля видео теперь доступны программно, что снижает барьер для разработчиков.
GPT-5.6 Sol: OpenAI научила модель решать задачи командой субагентов
Три модели с разным уровнем мощности и цены — с самым надежным стеком безопасности.
Microsoft дала ИИ-тренера для сложных звонков: Live Voice Practice
Открытый код и Azure Voice Live дают бесконечные тренировки с мгновенной оценкой.
Alibaba Qwen3-ASR: расшифрует 52 языка и точно выровняет речь из любой ASR
Старшая модель конкурирует с коммерческими API, а выравниватель точнее других моделей.
Hugging Face: LLM-сервер одной командой — как OpenAI API, без Kubernetes
Приватный эндпоинт на GPU, оплата посекундная — для тестов и разработки.
OpenAI даёт Codex мобильный пульт и облачную среду — агенты теперь работают сами
Плагин DigitalOcean позволяет развернуть постоянную среду разработки одним промптом, а мобильное приложение — управлять ею на ходу.
Runway Agent 2.0: сам делает рекламу и сам её улучшает по данным
Инструмент переходит от создания видео к полному циклу маркетинга, закрывая разрыв между идеей и работающей кампанией.
Microsoft: ИИ объясняет, как мозг реагирует на язык — и сам проверяет свои версии
Непрозрачные модели предсказания мозга теперь дают проверяемые гипотезы — и находят новые микрорегионы.
Olmo Hybrid: вдвое меньше данных для той же мощности — и предсказывает иначе
Гибридные модели лучше улавливают контекст, а трансформеры точнее цитируют — это меняет подход к выбору архитектур.
Агенты OpenRouter теперь выбирают модели по свежим данным — и тестируют их в редакторе
Это избавляет агентов от устаревших данных, а разработчиков — от ручного сравнения и переключения окон.
Codex от OpenAI: агенты работают по 8+ часов
Агенты стали основным инструментом для всех отделов OpenAI, включая нетехнические — и позволяют выполнять кросс-функциональные задачи.
Alibaba Qwen-AgentWorld: модель, которая сама симулирует мир для ИИ-агентов
Модель предсказывает динамику семи разных сред для тренировки ИИ-агентов, превосходя реальные условия по контролю и масштабу.
OpenAI создала свой ИИ-чип Jalapeño — он вдвое дешевле GPU
Первый шаг к полной независимости от Nvidia и гигаватт-масштаба.
Runway Seedance 2.0 генерирует видео сразу в 4K — без апскейла
Шесть новых соотношений сторон для 4K — и 150 кредитов в секунду за премиальное качество.
NeMo AutoModel от Hugging Face и NVIDIA: MoE-модели обучаются в 3.7 раза быстрее — без смены кода
Библиотека сокращает расход памяти GPU на 32% — это упрощает работу с MoE-моделями.
Google открыл Computer Use для Gemini 3.5 Flash: теперь модель кликает за вас по экрану
Модель автоматизирует задачи в браузере, на телефоне и ПК — и объясняет каждый шаг.
OpenAI представила Jalapeño: первый чип для LLM с рекордной эффективностью
Чип разработан с Broadcom за девять месяцев — это путь к полному контролю над своим ИИ-стеком.
Microsoft Talos: ИИ сам перепроверяет геномы на редкие болезни
Возвращает 90% диагнозов, выдавая всего 1.3 кандидата на вариант для экспертной проверки.
Sakana Fugu Ultra: одна модель командует другими — и она на OpenRouter
Модель сама выбирает, какую LLM вызвать для задачи — до 1M токенов и с картинками.
ANOLISA от Alibaba: первая ОС, которая работает на ИИ-агентов — сокращает токены и риски
Когда ОС создана для агентов, они тратят меньше токенов и защищены от «потери контроля».
OpenAI вложила $600 000 в Rust и запустила программу патчинга open source уязвимостей
Trail of Bits закрывает баги вместе с мейнтейнерами — ИИ ищет, люди пишут патчи и не бросают проект один на один с тикетом.
Deepgram починил ошибку 400 при распознавании аудио по URL
Баг с REMOTE_CONTENT_ERROR тихо жил несколько дней — исправлен 17 июня, объявлено 23-го.
ParallelKernelBench: лучшие LLM решают меньше трети задач на многогпу CUDA-ядра
Несколько сгенерированных ядер обогнали все публичные реализации — но воспроизводимость пока случайная.
GPT-5 Pro за один сеанс объяснил иммунологу загадку, которую его лаборатория не могла решить три года
Модель не просто нашла ответ в литературе — она предсказала результат неопубликованного эксперимента.
Azure Copilot Observability Agent вышел в общий доступ — расследует инциденты вместо инженера
KPMG сообщает об экономии 250 инженерных часов в месяц — агент сам сшивает логи, метрики и трейсы и объясняет причину сбоя по-человечески.
Claude Tag: Anthropic дала ИИ собственный аккаунт в Slack и GitHub
65% кода продуктовой команды Anthropic уже пишет внутренняя версия — теперь это доступно клиентам Enterprise и Team.
Meta Glasses с Muse Spark: ИИ-ассистент, который понимает, что вы видите — за $299
Meta считает умные очки идеальным устройством для ИИ-ассистента на весь день, который понимает мир с вашей точки зрения.
huggingface_hub выходит каждую неделю — без закрытых API и платных платформ
Весь стек скопируем: GitHub Actions, open-weights GLM-5.2 и HF Inference Providers — ничего проприетарного.