Новости AI-стека
Daily · свежие материалы
Runway Seedance 2.0 генерирует видео сразу в 4K — без апскейла
Шесть новых соотношений сторон для 4K — и 150 кредитов в секунду за премиальное качество.
NeMo AutoModel от Hugging Face и NVIDIA: MoE-модели обучаются в 3.7 раза быстрее — без смены кода
Библиотека сокращает расход памяти GPU на 32% — это упрощает работу с MoE-моделями.
Google открыл Computer Use для Gemini 3.5 Flash: теперь модель кликает за вас по экрану
Модель автоматизирует задачи в браузере, на телефоне и ПК — и объясняет каждый шаг.
OpenAI представила Jalapeño: первый чип для LLM с рекордной эффективностью
Чип разработан с Broadcom за девять месяцев — это путь к полному контролю над своим ИИ-стеком.
OpenAI вложила $600 000 в Rust и запустила программу патчинга open source уязвимостей
Trail of Bits закрывает баги вместе с мейнтейнерами — ИИ ищет, люди пишут патчи и не бросают проект один на один с тикетом.
GPT-5 Pro за один сеанс объяснил иммунологу загадку, которую его лаборатория не могла решить три года
Модель не просто нашла ответ в литературе — она предсказала результат неопубликованного эксперимента.
huggingface_hub выходит каждую неделю — без закрытых API и платных платформ
Весь стек скопируем: GitHub Actions, open-weights GLM-5.2 и HF Inference Providers — ничего проприетарного.
Seed2.1 от ByteDance: агент, который сам участвует в своём обучении
Модель доступна через Doubao и Volcano Engine — Pro-версия стоит 6 ₽/млн токенов на вход и 30 ₽/млн на выход.
GPT-5.5-Cyber патчит Linux-ядро и cURL — OpenAI расширяет Daybreak
Модель набрала 85,6% на CyberGym; более 30 open-source проектов уже участвуют в Patch the Planet.
Runway Aleph 2.0 в Figma Weave: правишь один кадр — меняется всё видео
Модель трогает только то, что просили; клипы до 30 секунд при 1080p, мультишотовые последовательности — без ручного ретуша покадрово.
GPT-5.5-Cyber вышел полностью — 85,6% на CyberGym и автопатчинг для open source
За первую неделю Patch the Planet: 37 смёрженных патчей в cURL, Go, Python и ещё 16 проектах — модель генерирует, люди триажируют.
PP-OCRv6 на 34,5M параметрах обогнала GPT-5.5 и Qwen3-VL-235B в распознавании текста
Специализированная OCR в тысячи раз компактнее флагманских мультимодальных моделей — и точнее на их же задаче.
Samsung развернул ChatGPT и Codex для всех сотрудников — три года назад он их запрещал
Охват — вся Корея плюс глобальное подразделение DX; OpenAI называет это одним из крупнейших корпоративных запусков за всю историю компании.
Медицинский ИИ угадывает правильный ответ, не глядя на снимок
Новый фреймворк показал: 60% ответов не меняются, даже если подсунуть другую картинку.
Исследовательский агент сливает корпоративные секреты через поисковые запросы — даже когда его просят молчать
PA-DR снижает утечки с 34% до 9,9%, одновременно повышая точность ответов с 48,7% до 58,7%.
GPT-5.5 Instant догнал думающие модели в медицинских вопросах — и это бесплатно
Параллельно o3 Deep Research помог найти диагнозы в 376 нерешённых случаях — исследование вышло в NEJM AI совместно с Harvard и Boston Children's Hospital.
Runway добавил встроенный монтаж — резать и склеивать видео теперь прямо там
Раньше для финальной сборки приходилось уходить в сторонний редактор — теперь обрезка, переупорядочивание и экспорт внутри одной платформы.
OpenAI o3 нашёл диагнозы в 18 случаях, которые врачи не могли решить годами
Модель не ставила диагнозы сама — она строила гипотезы, которые потом проверяли клиницисты в лаборатории.
98% PEFT-моделей используют LoRA — Hugging Face предлагает это оспорить
При правильно подобранных гиперпараметрах альтернативы дают тот же результат — а значит, монополия LoRA держится на инерции, не на качестве.
GPT-5.4 самостоятельно улучшил реакцию в химии лекарств — и проверил это в лаборатории
OpenAI и Molecule.one опубликовали препринт: модель не просто предложила идею, а довела её до экспериментального результата.
ChatGPT теперь сам следит за интернетом по расписанию — и присылает только важное
Появилась отдельная страница управления задачами, но запуск — не чаще раза в час, а при бездействии задача уходит на паузу автоматически.
AWS Strands Robots: один код — и симуляция, и реальный робот
LeRobot хранит демонстрации из симулятора и с железа в одном формате — агент не замечает разницы.
Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации
Управление темпом, акцентом и тоном через промпт остаётся — задержка до первого байта падает.
Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство
Прототип на Gemini берёт на себя сбор данных и черновик решения — чиновник остаётся финальным арбитром.
OpenAI научилась проверять безопасность модели до релиза — на реальных разговорах
Метод поймал «calculator hacking» в GPT-5.1 до выхода и предсказывает частоту нарушений с медианной ошибкой 1.5×.
Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели
Imagen 4 уходит в августе, а единственная замена для Veo — модели в статусе preview, не GA.
OpenAI вложила $150 млн в партнёрскую сеть для корпоративного внедрения
Accenture, McKinsey, BCG, PwC и десятки других — плюс цель в 300 000 сертифицированных консультантов к концу 2026 года.
Документация OpenAI теперь сама пишет гайды под ваш проект и отдаёт их в Codex
Агент на developers.openai.com понимает контекст задачи — генерирует кастомное руководство, а не просто ищет по тексту.
Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов
Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.
GPT-5.5 в Codex упал в прод — и тем самым подтвердил своё существование
Параллельно лежала половина API OpenAI — от Batch до Sora.