AI/News — anthropic ecosystem newsroom

Daily · свежие материалы

хронологический список

19 ИЮН

Daily · Microsoft AI · Microsoft AI

Microsoft проверила симуляторы пользователей на 1 200 разговорах — и нашла неожиданный результат

Восемь метрик USR-8 показали: качество симулятора определяет промпт, а не код фреймворка.

1 мин

19 ИЮН

Daily · HuggingFace · HuggingFace · TG #549

Исследовательский агент сливает корпоративные секреты через поисковые запросы — даже когда его просят молчать

PA-DR снижает утечки с 34% до 9,9%, одновременно повышая точность ответов с 48,7% до 58,7%.

2 мин

18 ИЮН

Daily · HuggingFace · HuggingFace · TG #544

MAI-Code-1-Flash появился в JetBrains, Xcode, Eclipse и ещё пяти средах разработки

Модель бесплатна на плане Copilot Free — но корпоративным пользователям пока недоступна.

1 мин

17 ИЮН

Daily · Microsoft AI · Microsoft AI · TG #531

GitHub Copilot стал отдельным десктопным приложением с параллельными агентскими сессиями

Плюс авторутинг между GPT-5.4, Claude и Haiku — со скидкой 10% за автоматический выбор модели.

2 мин

16 ИЮН

Daily · Google · Google · TG #522

Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство

Прототип на Gemini берёт на себя сбор данных и черновик решения — чиновник остаётся финальным арбитром.

2 мин

15 ИЮН

Daily · HuggingFace · HuggingFace · TG #514

Microsoft Foundry сам отбирает нужные трассировки и гоняет бенчмарки на вашем агенте

Умная выборка даёт +44% словарного охвата против случайной — и это важнее, чем кажется при файнтюнинге.

2 мин

11 ИЮН

Daily · Runway · Runway · TG #500

nn.Linear под профилировщиком: transpose не трогает GPU

Из инструмента для пре-продакшна — в со-продюсера: студия и AI-компания запускают совместный slate с новым IP.

1 мин

09 ИЮН

Daily · Google · Google · TG #477

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Первая модель среднего размера от Google с нативным аудиовходом: 16 ГБ VRAM, Apache 2.0 — и бенчмарки близко к 26B MoE.

1 мин

08 ИЮН

Daily · Microsoft AI · Microsoft AI · TG #470

Microsoft Foundry даёт агентам память между сессиями — без внешней базы данных

Состояние хранится в изолированной microVM на сервере; клиент знает только session id.

1 мин

08 ИЮН

Daily · HuggingFace · HuggingFace · TG #466

OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление

Проект сужает зону ответственности — только протокол среды, без логики наград; тренеры и харнессы подключаются как плагины.

2 мин

07 ИЮН

Daily · HuggingFace · HuggingFace · TG #463

Her читает JSONL-логи Claude Code и находит рискованные действия агента

Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.

1 мин

06 ИЮН

Daily · HuggingFace · HuggingFace · TG #459

Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU

Учитель — DeepSeek V4 Pro, 2 500 резюме и 10 000 вакансий; итог — модель, которая объясняет, почему одна вакансия лучше другой.

1 мин

05 ИЮН

Daily · HuggingFace · HuggingFace · TG #457

Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри

Обучающий сигнал брали из собственных ошибок модели — никаких человеческих разметчиков.

2 мин

Новости AI-стека

Daily · свежие материалы

Microsoft проверила симуляторы пользователей на 1 200 разговорах — и нашла неожиданный результат

Исследовательский агент сливает корпоративные секреты через поисковые запросы — даже когда его просят молчать

MAI-Code-1-Flash появился в JetBrains, Xcode, Eclipse и ещё пяти средах разработки

GitHub Copilot стал отдельным десктопным приложением с параллельными агентскими сессиями

Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство

Microsoft Foundry сам отбирает нужные трассировки и гоняет бенчмарки на вашем агенте

nn.Linear под профилировщиком: transpose не трогает GPU

Gemma 4 12B работает без энкодеров — и умещается на обычном ноутбуке

Microsoft Foundry даёт агентам память между сессиями — без внешней базы данных

OpenEnv стал общим стандартом: Meta, NVIDIA, Unsloth и ещё десяток компаний берут проект под совместное управление

Her читает JSONL-логи Claude Code и находит рискованные действия агента

Qwen3-8B научили отбирать вакансии под резюме — и уместили на одну GPU

Пять лесных торговцев на Qwen2.5-3B — и настоящие биржевые пузыри

Замечания по сайту