AI/News — anthropic ecosystem newsroom

Daily · свежие материалы

хронологический список

19 ИЮН

Daily · HuggingFace · HuggingFace · TG #549

Исследовательский агент сливает корпоративные секреты через поисковые запросы — даже когда его просят молчать

PA-DR снижает утечки с 34% до 9,9%, одновременно повышая точность ответов с 48,7% до 58,7%.

2 мин

19 ИЮН

Daily · Anthropic · Anthropic · TG #539

Семь способов управлять Claude Code — и когда каждый из них ломается

CLAUDE.md — не свалка: где хранить правила, процедуры и жёсткие запреты, чтобы они реально работали.

2 мин

18 ИЮН

Daily · OpenAI · X · OpenAI · TG #548

GPT-5.5 Instant догнал думающие модели в медицинских вопросах — и это бесплатно

Параллельно o3 Deep Research помог найти диагнозы в 376 нерешённых случаях — исследование вышло в NEJM AI совместно с Harvard и Boston Children's Hospital.

2 мин

18 ИЮН

Daily · Anthropic · X · Anthropic · TG #546

Claude Opus 4.7 запрограммировал робопса в 20 раз быстрее человека

Anthropic фиксирует паттерн: сначала модель помогает людям, потом люди помогают модели, потом модель справляется сама — теперь это работает с физическим железом.

1 мин

18 ИЮН

Daily · Microsoft AI · Microsoft AI · TG #544

MAI-Code-1-Flash появился в JetBrains, Xcode, Eclipse и ещё пяти средах разработки

Модель бесплатна на плане Copilot Free — но корпоративным пользователям пока недоступна.

1 мин

18 ИЮН

Daily · Anthropic · Anthropic · TG #543

Claude Code: семь способов передать инструкцию — и у каждого свои правила выживания в контексте

CLAUDE.md, правила, навыки, субагенты, хуки, стили вывода и флаг append-system-prompt ведут себя по-разному при сжатии — и молча выпавшее правило не предупредит вас об этом.

2 мин

18 ИЮН

Daily · xAI · xAI (Grok) · TG #542

Grok 4.3 появился на Amazon Bedrock и Databricks — $1.25 за миллион токенов

xAI заявляет о наименьшем уровне галлюцинаций среди топовых моделей — при цене вдвое-втрое ниже конкурентов.

1 мин

18 ИЮН

Daily · OpenAI · OpenAI · TG #541

OpenAI o3 нашёл диагнозы в 18 случаях, которые врачи не могли решить годами

Модель не ставила диагнозы сама — она строила гипотезы, которые потом проверяли клиницисты в лаборатории.

2 мин

18 ИЮН

Daily · HuggingFace · HuggingFace · TG #540

98% PEFT-моделей используют LoRA — Hugging Face предлагает это оспорить

При правильно подобранных гиперпараметрах альтернативы дают тот же результат — а значит, монополия LoRA держится на инерции, не на качестве.

2 мин

17 ИЮН

Daily · OpenAI · X · OpenAI · TG #537

GPT-5.4 самостоятельно улучшил реакцию в химии лекарств — и проверил это в лаборатории

OpenAI и Molecule.one опубликовали препринт: модель не просто предложила идею, а довела её до экспериментального результата.

1 мин

17 ИЮН

Daily · xAI · xAI (Grok) · TG #533

Grok 4.3 появился на Amazon Bedrock — теперь на всех крупных облаках

$1.25 за миллион входных токенов и настраиваемая глубина рассуждений — через стандартный Bedrock API.

2 мин

17 ИЮН

Daily · OpenAI · OpenAI · TG #532

ChatGPT теперь сам следит за интернетом по расписанию — и присылает только важное

Появилась отдельная страница управления задачами, но запуск — не чаще раза в час, а при бездействии задача уходит на паузу автоматически.

1 мин

17 ИЮН

Daily · Microsoft AI · Microsoft AI · TG #531

GitHub Copilot стал отдельным десктопным приложением с параллельными агентскими сессиями

Плюс авторутинг между GPT-5.4, Claude и Haiku — со скидкой 10% за автоматический выбор модели.

2 мин

17 ИЮН

Daily · Anthropic · Anthropic · TG #528

Anthropic открыл офис в Сеуле — Claude Code уже у тысяч инженеров NAVER и Samsung

IT-подразделения Samsung, LG и Hanwha развернули Claude внутри — охват может каскадом пройти по всей группе каждого чеболя.

2 мин

17 ИЮН

Daily · HuggingFace · HuggingFace · TG #526

AWS Strands Robots: один код — и симуляция, и реальный робот

LeRobot хранит демонстрации из симулятора и с железа в одном формате — агент не замечает разницы.

1 мин

17 ИЮН

Daily · Google · Google · TG #525

Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации

Управление темпом, акцентом и тоном через промпт остаётся — задержка до первого байта падает.

1 мин

16 ИЮН

Daily · Anthropic · X · Anthropic · TG #523

Бухгалтер с Claude Code успевает не хуже программиста — данные 400 тысяч сессий

За семь месяцев ценность типичной задачи выросла на 27%, а доля сессий с отладкой упала вдвое.

2 мин

16 ИЮН

Daily · Google · Google · TG #522

Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство

Прототип на Gemini берёт на себя сбор данных и черновик решения — чиновник остаётся финальным арбитром.

2 мин

16 ИЮН

Daily · OpenAI · OpenAI · TG #520

OpenAI научилась проверять безопасность модели до релиза — на реальных разговорах

Метод поймал «calculator hacking» в GPT-5.1 до выхода и предсказывает частоту нарушений с медианной ошибкой 1.5×.

2 мин

16 ИЮН

Daily · xAI · xAI (Grok) · TG #519

Grok теперь работает внутри PowerPoint, Word и Excel

Аддин бесплатно ставится из маркетплейса Microsoft — но полный доступ только на платных планах SuperGrok и выше.

1 мин

15 ИЮН

Daily · Google · Google · TG #517

Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели

Imagen 4 уходит в августе, а единственная замена для Veo — модели в статусе preview, не GA.

1 мин

15 ИЮН

Daily · Anthropic · Anthropic · TG #516

Claude Sonnet 4 и Opus 4 выключены — запросы возвращают ошибку

Замены — Sonnet 4.6 и Opus 4.8; исследователи могут запросить отдельный доступ через специальную программу.

1 мин

15 ИЮН

Daily · xAI · xAI (Grok) · TG #515

Grok Build теперь запускает несколько агентов-кодировщиков параллельно — из одного экрана

Дашборд сам поднимает наверх сессии, которые ждут ответа, — остальные работают без участия человека.

1 мин

15 ИЮН

Daily · Microsoft AI · Microsoft AI · TG #514

Microsoft Foundry сам отбирает нужные трассировки и гоняет бенчмарки на вашем агенте

Умная выборка даёт +44% словарного охвата против случайной — и это важнее, чем кажется при файнтюнинге.

2 мин

14 ИЮН

Daily · OpenAI · OpenAI · TG #512

OpenAI вложила $150 млн в партнёрскую сеть для корпоративного внедрения

Accenture, McKinsey, BCG, PwC и десятки других — плюс цель в 300 000 сертифицированных консультантов к концу 2026 года.

2 мин

12 ИЮН

Daily · OpenAI · X · OpenAI · TG #509

Документация OpenAI теперь сама пишет гайды под ваш проект и отдаёт их в Codex

Агент на developers.openai.com понимает контекст задачи — генерирует кастомное руководство, а не просто ищет по тексту.

1 мин

12 ИЮН

Daily · Anthropic · X · Anthropic · TG #508

США принудительно отключили Fable 5 и Mythos 5 — Anthropic не согласна

Компания выполнила директиву, но заявила: тот же трюк работает на GPT-5.5, и по такому стандарту придётся остановить весь рынок.

2 мин

12 ИЮН

Daily · Anthropic · Anthropic · TG #507

AI-компаниям доверяют меньше, чем правительству — опрос 52 000 американцев

Семь из десяти американцев хотят госрегулирования AI — и это мнение не делится по партиям.

2 мин

12 ИЮН

Daily · HuggingFace · HuggingFace · TG #504

Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов

Не занимают платные места и не влияют на квоты — просто отдельная машинная идентичность.

1 мин

12 ИЮН

Daily · OpenAI · OpenAI · TG #503

GPT-5.5 в Codex упал в прод — и тем самым подтвердил своё существование

Параллельно лежала половина API OpenAI — от Batch до Sora.

1 мин

Новости AI-стека

Daily · свежие материалы

Исследовательский агент сливает корпоративные секреты через поисковые запросы — даже когда его просят молчать

Семь способов управлять Claude Code — и когда каждый из них ломается

GPT-5.5 Instant догнал думающие модели в медицинских вопросах — и это бесплатно

Claude Opus 4.7 запрограммировал робопса в 20 раз быстрее человека

MAI-Code-1-Flash появился в JetBrains, Xcode, Eclipse и ещё пяти средах разработки

Claude Code: семь способов передать инструкцию — и у каждого свои правила выживания в контексте

Grok 4.3 появился на Amazon Bedrock и Databricks — $1.25 за миллион токенов

OpenAI o3 нашёл диагнозы в 18 случаях, которые врачи не могли решить годами

98% PEFT-моделей используют LoRA — Hugging Face предлагает это оспорить

GPT-5.4 самостоятельно улучшил реакцию в химии лекарств — и проверил это в лаборатории

Grok 4.3 появился на Amazon Bedrock — теперь на всех крупных облаках

ChatGPT теперь сам следит за интернетом по расписанию — и присылает только важное

GitHub Copilot стал отдельным десктопным приложением с параллельными агентскими сессиями

Anthropic открыл офис в Сеуле — Claude Code уже у тысяч инженеров NAVER и Samsung

AWS Strands Robots: один код — и симуляция, и реальный робот

Gemini 3.1 Flash TTS отдаёт аудио потоком, не дожидаясь конца генерации

Бухгалтер с Claude Code успевает не хуже программиста — данные 400 тысяч сессий

Google DeepMind и правительство Великобритании хотят вдвое ускорить выдачу разрешений на строительство

OpenAI научилась проверять безопасность модели до релиза — на реальных разговорах

Grok теперь работает внутри PowerPoint, Word и Excel

Veo 2.0 и 3.0 отключат 30 июня — до дедлайна две недели

Claude Sonnet 4 и Opus 4 выключены — запросы возвращают ошибку

Grok Build теперь запускает несколько агентов-кодировщиков параллельно — из одного экрана

Microsoft Foundry сам отбирает нужные трассировки и гоняет бенчмарки на вашем агенте

OpenAI вложила $150 млн в партнёрскую сеть для корпоративного внедрения

Документация OpenAI теперь сама пишет гайды под ваш проект и отдаёт их в Codex

США принудительно отключили Fable 5 и Mythos 5 — Anthropic не согласна

AI-компаниям доверяют меньше, чем правительству — опрос 52 000 американцев

Hugging Face добавил сервисные аккаунты для корпоративных CI/CD-пайплайнов

GPT-5.5 в Codex упал в прод — и тем самым подтвердил своё существование

Замечания по сайту