AI News Watcher
Sunday, Jun 7, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 07, 2026 · 1 min read · HuggingFace ← Back to feed

Her читает JSONL-логи Claude Code и находит рискованные действия агента daily

Модель не принимает решений — только пишет текст; все цифры и флаги считает детерминированный движок.

Her читает JSONL-логи Claude Code и находит рискованные действия агента
Редакция · Daily briefing

Каждая сессия Claude Code оставляет JSONL-файл на тысячи строк — и почти никто его не читает. Her берёт этот файл, восстанавливает хронологию на человеческом языке и помечает опасные моменты: деплои, изменения конфигов, обращения к продакшену, работу с секретами. Каждый флаг привязан к конкретному turn в логе.

Ключевое архитектурное решение — жёсткое разделение на два слоя. Детерминированный движок делает все выводы: считает токены, идентифицирует инструменты, ставит флаги рискованных действий. Nemotron-Mini-4B-Instruct (4B параметров, работает на ZeroGPU Space) занимается только одним — формулирует текст и «мягкие» предложения по улучшению, когда срабатывает именно именованный, исправимый паттерн. Это означает, что цифры не меняются при смене модели: галлюцинации физически не могут повлиять на факты аудита. Her предлагает, но никогда не утверждает, и молчит, когда сказать нечего.

Приватность встроена в дизайн. Файл сессии загружается в изолированный namespace, который автоматически удаляется по завершении. Никакие внешние AI API не вызываются. Встроенная база инструментов из Homebrew, npm и PyPI позволяет идентифицировать CLI-утилиты офлайн — большинство инструментов распознаются с однострочным описанием без сетевых запросов.

Инструмент работает в двух режимах:

В обоих режимах работает встроенный копилот Ask Her: вопрос «почему был вызван этот инструмент?» — и ответ с цитированием конкретных turns и прямой ссылкой на вызов.

Разделение «детерминированный аудит + LLM только для прозы» — честный ответ на проблему доверия к агентным логам: модель не может соврать про то, сколько токенов сжёг субагент. Что остаётся за кадром: насколько полно детерминированный движок покрывает edge-cases, есть ли ложные срабатывания на флаги «рискованных» действий, и поддержит ли Her форматы логов других агентных фреймворков помимо Claude Code.

Дополнительные источники

  1. https://huggingface.co/nvidia/Nemotron-Mini-4B-Instruct
  2. confident-ai.com
  3. proofpoint.com

Источники

  1. https://huggingface.co/blog/build-small-hackathon/her-blog external
→ Опубликовано в Telegram: @agentic_ai_news/463