Her читает JSONL-логи Claude Code и находит рискованные действия агента

Каждая сессия Claude Code оставляет JSONL-файл на тысячи строк — и почти никто его не читает. Her берёт этот файл, восстанавливает хронологию на человеческом языке и помечает опасные моменты: деплои, изменения конфигов, обращения к продакшену, работу с секретами. Каждый флаг привязан к конкретному turn в логе.

Ключевое архитектурное решение — жёсткое разделение на два слоя. Детерминированный движок делает все выводы: считает токены, идентифицирует инструменты, ставит флаги рискованных действий. Nemotron-Mini-4B-Instruct (4B параметров, работает на ZeroGPU Space) занимается только одним — формулирует текст и «мягкие» предложения по улучшению, когда срабатывает именно именованный, исправимый паттерн. Это означает, что цифры не меняются при смене модели: галлюцинации физически не могут повлиять на факты аудита. Her предлагает, но никогда не утверждает, и молчит, когда сказать нечего.

Приватность встроена в дизайн. Файл сессии загружается в изолированный namespace, который автоматически удаляется по завершении. Никакие внешние AI API не вызываются. Встроенная база инструментов из Homebrew, npm и PyPI позволяет идентифицировать CLI-утилиты офлайн — большинство инструментов распознаются с однострочным описанием без сетевых запросов.

Инструмент работает в двух режимах:

Session view — один файл; хронология, токены, инструменты, субагенты, MCP-серверы и флаги рисков по одной сессии.
Project view — несколько файлов сразу; позволяет искать паттерн или вопрос поперёк множества сессий.

В обоих режимах работает встроенный копилот Ask Her: вопрос «почему был вызван этот инструмент?» — и ответ с цитированием конкретных turns и прямой ссылкой на вызов.

Разделение «детерминированный аудит + LLM только для прозы» — честный ответ на проблему доверия к агентным логам: модель не может соврать про то, сколько токенов сжёг субагент. Что остаётся за кадром: насколько полно детерминированный движок покрывает edge-cases, есть ли ложные срабатывания на флаги «рискованных» действий, и поддержит ли Her форматы логов других агентных фреймворков помимо Claude Code.

Her читает JSONL-логи Claude Code и находит рискованные действия агента daily

Дополнительные источники

Источники

Оценить материал