Стоит читать если: вы разрабатываете агентов на OpenRouter и ищете способы внедрения человеческого контроля, или вам нужна модель с большим контекстом для текстовых задач. Можно пропустить если: вы не работаете с OpenRouter Agent SDK и вам не интересны новые текстовые модели.
Инструменты Human-in-the-Loop для Agent SDK: когда агент зовёт на помощь
OpenRouter добавляет в свой Agent SDK новый тип инструментов: Human-in-the-Loop (HITL). Они позволяют агентам автоматически обрабатывать стандартные запросы и ставить выполнение на паузу, когда требуется человеческое решение в критических ситуациях. Это решает проблему жёсткой дихотомии между полностью автоматическими и полностью ручными инструментами.
Управление логикой происходит через хук onToolCalled. Когда модель вызывает HITL-инструмент, этот хук запускается. Если onToolCalled возвращает значение, агент продолжает работу, как с обычным инструментом. Если хук возвращает null, цикл выполнения приостанавливается со статусом awaiting_hitl, передавая управление приложению. Человеческое решение затем возвращается агенту через callModel с соответствующим function_call_output.
Такой механизм идеально подходит для ситуаций, где решение зависит от данных. Например, это могут быть финансовые пороги для одобрения платежей, пороговые значения риска или проверки соответствия внутренним политикам. Важно, что вся ветвящаяся логика сосредоточена в одной функции, а не разбросана по всему коду приложения.
Для обработки ответов человека предусмотрен второй опциональный хук onResponseReceived. Он срабатывает, когда человек предоставляет результат для приостановленного вызова. Этот хук позволяет трансформировать исходные данные перед их передачей модели. Его можно использовать для добавления метаданных, нормализации форматов, валидации по бизнес-правилам или обогащения ответа дополнительным контекстом, который человеку не требовалось предоставлять вручную. Если onResponseReceived выбрасывает ошибку, она передается модели как { error:..., originalOutput:... }, предотвращая проглатывание проблем без уведомления.
Жизненный цикл паузы и возобновления работы выглядит следующим образом:
- Модель вызывает HITL-инструмент во время цикла агента.
- Запускается
onToolCalled. Если он возвращает значение, агент продолжает работу. Если возвращаетсяnull, цикл приостанавливается. - Приложение читает ожидающие вызовы через
getToolCallsи представляет их пользователю. - Пользователь принимает решение.
- Приложение снова вызывает
callModel, передавая решение как элементfunction_call_output. onResponseReceived(если определен) трансформирует ответ.- Модель получает результат, и цикл агента возобновляется. SDK берет на себя всю работу по отслеживанию состояния, диспетчеризации хуков и валидации схемы, что существенно упрощает разработку.
Отличие HITL от requireApproval важно для выбора стратегии. Оба механизма ставят работу на паузу для человеческого ввода, но различаются логикой принятия решений:
- HITL (через
onToolCalled) приостанавливается только тогда, когда хук возвращаетnull. Решение принимается на основе данных (пороги, скоринг, политики), и инструмент может автоматически разрешать рутинные ситуации, возвращая значение и пропуская человеческое вмешательство. requireApprovalвсегда приостанавливается перед любым выполнением, требуя бинарного согласия «да/нет», независимо от входных данных. Возможность автоматического разрешения здесь отсутствует. Этот механизм лучше подходит, когда каждое действие требует явного подтверждения (например, «удалить базу данных» или «отправить это электронное письмо»).
Новая модель на платформе: inclusionAI: Ring-2.6-1T
На OpenRouter появилась новая модель: inclusionAI: Ring-2.6-1T. Эта модель поддерживает преобразование текста в текст и предлагает впечатляющее контекстное окно.
Основные характеристики модели:
- Название: inclusionAI: Ring-2.6-1T
- Контекстное окно: 262144 токенов, что позволяет обрабатывать очень длинные тексты и вести глубокий анализ.
- Модальности: Модель принимает текстовый ввод и генерирует текстовый вывод.
Страница модели
Что это значит
Интеграция человеческого участия в работу агентов с помощью Human-in-the-Loop — это шаг к созданию более надёжных и управляемых AI-систем в продакшене. Она позволяет инженерам проектировать агентов, способных эффективно масштабироваться на рутинных задачах, одновременно обеспечивая надлежащий контроль и безопасность в сценариях с высокими ставками. Разработчики могут сосредоточиться на логике принятия решений, а не на сложном управлении состоянием циклов агента. Новая модель inclusionAI: Ring-2.6-1T, в свою очередь, обеспечивает работу с масштабными текстовыми данными, открывая путь к более глубокому анализу и более точным ответам в приложениях, требующих обширного контекста.