Microsoft Foundry: ИИ просит о помощи, агенты помнят и новые модели

Hero illustration: Microsoft Foundry: ИИ просит о помощи, агенты помнят и новые модели.

Стоит читать если: вы работаете с агентными системами, внедряете ИИ в критически важные бизнес-процессы, интересуетесь безопасностью промптов или ищете новые модели для развертывания. Можно пропустить если: вас не затрагивают вопросы архитектуры, памяти или безопасности ИИ-приложений в корпоративной среде.

ИИ, который знает, когда ему нужна помощь: паттерны Human-in-the-Loop в Foundry

Проблема автономных систем в корпоративной среде. Полностью автономные ИИ-системы могут быть эффективными, но в корпоративных сценариях они несут риски, связанные с точностью, соответствием требованиям и доверием. В таких случаях ИИ должен уметь запрашивать помощь человека. Microsoft Foundry вводит паттерны Human-in-the-Loop (HITL), которые позволяют встраивать человеческое суждение в рабочие процессы ИИ, делая его не запасным вариантом, а частью архитектуры.

Как работает «Decision Gate». Ключевой инновацией является «Decision Gate» — динамический слой контроля, который активируется на основе риска, уверенности или контекста. Этот гейт оценивает различные сигналы:

Уровень уверенности модели: например, если точность вывода ниже 75%.
Бизнес-правила: действия с высокой финансовой значимостью, требующие утверждения.
Полнота контекста: наличие недостающих или неоднозначных входных данных.
Классификация риска: определение низкого, среднего или высокого уровня влияния.

Сценарии применения HITL. Паттерны Human-in-the-Loop наиболее ценны в следующих областях:

Пограничные решения: там, где вывод системы имеет реальное влияние на мир (отправка писем, обновление записей).
Зоны неоднозначности: когда возможны множественные интерпретации (неясные запросы, неполные данные).
Действия, чувствительные к политике: ситуации со строгими правилами, но переменным контекстом (утверждения, процессы соответствия).

Цель HITL — не максимизировать автоматизацию или надзор, а привести уровень контроля в соответствие с уровнем риска, обеспечивая graduated control вместо бинарного выбора.

Memory Store: Долговременная память для агентов Foundry

ИИ, который помнит предпочтения. Современные ИИ-системы часто не сохраняют долгосрочную память между взаимодействиями. microsoft-foundry представила memory-store (предварительная версия) — управляемую систему долговременной памяти для ИИ-агентов. Она позволяет агентам запоминать предпочтения пользователя, важные факты и обобщенный контекст разговора через разные сессии и устройства.

Ключевые концепции Memory Store:

Memory Store: контейнер для памяти, определяющий, какая информация релевантна для каждого агента. Рекомендуется создавать одно хранилище на агента для чистоты границ памяти.
Scope: определяет, кому принадлежит память (например, user_123 или автоматически сопоставляется с {{$userId}} из заголовков аутентификации), обеспечивая конфиденциальность и изоляцию.
Типы памяти:
- User profile memory: хранит стабильную, долгосрочную информацию о пользователе (предпочтения, привычки), которая вводится как статический контекст в начале разговора.
- Chat summary memory: фиксирует сжатые выводы из разговоров.

Практическое применение. memory-store упрощает создание персонализированных и непрерывных взаимодействий с ИИ-агентами, например, запоминая предпочтения пользователя в выборе кофе.

Майские обновления Microsoft Foundry Labs: от новых моделей до бенчмарков

Четыре новых релиза. В мае 2026 года microsoft-foundry-labs представила четыре заметных обновления, охватывающих бенчмаркинг, экспериментальные стек агентов, модели для изображений и геопространственных данных.

SocialReasoning-Bench: оценка поведения агентов

Измерение полезности агента. По мере того как агенты ИИ начинают взаимодействовать друг с другом от имени пользователей, простое завершение задачи становится недостаточным показателем полезности. socialreasoning-bench — это новый бенчмарк с открытым исходным кодом от Microsoft Research AI Frontiers, который измеряет, насколько хорошо агент действует в интересах своего пользователя. Он поддерживает два сценария — координацию календаря и переговоры на маркетплейсе — и оценивает их по двум метрикам:

Outcome Optimality: доля доступной ценности, которую агент захватывает для своего принципала.
Due Diligence: качество использованного процесса, оцениваемое по детерминированной политике разумного агента.

MagenticLite, Magentic Orchestrator & Fara 1.5: экспериментальный агентный стек

Комплексное решение для малых моделей. Microsoft Research AI Frontiers также выпустила экспериментальный сквозной агентный стек, оптимизированный для малых моделей, который включает три компонента:

magenticlite: уровень приложений, переработанный интерфейс чата и браузера, оптимизированный для малых моделей. Работает как в браузере, так и с локальной файловой системой, с песочницей для браузерных сессий и выполнения кода на базе Quicksand (среда выполнения QEMU с открытым исходным кодом). Обеспечивает прозрачность и возможность прямого контроля.
magenticbrain: оркестратор стека, модель, дообученная на Qwen 3 8B. Отвечает за планирование, написание кода и делегирование, была обучена внутри magenticlite с теми же схемами инструментов.
fara-1-5: семейство моделей для компьютерного использования (Qwen 3.5), представленное в трех размерах (4B, 9B, 27B), с рекомендованной 9B-моделью как флагманом. Устанавливает новый state-of-the-art среди малых моделей для компьютерного использования на бенчмарке Online-Mind2Web.

Зачем это нужно. Эти компоненты были разработаны для совместной работы, обеспечивая эффективное выполнение агентов, сохранение данных на устройстве пользователя и поддержку широкого спектра агентных задач.

MAI-Image-2-Efficient: быстрая генерация изображений

Оптимизация для продакшена. mai-image-2-efficient (Image-2e) — это новая модель текст-в-изображение от Microsoft, построенная на той же архитектуре, что и MAI-Image-2, но оптимизированная для производственных нагрузок. Она до 22% быстрее и в 4 раза эффективнее, чем MAI-Image-2, и опережает ведущие модели текст-в-изображение на 40% в среднем по выходным токенам на секунду.

Что это дает. Такая эффективность позволяет компаниям генерировать больше изображений при меньших затратах GPU, что открывает новые категории работы, такие как массовая генерация для e-commerce или креативных инструментов, требующих низкой задержки.

EO/OS Object Detection: геопространственное обнаружение объектов

Модель для спутниковых снимков. eo-os-object-detection — это собственная модель Microsoft для обнаружения и локализации объектов на спутниковых и аэрофотоснимках. Доступна в Microsoft Foundry как управляемая конечная точка, она оптимизирована для пакетной обработки больших архивов изображений.

Cohere Command A+ теперь в Microsoft Foundry

Новая MoE модель для корпораций. cohere-command-a-plus, новейшая модель Mixture-of-Experts (MoE) от Cohere, теперь доступна в microsoft-foundry. Она разработана для корпоративных рабочих нагрузок с ИИ-агентами, предлагая эффективность и масштабируемость. Модель выпущена под лицензией Apache 2.0.

Ключевые особенности Command A+:

Унифицированная модель: объединяет рассуждения, мультимодальное понимание, многоязычные возможности, извлечение информации и использование инструментов.
Большое контекстное окно: поддерживает контекстное окно 128K.
Ввод и вывод: обрабатывает ввод текста, изображений и инструментов, а также выдает результаты рассуждений и использования инструментов.
Оптимизация для корпоративных задач: идеально подходит для агентных рабочих процессов, RAG (Retrieval-Augmented Generation), мультимодального понимания документов, корпоративного поиска, кодирования и бизнес-автоматизации.
Развертывание через Managed Compute: может быть развернута в Microsoft Foundry с использованием выделенной управляемой инфраструктуры.
Эффективность: использует разреженную архитектуру MoE с 218B общих параметров и только 25B активных параметров. Cohere заявляет, что это их самая быстрая модель, обеспечивающая до 63% больше выходных токенов в секунду и сниженную задержку.

Защита от инъекций промптов в Azure AI: Часть 2

#1 риск в OWASP Top 10. Инъекции промптов признаны риском номер один в OWASP Top 10 для приложений больших языковых моделей. Промпт-инъекция использует то, что системные промпты, пользовательские промпты и контекстные данные интерпретируются как естественный язык без строгой сепарации. Это позволяет злоумышленникам внедрять вредоносные инструкции, которые переопределяют поведение модели, заставляя ее раскрывать конфиденциальную информацию, игнорировать защитные механизмы или вызывать непреднамеренные действия.

Риски инъекций промптов:

Раскрытие данных: модель может выдать системные промпты, секреты, извлеченные документы.
Джейлбрейк/Обход политики: обход защитных механизмов, создание вредоносного или предвзятого вывода.
Несанкционированные операции: подключенный агент может инициировать вызовы API, отправлять электронные письма, изменять записи.
Косвенные инъекции: скрытые инструкции в документах, веб-страницах или метаданных, которые выполняются при извлечении.

Примеры реальных инцидентов.

Microsoft Bing Chat «Sydney» (февраль 2023): пользователь заставил модель раскрыть ее полный системный промпт, включая внутреннее кодовое имя «Sydney» и правила работы.
Chevrolet Watsonville Chatbot (конец 2023): пользователи вынудили ChatGPT-бота дилерского центра рекомендовать конкурентов, «продавать» автомобили за 1 доллар и писать произвольный код Python.

Типы инъекций промптов:

Прямая: вредоносные инструкции явно вводятся пользователем.
Косвенная: инструкции скрыты в извлеченном контенте (документы, веб-страницы, электронные письма, метаданные), что делает их невидимыми для пользователя.
Визуальная/Мультимодальная: инструкции встроены в изображения, видео, аудио или метаданные, обрабатываемые мультимодальными моделями.
Код-инъекция через ИИ-помощь: вредоносные инструкции маскируются под комментарии или строки в коде, который пользователь просит модель просмотреть или рефакторить.

GitHub Copilot для Eclipse стал открытым исходным кодом

Доступность для сообщества. github-copilot для eclipse теперь доступен как проект с открытым исходным кодом под лицензией MIT. Это позволяет сообществу разработчиков исследовать, учиться и вносить свой вклад в развитие ИИ-инструментов для Eclipse.

Возможности и вклад. Код включает реализации для автодополнения кода, предложений следующего редактирования (NES), чата и агентных рабочих процессов. Также предусмотрены расширенные возможности агентов, такие как пользовательские агенты, изолированные субагенты, агент планирования и интеграция с Model Context Protocol (MCP).

Vega: доказательства с нулевым разглашением для цифровой идентификации

Конфиденциальная проверка личности. vega — это новая система доказательств с нулевым разглашением (ZKP) от Microsoft Research, которая позволяет пользователям подтверждать факты из государственных документов (возраст, личность, профессиональный статус) без раскрытия самих документов. Учетные данные никогда не покидают устройство.

Ключевые преимущества:

Скорость: доказательства генерируются менее чем за 100 мс на обычных устройствах.
Масштабируемость: ZKP могут многократно использоваться, пропуская большую часть ресурсоемкой работы после первого доказательства.
Практичность: vega ориентирована на реальные форматы, такие как мобильные водительские удостоверения и цифровой кошелек ЕС.
Конфиденциальность: система построена на Rust и скоро будет открыта, что делает проверку личности практичной и конфиденциальной в масштабе.

Также за день

Microsoft и EY углубляют альянс. Компании инвестируют более 1 миллиарда долларов в инициативу, которая поможет организациям перейти от пилотных проектов ИИ к масштабной трансформации, используя платформы Microsoft AI и опыт EY в развертывании ИИ в корпоративной среде. Деталей в источнике нет.

Что это значит

Фокус на надежности и масштабируемости AI. Этот день для Microsoft AI показывает сильный акцент на движении от экспериментов к производственным системам. human-in-the-loop и memory-store создают основу для более надежных и персонализированных ИИ-агентов, а работа над безопасностью промптов подчеркивает критичность защиты в корпоративной среде. Одновременно, новые модели и интеграция сторонних решений расширяют инструментарий для разработчиков, а доказательства с нулевым разглашением открывают путь к конфиденциальной цифровой идентичности. Все это говорит о том, что Microsoft активно формирует экосистему, в которой ИИ будет не просто инструментом, а доверенным партнером в сложных бизнес-процессах.

Microsoft Foundry: ИИ просит о помощи, агенты помнят и новые модели daily