AI News Watcher
Tuesday, Jun 30, 2026  ·  Daily briefing
Feed Telegram
Daily briefing · By AI News Watcher · Jun 30, 2026 · 2 min read · Microsoft AI ← Back to feed

Microsoft SkillOpt: агенты учатся сами — без переобучения модели daily

Превращает ручное написание навыков в обучение — так агенты становятся надёжнее и не дрейфуют.

Microsoft SkillOpt: агенты учатся сами — без переобучения модели
Редакция · Daily briefing

Надёжность AI-агентов часто страдает из-за того, что их инструкции или «навыки» приходится постоянно править. Это ручной и непредсказуемый процесс, который ведёт к ошибкам и «дрейфу промптов» (неконтролируемому изменению промптов). Microsoft Research предлагает SkillOpt — систему, которая превращает редактирование навыков в процесс обучения, делая поведение агентов более надёжным без изменения весов основной модели.

SkillOpt рассматривает файл навыков агента как обучаемый параметр, отдельный от замороженной целевой модели. Это позволяет оптимизировать навыки, не затрагивая базовую нейросеть. Процесс оптимизации SkillOpt организован как цикл «прямой проход — обратный проход — обновление» в текстовом пространстве:

Такой подход обеспечивает контролируемость и аудируемость оптимизации. SkillOpt показал стабильные улучшения производительности по 52 оценочным метрикам на шести бенчмарках, семи целевых моделях и трёх режимах выполнения, включая GPT-5.5 и Qwen3.5-4B. Оптимизированные навыки остаются компактными, переносятся между моделями разных масштабов, средами агентов и схожими задачами. Microsoft также представила SkillOpt-Sleep — автономный ночной компаньон для локальных агентов, который анализирует прошлые сессии и закрепляет проверенные навыки.

Помимо оптимизации навыков, Microsoft работает над улучшением памяти агентов. Система Memora призвана решить проблему неэффективного хранения и извлечения информации для долгосрочных задач. Memora разделяет то, что хранится (богатое содержимое памяти), и то, как это извлекается (легковесные абстракции и якорные подсказки). Это позволяет агентам масштабировать свои возможности, объединять связанную информацию и получать детали без необходимости перечитывать всю историю. Memora показала новые лучшие результаты на бенчмарках LoCoMo и LongMemEval, используя до 98% меньше токенов контекста.

Эти исследования дополняет углублённая интеграция GitHub Copilot в JetBrains AI Assistant. Теперь Copilot является опцией первого класса в инструменте выбора агента JetBrains AI Assistant, позволяя разработчикам выбирать модель Copilot и настраивать глубину рассуждений в чате. Copilot может выполнять многоэтапную работу, предлагать изменения, выполнять команды и взаимодействовать с пользователем.

SkillOpt и Memora представляют собой фундаментальные шаги Microsoft к созданию более автономных и надёжных AI-агентов, способных учиться и помнить в долгосрочной перспективе. Интеграция Copilot в JetBrains демонстрирует, как эти концепции начинают проникать в реальные инструменты разработки, предлагая инженерам новые способы взаимодействия с ИИ-помощниками.

Дополнительные источники

  1. https://www.microsoft.com/en-us/research/publication/skillopt-executive-strategy-for-self-evolving-agent-skills/
  2. https://github.com/microsoft/SkillOpt
  3. https://www.microsoft.com/en-us/research/publication/memora-a-harmonic-memory-representation-balancing-abstraction-and-specificity/
  4. https://github.com/microsoft/Memora
  5. https://blog.jetbrains.com/ai/2025/12/bring-your-own-ai-agent-to-jetbrains-ides/
  6. github.blog

Источники

  1. https://github.blog/changelog/2026-06-30-copilot-agent-is-now-available-in-jetbrains-ai-assistant external
  2. https://www.microsoft.com/en-us/research/blog/skillopt-agent-skills-as-trainable-parameters/ external
  3. https://www.microsoft.com/en-us/research/blog/memora-a-harmonic-memory-representation-balancing-abstraction-and-specificity/ external
→ Опубликовано в Telegram: @agentic_ai_news/605